Я иногда пишу компьютерно-археологические посты, например, о происхождении клавиатурных раскладок и графических разрешений, о том как появился r-pentomino, или там про первоапрельские RFC. Сегодня напишу немного про этимологию разных около-компьютерных терминов.
Все знают, что слово модем происходит из комбинации слов модулятор
и демодулятор
— названий двух устройств, переводящих цифровую информацию в вид, удобный для передачи по аналоговым сетям связи и обратно. Аналогичное происхождение у слова кодек (кодер
+декодер
) и менее широко известных жаргонных терминов балун (balanced
+unbalanced
) и сердес (serializer
+deserializer
).
Похожее на кодек
по написанию и звучанию название компании Kodak, зарегистрированное в 1888 году, имеет другую природу. Основатель компании, George Eastman, специально придумывал новое, короткое, легко узнаваемое и произносимое на разных языках слово, по легенде используя для этого набор букв из игры Anagrams (бабушка игры Scrabble). Одним из критериев для Джорджа было использование его любимой буквы К, составляющей в итоге 40% всего названия. Затея придумать новое слово удалась не вполне: в 1896 году на страницах журнала Amateur Photographer разгорелась переписка читателей, пытающихся выяснить его происхождение. Обнаружилось, например, что на хиндустани это слово, пришедшее из персидского, означает "мальчик", а один из читателей указывал на созвучие с ивритским Kahdak
.
Слово bit в смысле минимального количества информации впервые появилось в публикациях в статье Клода Шеннона 1948 года «Математическая теория связи». При этом сам Клод ссылался на авторство математика Джона Тьюки, который использовал bit как сокращение к binary [information] digit
во внутренних документах Bell Labs. Под словом byte (байт
, искажённое английское укус/кусок
) принято понимать минимальный объём обрабатываемой за раз или непосредственно адресуемой информации. Впервые оно было использовано Вернером Бухгольцем в 1956 в проектной документации на систему IBM Stretch. В разных системах байты бывали разных размеров, например, 4, 6 или 9 бит, а также переменной величины. Чтобы точно указать на размер байта в 8 бит, принято использовать термин октет
.
По инженерным причинам в компьютерах эффективнее работать с числами, кратными степеням двойки. Поэтому под словом kilobit
инженеры чаще понимают 1024 бита (2^10), но в некоторых случаях его используют для обозначения 1000 бит (10^3, как и с другими мерами, вроде метров). Например, в Encyclopedia of Library and Information Science издания 1968 года на одной и той же странице написано, что килобит это 1000 бит, а килобайт это 1024 байта. Аналогичная история с приставками мега-, гиги- и так далее. Вся эта путаница происходила до конца 1998 года, когда наконец пришла Международная электротехническая комиссия и всё исправила (нет). С тех пор по международным стандартам килобит должен означать 1000 бит, а для 1024 бит надо использовать термин kibibit
(кибибит
). Но, например, по российскому «Положению о единицах величин» от 2009 года термин килобайт фиксируется всё равно в значении 1024 байта.
Для измерения скорости передачи данных помимо всяких килобайт/сек
и килобит/сек
иногда используются термины, основанные на похожем слове бод (например, килобод
). Под бодом в современной связи обычно понимается количество изменений несущей частоты в секунду, поэтому если, например, несущая использует два уровня сигнала, то 1 бод это 1 бит/сек. Но это не точно, потому что биты тут считаются брутто, т.е. включают в себя всякую служебную информацию, вроде коррекции ошибок. Эти самые боды названы в честь Жана Мориса Эмиля Бодо, французского инженера, который в 1870 году придумал базовую кодировку для телетайпов (aka международный телеграфный код №1).
А ещё, оказывается, что слово android почти втрое старше слова robot, которому в прошлом году исполнилось 100 лет.