Заглянем в будущее - Семенов Николай Николаевич. Страница 41
Логарифмическая функция, знакомая из школы, возрастает очень медленно с ростом числа. Значит, и потребное количество информации с ростом числа вариантов растет очень медленно. Так, продолжая нашу таблицу для большого числа исходов, легко находим, что при 512 вариантах необходимо только 9 единиц информации, чтобы принять решение, а при N = 4096 только на три единицы больше, то есть 12.
Иногда удивляются тому, как опытный следователь, получая от обвиняемого скупые ответы только в виде единиц информации — «да» или «нет», быстро распутывает дело. Ему, безусловно, помогает выведенная нами логарифмическая зависимость.
Единичная доза информации, которая получается из нашей формулы, если в ней положить N = 2 (log2 2 = 1), получила международное название «бит». Оно происходит от сокращения английских слов binary digit, что значит — двоичная единица.
В жизни мы на каждом шагу пользуемся этой минимальной дозой информации в один бит. Кто не подсказывал в школе товарищу движением головы, чтобы сообщить ему ровно один бит информации — «да» или «нет»? Не случайно жизнь выработала этот метод четкого вопроса — «да» или «нет»? Он требует принятия решения и четкого ответа в виде одного бита информации — «либо да, либо нет», он требует ухода из болота «ни да, ни нет», «скорей да, чем нет», «и да и нет».
Бит обладает ценными свойствами. Он наиболее прост и надежен при передаче информации на расстояние: кивок головой, взмах рукой, голос, выстрел, взрыв, световой зайчик, костер, ракета и т. д.
Для систем проводной и радиосвязи бит просто клад. В силу своей простоты — ведь надо передать только «да» или «нет» — он отлично сражается с помехами и обеспечивает наибольшую дальность и наименьшие ошибки.
В «жилах» ЭВМ тоже в большинстве случаев бегут биты — они наиболее надежны, они упрощают конструкцию, они подчиняются простейшей логике.
Наконец, самое главное — из этих простых дальнобойных посылок типа «да» — «нет» (в канале связи это может быть + и –, 0 и 1, излучение и отсутствие излучения) можно составить любую сложную информацию (как из простых кирпичей создают чудеса архитектуры). Даже, точнее сказать, наоборот: любую информацию — речь, музыку, изображение — можно разложить на простые биты типа «да» — «нет», передать их в таком надежном виде по каналам связи, а затем снова сложить из них исходную информацию.
Итак, если мы передаем из одной точки пространства в другую одну посылку, которая может принимать только одно из двух равновероятных значений — «да» или «нет», — то мы сообщаем ровно один бит информации.
При этом передаваемая информация, конечно, совершенно не зависит от вида переносчика и от длительности посылки. Это может быть звук, свет, электрический ток, радиоволна, луч лазера; а длительность любая — микросекунда, секунда, час, год и т. д.
Как же практически пересчитать объем информации, содержащийся в той или иной книге, например в Большой Советской Энциклопедии, в биты?
Русский алфавит состоит из 32 букв. Каждой букве можно поставить в соответствие комбинацию из пяти символов типа «да» — «нет» (25 = 32). Однако в тексте встречаются еще цифры, знаки препинания и другие вспомогательные знаки: скобки, кавычки, тире и т. д. Поэтому возьмем комбинацию не из пяти, а из шести символов.
Раскрываем наугад любой том БСЭ и считаем число букв, цифр и знаков, которое размещается на странице. Округленно подсчет дает 6000. Следовательно, если переписать эту страницу на двоичный алфавит, то есть покрыть ее унылым набором из «да» и «нет», а практически пишут 0 и 1, то общее их число будет 6 ? 6000 = 36 000. (При том же шрифте и формате это потребует уже шести страниц.)
Если бы все буквы, цифры и другие знаки встречались в тексте одинаково часто, то количество информации на одной странице БСЭ было бы равно числу двоичных знаков, то есть составляло 36 000 бит. Но, как показал Клод Шеннон, если одни символы встречаются чаще, а другие реже, то количество информации в таком тексте падает. Учет этого обстоятельства для русского языка уменьшает количество информации на нашей странице, испещренной только нулями и единицами, приблизительно в три раза.
Таким образом, одна страница БСЭ содержит лишь 12 000 бит информации. Считая среднее число страниц равным 650, получаем объем информации в одном томе 7 800 000 бит, а во всех 51 томах округленно 400 миллионов бит (4 · 108 бит).
О достоинствах бита мы говорили: это простота и надежность; и в этом смысле он друг человека (а возможно, и других разумных существ, если они есть) Но этот друг может стать, и частично уже стал, врагом человека. Об этом красноречиво свидетельствует экспонента, по которой растет армия бит во времени.
Их становится так много, что в этих джунглях из бит можно заблудиться. Ведь в общую копилку человеческих знаний непрерывно вносят свою долю миллионы людей, и ее «золотой фонд» растет с колоссальной скоростью. Число бит в копилке достигло астрономической величины. И ориентироваться даже на небольшом участке этой копилки становится все труднее и труднее.
Ситуация напоминает сказку К. Чуковского, когда девочка Женя пожелала иметь все-все игрушки мира и чуть-чуть не стала жертвой их нашествия.
Анализ роста основных показателей земной цивилизации — потребляемая энергия и вещество, народонаселение, объем научной и технической информации и т. д. — за ряд последних столетий показывает, что он происходит по так называемой экспоненте. Что это значит?
Снег подтаивает. Вы находитесь на верху крутого склона. Слепили снежок, пустили его вниз и наблюдаете, как он катится. Снежок быстро облипает снегом и растет, как на дрожжах: чем больше его масса, тем больше на него налипает снега и тем быстрее он разрастается. В этом и есть вся премудрость экспоненты, ее закон.
Сам закон получается вот откуда. Обозначим нарастающую массу нашего снежного кома буквой игрек (у), тогда скорость ее нарастания есть производная массы по времени, то есть dy/dt. Если обходиться без высшей математики, то можно эту же скорость вычислить, деля прирост массы кома ?у на время ?t, за которое он произошел: dy/dt.
Экспоненциальная зависимость требует прямой пропорциональности в каждый момент времени между растущей массой кома у и скоростью налипания на ком снега
?y/?t(точнее dy/dt) .
Следовательно, общее условие прямой пропорциональности запишется так:
?y/?t = Const у .
Если такая зависимость справедлива, например, для народонаселения планеты, то с увеличением его, скажем, в три раза скорость его прироста тоже должна возрасти в три раза. Это, в свою очередь, ускорит дальнейшее нарастание численности населения и, соответственно, пропорциональное нарастание скорости его прироста и т. д.
Если ничто не нарушит прогресса с такой прямой пропорциональностью, то у может достичь сколь угодно больших величин.
В примере со снежным комом естественным ограничением явится длина снежного склона.
Если склон очень длинен, например, вы пустили снежок с вершины или седловины Эльбруса, то при больших значениях у сильно возрастет сопротивление воздуха, его движение замедлится, скорость налипания ?y/?t упадет, нарастание кома замедлится, прямая пропорциональность нарушится.
Теперь естественно спросить, по какому же закону во времени должна нарастать масса нашего снежного кома у, чтобы была прямая пропорциональность между y и ?y/?t?
Оказывается, есть только одна удивительная функция, которая при всех значениях пропорциональна своей производной, удовлетворяющая нашему уравнению. Вот она: