Аналогия - Медников Борис Михайлович. Страница 11

Письмо капитана Гранта. Полагаю, в детстве все вы читали захватывающую историю Жюль Верна, которая начиналась с того, что в брюхе акулы была найдена бутылка, а в той бутылке — три записки. Море смыло часть текста, но можно было догадаться, что они написаны на разных языках — английском, немецком и французском. Остаток английского текста гласил:

… 62… Bri… gow… sink… stra… aland… skipp… Gr…… that monit… of long… and… ssistance… lost…

To же на немецком:

… 7 Juni… Glas… zwei… atrosen… graus… bringt ihnen…

Видимо, Жюль Берн знал немецкий хуже английского. По той же причине лучше всего сохранился французский текст документа:

… troi… ats… tannia… gonie…austral… abor… contin… pr… cruel… indi…jete… ongit et 37°11'… lat…

Казалось бы, немного. Но герои романа во главе с Жаком Паганелем в конце концов, ошибаясь и в процессе кругосветного путешествия исправляя ошибки, уверенно восстановили текст, за исключением одного слова. Вот как выглядел текст в переводе на русский язык:

«27 июня 1862 года трехмачтовое судно «Британия» из Глазго потерпело крушение в тысяче пятистах лье от Патагонии, в Южном полушарии. Два матроса и капитан Грант добрались до острова Табор. Здесь, постоянно терпя жестокие лишения, они бросили этот документ под 153° долготы и 37°11" широты. Придите им на помощь".

Я подчеркнул те слова и части слов, которые сохранило море. Чем для нас примечательна эта выдуманная история? Прежде всего, тем, что текст повторен трижды. Будь копии одноязычными, результат был бы тот же: помехоустойчивость сигнала возросла бы. Примечательно, что Паганель споткнулся на слове «Табор» — оно имелось только во французском тексте и, значит, не обладало трехкратной избыточностью. Впрочем, будь оно расшифровано, героям романа не пришлось бы совершать кругосветное плавание, и роман вообще бы не состоялся.

Сопоставим это с тем фактом, что каждый из нас имеет двойной, диплоидный, набор генов — от отца и от матери. Как говорят генетики, наши организмы на всем протяжении развития от оплодотворенной яйцеклетки, зиготы, находятся в диплофазе. Только наши гаметы — спермии и яйцеклетки гаплоидны, имеют один набор генов.

Но это не общий для всей природы закон. Высшие растения имеют две стадии развития — гаплофазу и диплофазу. Но и у них гаплофаза редуцирована и, в конце концов, паразитирует на диплофазе, являясь частью цветка. Мужской гаплоидный организм цветковых состоит всего-то из трех клеток (пыльцевое зерно). А многие простейшие, грибы и водоросли на протяжении большей части жизни живут в гаплофазе. У них диплоидна только зигота. Гаплоидны и бактерии.

Какой вывод можно сделать из этого? По-видимому, дублирование, а то и многократное повторение генетической информации необходимо для прогрессивной эволюции. И необходимо именно потому, что повышает помехоустойчивость. Если генетический текст повторен трижды, возникают триплоиды. Они бесплодны при половом размножении, но отличаются мощностью роста, высокой жизненной устойчивостью. Таковы гигантская триплоидная осина, бессемянный культурный банан и многие другие сорта растений, а также триплоидные земноводные и рыбы.

Но это не единственный вывод, который можно сделать, анализируя с точки зрения теории информации письмо капитана Гранта. Возьмите русский перевод. В нем 48 слов, из коих можно восстановить 25. Но для понимания смысла текста многие слова лишние, такие как «трехмачтовое судно», «в тысяче пятистах лье от Патагонии» (обрывок последнего слова вынудил Гленарвана со спутниками пересечь Анды и пампасы), «в южном полушарии» (моряк так бы не написал, он ограничился бы аббревиатурой Ю. Ш., точнее s.l.), «здесь они бросили этот документ». Так что для понимания смысла достаточно было 32 слов, многие из которых восстанавливаются по обрывкам: Bri, gow, stra, aland, contin, indi… ongit и т. д.

Получается, что многие символы в тексте письма лишние? Ведь и без них можно обойтись?

Да, лишние. А значит, следуя логике авторов модной гипотезы, их бы следовало назвать «эгоистическими, паразитическими, мусорными» и т. д.

Вы скажете, конечно, что здесь что-то не так. Вот мы и подошли к важному выводу теории информации: все человеческие языки построены со значительной избыточностью. Как оценить степень этой избыточности? Абсолютно точное определение этой величины нереально, хотя бы потому, что избыточность — свойство не языка, а написанного на нем текста. Но, сопоставив много разных текстов, мы можем вывести нечто среднее, характеризующее язык, что-то вроде средней температуры по больнице. Метод определения доступен каждому. Его можно назвать хотя бы методом Паганеля, а суть его — моделирование письма капитана Гранта.

В такую игру удобнее играть вдвоем. Один, по возможности случайно, выбирает кусок текста, неизвестного партнеру. Достаточно примерно тысячи знаков. Затем, пользуясь таблицей случайных чисел, из него вычеркивают 10, 20, 50 и т. д. процентов знаков. Второй игрок должен текст восстановить. Так определяется избыточность текста, выражающаяся в процентах «лишних» символов, без которых задачу можно решить. Хорошо для этой цели использовать персональный компьютер.

Подобные опыты, проведенные в разных странах, на разноязычных текстах, дают близкие цифры: примерно до 80% символов в лингвистической информации оказываются лишними. Мы могли бы говорить и писать в пять раз экономнее — но сколько времени мы бы тогда тратили на расшифровку сообщения?

В принципе, возможно построить совершенно безызбыточный язык, так называемый оптимальный код. В нем каждое случайное сочетание букв означало бы осмысленное слово. Но пользоваться им было бы невозможно. Как в свое время заметил И. А. Полетаев, «никакой аптекарь не рискнул бы выполнить рецепт, написанный типичным врачебным почерком, если бы ошибка в одной букве меняла слово «аспирин» на слово «стрихнин»». Да и жизнь машинисток и наборщиков, телеграфистов и редакторов была бы сплошным мучением.

Конечно, в одном и том же канале можно встретить разные по избыточности тексты. Хорошо бы таким способом сравнить плотность информационного содержания в текстах, например, Хемингуэя и Проскурина. Убежден, что не только теория информации, но и теория литературы почерпнула бы от таких экспериментов немало полезного. Напомню, что Проспер Мериме, отчаявшись перевести пушкинский «Анчар» на французский язык, сделал это по-латыни. Значит ли это, что французский язык избыточнее русского? Вряд ли: в стихотворениях хотя бы Франсуа Вийона плотность информации не меньше пушкинской:

На помощь только враг придет,
Лишь о святом дурная слава,
Всего на свете горше мед,
И лишь влюбленный мыслит здраво.

Но оставим это литературоведам и перейдем к специальным языкам. Строго говоря, к ним нельзя применить это название. Специальные языки — это способы построения текстов, подлежащих передаче по каналу со специфическими свойствами, например, при наличии высокого уровня помех. Особенно часто они используются там, где ошибка в расшифровке сообщения стоит чересчур дорого. С этой точки зрения для нас наиболее интересен язык аэродромных диспетчеров, на котором они общаются по радио с пилотами взлетающих и идущих на посадку самолетов.

Соответствующие исследования показали чудовищную избыточность языка диспетчеров — до 96%! Только столь низкая информационная плотность сигнала позволяет преодолеть высокий уровень помех. И хорошо, что никому в голову не приходит объявить 96% слов в радиопереговорах лишними, мусорными и наказывать пилотов и диспетчеров за многословие.