Игра разума. Как Клод Шеннон изобрел информационный век - Сони Джимми. Страница 17
Теперь еще больше упростим эту схему. Допустим, мы хотим изучить целую популяцию индивидуумов, выбрав всего две черты, А и В.
А что если целую популяцию и все ее релевантные гены можно представить в виде всего одного алгебраического выражения?
И снова каждый ряд символов получен от одного родителя, а каждая колонка обозначает позицию гена. Скажем, существуют две возможные аллели для А (к примеру, каштановые и светлые волосы) и три для В (высокий, среднего роста и низкорослый). В этом случае получится двадцать один генетически отличный от других индивидуум (поверьте нам), варьирующийся от
A1B1
A1B1
до
A1B3
A2B2
Итак, как мы можем смоделировать генетические изменения населения со временем, или предсказать результаты его произвольного смешения с другой группой? Как будет выглядеть новая популяция через пять поколений? А через тысячу поколений?
Если бы мы были наделены неограниченным количеством времени и бумаги, то могли бы произвести расчеты отдельно для каждого из двадцати одного индивидуума, соединившихся в произвольном порядке с представителями другой группы. В результате мы получили бы одно поколение, а дальше мы могли бы вновь и вновь повторять этот процесс до бесконечности. А что если целую популяцию и все ее релевантные гены можно представить в виде всего одного алгебраического выражения? Оно должно быть, как отметил Шеннон, одновременно компактным и наглядным: достаточно компактным, чтобы использовать его в качестве единственной величины в уравнении, и наглядным, чтобы его можно было «разобрать» на все его составляющие, когда нам нужно остановить циклы рекомбинации и изучить результаты.
Размышляя подобным образом, Шеннон изобрел символ, чтобы суммировать всю популяцию: λhijk.
Данное выражение действительно, как он указывал, является «целой группой цифр». λ – это популяция в целом, h, j, i и k – это гены. По мере того как мы узнаем ряд генов, возможных для данной популяции, мы можем заменить эти буквы рядом цифр. Колонка hj – это одна позиция гена, и так как первая рассматриваемая черта имеет две аллели, значение h или j может варьироваться от 1 до 2. Колонка ik – это другая позиция гена, и так как вторая рассматриваемая черта имеет три аллели, значение i или k может варьироваться от 1 до 3. λ1322 теперь означает не одного индивидуума, а долю целой популяции, имеющей генетический код:
A1B3
A2B2.
λhijk – это особенно простой способ перевести в символы частоту гена, потому что, как и хорошая оптическая иллюзия, она открывает два разных набора информации, в зависимости от того, как мы ее читаем. Если читать вертикально, то колонки с величинами – hj и ik – означают позиции генов, что подводит нас к качествам любого индивидуума в данной популяции. Если прочитать горизонтально, ряды величин —hi и jk— означают наборы хромосом, каждая из которых наследуется от одного из родителей.
Другими словами, это была попытка Шеннона повторить центральный концептуальный скачок, который он применил в своей диссертации, посвященной электрическим схемам. И, как и прежде, рациональный выбор символов – суммирование в параллельном соединении или решетка величин для хромосом – позволил Шеннону упростить и смоделировать будущее на бумаге. Оставшаяся часть его диссертации представляла собой набор генетических теорем, которые стали сферой приложения его алгебраических инструментов. С их помощью он мог оценить вероятность того, что определенный ген проявится у индивидуума после n-поколений. Он мог использовать суммирование для обозначения комбинации нескольких популяций, а умножение – для рандомизированного размножения, и он показал, как вычислять продукт двух популяций, λhijk · λhijk. Там были фракции популяций, воображаемые «негативные популяции» и скорости изменения частоты генов со временем. Он также мог рассматривать «летальные факторы», или естественный отбор и недостаточно адаптируемые черты, рассматриваемые во времени – алгебра эволюции. Он использовал алгебраические уравнения, в которых х была целой группой организмов: располагая данными о генах известной группы в настоящем, он мог заглянуть в прошлое и установить гены неизвестных предков, которые стали основоположниками семейного древа. Но самое важное, он вывел уравнение – двенадцатилинейную махину из соединенных друг с другом скобок и экспонент, – которое давало частоту трех разных аллелей в любой популяции через любое количество поколений. И хотя ряд сделанных в диссертации заключений не был открытием, этот последний итог – экстраполяция в будущее любых трех черт – был абсолютно новым достижением. Менее чем через год после того, как Шеннон освоил новую терминологию, он смог выдать результаты, на пять-десять лет предвосхищавшие ход науки.
Но в отличие от сделанных им открытий в области переключателей тока, работа Шеннона о генетике получилась успешной только потому, что уровень абстрагирования был гораздо выше. Есть некая ирония в том, что учреждение, предназначавшееся для практических целей – продвигать идеи селекционного отбора людей, – завершило свое существование такой непрактичной работой. Во всех случаях, за исключением самых простейших организмов, алгебра Шеннона требовала слишком много данных, чтобы сделать реальные прогнозы. «Моя теория дает прогнозы на будущее при наличии всех генетических фактов, – объяснял он позднее. – Но люди не знают всей информации, особенно в том, что касается человеческого организма. Им гораздо больше интересна плодовая мушка!» Спустя два года после смерти Шеннона генетики завершили выстраивание последовательности генома человека. Но даже тогда требовалось еще очень много данных по генетической вариации между человеческими индивидуумами, чтобы алгебра Шеннона заработала. Если что-то и должно было получиться из диссертации Шеннона, то явно не такой мгновенный и ощутимый итог, как цифровой компьютер, а скорее, новые методы и символы, помогающие решать проблемы популяционной генетики в самых общих понятиях.
Но даже это пришлось бы претворять в жизнь без помощи Шеннона. Он оставил свою работу в области генетики сразу после того, как она была отпечатана и прошита.
В определенном смысле предметом диссертации был сам Клод Шеннон. Данный проект был инициативой Буша, и гипотеза была его. Гипотеза: субъект, двадцатитрехлетний гений, работающий в научной области, в которой он не получил образования и «даже не знал, что означают конкретные термины», способен сделать оригинальные открытия меньше чем за год. Заключение: подтверждено в целом.
В кулуарах Буш потихоньку тщательно изучал мнения своих коллег, признавая, как и прежде, что в работе Шеннона просматривались черты дилетантизма: «Сначала все идет нормально, потом резко прерывается, и обнаруживаешь очевидные грубые ошибки». Тогда уже он был готов огласить Шеннону свой вердикт как можно более деликатно. «Мне нужна ваша поддержка, прежде чем я поговорю с ним относительно конкретной вещи, – писал он гарвардскому специалисту по статистике, – потому что то, что я скажу, может его сильно воодушевить или разочаровать». Такое беспокойство говорит о чувствительном самолюбии, которое Буш видел у своего студента, «человека, с которым следует обращаться крайне деликатно», а также о том простом факте, что в академической жизни Шеннон вплоть до того момента – от Гэйлорда до Кембриджа – не знал поражений.
В любом случае Бушу не пришлось сообщать плохие новости: в появившихся рецензиях звучали фразы типа «очень достойно» и «весьма впечатлен». Беркс была особенно участлива, выражая свое одобрение. Существует легенда о том, что математик семнадцатого века Паскаль в возрасте двенадцати лет самостоятельно открыл теоремы евклидовой геометрии, рисуя на полу своей детской. И работа Шеннона, по заявлению Беркс, была чем-то подобным. «Я совершенно точно знаю, что это должно быть слегка отшлифовано, а затем опубликовано», – писал Буш Шеннону не без удовлетворения.