Логика случая. О природе и происхождении биологической эволюции - Кунин Евгений Викторович. Страница 25
Фундаментальные причины существования различных соотношений для различных функциональных классов генов еще не выяснены. Привлекательно простая модель эволюции метаболических сетей прокариот как «ящика с инструментами», предложенная Сергеем Масловым и коллегами, может быть первым шагом на пути объяснения квадратичной зависимости, характерной для регуляторных генов (Maslov et al., 2009). В этой модели ферменты, необходимые для утилизации новых метаболитов, добавляются вместе с соответствующими им регуляторами (в первую очередь посредством горизонтального переноса генов, гл. 5) во все более развитую сеть реакций. В результате усложнения сети, обеспечивающей все большее разнообразие ферментов промежуточных реакций, увеличивается отношение числа регуляторных генов к регулируемым. В какой-то момент, и его наступление можно точно предсказать, цена добавления новых регуляторов неизбежно станет слишком невыгодной («разрастающаяся бюрократия») и будет ограничивать рост сложности генома.
Гипотеза «бюрократического потолка» для верхней границы сложности генома выглядит особенно правдоподобно в свете почти полного отсутствия роста числа генов в геномах позвоночных, особенно млекопитающих (и в наших геномах тоже), для которых связь между числом генов и размером генома очевидно нарушена (см. гл. 3 и 8). В принципе число генов могло бы быть напрямую ограничено ценой репликации ДНК, но для огромных геномов позвоночных этот фактор можно смело исключить как главное ограничение. Соответственно, цена регуляции, возможно совместно с ценой экспрессии, выглядит наиболее вероятным кандидатом на роль основного фактора, ограничивающего рост числа генов. Поэтому не случайно позвоночные (и в меньшей степени другие многоклеточные эукариоты) выработали новые, замысловатые способы увеличения сложности протеома, такие как широко распространенный альтернативный сплайсинг, альтернативная трансляция и сложная регуляция (в особенности обширный, все еще слабо изученный набор регуляторных РНК). Такие формы сложности не вызывают инфляционный рост числа белок-кодирующих генов и, таким образом, снижают по крайней мере некоторые издержки, особенно издержки трансляции (см. гл. 8).
Рис. 4-10. Четко различающиеся соотношения между различными функциональными классами генов и размером генома (общим числом белок-кодирующих генов) прокариот. Использована информация из базы данных COG (Tatusov et al., 2003). График построен в двойных логарифмических координатах.
Универсальная зависимость численности функциональных классов генов от размера генома находится в обратной зависимости с ранее описанным степенным законом распределения численности семейств генов. Чем больше положительный показатель степени функции зависимости от размера генома для функционального класса генов (рис. 4-10), тем меньше отрицательный показатель степени функции распределения численности семейств в этом классе (рис. 4–7). Кажется интуитивно правдоподобным, что функциональные классы с сильной зависимостью от размера генома должны содержать много больших семейств паралогичных генов. Обратная зависимость этих двух универсалий генома была выведена в рамках простой эволюционной модели, в которой используются правила пропорциональных вычислений для функциональной композиции генома, например «добавить два регулятора на каждый метаболический фермент» (Grilli et al., 2011). Предсказания этой модели подтверждаются эмпирическими данными для многих геномов бактерий и архей.
Стохастичность, нейтральность и отбор в эволюции
В предыдущих разделах этой главы мы ознакомились со многими количественными универсалиями, отражающими важнейшие аспекты эволюции и функционирования генома. Среди этих универсалий мы рассматривали вездесущий степенной закон распределения, который описывает как структуру всех биологических сетей, так и семейства паралогичных генов в разнообразных геномах, близкое к логарифмически нормальному распределение скоростей эволюции генов и универсальные корреляции, такие как отрицательная корреляция между генной экспрессией и скоростью эволюции. Какова природа этих универсалий? Отражают ли они какие-то глубокие свойства эволюции или это просто статистические эффекты, не имеющие отношения к пониманию биологических явлений? Здесь и далее в этой книге (гл. 13) будет отстаиваться точка зрения на эти универсалии как на нетривиальные, характерные и биологически значимые тенденции, хотя они отражают только одну из двух (а возможно, и большего числа) дополнительных (в смысле принципа дополнительности Бора) составляющих эволюции жизни [44].
Во-первых, как это уже отмечалось и теперь совершенно очевидно, все эти универсалии зависимы от поведения совокупностей генов, фундаментальных единиц эволюции, рассматриваемых как статистические ансамбли. Таким образом, эти универсальные зависимости и распределения являются эмергентными свойствами биологических систем, то есть свойствами, проявляющимися в результате того, что эти системы состоят из многочисленных (достаточно многочисленных для проявления устойчивых статистических закономерностей) элементов (генов или белков, в зависимости от контекста), слабо взаимодействующих друг с другом (если сравнивать эти взаимодействия с теми, которые поддерживают целостность самих этих элементов).
Во-вторых, как мы уже видели, современный эволюционный анализ не останавливается на демонстрации существования универсальных понятий и законов. По крайней мере некоторые ключевые универсалии, такие как распределение эволюционных скоростей, отрицательные корреляции между скоростью эволюции и экспрессией и распределение численности паралогичных семейств, были теоретически выведены в рамках простых, но достаточно детализированных, формальных моделей эволюции. Способность простых моделей, в которых в качестве элементарных событий рассматриваются наиболее общие эволюционные процессы (такие как дупликация и утрата генов), объяснять геномные универсалии убеждает в том, что эти универсалии отражают существенные черты эволюции.
Третье, и, возможно, наиболее важное, замечание о новой парадигме понимания эволюции, которую мы пытаемся здесь обрисовать, состоит в том, что порождающие модели для общегеномных универсалий либо совсем не используют понятие отбора, либо используют только понятие очищающего (стабилизирующего) отбора. Эта форма отбора направлена на сохранение статуса-кво и наблюдается для укладки белковых молекул, для распределения численности генных семейств и для универсальной зависимости численности функциональных классов генов от общего числа генов (Koonin and Wolf, 2010b).
Аналогия между эволюционным процессом и статистической физикой не ограничена существованием универсальных зависимостей и распределений, некоторые из которых могут быть выведены в рамках простых моделей. Возможно также составить схему детального соответствия ключевых параметров этих двух областей (Barton and Coe, 2009; Sella and Hirsh, 2005). Такой параметр состояния (степень свободы), как положение частицы, в этой схеме является аналогом либо состояния сайта в нуклеотидной или белковой последовательности, либо состояния гена в геноме (в зависимости от уровня моделирования эволюции), и тогда параметрам скорости эволюции для сайта или гена будет соответствовать скорость частицы. Более того, значение эффективной численности популяции будет очевидно аналогичным значению температуры в статистической физике, а приспособленность будет соответствовать свободной энергии.
Краткий обзор и перспектива: о природе эволюционного процесса
Результаты взаимопроникновения сравнительной геномики и системной биологии, обсуждаемые в данной главе, приводят нас к следующему ключевому обобщению.
Многие, чтобы не сказать все, общие закономерности геномной и молекулярно-фенотипической эволюций описываются стохастическими процессами, основанными на принципе подверженной ошибкам репликации и ограниченными очищающим отбором, который поддерживает существующую общую (но не специфическую) архитектуру генома и устройства клеток.