Математика нематериального генома
[...] Ричард Штернберг и другие ученые, утверждают, что стандартные алгоритмы не могут полностью объяснить биологию. [...] Согласно аргументации Штернберга, биологические процессы управляются когнитивными способностями – способностью делать аутентичный выбор и проявлять творческое поведение – а центр управления жизнью является нематериальным (см. здесь, здесь). В этой статье я приведу несколько приблизительных расчетов, чтобы проиллюстрировать, почему многие пришли к таким выводам. Хотя это и не является формальной защитой, анализ направлен на то, чтобы дать читателям интуитивное понимание логики, лежащей в основе этой точки зрения.
Определение проблемы
Неалгоритмический характер жизни хорошо иллюстрируется на примере развития – процессе превращения оплодотворенной яйцеклетки в младенца. Если бы эмбриональное развитие контролировалось алгоритмически (т. е. исключительно с помощью физических механизмов), оплодотворенная яйцеклетка или другая исходная точка содержала бы необходимую информацию для управления всем процессом развития. В следующем анализе будет проверена эта «преформистская» гипотеза в отношении человека.
Первый шаг – оценка количества информации в оплодотворенной яйцеклетке человека (зиготе). Информация в ДНК человека составляет около 10 миллиардов бит (10¹⁰) – каждый из 3 миллиардов локусов может содержать любой из 4 нуклеотидов, а каждый нуклеотид соответствует 2 битам. Наибольший объем информации, который может содержаться в зиготе, вероятно, меньше количества белков, ДНК, РНК, липидов и углеводов, то есть меньше 1 000 000 000 000 000 (10¹⁵) бит.
Чтобы определить, не ниже ли эти значения требуемой информации для развития, необходимо разделить эмбриологию на отдельные области и стадии. Я оценю количество отдельных областей на основе среднего расстояния между капиллярами и диапазона многих химических сигналов, которое составляет порядка 1 мм, что дает 1 000 000 областей, содержащих несколько тысяч клеток. Я оценю количество стадий развития на основе времени между отдельными состояниями клеток, связанными с транскрипцией, клеточной организацией, движением и сигналами. Нижняя граница оценки составляет 1000 отдельных стадий развития человека, продолжительностью примерно 7 часов. Общее количество переходов между стадиями в отдельных областях является произведением двух чисел, которое составляет 1 000 000 000 (10⁹).
Если бы зигота содержала всю информацию, необходимую для управления развитием, ей потребовалось бы закодировать инструкции для каждого из примерно 10⁹ различных переходов развития. Однако объем информации в геноме, который можно выделить на каждый переход, ограничен. Используя верхнюю границу в 10¹⁰ бит в геноме, получается только около 10 бит на переход – этого едва хватает для кодирования нескольких двоичных выборов. Даже если мы предположим, что максимальная теоретическая информационная емкость клетки ближе к 10¹⁵ битам, эта верхняя граница все равно дает только около 1 000 000 битов на один переход.
Расчет необходимой информации
Модели вычислений целых клеток могут дать представление о минимальных информационных требованиях для алгоритмов развития. Karr et al. (2012) смоделировали жизненный цикл Mycoplasma genitalium [считается организмом с наименьшим известным размером генома – прим. перев.], включая его компоненты и молекулярные взаимодействия. Их симуляция моделировала 28 клеточных процессов с использованием около 1000 уравнений и 2000 переменных. Размер пакета программного обеспечения для моделирования составляет 500 миллионов бит. Даже эта симуляция одной из самых простых известных клеток превышает порог, необходимый для того, чтобы зигота содержала информацию, необходимую для развития.
Однако сложность преобразования одной области человеческого зародыша в следующую стадию развития представляет собой гораздо более сложную задачу. Каждая область соответствует тысячам клеток. Минимальный перечень соответствующих переменных для одной только клетки включает в себя следующее:
● 10 000 состояний генов
● 10 000 эпигенетических состояний
● 100 состояний сигнальных молекул
● 100 состояний внеклеточного матрикса и механических состояний
Дополнительные переменные соответствуют типам и формам клеток, движению и микроокружению.
Любой алгоритм, участвующий в управлении развитием, должен работать с огромным набором переменных, включая как внутренние состояния клеток, так и сигнальные переменные, общие для соседних клеток, а зачастую и для клеток, находящихся в отдаленных областях. Некоторые типы клеток, такие как остеобласты, мигрируют на значительные расстояния, выполняя сложные функции и динамически взаимодействуя с множеством типов клеток и тканевых сред. В результате общее количество переменных и их взаимозависимостей в процессе развития значительно превышает количество переменных в симуляциях целых клеток.
Кроме того, модели целых клеток используют четко определенные алгоритмы для решения систем уравнений. В отличие от них, эмбрионы могут творчески реагировать на вызовы, используя нестандартные клеточные механизмы неалгоритмическим образом. Они часто очень быстро находят оптимальные решения проблем, с которыми никогда раньше не сталкивались. Эти отличия от моделей целых клеток указывают на то, что объем информации, связанной с любым набором алгоритмов, который мог бы направлять только один из 10⁹ переходов, должен быть намного больше 500 миллионов бит. Более того, информация, хранящаяся в зиготе, должна соответствовать программному и аппаратному обеспечению для запуска алгоритмов развития. Зигота не способна хранить всю необходимую информацию.
Даже если зигота могла бы содержать алгоритмическую информацию, необходимое количество вычислений представляет собой не менее сложную проблему. Открытый характер проблем, возникающих в процессе развития, означает, что переход клеток от одной стадии к другой представляет собой неалгоритмическую проблему (см. «Новая статья о философской революции в биологии – разум выше материи»). Такие проблемы требуют большего количества операций, чем NP-трудные проблемы, которые экспоненциально увеличиваются с количеством переменных.
Следовательно, количество вычислений для одного перехода развития должно превышать 10⁹ в степени 10, что составляет 10⁹⁰ (1 с 90 нулями). Модели целых клеток могут моделировать клеточный цикл за 10⁹ операций, и показатель степени умножается на 10, поскольку переходы развития включают более чем в 10 раз большее количество переменных. Такое количество вычислений невозможно выполнить даже на самом быстром компьютере, размером с Землю, за всю историю Вселенной; оно является трансвычислительной задачей.
Еще одним примером трансвычислительной задачи природы развития является количество возможных изменений состояния генов. Если из примерно 10 000 генов, участвующих в развитии, изменяются всего 30, количество комбинаций приближается к 10⁹⁰. Для сравнения: на одном этапе развития могут произойти тысячи изменений состояния генов, поэтому для реагирования на нарушения развития на протяжении всего периода развития может потребоваться изменение более 30 генов. Количество возможных реакций – и вычислений, необходимых для их оценки – значительно превышает 10⁹⁰.
Заключение
Если зигота не может содержать информацию, направляющую развитие, то эта информация должна находиться в логической и математической структуре, которая проистекает из платоновской формы или эквивалентна ей, как заключил Штернберг. Если кто-то не желает принимать столь радикальный вывод, он должен признать, что алгоритмы развития демонстрируют эффективность и изобретательность, которые значительно превосходят человеческие знания. Они могли возникнуть только из разума, намного превосходящего наш собственный.
Кроме того, необходимо отказаться от любой ненаправленной эволюционной модели. Каждая область плода использует набор операций, который включает в себя карту последующих этапов развития и инструкции по переходу от текущего этапа к следующему. Они также должны иметь планы на случай непредвиденных обстоятельств для бесчисленных возможных начальных состояний. Любой крупный эволюционный переход должен мгновенно изменять алгоритмы во всех областях на всех этапах. Если бы мутации перенаправляли только несколько областей на нескольких этапах к новому организму, последующие этапы вернули бы траекторию развития плода к исходной цели. Если бы попытки перенаправления не увенчались успехом, индивид подвергся бы деформациям или смерти. Только дизайнер мог бы одновременно изменить каждый алгоритм, чтобы последовательно направить развитие к новому результату.