Перевірка фактів: Новий «повний» геном шимпанзе показує 14,9% відмінність від геному людини
В новаторській статті в журналі Nature повідомляється про «повне секвенування геномів мавп» («Complete sequencing of ape genomes»), включаючи геноми шимпанзе, бонобо, горил, борнейських орангутангів, суматранських орангутангів та сіамангів. Я вже зазначив це, повідомивши, що ікона еволюції – знаменита «1-відсоткова різниця» між геномами людини й шимпанзе, про яку твердять в усіх популярних та інших наукових виданнях й підручниках, – впала. Дослідники, з якоїсь причини – я не вмію читати думки – вважали за краще поховати цей чудовий висновок в технічному жаргоні в розділі «Додаткові дані». А тепер докладніше про наукові деталі.
Ви можете подумати: «А чи не були ці геноми секвеновані давно?». Відповідь – так, але й ні. Так, ми секвенували геноми цих видів у минулому, але, як пояснюється в статті, «через повторювану природу геномів мавп повні збірки не були досягнуті. В поточних джерелах відсутній аналіз послідовностей деяких найбільш динамічних геномних ділянок, включаючи ділянки, що відповідають родинам генів, характерних для конкретної лінії».
Або, як сказано в супровідній статті:
«В минулому вчені розшифровували фрагменти геномів нелюдиноподібних мавп, але їм ніколи не вдавалося зібрати повну послідовність для будь-якого виду. Однак у нинішньому дослідженні Катерина Макова та її колеги використовували передові методи секвенування та алгоритми, які дозволили їм прочитати довгі сегменти ДНК й зібрати їх у послідовність, що простягається від одного кінця кожної хромосоми до іншого, без будь-яких пропусків. "Такого ще не було", – каже Макова».
Іншими словами, повні геноми мавп ніколи не були повністю секвеновані. А в якості еталонної послідовності вони використовували геном людини, через що геноми мавп виглядали більш схожими на людські, ніж насправді.
Ви не вірите мені?
З технічного документа:
«Більшість попередніх порівняльних досліджень геномів мавп було обмежено відображенням неякісних збірок на більш якісний геном людини. Таким чином, були введені людські референтні упередження».
Це узгоджується з тим, що Національний центр біотехнологічної інформації заявив у 2007 році про ранній проект геному шимпанзе:
«Контиги були зібрані з використанням людського геному в якості орієнтиру й тому вони «схожі на людські» в своїй конструкції. Це важлива відмінність, оскільки деякі послідовності, такі як інсерції, делеції й дуплікації генів, можуть бути не зовсім точно представлені в поточній збірці шимпанзе».
Таким чином, досі більшість версій геномів шимпанзе та інших мавп були фактично «схожі на людські», тому що вони були «зібрані з використанням людського геному як орієнтиру». Завдяки цьому геноми шимпанзе та інших мавп виглядають більш схожими на людський геном, ніж вони є насправді. Чи можуть ці нові креслення геномів мавп допомогти вирішити цю проблему?
Проблема вирішена?
Чергова стаття в Nature з поясненнями, схоже, припускає, що ці «повні» плани геномів мавп доведуть, що вони менш схожі на людський геном, ніж стверджувалося раніше:
«Незабаром після того, як в 2003 році була завершена робота над першою послідовністю геному людини, було опубліковано збірку геному шимпанзе. За нею послідували збірки інших людиноподібних мавп, таких як горила, суматранський орангутанг і бонобо, а також дрібних приматів, які менш близькі до людини, ніж людиноподібні мавпи. Ці геноми надали цінну можливість скласти каталог генетичних відмінностей, що накопичилися в ході еволюції приматів, включаючи зміни, унікальні для людини. Але оскільки ці перші версії були неповними планами, порівняння можна було проводити тільки між правильно розшифрованими ділянками геному. Тому ці дослідження були зосереджені тільки на відносно невеликих відмінностях і виключали надзвичайно повторювані послідовності й великомасштабні структурні відмінності, такі як інверсії й дуплікації геномних послідовностей». (Виділення додано)
Останнє речення ніби натякає на те, що попередні порівняння геномів людини й мавпи «фокусувалися тільки на відносно невеликих відмінностях» і «виключали» ділянки, які тягнуть за собою «великомасштабні структурні відмінності». В пояснювальній статті зазначається, що в ході дослідження були «повністю секвеновані геноми шести видів живих мавп, що дозволило провести довгоочікуване порівняння важкопорівнюваних геномних ділянок». Таким чином, можна було б очікувати, що ці нові «повні» геноми мавп виявлять набагато більше відмінностей в порівнянні з геномом людини.
Нові геноми мавп і геном людини
Що дивно, так це те, що при читанні технічного документа важко знайти пряме порівняння між геномами мавп і людини. Схоже, що цей уривок якнайближче до цього:
«В цілому, порівняння послідовностей повних геномів мавп виявило більшу розбіжність, ніж передбачалося раніше (Додаткові примітки III-IV). Дійсно, 12,5-27,3% геномів мавп не вирівнювалися або не відповідали простому вирівнюванню один до одного, тим самим вносячи прогалини».
Що саме це означає? Ну, по-перше, вони визнають, що «порівняння послідовностей повних геномів мавп виявило більшу дивергенцію, ніж передбачалося раніше». Але в технічній статті Nature людина розглядається як «мавпа», тому в цій заяві мається на увазі, що порівняння «геномів мавп» включає в себе порівняння геномів людини і мавпи (тобто нелюдиноподібних гоміноїдів). Тому до кінця цієї статті я буду називати людей «людьми», а нелюдиноподібних гоміноїдів – «мавпами», як це робить більшість нормальних людей.
Цікаво, що у двох препринтах статті (v1 і v2), опублікованих минулого року на BioRxiv (які, ймовірно, є версіями рукопису, представленого в Nature спочатку і опісля одного раунду правок), цей результат передує двома реченнями:
«Часто цитована статистика ∼99% ідентичності послідовностей між шимпанзе й людиною застосовна до більшої частини геному, якщо враховувати однонуклеотидні варіанти (SNV). Однак порівняння геномів T2T дає набагато більш точну оцінку».
T2T означає дослідження «від теломери до теломери» – тобто дослідження всієї хромосоми протягом усього геному. Ці речення, очевидно, були видалені під час редагування опублікованої в Nature версії – цікаве рішення редактора. То що ж говориться в статті про відмінності між людьми й шимпанзе?
Як ми побачимо, наведене вище твердження – що «порівняння послідовностей повних геномів мавп виявило більшу розбіжність, ніж передбачалося раніше» – є правильним. Але воно не розкриває масштабів відмінностей між геномами людини й мавпи, які виявило це дослідження. Тому дозвольте мені перейти до справи:
Подивіться на ці цифри: «12,5-27,3%». Ті самі цифри знову з'являються в «Додаткових даних», де порівнюються різні геноми мавп і людини. Їх можна знайти, якщо знати, де шукати, але чи варто говорити «поховані» – або «сховані»? Наскільки я можу судити, в «Додаткових даних» повідомляється, що геном мавпи, найбільш схожий на геном людини, – це геном шимпанзе. І він показує 12,5-відсоткове «gap-divergence» [розбіжність за рахунок розривів (невідповідності) – прим. перекл.] – тобто відмінність – від геному людини! А якщо подивитися на «gap divergence», коли геном людини є метою, а шимпанзе – запитом, то різниця складе 13,3 відсотка. Дозвольте уточнити: згідно з цим дослідженням, геноми людини й шимпанзе збігаються на 98,8 % (або відрізняються на 1,2 %), як, наприклад, стверджує Національний музей природничої історії Смітсонівського інституту. Насправді вони схожі не більше ніж на 87,5% – тобто геноми людини й шимпанзе відрізняються як мінімум на 12,5%, якщо не на 13,3%! Насправді, різниця в 13,3 відсотка є більш значущою, оскільки вона відображає, наскільки схожа вся збірка людського геному на геном шимпанзе.
Що саме являє собою «gap-divergence»
Перш ніж ми продовжимо, я хочу з'ясувати, що саме автори мають на увазі під «gap-divergence». В статті наводиться таке визначення:
«Gap divergence визначається як частка позицій в цільовому гаплотипі, які не вирівняні з іншим гаплотипом, що може бути викликано біологічними процесами (наприклад, втратою/придбанням генів та інсерціями/делеціями), відсутністю даних або технічними проблемами (наприклад, збоєм вирівнювання через SVs [Structural Variants – структурні варіанти – прим. перекл.], повторюваних елементів тощо)».
Як же вони визначають розбіжність (gap divergence)? Наскільки я можу судити, це базується на поділі цільового геному в рамках вирівнювання геному на сегменти по 1 мільйону пар основ (1 Mbp) і на тому, скільки основ в кожному сегменті 1 Mbp не мають вирівнювання в геномі запиту, який був вирівняний з ним. Якщо весь сегмент розміром 1 Mbp не має вирівнювання з цільовим геномом, то його розбіжність становить 100 %. Якщо 10 000 п.о. не мають вирівнювання, то розбіжність становить 1 відсоток; якщо 1 000 п.о. не мають вирівнювання, то розбіжність становить 0,1 відсотка і т.д. Згідно з результатами дослідження, середня розбіжність у кожному сегменті геному людини (цільового) розміром 1 Mbp, вирівняному з геномом шимпанзе (запит), становить 12,5 %. Таким чином, 12,5 % основ в геномі людини не мають подібних основ в геномі шимпанзе при вирівнюванні усього геному.
Наведений нижче малюнок, створений в ілюстративних цілях і не є результатом дослідження, допомагає показати відмінності між «SNV» та «розривами» між двома геномами:
Як бачите, розриви являють собою нуклеотиди або сегменти нуклеотидів, яких просто немає в тому чи іншому геномі, а SNV – нуклеотиди, які існують, але відрізняються один від одного. Ці два типи відмінностей можна скласти, щоб обчислити загальну різницю між геномами.
Верхня оцінка
Але чому в основному тексті вказано діапазон від 12,5 до 27,3 відсотка? Тому що верхня оцінка розбіжності геномів горили й людини становить значні 27,3 відсотка. Насправді, якщо ми подивимося на Додатковий малюнок III.12, то виявимо наступні відсотки «розбіжності» між різними геномами приматів у порівнянні з геномом людини (не статеві хромосоми):
● Суматранський орангутанг (Pongo abelii) проти людини: 15,4% і 16,5% «розбіжності» (тобто мінімальна різниця)
● Горила (Gorilla gorilla) проти людини: 17,9% і 27,3% «розбіжності» (тобто мінімальна різниця)
● Бонобо (Pan paniscus) проти людини: 12,5 % і 14,4 % «розбіжності» (тобто мінімальна різниця)
● Шимпанзе (Pan troglodytes) проти людини: 12,5 % і 13,3 % «розбіжності» (тобто мінімальна різниця)
Бачите, як легко узагальнити ці дані? Це величезні відкриття як для науки, так і для широкої культури, проте в технічній статті Nature й у двох статтях-поясненнях Nature не вдалося чітко позначити ці моменти. Вони поховали їх в технічному жаргоні та відсутності ясності глибоко в Додаткових даних, а пропозиція про «часто цитовану статистику ~99% ідентичності послідовностей» була видалена при перегляді статті. Nature, смію вас запевнити, не є безсистемно редагованим журналом. Це був свідомий вибір, зроблений кимось в процесі редагування. Відсутність ясності просто неймовірна.
Технічні подробиці
Глибоко в Додаткових даних ми знаходимо малюнок III.12, який пояснює розбіжність між різними видами:
Напис говорить: « На графіках показані сегменти розміром 1 Mbp, відсортовані за розбіжностями між ними для кожного парного вирівнювання», де парне вирівнювання – це спроба вирівняти дві послідовності, щоб визначити ступінь їхньої схожості або відмінності. Таким чином, ми маємо справу з прямим показником мінімального ступеня відмінності між двома геномами.
Додавання однонуклеотидних варіацій (SNV)
Але є ще один тип варіацій між геномами, також виявлений у роботі, – однонуклеотидні відмінності (звані «однонуклеотидними варіаціями» або іноді «короткими нуклеотидними варіаціями» або SNV). Знову ж таки, в Додаткових даних ми знаходимо малюнок III.11, на якому показано відсоток SNV між геномами людини й різних мавп, представлених в цьому дослідженні. Ось що вони виявили:
● Суматранський орангутан (Pongo abelii) проти людини: ~3,6 відсотка відмінностей
● Горила (Gorilla gorilla) проти людини: 1,9 відсотка - 2,0 відсотка відмінностей
● Бонобо (Pan paniscus) проти людини: 1,5 - 1,6 відсотка відмінностей
● Шимпанзе (Pan troglodytes) проти людини: 1,5 - 1,6 відсотка відмінностей
Якщо до відмінностей SNV додати розбіжності в розривах, то отримаємо такі загальні ступені відмінностей між геномами людини і мавп:
● Суматранський орангутан (Pongo abelii) проти людини: ~19% - 20,1% відмінностей
● Горила (Gorilla gorilla) проти людини: ~19,8% - 29,3% відмінностей
● Бонобо (Pan paniscus) проти людини: ~14,0% - 16,0% відмінностей
● Шимпанзе (Pan troglodytes) (мета) проти людини: ~14,0% відмінностей
● Людина (мета) проти шимпанзе (Pan troglodytes): ~14,9 % різниці
Отже, ми бачимо, що загальна різниця між геномом людини й геномом шимпанзе становить 14,9 відсотка. Це набагато більше, ніж часто стверджувана статистика про те, що ми всього на 1 відсоток генетично відрізняємося від шимпанзе!
Чи є це останнім словом?
Безсумнівно, необхідно провести додатковий аналіз, щоб визначити ступінь точного збігу нуклеотидів між геномами людини й шимпанзе, навіть у тих ділянках, які легше піддаються вирівнюванню. Тому я підозрюю, що в майбутньому ступінь відмінностей між геномами людини й шимпанзе може зрости.
На даний момент ми можемо з упевненістю сказати, що це останнє дослідження показує, що геноми людини й шимпанзе відрізняються як мінімум на 14,9 відсотка. Це означає, що геноми людини й шимпанзе відрізняються один від одного як мінімум на порядок більше, ніж зазвичай говорять громадськості.
Зрозуміло, мова йде про 44 нестатеві хромосоми в геномі людини. Варто також зазначити, що в порівнянні з шимпанзе Y-хромосома людини розходиться на 56,6 % (і на 3,9 % за SNV), а X-хромосома людини розходиться на 4,4 % (і на 1,1 % за SNV). Але все це теж приховано в Додаткових даних.
Це революційні результати, і дуже шкода, що Nature не повідомила про них у явній формі й зробила все це таким важкодоступним, використовуючи жаргон, який більшість неспеціалістів не зрозуміють. Чому вони так вчинили? Важливо розуміти, що публікація наукових робіт може бути схожа на приготування ковбаси: вона часто буває брудною, й остаточний варіант, який ви читаєте, зазвичай являє собою компромісну мову, яку всі автори, рецензенти та редактори були готові опублікувати – і може не відображати те, що відчуває кожен автор статті. Тож, можливо, деякі автори цього дослідження воліли б викласти наслідки більш чітко. Але ми все одно можемо запитати: «Чому Nature не виклала результати чітко й не дозволила подіям розвиватися природним чином й прийняти їх результати, чи то позитивні чи негативні?»
Я підозрюю, що цей радикальний висновок має наслідки – не тільки для науки, але й для людської винятковості, для надійності широко рекламованих тез і багато чого іншого – які люди будуть обговорювати ще довгий час. І, можливо, для деяких представників світу науки й наукових репортажів, особливо для тих, хто поширював дискредитуючу себе цифру про всього лише 1-відсоткову відмінність від шимпанзе, ці розмови можуть виявитися небажаними.