|
Международный консорциум HapMap опубликовал самый полный на сегодня каталог вариаций человеческого генома. Новая свободно доступная база данных позволит ускорить поиск генов, связанных с различными наследственными заболеваниям, а также будет незаменимым источником информации для исследований в области этногеномики.
Генетический код любых двух людей, не имеющих родственных связей, совпадает на 99,9%. В этом выражается видовое единство человечества. Однако оставшейся одной десятой процента вполне достаточно, чтобы породить всё разнообразие людей на Земле. Стартовавший три года назад проект ставил своей целью изучить эти различия.
Всего было собрано 269 образцов ДНК у четырех групп населения. Первая группа (обозначаемая YRI) включала 90 жителей Нигерии, принадлежащих к племени Йоруба, вторая (CEU) — 90 жителей американского штата Юта. В обоих случаях образцы брали у 30 семейных групп: мать, отец, ребенок. Еще две группы были отобраны уже не столь систематически: 45 образцов (CHB) взяли у пекинских китайцев и 44 — у японцев в Токио (JPT). Эти две группы в исследовании часто объединяют в одну: CHB + JPT. Ни один из этих наборов, конечно, не является репрезентативной выборкой для соответствующего этноса. Поэтому авторы статьи в журнале Nature рекомендуют во избежание недоразумений обозначать подборки образцов аббревиатурами, а не национальностями.Все эти образцы прошли секвенирование, то есть были определены последовательности нуклеотидов, составляющие молекулы ДНК. А затем началось самое интересное — сравнение и отождествление участков ДНК из разных образцов и выявление различий. В некоторых случаях различия могут быть довольно крупными — например, с места на место может переехать целый фрагмент генетического кода (такие фрагменты называют траспозонами). Однако это случается относительно редко. Большинство же мутаций представляют собой подмену одного нуклеотида другим, пропуск или добавление лишнего нуклеотида. Это так называемые однонуклеотидные полиморфизмы (single nucleotide polymorphism, SNP). Именно на них и сосредоточились в первую очередь исследователи.
Хотя, на первый взгляд, задача кажется простой, в действительности надежно выявить однонуклеотидные полиморфизмы довольно трудно. Ведь по каждому из них нужно быть до конца уверенным, что это не ошибка при расшифровке ДНК. Поэтому после выявления каждый кандидат в SNP должен пройти соответствующую проверку (генотипирование). Но самое лучшее подтверждение — это выявление SNP в двух разных геномах (повторяемость).
На момент начала проекта в октябре 2002 года в различных свободно доступных базах данных имелась информация об 1,7 млн SNP в человеческом геноме. Однако про большинство из них не было известно, насколько надежны данные и сколь широко встречается данная мутация. На момент публикации статьи в Nature число кандидатов в SNP выросло до 9,2 млн, из которых 3,6 млн были обнаружены по крайней мере в двух разных образцах, а 2,4 млн подверглись независимой проверке.
Из других любопытных цифр можно упомянуть следующие:
-
Средняя плотность SNP — 1 мутация на 279 нуклеотидов (речь идет не об одном образце, а обо всех известных на сегодня SNP). В некоторых участках генома частота мутаций в 10 раз выше средней.
-
Некоторые SNP встречаются в разных вариантах во всех исследованных группах, но есть такие, которые в некоторой группе встречаются только в одном варианте. Так, у YRI полиморфизм имеется по 85% SNP, у CEU — по 79%, у CHB + JPT — по 75% всех проверенных SNP.
-
Скорость возникновения случайных мутаций — 10–8 на один нуклеотид за поколение. То есть каждый ребенок имеет в среднем около 30 однонуклеотидных различий со своими родителями. А для того, чтобы точечные мутации привели к различию геномов на 1%, две популяции должны развиваться изолировано примерно миллион поколений. Впрочем, механизмы эволюции не исчерпываются точечными мутациями.
В целом, опубликованные материалы надолго станут предметом изучения большого количества ученых. Только на конференции Американского общества генетики человека (American Society Human Genetics), прошедшей на днях в Солт-Лейк Сити, было представлено более 70 статей и докладов, основанных на данных проекта HapMap. Для подобных исследований уже стало доброй традицией, что все материалы, включая упомянутую статью в Nature, находятся в открытом доступе в интернете.