Проект "Геном человека" (Human Genome Project)
Автор: Макс Арбалет
Наиболее масштабным и дорогостоящим биологическим научно-исследовательским проектом считают проект «Геном человека». Во время его 15-тилетней истории возникла биоинформатика, т.е. то, чем мы, участники медицинских проектов распределенных вычислений (РВ), помогаем заниматься коллективам исследователей опасных болезней.
Проект можно рассматривать и в некотором роде как проект распределенных вычислений. Да, технологически проект построен, безусловно, совсем на других принципах, чем «классические» проекты РВ, где необходимые вычислительные мощности складываются из персональных компьютеров участников. В проекте «Геном человека» всю работу проворачивали мощные суперкомпьютеры и специализированные вычислительные системы-автоматы. Но в более широком смысле, этот проект похож на любой проект РВ фундаментальностью поставленных целей, огромным количеством потребовавшихся вычислений, открытостью результатов и соревновательной составляющей — в проекте приняли участие десятки государственных и коммерческих научных организаций со всего мира, действующих заодно, но преследующих разные цели.
Поэтому очень интересно проследить историю проекта «Геном человека», тем более что разворачивалась она в 1990-х гг. на фоне стремительного развития компьютерных технологий, сыгравших определяющую роль в его успешном завершении.
Немного теории. Каждая хромосома (а в соматических клетках человека их содержится 23 пары) образуется одной молекулой ДНК в форме двойной спирали, состоящей из элементарных химических звеньев - нуклеотидов. Последние построены из углеводов, фосфатов и азотистых оснований. Углеводы и фосфаты одинаковы во всех нуклеотидах, а азотистых оснований — четыре: А (аденин), Т (тимин), Г (гуанин), Ц (цитозин). Поэтому последовательность оснований определяет генетический код клетки и основную программу химических процессов.
ГЕНОМ человека, то есть совокупность всех генов и межгенных участков ДНК, по оценкам, состоит из 20-25 тыс. генов.
Любое нарушение "инструкций", записанных в генах, ведет к мутациям. Из 10 тыс. известных заболеваний человека около 3 тыс. — наследственные болезни. Отсюда такой интерес к геному человека и причина начала его полномасштабного научного исследования в проекте, получившем название "Геном человека" (Human Genome Project).
Главной целью, поставленной перед проектом, стало определение точной последовательности азотистых оснований и положения генов в молекуле ДНК каждого вида клеток человека, что открыло бы причины наследственных заболеваний и пути к их лечению. Кроме того, нужно было получить три типа карт хромосом: генетические, физические и секвенсовые (от англ. sequence — последовательность). Выявить все гены, присутствующие в геноме, и установить расстояния между ними — значит локализовать каждый ген в хромосомах. Такие генетические карты помимо инвентаризации генов и указания их положений отвечают на исключительно важный вопрос о том, как гены определяют те или иные признаки организма. Ведь многие признаки зависят от нескольких генов, часто расположенных в разных хромосомах, и знание положения каждого из них позволит понять, как происходит дифференцировка (специализация) клеток, органов и тканей.
В проекте на разных этапах были заняты тысячи специалистов со всего мира: биологи, химики, математики, физики, программисты и техники. Это один из самых дорогих научных проектов в истории. Только за период с 1990 по 1998 гг. на него было потрачено более $1,5 млрд.
Основные этапы и результаты работы проекта «Геном человека»
В 1988 г. один из первооткрывателей знаменитой двойной спирали ДНК, нобелевский лауреат Дж. Уотсон, публично высказал мысль о том, что наука вплотную приблизилась к раскрытию химической основы наследственности человека. К тому времени было уже известно, что наследственный аппарат человека, геном, составляет около 3 млрд. нуклеотидных пар. В то время эта величина казалась необозримо большой, и сама мысль, что такой объем информации может быть получен, представлялась совершенно фантастической.
В 1980-е годы технологии были слишком примитивными для решения задачи расшифровки генома и среди биологов было много противников этого проекта. Биологи всерьез опасались, что их всех заставят бесконечное количество раз выполнять скучные операции с ДНК человека. Как сказал один юный кандидат наук: «Я не хочу положить свою жизнь на то, чтобы определить последовательность 12-й хромосомы от 100 000-й до 200 000-й пары оснований». Такие опасения рассеялись после появления новых технологий, позволивших передать машинам рутинную работу по определению последовательности. И 1990-е годы вошли в историю как годы уверенного совершенствования возможностей определять последовательность полных геномов.
В 1988 г. средства на изучение генома человека выделило Министерство энергетики, а в 1990 г. — Конгресс США. В Роквилле (штат Мэриленд) появился Национальный институт исследования генома человека (National Human Genome Research Institute, NHGRI), директором которого стал Фрэнсис Коллинз (Francis Collins), и работа над проектом пошла полным ходом.
1995. NHGRI публикует первую полную последовательность ДНК живого организма — бактерии Haemophilus influenzae. За этой бактерий вскоре последовали другие организмы.
1996. Определен первый геном эукариотической клетки (т. е. сложноорганизованной клетки, ДНК которой заключена в ядре) — клетки дрожжей Saccharomyces cerevisiae. Этим открытием увенчались совместные усилия шестисот ученых из Европы, Северной Америки и Японии.
1998. Опубликована первая последовательность ДНК многоклеточного организма — плоского червя Caenorhabditis elegans.
Число хромосом и их длина различны у разных биологических видов. В клетках бактерий всего одна хромосома. Так, размер генома бактерии Mycoplasma genitalium — 0,58 Мб (Мегабаза — от английского слова «base» — основание), у бактерии кишечной палочки Escherichia coli в геноме 4,2 Мб, у растения Arabidopsis thaliana — 100 Мб, у плодовой мушки Drosophila melanogaster — 120 Мб. Самая маленькая хромосома клеток человека Homo sapiens содержит ДНК длиной 50 Мб, самая большая (хромосома 1) — 250 Мб.
До 1996 г. наибольший участок ДНК, выделяемый из хромосом с помощью реактивов, имел длину 0,35 Мб, а на лучшем оборудовании их структура расшифровывалась со скоростью 0,05–0,1 Мб в год при стоимости $1–2 за основание. Иными словами, только на эту работу понадобилось бы примерно 30 тыс. дней (почти век) и $3 млрд.
Совершенствование технологии к 1998 г. повысило производительность до 0,1 Мб в день (36,5 Мб в год) и понизило стоимость до $0,5 за основание. Использование новых электромеханических устройств, которые к тому же потребляют меньше реактивов, позволило уже в 1999 г. ускорить работы еще в 5 раз и уменьшить стоимость до $0,25 за основание (для человеческой ДНК еще дешевле).
Знаковой фигурой в этом процессе стал Крейг Вентер (Craig Venter), бывший ведущий сотрудник NHGRI, основавший в 1998 г. собственную коммерческую компанию «Силера джиномикс» (Роквилл, штат Мэриленд). В распоряжении Вентера оказался огромный парк компьютеров, который считался тогда вторым по мощности в мире. Триста суперкомпьютеров стоимостью около 80 миллионов долларов круглосуточно обрабатывали огромные объемы данных.
Вентер внедрил в науку метод определения последовательности ДНК, позднее названный «методом беспорядочной стрельбы», который еще называют «методом пулеметной очереди» или «методом стрельбы из дробовика». Суть метода в том, что определяемую ДНК организма разбивают на множество небольших фрагментов, каждый из которых вводят в автомат, определяющий последовательность ДНК. Нечто похожее получится, если разодрать книгу по страницам и раздать их разным читателям. После того как будут определены последовательности каждого фрагмента, в действие вводят сложнейшие компьютерные программы, заново собирающие исходную последовательность. Такое интенсивное использование информационных технологий объясняет, почему многие ученые назвали новую область исследований генома биоинформационной революцией.
К концу 1999 г. было расшифровано свыше двух десятков геномов. Каждое такое достижение требовало определения все более и более длинной последовательности и было важной вехой на пути к определению собственно генома человека.
В июне 2000 года Крейг Вентер и Фрэнсис Коллинз, руководитель проекта «Геном человека» в NHGRI и Национальных институтах здоровья США, объявили о событии, названном ими «первой сборкой генома человека». По существу, это была первая реконструкция полного генома человека, выполненная методом беспорядочной стрельбы.
В феврале 2001 г. Международный консорциум, в который вошли помимо NHGRI и биотехнологической компании «Силера джиномикс», 16 организаций из Великобритании, США, Франции, Германии, Японии и Китая, обнародовали результаты колоссальной работы — первый набросок генома человека.
На протяжении следующих лет различные группы ученых во всем мире постепенно расшифровывали хромосомы человека, периодически сообщая о результатах своей работы. Так, в 2003-м было объявлено о полной расшифровке ДНК, оставалась только первая хромосома человека — последняя из нерасшифрованных хромосом.
И вот, 17 мая 2006 г. исследователи Wellcome Trust Sanger Institute совместно с американскими и английскими коллегами объявили об окончании последнего этапа работы по расшифровке полного генома человека — секвенировании самой большой, первой хромосомы. Об этом сообщается в статье S.G. Gregory et al. «The DNA sequence and biological annotation of human chromosome 1», опубликованной 18 мая в журнале Nature.

В последовательность 1-й хромосомы входит 223 569 564 нуклеотидных оснований, что составляет около 8% от человеческого генома. Она кодирует в два раза больше генов, чем средняя человеческая хромосома – более 3000 генов, включая те, мутации которых лежат в основе развития более 350 известных заболеваний, в том числе некоторых типов рака, болезней Альцгеймера и Паркинсона, гиперлипидэмии и порфирии. В ходе последнего этапа секвенирования идентифицировано более 1000 новых генов, что должно помочь ученым в разработке новых диагностических тестов и методов терапии различных заболеваний.
По словам доктора Марка Уолпорта (Mark Walport), директора Wellcome Trust, проект «Геном человека» обеспечил исследователей огромным количеством информации о человеческих генах и их возможных вариациях. Эта информация необходима для получения ответов на вопросы о причинах тех или иных состояний человеческого организма.
Весь этот огромный массив информации содержится в многочисленных базах данных и электронных библиотеках со свободным доступом для ученых со всего мира. Этой возможностью последние охотно пользуются, применяя полученные данные в многочисленных исследованиях и проектах, порой самого фантастического толка. Кроме того, в настоящее время с различными прикладными целями активно продолжается расшифровка геномов многих организмов.
Источники:
|