Ukraine - Distributed Computing Team

» Навігація

≡ Новини
≡ Новини (Архів)
≡ Описи проектів

≡ Опитування
≡ Архіви

≡ Форум

≡ Форум (PDA)

» Статті

Описи проектів

◊ Начало раздела >

Проект "Геном человека" (Human Genome Project)

Автор: Макс Арбалет

версiя українською

Проект Геном человека (Human Genome Project)

   Наиболее масштабным и дорогостоящим биологическим научно-исследовательским проектом считают проект «Геном человека». Во время его 15-тилетней истории возникла биоинформатика, т.е. то, чем мы, участники медицинских проектов распределенных вычислений (РВ), помогаем заниматься коллективам исследователей опасных болезней.

   Проект можно рассматривать и в некотором роде как проект распределенных вычислений. Да, технологически проект построен, безусловно, совсем на других принципах, чем «классические» проекты РВ, где необходимые вычислительные мощности складываются из персональных компьютеров участников. В проекте «Геном человека» всю работу проворачивали мощные суперкомпьютеры и специализированные вычислительные системы-автоматы. Но в более широком смысле, этот проект похож на любой проект РВ фундаментальностью поставленных целей, огромным количеством потребовавшихся вычислений, открытостью результатов и соревновательной составляющей — в проекте приняли участие десятки государственных и коммерческих научных организаций со всего мира, действующих заодно, но преследующих разные цели.

   Поэтому очень интересно проследить историю проекта «Геном человека», тем более что разворачивалась она в 1990-х гг. на фоне стремительного развития компьютерных технологий, сыгравших определяющую роль в его успешном завершении.

   Немного теории. Каждая хромосома (а в соматических клетках человека их содержится 23 пары) образуется одной молекулой ДНК в форме двойной спирали, состоящей из элементарных химических звеньев - нуклеотидов. Последние построены из углеводов, фосфатов и азотистых оснований. Углеводы и фосфаты одинаковы во всех нуклеотидах, а азотистых оснований — четыре: А (аденин), Т (тимин), Г (гуанин), Ц (цитозин). Поэтому последовательность оснований определяет генетический код клетки и основную программу химических процессов.

   ГЕНОМ человека, то есть совокупность всех генов и межгенных участков ДНК, по оценкам, состоит из 20-25 тыс. генов.

   Любое нарушение "инструкций", записанных в генах, ведет к мутациям. Из 10 тыс. известных заболеваний человека около 3 тыс. — наследственные болезни. Отсюда такой интерес к геному человека и причина начала его полномасштабного научного исследования в проекте, получившем название "Геном человека" (Human Genome Project).

   Главной целью, поставленной перед проектом, стало определение точной последовательности азотистых оснований и положения генов в молекуле ДНК каждого вида клеток человека, что открыло бы причины наследственных заболеваний и пути к их лечению. Кроме того, нужно было получить три типа карт хромосом: генетические, физические и секвенсовые (от англ. sequence — последовательность). Выявить все гены, присутствующие в геноме, и установить расстояния между ними — значит локализовать каждый ген в хромосомах. Такие генетические карты помимо инвентаризации генов и указания их положений отвечают на исключительно важный вопрос о том, как гены определяют те или иные признаки организма. Ведь многие признаки зависят от нескольких генов, часто расположенных в разных хромосомах, и знание положения каждого из них позволит понять, как происходит дифференцировка (специализация) клеток, органов и тканей.

   В проекте на разных этапах были заняты тысячи специалистов со всего мира: биологи, химики, математики, физики, программисты и техники. Это один из самых дорогих научных проектов в истории. Только за период с 1990 по 1998 гг. на него было потрачено более $1,5 млрд.

   Основные этапы и результаты работы проекта «Геном человека»

   В 1988 г. один из первооткрывателей знаменитой двойной спирали ДНК, нобелевский лауреат Дж. Уотсон, публично высказал мысль о том, что наука вплотную приблизилась к раскрытию химической основы наследственности человека. К тому времени было уже известно, что наследственный аппарат человека, геном, составляет около 3 млрд. нуклеотидных пар. В то время эта величина казалась необозримо большой, и сама мысль, что такой объем информации может быть получен, представлялась совершенно фантастической.

   В 1980-е годы технологии были слишком примитивными для решения задачи расшифровки генома и среди биологов было много противников этого проекта. Биологи всерьез опасались, что их всех заставят бесконечное количество раз выполнять скучные операции с ДНК человека. Как сказал один юный кандидат наук: «Я не хочу положить свою жизнь на то, чтобы определить последовательность 12-й хромосомы от 100 000-й до 200 000-й пары оснований». Такие опасения рассеялись после появления новых технологий, позволивших передать машинам рутинную работу по определению последовательности. И 1990-е годы вошли в историю как годы уверенного совершенствования возможностей определять последовательность полных геномов.

   В 1988 г. средства на изучение генома человека выделило Министерство энергетики, а в 1990 г. — Конгресс США. В Роквилле (штат Мэриленд) появился Национальный институт исследования генома человека (National Human Genome Research Institute, NHGRI), директором которого стал Фрэнсис Коллинз (Francis Collins), и работа над проектом пошла полным ходом.

   1995. NHGRI публикует первую полную последовательность ДНК живого организма — бактерии Haemophilus influenzae. За этой бактерий вскоре последовали другие организмы.

   1996. Определен первый геном эукариотической клетки (т. е. сложноорганизованной клетки, ДНК которой заключена в ядре) — клетки дрожжей Saccharomyces cerevisiae. Этим открытием увенчались совместные усилия шестисот ученых из Европы, Северной Америки и Японии.

   1998. Опубликована первая последовательность ДНК многоклеточного организма — плоского червя Caenorhabditis elegans.

   Число хромосом и их длина различны у разных биологических видов. В клетках бактерий всего одна хромосома. Так, размер генома бактерии Mycoplasma genitalium — 0,58 Мб (Мегабаза — от английского слова «base» — основание), у бактерии кишечной палочки Escherichia coli в геноме 4,2 Мб, у растения Arabidopsis thaliana — 100 Мб, у плодовой мушки Drosophila melanogaster — 120 Мб. Самая маленькая хромосома клеток человека Homo sapiens содержит ДНК длиной 50 Мб, самая большая (хромосома 1) — 250 Мб.

   До 1996 г. наибольший участок ДНК, выделяемый из хромосом с помощью реактивов, имел длину 0,35 Мб, а на лучшем оборудовании их структура расшифровывалась со скоростью 0,05–0,1 Мб в год при стоимости $1–2 за основание. Иными словами, только на эту работу понадобилось бы примерно 30 тыс. дней (почти век) и $3 млрд.

   Совершенствование технологии к 1998 г. повысило производительность до 0,1 Мб в день (36,5 Мб в год) и понизило стоимость до $0,5 за основание. Использование новых электромеханических устройств, которые к тому же потребляют меньше реактивов, позволило уже в 1999 г. ускорить работы еще в 5 раз и уменьшить стоимость до $0,25 за основание (для человеческой ДНК еще дешевле).

   Знаковой фигурой в этом процессе стал Крейг Вентер (Craig Venter), бывший ведущий сотрудник NHGRI, основавший в 1998 г. собственную коммерческую компанию «Силера джиномикс» (Роквилл, штат Мэриленд). В распоряжении Вентера оказался огромный парк компьютеров, который считался тогда вторым по мощности в мире. Триста суперкомпьютеров стоимостью около 80 миллионов долларов круглосуточно обрабатывали огромные объемы данных.

   Вентер внедрил в науку метод определения последовательности ДНК, позднее названный «методом беспорядочной стрельбы», который еще называют «методом пулеметной очереди» или «методом стрельбы из дробовика». Суть метода в том, что определяемую ДНК организма разбивают на множество небольших фрагментов, каждый из которых вводят в автомат, определяющий последовательность ДНК. Нечто похожее получится, если разодрать книгу по страницам и раздать их разным читателям. После того как будут определены последовательности каждого фрагмента, в действие вводят сложнейшие компьютерные программы, заново собирающие исходную последовательность. Такое интенсивное использование информационных технологий объясняет, почему многие ученые назвали новую область исследований генома биоинформационной революцией.

   К концу 1999 г. было расшифровано свыше двух десятков геномов. Каждое такое достижение требовало определения все более и более длинной последовательности и было важной вехой на пути к определению собственно генома человека.

   В июне 2000 года Крейг Вентер и Фрэнсис Коллинз, руководитель проекта «Геном человека» в NHGRI и Национальных институтах здоровья США, объявили о событии, названном ими «первой сборкой генома человека». По существу, это была первая реконструкция полного генома человека, выполненная методом беспорядочной стрельбы.

   В феврале 2001 г. Международный консорциум, в который вошли помимо NHGRI и биотехнологической компании «Силера джиномикс», 16 организаций из Великобритании, США, Франции, Германии, Японии и Китая, обнародовали результаты колоссальной работы — первый набросок генома человека.

   На протяжении следующих лет различные группы ученых во всем мире постепенно расшифровывали хромосомы человека, периодически сообщая о результатах своей работы. Так, в 2003-м было объявлено о полной расшифровке ДНК, оставалась только первая хромосома человека — последняя из нерасшифрованных хромосом.

   И вот, 17 мая 2006 г. исследователи Wellcome Trust Sanger Institute совместно с американскими и английскими коллегами объявили об окончании последнего этапа работы по расшифровке полного генома человека — секвенировании самой большой, первой хромосомы. Об этом сообщается в статье S.G. Gregory et al. «The DNA sequence and biological annotation of human chromosome 1», опубликованной 18 мая в журнале Nature.

Человеческие хромосомы

   В последовательность 1-й хромосомы входит 223 569 564 нуклеотидных оснований, что составляет около 8% от человеческого генома. Она кодирует в два раза больше генов, чем средняя человеческая хромосома – более 3000 генов, включая те, мутации которых лежат в основе развития более 350 известных заболеваний, в том числе некоторых типов рака, болезней Альцгеймера и Паркинсона, гиперлипидэмии и порфирии. В ходе последнего этапа секвенирования идентифицировано более 1000 новых генов, что должно помочь ученым в разработке новых диагностических тестов и методов терапии различных заболеваний.

   По словам доктора Марка Уолпорта (Mark Walport), директора Wellcome Trust, проект «Геном человека» обеспечил исследователей огромным количеством информации о человеческих генах и их возможных вариациях. Эта информация необходима для получения ответов на вопросы о причинах тех или иных состояний человеческого организма.

   Весь этот огромный массив информации содержится в многочисленных базах данных и электронных библиотеках со свободным доступом для ученых со всего мира. Этой возможностью последние охотно пользуются, применяя полученные данные в многочисленных исследованиях и проектах, порой самого фантастического толка. Кроме того, в настоящее время с различными прикладными целями активно продолжается расшифровка геномов многих организмов.

Источники:

В.Н. Сойфер. Международный проект «Геном человека», 1999.
Дмитрий Самин. Геном человека. / Библиотекарь
Л.Л.Киселев. Вестник. Геном человека и биология XXI века. / РАН (том 70, №5, с.412-424 (2000)
Элементы
Интернет-журнал «Коммерческая биотехнология»

Дата: Субота, 01 Липень 2006

Прочитана: 37821 раз

» Положення команди

Медико-біологічні
Correlizer	47
DrugDiscovery@Home	9
Fightaids@Home	40
Folding@Home	56
Gpugrid.net	50
Help Cure Muscular Dystrophy	40
Help Conquer Cancer	40
Help Fight Childhood Cancer	40
Human Proteome Folding (Phase 2)	40
Lattice Project	20
Malariacontrol.net	47
NRG@home (Najmanovich Research Group)	26
Poem@Home	32
Ps3grid.net	50
RNA World	47
Rosetta@Home	27
World Community Grid	40
Математика
Abc@Home	13
Collatz Conjecture	75
EulerNet	10
Gimps (Great Internet Mersenne Prime Search)	29
Mersenne@home	78
NFS@Home (Number Field Sieve)	55
OGR-27	11
OPTIMA@HOME	35
primaboinca	44
Primegrid	40
Seventeen Or Bust	16
Seventeen Or Bust-Sieve	17
WEP-M+2 Project (Wanless)	40
Криптографія
DistrRTgen	68
Enigma@Home	52
RC5-72	22
Фізика
Einstein@Home	49
IBERCIVIS	1
Leiden Classical	61
Lhc@Home	33
Magnetism@Home	2
Muon1-DPAD	31
Spinhenge@Home	39
Хімія
QMC@Home	44
Kосмос
Constellation@home	51
Cosmology@Home	44
Milkyway@Home	48
Orbit@Home	27
SETI@Home	90
Планета земля
Climate Prediction	43
La Red de Atrapa Sismos	7
Quake Catcher Network	64
Radioactive@Home	12
Virtual Prairie (ViP)	24
Штучний інтелект
FreeHAL@Home	24
Neurona@Home	21
Інтернет
Majestic-12	4
Рендеринг
Burp	34
Luxrenderfarm@home	0
ORE (Open Rendering Environment)	40
Ігрові проекти
Chess960@Home	95
sudoku@vtaiwan	16
Клікери і трекери
Marmot Project	239
Whatpulse	83
Мікс
AlmereGrid	24
Pirates@Home	9
Sztaki Desktop Grid	58
Yoyo@Home	37