Ген хромосома днк – Хромосомы дают первые сведения о структуре генома. Геном человека: Энциклопедия, написанная четырьмя буквами

Содержание

Центры хромосом раскрывают древнюю ДНК

Генетики, исследующие «сердце» человеческого генома, обнаружили в нем большие куски ДНК неандертальцев и других древних ДНК. Полученные результаты открывают новые способы изучения как хромосом, которые ведут себя во время деления клеток, так и того, как они изменились в ходе эволюции человека.

Хромосомы — это структуры в ядре эукариотической клетки, в которых сосредоточена большая часть наследственной информации. Центромеры находятся посередине хромосом и закрепляет волокна, которые разделяют хромосомы, когда клетки делятся, что означает, что они действительно важны для понимания того, что происходит, когда деление клетки происходит неправильно, что приводит к раку или генетическим дефектам.

Но ДНК центромер содержит много повторяющихся последовательностей, и ученые не смогли правильно нанести на карту этот регион.

«Это сердце тьмы генома, мы предупреждаем студентов не ходить туда», — сказал Чарльз Лэнгли, профессор эволюции и экологии в Калифорнийском университете в Дэвисе. Лэнгли — старший автор статьи, описывающей работу, опубликованную в журнале eLife.

Он и его коллеги пришли к выводу, что могут существовать гаплотипы — группы генов, которые наследуются вместе в эволюции человека — которые простираются на огромные части наших геномов, и даже по всем центромерам.

Это связано с тем, что центромеры не участвуют в так называемом процессе «кроссовера», который происходит, когда клетки делятся, образуя сперму или яйцеклетку. Во время кроссовера парные хромосомы выстраиваются рядом друг с другом, и их конечности пересекаются, иногда разрезая и сращивая ДНК между ними, так что гены могут быть перетасованы. Но кроссоверы сокращаются до нуля вблизи центромер. Без этой перестановки в каждом поколении центромеры могли бы сохранить очень древние участки ДНК без изменений.

Исследователи искали унаследованные однонуклеотидные полиморфизмы — унаследованные изменения в одной букве ДНК — которые позволили бы им картировать гаплотипы в центромере. Сначала они показали, что могут идентифицировать центромерные гаплотипы, или «кенабы», у плодовых мух дрозофилы.

Смотрите также

Этот вывод имеет два значения. Во-первых, если исследователи могут отличать хромосомы друг от друга по их центромерам, они могут начать проводить функциональные тесты, чтобы определить, влияют ли эти различия на то, какой фрагмент ДНК наследуется. Например, во время образования яйцеклетки четыре хроматиды образуются из двух хромосом, но только одна попадает в яйцеклетку. Итак, ученые хотят знать: передаются ли определенные гаплотипы центромер чаще? И есть ли вероятность того, что некоторые гаплотипы будут вовлечены в ошибки?

Во-вторых, исследователи могут использовать центромеры, чтобы посмотреть на происхождение и эволюционное происхождение.

Обращаясь к человеческой ДНК, ученые рассмотрели последовательности центромер из проекта 1000 геномов, общедоступного каталога человеческих генов. Они обнаружили гаплотипы, охватывающие центромеры во всех хромосомах человека.

В Х-хромосоме в этих последовательностях генома они обнаружили несколько основных центромерных гаплотипов, представляющих родословную, растянувшуюся на полмиллиона лет. В геноме в целом большая часть разнообразия наблюдается среди африканских геномов, что согласуется с недавним распространением людей с африканского континента. Одна из старейших гаплотиповых линий центромер не принадлежала этим ранним эмигрантам.

В 11-й хромосоме они обнаружили сильно отличающиеся гаплотипы неандертальской ДНК в неафриканских геномах. Эти гаплотипы расходились от 700 000 до миллиона лет назад, примерно в то время, когда предки неандертальцев отделялись от других человеческих предков. Центромера хромосомы 12 также содержит еще более древний архаичный гаплотип, который, по-видимому, происходит от неизвестного родственника.

Неандертальская ДНК на хромосоме 11 может влиять на различия в нашем обонянии и по сей день. Клетки, которые реагируют на вкус и запах, несут рецепторы запахов, вызванные специфическими химическими сигнатурами. Люди имеют около 400 различных генов для рецепторов запахов. Тридцать четыре из этих генов находятся в пределах гаплотипа центромера хромосомы 11. Центромерные гаплотипы неандертальцев и второй древний гаплотип составляют около половины вариации этих белков-рецепторов запахов.

Из других работ известно, что генетические вариации в рецепторах одоранта могут влиять на чувство вкуса и обоняния, но функциональные эффекты вариаций, обнаруженных в этом исследовании, еще предстоит обнаружить, а их влияние на вкус и запах проанализировать.


Больше информации: eLife, DOI: 10.7554/eLife.42989

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите

Ctrl+Enter.

Сколько у нас генов?

Юлия Макарова,
кафедра биотехнологии Сеченовского университета (Москва)
«Химия и жизнь» №4, 2019

Фото: Estes Bob (flickr.com) («Химия и жизнь» №4, 2019)

После того как ученые получили основную информацию о геноме человека, они попытались определить число генов, но эта задача оказалась непростой. Точное число неизвестно до сих пор, и все же оценки становятся все более достоверными.

«Геном человека» завершен, поиск генов продолжается

В 1977 году Фредерик Сэнгер разработал метод определения нуклеотидной последовательности ДНК (секвенирования), который используется и по сей день (см. «Химию и жизнь» № 8, 2018). В 1995 году был расшифрован первый геном бактерии Haemophilis influenza

, в 1996 году — геном эукариотической клетки (дрожжей Saccharomyces cerevisiae), а в 1998 году — геном нематоды Caenorhabditis elegans.

Конечно, на рубеже тысячелетий все с нетерпением ждали результатов проекта «Геном человека», который продолжался с 1990 по 2003 год. Его задачей было определение нуклеотидной последовательности ДНК человека и — главное! — локализация человеческих генов (изначально предполагалось, что их около 100 000). Биомедицинская наука вот-вот должна была получить бесценный инструмент: полный список генов, необходимых для расшифровки молекулярных механизмов возникновения и развития тяжелых болезней — рака, шизофрении, деменции и многих других. О подготовке «черновой» версии генома человека торжественно объявили летом 2000 года, опубликована она была в 2001-м. «Геном человека» официально завершил свою работу в 2003 году и 27 мая 2004 года опубликовал полную последовательность генома.

«Полной» ее можно было назвать с некоторыми оговорками. Прежде всего, секвенировалась только ДНК в составе эухроматина, то есть такая ДНК, которая между делениями клетки пребывает в неплотно упакованном состоянии. Примерно 8% человеческого генома — это гетерохроматин, компактно уложенная ДНК, она приходится в основном на районы центромер и теломер (то есть концов хромосом и участков, к которым прикрепляются нити веретена деления). С другой стороны, эти 8% ДНК и менее интересны, чем остальные 92, поскольку они крайне слабо транскрибируются, то есть содержат относительно мало генов. (Напомним, что транскрипция — это синтез РНК на матрице ДНК, а что дальше происходит с РНК, разберем чуть позже.) К тому же они богаты повторами, что затрудняет сборку непрерывной последовательности из прочтенных фрагментов. «Белые пятна» в геноме человека продолжают заполнять до сих пор: на начало 2019 года разрывов все еще больше 500, и в основном это те же центромерные и концевые области хромосом. Те, кому интересно, как продвигается дело, могут следить за процессом в Сети, на сайте международной организации, которая занимается эталонными геномами, —

Genome Reference Consortium.

Считалось, что секвенирование генома человека позволит определить локализацию каждого гена и их общее количество. Однако сегодня существует несколько баз данных генов, которые в значительной мере отличаются друг от друга.

С генами, кодирующими белки, удалось достичь некоторой ясности. Их оказалось гораздо меньше 100 000. В 2010 году по инициативе Организации по изучению протеома человека (HUPO — Human Proteome Organization) запущен одноименный проект — «Протеом человека», который должен составить полный список человеческих белков.

Какие факты позволяют утверждать, что определенный участок генома — это ген белка? Возможно, у нас есть белок, последовательность аминокислот в котором соответствует последовательности нуклеотидных триплетов в этом участке, и (или) имеются другие доказательства. Например, известна матричная РНК (мРНК) — молекула РНК, которая синтезируется в ходе транскрипции на матрице ДНК и, в свою очередь, становится матрицей для белка. Кстати, одна и та же мРНК может кодировать несколько белков за счет альтернативного сплайсинга — различных вариантов сшивания ее кодирующих участков. Вообще, белков у человека больше, чем белок-кодирующих генов. В рамках проекта «Протеом человека» предполагается идентифицировать и охарактеризовать не менее одного белка, считываемого с каждого гена, описать однонуклеотидные полиморфизмы (отличия в одну «букву») в этих генах, а также варианты сплайсинга мРНК и посттрансляционной модификации белков.

Однако есть и другие способы. Сейчас довольно много известно о том, какими признаками должны обладать гены белка, и существуют программы, которые ищут их 

in silico — в компьютере, с помощью анализа генома. Подсказкой может служить и то, что гены разных видов эукариот в силу общности эволюционного происхождения сходны между собой (гомологичны), и если мы видим последовательность, которая у другого живого существа кодировала белок, — возможно, она кодирует белок и у человека.

Данные, полученные в рамках проекта «Протеом человека», представлены в аннотированных базах знаний, таких как neXtProt. Белки делятся на пять групп, по достоверности наших сведений об их существовании — PE1, 2, 3, 4, 5 (PE означает protein existence). В марте 2019 года neXtProt содержала информацию о 17694 белках, существование которых экспериментально подтверждено, 1548 белках, для которых известны мРНК, 510 — определенных на основании гомологии с другими белками, 71 белке, предсказанном по последовательности ДНК, без других доказательств, и 576 сомнительных белках, относительно которых неясно, существуют они или нет.

Особый интерес вызывают белки, чье существование экспериментально не доказано, — так называемые потерянные (missing) белки. К этой категории относят все вышеперечисленные группы, кроме первой либо первой и последней. Для выявления и характеристики таких белков создан ресурс MissingProteinPedia.

Не только белки

Но белками все не исчерпывается. Проект «Геном человека» показал, что кроме матричных, транспортных и рибосомных РНК существует еще множество типов РНК, не менее важных для жизни.

Типы РНК («Химия и жизнь» №4, 2019)Типы РНК («Химия и жизнь» №4, 2019)

РНК подразделяются на некодирующие РНК (нкРНК), которые не транслируются в белки, и кодирующие, или матричные РНК (мРНК), служащие матрицей для синтеза белков. У некодирующих РНК более сложная классификация. Они бывают инфраструктурными и регуляторными. Инфраструктурные РНК известны нам из школьных учебников — это рибосомные РНК (рРНК) и транспортные РНК (тРНК). Молекулы рРНК составляют основу рибосомы — молекулярной машины, которая и строит белок на матричной РНК (проводит трансляцию). Последовательность из трех нуклеотидов в мРНК указывает, какую аминокислоту следуют включить в белок. Молекулы тРНК приносят указанные аминокислоты на рибосомы в ходе трансляции.

Регуляторные нкРНК очень широко представлены в организме, классифицируются в зависимости от размера и выполняют важные функции (см. таблицу 1). По сравнению с генами белков, длина которых обычно измеряется в килобазах — тысячах пар нуклеотидов, а точнее, в десятках и сотнях тысяч пар, они совсем маленькие (что не облегчает поиск их генов). Но рычажку «вкл.—выкл.» и не надо быть большим.

Таблица 1. Некодирующие регуляторные РНК

НазваниеДлина
(нуклеотиды)
Функции
Длинные некодирующие РНК (днкРНК, lncRNA)2001. Регулируют избирательное метилирование ДНК
2. Руководят избирательной посадкой на хроматин белковых комплексов, подавляющих активность генов
Малые РНК
Малые ядерные РНК (мяРНК, snRNA)1501. Участвуют в сплайсинге
2. Регулируют активность факторов транскрипции
3. Поддерживают целостность теломер
Малые ядрышковые РНК (мякРНК, snoRNA)60–3001. Участвуют в химической модификации рРНК, тРНК и мяРНК
2. Возможно, участвуют в стабилизации структуры рРНК и защите от действия ферментов гидролаз
Малые интерферирующие РНК (миРНК, siRNA)21–221. Обеспечивают антивирусную иммунную защиту
2. Подавляют активность собственных генов
МикроРНК (мкРНК, miRNA)18–25Подавляют трансляцию путем РНК-интерференции
Антисмысловые РНК (asRNA)1. Короткие: менее 200
2. Длинные: более 200
Блокируют трансляцию, образуя гибриды с мРНК
РНК, связанные с белками Piwi (piRNA, piwiRNA)26–32Их называют «стражами генома», они подавляют активность мобильных генетических элементов во время эмбриогенеза

Таким образом, прежде чем ответить на вопрос: «Сколько у нас генов?», необходимо понять, что «ген» может кодировать не только белок. Собственно, это ясно уже давно. Основное внимание проекта «Геном человека» было направлено на белок-кодирующие гены. Однако уже в первом докладе о геноме, опубликованном в 2001 году, сказано, что «тысячи генов человека продуцируют некодирующие РНК (нкРНК), являющиеся их конечным продуктом», хотя на тот момент было известно лишь около 706 генов нкРНК.

Стивен Зальцберг из Университета Джонса Хопкинса в своей статье, посвященной как раз проблеме подсчета человеческих генов, дает следующее определение: «Ген — любой участок хромосомной ДНК, который транскрибируется в функциональную молекулу РНК или сначала транскрибируется в РНК, а затем транслируется в функциональный белок». Это определение включает как гены некодирующих РНК, так и белок-кодирующие гены, но исключает псевдогены — нефункциональные остатки структурных генов, утратившие способность кодировать белок.

Публикация проекта «Геном человека» 2001 года оценила количество белок-кодирующих генов в 31 000, а группа под руководством Крейга Вентера (которая успешно соперничала с международным проектом), назвала «точное» число 26 588. В 2004 году, после завершения официального проекта предполагаемое число белок-кодирующих генов снизилось до 24 000. Каталог человеческих генов Ensembl (версия 34d) на тот момент включал 22 287 белок-кодирующих генов и 34 214 транскриптов. Скорее всего, мы не ошибемся, если скажем, что генов, кодирующих белки, у человека около 20 000 или чуть больше. Но что с генами РНК?

Новое секвенирование и базы данных

Исследовать многообразие РНК не так просто по многим причинам, от их высокой лабильности до малых размеров. Однако появление высокопроизводительных методов параллельного секвенирования (когда миллионы фрагментов ДНК из одного образца читаются одновременно), оно же секвенирование нового поколения (next-generation sequencing, NGS), значительно ускорило поиск функциональных участков генома.

Различные платформы для NGS позволяют читать от миллиона до десятков миллиардов коротких последовательностей (отсеквенированные «за один проход» участки называют ридами, от английского read) длиной 50–600 нуклеотидов каждая. К наиболее популярным платформам относятся Illumina и IonTorrent, и все больше внимания привлекают к себе платформы для секвенирования единичных молекул — Pacific Biosciences, нанопоровое секвенирование Oxford Nanopore, Helicos Biosciences HeliScope (компания Helicos объявлена банкротом, но технология лицензирована другим компаниям). Последним не нужно нарабатывать много копий ДНК для секвенирования — они действительно работают с отдельными молекулами! Другой их важный плюс в том, что они позволяют прочитывать значительно более длинные риды, до 10–60 тысяч нуклеотидов. Именно благодаря этому качеству, например, метод нанопорового секвенирования с успехом применили для секвенирования богатого повторами центромерного участка Y-хромосомы человека.

Кроме того, появились методы секвенирования РНК — сначала через создание ДНК-копий, а потом и прямые. Изначально они создавались для количественного определения экспрессии генов, но также способствовали обнаружению ранее не известных РНК, как кодирующих, так и не кодирующих.

Благодаря методам NGS базы данных генов lncRNA и других РНК всего за десятилетие резко выросли, и каталоги генов человека теперь содержат больше генов РНК, чем генов белков. Кроме того, секвенирование РНК позволило установить, что альтернативный сплайсинг, альтернативное инициирование транскрипции и альтернативное прерывание транскрипции происходят гораздо чаще, чем полагали, и затрагивают до 95% человеческих генов. Следовательно, даже когда мы узнаем местоположение всех генов в геноме, нужно будет выявить все изоформы этих генов, а также определить, выполняют ли эти изоформы какие-либо функции или просто представляют собой ошибки сплайсинга.

Задача по составлению каталога всех генов по-прежнему не решена. В последние 15 лет только две исследовательские группы составляют, корректируют и пополняют список генов: RefSeq и Ensembl / Gencode. Первая поддерживается Национальным центром биотехнологической информации при Национальных институтах здравоохранения США, вторая — Европейской молекулярно-биологической лабораторией. Кстати, Gencode — подпроект консорциума ENCODE, «масштабной научной экспедиции в пустыни генома, не кодирующего белки» (см. «Химию и жизнь» № 10, 2012). В этих каталогах есть сотни различий по белок-кодирующим генам, тысячи — по генам длинных некодирующих РНК; имеются существенные расхождения и в других группах (см. таблицу 2).

Таблица 2. Количество разных типов генов в базах данных Gencode, RefSeq, CHESS

Типы геновGencodeRefSeqCHESS
Белок-кодирующие гены19 90120 34521 306
Гены длинных некодирующих РНК15 77917 71218 484
Антисмысловые РНК5501282694
Другие некодирующие РНК221313 8994347
Псевдогены14 72315 952
Общее число транскриптов (видов РНК)203 835154 484323 827

По: BMC Biology, 2018, 16:94

В 2017 году сотрудники Университета Джонса Хопкинса под руководством Стивена Зальцберга создали еще одну базу данных генов человека — CHESS. Они использовали данные глубокого секвенирования РНК, чтобы заново получить информацию о всех продуктах транскрипции в разнообразных тканях человеческого организма, и отмечают, что существенно пополнили списки генов. Примечательно, что новая база включает все белок-кодирующие гены как Gencode, так и RefSeq, поэтому пользователям CHESS не нужно решать, какую базу данных они предпочитают. Создатели CHESS отмечают, что более обширная база с большей вероятностью содержит последовательности, ошибочно отнесенные к генам, но лучше потом удалить такую последовательность, чем пропустить существующий ген.

Итак, все еще неизвестно, сколько всего генов у человека. Существуют проблемы, затрудняющие получение точного ответа. Например, многие гены (особенно гены lncRNA), видимо, имеют высокую тканеспецифичность. Во всех клетках один и тот же геном, однако в разных тканях транскрибируются различные гены, не только белков, но и регуляторных РНК. А значит, пока ученые подробно не исследуют все типы клеток человека, они не могут быть уверены, что обнаружили все человеческие гены. И все же сегодня знания о человеческих генах значительно обширнее, чем в начале проекта «Геном человека», а технологии совершеннее. Это дает надежду на то, что в скором времени мы узнаем точный ответ на поставленный вопрос. А пока ограничимся приблизительными данными: чуть более 20 тысяч генов белков, а вместе с генами РНК — возможно, 200–300 тысяч, но, может быть, и меньше.

Сколько у нас генов?

Статья на конкурс «био/мол/текст»: Это интересный вопрос, ответ на который должен был дать проект «Геном человека», завершившийся в 2003 году. После того как ученые получили основную информацию о геноме человека, они попытались определить число генов, но эта задача оказалось не такой простой. Цель настоящей статьи — суммировать и проанализировать научные данные по составлению каталога генов у человека.

Эта работа опубликована в номинации «Свободная тема» конкурса «био/мол/текст»-2018.


«Диа-М»

Генеральный спонсор конкурса — компания «Диаэм»: крупнейший поставщик оборудования, реагентов и расходных материалов для биологических исследований и производств.


Genotek

Спонсором приза зрительских симпатий выступил медико-генетический центр Genotek.


«Альпина нон-фикшн»

«Книжный» спонсор конкурса — «Альпина нон-фикшн»

Как же мало известно о генах! Первый раз я остро ощутила это, находясь на практике в лаборатории медицинской генетики Харбинского медицинского университета. Исследовательская группа, где я проходила стажировку, занималась изучением онкогена Sei-1, который индуцирует образование двухминутных хромосом (DM), что способствует развитию онкогенеза. Однако механизм образования онкогена Sei-1 остается неизвестным до сих пор. А ведь различные мутации генов являются причиной возникновения и других опасных заболеваний человека, помимо рака. Итак, в данной статье мы изложим некоторые соображения о том, почему мы все еще многое не знаем о генах, а также сформулируем наше мнение о том, сколько генов у человека.

В 1977 году Фредерик Сэнгер впервые разработал метод секвенирования ДНК [1], основанный на терминации ДНК-полимеразной реакции с помощью дидезоксинуклеотидов, за что в 1980 году был удостоен Нобелевской премии в области химии. В этом же году Нобелевскую премию получили Максам и Гилберт, которые предложили метод секвенирования ДНК путем химической деградации. В 1985 году была выявлена первая полная последовательность ДНК бактерии (Haemophilus influenzae), в 1996 году получен первый геном эукариотической клетки (дрожжи Saccharomyces ceravisiae), а в 1998 году расшифрован геном дождевого червя (Caenorhabditis elegans). Завершение в 2003 году проекта «Геном человека» привело к публикации полной последовательности человеческого генома. Но «полной» ее можно назвать весьма условно, учитывая, что около 8% не секвенировано и по сей день [2].

Проект «Геном человека» и полный список генов

Выявление полного списка генов необходимо для выяснения молекулярных механизмов возникновения и развития рака, шизофрении [3], деменции, а также многих других заболеваний человека. Секвенирование ДНК, выделенной из тканей больных, позволяет выявлять такие мутации, как нуклеотидные замены, делеции и вставки, ответственные за возникновение этих заболеваний.

Арт-проект на выставке «Геном — расшифровка кода жизни»

Рисунок 1. Арт-проект на выставке «Геном — расшифровка кода жизни» в Национальном музее естественной истории в Вашингтоне

Собственно, ради этого и затевался проект «Геном человека» (Human genome project, HGP), который продолжался с 1990 по 2003 год. Его основной задачей было определение нуклеотидной последовательности ДНК человека и локализации 100 000 человеческих генов (как тогда полагали) [4]. Параллельно с этим планировалось изучить ДНК набора модельных организмов, чтобы получить сравнительную информацию, необходимую для понимания функционирования генома человека. Предполагалось, что информация, полученная в результате HGP, станет настольной книгой для биомедицинской науки в XXI веке [5]. Целями данных исследований являлось получение информации о причинах ряда болезней [6] и, в конечном итоге, разработка способов лечения более чем 4000 генетических заболеваний, которые затрагивают человечество, включая многофакторные, в которых генетическая предрасположенность играет важную роль. Считалось, что результаты секвенирования генома позволят определить локализацию каждого гена и их общее количество. Однако последовавшие за этим события доказали обратное: сегодня существует несколько баз данных генов, которые существенно отличаются друг от друга. Причем число белок-кодирующих генов совпадает, а число генов других типов расходится.

Проект «Протеом человека»

В 2010 году по инициативе Организации по изучению протеома человека (Human proteome organization, HUPO) был начат проект «Протеом человека» (HPP), целью которого является создание полного списка белков вида Homo sapiens [7]. Для этого, во-первых, предполагается идентифицировать и охарактеризовать, по крайней мере, по одному белковому продукту белок-кодирующих генов, их однонуклеотидные полиморфизмы и варианты сплайсинга, а также виды посттрансляционной модификации белков [8]. Во-вторых, данные протеомики, полученные в результате реализации HPP, способствуют, в дополнение к геномным данным, решению различных биомедицинских задач и созданию новых аннотированных баз знаний, таких как neXtProt [9].

В настоящее время neXtProt содержит информацию о 17 487 белках, существование которых экспериментально подтверждено, 1728 белках, подтвержденных на уровне транскриптов, 515-и, определенных на основании гомологии, 76-и предсказанных и 571-м неизвестной природы. Особый интерес вызывают белки, существование которых экспериментально не доказано, хотя данные о том, что они кодируются геномом, существуют. Это так называемые «потерянные» белки, которые составляют примерно 18% всех кодируемых белков. Для выявления и характеристики таких белков создан ресурс MissingProteinPedia [7].

«Протеом человека» является продолжением проекта «Геном человека». Предполагается, что благодаря проекту по изучению протеома мы узнаем точное количество белок-кодирующих генов, что впоследствии позволит понять, сколько всего генов у человека.

Немного о РНК

Проект «Геном человека» показал, что молекулы РНК также важны для жизни, как и ДНК. Внутри клеток существует множество РНК (рис. 2). Изначально РНК подразделяются на некодирующие РНК (нкРНК), которые не транслируются в белки, и кодирующие РНК (мРНК), служащие матрицей для синтеза полипептидных цепей белка. Некодирующие РНК имеют более сложную классификацию. Они бывают инфраструктурными и регуляторными. Инфраструктурные РНК представлены рибосомными РНК (рРНК) и транспортными РНК (тРНК). Молекулы рРНК синтезируются в ядрышке и составляют основу рибосомы, а также кодируют белки субъединиц рибосомы. После того, как рРНК полностью собраны, они переходят в цитоплазму, где в качестве ключевых регуляторов трансляции, участвуют в чтении кода мРНК. Последовательность из трех азотистых оснований в мРНК указывает на включение определенной аминокислоты в последовательность белка. Молекулы тРНК, приносят указанные аминокислоты на рибосомы, где синтезируется белок.

Виды РНК

Рисунок 2. Виды РНК

Регуляторные нкРНК очень широко представлены в организме, классифицируются в зависимости от размера и выполняют ряд важных функций (табл. 1).

Таблица 1. Некодирующие регуляторные РНК
НазваниеОбозначениеДлинаФункции
Длинные некодирующие РНКднкРНК, lncRNA200 нуклеотидов1. Регулируют избирательное метилирование ДНК, направляя ДНК-метилтрансферазу
2. Руководят избирательной посадкой репрессорных комплексов polycomb
Малые РНКМалые ядерные РНКмяРНК, snRNA150 нуклеотидов1. Участвуют в сплайсинге
2. Регулируют активность факторов транскрипции
3. Поддерживают целостность теломер [13]
Малые ядрышковые РНКмякРНК, snoRNA60–300 нуклеотидов1. Участвуют в химической модификации рРНК, тРНК и мяРНК
2. Возможно, участвуют в стабилизации структуры рРНК и защите от действия гидролаз
Малые интерферирующие РНКмиРНК, siRNA21–22 нуклеотидов1. Осуществляют антивирусную иммунную защиту
2. Подавляют активность собственных генов
Микро-РНКмкРНК, miRNA18–25 нуклеотидовПодавляют трансляцию путем РНК-интерференции
Антисмысловые РНК [14]asRNA1. Короткие: менее 200 нуклеотидов
2. Длинные: более 200 нуклеотидов
Блокируют трансляцию, образуя гибриды с мРНК
РНК, связанные с белками PiwipiRNA, piwiRNA26–32 нуклеотидовИх также называют «стражами генома», они подавляют активность мобильных генетических элементов во время эмбриогенеза

Проблема терминологии

Прежде чем ответить на вопрос: «Сколько у нас генов?», нужно понять, что же такое ген?

Основное внимание HGP было направлено на белок-кодирующие гены [15]. Однако, как было указано в первоначальном докладе HGP в 2001 году, «тысячи генов человека продуцируют некодирующие РНК (нкРНК), являющиеся их конечным продуктом», хотя на тот момент было известно около 706 генов нкРНК [2]. В своей недавней статье, опубликованной в журнале BMC Biology Стивен Зальцберг (Steven L. Salzberg) дает следующее определение гена [16]:

Ген
любой участок хромосомной ДНК, который транскрибируется в функциональную молекулу РНК или сначала транскрибируется в РНК, а затем транслируется в функциональный белок.

Это определение включает как гены некодирующих РНК, так и белок-кодирующие гены, и позволяет определять все варианты альтернативного сплайсинга в одном локусе как варианты одного и того же гена. Это позволяет исключить псевдогены – нефункциональные остатки структурных генов, утратившие способность кодировать белок.

Результаты двух первых исследований свидетельствовали о наличии у человека 31 000 [2] и 26 588 белок-кодирующих генов [17], а в 2004 появилась полная последовательность генома человека [4], и авторы подсчитали, что полный каталог насчитывает 24 000 белок-кодирующих генов. Каталог человеческих генов Ensembl включает 22 287 белок-кодирующих генов и 34 214 транскриптов [18].

Секвенирование нового поколения (NGS)

Появление высокопроизводительных методов параллельного секвенирования (в ходе такого секвенирования миллионы фрагментов ДНК из одного образца секвенируются одновременно) или секвенирования нового (следующего) поколения (next-generation sequencing, NGS) [1] позволило значительно ускорить поиск функциональных участков генома [4]. Биотехнологические компании разработали и коммерциализировали различные платформы для NG-секвенирования, позволяющие секвенировать от 1 млн до десятков млрд коротких последовательностей (ридов, reads) длиной 50–600 нуклеотидов каждая. К наиболее популярным платформам относятся такие, как Illumina и IonTorrent, использующие амплификацию ДНК с помощью ПЦР [19], а также платформы одномолекулярного секвенирования, такие как Helicos Biosciences HeliScope, Pacific Biosciences SMRT (single molecule real-time sequencing), и нанопорового секвенирования Oxford Nanopore, осуществляющие секвенирование в реальном времени и позволяющие прочитывать значительно более длинные риды — до 10–60 тыс. нуклеотидов. Кроме того, изобретение секвенирования РНК (RNA-seq) в 2008 году, которое создавалось для количественного определения экспрессии генов, также способствовало обнаружению транскрибируемых последовательностей, как кодирующих, так и некодирующих РНК [20].

Благодаря NGS, базы данных днкРНК и других генов РНК (таких как микро-РНК) резко выросли за десятилетие, и текущие каталоги генов человека теперь содержат больше генов, кодирующих РНК, чем белки (табл. 2).

Таблица 2. Количество разных типов генов в следующих базах данных: Gencode, Ensembl, RefSeq, CHESS
Типы геновGencodeEnsemblRefSeqCHESS
Белок-кодирующие гены19 90120 37620 34521 306
Гены длинных некодирующих РНК15 77914 72017 71218 484
Антисмысловые РНК5501282694
Другие некодирующие РНК2213222213 8994347
Псевдогены14 723174015 952
Общее число транскриптов203 835203 903154 484323 827
Последовательность ДНК

Рисунок 3. Последовательность ДНК, получаемая после секвенирования человеческого генома

В ходе секвенирования РНК обнаружилось, что альтернативный сплайсинг, альтернативное инициирование транскрипции и альтернативное прерывание транскрипции проиcходят гораздо чаще, чем полагали, затрагивая до 95% человеческих генов. Следовательно, даже если известно местоположение всех генов, сначала нужно выявить все изоформы этих генов, а также определить, выполняют ли эти изоформы какие-либо функции или они просто представляют собой ошибки сплайсинга.

Базы данных генов человека

Задача по составлению каталога всех генов по-прежнему не решена. Проблема заключается в том, что за последние 15 лет только две исследовательские группы составили список доминантных генов: RefSeq, которая поддерживается Национальным центром биотехнологической информации (NCBI) при Национальных институтах здоровья (NIH), и Ensembl/Gencode, которая поддерживается Европейской молекулярно-биологической лабораторией (EMBL). Однако, несмотря на большой прогресс, сейчас в каталогах различается количество белок-колирующих генов, генов длинных некодирующих РНК, псевдогенов, а также варьирует количество антисмысловых РНК и других некодирующих РНК (табл. 2). Каталоги еще дорабатываются: например, в прошлом году сотни генов, кодирующих белок, были добавлены или удалены из списка Gencode. Эти разногласия объясняют проблему создания полного каталога человеческих генов.

В 2017 году была создана новая база данных генов человека — CHESS. Примечательно, что она включает все белок-кодирующие гены как Gencode, так и RefSeq, так что пользователям CHESS не нужно решать, какую базу данных они предпочитают. Бóльшее количество генов может вызывать больше ошибок, но создатели считают, что бóльший набор окажется полезным при исследовании болезней человека, которые еще не отнесены к генетическим. Набор генов CHESS в настоящее время в версии 2.0 еще не окончательный, и, безусловно, создатели работают над его усовершенствованием.

Таким образом, все еще неизвестно, сколько всего генов у человека. Существует ряд проблем, затрудняющих эту задачу. Например, многие гены (особенно, гены днкРНК), видимо, имеют высокую тканеспецифичность. Из этого следует, что пока ученые подробно не исследуют все типы клеток человека, они не могут быть уверены, что обнаружили все человеческие гены и транскрипты. Безусловно, сегодня знания о человеческих генах стали значительно обширнее, чем в начале проекта «Геном человека», а технологии совершеннее. Это дает надежду на то, что в скором времени мы узнаем точный ответ на поставленный вопрос.

  1. 12 методов в картинках: секвенирование нуклеиновых кислот;
  2. Eric S. Lander, Lauren M. Linton, Bruce Birren, Chad Nusbaum, Michael C. Zody, et. al.. (2001). Initial sequencing and analysis of the human genome. Nature. 409, 860-921;
  3. Власть колец: всемогущие кольцевые РНК;
  4. International Human Genome Sequencing Consortium. (2004). Finishing the euchromatic sequence of the human genome. Nature. 431, 931-945;
  5. Mohammad Ilyas. (2017). Next-Generation Sequencing in Diagnostic Pathology. Pathobiology. 84, 292-305;
  6. Геном человека: полезная книга, или глянцевый журнал?;
  7. Mark S. Baker, Seong Beom Ahn, Abidali Mohamedali, Mohammad T. Islam, David Cantor, et. al.. (2017). Accelerating the search for the missing proteins in the human proteome. Nat Comms. 8, 14271;
  8. SUMO: японская борьба или уникальная посттрансляционная модификация?;
  9. Pascale Gaudet, Pierre-André Michel, Monique Zahn-Zabal, Aurore Britan, Isabelle Cusin, et. al.. (2017). The neXtProt knowledgebase on human proteins: 2017 update. Nucleic Acids Res. 45, D177-D182;
  10. Обо всех РНК на свете, больших и малых;
  11. Кодирующие некодирующие РНК;
  12. Власть колец: всемогущие кольцевые РНК;
  13. Цинковые пальцы смерти;
  14. Есть ли смысл в антисенсах?;
  15. Геном человека: как это было и как это будет;
  16. Steven L. Salzberg. (2018). Open questions: How many genes do we have?. BMC Biol. 16;
  17. J. C. Venter, H. O. Smith, M. D. Adams. (2015). The Sequence of the Human Genome. Clinical Chemistry. 61, 1207-1208;
  18. Eric T. Wang, Rickard Sandberg, Shujun Luo, Irina Khrebtukova, Lu Zhang, et. al.. (2008). Alternative isoform regulation in human tissue transcriptomes. Nature. 456, 470-476;
  19. 12 методов в картинках: полимеразная цепная реакция;
  20. Hassaan Mehboob Awan, Abdullah Shah, Farooq Rashid, Ge Shan. (2017). Primate-specific Long Non-coding RNAs and MicroRNAs. Genomics, Proteomics & Bioinformatics. 15, 187-195.

Геном — все статьи и новости

Геном — совокупность генов, характерных для гаплоидного (одинарного) набора хромосом определенного вида организмов. Геном также считается совокупностью наследственного материала, заключенного в клетке организма. Геном содержит биологическую информацию, которая необходима для построения и поддержания организма. У человека геном состоит из 23 пар хромосом, расположенных в ядре и ДНК митохондрий.

В отличие от прокариот, основная часть генома эукариот находится в ядре клетки, а меньшая часть — в митохондриях, хлоропластах и других пластидах. Так же, как и у прокариот, информационной макромолекулой генома эукариот является ДНК, которая неравномерно распределена по нескольким хромосомам в виде комплексов с многочисленными белками. Считается, что содержание ДНК у эукариот в расчете на одну клетку в среднем на два-три порядка выше, чем у прокариот.

Геном определяется количеством ДНК и измеряется числом пар образующих ДНК нуклеотидов или в единицах массы. В отличие от генотипа, геном представляет собой характеристику вида, а не отдельной особи. Чтобы определить число и сходство геномов у разных видов, используют геномный анализ.

Диплоидные организмы содержат два генома — отцовский и материнский. Также можно встретить виды (чаще — среди растений), у которых хромосомный набор представлен несколькими геномами. Такое явление называется полиплоидией. Полиплоидию можно вызвать искусственно. С помощью гибридизации разных видов получают организмы аллополиплоиды, в клетках которых одновременно присутствуют геномы разных видов.

Геном различается у разных групп организмов. Так, геном бактерий состоит в среднем из 106 пар нуклеотидов, грибов — из 107 пар, большинства животных и многих растений — из 109 пар. У значительной части семенных растений, а также у саламандр и некоторых рыб он достигает размера в 1010 пар нуклеотидов. Геном человека включает 22 пары аутосом (парные хромосом, одинаковые у живых мужских и женских организмов с хромосомным определением пола), две половые хромосомы Х и Y, а также митохондриальная ДНК, что в совокупности составляет примерно 3,1 млрд пар оснований.

Термин был предложен немецким биологом Гансом Винклером в 1920 году. В 2015 году завершился семилетний международный проект «1000 геномов» (The 1000 Genomes Project), цель которого — полное секвенирование, или расшифровка, геномов тысячи человек. В проекте приняло участие множество исследовательских организаций, в том числе из США, Великобритании, Дании, Германии, Финляндии, Китая, Южной Кореи, Франции и Швейцарии. Российские институты в проекте не участвовали. Основная задача проекта — обнаружить и описать более 95% генетических вариаций, которые встречаются у людей с частотой более 1%. В результате генетики полностью расшифровали геномы более чем 2,5 тыс. человек, каждый из которых состоит из 3 млрд генов.

Фото: PublicDomainPictures/Pixabay

Хромосомы дают первые сведения о структуре генома. Геном человека: Энциклопедия, написанная четырьмя буквами

Хромосомы дают первые сведения о структуре генома

Выше уже говорилось, что в ядре клетки молекулы ДНК расположены в особых структурах, получивших название хромосомы. Их исследование началось еще свыше 100 лет назад с помощью обычного светового микроскопа. Уже к концу XIX века выяснилось кое-что о поведении хромосом в процессе деления клеток и высказывалась мысль об их участии в передаче наследственности.

Хромосомы становятся видимыми в микроскопе при делении клетки на определенной стадии клеточного цикла, называемой митозом. Хромосомы в этом состоянии представляют собой компактные палочковидные структуры разной длины с довольно постоянной толщиной, у большей части хромосом имеется перетяжка, которая делит хромосому на два плеча. В области перетяжки расположена важная для удвоения хромосом структура, называемая центромерой. При делении клетки в ходе митоза происходит удвоение числа хромосом, в результате которого обе вновь образующиеся клетки в конечном итоге обеспечиваются одним и тем же стандартным набором хромосом.

Лишь в 1956 г. впервые Ю. Тио и A. Леван описали хромосомный набор человека, определили количественный состав хромосом и дали их общую морфологическую характеристику. По сути дела эти работы и положили начало изучению структуры генома человека. У человека в каждой клетке тела содержится 46 хромосом, физические длины которых находятся в пределах от 1,5 до 10 мкм (рис. 7).

Рис. 7. Вид под микроскопом полного набора хромосом, содержащихся в ядре каждой отдельной клетки человека

Напомним читателю, что набор хромосом во всех клетках человека (за исключением половых) называют диплоидным (двойным), поскольку каждая из хромосом представлена двумя копиями (всего 23 пары). Каждая соматическая клетка человека (кроме красных кровяных клеток крови) содержит по 2 полных набора хромосом. В каждом единичном (гаплоидном) наборе присутствует 23 хромосомы — 22 обычные хромосомы (аутосомы) и по одной половой хромосоме — X или Y. Таким образом, геном каждого конкретного человека состоит из 23 пар гигантских молекул ДНК, распределенных в разных хромосомах, а если говорить о геноме человека вообще (мужчин и женщин), то общее число таких молекул равно 24. Это первое базовое сведение, которое было получено о геноме человека при анализе хромосом.

Изучение строения (размера и формы) хромосом человека показало, что большинство из них по внешнему виду напоминают кегли, состоящие из двух толстых частей (хроматид) и тонкой перетяжки (центромеры) между ними. Сходство с кеглями, а не с гантелями заключается в том, что центромера чаще всего расположена не в центре хромосомы, а смещена к одному из ее концов. Размеры хромосом сильно варьируют, самая короткая хромосома примерно в десять раз меньше, чем самая длинная. Это второе принципиально важное сведение о структуре генома человека — составляющие его 24 молекулы ДНК имеют разный размер.

Если сравнивать число и размер хромосом у человека и у других видов организмов, то можно увидеть огромные отличия. Например, у коровы, размер генома которой примерно равен геному человека, имеется 60 пар хромосом. У шпорцевой лягушки содержится всего 18 хромосом, но даже самые маленькие из них больше, чем самые крупные хромосомы человека. У птиц, наоборот, число хромосом достигает 40 и более и все они очень небольшие по размерам. Таким образом, разнообразие хромосом в природе весьма велико.

С помощью световой микроскопии были определены размеры всех хромосом человека. Затем все неполовые хромосомы были пронумерованы по уменьшению размера — от 1 до 22. Половым хромосомам не присвоили номер, а назвали X и Y. Как показали более точные последующие исследования, хромосома 21 реально оказалась чуть меньше 22, однако нумерацию хромосом не изменили (чтобы не вносить путаницу). Различие в хромосомных наборах между мужчинами и женщинами состоит в том, что у женщин имеются две половые X-хромосомы (т. е. хромосомы во всех 23-х парах одинаковы), а у мужчин пару с X-хромосомой образует мужская половая хромосома — Y. Каждую хромосому можно рассматривать как отдельный том большого двадцатичетырехтомного собрания сочинений под названием Энциклопедия человека.

Половые клетки человека, в отличие от клеток тела взрослого организма (соматических клеток), содержат не 2 набора томов ДНКового текста, а всего лишь один. Перед зачатием каждая отдельная хромосома (отдельный том в Энциклопедии человека) сперматозоида отца и яйцеклетки матери состоят из смешанных в разном сочетании различных глав ДНКового текста их родителей. Любая из хромосом, полученная нами от отца, образовалась в его семенниках незадолго до того, как мы были зачаты. Ранее, за всю историю человечества, точно такая хромосома никогда не существовала. Она была сформирована в процессе случайного перемешивания, происходящего при делении, постепенно образуясь из объединяющихся друг с другом участков хромосом предков со стороны отца. Также обстоит дело и с хромосомами яйцеклеток, за исключением того, что они формируются в организме нашей матери задолго до нашего рождения (почти сразу после рождения самой матери).

В зиготе, образующейся в результате слияния сперматозоида и яйцеклетки, материнские и отцовские гены смешиваются и перетасовываются в разных сочетаниях. Это происходит в результате того, что хромосомы не остаются неизменными в поколениях — они вступают во взаимодействие со своей случайно встреченной парой, обмениваясь с ней материалом. Такой постоянно идущий процесс получил название рекомбинации. И следующему поколению часто достается уже гибридная хромосома — часть от дедушки и часть от бабушки. Далее в ряду поколений пути генов постоянно пересекаются и расходятся. В результате слияния уникальной яйцеклетки с уникальным сперматозоидом и возникает уникальный во всех отношениях геном. И в этом смысле все мы уникумы. Каждый человеческий индивид хранит уникальную генетическую информацию, состоящую из случайной комбинации разных вариантов генов.

Отдельный ген можно рассматривать как единицу, продолжающую существовать в ряду многочисленных поколений. И в этом смысле ген бессмертен! Существует даже такая оригинальная точка зрения, что не сами люди, а их гены правят миром, а каждый конкретный живой организм служит лишь временным прибежищем для них. Эта не бесспорная мысль принадлежит Ричарду Докинзу, автору книги «Эгоистичный ген». По его мнению, гены практически бессмертны в отличие от живых организмов, в которых они существуют. Некоторым генам десятки и даже сотни миллионов лет. Гены, пользуясь терминологией Докинза, делают все возможное, чтобы выжить. Приспосабливаются к жаре и холоду, выбирая себе местечко получше, мигрируют с помощью человека и вступают в новые комбинации. Человек оказался довольно непоседливым хозяином. За тысячи лет он сильно исколесил мир, распространяя свое присутствие, влияние и свою начинку — гены. (Подробнее с идеями и аргументацией Р. Докинза любознательный читатель может познакомиться в Приложении 1). Такая точка зрения далеко не бесспорна, и из дальнейшего изложения нам станет понятно, что гены — это в первую очередь не эгоисты, а трудоголики. Имеются гены — «сторожа» генома, гены — «дворники», гены — «повара» и гены — «домоуправители». Обеспечивая свое существование, они обеспечивают и существование нас.

Сразу после зачатия будущий человек представляет собой всего одну клетку (зиготу), наделенную одной исходной ДНКовой библиотекой, содержащей 46 томов. Среди 46 томов всегда 23 получены от отца, а другие 23 — от матери. Тексты 23 отцовских и 23 материнских томов хотя и очень сходны в целом, тем не менее отличаются в деталях. Например, в отцовском томе № 18 на странице 253 существует предложение-предписание (в виде гена), в котором сказано, что глаза у ребенка должны быть карими, а в этом же материнском томе на той же странице тоже написано о цвете глаз, но согласно этому тексту цвет должен быть голубыми. Первое указание более строгое (доминирующее), чем второе, и в результате у ребенка глаза будут иметь карий цвет. Ген, который диктует свои права, называют доминирующим, а тот, который уступает свои права, — рецессивным. Голубой цвет глаз имеют только те люди, у которых и в материнском, и в отцовском тексте содержатся рецессивные гены, в которых есть указание на голубоглазость. Затем зигота делится на две клетки, каждая из них вновь делится и так до появления миллиардов клеток. Схематически процесс деления клеток изображен на рис. 8.

При каждом делении клетки содержащиеся в библиотеках тома ДНКового текста точно копируются, причем практически без ошибок. Организм взрослого человека состоит в среднем из 1014 клеток. Например, в головном мозге и печени насчитывается примерно по 10 млрд. клеток, в иммунной системе — 300 млрд. клеток. В течение всей жизни человека в его организме происходит около 1016 клеточных делений. Клеточный состав многих органов за 70 лет жизни обновляется несколько раз. И каждая из этих клеток содержит одни и те же 46 томов ДНКового текста.

В конце 60-х годов XX века был осуществлен важный прорыв в исследовании хромосом. Обусловлен он был всего лишь тем, что для их окраски стали использовать специальное контрастное вещество — акрихин-иприт, а затем и другие сходные с ним соединения. Такая окраска позволила выявить внутри хромосом большое число разных субструктур, которые не обнаруживались под микроскопом без окрашивания. После окрашивания хромосом специфическим красителем Гимза-Романовского они выглядят как зебры: вдоль всей длины видны поперечные светлые и темные полосы, имеющие окраску разной интенсивности.

Рис. 8. Основные стадии клеточного цикла, приводящего к делению клетки

Эти полосы получили название хромосомных G-сегментов или полос (рис. 9). Картина сегментации сильно отличается у разных хромосом, но расположение хромосомных сегментов постоянно у каждой из хромосом во всех типах клеток человека.

Природа полос, выявляемых при окраске, до конца еще не ясна. Сейчас установлено только, что участки хромосом, соответствующие темным полосам (названные R-полосами), реплицируются раньше, чем светлые участки (названные G-полосами). Таким образом, полосатость хромосом скорее всего все же имеет некий до конца еще не понятый смысл.

Окрашивание хромосом очень облегчило их идентификацию, а в дальнейшем способствовало определению расположения на них генов (картированию генов).

Рис. 9. Специфические хромосомные G-сегменты, выявляемые при окраске хромосом человека, и система их обозначения согласно решению международной конференции в Париже в 1971 году. Цифрами под хромосомами указаны их номера. X и Y — половые хромосомы, p — короткое плечо, q — длинное плечо хромосом

Хотя детальные процессы, происходящие при окрашивании, еще не до конца ясны, очевидно, что картина окраски зависит от такого параметра, как увеличенное или уменьшенное содержание в отдельных полосах хромосом АТ или ГЦ-пар. И это еще одно общее сведение о геноме — он не однороден, в нем есть районы, обогащенные определенными парами нуклеотидов.

Это, в частности, может быть связано с повторяемостью некоторых типов нуклеотидных последовательностей ДНК в определенных районах.

Дифференциальная окраска хромосом нашла широкое применение для выявления и идентификации небольших индивидуальных изменений генома конкретного человека (полиморфизма), в частности, приводящих к различным патологиям. Примером этому может служить обнаружение так называемой филадельфийской хромосомы, встречающейся у больных с хроническим миелоидным лейкозом. С помощью окраски хромосом установлено, что у пациентов с этим заболеванием определенный фрагмент исчезает на хромосоме 21 и появляется на конце длинного плеча хромосомы 9 (перенос фрагмента или транслокация, сокращенно t). Генетики обозначают такое событие как t (9; 21). Таким образом, хромосомный анализ свидетельствует о том, что разные молекулы ДНК могут обмениваться между собой отдельными участками, в результате чего в геноме образуются «гибриды», состоящие из молекул ДНК разных хромосом. Анализ уже изученных свойств хромосом позволил сформировать представление о полиморфизме генома человека.

Для выяснения локализации отдельных генов на хромосомах (то есть картирования генов) используют целый арсенал специальных зачастую весьма сложных по замыслу и исполнению методов. Один из основных — молекулярная гибридизация (образование гибрида) гена или его фрагмента с фиксированными на твердой подложке препаратами хромосом, выделенными из клеток в чистом виде (это называют гибридизацией in situ). Суть метода гибридизации in situ заключается во взаимодействии (гибридизации) между денатурированными (расплетенными) нитями ДНК в хромосомах и комплементарными нуклеотидными последовательностями добавленных к препарату хромосом, индивидуальных однонитевых ДНК или РНК (их называют зондами). При наличии комплементарности между одной из нитей хромосомной ДНК и зондом между ними образуются довольно стабильные молекулярные гибриды. Зонды маркируют предварительно с помощью разных меток (радиоактивных, флуоресцентных или др.). Места образования гибридов на хромосомах выявляют по положению этих меток на препаратах хромосом. Так, еще до появления методов генной инженерии и секвенирования ДНК выяснили, например, расположение в геноме человека генов, кодирующих большие и малые рибосомные РНК (рРНК). Гены первых оказались локализованными в пяти разных хромосомах человека (13, 14, 15, 21 и 22), тогда как основная масса генов малой рРНК (5S РНК) сконцентрирована в одном месте на длинном плече хромосомы 1.

Пример картины, получаемой при гибридизации меченых флюоресцентным красителем генов-зондов, приведен на рис. 10 на цветной вклейке.

Рис. 10. Гибридизация хромосом человека с генами-зондами, мечеными красным и зеленым флюоресцентными красителями. Стрелками указано расположение соответствующих генов на концах двух разных хромосом (справа вверху дано увеличение картины гибридизующихся хромосом).

Гены, расположенные на одной хромосоме, определяют как сцепленные (связанные) гены. Если гены расположены на разных хромосомах, они наследуются независимо (независимая сегрегация). Когда же гены находятся на одной и той же хромосоме (т. е. сцеплены), они неспособны к независимой сегрегации. Изредка в половых клетках могут происходить различные изменения хромосом в результате рекомбинационных процессов между гомологичными хромосомами. Один из таких процессов получил название кроссинговера. Из-за кроссинговера сцепление между генами одной группы никогда не бывает полным. Чем ближе расположены друг к другу сцепленные гены, тем меньше вероятность изменения расположения таких генов у детей по сравнению с родителями. Измерение частоты рекомбинаций (кроссинговера) используется для установления линейного порядка генов на хромосоме внутри группы сцепления. Таким образом, при картировании хромосом первоначально устанавливают, находятся ли данные гены в одной и той же хромосоме, без уточнения, в какой именно. После того, как хотя бы один из генов данной группы сцепления локализуют в определенной хромосоме (например, с помощью гибридизации in situ), становится ясным, что все другие гены этой группы сцепления находятся в той же самой хромосоме.

Первым примером связи генов с определенными хромосомами может служить обнаружение сцепления определенных наследуемых признаков с половыми хромосомами. Чтобы доказать локализацию гена в мужской половой Y-хромосоме, достаточно показать, что данный признак всегда встречается только у мужчин и никогда не обнаруживается у женщин. Группа сцепления женской X-хромосомы однозначно характеризуется отсутствием наследуемых признаков, передающихся от отца к сыну, и наследованием признаков матери.

Особенно важным для изучения генома человека на первых этапах его исследования стал метод, называемый гибридизацией соматических клеток. При смешивании соматических (неполовых) клеток человека с клетками других видов животных (чаще всего для этой цели использовали клетки мышей или китайских хомячков) в присутствии определенных агентов может происходить слияние их ядер (гибридизация). При размножении таких гибридных клеток происходят потери некоторых хромосом. По счастливой для экспериментаторов случайности в гибридных клетках человек-мышь происходит потеря большей части хромосом человека. Далее отбираются гибриды, в которых остается только какая-нибудь одна человеческая хромосома. Исследования таких гибридов позволили связать некоторые биохимические признаки, свойственные клеткам человека, с определенными хромосомами человека. Постепенно благодаря использованию селективных сред научились добиваться сохранения или потери отдельных хромосом человека, несущих определенные гены. Схема отбора, хотя и не очень проста на первый взгляд, довольно хорошо показала себя в эксперименте. Так, придумали специальную селективную среду, на которой могут выживать только те клетки, в которых синтезируется фермент тимидинкиназа. Если для гибридизации с клетками человека взять в качестве партнера мутантные клетки мыши, не синтезирующие тимидинкиназу, то будут выживать только те гибриды, которые содержат хромосомы человека с геном тимидинкиназы. Таким путем впервые удалось установить локализацию гена тимидинкиназы на хромосоме 17 человека.

Несмотря на то, что изучение генома человека на уровне хромосом дало ряд важных его характеристик, они были самыми общими и дали относительно мало для полного понимания устройства и функционирования генетического аппарата человеческих клеток.

Данный текст является ознакомительным фрагментом.

Читать книгу целиком

Поделитесь на страничке

Следующая глава >

Геном человека — это… Что такое Геном человека?

Графическое представление нормального человеческого кариотипа.

Геном человека — совокупность наследственного материала, заключенного в клетке человека. Человеческий геном состоит из 23 пар хромосом, находящихся в ядре, а также митохондриальной ДНК. Двадцать две аутосомные хромосомы, две половые хромосомы Х и Y, а также митохондриальная ДНК человека содержат вместе примерно 3,1 млрд пар оснований[1].

В ходе выполнения проекта «Геном человека» была определена последовательность ДНК всех хромосом и митохондриальной ДНК. В настоящее время эти данные активно используется по всему миру в биомедицинских исследованиях. Полное секвенирование выявило, что человеческий геном содержит 20 000—25 000 генов[2], что значительно меньше, чем ожидалось в начале проекта. Только 1,5 % всего генетического материала кодирует белки или функциональную РНК. Остальная часть является некодирующей ДНК, которую часто называют мусорной ДНК[3].

Особенности

Хромосомы

Геном человека состоит из 23 пар хромосом (в сумме 46 хромосом), где каждая хромосома содержит сотни генов, разделённых межгенным пространством. Межгенное пространство содержит регуляторные участки и ничего не кодирующую ДНК.

В геноме присутствует 23 пары хромосом: 22 пары аутосомных хромосом, а также пара половых хромосомы X и Y. У человека мужской пол является гетерогаметным и определяется наличием Y хромосомы. Нормальные диплоидные соматические клетки имеют 46 хромосом.

Гены

По результатам проекта Геном человека, количество генов в геноме человека составляет около 28000 генов. Начальная оценка была более чем 100 тысяч генов. В связи с усовершенствованием методов поиска генов (предсказание генов) предполагается дальнейшее уменьшение числа генов.

Число генов человека не намного превосходит число генов у более простых организмов, например, круглого червя Caenorhabditis elegans или мухи Drosophila melanogaster. Так происходит из-за того, что в человеческом геноме широко представлен альтернативный сплайсинг. Альтернативный сплайсинг позволяет получить несколько различных белковых цепочек с одного гена. В результате человеческий протеом оказывается значительно больше протеома рассмотренных организмов. Большинство человеческих генов имеют множественные экзоны, и интроны часто оказываются значительно более длинными, чем граничные экзоны в гене.

Гены неравномерно распределены по хромосомам. Каждая хромосома содержит богатые и бедные генами участки. Эти участки коррелируют с хромосомными бандами (полосы поперёк хромосомы, которые видно в микроскоп) и с CG-богатыми участками. В настоящий момент значимость такого неравномерного распределения генов не вполне изучена.

Кроме кодирующих белок генов человеческий геном содержит тысячи РНК-генов, включая транспортную РНК (tRNA), рибосомную РНК, микро РНК (microRNA) и прочие не кодирующие белок РНК последовательности.

Регуляторные последовательности

В человеческом геноме найдено множество различных последовательностей, отвечающих за регуляцию гена. Под регуляцией понимается контроль экспрессии гена (процесс построения матричной РНК по участку молекулы ДНК). Обычно это короткие последовательности, находящиеся либо рядом с геном, либо внутри гена. Иногда они находятся на значительном расстоянии от гена (энхансеры). Систематизация этих последовательностей, понимание механизмов работы, а также вопросы взаимной регуляции группы генов группой соответствующих ферментов на текущий момент находятся только на начальной стадии изучения. Взаимная регуляция групп генов описывается с помощью сетей регуляции генов. Изучение этих вопросов находится на стыке нескольких дисциплин: прикладной математики, высокопроизводительных вычислений и молекулярной биологии. Знания появляются из сравнений геномов различных организмов и благодаря достижениям в области организации искусственной транскрипции гена в лабораторных условиях.

Идентификация регуляторных последовательностей в человеческом геноме частично была произведена на основе эволюционной консервативности (свойства сохранения важных фрагментов хромосомной последовательности, которые отвечают примерно одной и той же функции). Согласно некоторой гипотезе, в эволюционном дереве ветвь разделяющая человека и мышь появилась приблизительно 70-90 миллионов лет назад[4]. Для двух геномов компьютерными методами были выявлены консервативные последовательности (последовательности идентичные или очень слабо отличающиеся в сравниваемых геномах) в не кодирующей части и оказалось, что они активно участвуют в механизмах регуляции генов для обоих организмов[5].

Другой подход получения регуляторных последовательностей основан на сравнении генов человека и рыбы фугу. Последовательности генов и регуляторные последовательности у человека и рыбы фугу существенно схожи, однако геном рыбы фугу содержит в 8-раз меньший объём «мусорной ДНК». Такая «компактность» рыбьего генома позволяет значительно легче искать регуляторные последовательности для генов[6].

Прочие объекты в геноме

Кодирующие белок последовательности (множество последовательностей составляющих экзоны) составляют менее чем 1,5 % генома[3]. Не учитывая известные регуляторные последовательности, в человеческом геноме содержится масса объектов, которые выглядят как нечто важное, но функция которых, если она вообще существует, на текущий момент не выяснена. Фактически эти объекты занимают до 97 % всего объёма человеческого генома. К таким объектам относятся:

Представленная классификация не является исчерпывающей. Большая часть объектов вообще не классифицирована мировой научной общественностью на текущий момент.

Соответствующие последовательности, скорее всего, являются эволюционным артефактом. В современной версии генома их функция выключена, и на эти участки генома многие ссылаются как на «мусорную ДНК». Однако существует масса свидетельств, которая говорит о том, что эти объекты обладают некоторой функцией, которая не вполне понятна на текущий момент.

Псевдогены

Эксперименты с ДНК-микрочипами показали, что много участков генома, не являющихся генами, вовлечены в процесс транскрипции[7].

Вирусы

Около 1 % в геноме человека занимают встроенные гены ретровирусов (эндогенные ретровирусы). Эти гены обычно не приносят пользы хозяину, но существуют и исключения. Так, около 43 млн. лет назад в геном предков обезьян и человека попали ретровирусные гены, служившие для построения оболочки вируса. У человека и обезьян эти гены участвуют в работе плаценты.

Большинство ретровирусов встроились в геном предков человека свыше 25 млн. лет назад. Среди более молодых человеческих эндогенных ретровирусов полезных на настоящий момент не обнаружено[8],[9].

См. также

Примечания

  1. Talking glossary of genetic terms: genome  (англ.). National Human Genome Research Institute. Архивировано из первоисточника 4 ноября 2012. Проверено 1 ноября 2012.
  2. International Human Genome Sequencing Consortium (2004). «Finishing the euchromatic sequence of the human genome.». Nature 431 (7011): 931-45. PMID 15496913. [1]
  3. 1 2 International Human Genome Sequencing Consortium (2001). «Initial sequencing and analysis of the human genome.». Nature 409 (6822): 860-921. PMID 11237011. [2]
  4. Nei M, Xu P, Glazko G (2001). «Estimation of divergence times from multiprotein sequences for a few mammalian species and several distantly related organisms.». Proc Natl Acad Sci U S A 98 (5): 2497-502. PMID 11226267.
  5. Loots G, Locksley R, Blankespoor C, Wang Z, Miller W, Rubin E, Frazer K (2000). «Identification of a coordinate regulator of interleukins 4, 13, and 5 by cross-species sequence comparisons.». Science 288 (5463): 136-40. PMID 10753117. Summary
  6. Meunier, Monique Genoscope and Whitehead announce a high sequence coverage of the Tetraodon nigroviridis genome  (англ.). Genoscope.(недоступная ссылка — история) Проверено 12 сентября 2006.
  7. Claverie J (2005). «Fewer genes, more noncoding RNA.». Science 309 (5740): 1529-30. PMID 16141064.
  8. Eugene D. Sverdlov. Retroviruses and primate evolution. BioEssays Volume 22, Issue 2, pages 161–171, February 2000
  9. Anders L Kjeldbjerg, Palle Villesen, Lars Aagaard, Finn Skou Pedersen. Gene conversion and purifying selection of a placenta-specific ERV-V envelope gene during simian evolution // BMC Evolutionary Biology. 2008. V. 8. P. 266.

Список литературы

  • Тарантул В. З. Геном человека. Энциклопедия, написанная четырьмя буквами. — Языки славянской культуры, 2003. — 396 с. — ISBN 5-94457-108-X.
  • Ридли Мэтт. Геном: автобиография вида в 23 главах. — М.: Эксмо, 2008. — 432 с. — ISBN 5-699-30682-4

Ссылки

25-я ХРОМОСОМА — ВАЖНОЕ ДОПОЛНЕНИЕ (митохондриальный геном)

25-я ХРОМОСОМА — ВАЖНОЕ ДОПОЛНЕНИЕ (митохондриальный геном)

Мал золотник, да дорог.

Русская поговорка

Когда сейчас громогласно заявляют о полном секвенировании генома человека, то, как правило, подразумевают ядерный геном. На этом фоне как-то забывается, что в клетках имеются молекулы ДНК, расположенные не только в хромосомах, но и в таких уже упоминавшихся специфических внутриклеточных структурах, как митохондрии. И это тоже геном человека, но он называется митохондриальным, а ДНК — митохондриальной (сокращенно митДНК). МитДНК теперь называют иногда хромосомой 25 или М-хромосомой. Эта ДНК была секвенирована еще в 1981 году уже упоминавшимся Ф. Сенгером, что тоже было в свое время сенсацией, которая, однако, имела резонанс несопоставимо меньший, чем секвенирование ядерного генома. Что же представляет собой эта 25-ая хромосома человека?

В клетке человека насчитывается от 100 до 1000 митохондрий, в каждой из которых содержится от 2 до 10 молекул кольцевой митДНК длиной 16569 п. н. Таким образом, размер митохондриального генома примерно в 200 000 раз меньше ядерного. Интересно, что размер митДНК у человека — один из наименьших среди высших организмов (эукариот). Например, у дрожжей митДНК состоит из 78520 п. н. Человеческая митДНК содержит 37 генов, кодирующих 13 белковых цепей, 22 тРНК и 2 рибосомных РНК (рРНК) (рис. 30). Белковые цепи входят в состав белков, которые участвуют в основном в важнейшем внутриклеточном процессе, называемом окислительным фосфорилированием, который обеспечивает клетку энергией. За счет окислительного фосфорилирования в митохондриях осуществляется производство более 90 % специальных молекул АТФ, являющихся основой энергетики клетки.

Рис. 30. Структура митохондриального генома человека (митДНК). В митДНК содержится 22 гена, кодирующих тРНК, 2 рибосомных гена (16S и 12S рРНК) и 13 белок-кодирущих генов. Стрелками указано направление транскрипции генов. Сокращения: ND1—ND6, ND4L — гены субъединиц НАД-Н-дегидрогеназного комплекса; COI–COIII — гены субъединиц цитохром-с-оксидазы; ATP6, ATP8 — гены субъединиц АТФ-синтетазы; Cyt b — ген цитохрома b

Всего же в процессе окислительного фосфорилирования задействовано 87 генов, но все недостающие 74 кодируются не митохондриальным, а ядерным геномом. Интересно, что в ядерном геноме обнаруживаются участки, подобные митДНК. Предполагается, что в процессе эволюции и при различных патологиях имела место миграция части митДНК в ядерный геном.

Важно, что устройство митохондриального генома существенно отличается от ядерного. В первую очередь, для митДНК характерно очень компактное расположение генов, как и в геноме бактерий. В отличие от ядерного генома митохондриальные гены соседствуют друг с другом и между ними практически отсутствуют межгенные промежутки. В ряде случаев они даже перекрываются на один нуклеотид: последний нуклеотид одного гена оказывается первым в следующем за ним. То есть гены набиты в митохондриальной ДНК, как сельди в бочке. Кроме того, большинство митохондриальных генов не содержит такие характерные для ядерных генов структуры, как интроны. Но это еще не все отличия. Выяснилось, в частности, что митДНК не подвержена такой модификации, как метилирование, которая характерна для ядерной ДНК.

Однако особенное удивление исследователей вызвал генетических код, используемый в митДНК. Хотя генетический код универсален (за очень небольшим исключением) во всем живом мире, в митохондриях используется некий его необычный вариант. Большинство кодонов в митохондриальных генах сходны с теми, которые имеются в ядерной ДНК, но наряду с этим имеются и принципиальные отличия. В митДНК человека изменили свой смысл четыре кодона. Терминирующими стали кодоны АГА и АГГ. Кодон УГА, являющийся в ядерной ДНК терминирующим, в митДНК не только не вызывает остановки трансляции, а кодирует аминокислоту триптофан. Аминокислоту метионин кодируют не один кодон АУГ, а еще кодон АУА, который в ядерном геноме кодирует аминокислоту изолейцин.

МитДНК ответственна в клетке за синтез всего лишь нескольких митохондриальных белков. Но эти белки очень важны для клетки, поскольку участвуют в осуществлении одного из важнейших процессов — обеспечении клетки энергией. Таким образом, митДНК — весьма ценное приложение к Энциклопедии человека. Белки, кодируемые непосредственно генами митДНК, синтезируются тут же в митохондриях. Для этой цели используется собственная РНК-полимераза и собственный аппарат белкового синтеза. Причина ясна — генетический код митохондрий особый, нужна и особая система биосинтеза.

Далеко не все белки, которые нужны для автономного существования митохондрий, кодируются митохондриальным геномом и синтезируются здесь же. Для этого их геном слишком мал. Большая часть митохондриальных белков и отдельных субъединиц этих белков кодируется основным, т. е. ядерным геномом и синтезируется в цитоплазме клеток. Затем они транспортируются в митохондрии, где взаимодействуют со специфическими белками, кодируемыми митДНК. Таким образом, между ядерным и митохондриальным геномом существует тесная взаимосвязь, они дополняют друг друга.

Почему в эволюции клетки случилось так, что очень небольшая часть ДНК содержится не в хромосомах ядра, а отдельно внутри митохондрий? В чем необходимость или преимущество такого распределения генетического материала, пока неизвестно. Для объяснения этого удивительного факта было придумано много гипотез. Одну из первых еще в далеком 1890 году высказал Р. Альтман. Однако она и на сегодняшний день сохранила актуальность. Согласно этой точке зрения, митохондрии появились в клетках высших организмов не в ходе внутриклеточного развития и дифференцировки, а в результате естественного симбиоза высших организмов с низшими аэробными организмами. Такое объяснение предполагает, что митохондриальный генетический код более древен, чем код, используемый в ядерной ДНК у современных организмов.

Но наряду с этим высказывалась и иная точка зрения, которая пока в равной мере имеет право на существование. Согласно последней, после перехода большинства генов из митДНК в ядерную ДНК в аппарате, обеспечивающем синтез белка в митохондриях, произошли какие-то мутации. Для того, чтобы процесс трансляции не нарушался, потребовались специальные мутации в генах митДНК, которые бы «компенсировали» нарушения и позволили бы измененному аппарату белкового синтеза осуществлять свою работу. Если исходить из этого предположения, тогда митохондриальный код следует рассматривать не как более древний, а, наоборот, скорее как более молодой.

В любом случае язык митДНК — это в определенном смысл «жаргон». Зачем он нужен митохондриям? Здесь можно провести параллель с жаргонами определенных социальных или профессиональных групп. Жаргон используется ими для сокрытия своих намерений и действий от посторонних, избежания чужого вмешательства в их дела. Возможно, и митДНК, благодаря использованию видоизмененного кода — жаргона, — изолируется от белок-синтезирующиего аппарата клетки, специализируясь на выполнении одной, но очень важной для клетки функции — производстве энергии.

Замечено, что митохондриальный геном более раним, чем ядерный геном. В результате в нем часто происходят различного рода мутации (точковые мутации, небольшие потери ДНК — делеции и, наоборот, вставки — инсерции). Сейчас уже установлены многочисленные болезни человека, связанные с изменениями в митДНК. Патологические мутации обнаружены почти во всех митохондриальных генах. При этом отмечают огромное разнообразие клинических признаков, обусловленных одним и тем же молекулярным повреждением. Обнаружена взаимосвязь некоторых мутаций и изменений в экспрессии генов митДНК с возникновением рака. В частности, неоднократно отмечалось при раке груди и лимфомах усиление транскрипции гена, кодирующего одну из цепей белкого комплекса, участвующего в снабжении клеток энергией (субъединицы II цитохром-с — оксидазы). Некоторые, к счастью, редкие, тяжелые наследственные болезни человека также обусловлены мутациями в отдельных генах митДНК. В России сейчас существует специальная программа диагностики и профилактики митохондриальных болезней.

Еще один удивительный факт, связанный с митДНК, касается ее наследования. Оказалось, что митДНК передается из поколения в поколение принципиально иначе, чем хромосомная ДНК. Организм человека развивается из оплодотворенной яйцеклетки, которая содержит хромосомы обоих родителей. При оплодотворении в яйцо проникает сперматозоид с набором отцовских хромосом, но практически без отцовских митохондрий и, следовательно, без какой-либо отцовской митДНК. Только яйцеклетка предоставляет зародышу свою митДНК. Это ведет к важным последствиям: митДНК передается только по женской линии. Мы все получаем митДНК только от своей матери, а она еще раньше от своей, и так далее в ряду только женских поколений. Сыновья в отличие от дочерей не передают свою митДНК — цепочка оборвется. Таким путем ДНК образуют клоны — наследственные линии, которые могут только разветвляться (если у женщины родилось несколько дочерей), но в отличие от хромосомной ДНК не могут объединяться в одном организме и создавать новые генетические комбинации. По этой причине было интересно провести сравнение митДНК у представителей различных человеческих этнических популяций, то есть рас и народностей. Такого рода сравнения были начаты еще в конце 80-х годов прошлого века и продолжаются до сих пор. Подробнее мы еще поговорим об этом далее.

Таким образом, такие базовые процессы в клетке, как транскрипция, трансляция, репликация и репарация митДНК, в значительной мере зависят от ядерного генома, но пока не до конца ясно, как эти два генома интегрированы друг с другом. Изучение механизмов межгеномного взаимодействия может стать полезным во многих отношениях, в частности для понимания интегральной картины различных патологий человека, включая и злокачественное перерождение клеток.

Данный текст является ознакомительным фрагментом.

Читать книгу целиком

Поделитесь на страничке

Следующая глава >

Отправить ответ

avatar
  Подписаться  
Уведомление о