В конце марта 2022 года группа исследователей из более чем двух десятков исследовательских институтов объявила о прорыве в 30-летней работе по созданию высококачественной последовательности генома человека. Хотя первый черновик проекта «Геном человека» был подготовлен еще 20 лет назад, почти 8% ДНК человека оставались загадками. На данный момент расшифрована почти каждая часть генома, кроме Y-хромосомы. Недавно нанесенные на карту области дадут генетикам окно в участки генома, которые были когда-то описаны как «мусорная» ДНК (или некодирующая). В настоящее время считается, что эти области имеют фундаментальное значение для эволюции, роста эмбрионов и способов репликации и гибели клеток. «Мы обнаружили, что эти вещи намного разнообразнее, чем мы когда-либо могли себе представить», — поясняет сравнительный биолог из Университета Коннектикута и соавтор этой последовательности Рэйчел О’Нил. Предыдущие результаты были «подобны изучению культуры, музыки и языка на всей планете, игнорируя Африку». Участки генома оставались загадкой для ученых, потому что они состоят из сложных повторяющихся последовательностей ДНК. Исследуемые области генетического материала могут состоять из последовательности длиной в тысячу букв, которая повторяется тысячи раз. «Они развились путем повторения», — сказал в интервью журналу Popular Science вычислительный биолог из Калифорнийского университета Бенедикт Патен. Чрезмерное повторение делало секвенирование (определение аминокислотной или нуклеотидной последовательности) особенно хлопотным. Несмотря на то, что генетическое секвенирование стало намного быстрее и дешевле, чем два десятилетия назад, когда геном человека был впервые реконструирован, в настоящее время наиболее распространенной технологией является считывание коротких фрагментов генома. Эти фрагменты собираются в полную картину путем сопоставления перекрывающихся последовательностей ДНК. Собирать воедино повторяющиеся фрагменты немного похоже на сборку пазла со стадом зебр. Исследователям пришлось разработать инструменты для чтения чрезвычайно длинных нитей ДНК и закодировать новые алгоритмы, чтобы окончательно завершить картину. Исторически сложилось так, что генетики описывали большие участки генома, включая недавно секвенированные области, как «мусор». Подавляющее большинство генетических исследований сосредоточено на генах — сравнительно крошечных участках ДНК, которые транскрибируются в РНК, а затем транслируются в белки. «Мусорная» ДНК, которая составляет 98% всего генома, не переводится в функциональные белки. Но за последние два десятилетия биологи осознали, что информация, содержащаяся в этом «мусоре», лежит в основе жизни, какой мы ее знаем. Как выразилась Рэйчел О’Нил, мусор для одного человека — сокровище для другого. Геном человека состоит из 46 хромосом, Х-образных «библиотек» запутанных ДНК. Новая последовательность затронула три части этих хромосом: теломеры — «концевые заглушки» хромосом, которые предотвращают стирание ДНК; центромеры — плотные узлы ДНК в середине каждой хромосомы, которые имеют решающее значение для репликации ДНК; и ДНК в «плечах» хромосом, которые используются для создания белковых фабрик, называемых рибосомами. Хотя эта ДНК не производит белков, она может производить РНК. РНК обычно считают чистым носителем информации, но она также способна быть активным участником жизни клетки, прикрепляясь к другим молекулам и способствуя химическим реакциям. (Вот почему некоторые биологи-эволюционисты считают, что самые ранние организмы полностью состояли из РНК, которая содержала бы как схему, так и инструменты для репликации.) В центромерах РНК помогает сцеплять хромосомы по мере их репликации. Без РНК весь геном распадается. ДНК в теломерах производит повторяющиеся цепочки РНК, которые удерживают концы вместе и, по-видимому, играют роль в процессе клеточного старения, связывая теломеры вместе по мере их износа. ДНК, управляющая строительством рибосомы (рДНК), может играть столь же важную роль. В школьных учебниках по биологии рибосомы обычно описываются как глупые механизмы, считывающие РНК и выделяющие белки. Но, как объясняет генетик из Стэнфордского университета Мария Барна (не участвовавшая в разработке новой последовательности), разные рибосомы, вероятно, выполняют немного разные функции. Ключом ко всему снова является РНК. В структуру фабрики вплетены четыре «вида» рибосомных РНК, кодируемых рДНК. Различные участки рДНК производят немного разные подвиды. «То, что прямо сейчас видно из полученных данных о теломерах, говорит нам, что существует огромное разнообразие рДНК, — поясняет Барна. — Почти 25% рДНК могут быть изменчивым». Однако не все эти варианты на самом деле превратятся в рибосомы. Но разнообразие может играть роль во всем: от предоставления нейронам сверхточных рибосом для построения специализированных белков до обеспечения роста опухоли. Мария Барна также заявляет, что теперь у ученых есть первоначальный каталог возможностей этих вариантов, которые, в свою очередь, могут быть применены к нормальной клеточной дифференцировке, а также к болезненным состояниям. Вероятно, имеет значение структура повторяющихся последовательностей. Повторы в состоянии развиваться чрезвычайно быстро, перескакивая с хромосомы на хромосому или перемещая целые гены. И даже у близкородственных организмов могут быть чрезвычайно разные центромеры и теломеры, что говорит о их роли в появлении новых видов. «Это парадокс, — объясняет Рэйчел О’Нил. — Одна из наиболее консервативных функций также является одной из самых дивергентных частей хромосомы». Открытый вопрос заключается в том, как такие фундаментальные части всей биологии могут быть настолько гибкими. По материалам статьи «What we might learn about embryos and evolution from the most complete human genome map yet» Popular Science