Геномы латиноамериканцев указывают путь к скрытой ДНК

Математик Джулио Дженовезе, вычислительный биолог в области генетики в HMS и в Институте Броуда, работающий в лаборатории генетика Стивена МакКэрролла, доцента генетики HMS и директора генетики Центра психиатрических исследований Стэнли в Институте Броуда, нашел способ использовать геномы латиноамериканцев для интерполяции местоположения этих недостающих частей. Их результаты будут опубликованы в Американском журнале генетики человека 8 августа.«В природе полимераза, молекулярный механизм, который копирует ДНК в живых клетках, может секвенировать сотни миллионов пар оснований ДНК.

Разработанные нами методы секвенирования ДНК в лаборатории позволяют делать только относительно короткие сегменты, и нам необходимо «соедините эти части вместе после того, как факт», — сказал Дженовезе. «Итак, пока мы ждем, пока технология секвенирования догонит природу, мы хотели посмотреть, можем ли мы использовать математические шаблоны, чтобы найти место для некоторых недостающих частей».Используя геномы смешанных популяций — популяций, таких как латиноамериканцы и афроамериканцы, которые происходят от более чем одного континента — команда разработала сложный математический метод, который поможет заполнить неизведанные области на карте генома человека. Карта — это ключевой инструмент, который используют генетики для поиска генов болезней и выявления функциональных генетических вариаций, лежащих в основе человеческого разнообразия. Неотмеченная ДНК также иногда напоминает известные картированные гены, которые могут мешать попыткам изучения подобных последовательностей.

Исследователи заявили, что центромеры, наиболее известные как молекулярные шарниры, которые помогают делению хромосом, широко считаются структурными элементами, которые вряд ли несут в себе гены, кодирующие белок. По этой причине их открытие — что почти половина неотмеченных последовательностей, содержащихся в доступных геномных справочных библиотеках, включая многие гены, кодирующие белок, находятся в центромерах, — было неожиданным.Понимание разнообразия населения

Удивительно, но исследование также показало, что геномы латиноамериканцев являются уникально мощным ресурсом для составления карт генома человека. В ходе исследования был проведен поиск в 242 геномах латиноамериканцев из фазы 1 проекта «1000 геномов» на предмет последовательностей ДНК, которые еще не были обнаружены на эталонной карте генома человека.«На протяжении всей истории геномных исследований разные популяции делали генетические исследования уникальными из-за истории или структуры этой популяции», — сказал МакКэрролл.

Сила латиноамериканского генома для подхода Дженовезе проистекает из вклада африканских предков, которые есть у многих латиноамериканцев. Из-за долгой истории эволюции человека на континенте африканский геном богат генетическим разнообразием. Другие человеческие популяции произошли от подгрупп этого разнообразного населения, поскольку небольшие группы мигрировали по земному шару всего несколько десятков тысяч лет назад. (Иногда, однако, отсутствие разнообразия в популяции может быть преимуществом для исследователей. Есть островные популяции, которые позволили обнаружить рецессивные мутации, которые редки в большей части мира, но чаще встречаются на данном острове. .)«У латиноамериканского населения есть относительно особый дар.

Наличие недавнего африканского происхождения, но совсем небольшого, может дать особенно важную информацию о структуре человеческого генома во всех популяциях», — сказал МакКэрролл.Когда хромосомы рекомбинируют друг с другом в каждом поколении, они образуют относительно большие сегменты или куски.

В геномах латиноамериканцев, многие из которых ведут свое происхождение от европейцев, индейцев и африканцев, смешанные последовательности европейцев, индейцев и африканцев образуют мозаику из больших сегментов.Представленный как отдельные цвета, смешанный геном будет выглядеть как мозаика из больших красных, зеленых и синих плиток, а не как видеоэкран с крошечными пикселями разного цвета.

Дженовезе разработал алгоритм, который мог бы использовать близость отсутствующей последовательности к известным генетическим маркерам, чтобы точно определить, где на хромосоме подходят недостающие части — метод, впервые описанный в соответствующей статье в феврале, который локализовал меньшую выборку генов.Этот метод лучше всего работает, когда у людей есть немного африканской ДНК, потому что разнообразие африканских геномов обеспечивает большое количество генетических маркеров. Но Дженовезе обнаружил, что его метод наиболее эффективен, когда люди имеют лишь небольшую африканскую родословную, потому что этот генетический «сигнал» наиболее локализован в небольшом количестве областей в их геномах.

Поскольку отобранные геномы латиноамериканцев имели низкий уровень африканского происхождения (в среднем всего несколько процентов по сравнению с примерно 80 процентами у афроамериканцев), он был более эффективен для точного определения места на карте маркера.Белые пятна на карте, которые исследователи определили, были центромерами, единственными местами, где можно было спрятать недостающую ДНК.Новый подход к картографииДо этой работы ученые были склонны предполагать, что картирование оставшихся участков terra incognita в геноме человека потребует будущих улучшений в технологии секвенирования.

«Я думаю, что люди склонны предполагать, что кто-то изобрел некоторую технологию секвенирования, которая может волшебным образом считывать хромосомы последовательно от конца до конца», — сказал МакКэрролл. «Джулио подходит к проблеме как математик, и его любимая технология генома — это его собственный ум. Он увидел способ ответить на этот вопрос, используя данные, которые уже были перед нами, ища закономерности и взаимосвязи в данных вместо того, чтобы пытаться последовательность всего ".ДНК с высокой повторяемостью, составляющая большую часть центромер, особенно сложно секвенировать с помощью современных технологий.

Вместо того, чтобы пытаться пройти через все неизвестные области, исследователи использовали известную информацию по обе стороны промежутков, чтобы показать, что подходит посередине.Миллионы пар оснований последовательности, обнаруженные командой Дженовезе и МакКэрролла, будут добавлены в следующий выпуск эталонной сборки генома человека — «карты Google» генома человека, которые генетики используют каждый день, — обеспечивая более полное представление генома и как все части сочетаются друг с другом.