Подробная информация об исследовании опубликована на сайте Nature Biotechnology.«Способность технологий секвенирования следующего поколения производить сотни миллионов коротких считываний последовательностей ДНК была невероятным благом для биомедицинских исследователей», — сказал доктор Деккер, содиректор Программы системной биологии, профессор биохимии и молекулярной биологии. фармакология в UMMS и старший автор исследования. «По мере того, как эти последовательности ДНК становятся все короче и короче, сборка полных геномов становится все более сложной задачей. После 20 лет интенсивных усилий даже в геноме человека все еще есть пробелы.
«Используя трехмерную структуру генома в качестве руководства, мы показали, что эти фрагменты последовательностей ДНК могут быть собраны быстро, дешево и более точно, чем позволяют существующие методологии. Этот элегантный и мощный метод позволит нам завершить создание человеческого геном, собрать геномы любых других видов и ускорить новые генетические открытия ».В последнее десятилетие, когда стоимость высокопроизводительного секвенирования ДНК упала до нескольких тысяч долларов, секвенирование новых геномов стало почти рутинным. Методы секвенирования нового поколения позволяют легко считывать сотни миллионов последовательностей ДНК за раз.
Однако эти последовательности случайным образом разбиваются на очень короткие части и должны быть собраны в более крупные части с использованием компьютерных алгоритмов, которые могут сопоставить перекрывающиеся части. Конечным результатом этой начальной сборки обычно является набор из 100 000 фрагментов ДНК, которые затем необходимо организовать относительно друг друга в правильном порядке для создания полного генома.Этой последней задаче мешает тот факт, что геномы полны очень повторяющихся последовательностей, которые появляются во множестве мест. Найти, где именно среди тысяч возможных местоположений находится конкретный фрагмент ДНК, — непростая задача.
Чтобы завершить этот второй шаг, который часто называют каркасом генома, ученые полагаются на трудоемкие, малоэффективные экспериментальные методы для построения достаточно точных полных геномов.«Как собрать эти фрагменты ДНК стало узким местом для исследователей, на решение которого могут уйти недели или месяцы», — сказал Ноам Каплан, доктор философии, научный сотрудник лаборатории Деккера и первый автор исследования Nature Biotechnology.
Решая эту проблему, Деккер и Каплан рассматривали трехмерную структуру генома как руководство для сборки линейных последовательностей ДНК. Используя технологию Hi-C, разработанную лабораторией Dekker, они измерили, как часто каждый фрагмент ДНК в геноме взаимодействует с другими.
Последовательности ДНК, расположенные рядом друг с другом в трехмерном геноме, имеют тенденцию взаимодействовать чаще, в то время как последовательности ДНК, расположенные дальше друг от друга, взаимодействуют реже. Затем используются вычислительные методы для математического определения линейного геномного положения каждого фрагмента в геноме на основе данных частоты трехмерного взаимодействия, соответствующих этой последовательности.Например, сказал Каплан, последовательность может умещаться в одномерном линейном геноме в нескольких местах. Но, используя данные о частоте взаимодействия, можно определить взаимосвязь, которую она имеет с другими последовательностями, и находится ли она близко к этим последовательностям или далеко от них. «Таким образом, хотя конкретная последовательность может уместиться во многих местах линейного генома, мы можем определить, является ли конкретная последовательность лучше, трехмерно, в одном месте по сравнению с другим, на основе этих данных взаимодействия», — сказал доктор Каплан.
С помощью этого нового подхода Каплан и Деккер смогли предсказать положения 65 ранее не локализованных фрагментов.«Мы были удивлены, насколько хорошо работает наш метод, — сказал Каплан. «Приятно видеть, как простая идея может решить такую сложную и распространенную проблему».
Деккер добавил: «Этот новый подход к сборке генома может помочь производить геномные последовательности более высокого качества быстрее и проще, чем существующие методы. Будет особенно интересно применить этот метод для выявления хромосомных аберраций, которые являются признаком рака».
