Новый подход к секвенированию и сборке геномов приматов: технические достижения в чтении длинных последовательностей ДНК имеют разветвления в понимании эволюции приматов и болезней человека.

Геном западной низменной гориллы в настоящее время секвенирован и собран на высоком уровне качества, приближающемся к геному мыши и человека.Новая технология секвенирования, основанная на более длинных считываниях последовательностей, позволяет впервые обнаружить отсутствующие гены и отсутствующие формы генетической изменчивости. Это собрание предлагает новое биологическое понимание живого вида, который уступает только шимпанзе по своей эволюционной близости к человеку.В выпуске журнала Science от 1 апреля исследователи под руководством Эвана Эйхлера, профессора геномных наук Вашингтонского университета, объяснили, почему предыдущие сборки генома горилл и других млекопитающих были фрагментированными, неполными и потенциально вводящими в заблуждение:

Технологии массового параллельного секвенирования, увеличивая скорость, улучшая точность и снижая стоимость секвенирования генома, обычно производят только короткие отрезки последовательностей, называемые «считываниями». После секвенирования считанные данные собираются вместе с программным обеспечением для сборки генома.Программа пытается восстановить исходный геном, используя перекрытие между чтениями последовательностей. К сожалению, наличие длинной повторяющейся ДНК, которая является обычным явлением в геномах человека и других приматов, сбивает с толку программное обеспечение для сборки и заставляет его разбивать геном на очень маленькие фрагменты.

«Такие сборки могут быть похожи на швейцарский сыр, — сказал Эйхлер, — с большим количеством пропущенной биологической информации в пробелах». По его словам, оригинальный опубликованный геном западной низменной гориллы, созданный с использованием технологии короткого чтения, был разбит на более чем 400 000 частей.«Эти пробелы не случайны, они сгруппированы в местах повторов», — сказал он. «Если генетики не могут уловить эти повторы и определить структурные различия в геномах, у них возникнут проблемы с пониманием организации генов и сравнением генетических вариаций внутри и между видами».В его команду входили специалисты по биоинформатике из Университета штата Вашингтон Дэвид Гордон и Джон Хаддлстон, а также постдокторанты Марк Чейссон, Крис Хилл и Зев Кроненберг.

Исследовательская группа проанализировала ДНК в образце крови самки западной низменной гориллы из зоопарка Линкольн-Парк в Чикаго.Исследователи использовали технологию секвенирования Single Molecule, Real-Time (SMRT), инструменты сборки Falcon и QUIVER и другие методы для генерации длинных считываний последовательностей.

Их длина более чем в сто раз превышала длину самых популярных технологий последовательностей. Длинные чтения позволили им пройти через большинство повторяющихся областей генома гориллы во время сборки.В результате появился новый геном гориллы, который был больше и содержал гораздо меньше частей. Вместо 400 000 фрагментов сейчас всего 1800 штук.

Средний размер фрагментов генома был в 800 раз больше, и примерно 90 процентов всех пробелов в исходной сборке были закрыты.Исследователи заметили, что эта дополнительная информация о секвенировании значительно улучшила аннотацию генов этого вида горилл. Это также привело к открытию тысяч сегментов, кодирующих белки и пептиды, и новых регуляторных элементов, которые были пропущены как часть первой сборки генома.

Различия в том, как контролируются гены, или даже потеря или нарушение некоторых регуляторных элементов генов, может объяснить, почему человеческие предки эволюционировали так, чтобы так сильно отличаться от своих сородичей-великих обезьян.Ученые также обнаружили десятки тысяч новых структурных вариантов, таких как делеции или вставки ДНК, которые, вероятно, будут более важными, чем меньшие различия в одной паре оснований, которые были каталогизированы ранее. (Пары оснований — это два химических вещества, которые образуют ступеньку лестницы ДНК)«Моя мотивация в изучении геномов человека и больших обезьян, — сказал Эйхлер, — состоит в том, чтобы попытаться узнать, что движет нами как вид. Я хотел бы увидеть переделку геномов всех великих обезьян, включая шимпанзе и орангутанга. , чтобы получить исчерпывающее представление о генетических вариантах, которые отличают людей от человекообразных обезьян. Я считаю, что существует гораздо больше генетических вариаций, чем мы думали ранее.

Первый шаг — это найти ».Среди областей, в которых исследователи обнаружили интригующие различия между людьми и гориллами, находятся гены, связанные с сенсорным восприятием, выработкой кератина (кожного белка), регуляцией инсулина, иммунитетом, размножением и передачей клеточных сигналов.Новая сборка генома также дает новые ключи к разгадке эволюционной истории низменной гориллы.

Предыдущие исследования показали, что популяция горилл не так давно испытывала узкое место, но анализ с использованием нового генома показывает, что узкое место было более серьезным, чем считалось ранее.Паттерны генетической изменчивости в геноме горилл могут служить доказательством того, как болезни, изменение климата и деятельность человека влияют на популяции низинных горилл.

«Я думаю, что главная идея, — сказал Эйхлер, — заключается в том, что новая технология и сборка генома вернут нас туда, где мы должны были быть 10 лет назад».«Технология секвенирования и вычислительная биология, — писали Эйхлер и его команда в своей статье, — теперь достигли той стадии, когда отдельные лаборатории могут генерировать высококачественные геномы млекопитающих. Эта возможность обещает революционизировать наше понимание эволюции генома и биологии видов. . "Эйхлер добавил, что эти достижения, вероятно, также внесут большой вклад в исследования генетических основ болезней человека, особенно если таким образом будет секвенировано больше геномов человека.

«Как медицинские исследователи, если мы полагаемся только на короткие последовательности считывания, в нашей броне есть брешь. Работа с геномами горилл и других людей ясно демонстрирует, что большие участки генетических вариаций не могут быть поняты с помощью подходов короткого считывания последовательностей. «Долгое чтение» позволяет нам получить доступ к новым уровням генетической изменчивости, которые ранее были недоступны, недоступны », — сказал он.

Однако он добавил: «При уровне 80 000 долларов за штуку цена на клиническое секвенирование генома человека с использованием длинных считываний еще не подходящая на сегодняшний день. Учитывая несколько лет снижения затрат и дальнейшее развитие технологий, я готов поспорить, что это так мы будем секвенировать человеческие геномы, чтобы обнаруживать мутации, вызывающие болезни в будущем ».