Новый метод, разработанный командой и описанный в журнале Science, выявил эти варианты в недостаточно изученных областях ДНК, которые не кодируют белки, а вместо этого влияют на активность других генов. По мере того, как становится доступным еще больше полных последовательностей генома, этот подход можно применять для поиска любого потенциально вызывающего заболевание варианта в некодирующих областях генома.Теперь исследователи могут идентифицировать участки ДНК внутри некодирующей ДНК, основной части генома, которая не транслируется в белок, где мутации могут вызывать такие заболевания, как рак.Их подход выявляет множество потенциальных генетических вариантов в некодирующей ДНК, которые вызывают развитие множества различных видов рака.
Этот подход имеет большой потенциал для поиска других вариантов, вызывающих болезнь.В отличие от кодирующей области генома, в которой находятся 23000 наших генов, кодирующих белок, некодирующая область, составляющая 98% нашего генома, плохо изучена. Недавние исследования подчеркнули биологическую ценность некодирующих участков, ранее считавшихся «мусорной» ДНК, в регуляции белков. Эта новая информация предоставляет исследователям отправную точку для просеивания некодирующих областей и выявления наиболее функционально важных областей.
«Наша методика позволяет ученым сосредоточиться на наиболее функционально важных частях некодирующих областей генома», — говорит профессор Марк Герштейн, старший автор из Йельского университета. «Это не только полезно для исследований рака, но может быть распространено и на другие генетические заболевания».Команда использовала полный набор генетических вариантов из первой фазы проекта «1000 геномов», вместе с информацией о некодирующих регионах, созданных в рамках проекта ENCODE, и определила регионы, в которых не накопилось много вариаций.
Гены, кодирующие белок, играют решающую роль в выживании и приспособленности человека и подвергаются сильному «очищающему» отбору, который устраняет вариации. Команда обнаружила, что некоторые некодирующие участки ДНК демонстрируют почти такой же низкий уровень вариации, как и гены, кодирующие белок, и назвали эти участки «сверхчувствительными».
В сверхчувствительных областях они рассматривали отдельные отдельные буквы ДНК, которые при изменении вызывали наибольшие нарушения в генетической области. Если эта некодирующая сверхчувствительная область является центральной для сети из многих родственных генов, вариации могут вызвать больший эффект цепной реакции, приводящий к болезни.
Они объединили всю эту информацию для разработки компьютерного рабочего процесса, известного как FunSeq. Эта система отдает приоритет генетическим вариантам в некодирующих регионах на основе их прогнозируемого воздействия на заболевание человека.«Наш метод — практичный и успешный способ скрининга очищающей селекции в некодирующих областях генома с использованием свободно доступных данных, таких как данные из проектов ENCODE и 1000 Genomes», — говорит д-р Яли Сюэ, автор из Wellcome Trust Sanger Institute. . «Это действительно показывает ценность этих крупномасштабных наборов данных открытого доступа».Команда применила FunSeq к 90 раковым геномам, включая рак груди, рак простаты и опухоли головного мозга, и обнаружила почти 100 потенциальных некодирующих вариантов, вызывающих рак.
Например, в геномах рака груди они обнаружили единственное изменение буквы ДНК, которое, по-видимому, оказывает большое влияние на развитие рака груди. Это изменение одной буквы происходит в сверхчувствительной области, которая является центральной для сети из многих связанных генов.
«Хотя мы видим, что первое эффективное использование нашего инструмента — это раковые геномы, этот метод можно применить для поиска любого потенциально вызывающего заболевание варианта в некодирующих областях генома», — говорит доктор Крис Тайлер-Смит, ведущий автор. из института Wellcome Trust Sanger. «Мы воодушевлены огромным потенциалом этого метода для поиска новых болезнетворных, а также полезных вариантов в этих важных, но неизученных областях нашего генома».

