Буквы в геноме человека несут инструкции по производству белков с помощью трехбуквенного кода. Каждое трио составляет «слово»; слова затем соединяются в предложение, чтобы построить определенный белок.
Если буква случайно вставлена или удалена из нашего генома, трехбуквенный код сдвигает метку, в результате чего все последующие слова будут написаны с ошибками. Эти мутации "сдвига рамки" приводят к тому, что белковое предложение становится непонятным. Потеря одного белка может иметь разрушительные последствия для клеток, приводя к дисфункции, а иногда и к серьезным заболеваниям.
Вставки и делеции ДНК различаются по длине и последовательности. Каждый индекс может иметь размер от одной буквы ДНК до тысячи, и они часто очень повторяются. Их изменчивость затрудняет идентификацию инделей, несмотря на значительные достижения в технологии секвенирования генома.
По сути, это области генома, которые оставались скрытыми от глаз, пока исследователи ищут мутации, вызывающие болезнь.Команда ученых CSHL, включая доцентов Майка Шаца, Голсона Лайона и Ивана Иосифова, а также профессора Майкла Виглера, разработала способ поиска существующих наборов геномных данных на предмет мутаций indel.
Метод, который они называют Скальпелем, начинается с объединения всех последовательностей из заданной области генома. Скальпель — компьютерная формула или алгоритм — затем создает новое выравнивание последовательности для этой области, что очень похоже на сборку частей головоломки.
«Эти отступы похожи на очень мелкие разрезы в геноме — места, куда вставляется или удаляется ДНК — и Скальпель предоставляет нам вычислительную линзу, чтобы увеличить масштаб и точно увидеть, где именно происходят разрезы», — говорит Шац, количественный биолог. Такая информация имеет решающее значение для понимания мутаций, вызывающих заболевание. В работе, опубликованной сегодня в Nature Methods, команда использовала Скальпель для поиска инделей в образцах пациентов.
Лайон, исследователь CSHL, который также является практикующим психиатром, работал со своей командой над анализом пациента с тяжелым синдромом Туретта и обсессивно-компульсивным расстройством, выявляя и проверяя более тысячи инделей, чтобы продемонстрировать точность метода.Команда CSHL провела аналогичный анализ для поиска инделов, связанных с аутизмом.
Они исследовали набор данных из 593 семей из коллекции Simons Simplex Collection, группы, полностью состоящей из семей с одним больным ребенком, но без других членов семьи с этим расстройством. Хотя исследователи обнаружили в общей сложности 3,3 миллиона инделей в 593 семьях, большинство из них оказались относительно безвредными. Тем не менее, несколько десятков мутаций были специально связаны с аутизмом. «Все это дополняет наши знания о спонтанных мутациях, вызывающих аутизм», — говорит Шац.Но этот инструмент можно применять гораздо шире. «Мы сотрудничаем с учеными-растениями, биологами-онкологами и другими в поисках инделей», — говорит Шац. «Это мощный инструмент, и мы с нетерпением ждем возможности раскрыть новые фрагменты генома, которые имеют значение на всем древе жизни».
Эта работа была поддержана Национальным институтом здравоохранения США, Национальным научным фондом США, Грантом поддержки онкологического центра CSHL, Институтом когнитивной геномики Стэнли и Фондом Саймонса.
