DeepBind предсказывает, где связываются белки, выявляя мутации, вызывающие болезни

Старший научный сотрудник CIFAR Брендан Фрей (Университет Торонто) под руководством ведущих авторов Бабака Алипанахи и Эндрю Делонга разработал метод с использованием глубокого обучения — техники машинного обучения, впервые разработанной участниками CIFAR в области нейронных вычислений. Программа Adaptive Perception и сейчас используется такими компаниями, как Google и Facebook.Сотни тысяч белков в клетках человека присоединяются к ДНК и РНК и регулируют экспрессию генов. «Они главные контролеры ячейки», — говорит Алипанахи. Но многие из этих белков разборчивы в отношении последовательностей, с которыми они будут связываться.

DeepBind может анализировать зашумленные экспериментальные данные, чтобы определить последовательности ДНК и РНК, с которыми будет связываться набор белков. Затем он может посмотреть на новую последовательность и вычислить оценку, показывающую, насколько вероятно, что какой-либо из этих белков свяжется с ней.

Учитывая последовательность с мутацией, инструмент может анализировать, изменяется ли связывание. Мутации, которые добавляют или удаляют сайты связывания с белками, могут изменить характер экспрессии генов и привести к заболеванию.

Фрей, старший научный сотрудник программы генетических сетей и программы нейронных вычислений. В Adaptive Perception говорится: «DeepBind — это один из примеров серии технологий, которые мы разработали, объединив наши знания в области глубокого обучения и биологии генома. Я верю, что эти технологии произведут революцию в здравоохранении и точной медицине.

Они меняют правила игры».Группа Фрея уже более десяти лет разрабатывает прорывные методы машинного обучения для понимания генома. Буквально в прошлом году технологические лидеры таких компаний, как Facebook, Google и Deep Mind, согласились, что следующим «большим достижением» глубокого обучения станет его применение в здравоохранении и геномной медицине. Основываясь на своих успехах за последнее десятилетие, группа Фрея не могла с этим согласиться.

Первый анализ генетических данных человека DeepBind, описанный в Nature Biotechnology, уже предоставил новую информацию о нарушениях связывания белков при мутациях, связанных с раком, гемофилией и семейной гиперхолестеринемией — наследственным заболеванием, связанным с очень высоким уровнем холестерина. Система также показала, что генетическая мутация, приводящая к аномальному развитию коры головного мозга, может быть более сложной, чем считалось ранее. В частности, было обнаружено, что мутация, которая, как известно, удаляет один сайт связывания, фактически удаляет два сайта связывания одновременно.

DeepBind следует за революционной разработкой «человеческого кода сращивания» группой Фрея в сотрудничестве со старшими научными сотрудниками CIFAR Стивеном Шерером (Больница для больных детей и Университет Торонто) и Тимоти Хьюзом (Университет Торонто). Их система определила новые гены, которые могут быть причастны к расстройствам аутистического спектра, наследственному неполипозному раку толстой кишки и спинальной мышечной атрофии, путем выявления ошибок в сплайсинге генов. Поскольку многие белки регулируют сплайсинг, исследователи намерены использовать свои идеи DeepBind для улучшения человеческого кода сплайсинга. Новый инструмент существенно расширяет типы мутаций, которые они могут анализировать, до промоторов и энхансеров.

Фрей говорит, что на концепции DeepBind сильно повлияли сотрудники CIFAR, которые находятся в авангарде разработки технологий глубокого обучения. «CIFAR сыграл решающую роль в создании исследовательской сети, которая привела к нашим открытиям в области глубокого обучения и геномной медицины», — говорит Фрей.