По следу метаболита: специалисты по биоинформатике делают самую эффективную поисковую систему для молекулярных структур доступной в Интернете

Этот процесс очень сложен и редко приводит к убедительным результатам. Однако работа ученых всего мира, которые занимаются подобного рода фундаментальными исследованиями, теперь значительно упростилась: команда биоинформатиков во главе с профессором Бокером из Йены вместе со своими сотрудниками из Университета Аалто в Эспоо, Финляндия , разработали поисковую систему, которая значительно упрощает идентификацию молекулярных структур метаболитов. В недавно опубликованном выпуске известного научного журнала Proceedings of the National Academy of Sciences of the United States of America (PNAS) они представляют свою поисковую систему «CSI: FingerID».В этом случае CSI означает идентификацию структуры соединения и основан на сочетании различных методов.

Для начала образцы метаболитов, подлежащие анализу, подвергаются так называемой тандемной масс-спектрометрии. «На этом этапе молекулы разбираются на более мелкие фрагменты и определяется их молекулярный вес», — объясняет Бокер. Полученные спектры дают информацию о химическом составе метаболитов, но этой информации еще недостаточно, чтобы делать выводы о молекулярной структуре. Здесь в игру вступает недавно разработанная поисковая система. Он работает аналогично поисковой системе в Интернете, но вместо поиска по ключевым словам инструмент ищет молекулярную информацию, которая переводит данный спектр масс в структурную формулу.

После того, как спектр масс был отправлен в поисковую систему, «CSI: FingerID» просматривает ряд онлайн-баз данных о молекулярной структуре, где ученые всего мира публикуют информацию и структурные формулы как недавно открытых, так и давно известных метаболитов. Один поиск CSI: FingerID приводит к списку возможных структур-кандидатов, которые лучше всего соответствуют спектру.Уменьшите количество возможных соединений«После получения списка возможных кандидатов мы все еще не знаем с абсолютной уверенностью, с каким метаболитом имеем дело. Но когда мы можем сократить количество возможных соединений с нескольких тысяч до, возможно, десяти, тогда это огромный прогресс», — говорит Бокер. «Поскольку точные лабораторные тесты для определения соединений могут быть дорогостоящими и трудоемкими, поэтому различить тысячи возможных вариантов обычно невозможно — но часто возможно тестирование всего десяти соединений».

И поскольку соответствующие базы данных также постоянно растут — в среднем десять записей добавляются в минуту во всем мире, — результаты поиска становятся все более точными.Биоинформатики показывают в этом новом исследовании, что они получают значительно более высокий коэффициент попадания с помощью своего метода, чем любой другой метод, который использовался до сих пор. С этой целью они проверили свою поисковую систему с более чем 6000 тестируемых веществ.

Помимо использования самих CSI: FingerID для анализа встречающихся в природе метаболитов, профессор Бокер и его команда в Йене сделали поисковую систему бесплатно доступной для международного научного сообщества.