Обширная каталогизация человеческих белков обнаруживает 193 никогда не существовавших

В резюме этой работы, которое будет опубликовано 29 мая в журнале Nature, команда также сообщает об идентификации 193 новых белков, которые происходят из областей генома, которые, по прогнозам, не кодируют белки, предполагая, что геном человека более сложен, чем думал ранее. По словам руководителей группы, проект каталогизации, возглавляемый исследователями из Университета Джонса Хопкинса и Института биоинформатики в Бангалоре, Индия, должен стать важным ресурсом для биологических исследований и медицинской диагностики.

«Вы можете думать о человеческом теле как об огромной библиотеке, где каждый белок — это книга», — говорит Ахилеш Панди, доктор медицинских наук, профессор Института генетической медицины МакКусика-Натанса и биологической химии, патологии и онкологии. из Университета Джонса Хопкинса и основатель и директор Института биоинформатики. «Сложность в том, что у нас нет исчерпывающего каталога, который дает нам названия имеющихся книг и где их найти. Мы думаем, что теперь у нас есть хороший первый набросок этого всеобъемлющего каталога».

Хотя гены определяют многие характеристики организма, они делают это, предоставляя инструкции по созданию белков, строительных блоков и рабочих лошадок для клеток, а, следовательно, тканей и органов. По этой причине многие исследователи считают каталог белков человека — и их расположение в организме — даже более поучительным и полезным, чем каталог генов в геноме человека.

Пандей отмечает, что изучение белков намного сложнее с технической точки зрения, чем изучение генов, поскольку структуры и функции белков сложны и разнообразны. И простой список существующих белков не будет очень полезным без сопроводительной информации о том, где эти белки находятся в организме. Поэтому большинство исследований белка на сегодняшний день сосредоточено на отдельных тканях, часто в контексте конкретных заболеваний, добавляет он.

Чтобы добиться более полного обзора протеома, исследовательская группа начала с взятия образцов 30 тканей, извлечения их белков и использования ферментов, таких как химические ножницы, для разрезания их на более мелкие кусочки, называемые пептидами. Затем они пропустили пептиды через серию инструментов, предназначенных для определения их идентичности и измерения их относительного содержания.

«Создав исчерпывающий набор данных о человеческих белках, мы облегчили другим исследователям идентификацию белков в их экспериментах», — говорит Панди. «Мы считаем, что наши данные станут золотым стандартом в этой области, особенно потому, что все они были получены с использованием единых методов и анализа, а также на самых современных машинах».Среди белков, паттерны данных которых были охарактеризованы впервые, есть много, существование которых никогда не предсказывалось. (В геноме, в дополнение к последовательностям ДНК, кодирующим белки, есть участки ДНК, последовательности которых не соответствуют обычному образцу генов, кодирующих белок, и поэтому были отмечены как «некодирующие».) Наиболее неожиданным открытием группы стало то, что 193 Идентифицированные ими белки можно проследить до этих якобы некодирующих участков ДНК.

«Это была самая захватывающая часть нашего исследования, заключающаяся в обнаружении дополнительных сложностей в геноме», — говорит Панди. «Тот факт, что 193 белка произошли из последовательностей ДНК, которые, как было предсказано, не кодируют, означает, что мы не полностью понимаем, как клетки читают ДНК, потому что очевидно, что эти последовательности действительно кодируют белки».Панди считает, что протеом человека настолько обширен и сложен, что каталог исследователей никогда не будет полностью полным, но эта работа обеспечивает прочную основу, на которую другие могут надежно опираться.