Новый метод помогает картировать генетическое наследие видов

Эти вопросы кажутся простыми, но на самом деле генетикам сложно ответить. Новый сложный статистический метод, разработанный исследователями из Университета Иллинойса и Университета Техаса в Остине, может помочь исследователям построить более точные деревья видов, детализирующие происхождение генов и взаимосвязи между видами.Этот метод, называемый статистическим биннингом, использовался в проекте «Филогенетика птиц», который стал предметом специального выпуска журнала Science от 12 декабря.«Дерево видов — это способ описания того, как вид произошел от общего предка», — сказала руководитель исследования Тэнди Варноу, профессор-основатель биоинженерии и информатики в Университете Иллинойса. «Исследователи используют дерево видов, чтобы делать самые разные вещи, например, выяснять, когда возникли различные черты, и что спровоцировало их эволюцию, и как эти вещи могли или не могли быть вызваны изменениями окружающей среды».

По словам Варноу, существует два основных подхода к построению дерева видов на основе геномных данных. Один метод, который преобладал на протяжении десятилетий, объединяет все данные генов в одну гигантскую матрицу и анализирует ее, чтобы составить карту общего дерева видов.

Это называется конкатенацией. Сложность этого подхода заключается в том, что отдельные гены часто имеют разные клоны, которые могут сильно отличаться друг от друга и от дерева видов в целом.Второй подход, основанный на коалесценции, рассматривает данные для каждого гена и оценивает деревья генов для каждого признака.

Затем он объединяет все деревья вместе, чтобы создать общее дерево видов. Хотя этот подход является обоснованным теоретически и статистически, на практике он работает не так хорошо, как ожидалось.«Мы поняли, что объединенные генные деревья содержат ошибки», — сказал Варнов. «Когда генные деревья содержат ошибки, тогда, когда вы объединяете их, вы получаете плохую оценку дерева видов.

Итак, нам нужно было получить лучшие генные деревья, и вопрос в том, как нам это сделать?»Статистическое объединение в группы берет все данные о генах и использует методы статистической оптимизации для сортировки генов по наборам или «ячейкам». У генов в каждом бункере есть деревья, которые, кажется, не имеют статистически значимых различий. Данные для каждого бина объединяются в «супергенное» дерево, а затем супергенные деревья объединяются в общее дерево видов.

«Вы можете думать о статистическом биннинге как о сочетании лучших свойств двух доминирующих подходов», — сказал Сиаваш Мирараб, аспирант Техасского университета в Остине и первый автор статьи, в которой подробно описан метод статистического биннинга. "Без этого метода людям приходилось выбрасывать данные, которые им не нравились. Такой подход позволяет вам использовать все имеющиеся у вас данные, и вам не нужно ничего выбрасывать. У нас есть метод, который позволяет добиться этого с помощью группировать вещи таким образом, чтобы они имели смысл статистически ".Исследователи сравнили деревья видов, полученные с использованием метода объединения со статистическим объединением, с деревьями, полученными только объединением или объединением для нескольких биологических классов, таких как птицы, млекопитающие, дрожжи и другие.

Они обнаружили, что добавление процесса статистического биннинга к конвейеру дает деревья видов, которые лучше, чем деревья, полученные любым из традиционных методов.«Мы сортируем генные данные сложным статистическим способом, но, сделав это, мы получаем более качественные деревья», — сказал Варнов. «Результатом является значительно улучшенная оценка деревьев генов, которая дала нам более точные оценки дерева видов и длины ветвей, что помогает вам выяснить, когда что-то произошло. Все было намного точнее».Статистическое объединение позволило Проекту птичьей филогенетики проанализировать более 14 000 генов — один из крупнейших подобных проектов, опубликованных на данный момент, — и построить большое дерево, связывающее множество различных видов птиц.

Оказывается, фламинго более близок к голубю.Варнов и Мирараб планируют продолжить совершенствование метода статистического биннинга и надеются, что он может повысить точность многих других подобных исследований.

«В исследовательском сообществе есть большие разногласия относительно того, следует ли использовать конкатенацию объединенного анализа. Мы поняли, почему метод объединения не дает хороших результатов, и придумали способ улучшить ввод, чтобы он мог иметь хорошие результаты.

Это способ привести эти два очень разделенных сообщества к большему соглашению друг с другом », — сказал Варнов.