
Одним из перспективных направлений развития биотоплива является биогаз, обладающий огромным потенциалом как возобновляемый и чистый источник энергии. Биогаз — это производство метана в результате анаэробного сбраживания (ферментации) органических веществ, таких как сельскохозяйственные или пищевые отходы.
Детальные знания о функционировании процесса ферментации являются ключом к оптимизации этого процесса; однако подавляющее большинство микробов остаются неизвестными и не могут культивироваться в лабораториях.
В новом исследовании, только что опубликованном в журнале открытого доступа GigaScience, исследователи из Университета Билефельда в Германии охарактеризовали сложные сообщества микроорганизмов в биогазовой установке, которая генерирует тепло и энергию из кукурузного силоса и свиного навоза. Кроме того, авторы предприняли необычный шаг, чтобы сделать свое исследование более воспроизводимым, создав виртуальный «контейнер» своих данных и инструментов.
Для своего исследования исследователи провели метагеномный и мета-транскриптомный анализ, в результате которого были получены последовательности ДНК и РНК из тысяч присутствующих видов микробов. На основе этого они смогли создать каталог из 250 000 генов, который позволил исследователям начать определение биологии, лежащей в основе производства метана. Хотя это производство данных лишь поверхностное представление огромного количества собранной информации, авторы повысили полезность этого ресурса, выпуская все данные и вычислительные методы в виде совместно используемого контейнера. Эти контейнеры позволяют другим, нажав всего несколько кнопок, выполнить тот же анализ в облаке.
Это не только делает исследования воспроизводимыми, но и позволяет исследователям во всем мире использовать эти ресурсы для более быстрого определения важных процессов, связанных с производством биогаза, и более точного изучения его использования для биотоплива.
По мере того, как эксперименты становятся все более емкими, анализ и публикация методов и результатов научных исследований становится все более сложной задачей.
Чтобы обойти это, авторы использовали быстро развивающуюся платформу Docker, которая эффективно объединяет программное обеспечение в систему, включающую все необходимое для его повторного запуска. Это устраняет необходимость для других исследователей устанавливать и поддерживать множество сложных инструментов биоинформатики и программных библиотек: что-то, что может быть технически сложной задачей для исследователей без вычислительных ресурсов и навыков.
«Мы решили использовать методы виртуализации, чтобы инкапсулировать рабочий процесс анализа и сделать его практически независимым от хоста, на котором он выполняется», — говорит Андреас Бремгес, первый автор исследования. Питер Бельманн построил контейнер Docker для исследования биогаза и является членом основной группы проекта биобоксов по стандартизации сменных контейнеров программного обеспечения для биоинформатики.
«Воспроизводимость опубликованных исследований — важный аспект науки», — подчеркивает Питер Ли, ведущий менеджер данных в GigaScience, который предпринял шаг по точному воспроизведению результатов в статье, что крайне необычно для любой другой научной публикации. "Андреас и его коллеги предоставили контейнер Docker, который инкапсулирует метод, используемый для обработки данных из их исследования биогаза. Это значительно упростило мою работу по проверке воспроизводимости их результатов, поскольку их контейнер Docker позаботился об установке инструментов биоинформатики и их зависимостей на моем облачном сервере."
Использование Docker в этой «контейнерной» публикации — это шаг к переходу от публикации статичных и часто невоспроизводимых документов, которые мало изменились с 17 века, к более воспроизводимым цифровым объектам, которые лучше подходят для технологий 21 века.
