Чтобы решить эту проблему, ученые из Университета Данди, Европейского института биоинформатики (EMBL-EBI), Университета Бристоля и Кембриджского университета запустили прототип репозитория для данных изображений: ресурс данных изображений (IDR). Этот бесплатный ресурс, описанный в Nature Methods, является первым хранилищем общих биологических изображений, в котором хранятся и интегрируются данные из разных модальностей и лабораторий.IDR также показывает потенциальное влияние совместного использования и повторного использования данных изображений для наук о жизни.Объединение ресурсов«Получение изображений действительно изменит науку только в том случае, если мы сделаем данные общедоступными», — объясняет Алвис Бразма, ведущий автор и старший научный сотрудник EMBL-EBI. «Ученые должны иметь возможность запрашивать существующие данные для выявления общих черт и закономерностей.
Но для того, чтобы это стало возможным, нам нужна надежная платформа, на которой исследователи могут загружать свои данные изображений и легко получать доступ к данным из других экспериментов. Ресурс данных изображений является первым шагом на пути к созданию репозиторий публичных изображений для наук о жизни ".Во всем мире существует множество ресурсов, в которых люди публикуют данные изображений, но ни один из этих репозиториев не является одновременно общим и связан с другими соответствующими биомолекулярными данными. Это означает, что, несмотря на все усилия, которые прилагаются к ним, сложно повторно использовать эти наборы данных в новых исследованиях.
Есть много причин, по которым совместное использование данных изображений было настолько трудным до сих пор — в первую очередь неоднородность и сложность данных изображений, но также критическая масса опыта в области хранения, вычислений и курирования.«Данные изображений — это большой объем данных, да, но настоящая проблема заключается в том, что они неоднородны и многомерны», — говорит Джейсон Сведлоу, старший автор исследования и профессор количественной клеточной биологии в Университете Данди. «Обработка, хранение и анализ данных изображений требуют значительных усилий и вычислительной мощности.
Создание прототипа IDR стало возможным только благодаря тесному сотрудничеству между несколькими научными организациями».Хорошая картинка — но что это значит?IDR содержит широкий спектр данных визуализации, включая скрининг высокого содержания, микроскопию сверхвысокого разрешения, покадровую съемку и цифровую визуализацию патологии. Но не только разнообразие типов данных делает ресурс уникальным; это дополнительная информация, которая создает добавленную стоимость.
«IDR не просто показывает вам изображение или видео ячейки. Он также сообщает вам, о чем это изображение, где оно было снято, кем и какие выводы можно сделать из него», — продолжает Бразма.
Новый ресурс объединяет данные изображений с молекулярными и фенотипическими данными. IDR включает информацию об экспериментальных протоколах: параметры, анализы и эффекты, которые ученые наблюдали в клетках и функциях, например. Это позволяет пользователям анализировать генные сети — потенциально выявляя ранее неизвестные взаимодействия — в масштабе, недоступном для отдельных исследований.
Это требует ошеломляющего объема хранилища и вычислительной мощности. Коллаборация IDR смогла успешно запустить свой проект благодаря ресурсу Embassy Cloud и поддержке EMBL-EBI.
Репозиторий данных изображенийПрототип общедоступного репозитория изображений содержит широкий спектр данных, в том числе:Скрининг с высоким содержаниемМикроскопия сверхвысокого разрешения
Покадровая съемкаЦифровая визуализация патологииМетаданные экспериментального протоколаНаблюдаемые эффекты в клетках и особенностях
Перекрестные ссылки с молекулярными архивамиДемонстрация успеха
Группа Сведлоу в Данди и группа Карасо Саласа из Бристольского университета использовали IDR, чтобы проиллюстрировать, как общие данные изображений могут раздвинуть границы исследований. Используя данные, хранящиеся в IDR, они идентифицировали гены из различных исследований, которые при мутации или удалении заставляли клетки удлиняться и растягиваться. Они собрали информацию из нескольких различных исследований и построили генную сеть, которая дает четкое представление о том, как эти гены влияют на форму клеток — важное свойство, которое следует учитывать при метастатическом раке."Расширение общедоступных архивов за счет включения изображений представляет огромный интерес для биотехнологической промышленности и компаний, занимающихся разработкой лекарств.
Это дает возможность определять новые методы лечения и цели, а также расширяет масштабы исследований, позволяя ученым со всего мира получать доступ к наборам данных изображений друг друга, "добавляет Сведлоу.«Технологии биоимиджинга в настоящее время революционизируют науку о жизни. Совместное использование быстро растущего объема данных изображений является ключом к проведению новаторских исследований в будущем», — говорит Ян Элленберг, руководитель отдела клеточной биологии и биофизики EMBL и координатор Euro-BioImaging. -Европейская инфраструктура для технологий обработки изображений. «По этой причине архивирование и совместное использование данных изображений является высоким приоритетом для EMBL, а также для будущих сервисов общих данных Euro-BioImaging, которые могут основываться на пилотном примере IDR».Следующие шаги
Пока что сотрудники доказали, что IDR возможен и полезен. Следующим шагом является обеспечение поддержки и инвестиций, необходимых для преобразования прототипа в готовую к производству инфраструктуру обработки изображений.Программное обеспечение и технология IDR имеют открытый исходный код, поэтому к ним можно получить доступ и встроить их в другие системы публикации данных изображений.
Это способствует и расширяет публикацию и повторный анализ научных данных.
