За последнее десятилетие науки о жизни кардинально изменились, поскольку данные продолжают развиваться, становясь более крупными, взаимозависимыми и изначально основанными на Интернете. В этом контексте более широкое научно-исследовательское сообщество изо всех сил пытается спроектировать эти данные для Интернета, чтобы они были постоянно доступны, повторно использовались и могли быть атрибутированы.
В зависимости от конкретной задействованной базы данных идентификаторы могут обозначать ген, геном, химическое вещество, организм, набор экспериментальных данных или даже опубликованную статью.
Полезность всех этих элементов зависит от надежности и уникальности их соответствующих идентификаторов, что позволяет связывать их и обнаруживать на неограниченный срок. Авторы отмечают, что естественный способ возникновения большинства идентификаторов угрожает этой полезности, и признают, что трудно создавать и поддерживать постоянные идентификаторы или веб-адреса, которые не будут ломаться и которые используются последовательно.
Эта работа призывает профессионалов лучше выполнять работу по разработке идентификаторов — в соответствии с новыми соглашениями, разработанными сообществом, — чтобы данные можно было более эффективно использовать для научных открытий. Он также призывает пользователей быть осведомленными об этих соглашениях и доступных инструментах, чтобы не сгореть из-за неработающих ссылок и пропущенных соединений.
"Как и в случае с сантехникой, вопрос о том, как работают идентификаторы, должны понимать только те, кто их строит и обслуживает. Однако каждый должен знать, как следует использовать идентификаторы, и именно здесь важна условность », — сказал Макмерри. «Благодаря этой работе мы надеемся побудить всех участников научной экосистемы, включая авторов, создателей данных, интеграторов данных, издателей, разработчиков программного обеспечения и преобразователей, — придерживаться передовой практики, чтобы максимизировать полезность и влияние жизни. научные данные."