Арти Банг и Прити Реге из инженерного колледжа в Пуне, Индия, объясняют, что песни и крики птиц состоят из слогов, а каждый призыв и песня, уникальные для данного вида, состоят из группы слогов, которые, в свою очередь, состоят из слогов. элементы. Можно провести спектрографический анализ звука, но это трудоемко и требует специалистов, хорошо умеющих слышать звуки, издаваемые птицами.
В конечном итоге, однако, такой подход будет субъективным, когда дело доходит до различения птиц с очень похожими звуками и песнями.Команда предполагает, что автоматическое распознавание птиц, основанное на записи звуков, издаваемых птицами, является проблемой распознавания образов. Таким образом, они разработали автоматизированную систему, которая позволяет обойти проблемы, связанные с предыдущими попытками автоматизировать процесс, и основана на извлечении слогов из 10-миллисекундных аудиокадров.
Затем анализ основывается на методах, которые использовались для извлечения информации, такой как темп, тональность и жанр из музыкальных записей.Команда протестировала алгоритм, разработанный на основе исследования образцов песен и криков птиц из обширной и хорошо известной международной базы данных Xeno Canto.
Они провели предварительное тестирование системы с классификацией десяти видов птиц, обитающих в Индии, с использованием моделирования гауссовой смеси (GMM) и опорных векторных машин (SVM). Тот же подход можно в равной степени применить к видам, обитающим в любой точке мира.
Снижение избыточности в системе позволяет им снизить влияние фонового шума в любой аудиозаписи и, таким образом, еще больше повысить точность.
