Редко бывает музыкальный исполнитель, которого называют бросающим вызов жанрам. Большинство певцов и музыкантов склонны придерживаться определенного жанра, будь то электронная танцевальная музыка, регги, классика, фолк, джаз, рок или индийские жанры, такие как Bhangra и Ghazal, или любой из сотен других категорий.
Слушатели могут отнести любую песню к одному из нескольких десятков жанров, с которыми они знакомы, в то время как преданные поклонники определенного жанра могут хорошо различать десятки поджанров в каждой классификации. В век цифрового распространения и архивирования музыки и музыкальных рекомендательных систем имеет смысл найти способ автоматизировать процесс категоризации жанров.Теперь исследователи из Индии разработали простую систему, которая вместо того, чтобы пытаться количественно оценить множество различных параметров — темп, пульс, громкость, мелодию, ритм, тембр и т. Д. — фокусируется только на высоте тона, темпа, паттерне изменения амплитуды и периодичности по порядку. пометить данную песню как принадлежащую определенному жанру.
Их подход использует консенсус случайной выборки (RANSAC) в качестве классификатора.В подходе команды их система разбивает звуковой сигнал на 88 частотных диапазонов, делит каждый поддиапазон на короткие кадры и для каждого кадра вычисляет кратковременную среднеквадратичную мощность (STMSP) и средний STMSP. , это дает метрику для шага.
Команда демонстрирует, что для семи основных музыкальных жанров этот показатель очень разный. Однако, чтобы быть более точными, они также измеряют ритм или темп песни, что является важным описанием восприятия, по существу не зависящим от мелодии. Темп можно извлечь из звукового файла с помощью математического процесса, известного как преобразование Фурье, которое дает метрику в ударах в минуту (BPM).
Высота и темп могут помочь определиться с жанром, но часто они накладываются друг на друга. Например, эти характеристики часто сходны в северо-индийской бхангра и западной рок-музыке. Таким образом, еще один показатель — вариация амплитуды — также добавлен к смеси. Кроме того, команда также использует периодичность на основе корреляции.
Это еще одна особенность восприятия, которая фиксирует повторы в данном сигнале.Теперь команда проверила свою систему идентификации жанров по сравнению с более ранними моделями других исследователей в базе данных песен, а затем сравнила ее с ручной категоризацией.
Их результаты показывают, что их система «существенно лучше», и ее можно легко включить в музыкальную базу данных или в онлайн-сервис музыкальных рекомендаций.
