
Время имеет значение для структуры человеческой речи. Например, фонемы — это самая короткая, самая базовая единица речи и длятся в среднем от 30 до 60 миллисекунд.
Для сравнения, слоги занимают больше времени: от 200 до 300 миллисекунд. Большинство целых слов еще длиннее.
Чтобы понимать речь, мозгу нужно как-то интегрировать эту быстро развивающуюся информацию.
По словам соавтора исследования Тобиаса Оверата, слуховая система, как и другие сенсорные системы, вероятно, использует кратчайшие пути, чтобы справиться с натиском информации — например, путем выборки информации фрагментами, аналогичными длине среднего согласного или слога. доцент кафедры психологии и нейробиологии в Duke. Другой автор-корреспондент — Джош Макдермотт из Массачусетского технологического института.
В исследовании, опубликованном 18 мая в журнале Nature Neuroscience, Оверат и его сотрудники разрезали записи иностранной речи на короткие фрагменты длиной от 30 до 960 миллисекунд, а затем собрали фрагменты, используя новый алгоритм для создания новых звуков, которые авторы называют ‘лоскутные одеяла’.
Чем короче фрагменты результирующих речевых лоскутов, тем сильнее нарушалась исходная структура речи.
Чтобы измерить активность нейронов в режиме реального времени, ученые разыграли речевые лоскутные одеяла для изучения участников, сканируя их мозг на функциональном аппарате магнитно-резонансной томографии. Команда предположила, что области мозга, участвующие в обработке речи, будут более активно реагировать на речевые лоскутные одеяла, состоящие из более длинных сегментов.
Действительно, область мозга, называемая верхней височной бороздой (STS), стала очень активной во время лоскутных одеял продолжительностью 480 и 960 миллисекунд по сравнению с лоскутными одеялами продолжительностью 30 миллисекунд.
Напротив, другие области мозга, участвующие в обработке звука, не изменили свою реакцию в результате различий в звуковых квилтах.
"Это было довольно интересно. Мы знали, что находимся в чем-то ", — сказал Оверат, член Duke Institute for Brain Sciences
Известно, что верхняя височная борозда объединяет слуховую и другую сенсорную информацию. Но никто не показал, что СТС чувствительна к временным структурам речи.
Чтобы исключить другие объяснения активации STS, исследователи протестировали множество управляющих звуков, которые они создали для имитации речи. Один из созданных ими синтетических звуков имел частоту речи, но не имел ритмов. Другой удалил всю высоту из речи. Третья использовала звуки окружающей среды.
Они стегали каждый из этих контрольных стимулов, измельчая их на 30- или 960-миллисекундные части и сшивая их вместе, прежде чем воспроизводить их участникам. Похоже, что STS не реагировал на манипуляции с квилтингом, когда его применяли к этим контрольным звукам.
«Мы действительно сделали все возможное, чтобы убедиться, что эффект, который мы наблюдаем в STS, был вызван обработкой речи, а не каким-либо другим объяснением, например, высотой звука или естественным звуком, в отличие от некоторых компьютерный звук ", — сказал Оверат.
Группа планирует изучить, похож ли ответ в STS для иностранной речи, которая фонетически сильно отличается от английской, такой как мандарин, или лоскутных одеял знакомой речи, которая является понятной и имеет значение. Для знакомой речи они могут увидеть более сильную активацию в левой части мозга, которая считается доминирующей в обработке речи.
