Электронный научный журнал

Информационно-коммуникационные технологии
в педагогическом образовании

12+

ПРИМЕНЕНИЕ ВЫДЕЛЕНИЯ СИНХРОННОСТИ ДЛЯ ОЦЕНКИ СХОДСТВА ВОКАЛЬНЫХ ИСПОЛНЕНИЙ

Авторы: Е. С. Катаева, Ю. Р. Свешникова, А. Ю. Якимук
Раздел: Использование информационно-коммуникационных технологий в общем, дополнительном, среднем профессиональном и высшем образовании

УДК 004.522

Е. С. Катаева, Ю. Р. Свешникова, А. Ю. Якимук

E. S. Kataeva, Yu. R. Sveshnikova, A. Yu. Yakimuk

Катаева Елена Сергеевна, ст. преподаватель, ФБ ТУСУР, г. Томск.

Свешникова Юлия Руслановна, студентка 6 курса, ФБ ТУСУР, г. Томск.

Якимук Алексей Юрьевич, аспирант, ФБ ТУСУР, г. Томск.

Kataeva Elena Sergeevna, Senior lecturer Faculty of security, TUSUR, Tomsk.

Sveshnikova Yuliya Ruslanovna, 6-year student Faculty of security, TUSUR, Tomsk.

Yakimuk Alexey Yurievich, Ph.D. student Faculty of security, TUSUR, Tomsk.

ПРИМЕНЕНИЕ ВЫДЕЛЕНИЯ СИНХРОННОСТИ ДЛЯ ОЦЕНКИ СХОДСТВА ВОКАЛЬНЫХ ИСПОЛНЕНИЙ

APPLICATION OF SYNCHRONOUS ISOLATION FOR EVALUATING THE SIMILITY OF VOCAL PERFORMANCES

Аннотация. В данной работе рассматривается вопрос оценки сходства вокальных исполнений с помощью выделения синхронности. Данный подход позволит проводить обучение вокальному исполнению на начальных этапах и расширить спектр предлагаемых пользователям заданий.

Annotation. This paper addresses the issue of assessing the similarity of vocal performances by highlighting the synchronicity. This approach will allow vocal performance training at the initial stages and expand the range of assignments offered to users.

Ключевые слова: вокальное исполнение, синхронность, аппроксимация временных видов, речевые технологии.

Keywords: vocal performance, synchronicity, approximation of temporary types, speech technology.

При правильном подходе на ранних этапах к обучению вокальному исполнению требуется определять не четкое попадание в заданные ноты, а схожесть вокального исполнения с поставленной задачей. Это обуславливается невозможностью грамотной оценки правильности исполнения ноты или степени отклонения от идеального звучания из-за отсутствия развитого музыкального слуха. В таком случае исполненная в соседней октаве правильная нота будет воспринята как ошибочная, что приводит нас к необходимости проведения оценки динамики частоты основного тона вокального исполнения.

Оценка сходства вокального исполнения является достаточно частой темой научных исследований в области речевых технологий. Особое внимание в подобных исследованиях уделяется изучению представителей животного мира. Так в статье [1] изучается влияние шума на пение птиц, путем сходства пения воробьев за городом и в городской структуре. А в статье [2] исследуется сходство вокализации 18 домашних мышей. Пению человека также уделяется внимание ученых. Так, например, в статье [3] проводится оценка хорового пения с помощью автокорреляционной функции и вычисления нестационарных «корреляционных портретов» звучания хора и их визуального сравнения.

Для проведения исследования был подготовлен набор из 8 локаций по 8 аудиозаписей с вокальным исполнением в каждой, среди которых одна из аудиозаписей была сделана человеком с музыкальным образованием, а оставшиеся – записями 7 дикторов, прослушавших аудиозапись и постаравшихся повторить услышанное в эталонной записи. Анализ аудиозаписей осуществлялся в программном корпусе «Amadeus» [5].

Выше представлен пример графика распределения частот основного тона для обработанных аудиозаписей одной из анализируемых локаций (рис. 1). В данной локации необходимо было спеть стаккато без произношения названий следующие ноты первой октавы: до, ре, ми, фа, соль, фа, ми, ре, до.

Для оценки сходства вокальных исполнений был разработан алгоритм, выделяющий синхронность в анализируемых данных (рис. 2).

На первом шаге алгоритма происходит аппроксимация пары рядов значений частот основного тона (для эталонной и сравниваемой с ней аудиозаписей). В качестве методов аппроксимации использовались оценка Надарая-Ватсона по 6 ядерным функциям (треугольное, Епанечникова, Фишера, Валле-Пуссена, триквадратное и трикубическое) и кодировка. Следующий шаг работы алгоритма заключается в сравнении каждого значения аппроксимированного оцениваемого ряда с соответствующим значением аппроксимированного эталонного ряда, определении количества равных пар и вычислении доли совпадений временного ряда с эталоном.

В соответствии с приведенной блок-схемой была выполнена программная реализация алгоритма оценки сходства вокальных исполнений. На рисунке 3 и 4 представлены консольные окна программы с результатами вычисления оценок сходства обработанных вокальных исполнений для 7 исполнителей с применением первого и второго подходов соответственно. Аналогичным образом были оценены все остальные локации.

Для оценки точности полученных значений при подходе, включающем оценки Надарая-Ватсона, были рассчитаны значения абсолютной и относительной средней ошибок аппроксимации. Для оценки качества полученных результатов были рассчитаны средние относительные ошибки аппроксимации [4].

В результате были выдвинуты следующие рекомендации: для ядер – треугольное, триквадратное и трикубическое следует выбирать ширину окна равную 2. Для остальных ядер ширину окна равную 1. Минимальные ошибки были получены при ядре Валле-Пуссена и составили менее 5%.

Список литературы

  1. Jacob R. Job Song adjustments by an open habitat bird to anthropogenic noise, urban structure, and vegetation [Текст] / Jacob R. Job, Steve L. Kohler, Sharon A. Gill // Behavioral Ecology, Volume 27, Issue 6, 1 November 2016, Pages 1734-1744.
  2. Portfors, C. V. The role of ultrasonic vocalizations in mouse communication [Текст] / Portfors, C. V., & Perkel, D. J. // Current opinion in neurobiology, 28. – 2014. – Pages 115-20.
  3. Бакаев, А. В. Корреляционный анализ ансамблевого пения [Текст] / А. В. Бакаев // Инженерный вестник дона. – Ростов-на-Дону, 2014. – т. 29. – № 2. – С. 123-129.
  4. Свешникова, Ю. Р. Непараметрическая оценка ядерного типа [Текст] / Ю. Р. Свешникова, Е. С. Катаева // Матер. Междунар. науч.-техн. конф. студентов, аспирантов и молодых учёных «Научная сессия ТУСУР – 2018». – Томск, 16-18 мая 2018 год. – Томск : В-Спектр, 2018. – Ч. 3. – С. 97-100.
  5. Якимук, А. Ю. Программный комплекс для автоматизации моделирования сегментации речевых сигналов и вокальных исполнений [Текст] / А. Ю. Якимук, А. А. Конев, А. О. Осипов // Вестник Иркутского гос. техн. ун-та. – 2017. – Т. 21. – № 10 (129). – С. 53-64.
Теги: вокальное исполнение, синхронность, аппроксимация временных видов, речевые технологии, vocal performance, synchronicity, approximation of temporary types, speech technology

Оставить комментарий







Авторизация
E-mail

Пароль  


Регистрация