ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ИДЕНТИФИКАЦИИ ГОЛОСА В РАМКАХ ПРОЕКТНОЙ ДЕЯТЕЛЬНОСТИ ОБУЧАЮЩИХСЯ

Раздел: Прикладные задачи искусственного интеллекта

Журнал: Материалы IV Всероссийской научно-практической конференции с междун. участием «ИИ в образовании. Современные достижения и перспективы применения: в генерации знаний, управлении, обучении, оценке результатов обучения и формировании компетенций обучающихся»

26 июня 2025 г.

Авторы: Сокольская Елена Владимировна , Тереханова Ирина Владимировна

Информационно-коммуникационные технологии в педагогическом образовании, 2025. № 5 (98). infed.ru

_______________________________________________________________________

 

УДК 004.89 + 51-76

Е. В. Сокольская, И. В. Тереханова

E. V. Sokolskaya, I. V. Terekhanova

Сокольская Елена Владимировна, к. геогр. н., доцент, ГОУ «Приднестровский государственный университет им. Т. Г. Шевченко», г. Тирасполь, Приднестровская Молдавская Республика.

Тереханова Ирина Владимировна, учитель информатики высшей квалификационной категории, МОУ «Бендерский теоретический лицей имени Л. С. Берга», г. Бендеры, Приднестровская Молдавская Республика.

Sokolkaya Elena Vladimirovna, candidate of geographical sciences, associate professor, T. G. Shevchenko University, Tiraspol, Pridnestrovian Moldavian Republic.

Terekhanova Irina Vladimirovna, computer science teacher of the highest qualification category, Municipal educational institution «Bender Theoretical lyceum named after L. S. Berg», Bendery, Pridnestrovian Moldavian Republic.

 

ПРИМЕНЕНИЕ НЕЙРОННЫХ СЕТЕЙ ДЛЯ ИДЕНТИФИКАЦИИ ГОЛОСА В РАМКАХ ПРОЕКТНОЙ ДЕЯТЕЛЬНОСТИ ОБУЧАЮЩИХСЯ

APPLICATION OF NEURAL NETWORKS FOR VOICE IDENTIFICATION WITHIN SCHOOL STUDENTS’ PROJECT-BASED ACTIVITIES

 

Аннотация. В статье рассматривается опыт внедрения нейросетевых технологий в образовательный процесс на примере реализации учебного проекта по созданию системы идентификации личности по голосу. Актуальность проекта обусловлена ростом интереса к биометрическим методам аутентификации в условиях цифровизации образовательной среды. В рамках работы были разработаны две архитектуры нейронных сетей, реализованные средствами языка Python, и проведён сравнительный анализ их точности и эффективности. Также описано практическое применение созданной системы в форме Telegram-бота для автоматизации контроля посещаемости учащихся. Результаты проекта продемонстрировали высокую точность распознавания, подтвердив потенциал интеграции искусственного интеллекта в формирование проектных компетенций обучающихся.

Annotation. This article presents the experience of integrating neural network technologies into the educational process through the implementation of a student project focused on developing a voice-based user identification system. The relevance of the project stems from the growing interest in biometric authentication methods within the context of digitalized education. Two neural network architectures were developed and implemented using Python, followed by a comparative analysis of their performance and accuracy. The practical implementation of the system as a Telegram bot for automating student attendance monitoring is also discussed. The results demonstrate high recognition accuracy, highlighting the potential of artificial intelligence integration in developing students' project competencies.

Ключевые слова: нейросети, голосовая идентификация, биометрия, проектная деятельность, искусственный интеллект, школьное образование, telegram-бот.

Keywords: neural networks, voice identification, biometrics, project-based learning, artificial intelligence, school education, telegram bot.

 

Современный этап развития образования характеризуется активным внедрением цифровых технологий, которые становятся неотъемлемым компонентом учебной среды. Одним из наиболее перспективных направлений цифровизации выступает использование технологий искусственного интеллекта, в частности, нейросетевых решений. На сегодняшний день нейронные сети, как одна из форм искусственного интеллекта, находят широкое применение при обработке значительных объемов информации, решении нестандартных задач с опорой на машинное обучение, автоматизации повседневных операций, а также создании различных типов цифрового контента [1, 2].

Нейронные сети демонстрируют высокую востребованность и эффективность в различных сферах человеческой деятельности, включая экономику, здравоохранение, культуру и, что особенно актуально, образование. Внедрение нейросетей в образовательную практику открывает новые возможности как для обучающихся, так и для преподавателей, способствуя персонализации обучения, автоматизации ряда рутинных процессов и активизации их творческой деятельности [1, 2].

Актуальность исследования обусловлена необходимостью теоретического осмысления и практической апробации применения нейросетевых технологий в образовательной деятельности, направленной на формирование проектных компетенций у обучающихся. Таким образом, качественно новый подход к организации образовательной деятельности, основанный на нейронных сетях, обеспечивает условия для её модернизации в соответствии с требованиями цифровой эпохи [1, 2].

В настоящей статье представлен анализ возможностей применения нейронных сетей в процессе подготовки учащихся средней школы к выполнению проектной деятельности. Исследование основывается на опыте реализации учебного проекта, темой которого стала разработка системы голосовой идентификации личности с использованием алгоритмов искусственного интеллекта. Выбор данной темы обусловлен активным развитием и внедрением биометрических технологий в сферу информационной безопасности. В последние годы метод голосовой идентификации демонстрирует устойчивую динамику роста популярности, становясь одним из ключевых направлений биометрической аутентификации. Высокий интерес к подобным решениям связан с необходимостью создания надёжных, универсальных и оперативных методов идентификации личности, отвечающих требованиям цифрового общества.

В рамках реализации учебного проекта, направленного на разработку системы голосовой биометрии с использованием нейросетевых технологий, особое внимание было уделено анализу двух ключевых аспектов пользовательской аутентификации: идентификации и верификации. Эти процессы, хотя и решают смежные задачи, отличаются по принципам функционирования и области применения.

Идентификация представляет собой процесс установления личности на основе анализа голосового сигнала без предварительного указания пользователем каких-либо персональных данных. Система сравнивает поступивший аудиофрагмент с эталонными шаблонами, заранее сохранёнными в базе данных, и на основании полученных вероятностных оценок определяет наиболее подходящее совпадение. Если соответствие найдено, пользователю предоставляется доступ. В случае, если система не может однозначно сопоставить голос с существующими шаблонами, доступ отклоняется.

Верификация, в отличие от идентификации, предполагает, что пользователь заранее предоставляет системе уникальный идентификатор (например, логин), а голосовая запись служит подтверждением принадлежности к конкретной учетной записи. Процедура верификации сводится к сравнению двух голосовых шаблонов: предоставленного и хранимого в базе. Система рассчитывает степень схожести между ними, и, если полученное значение превышает заданный порог, доступ разрешается. В противном случае ‒ отклоняется.

Сравнительный анализ показал, что в условиях быстро развивающейся цифровой инфраструктуры и повышенных требований к безопасности, голосовая идентификация как технология демонстрирует больший потенциал к масштабированию и удобству использования. Она не требует от пользователя ввода дополнительных данных и позволяет автоматизировать процесс аутентификации, что делает её предпочтительной для интеграции в современные цифровые системы.

В рамках данной проектной работы процесс идентификации состоит из двух этапов – извлечение коэффициентов из исходных аудиоданных, т. е. создание математической модели голоса и определение степени схожести двух моделей между собой, а так же сравнение на основе нейронных моделей. Обучающиеся реализовали программное решение для голосовой идентификации личности с использованием языка программирования Python. Выбор платформы обусловлен широким спектром специализированных научных и математических библиотек, позволяющих абстрагироваться от технических деталей реализации и сосредоточиться на функциональной логике алгоритмов.

Авторы проекта были нацелены на создание функционального программного приложения, обеспечивающего идентификацию пользователя по голосу с минимальным уровнем погрешности и пригодного для последующего внедрения в существующие цифровые системы в рамках образовательного учреждения. Для достижения данной цели были поставлены и решены следующие исследовательские задачи:

  1. Изучение теоретических основ обработки аудиосигналов, включая методы анализа и предобработки звука.
  2. Обзор и сравнительный анализ алгоритмов извлечения признаков из голосовых данных с целью выбора наиболее оптимального метода получения числовых характеристик, описывающих голосовую модель говорящего.
  3. Разработка и обучение различных нейросетевых моделей, способных определять степень соответствия голосовых записей одному пользователю. Для этого выполнены следующие этапы:
    1. построение архитектуры моделей нейронных сетей с использованием специализированных Python-библиотек.
    2. формирование обучающей выборки из записей зарегистрированных пользователей.
    3. проведение тестирования модели на голосовых данных зарегистрированных и неизвестных системе пользователей.
  4. Анализ результатов с точки зрения точности и производительности программного продукта.
  5. Разработка пользовательского интерфейса, обеспечивающего доступную и понятную работу с системой голосовой идентификации в рамках образовательного учреждения.

Реализация этого алгоритма осуществлялась с применением языка Python, где были использованы библиотеки Librosa (для работы со звуком), NumPy и SciPy (для численных расчётов). После преобразования голосов в векторные признаки, была реализована задача определения их принадлежности конкретным пользователям. Для решения этой задачи применялись два подхода на основе нейросетевых моделей.

  1. Первая архитектура использовала одну полносвязную нейросеть, принимающую на вход MFCC-векторы (рис. 1). Выходной слой содержал столько нейронов, сколько зарегистрировано пользователей. В процессе идентификации активировался нейрон, соответствующий наиболее вероятному владельцу голоса.

Рисунок 1. Первая архитектура нейронной сети

  1. Вторая архитектура предусматривала множество независимых моделей, каждая из которых обучалась на голосе конкретного пользователя (рис. 2). При распознавании каждый классификатор выдавал бинарный ответ: принадлежит ли голос определённому человеку. Такая стратегия позволила повысить точность и обеспечить возможность определения «незарегистрированных» голосов как неизвестных, что особенно ценно для систем безопасности.

Рисунок 2. Вторая архитектура нейронной сети

Ключевым фактором эффективного применения нейросетей в образовательной среде является качество исходной информации, использованной для обучения нейросети, определение задач и подбор подходящих нейросетевых инструментов, способных обеспечить их решение. Немаловажным аспектом выступает и возможность последующей верификации точности и надежности полученного с её помощью контента.

Обучение и тестирование проводилось на выборке, включающей 10 человек, каждый из которых предоставил около 1,5 часов аудиозаписей. Материалы были сегментированы на фрагменты по 4 секунды. Время обучения первой модели нейронной сети составило около 3-4 минут, а второй ‒ до 45 минут (в зависимости от числа пользователей и мощности оборудования). Скорость идентификации ‒ менее 45 мс в обоих случаях. Точность первой модели достигла 96 %, второй ‒ приблизительно 99 %. Вторая архитектура позволила эффективно выявлять незарегистрированных пользователей, что делает её применимой для ограничения доступа посторонним лицам.

В рамках учебного проекта были реализованы две эффективные архитектуры нейросетевых систем голосовой идентификации. Полученные показатели точности подтверждают достижение поставленной цели ‒ создание надёжного программного инструмента, пригодного для дальнейшего применения в реальных условиях.

Созданное в рамках проектной деятельности обучающихся программное решение, реализованное в виде Telegram-бота, обладает широким спектром функциональных возможностей и может быть интегрировано в образовательную инфраструктуру (рис. 3).

 

Рисунок 3. Telegram-бот для автоматизированного контроля посещаемости и передачи информации обучающимся

Одной из ключевых сфер его применения является автоматизированный контроль посещаемости обучающихся. Система способна не только фиксировать факт присутствия учащегося на занятии, но и регистрировать опоздания, обеспечивая тем самым дополнительный инструмент мониторинга дисциплины и участия в учебном процессе. Дополнительным преимуществом разработки является возможность персонализированной передачи информации учащимся. Telegram-бот позволяет направлять индивидуальные сообщения без необходимости использования личных мобильных телефонов обучающихся. Это особенно актуально в образовательных учреждениях, где действуют ограничения на использование мобильных устройств. Таким образом, внедрение подобного инструмента способствует цифровизации образовательной среды и может стать эффективным решением в условиях современных требований к информационной безопасности и организации учебного процесса.

Проект, реализованный обучающимися, позволил не только освоить современные нейросетевые технологии, но и развить навыки практического применения искусственного интеллекта в актуальной прикладной задаче. Полученные результаты подтверждают высокую образовательную ценность нейросетевых проектов, направленных на решение реальных технологических и социально значимых проблем.

Таким образом, выполнение данного проекта позволило не только реализовать практико-ориентированную задачу на стыке программирования и искусственного интеллекта, но и развить у обучающихся ключевые проектные компетенции, востребованные в условиях современной цифровой экономики.

Список литературы

  1. Широколобова, А. Г. Искусственный интеллект как инструмент оптимизации работы преподавателя высшей школы / А. Г. Широколобова. – Текст: электронный // Педагогика. Вопросы теории и практики. – 2024. – Т. 9. – № 2. – С. 138–145. – URL: https://pedagogika-voprosy.ru/index.php/ped/article/view/18 (дата обращения: 16.05.2025).
  2. Полубоярова, Ю. А. Использование нейросетей в проектной деятельности студентов / Ю. А. Полубоярова. – Текст: электронный // S-BA.RU: сайт. – URL: https://s-ba.ru/tpost/aglamjede1-ispolzovanie-neirosetei-v-proektnoi-deya (дата обращения: 18.05.2025).

                                                

© Сокольская Е. В., Тереханова И. В., 2025

PDF