АЛГОРИТМЫ ИДЕНТИФИКАЦИИ ЧЕЛОВЕКА ПО ГОЛОСУ
Ключевые слова:
речевой сигнал, идентификация человека по голосу, разделение набора признаков, MFCC, GMMАннотация
В данной статье рассмотрено использование метода GММ для построения голосовой модели человека для задачи идентификации человека по голосу. Технология распознавания голоса доступна в широком спектре приложений, включая безопасность, голосовые помощники, системы управления и многое другое. В статье представлен подход, основанный на использовании метода GMM для моделирования и классификации голосовых команд. В статье представлены эксперименты на наборе аудиоданных каракалпакского языка.
Библиографические ссылки
H. Beigi. Fundamentals of speaker recognition. Springer US, 2011.
W. M. Campbell, D. E. Sturim, D. A. Reynolds, Support vector machines using GMM supervectors for speaker verification, IEEE signal processing letters 13 (5) (2006) 308–311.
Рабинер Л., Шафер Р. Цифровая обработка речевых сигналов. – М.: Радио и связ, 1981. – 496 с.
Маматов Н.С., Нуримов П.Б., Самижонов А.Н. Нутқ сигналларида овоз фаоллигини аниқлаш алгоритмлари. «Ахборот коммуникация технологиялари ва дастурий таъминот яратишда инновацион ғоялар» Республика илмий-техник конференцияси 17-18 май 2021 йил.
П.Б.Нуримов, А.Н.Самижонов, Ш.И.Фозилов, З.М.Сулаймонов Шахсни нутқи асосида таниб олишда белгилар фазосини шакллантириш. Информатика ва энергетика муаммолари Ўзбекистон Журнали, №4, 2020
Desai D, Joshi M., Speaker Recognition Using MFCC and Hybrid Model of VQ and GMM. Recent Advances in Intelligent I nformatics 235: 53-63.
W. M. Campbell, D. E. Sturim, D. A. Reynolds, Support vector machines using GMM supervectors for speaker verification, IEEE signal processing letters 13 (5) (2006) 308–311.
Нуримов П.Б., Ережепов К.К., Шахсни овози бўйича биометрик таниб олиш тизимлари, Между-народной научно-практической конференции «Актуальные задачи математичес-кого моделирования и информа-ционных технологий» Nukus, May 2-3, 2023.
Fabian Pedregosa, Gaël Varoquaux, Alexandre Gramfort, ..., Scikit-learn: Machine Learning in Python,https://arxiv.org/abs/1201.04 90
James Lyons et al. (2020, January 14). jameslyons/ python_speech_ features: release v0.6.1 (Version 0.6.1).
Загрузки
Дополнительные файлы
Опубликован
Как цитировать
Лицензия
Copyright (c) 2024 Keulimjay Erejepov
Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.