ПОСТРОЕНИЕ ДИАГРАММ ИСПОЛЬЗОВАНИЯ И ОСНОВНЫХ КЛАССОВ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ КОНВЕРТАЦИИ РЕЧИ В ТЕКСТ И ТЕКСТА В РЕЧЬ

Авторы

  • Nurbek Nuritdinov Namangan muhandislik-qurilish instituti
  • Narzillo Mamatov

Ключевые слова:

Распознавание речи, Конвертация текста в речь, Flask, Нейронная сеть LSTM, MFCC, AJAX, jQuery, Алгоритм перевода, Спектрограмма, API-интеграция

Аннотация

В данной статье рассматривается разработка программного обеспечения, обеспечивающего в реальном времени конвертацию речи в текст и наоборот с использованием веб-технологий. Backend реализован на Flask, а frontend включает jQuery и AJAX, что позволяет пользователям распознавать речь и переводить её на другие языки. Для распознавания речи применяются нейронные сети LSTM, использующие MFCC-признаки для анализа аудиоданных. Также для генерации речи из текста используется спектральный анализ и модель кодировщик-декодировщик. Интерфейс приложения интуитивно понятен и адаптирован для работы на различных устройствах

Библиографические ссылки

Mamatov, Narzillo & Niyozmatova, N. & Abdullaev, Sh & Samijonov, Abdurashid & Erejepov, K.. (2021). Transformator neyron tarmoqlariga asoslangan nutqni aniqlash. 1-5. 10.1109/ICISCT52966.2021.9670093.

Niyozmatova, N. & Mamatov, Narzillo & Tulaganova, Sh & Samijonov, Abdurashid & Samijonov, B.. (2023). Tanish tizimlarida o‘zbek nutqining nutq faolligini aniqlash usullari. 050019. 10.1063/5.0145438.

Mamatov, N., Niyozmatova, N., Samijonov, A. 2021. Ovozli signallarni oldindan qayta ishlash uchun dasturiy ta'minot. Xalqaro amaliy fanlar va muhandislik jurnali, 18, 2020163. https://doi.org/10.6703/IJASE.202103_18(1).006

Mamatov, N.S., Niyozmatova, N.A., Yoʻldoshev, Y.S., Abdullaev, S.S., Samijonov, A.N. (2023). Diqqat mexanizmiga asoslangan neytral tarmoqda nutqni avtomatik aniqlash. In:

https://www.pragnakalp.com/speech-recognition-speech-to-text-python-using-google-api-wit-ai-ibm-cmusphinx/ [online]

https://medium.com/@swilliam.productions/text-to-speech-with-tacotron-2-573986c42124[online]

Kajetan Malinovski Janette Mandell bilan, Til texnologiyasining kelajagi: Mashina tarjimasining kelajagi. Lionbridge, 2021 yil 22 yanvar

Zaynidinov, H., Singh, M., Tiwary, US, Singh, D. (tahrirlar) Intelligent Human Computer Interaction. IHCI 2022. Kompyuter fanlari bo'yicha ma'ruza matnlari, 13741-jild. Springer, Cham. https://doi.org/10.1007/978-3-031-27199-1_11

NS Mamatov, NA Niyozmatova, AN Samijonov va BN Samijonov, "O'zbek tili uchun til modellari qurilishi", 2022 Xalqaro axborot fanlari va kommunikatsiya texnologiyalari konferentsiyasi (ICISCT), Toshkent, O'zbekiston, 2022, s. 1-4, doi: 10.1109/ICISCT55600.2022.10146788.

Wiedecke, Bernd & Mamatov, Narzillo & Payazov, Mirabbos & Samijonov, Abdurashid. (2019). Akustik signalni tahlil qilish va aniqlash. Innovatsion texnologiyalar va tadqiqot muhandisligi xalqaro jurnali. 8. 2440-2442. 10.35940/ijitee.J9522.0881019.

Narzillo, M., Abdurashid, S., Parakhat, N., & Nilufar, N. (2019). Vektor kvantlash usuliga asoslangan ovoz bilan karnayni avtomatik aniqlash. Innovatsion texnologiyalar va tadqiqot muhandisligi xalqaro jurnali, 8(10), 2443–2445. https://doi.org/10.35940/ijitee.J9523.0881019

Загрузки

Дополнительные файлы

Опубликован

2025-03-23

Как цитировать

Nuritdinov, N., & Mamatov, N. (2025). ПОСТРОЕНИЕ ДИАГРАММ ИСПОЛЬЗОВАНИЯ И ОСНОВНЫХ КЛАССОВ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ КОНВЕРТАЦИИ РЕЧИ В ТЕКСТ И ТЕКСТА В РЕЧЬ. Потомки Аль-Фаргани, 1(1), 29–34. извлечено от https://al-fargoniy.uz/index.php/journal/article/view/755

Выпуск

Раздел

Статьи

Категории

Наиболее читаемые статьи этого автора (авторов)