ПОСТРОЕНИЕ ДИАГРАММ ИСПОЛЬЗОВАНИЯ И ОСНОВНЫХ КЛАССОВ ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ ДЛЯ КОНВЕРТАЦИИ РЕЧИ В ТЕКСТ И ТЕКСТА В РЕЧЬ
Ключевые слова:
Распознавание речи, Конвертация текста в речь, Flask, Нейронная сеть LSTM, MFCC, AJAX, jQuery, Алгоритм перевода, Спектрограмма, API-интеграцияАннотация
В данной статье рассматривается разработка программного обеспечения, обеспечивающего в реальном времени конвертацию речи в текст и наоборот с использованием веб-технологий. Backend реализован на Flask, а frontend включает jQuery и AJAX, что позволяет пользователям распознавать речь и переводить её на другие языки. Для распознавания речи применяются нейронные сети LSTM, использующие MFCC-признаки для анализа аудиоданных. Также для генерации речи из текста используется спектральный анализ и модель кодировщик-декодировщик. Интерфейс приложения интуитивно понятен и адаптирован для работы на различных устройствах
Библиографические ссылки
Mamatov, Narzillo & Niyozmatova, N. & Abdullaev, Sh & Samijonov, Abdurashid & Erejepov, K.. (2021). Transformator neyron tarmoqlariga asoslangan nutqni aniqlash. 1-5. 10.1109/ICISCT52966.2021.9670093.
Niyozmatova, N. & Mamatov, Narzillo & Tulaganova, Sh & Samijonov, Abdurashid & Samijonov, B.. (2023). Tanish tizimlarida o‘zbek nutqining nutq faolligini aniqlash usullari. 050019. 10.1063/5.0145438.
Mamatov, N., Niyozmatova, N., Samijonov, A. 2021. Ovozli signallarni oldindan qayta ishlash uchun dasturiy ta'minot. Xalqaro amaliy fanlar va muhandislik jurnali, 18, 2020163. https://doi.org/10.6703/IJASE.202103_18(1).006
Mamatov, N.S., Niyozmatova, N.A., Yoʻldoshev, Y.S., Abdullaev, S.S., Samijonov, A.N. (2023). Diqqat mexanizmiga asoslangan neytral tarmoqda nutqni avtomatik aniqlash. In:
https://medium.com/@swilliam.productions/text-to-speech-with-tacotron-2-573986c42124[online]
Kajetan Malinovski Janette Mandell bilan, Til texnologiyasining kelajagi: Mashina tarjimasining kelajagi. Lionbridge, 2021 yil 22 yanvar
Zaynidinov, H., Singh, M., Tiwary, US, Singh, D. (tahrirlar) Intelligent Human Computer Interaction. IHCI 2022. Kompyuter fanlari bo'yicha ma'ruza matnlari, 13741-jild. Springer, Cham. https://doi.org/10.1007/978-3-031-27199-1_11
NS Mamatov, NA Niyozmatova, AN Samijonov va BN Samijonov, "O'zbek tili uchun til modellari qurilishi", 2022 Xalqaro axborot fanlari va kommunikatsiya texnologiyalari konferentsiyasi (ICISCT), Toshkent, O'zbekiston, 2022, s. 1-4, doi: 10.1109/ICISCT55600.2022.10146788.
Wiedecke, Bernd & Mamatov, Narzillo & Payazov, Mirabbos & Samijonov, Abdurashid. (2019). Akustik signalni tahlil qilish va aniqlash. Innovatsion texnologiyalar va tadqiqot muhandisligi xalqaro jurnali. 8. 2440-2442. 10.35940/ijitee.J9522.0881019.
Narzillo, M., Abdurashid, S., Parakhat, N., & Nilufar, N. (2019). Vektor kvantlash usuliga asoslangan ovoz bilan karnayni avtomatik aniqlash. Innovatsion texnologiyalar va tadqiqot muhandisligi xalqaro jurnali, 8(10), 2443–2445. https://doi.org/10.35940/ijitee.J9523.0881019
Загрузки
Дополнительные файлы
Опубликован
Как цитировать
Лицензия
Copyright (c) 2025 Nurbek Nuritdinov, Narzillo Mamatov

Это произведение доступно по лицензии Creative Commons «Attribution» («Атрибуция») 4.0 Всемирная.