Метод синхронизации аудио- и текстовой информации с применением технологии распознавания речи
Ключевые слова:
система распознавания речи, текстовая и аудиоинформация, скрытые марковские цепи, алгоритм Нидлмана-ВуншаАннотация
Рассмотрены предпосылки к использованию системы распознавания речи для решения задачи синхронизации аудио- и текстовой информации. Предложен новый метод синхронизации текстовой и аудио информации – способом распознавания речи. Отмечаются особенности нового метода. Предложен программный код распознавания слов с получением временных отметок распознанных слов. Предложен алгоритм синхронизации текстовой и аудио информации. Проведено исследование, определена точность и полнота синхронизации.
Библиографические ссылки
Мишустин, В. А. Исследование способов синхронизации текстовой и аудио информации
для мобильных приложений / В. А. Мишустин, С. В. Иваница // Информатика и кибернетика. – 2021. – №3(25). – С. 32–36.
Алимурадов, А. К. Обзор и классификация методов обработки речевых сигналов в системах распознавания речи / А. К. Алимурадов, П.П. Чураков // Измерение. Мониторинг. Управление. Конроль, 2015. – №2(12). – С. 27–35.
Винцюк, Т. К. Анализ, распознавание и интерпретация речевых сигналов / Т. К. Винцюк. – Киев: Наукова думка, 1987. – 264 с.
Рабинер, Л. Р. Цифровая обработка речевых сигналов: пер. с англ. / Л. Р. Рабинер, Р. В. Шафер. – М.: Радио и связь, 1981. – 496 с.
Фролов, А. В. Синтез и распознавание речи. Современные решения / А. В. Фролов, Г. В. Фролов. – М.: Связь, 2003. – 216 с.
Методы автоматического распознавания речи: в 2 кн.: пер. с англ. / У. А. Ли, Э. П. Нейбург, Т. Б. Мартин [и др.]; под ред. У. Ли. – М.: Мир, 1983. – Кн. 1. – 328 с.
Методы автоматического распознавания речи: в 2 кн.: пер. с англ. / Д. Х. Клетт, Дж. А. Барнет, М. И. Бернстейн [и др.]; под ред. У. Ли. – М.: Мир, 1983. – Кн. 2. – 392 с.
Моттль, В. Скрытые марковские модели в структурном анализе сигналов / В. Моттль, И. Мучник. – М.: Физматлит, 1999. – 352 с.
Huang, X. Spoken Language Processing. Guide to Algorithms and System Developmen / X. Huang, A. Acero, H.-W. Hon. – Prentice Hall, 2001. – 980 p.
Open source speech recogmition toolkit [Электронный ресурс]. – Режим доступа: https://cmusphinx.github.io/
Sankoff, D. Matching Sequences under Deletion/Insertion Constraints // Proc. Nat. Acad. Sci., 1972. – РР. 4–6.