Метод синхронизации аудио- и текстовой информации с применением технологии распознавания речи

Авторы

  • Виктор Андреевич Мишустин Донецкий национальный технический университет
  • Сергей Васильевич Иваница Донецкий национальный технический университет

Ключевые слова:

система распознавания речи, текстовая и аудиоинформация, скрытые марковские цепи, алгоритм Нидлмана-Вунша

Аннотация

Рассмотрены предпосылки к использованию системы распознавания речи для решения задачи синхронизации аудио- и текстовой информации.  Предложен новый метод синхронизации текстовой и аудио информации – способом распознавания речи. Отмечаются особенности нового метода. Предложен программный код распознавания слов с получением временных отметок распознанных слов. Предложен алгоритм синхронизации текстовой и аудио информации. Проведено исследование, определена точность и полнота синхронизации.

Биографии авторов

Виктор Андреевич Мишустин, Донецкий национальный технический университет

магистрант кафедры компьютерной инженерии факультета интеллектуальных систем и программирования

Сергей Васильевич Иваница, Донецкий национальный технический университет

кандидат технических наук, доцент кафедры компьютерной инженерии факультета интеллектуальных систем и программирования

Библиографические ссылки

Мишустин, В. А. Исследование способов синхронизации текстовой и аудио информации

для мобильных приложений / В. А. Мишустин, С. В. Иваница // Информатика и кибернетика. – 2021. – №3(25). – С. 32–36.

Алимурадов, А. К. Обзор и классификация методов обработки речевых сигналов в системах распознавания речи / А. К. Алимурадов, П.П. Чураков // Измерение. Мониторинг. Управление. Конроль, 2015. – №2(12). – С. 27–35.

Винцюк, Т. К. Анализ, распознавание и интерпретация речевых сигналов / Т. К. Винцюк. – Киев: Наукова думка, 1987. – 264 с.

Рабинер, Л. Р. Цифровая обработка речевых сигналов: пер. с англ. / Л. Р. Рабинер, Р. В. Шафер. – М.: Радио и связь, 1981. – 496 с.

Фролов, А. В. Синтез и распознавание речи. Современные решения / А. В. Фролов, Г. В. Фролов. – М.: Связь, 2003. – 216 с.

Методы автоматического распознавания речи: в 2 кн.: пер. с англ. / У. А. Ли, Э. П. Нейбург, Т. Б. Мартин [и др.]; под ред. У. Ли. – М.: Мир, 1983. – Кн. 1. – 328 с.

Методы автоматического распознавания речи: в 2 кн.: пер. с англ. / Д. Х. Клетт, Дж. А. Барнет, М. И. Бернстейн [и др.]; под ред. У. Ли. – М.: Мир, 1983. – Кн. 2. – 392 с.

Моттль, В. Скрытые марковские модели в структурном анализе сигналов / В. Моттль, И. Мучник. – М.: Физматлит, 1999. – 352 с.

Huang, X. Spoken Language Processing. Guide to Algorithms and System Developmen / X. Huang, A. Acero, H.-W. Hon. – Prentice Hall, 2001. – 980 p.

Open source speech recogmition toolkit [Электронный ресурс]. – Режим доступа: https://cmusphinx.github.io/

Sankoff, D. Matching Sequences under Deletion/Insertion Constraints // Proc. Nat. Acad. Sci., 1972. – РР. 4–6.

Загрузки

Опубликован

09.05.2022

Как цитировать

Мишустин, В. А. ., & Иваница, С. В. . (2022). Метод синхронизации аудио- и текстовой информации с применением технологии распознавания речи. Информатика и кибернетика, (1(27), 25–30. извлечено от https://ojs.donntu.ru/index.php/infcyb/article/view/32

Выпуск

Раздел

Статьи