АРХИТЕКТУРА МУЛЬТИГОЛОСОВОГО СИНТЕЗАТОРА РЕЧИ ПО ТЕКСТУ

В. А. Захарьев; А. А. Петровский

АРХИТЕКТУРА МУЛЬТИГОЛОСОВОГО СИНТЕЗАТОРА РЕЧИ ПО ТЕКСТУ

В. А. Захарьев, А. А. Петровский

Полный текст:

PDF (Rus)

сгенерировать QR код

Аннотация

Предлагается схема построения мультиголосового синтезатора речи на базе использования синергетического эффекта от интеграции системы синтеза речи по тексту с системой конверсии голоса. Главной отличительной особенностью данного решения является возможность использования лингвистической, фонетической и просодической информации, имеющейся в синтезаторе речи, на этапе обучения системы конверсии голоса. Это позволяет эффективно применить текстонезависимый подход к обучению, улучшив степень качества конверсии голоса. Его использование позволяет добавить функции мультимодальности для синтезатора речи без значительных трудозатрат на подготовку речевых баз для добавления новых дикторов.

Ключевые слова

конверсия голоса, мультиголосовой синтезатор речи по тексту, текстонезависимое обучение, скрытая марковская модель, параметрическая модель представления сигнала

Об авторах

В. А. Захарьев

Белорусский государственный университет информатики и радиоэлектроники
Беларусь

А. А. Петровский

Белорусский государственный университет информатики и радиоэлектроники
Беларусь

Список литературы

1. Лобанов Б.М. Компьютерный синтез и клонирование речи. Минск, 2008.

2. Sundermann D. // ICASSP. 2006. P. 81-84.

3. Duxans B. // PUC. 2006. P. 171-175.

4. Анализаторы речевых и звуковых сигналов: методы, алгоритмы и практика. // Под ред. А.А. Петровского. Минск, 2009

5. Bourlard H. Introduction to Hidden Markov Models. Lauseane, 2010.

6. Stylianou Y. // Springer. 2007. P. 502-532.

7. Захарьев В.А, Петровский А.А. // Докл. БГУИР. 2013. № 1 (71). C. 39-45.

Рецензия

Для цитирования:

Захарьев В.А., Петровский А.А. АРХИТЕКТУРА МУЛЬТИГОЛОСОВОГО СИНТЕЗАТОРА РЕЧИ ПО ТЕКСТУ. Доклады БГУИР. 2013;(7):57-63.

For citation:

Zakharyeu V.A., Petrovsky A.A. ARCHITECTURE OF THE MULTIVOICE TEXT-TO-SPEECH SYSTEM. Doklady BGUIR. 2013;(7):57-63. (In Russ.)

JATS XML

Контент доступен под лицензией Creative Commons Attribution 4.0 License.

ISSN 1729-7648 (Print)
ISSN 2708-0382 (Online)

Логин
Пароль
	Запомнить меня
Регистрация нового пользователя Забыли Ваш пароль?

Войти

Доклады БГУИР

АРХИТЕКТУРА МУЛЬТИГОЛОСОВОГО СИНТЕЗАТОРА РЕЧИ ПО ТЕКСТУ

Полный текст:

Аннотация

Ключевые слова

Об авторах

Список литературы

Рецензия

Для цитирования:

For citation:

Использование куки-файлов