Preview

Доклады БГУИР

Расширенный поиск

АРХИТЕКТУРА МУЛЬТИГОЛОСОВОГО СИНТЕЗАТОРА РЕЧИ ПО ТЕКСТУ

Аннотация

Предлагается схема построения мультиголосового синтезатора речи на базе использования синергетического эффекта от интеграции системы синтеза речи по тексту с системой конверсии голоса. Главной отличительной особенностью данного решения является возможность использования лингвистической, фонетической и просодической информации, имеющейся в синтезаторе речи, на этапе обучения системы конверсии голоса. Это позволяет эффективно применить текстонезависимый подход к обучению, улучшив степень качества конверсии голоса. Его использование позволяет добавить функции мультимодальности для синтезатора речи без значительных трудозатрат на подготовку речевых баз для добавления новых дикторов.

Об авторах

В. А. Захарьев
Белорусский государственный университет информатики и радиоэлектроники
Беларусь


А. А. Петровский
Белорусский государственный университет информатики и радиоэлектроники
Беларусь


Список литературы

1. Лобанов Б.М. Компьютерный синтез и клонирование речи. Минск, 2008.

2. Sundermann D. // ICASSP. 2006. P. 81-84.

3. Duxans B. // PUC. 2006. P. 171-175.

4. Анализаторы речевых и звуковых сигналов: методы, алгоритмы и практика. // Под ред. А.А. Петровского. Минск, 2009

5. Bourlard H. Introduction to Hidden Markov Models. Lauseane, 2010.

6. Stylianou Y. // Springer. 2007. P. 502-532.

7. Захарьев В.А, Петровский А.А. // Докл. БГУИР. 2013. № 1 (71). C. 39-45.


Рецензия

Для цитирования:


Захарьев В.А., Петровский А.А. АРХИТЕКТУРА МУЛЬТИГОЛОСОВОГО СИНТЕЗАТОРА РЕЧИ ПО ТЕКСТУ. Доклады БГУИР. 2013;(7):57-63.

For citation:


Zakharyeu V.A., Petrovsky A.A. ARCHITECTURE OF THE MULTIVOICE TEXT-TO-SPEECH SYSTEM. Doklady BGUIR. 2013;(7):57-63. (In Russ.)

Просмотров: 308


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1729-7648 (Print)
ISSN 2708-0382 (Online)