Preview

Доклады БГУИР

Расширенный поиск

АРХИТЕКТУРА МУЛЬТИГОЛОСОВОГО СИНТЕЗАТОРА РЕЧИ ПО ТЕКСТУ

Полный текст:

Аннотация

Предлагается схема построения мультиголосового синтезатора речи на базе использования синергетического эффекта от интеграции системы синтеза речи по тексту с системой конверсии голоса. Главной отличительной особенностью данного решения является возможность использования лингвистической, фонетической и просодической информации, имеющейся в синтезаторе речи, на этапе обучения системы конверсии голоса. Это позволяет эффективно применить текстонезависимый подход к обучению, улучшив степень качества конверсии голоса. Его использование позволяет добавить функции мультимодальности для синтезатора речи без значительных трудозатрат на подготовку речевых баз для добавления новых дикторов.

Об авторах

В. А. Захарьев
Белорусский государственный университет информатики и радиоэлектроники
Беларусь


А. А. Петровский
Белорусский государственный университет информатики и радиоэлектроники
Беларусь


Список литературы

1. Лобанов Б.М. Компьютерный синтез и клонирование речи. Минск, 2008.

2. Sundermann D. // ICASSP. 2006. P. 81-84.

3. Duxans B. // PUC. 2006. P. 171-175.

4. Анализаторы речевых и звуковых сигналов: методы, алгоритмы и практика. // Под ред. А.А. Петровского. Минск, 2009

5. Bourlard H. Introduction to Hidden Markov Models. Lauseane, 2010.

6. Stylianou Y. // Springer. 2007. P. 502-532.

7. Захарьев В.А, Петровский А.А. // Докл. БГУИР. 2013. № 1 (71). C. 39-45.


Для цитирования:


Захарьев В.А., Петровский А.А. АРХИТЕКТУРА МУЛЬТИГОЛОСОВОГО СИНТЕЗАТОРА РЕЧИ ПО ТЕКСТУ. Доклады БГУИР. 2013;(7):57-63.

For citation:


Zakharyeu V.A., Petrovsky A.A. ARCHITECTURE OF THE MULTIVOICE TEXT-TO-SPEECH SYSTEM. Doklady BGUIR. 2013;(7):57-63. (In Russ.)

Просмотров: 39


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1729-7648 (Print)
ISSN 2708-0382 (Online)