Сегментация речи на фонетические элементы для систем защиты речевой информации

Е. Н. Сейткулов; С. Н. Боранбаев; А. В. Потапович; Г. В. Давыдов

doi:10.35596/1729-7648-2019-123-5-66-71

Сегментация речи на фонетические элементы для систем защиты речевой информации

Е. Н. Сейткулов, С. Н. Боранбаев, А. В. Потапович, Г. В. Давыдов

https://doi.org/10.35596/1729-7648-2019-123-5-66-71

Полный текст:

PDF (Rus)

сгенерировать QR код

Аннотация

Статья посвящена разработке алгоритма сегментации речи на фонетические элементы для синтеза речеподобных сигналов в системах защиты речевой информации. Основное внимание уделяется установлению границ фонетических единиц речи с учетом влияния этого фактора на качество синтезируемой речи компиляционным методом. Рассматриваются особенности установления границ фонем для слитной речи и влияние этого фактора на качество синтезируемой речи по базе фонем. Предлагается для обеспечения качественной синтезируемой речи начало и окончание фонем при сегментации устанавливать при переходе реализации сигнала через ноль, а при синтезе речеподобных сигналов использовать сплайн-функции на границах сегментов фонем.

Ключевые слова

сегментация речи, границы фонем, речеподобные сигналы, синтез, сплайн-функции

Об авторах

Е. Н. Сейткулов

Евразийский национальный университет им. Л.Н. Гумилева
Казахстан

Кандидат физико-математических наук, директор НИИ информационной безопасности криптологии

С. Н. Боранбаев

Евразийский национальный университет им. Л.Н. Гумилева
Казахстан

Доктор технических наук, профессор

А. В. Потапович

Белорусский государственный университет информатики и радиоэлектроники
Беларусь

Потапович Александр Владимирович - старший научный сотрудник НИЛ 5.3 НИЧ.

220013, Минск, ул. П. Бровки, 6, тел. +375-29-670-30-40

Г. В. Давыдов

Белорусский государственный университет информатики и радиоэлектроники
Беларусь

Кандидат технических наук, ведущий научный сотрудник НИЛ 5.3 НИЧ.

220013, Минск, ул. П. Бровки, 6

Список литературы

1. Sakoe H., Chiba S. Dynamic Programming Algorithm Optimization for Spoken Word Recognition // IEEE Transactions on Acoustics, Speech, and Signal Processing. 1978. Vol. ASSP-26, No. 1. P. 43-49.

2. Scharenborg O., Wan V., Ernestus M. Unsupervised speech segmentation: An analysis of the hypothesized phone boundaries // The Journal of the Acoustical Society of America. 2010. Vol. 127, No. 2. P. 1084-1095.

3. Gomez J.A., Calvo M. Improvements on automatic speech segmentation at the phonetic level // Materials of 16th Iberoamerican CongressProgress in Pattern Recognition, Image Analysis, Computer Vision and Applikations. 2011. P. 557-564.

4. Bemdt D.J., Clifford J. Using Dynamic Time Warping to FindPatterns in Time Series // AAAI Proc. knowledge discovery in databases. 1994. P. 359-370.

5. A Review: Automatic Speech Segmentation / Sakran A.E. [et al.] // International Jornal of Computer Science and Mobile Computing. 2017. Vol. 6, No. 4. P. 308-315.

6. Makowski R., Hossa R. Automatic speech signal segmentation based on the innovation adaptive filter // International Journal of Applied Mathematics and Computer Science. 2014. Vol. 24, No. 2. P. 259-270.

7. Kamarauskas J. Automatic Segmetation of Phonemes using Artificial Neural Networks // Elektronika ir Elektrotechnika. 2006. Vol. 72, No. 8. P. 39-42.

8. Automatic Silence/Unvoiced/Voiced Classification of Bangla Velar Phonemes: New Approach / Syed Akhter Hossain [et al.] // 8th ICCIT. Dhaka, 2005.

9. . Highly accurate phonetic segmentation using boundary correction models and system fusion / A. Stolcke [et al.] // 2014 IEEE International Conference on Acoustic, Speech and Signal Processing (ICASSP). IEEE, 2014. P. 5552-5556.

10. Method for protecting speech information / H.V. Davydau [et al.] // Doklady BGUIR. 2015. N° 8 (94). P. 107-110.

11. Rationale for the method of formation of the combined speech masking signals / Y. Seitkulov [et al.] // IEEE 8th International Conference on Application on Information and Communication Technologies (AICT). Astana, Kazakhstan, 2014.

12. Sorokin V.N. Segmentation of the period of the fundamental tone of a voice source // Acoustical Physics. 2016. Vol. 62, No. 2. P. 244-254.

13. Algoritym of forming speech base units using the method of dynamic programming / Seitkulov Y.N. [et al.] // Journal of Theoretical and Applied Information Technology. 2018. Vol. 96, No 23. P. 7928-7941.

Рецензия

Для цитирования:

Сейткулов Е.Н., Боранбаев С.Н., Потапович А.В., Давыдов Г.В. Сегментация речи на фонетические элементы для систем защиты речевой информации. Доклады БГУИР. 2019;(5):66-71. https://doi.org/10.35596/1729-7648-2019-123-5-66-71

For citation:

Seitkulov Y.N., Boranbayev S.N., Patapovich A.V., Davydau H.V. Segmentation of speech on phonetic elements for systems of speech information protection. Doklady BGUIR. 2019;(5):66-71. (In Russ.) https://doi.org/10.35596/1729-7648-2019-123-5-66-71

JATS XML

Контент доступен под лицензией Creative Commons Attribution 4.0 License.

ISSN 1729-7648 (Print)
ISSN 2708-0382 (Online)

Логин
Пароль
	Запомнить меня
Регистрация нового пользователя Забыли Ваш пароль?

Войти

Доклады БГУИР

Сегментация речи на фонетические элементы для систем защиты речевой информации

Полный текст:

Аннотация

Ключевые слова

Об авторах

Список литературы

Рецензия

Для цитирования:

For citation:

Использование куки-файлов