Preview

Доклады БГУИР

Расширенный поиск

МЕТОД КОРРЕКЦИИ СЛУХА НА ОСНОВЕ ПСИХОАКУСТИЧЕСКИ ОБУСЛОВЛЕННОГО ПЕРЕНОСА ЧАСТОТ В РЕЧЕВОМ СИГНАЛЕ

https://doi.org/10.35596/1729-7648-2020-18-1-43-51

Аннотация

Целью работы являлась разработка метода обработки речевого сигнала для коррекции слуховых патологий на основе психоакустически обусловленного переноса высокочастотных составляющих спектра сигнала в низкочастотную область с последующим частотно-зависимым усилением. Для достижения поставленной цели были решены задачи, связанные с разработкой принципов переноса частот в речевом сигнале. Разработанный метод является адаптивным, его настройка осуществляется согласно аудиограмме тугоухого человека. Для переноса частот выбираются две частотных полосы: исходная (откуда производится перенос) и целевая (куда производится перенос). Ширина исходной частотной полосы фиксирована, а ширина целевой полосы выбирается адаптивно. Перенос спектра выполняется только для согласных звуков, восприятие которых тугоухими людьми затруднено. Классификация звуков по признаку гласный/согласный/пауза реализована на базе нейронной сети. В качестве информационных признаков выбирались: среднее число переходов через нуль, кратковременная энергия, кратковременная амплитуда, нормализованная автокорреляционная функция и первый спектральный момент. Чтобы сохранить максимально натуральное звучание переносимых звуков используется концепция равной громкости. Для компенсации ослабления восприятия звука тугоухим человеком используется частотно-зависимое усиление сигнала на основе аудиограммы. Эффективность предложенного метода проверена экспериментально с использованием моделирования эффекта потери слуха. В эксперименте учувствовали 10 человек, которым давали прослушивать записи, пропущенные через модель потери слуха, а также записи, прощенные через модель потери слуха с последующей коррекцией. Результаты показали, что применение разработанного метода коррекции слуха в среднем улучшает разборчивость речи на 6 %.

Об авторах

М. И. Порхун
Белорусский государственный университет информатики и радиоэлектроники
Беларусь

Порхун Максим Игоревич, ассистент кафедры электронных вычислительных средств

220013, г. Минск, ул. П. Бровки, д. 6, тел. +375-17-293-84-20



М. И. Вашкевич
Белорусский государственный университет информатики и радиоэлектроники
Беларусь
к.т.н., доцент, доцент кафедры электронных вычислительных средств


Список литературы

1. Simpson A. Frequency-lowering devices for managing high-frequency hearing loss: a review. Trends in amplification. 2009;13(2):87-106. DOI: 10.1177/1084713809336421.

2. Alexander J.M. Individual variability in recognition of frequency-lowered speech. Seminars in Hearing. 2013;34(2):86-109. DOI: 10.1055/s-0033-1341346.

3. Robinson J.D., Baer T., Moore B. Using transposition to improve consonant discrimination and detection for listeners with severe high-frequency hearing loss. International Journal of Audiology. 2007;46(6):293-308. DOI: 10.1080/14992020601188591.

4. Hogan C.A., Turner C.W. High-frequency audibility: Benefits for hearing-impaired listeners. The Journal of the Acoustical Society of America. 1998;104:432-441. DOI: 10.1121/1.423247.

5. Королёва И.В. Введение в аудиологию и слухопротезирование. СПб: КАРО; 2012.

6. Фонлантен А., Хорст А. Слуховые аппараты. Ростов н/Д.: Феникс; 2009.

7. Traunmuller H. Analytical Expressions for the tonotopic sensory scale. Acoustical Society of America. 1990; 88(1):97-100. DOI: 10.1121/1.399849.

8. Liu Y.-T., Chang R.Y., Tsao Y., Chang Y.-P. A new frequency lowering technique for Mandarin-speaking hearing aid users. IEEE Global Conference on Signal and Information Processing (GlobalSIP), Orlando, FL. 2015;722-726. DOI: 10.1109/GlobalSIP.2015.7418291.

9. Николенко С.И., Архангельская Е.В., Кадурин А.А. Глубокое обучение. Погружение в мир нейронных сетей. СПб.: Питер; 2019.


Рецензия

Для цитирования:


Порхун М.И., Вашкевич М.И. МЕТОД КОРРЕКЦИИ СЛУХА НА ОСНОВЕ ПСИХОАКУСТИЧЕСКИ ОБУСЛОВЛЕННОГО ПЕРЕНОСА ЧАСТОТ В РЕЧЕВОМ СИГНАЛЕ. Доклады БГУИР. 2020;18(1):43-51. https://doi.org/10.35596/1729-7648-2020-18-1-43-51

For citation:


Porhun M.I., Vashkevich M.I. HEARING CORRECTION METHOD BASED ON PSYCHOACOUSTICALLY MOTIVATED FREQUENCY TRANSPOSITION IN A SPEECH SIGNAL. Doklady BGUIR. 2020;18(1):43-51. (In Russ.) https://doi.org/10.35596/1729-7648-2020-18-1-43-51

Просмотров: 2679


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1729-7648 (Print)
ISSN 2708-0382 (Online)