Комбинированный метод отбора информативных признаков для выявления речевых патологий по голосу
https://doi.org/10.35596/1729-7648-2023-21-4-110-117
Аннотация
Задача выявления голосовых патологий отличается малым объемом доступных данных для обучения, вследствие чего системы классификации, использующие малоразмерные данные, являются наиболее актуальными. Предлагается совместное использование методов LASSO (least absolute shrinkage and selection operator) и BSS (backward stepwise selection) в отборе наиболее значимых признаков для задач определения голосовых патологий, в частности бокового амиотрофического склероза. Использованы признаки на основе мел-частотных кепстральных коэффициентов, традиционно применяемые в обработке речевых сигналов, и на основе дискретной оценки огибающей спектра авторегрессионного процесса. Вторые спектральные признаки извлекаются с помощью генеративного метода, предполагающего вычисление дискретного преобразования Фурье последовательности отчетов, сгенерированной с использованием авторегрессионной модели входного голосового сигнала. Последовательность генерируется таким образом, чтобы учесть периодическую природу преобразования Фурье. Это позволяет повысить точность оценки спектра и уменьшить эффект спектральной утечки. Отбор признаков с помощью методов LASSO и BSS позволил повысить эффективность классификации, используя меньшее число признаков, по сравнению с применением только метода LASSO.
Ключевые слова
Об авторах
Д. С. ЛихачёвБеларусь
Лихачёв Денис Сергеевич - кандидат технических наук, доцент, доцент кафедры электронных вычислительных средств.
220013, Минск, ул. П. Бровки, 6. Тел.: +375 17 293-85-05
М. И. Вашкевич
Беларусь
Доктор технических наук, доцент, доцент кафедры электронных вычислительных средств.
220013, Минск, ул. П. Бровки, 6
Н. А. Петровский
Беларусь
Кандидат технических наук, доцент, доцент кафедры электронных вычислительных средств.
220013, Минск, ул. П. Бровки, 6
И. С. Азаров
Беларусь
Доктор технических наук, доцент, заведующий кафедрой электронных вычислительных средств.
220013, Минск, ул. П. Бровки, 6
Список литературы
1. Rabiner, L. R. Fundamentals of Speech Recognition / L. R. Rabiner, B. H. Juang // Pearson Education. 1993.
2. Benba, A. Discriminating between Patients with Parkinson’s and Neurological Diseases Using Cepstral Analysis / A. Benba, A. Jilbab, A. Hammouch // IEEE Transactions on Neural Systems and Rehabilitation Engineering. 2016. Vol. 24, No 10. P. 1100–1108.
3. Vashkevich, M. Classification of ALS Patients Based on Acoustic Analysis of Sustained Vowel Phonations / M. Vashkevich, Y. Rushkevich // Biomedical Signal Processing and Control. 2021. Vol. 65. P. 1–14.
4. Amyotrophic Lateral Sclerosis / M. C. Kiernan [et al.] // Lancet. 2011. Vol. 377, Iss. 9769. P. 942–955.
5. Detection of Bulbar ALS Using a Comprehensive Speech Assessment Battery / Y. Yunusova [et al.] // Proceedings of the International Workshop on Models and Analysis of Vocal Emissions for Biomedical Applications. 2013. P. 217–220
6. Fractal Features for Automatic Detection of Dysarthria / T. Spangler [et al.] // IEEE EMBS International Conference on Biomedical Health Informatics. 2017. P. 437–440.
7. Малоразмерные спектральные признаки для машинного обучения в задачах анализа и классификации голосового сигнала / Д. С. Лихачёв [и др.] // Информатика. 2023. № 1. С. 102–112. DOI: 10.37661/18160301-2023-20-1-102-112.
8. Markel, J. D. Linear Prediction of Speech / J. D. Markel, A. H. Gray. Berlin, New York: Springer-Verlag, 1976. 290 p.
9. Вашкевич, М. И. Система анализа и классификации голосового сигнала на основе пертрубационных параметров и кепстрального представления в психоакустических шкалах / М. И. Вашкевич, Д. С. Лихачёв, И. С. Азаров // Доклады БГУИР. 2022. Т. 20, № 4. С. 73–82. DOI: https://doi.org/10.35596/1729-7648-2022-20-1-73-82.
10. Анализ акустических параметров голоса для выявления заболеваний гортани / М. И. Вашкевич [и др.] // Информатика. 2020. № 17. С. 78–86.
11. Flach, P. Machine Learning: the Art and Science of Algorithms that Make Sense of Data / P. Flach. Great Britain: Cambridge University Press, 2012. 416 p.
12. An Introduction to Statistical Learning with Applications in R / G. James [et al.]. Springer, 2013. 440 p.
13. Kotu, V. Data Science: Concepts and Practice / V. Kotu, B. Deshpande. 2 ed. USA: Morgan Kaufmann Publishers an Imprint of Elsevier, 2019.
14. Voice Database Used in the Article Classification of ALS Patients Based on Acoustic Analysis of Sustained Vowel Phonations [Electronic Resource]. Mode of access: https://github.com/Mak-Sim/Minsk2020_ALS_database. Date of access: 12.05.2023.
15. The Necessity of Leave One Subject Out (LOSO) Cross Validation for EEG Disease Diagnosis / S. Kunjan [et al.] // Brain Informatics. Springer, 2021. P. 558–567.
Рецензия
Для цитирования:
Лихачёв Д.С., Вашкевич М.И., Петровский Н.А., Азаров И.С. Комбинированный метод отбора информативных признаков для выявления речевых патологий по голосу. Доклады БГУИР. 2023;21(4):110-117. https://doi.org/10.35596/1729-7648-2023-21-4-110-117
For citation:
Likhachov D.S., Vashkevich M.I., Petrovsky N.A., Azarov E.S. Combined Method for Informative Feature Selection for Speech Pathology Detection. Doklady BGUIR. 2023;21(4):110-117. (In Russ.) https://doi.org/10.35596/1729-7648-2023-21-4-110-117