Перспективные результаты исследований и разработки в области обработки изображений и речевых сигналов
https://doi.org/10.35596/1729-7648-2024-22-2-55-69
Аннотация
Представлен анализ перспектив развития технологий обработки изображений и речевых сигналов. Приведены основные результаты по данным направлениям, полученные за последние годы в соответствующих научных школах Белорусского государственного университета информатики и радиоэлектроники. Показано, что использование технологий машинного обучения в сочетании с методами цифровой обработки изображений и речевых сигналов позволяет существенно повысить эффективность систем их распознавания и классификации.
Об авторах
Д. С. ЛихачёвБеларусь
канд. техн. наук, доц., доц. каф. электронных вычислительных средств
Ц. Ма
Беларусь
ассист. каф. инфокоммуникационных технологий
Н. А. Петровский
Беларусь
канд. техн. наук, доц., доц. каф. электронных вычислительных средств
И. С. Азаров
Беларусь
д-р техн. наук, проф., зав. каф. электронных вычислительных средств
В. Ю. Цветков
Беларусь
Цветков Виктор Юрьевич, д-р техн. наук, проф., зав. каф. инфокоммуникационных технологий
220013, г. Минск, ул. П. Бровки, 6
Тел.: +375 17 293-84-08
Список литературы
1. GII. Global Information [Электронный ресурс]. Режим доступа: https://www.giiresearch.com/. Дата доступа: 29.01.2024.
2. Fortune Business Insights Information [Электронный ресурс]. Режим доступа: https://www.fortunebusinessinsights.com/. Дата доступа: 29.01.2024.
3. Blum, H. A Transformation for Extracting New Descriptors of Shape / H. Blum. Cambridge: MIT Press, MA, 1967. P. 362–380.
4. Saha, P. K. A Survey on Skeletonization Algorithms and Their Applications / P. K. Saha, G. Borgefors, G. Sanniti di Baja // Pattern Recognition Letter. 2016. Vol. 76. P. 3–12. DOI: 10.1016/j.patrec.2015.04.006.
5. Ogniewicz, R. L. Hierarchic Voronoi Skeletons / R. L. Ogniewicz, O. Kübler // Pattern Recognition. 1995. Vol. 28. P. 343–359.
6. Leymarie, F. Simulating the Grassfire Transform Using an Active Contour Model / F. Leymarie, M. D. Levine // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1992. Vol. 14. P. 56–75.
7. Saha, P. K. Skeletonization: Theory, Methods, and Applications / P. K. Saha, G. Borgefors, G. Sanniti di Baja // Academic Press. London. 2017.
8. Bai, X. Skeleton Pruning by Contour Partitioning with Discrete Curve Evolution / X. Bai, L. J. Latecki, W. Y. Liu // IEEE Trans. Pattern Anal. Mach. Intell. 2007. Vol. 29, No 3. P. 449–462. DOI: 10.1109/TPAMI.2007.59.
9. Skeleton Pruning as Trade-Off Between Skeleton Simplicity and Reconstruction Error / S. Wei [et al.] // Sci. China Inf. Sci. 2013. Vol. 56. P. 1–14. DOI: 10.1007/s11432-012-4715-3.
10. A Skeleton Pruning Algorithm Based on Information Fusion / H. Liu [et al.] // Pattern Recognit. Lett. 2013. Vol. 34, No 10. P. 1138–1145. DOI: 10.1016/j.patrec.2013.03.013.
11. A Skeleton Pruning Method Based on Saliency Sorting / G. Siyu [et al.]// 14th IEEE International Conference on Electronic Measurement & Instruments, Changsha, China. 2019. P. 593–599. DOI: 10.1109/ICEMI46757.2019.9101710.
12. Latecki, L. J. Convexity Rule for Shape Decomposition Based on Discrete Contour Evolution / L. J. Latecki, R. Lakämper // Comput. Vis. Image Underst. 1999. Vol. 73, No 3. P. 441–454. DOI: 10.1006/cviu.1998.0738.
13. Latecki, L. J. Polygon Evolution by Vertex Deletion / L. J. Latecki, R. Lakämper // Lect. Notes Comput. Sci. (Including Subser. Lect. Notes Artif. Intell. Lect. Notes Bioinformatics), Springer, Berlin, Heidelberg. 1999. Vol. 1682. P. 398–409. DOI: 10.1007/3-540-48236-9_35.
14. Latecki, L. J. Shape Similarity Measure Based on Correspondence of Visual Parts / L. J. Latecki, R. Lakämper // IEEE Trans. Pattern Anal. Mach. Intell. 2000. Vol. 22, No 10. P. 1185–1190. DOI: 10.1109/34.879802.
15. Ma, J. A Novel Fast Iterative Parallel Thinning Algorithm / J. Ma, X. H. Ren, V. Yu. Tsviatkou // Proceedings of the 2020 4th International Conference on Vision, Image and Signal Processing, New York, NY, USA. 2020. Article 7. P. 1–5. DOI: 10.1145/3448823.3448836.
16. Choi, W. Extraction of the Euclidean Skeleton Based on a Connectivity Criterion / W. Choi, K. Lam, W. Siu // Pattern Recognition. 2003. Vol. 36. P. 721–729. DOI: 10.1016/S0031-3203(02)00098-5.
17. Novel Fully Parallel Skeletonization Algorithm / J. Ma [et al.] // Pattern Analysis and Applications. 2021. P. 1–20. DOI: 10.1007/s10044-021-01039-y.
18. Noise-Against Skeleton Extraction Framework and Application on Hand Gesture Recognition / J. Ma [et al.] // IEEE Access. 2023. Vol. 11. P. 9547–9559. DOI: 10.1109/ACCESS.2023.3240313.
19. A One-Pass Thinning Algorithm and Its Parallel Implementation / R. T. Chin [et al.]// Computer Vision, Graphics and Image Processing. Vol. 40. P. 30–40. DOI: 10.1016/0734-189X(87)90054-5.
20. Ma, J. Hand Gesture Recognition Based on Skeletal Image Properties / J. Ma, V. Y. Tsviatkou, A.A. Boriskevich // Open Semantic Technologies for Intelligent Systems: Collec. of Sci. Pap. Minsk, 2023. Iss. 7. Р. 247–256.
21. Петровский, Н. А. Двумерные неразделимые банки фильтров на основе кватернионов / Н. А. Петровский, Е. В. Рыбенков, А. А. Петровский // Algorithms, Architectures, Arrangements, and Applications (SPA): тр. Междунар. науч.-техн. конф. Signal Processing, 2018. С. 120–125.
22. Рыбенков, Е. В. 2D неразделимая целочисленная реализация параунитарных банков фильтров на основе блочно-лестничной структуры / Е. В. Рыбенков, Н. А. Петровский // 27th European Signal Processing Conference (EUSIPCO): тр. Междунар. науч.-техн. конф., 2019. С. 1494–1499.
23. Рыбенков, Е. В. Проектирование неразделимых многомерных банков фильтров в алгебре кватернионов / Е. В. Рыбенков, Н. А. Петровский // Цифровая обработка сигналов и ее применение (DSPA’2019): тр. 21-й Междунар. конф., 2019., T. 2. C. 368–373.
24. Малоразмерные спектральные признаки для машинного обучения в задачах анализа и классификации голосового сигнала / Д. С. Лихачёв [и др.] // Информатика. 2023. T. 20, № 1. С. 102–112. DOI: 10.37661/1816-0301-2023-20-1-102-112.
25. Генеративный метод получения спектральных огибающих в контексте задачи анализа состояния голосовой функции человека / Д. С. Лихачёв [и др.] // Медэлектроника-2022. Средства медицинской электроники и новые медицинские технологии: сб. науч. ст. XI Междунар. науч.-тех. конф., г. Минск, 8–9 декабря 2022 г. Минск: Белор. гос. ун-т информ. и радиоэл., 2022. С. 281–283.
26. Комбинированный метод отбора информативных признаков для выявления речевых патологий по голосу / Д. С. Лихачёв [и др.] // Доклады БГУИР. 2023. Т. 21, № 4. C. 110–117. DOI: 10.35596/1729-7648-2023-21-4-110-117.
Рецензия
Для цитирования:
Лихачёв Д.С., Ма Ц., Петровский Н.А., Азаров И.С., Цветков В.Ю. Перспективные результаты исследований и разработки в области обработки изображений и речевых сигналов. Доклады БГУИР. 2024;22(2):55-69. https://doi.org/10.35596/1729-7648-2024-22-2-55-69
For citation:
Likhachov D.S., Ma J., Petrovsky N.A., Azarov I.S., Tsviatkou V.Yu. Promising Research and Development Results in the Field of Image and Speech Signal Processing. Doklady BGUIR. 2024;22(2):55-69. (In Russ.) https://doi.org/10.35596/1729-7648-2024-22-2-55-69