Онтологический подход к обработке текстов китайского языка
https://doi.org/10.35596/1729-7648-2020-18-6-49-56
Аннотация
Для реализации естественно-языкового пользовательского интерфейса и интеллектуального ответа на вопросы на основе знаний в работе предлагается модель обработки китайского языка, основанная на знаниях. В статье рассматриваются существующие методы обработки естественного языка и различные базы знаний, связанные с обработкой естественного языка. На основе анализа данных методов был сделан вывод о том, что в обработке естественного языка база знаний является самой основной и важной частью. База знаний позволяет обеспечить обработку естественного языка, основываясь на изначально описанных знаниях, а также объяснить процесс обработки. На основании анализа различных методов построения баз знаний об английском и китайском языках был предложен онтологический подход к обработке китайского языка. В модели обработки китайского языка можно выделить два основных аспекта исследования: построение базы знаний о китайском языке и разработка решателя задач на основе онтологии. Предложенный подход направлен на разработку семантической модели знаний о китайском языке. Как один из этапов реализации подхода была построена онтология китайского языка, которую можно использовать в дальнейшем для обработки китайского языка. В данной работе рассмотрены первая версия указанной онтологии и принцип построения базы знаний о китайском языке. Для построения онтологии на данном этапе нет единых стандартов и системы оценки. Расширение и улучшение онтологии и оценка ее качества требуют дальнейших исследований.
Об авторе
Ц. ЛунвэйБеларусь
Цянь Лунвэй, аспирант кафедры интеллектуальных информационных технологий
220037, Республика Беларусь, г. Минск, ул. Платонова, 39
тел. +375-29-721-60-63
Список литературы
1. Zong C.Q., Cao Y.Q., Yu S.W. Sixty Years of Chinese Information Processing. Applied Linguistics. 2009;01 (04):53-61. DOI: 10.16499/j.cnki.1003-5397.2009.04.007.
2. Liu Z.Y. Knowledge guided natural language understanding. Seventh China Conference on Data Mining. 2018;01:199-206.
3. YU S.W. The Basic Processing of Contemporary Chinese Corpus at Peking University Specification. Journal of Chinese information processing. 2002;16(05):49-64.
4. Jia J.Z., Dong G. The Study on Integration of CFN and VerbNet, WordNet. New Technology of Library and Information Service. 2008;01(06):06-10.
5. Dong Z.D., Dong Qiang. Theoretical Findings of Hownet. Journal of Chinese information processing. 2007;21(04):03-09.
6. Golenkov V.V. Ontology-based Design of Intelligent Systems. Open semantic technology for intelligent systems. 2017;02:37-56.
7. Shunkevich D.V. Ontology-based design of knowledge processing machines. Open semantic technology for intelligent systems. 2017;02:73-94.
8. Davydenko I.T. Ontology-based knowledge base design. Open semantic technology for intelligent systems. 2017;02:57-72.
9. Jie C.Y. Some Key Issues upon Contemporary Chinese Language Word Segmentation Standard Used for Information Processing. Journal of Chinese information processing. 1989;03(04): 3-41.
Рецензия
Для цитирования:
Лунвэй Ц. Онтологический подход к обработке текстов китайского языка. Доклады БГУИР. 2020;18(6):49-56. https://doi.org/10.35596/1729-7648-2020-18-6-49-56
For citation:
Longwei Q. Ontological approach to Chinese text processing. Doklady BGUIR. 2020;18(6):49-56. (In Russ.) https://doi.org/10.35596/1729-7648-2020-18-6-49-56