Автоматическое построение семантической сети для получения ответов на вопросы
https://doi.org/10.35596/1729-7648-2020-18-4-44-52
Аннотация
Выполнен анализ модели представления данных и знаний в виде семантической сети. Обоснован ее выбор для работы с текстовой информацией. Сформулирована задача автоматической генерации семантической сети на основе произвольного текста на русском языке. Приведены исходные данные, условия и ограничения, необходимые для алгоритма построения сети. В результате анализа части речи каждого слова и порядка слов в предложении установлены семантические отношения между словами. Создан словарь лексем, с помощью которого определяются части речи слов из предложений. Выбрано множество видов вопросов, используемых в семантической сети. Количество отношений в сети регулируется за счет возможности использовать только нужные типы связей при решении конкретной задачи. При этом отношения в семантической сети могут быть самых разных типов, что делает ее универсальной моделью представления данных и знаний. Разработан алгоритм, позволяющий получать ответы на поставленные вопросы. Рассмотрены предложения, для которых автоматически построена модель семантической сети. В предложенном алгоритме семантическая сеть интерпретируется как неориентированный граф, на котором для поиска ответа на вопрос применен алгоритм поиска в ширину. Разработанные алгоритмы реализованы в программном средстве, которое автоматически строит семантическую сеть для произвольного текста. Созданное программное средство позволяет задавать вопросы и получать на них ответы на основе информации, хранящейся в семантической сети. Эксперименты показали, что построенная семантическая сеть дает правильные ответы на поставленные ей вопросы. Сеть модифицируются путем добавления и удаления из нее информации. Есть возможность выбирать сложность структуры сети в зависимости от решаемой задачи. Предложенный подход к построению и работе с сетью позволяет использовать ее для текстов на разных языках, в информационных системах с естественно-языковым интерфейсом, для решения задач классификации и поиска информации.
Ключевые слова
Об авторах
В. В. ПотараевБеларусь
Потараев Виктор Витальевич, м.т.н., аспирант кафедры программного обеспечения информационных технологий
Лия Валентиновна Серебряная
Беларусь
Серебряная Лия Валентиновна, к.т.н., доцент, доцент кафедры программного обеспечения информационных технологий
220013, г. Минск, ул. П. Бровки, 6, тел. +375-17-293-84-93
Список литературы
1. Гаврилова Т.А. Базы знаний интеллектуальных систем. СПб.: Питер; 2000.
2. Рахимова Д.Р. Построение семантических отношений в машинном переводе. Вестник КазНУ им. аль-Фараби. Серия: Математика, механика и информатика. 2014;80(1):90-101.
3. Овчиева Ю.А. Семантическая сеть – перспективная платформа для системы управления знаниями. Вестник университета. 2015;3:14-16.
4. Осипов Г.С. Методы искусственного интеллекта. Москва: Физматлит; 2011.
5. Лукашевич Н.В. Тезаурусы в задачах информационного поиска. Москва: Издательство МГУ; 2011.
6. Усталов Д.А., Созыкин А.В. Комплекс программ автоматического построения семантической сети слов. Вестник ЮУрГУ. Серия: Вычислительная математика и информатика. 2017;6(2):69-83.
7. Wong W. Ontology Learning from Text: A Look Back and into the Future. ACM Computing Surveys. 2012;44(4):20:1-20:36.
8. Navigli R., Ponzetto S.P. BabelNet: The Automatic Construction, Evaluation and Application of a WideCoverage Multilingual Semantic Network. Artificial Intelligence. 2012;193:217-250.
9. Bouziane A., Bouchiha D., Doumi N., Malki M. Question Answering Systems: Survey and Trends. Procedia Computer Science. 2015;73:366-375.
10. Серебряная Л.В., Потараев В.В. Методы классификации текстовой информации на основе искусственной нейронной и семантической сетей. Информатика. 2016;52(4):95-103.
Рецензия
Для цитирования:
Потараев В.В., Серебряная Л.В. Автоматическое построение семантической сети для получения ответов на вопросы. Доклады БГУИР. 2020;18(4):44-52. https://doi.org/10.35596/1729-7648-2020-18-4-44-52
For citation:
Potaraev V.V., Serebryanaya L.V. Automatic generation of semantic network for question answering. Doklady BGUIR. 2020;18(4):44-52. (In Russ.) https://doi.org/10.35596/1729-7648-2020-18-4-44-52