
Ученые записки Казанского университета. Серия Физико-математические науки

Система автоматического построения графов знаний математических документов


В настоящей работе представлен процесс создания системы автоматизированного построения графов знаний для коллекций математических документов в формате LATEX. Разработана онтология MathCollectionOntology, определяющая типы объектов и связей в графах знаний. Представлены инструменты, включающие методы извлечения математических терминов, выделения тематик документов, извлечения сущностей из LATEX-кода, а также инструменты для вычисления статистических параметров графа.
Среди выделяемых сущностей: математические термины, тематики, полученные методом латентного размещения Дирихле, коды УДК, использованные формулы, аффилиации авторов, использованная литература и другие. Каждый извлеченный объект записывается в граф знаний с использованием определенных типов связей, выделенных в разработанной онтологии MathCollectionOntology.
С использованием разработанной системы проведены построение и анализ графа знаний для коллекции научных статей журнала «Известия высших учебных заведений. Математика», включающей 1114 русскоязычных статей в формате LATEX. Выделен терминологический состав тематик документов. Получены количественные параметры построенного графа знаний коллекции.

Об авторах

О. А. Невзорова
Казанский (Приволжский) федеральный университет

Невзорова Ольга Авенировна, кандидат технических наук, доцент кафедры информационных систем

ул. Кремлевская, д. 18, г. Казань, 420008

Б. Т. Гизатуллин
Казанский (Приволжский) федеральный университет

Гизатуллин Булат Тимурович, магистрант кафедры математической статистики Института математики и механики им. Н.И. Лобачевского

ул. Кремлевская, д. 18, г. Казань, 420008

Невзорова О.А., Гизатуллин Б.Т. Система автоматического построения графов знаний математических документов. Ученые записки Казанского университета. Серия Физико-математические науки. 2023;165(3):264-281.

Nevzorova O.A., Gizatullin B.T. A system for automatic construction of knowledge graphs of mathematical documents. Uchenye Zapiski Kazanskogo Universiteta. Seriya Fiziko-Matematicheskie Nauki. 2023;165(3):264-281. (In Russ.)

