Веб-платформа для фольклорных исследований на основе онтологии предметных областей
https://doi.org/10.25205/1818-7900-2021-19-2-53-64
Аннотация
Рассматривается веб-платформа, обеспечивающая размещение фольклорных материалов и проведение научных исследований. Фольклорные исследования связаны с изучением аудио- и видеоматериалов, фиксирующих воспроизведение элементов народного творчества на национальных языках, создание текстовых записей с переводами и комментариями на языке общего пользования (в данной работе переводы представлены на русском языке), построение картины мира на основе источников. Для структурирования и представления контента используется подход на основе онтологий, который позволяет описывать не только ресурсы, но и предметные знания в стиле Semantic Web, т. е. с помощью иерархий классов, объектов и связей между ними. Основной особенностью фольклорных исследований является необходимость синхронизации переводов (создание параллельных корпусов текстов) и разметки текстов сущностями предметной области (семантическая разметка). При этом каждый корпус сопоставляется определенной народности и имеет как свой национальный язык, так и свою уникальную систему понятий об окружающем мире. Такое представление предъявляет множество нестандартных требований к платформе, таких как работа с произвольными языками, поддержка множества онтологий, обеспечение создания и редактирования национальных предметных онтологий, семантическая разметка текстов, представление, навигация и поиск по разнородным ресурсам. Разработанная платформа предоставляет все необходимые инструменты для исследований, включая инструменты для разработки онтологий национальных предметных областей и ручного аннотирования текстов в режиме реального времени несколькими специалистами. Размещение ресурсов на платформе осуществляется на основе онтологии ресурсов, включающей такие понятия как корпус, видео- и аудиоресурсы, графическое изображение, персона, географическое место, жанр текста и т. п. Онтологии предметных областей представлены в виде иерархии, где на верхнем уровне размещается онтология универсалий, общая для всех фольклорных исследований, а наследуемые онтологии специализируются для каждого представленного национального корпуса. Веб-приложение построено на основе фреймворка Python Django и библиотеки TypeScript React, хранение данных реализовано с помощью базы данных Postgres.
Об авторах
В. А. ЛисинРоссия
Лисин Владислав Александрович - студент магистратуры, НГУ.
Новосибирск.
Е. А. Сидорова
Россия
Сидорова Елена Анатольевна - кандидат физико-математических наук, старший научный сотрудник, ИСИ СО РАН, Лаборатория ИИ.
Новосибирск.
Список литературы
1. Pontus Stenetorp, Sampo Pyysalo, Goran Topic, Tomoko Ohta, Sophia Ananiadou, Jun'ichi Tsujii. Brat: a Web-based Tool for NLP-Assisted Text Annotation. In: Proceedings of the Demonstrations at the 13th Conference of the European Chapter of the Association for Computational Linguistics, 2012, p. 102-107.
2. Tobias Daudert. A Web-based Collaborative Annotation and Consolidation Tool. In: Proceedings of the 12th Conference on Language Resources and Evaluation, 2020, p. 7053-7059.
3. Juan Miguel Cejuela, Peter McQuilton, Laura Ponting, Steven J Marygold, Raymund Stefancsik, Gillian H Millburn. Tagtog: interactive and text-mining-assisted annotation of gene mentions in PLOS full-text articles. Database the Journal of Biological Databases and Curation, 2014, no. 2014, p. bau033.
4. Mathilde Janier, John Lawrence, Chris Reed. OVA+: An Argument Analysis Interface. Frontiers in Artificial Intelligence and Applications, 2014, no. 266, p. 463-464.
5. Кустова Г. И., Ляшевская О. Н., Падучева Е. В., Рахилина Е. В. Семантическая разметка лексики в Национальном корпусе русского языка: принципы, проблемы, перспективы // Национальный корпус русского языка: 2003-2005. Результаты и перспективы. М., 2005. С. 155-174.
6. Гриневич А. А. Онтология «Образы медвежьих песен хантов» для портала «Фольклор народов Сибири» // Вестник музыкальной науки. 2016. № 3 (13). С. 95-99.
7. Meghini C., Doerr M. A first-order logic expression of the CIDOC Conceptual Reference Model. International Journal of Metadata, Semantics and Ontologies, 2018, no. 13 (2), p. 131149.
Рецензия
Для цитирования:
Лисин В.А., Сидорова Е.А. Веб-платформа для фольклорных исследований на основе онтологии предметных областей. Вестник НГУ. Серия: Информационные технологии. 2021;19(2):53-64. https://doi.org/10.25205/1818-7900-2021-19-2-53-64
For citation:
Lisin V.A., Sidorova E.A. Web Platform for Folklore Research Based on Domain Ontology. Vestnik NSU. Series: Information Technologies. 2021;19(2):53-64. (In Russ.) https://doi.org/10.25205/1818-7900-2021-19-2-53-64