Preview

Вестник НГУ. Серия: Информационные технологии

Расширенный поиск

Веб-платформа для фольклорных исследований на основе онтологии предметных областей

https://doi.org/10.25205/1818-7900-2021-19-2-53-64

Аннотация

Рассматривается веб-платформа, обеспечивающая размещение фольклорных материалов и проведение научных исследований. Фольклорные исследования связаны с изучением аудио- и видеоматериалов, фиксирующих воспроизведение элементов народного творчества на национальных языках, создание текстовых записей с переводами и комментариями на языке общего пользования (в данной работе переводы представлены на русском языке), построение картины мира на основе источников. Для структурирования и представления контента используется подход на основе онтологий, который позволяет описывать не только ресурсы, но и предметные знания в стиле Semantic Web, т. е. с помощью иерархий классов, объектов и связей между ними. Основной особенностью фольклорных исследований является необходимость синхронизации переводов (создание параллельных корпусов текстов) и разметки текстов сущностями предметной области (семантическая разметка). При этом каждый корпус сопоставляется определенной народности и имеет как свой национальный язык, так и свою уникальную систему понятий об окружающем мире. Такое представление предъявляет множество нестандартных требований к платформе, таких как работа с произвольными языками, поддержка множества онтологий, обеспечение создания и редактирования национальных предметных онтологий, семантическая разметка текстов, представление, навигация и поиск по разнородным ресурсам. Разработанная платформа предоставляет все необходимые инструменты для исследований, включая инструменты для разработки онтологий национальных предметных областей и ручного аннотирования текстов в режиме реального времени несколькими специалистами. Размещение ресурсов на платформе осуществляется на основе онтологии ресурсов, включающей такие понятия как корпус, видео- и аудиоресурсы, графическое изображение, персона, географическое место, жанр текста и т. п. Онтологии предметных областей представлены в виде иерархии, где на верхнем уровне размещается онтология универсалий, общая для всех фольклорных исследований, а наследуемые онтологии специализируются для каждого представленного национального корпуса. Веб-приложение построено на основе фреймворка Python Django и библиотеки TypeScript React, хранение данных реализовано с помощью базы данных Postgres.

Об авторах

В. А. Лисин
Новосибирский государственный университет
Россия

Лисин Владислав Александрович - студент магистратуры, НГУ.

Новосибирск.



Е. А. Сидорова
Институт систем информатики им. А.П. Ершова СО РАН
Россия

Сидорова Елена Анатольевна - кандидат физико-математических наук, старший научный сотрудник, ИСИ СО РАН, Лаборатория ИИ.

Новосибирск.



Список литературы

1. Pontus Stenetorp, Sampo Pyysalo, Goran Topic, Tomoko Ohta, Sophia Ananiadou, Jun'ichi Tsujii. Brat: a Web-based Tool for NLP-Assisted Text Annotation. In: Proceedings of the Demonstrations at the 13th Conference of the European Chapter of the Association for Computational Linguistics, 2012, p. 102-107.

2. Tobias Daudert. A Web-based Collaborative Annotation and Consolidation Tool. In: Proceedings of the 12th Conference on Language Resources and Evaluation, 2020, p. 7053-7059.

3. Juan Miguel Cejuela, Peter McQuilton, Laura Ponting, Steven J Marygold, Raymund Stefancsik, Gillian H Millburn. Tagtog: interactive and text-mining-assisted annotation of gene mentions in PLOS full-text articles. Database the Journal of Biological Databases and Curation, 2014, no. 2014, p. bau033.

4. Mathilde Janier, John Lawrence, Chris Reed. OVA+: An Argument Analysis Interface. Frontiers in Artificial Intelligence and Applications, 2014, no. 266, p. 463-464.

5. Кустова Г. И., Ляшевская О. Н., Падучева Е. В., Рахилина Е. В. Семантическая разметка лексики в Национальном корпусе русского языка: принципы, проблемы, перспективы // Национальный корпус русского языка: 2003-2005. Результаты и перспективы. М., 2005. С. 155-174.

6. Гриневич А. А. Онтология «Образы медвежьих песен хантов» для портала «Фольклор народов Сибири» // Вестник музыкальной науки. 2016. № 3 (13). С. 95-99.

7. Meghini C., Doerr M. A first-order logic expression of the CIDOC Conceptual Reference Model. International Journal of Metadata, Semantics and Ontologies, 2018, no. 13 (2), p. 131149.


Рецензия

Для цитирования:


Лисин В.А., Сидорова Е.А. Веб-платформа для фольклорных исследований на основе онтологии предметных областей. Вестник НГУ. Серия: Информационные технологии. 2021;19(2):53-64. https://doi.org/10.25205/1818-7900-2021-19-2-53-64

For citation:


Lisin V.A., Sidorova E.A. Web Platform for Folklore Research Based on Domain Ontology. Vestnik NSU. Series: Information Technologies. 2021;19(2):53-64. (In Russ.) https://doi.org/10.25205/1818-7900-2021-19-2-53-64

Просмотров: 138


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-7900 (Print)
ISSN 2410-0420 (Online)