Preview

Вестник НГУ. Серия: Информационные технологии

Расширенный поиск

Использование платформы TXM корпусного анализа для анализа текстов сообществ социальных сетей

https://doi.org/10.25205/1818-7900-2023-21-2-29-38

Аннотация

При формировании графов взаимодействующих объектов, построенных при импорте данных из социальных сетей и сетей мгновенного обмена сообщениями, в качестве атрибутов вершин выступают в том числе и текстовые данные. В настоящей работе авторы приводят описание методики исследования текстов, основанной на процедурах корпусного анализа. Целью данной статьи является проверка методологических средств, предоставляемых программным обеспечением TXM для сравнительного анализа текстов выделенных сообществ на графе взаимодействующих объектов. Метод предлагается для оценки качества выделения неявных сообществ на графе, полученном при импорте данных из сети каналов мессенджера Telegram.

Об авторах

А. И. Фокина
Национальный исследовательский университет «Высшая школа экономики» (НИУ ВШЭ)
Россия

Фокина Алина Игоревна, аспирант

Москва



А. А. Чеповский
Национальный исследовательский университет «Высшая школа экономики» (НИУ ВШЭ)
Россия

Чеповский Александр Андреевич, кандидат физико-математических наук, доцент

Москва



А. М. Чеповский
Национальный исследовательский университет «Высшая школа экономики» (НИУ ВШЭ); Российский университет дружбы народов (РУДН)
Россия

Чеповский Андрей Михайлович, доктор технических наук, профессор

Москва



Список литературы

1. Аванесян Н. Л., Соловьев Ф. Н., Чеповский А. А. Характеристики текстов сообществ социальных сетей // Вестник НГУ. Серия: Информационные технологии. 2021. Т. 19, № 1. С. 5–14. DOI: 10.25205/1818-7900-2021-19-1-5-14.

2. Лаврентьев А. М., Рябова Д. М., Тихомирова Е. А., Фокина А. И., Чеповский А. М., Шерстинова Т. Ю. Сравнительный анализ специальных корпусов текстов для задач безопасности // Вопросы кибербезопасности. 2020. № 3(37). С. 58–65. DOI: 10.21681/23113456-2020-03-58-65.

3. Лаврентьев А. М., Смирнов И. В., Соловьев Ф. Н., Суворова М. И., Фокина А. И., Чеповский А. М. Анализ корпусов текстов террористической и антиправовой направленности // Вопросы кибербезопасности. 2019. № 4(32). С. 54–60. DOI: 10.21681/2311-34562019-4-54-60.

4. Лаврентьев А. М., Соловьев Ф. Н., Суворова М. И., Фокина А. И., Чеповский А. М. Новый комплекс инструментов автоматической обработки текста для платформы TXM и его апробация на корпусе для анализа экстремистских текстов // Вестник НГУ. Серия: Лингвистика и межкультурная коммуникация. 2018 Т. 16 № 3 С. 19–31. DOI: 10.25205/18187935-2018-16-3-19-31.

5. Попов В. А., Чеповский А. А. Выделение неявных пересекающихся сообществ на графе взаимодействия Telegram-каналов с помощью «метода Галактик» // Труды ИСА РАН. Т. 72. 4/2022. С. 39–50. DOI: 10.14357/20790279220405.

6. Попов В. А., Чеповский А. А. Модели импорта данных из мессенджера Telegram // Вестник НГУ. Серия: Информационные технологии. 2022. Т. 20. № 2. С. 60–71. DOI: 10.25205/18187900-2022-20-2-60-71.

7. Соловьев Ф. Н. Автоматическая обработка текстов на основе платформы TXM с учетом анализа структурных единиц текста // Вестник НГУ. Серия: Информационные технологии. 2020. Т. 18. №1. С. 74–82. DOI: 10.25205/1818-7900-2020-18-1-74-82.

8. Чеповский А. А. Об особенностях построения и анализа графов взаимодействующих объектов в сети Telegram.-каналов. Вопросы кибербезопасности. 2023; 1(53):75-81. DOI: 10.21681/2311-3456-2023-1-75-81.

9. Чеповский А. А. О неявных сообществах на графе взаимодействующих объектов. Успехи кибернетики. 2023;4(1):56–64. DOI: 10.51790/2712-9942-2023-4-1-08.

10. Benzécri J.-P. L’analyse des données: l’analyse des correspondances. 2nd ed. Paris: Dunod, 1979. Vol. 2.

11. Fortunato, S., Newman, M. E. J. 20 years of network community detection. Nat. Phys. 2022; 18:848–850.

12. Heiden, S. The TXM Platform: Building Open-Source Textual Analysis Software Compatible with the TEI Encoding Scheme. In: Proceedings of the 24th Pacific Asia Conference on Language, Information and Computation. Sendai, Japan. P. 389–398.

13. Lavrentiev A., Sherstinova T., Chepovskiy A., Pincemin B. Using TXM Platform for Research on Language Changes over Time: The Dynamics of Vocabulary and Punctuation in Russian Literary Texts // Vestnik Tomskogo Gosudarstvennogo Universiteta, Filologiya. 2021. Vol. 70. P. 69-89. DOI: 10.17223/19986645/70/5.

14. Newman M. E. J. Networks: An Introduction. Oxford University Press, 2010. 784 p.

15. Schmid H. Probabilistic Part-of-Speech Tagging Using Decision Trees // Proc. of International Conference on New Methods in Language Processing. Manchester, UK. 1994. URL = http://www.cis.uni-muenchen.de/sschmid/tools/TreeTagger/data/tree-tagger1.pdf. (дата обращения: 30.05.2023).


Рецензия

Для цитирования:


Фокина А.И., Чеповский А.А., Чеповский А.М. Использование платформы TXM корпусного анализа для анализа текстов сообществ социальных сетей. Вестник НГУ. Серия: Информационные технологии. 2023;21(2):29-38. https://doi.org/10.25205/1818-7900-2023-21-2-29-38

For citation:


Fokina A.I., Chepovskiy A.A., Chepovskiy A.M. Using TXM Platform of Corpus Analysis for Text Analysis of Social Media. Vestnik NSU. Series: Information Technologies. 2023;21(2):29-38. (In Russ.) https://doi.org/10.25205/1818-7900-2023-21-2-29-38

Просмотров: 215


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-7900 (Print)
ISSN 2410-0420 (Online)