Preview

Вестник НГУ. Серия: Информационные технологии

Расширенный поиск

Сравнение методов машинного обучения для решения задачи анализа тональности

https://doi.org/10.25205/1818-7900-2024-22-3-49-61

Аннотация

   Сеть «Интернет» позволяет делиться своим мнением со всем миром, и эти данные используются для анализа отношения общества к тому или иному субъекту. С течением времени эмоционально окрашенных текстов становится все больше. Современные технологии позволяют обрабатывать огромные массивы данных в кратчайшие сроки, что по-настоящему важно при реализации анализа тональности, который является одним из актуальных направлений автоматической обработки естественного языка. Нами был собран и размечен корпус текстов отзывов на медицинские услуги. Также были апробированы три способа решения задачи анализа тональности, относящиеся к методам традиционного или глубокого машинного обучения. Проведен сравнительный анализ полученных результатов. Размеченный нами корпус выложен в открытый доступ и может быть использован для других исследований.

Об авторах

М. В. Швенк
Новосибирский государственный университет
Россия

Милана Владимировна Швенк, бакалавр

Новосибирск



Е. П. Бручес
Новосибирский государственный университет; Институт систем информатики им. А. П. Ершова СО РАН
Россия

Елена Павловна Бручес, младший научный сотрудник, старший преподаватель

Новосибирск



А. Я. Леман
Новосибирский государственный университет
Россия

Анна Яковлевна Леман, старший преподаватель

Новосибирск



Список литературы

1. Андросов А. Ю., Бородащенко А. Ю., Леонидова К. С. Алгоритм определения тональности публикаций СМИ к должностным лицам государственных органов // Известия ТулГУ. Технические науки. 2020. № 2. С. 47–53.

2. Ксенофонтов Г. С. Тональный анализ новостей экономики // Скиф. Вопросы студенческой науки. 2022. № 5 (69). С. 584–589.

3. Пазельская А. Г., Соловьев А. Н. Метод определения эмоций в текстах на русском языке // Компьютерная лингвистика и интеллектуальные технологии : Тр. Междунар. конференции «Диалог’2014». М.: Наука, 2014. C. 574–586.

4. Самигулин Т. Р., Джурабаев А. Э. У. Анализ тональности текста методами машинного обучения // Научный результат. Информационные технологии. 2021. Т. 6, № 1. С. 55–62. DOI: 10.18413/2518-1092-2021-6-1-0-7

5. Пескишева Т. А. Методы анализа тональности текстов на естественном языке // Общество. Наука. Инновации (НПК-2017). 2017. С. 1730–1742.

6. Астапов Р. Л., Дубатов Р. С. Классификация текстов с помощью сверточных нейронных сетей // Вестник науки. 2020. № 8 (29). С. 53–56.

7. Воробьев Н. В., Пучков Е. В. Классификация текстов с помощью сверточных нейронных сетей // Молодой исследователь Дона. 2017. № 6 (9). С. 2–7.

8. Бодрунова С. С. Кросс-культурный тональный анализ пользовательских текстов в Твиттере // Вестник Моск. ун-та. Серия 10. Журналистика. 2018. № 6. С. 191–212. DOI: 10.30547/vestnik.journ.6.2018.191212

9. Шунина Ю. С. Влияние способа формирования обучающей и тестовой выборок на качество классификации // Вестник УлГТУ. 2015. № 2 (70). С. 43–46.

10. Скрипачев В. О., Гуйда М. В., Гуйда Н. В., Жуков А. О. Особенности работы сверточных нейронных сетей // International Journal of Open Information Technologies. 2022. № 12. С. 5361.

11. Майоров Д. В. Применение глубокого обучения в предиктивном вводе // Научный журнал. 2023. № 2 (67). С. 19–25.

12. Muhamediyeva D. K., Abdurakhmanova N. N., Mirzayeva N. S. Using conventional neural networks for the problem of text classification // Central Asian Academic Journal of Scientific Research. 2021. No. 1. p. 213–220.

13. Abinash Tripathy. Sentiment Analysis Using Machine Learning Techniques : dissertation // Department of Computer Science and Engineering National Institute of Technology Rourkela. 2017. p. 131.

14. Бородин А. И., Вейнберг Р. Р., Литвишко О. В. Методы обработки текста при создании чат-ботов // Хуманитарни Балкански изследвания. 2019. № 3 (5). С. 108–111. DOI: 10.34671/SCH.HBR.2019.0303.0026

15. Сафаров Л. С. Использование технологии text mining при автоматической обработке текста // Экономика и социум. 2023. № 1−2 (104). С. 639–642.

16. Бербасов В. Д. Сравнительный обзор библиотек нейронных сетей Keras и Pytorch // Экономика и социум. 2023. № 8 (111). С. 423–426.

17. Васильченко А. М. Решение задач анализа данных на основе машинного обучения // Universum: технические науки. 2023. № 9−1 (114). С. 50–54. DOI: 10.32743/Uni-Tech.2023.114.9.15959

18. Шунина Ю. С., Алексеева В. А., Клячкин В.Н. Критерии качества работы классификаторов // Вестник УлГТУ. 2015. № 2 (70). С. 67–70.

19. Bing Liu. Sentiment Analysis and Opinion Mining // Morgan & Claypool Publishers. 2012. P. 168.

20. Ткаченко А. Л. Решение задачи классификации документов вуза на основе методов интеллектуального анализа // Вестник кибернетики. 2021. № 1 (41). С. 12–19. DOI: 10.34822/1999-7604-2021-1-12-19

21. Гальченко Ю. В., Нестеров С. А. Классификация текстов по тональности методами машинного обучения // SAEC. 2023. № 3. С. 369–378. DOI: 10.18720/SPBPU/2/id23-501

22. Юркина А. В., Крутиков А. К. Разработка специализированного программного модуля формирования обучающей выборки для нейрогороскопа // Universum: технические науки. 2023. № 10-1 (115). С. 61–65.

23. Hochreiter S., Bengio Y., Frasconi P. Schmidhuber J. Gradient flow in recurrent nets: the difficulty of learning long-term dependencies // IEEE Press. 2001. no. 1. p. 15.

24. Пустынный Я. Н. Решение проблемы исчезающего градиента с помощью нейронных сетей долгой краткосрочной памяти // Инновации и инвестиции. 2020. № 2. C. 130–132.


Рецензия

Для цитирования:


Швенк М.В., Бручес Е.П., Леман А.Я. Сравнение методов машинного обучения для решения задачи анализа тональности. Вестник НГУ. Серия: Информационные технологии. 2024;22(3):49-61. https://doi.org/10.25205/1818-7900-2024-22-3-49-61

For citation:


Shvenk M.V., Bruches E.P., Leman A.Y. Comparison of machine learning methods for sentiment analysis. Vestnik NSU. Series: Information Technologies. 2024;22(3):49-61. (In Russ.) https://doi.org/10.25205/1818-7900-2024-22-3-49-61

Просмотров: 174


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-7900 (Print)
ISSN 2410-0420 (Online)