Preview

Вестник НГУ. Серия: Информационные технологии

Расширенный поиск

Модель текста научно-технической статьи для разметки в корпусе научно-технических текстов

https://doi.org/10.25205/1818-7900-2022-20-3-5-13

Аннотация

В статье предложена модель текста научно-технической статьи для автоматизации разметки в корпусе научно-технических текстов. Обосновано, что при создании корпуса научно-технических текстов необходимо учитывать структурные особенности текстов научно-технических статей. Показана необходимость добавления структурной разметки в корпус научно-технических текстов. Отмечено, что тексты научно-технических статей имеют одинаковую для всех текстов этого класса структуру изложения материала, а также содержат ограниченный набор структурных элементов. Проанализированы особенности композиционной организации текстов научно-технических статей. Описано примерное содержание каждого из элементов структуры статьи. Представлена композиционная структура текстов научно-технических статей в нотациях Бекуса-Наура. Предложена модель текста научно-технической статьи в виде графа, вершинами и ребрами которого являются полноценные структурные элементы научно-технической статьи. Обосновано, что представление текста научно-технической статьи в виде графа дает возможность в процессе компьютерного анализа текста определить тип структурного элемента, степень вложенности, за счет подачи научно-технической статьи в виде конечного множества ее составных частей. Обосновано, что наличие структурной разметки в корпусе научно-технических текстов значительно расширит его исследовательский потенциал и послужит базой для задач автоматической обработки научно-технических текстов.

Об авторе

Ю. И. Бутенко
Московский государственный технический университет им. Н. Э. Баумана
Россия

 Бутенко Юлия Ивановна, кандидат технических наук, доцент кафедры «Романо-германские языки»

Москва 



Список литературы

1. Захаров В. П. Корпуса русского языка // Труды института русского языка имени В. В. Виноградова. 2015. Т.6. С. 20–65.

2. Кружков М. Г. Информационные ресурсы контрастивных лингвистических исследований: электронные корпуса текстов // Системы и средства информатики. 2015. Т. 25, № 2. С. 140–159.

3. Нагель О. В. Корпусная лингвистика и ее использование в компьютеризированном языковом обучении // Язык и культура. 2008. № 4. С. 53–59.

4. Соловьева А. Е. Англоязычные тексты военной авиации как основа лингвистического корпуса // Балтийский гуманитарный журнал. 2019. № 3 (28). С. 369–372.

5. Лесников В. С. Виды разметок текстовых корпусов русского языка // Научно-техническая информация. Серия 2. Информационные процессы и системы. 2019. №9. С. 27–30.

6. Ванюшкин А. С. О разметке корпусов текстов ключевыми словами // Новые информационные технологии в автоматизированных системах. 2018. № 21. C. 207–211.

7. Бутенко Ю. И. Влияние лингвистических особенностей текстов стандартов на информационный поиск // Филологические науки. Научные доклады высшей школы. 2019. № 6. С. 29–35. DOI: 10.20339/PhS.6-19.029

8. Попова Т. Г. Структура испанской научно-технической статьи как первичного жанра научного дискурса // Вестник Российского университета дружбы народов. Серия: Русский и иностранные языки, и методика их преподавания. 2004. № 1. С. 108–115.

9. Романов Д. А. Кратко о структуре экспериментальной научной статьи на английском языке // Вестник Казанского технологического университета. 2014. Т. 17, № 6. С. 325–327.

10. Раицкая Л. К. Структура научной статьи по политологии и международным отношениям в контексте качества научной информации // Полис. Политические исследования. 2019. № 1. С. 167–181.

11. Sidnyaev N. I. Mathematical apparatus for engineering-linguistic models // AIP Conference Proceedings. 2019. Vol. 2195. No. 1. P. 020033. DOI: 10.1063/1.5140133

12. Бутенко Ю. И. Модель текста стандарта при информационном поиске в коллекции документов нормативной базы // Вестник компьютерных и информационных технологий. 2020. – Т. 17, № 11. С. 23–32. DOI: 10.14489/vkit. 2020.11

13. Попова Н. Г. Введение к научной статье на английском языке: структура и композиция // Высшее образование в России. 2015. № 6. С. 52–58.

14. Иванов В. П. Как написать научную статью (структура материала и организация работы) // Вестник Полоцкого государственного университета. Серия В. Промышленность. Прикладные науки. 2016. № 3. С. 195.


Рецензия

Для цитирования:


Бутенко Ю.И. Модель текста научно-технической статьи для разметки в корпусе научно-технических текстов. Вестник НГУ. Серия: Информационные технологии. 2022;20(3):5-13. https://doi.org/10.25205/1818-7900-2022-20-3-5-13

For citation:


Butenko Yu.I. Model of the Text of a Scientifc and Technical Article for Markup in the Corpus of Scientifc and Technical Texts. Vestnik NSU. Series: Information Technologies. 2022;20(3):5-13. (In Russ.) https://doi.org/10.25205/1818-7900-2022-20-3-5-13

Просмотров: 180


Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-7900 (Print)
ISSN 2410-0420 (Online)