Том 22, № 3 (2024)

Метод извлечения многокомпонентных терминологических единиц с правыми определениями из научно-технических текстов

Ю. И. Бутенко

PDF (Rus)

5-14 195

В статье предложен метод извлечения русскоязычных многокомпонентных терминов, в структуре которых есть правые определения. Проведен анализ современных методов и программных средств извлечения специальной терминологии, а на его основе показано, что они охватывают термины только с левыми определениями. Исследована формальная структура многокомпонентных терминологических единиц с правыми определениями, где особое внимание уделено их грамматическим особенностям. Обоснована нецелесообразность применения лемматизации ко всем компонентам термина. Проанализирована корректность работы морфологических анализаторов в аспекте их применимости к извлечению многокомпонентных терминов. Приведены модели пятикомпонентных терминов, которые стали основой для разработки метода извлечения русскоязычных многокомпонентных терминов с правыми определениями. В моделях определены ядерный элемент, левое и правое определения, а также грамматические признаки правого определения. Проиллюстрированы различия в списках терминов-кандидатов при использовании традиционных подходов, использующих лемматизацию на первом этапе, и предложенного метода извлечения многокомпонентных терминов с правыми определениями.

Выбор оптимального языка программирования для генерации математических задач

Д. В. Винокурова

PDF (Rus)

15-27 271

Аннотация

Cравниваются математические библиотеки языков веб-программирования JavaScript, PHP, Python для создания генераторов в области некоторых тем математического анализа и вычислительной математики.

Основная цель исследования − провести эксперимент с заданным набором задач, используя библиотеки Math.js, Algebrite, Nerdamer, MathPHP, NumPy, SymPy, SciPy, чтобы определить оптимальные по функциональности и производительности для осуществления символьных и численных вычислений.

Экспериментальное исследование выполнялось с помощью перечисленных библиотек, в которых осуществлялось вычисление соответствующих задач с измерением скорости их выполнения. Представлен сравнительный анализ результатов исследования. Показаны основные проблемы, которые возникали в ходе эксперимента в различных библиотеках. Полученные результаты могут быть использованы разработчиками и исследователями, которые занимаются проектированием и реализацией генераторов математических задач. В процессе работы выявлено, что библиотеки JavaScript и PHP в полной мере не поддерживают все функции для создания генераторов математических задач. Python оказался намного эффективнее как в символьных, так и в численных вычислениях.

Дообучение модели CodeBERT для написания комментариев к SQL-запросам

Д. А. Комлев

PDF (Rus)

28-39 180

Аннотация

Автоматизированное создание комментариев к исходному коду – актуальная тема в разработке программного обеспечения, где модели машинного перевода применяются для «перевода» кода в текстовые описания. Предобученная на шести языках программирования модель CodeBERT используется для поиска кода, генерации документации, исправления ошибок. Эта модель хорошо понимает семантики естественного языка, языков программировани, а также связи между ними, эта модель хорошо подходит для дообучения на различные прикладные задачи, связанные с кодом. В статье рассматривается дообучение модели CodeBERT для генерации комментариев к SQL-запросам. Эта задача является актуальной, так как в крупных проектах может использоваться множество SQL-запросов различной сложности, и комментарии помогают улучшить их читаемость и понимание. Однако ручное написание и поддержание актуальности комментариев требует времени и усилий разработчиков. В статье предложено использовать предобученную модель CodeBERT для автоматической генерации комментариев к SQL-коду, что сократит время и позволит поддерживать комментарии в актуальном состоянии. Для дообучения используются открытые датасеты, содержание SQL-запрос, а также комментарий к нему. Результаты тестирования показали, что дообученная модель успешно справляется с задачей создания комментариев к SQL-запросам, что также подтверждается полученными значениями метрики Bleu.

Программно-аппаратные решения потоковой обработки данных для компенсации температурных дрейфов скважинного инклинометра «Луч»

В. С. Литвинов, А. А. Власов, Д. В. Тейтельбаум

PDF (Rus)

40-48 174

Аннотация

Новосибирское научно-производственное предприятие геофизической аппаратуры «Луч» разрабатывает и производит телеметрические системы, эксплуатируемые в процессе бурения нефтегазовых скважин. В их состав входит датчик ориентации (инклинометр), оценивающий положение прибора в скважине на основе сигналов с трех акселерометров и трех магнитометров. Модули системы работают в условиях повышенных температур (до 150 °С), и для обеспечения заданной погрешности измерений углов ориентации требуется компенсация температурных дрейфов. В данной работе приводятся оценки допустимых дрейфов показаний датчиков, температурная полиномиальная модель акселерометров и магнитометров, методика компенсации. Проведен эксперимент, по результатам которого определена пригодность используемой модели и методики.

Сравнение методов машинного обучения для решения задачи анализа тональности

М. В. Швенк, Е. П. Бручес, А. Я. Леман

PDF (Rus)

49-61 255

Аннотация

Сеть «Интернет» позволяет делиться своим мнением со всем миром, и эти данные используются для анализа отношения общества к тому или иному субъекту. С течением времени эмоционально окрашенных текстов становится все больше. Современные технологии позволяют обрабатывать огромные массивы данных в кратчайшие сроки, что по-настоящему важно при реализации анализа тональности, который является одним из актуальных направлений автоматической обработки естественного языка. Нами был собран и размечен корпус текстов отзывов на медицинские услуги. Также были апробированы три способа решения задачи анализа тональности, относящиеся к методам традиционного или глубокого машинного обучения. Проведен сравнительный анализ полученных результатов. Размеченный нами корпус выложен в открытый доступ и может быть использован для других исследований.

Логин
Пароль
	Запомнить меня
Регистрация нового пользователя Забыли Ваш пароль?

Войти

Вестник НГУ. Серия: Информационные технологии

Использование куки-файлов