Preview

Вестник НГУ. Серия: Информационные технологии

Расширенный поиск
Том 22, № 3 (2024)
Скачать выпуск PDF
5-14 130
Аннотация

   В статье предложен метод извлечения русскоязычных многокомпонентных терминов, в структуре которых есть правые определения. Проведен анализ современных методов и программных средств извлечения специальной терминологии, а на его основе показано, что они охватывают термины только с левыми определениями. Исследована формальная структура многокомпонентных терминологических единиц с правыми определениями, где особое внимание уделено их грамматическим особенностям. Обоснована нецелесообразность применения лемматизации ко всем компонентам  термина. Проанализирована корректность работы морфологических анализаторов в аспекте их применимости к извлечению многокомпонентных терминов. Приведены модели пятикомпонентных терминов, которые стали основой для разработки метода извлечения русскоязычных многокомпонентных терминов с правыми определениями. В моделях определены ядерный элемент, левое и правое определения, а также грамматические признаки правого определения. Проиллюстрированы различия в списках терминов-кандидатов при использовании традиционных подходов, использующих лемматизацию на первом этапе, и предложенного метода извлечения многокомпонентных терминов с правыми определениями.

15-27 150
Аннотация

   Cравниваются математические библиотеки языков веб-программирования JavaScript, PHP, Python для создания генераторов в области некоторых тем математического анализа и вычислительной математики.

   Основная цель исследования − провести эксперимент с заданным набором задач, используя библиотеки Math.js, Algebrite, Nerdamer, MathPHP, NumPy, SymPy, SciPy, чтобы определить оптимальные по функциональности и производительности для осуществления символьных и численных вычислений.

   Экспериментальное исследование выполнялось с помощью перечисленных библиотек, в которых осуществлялось вычисление соответствующих задач с измерением скорости их выполнения. Представлен сравнительный анализ результатов исследования. Показаны основные проблемы, которые возникали в ходе эксперимента в различных библиотеках. Полученные результаты могут быть использованы разработчиками и исследователями, которые занимаются проектированием и реализацией генераторов математических задач. В процессе работы выявлено, что библиотеки JavaScript и PHP в полной мере не поддерживают все функции для создания генераторов математических задач. Python оказался намного эффективнее как в символьных, так и в численных вычислениях.

28-39 100
Аннотация

   Автоматизированное создание комментариев к исходному коду – актуальная тема в разработке программного обеспечения, где модели машинного перевода применяются для «перевода» кода в текстовые описания. Предобученная на шести языках программирования модель CodeBERT используется для поиска кода, генерации документации, исправления ошибок. Эта модель хорошо понимает семантики естественного языка, языков программировани, а также связи между ними, эта модель хорошо подходит для дообучения на различные прикладные задачи, связанные с кодом. В статье рассматривается дообучение модели CodeBERT для генерации комментариев к SQL-запросам. Эта задача является актуальной, так как в крупных проектах может использоваться множество SQL-запросов различной сложности, и комментарии помогают улучшить их читаемость и понимание. Однако ручное написание и поддержание актуальности комментариев требует времени и усилий разработчиков. В статье предложено использовать предобученную модель CodeBERT для автоматической генерации комментариев к SQL-коду, что сократит время и позволит поддерживать комментарии в актуальном состоянии. Для дообучения используются открытые датасеты, содержание SQL-запрос, а также комментарий к нему. Результаты тестирования показали, что дообученная модель успешно справляется с задачей создания комментариев к SQL-запросам, что также подтверждается полученными значениями метрики Bleu.

40-48 115
Аннотация

   Новосибирское научно-производственное предприятие геофизической аппаратуры «Луч» разрабатывает и производит телеметрические системы, эксплуатируемые в процессе бурения нефтегазовых скважин. В их состав входит датчик ориентации (инклинометр), оценивающий положение прибора в скважине на основе сигналов с трех акселерометров и трех магнитометров. Модули системы работают в условиях повышенных температур (до 150 °С), и для обеспечения заданной погрешности измерений углов ориентации требуется компенсация температурных дрейфов. В данной работе приводятся оценки допустимых дрейфов показаний датчиков, температурная полиномиальная модель акселерометров и магнитометров, методика компенсации. Проведен эксперимент, по результатам которого определена пригодность используемой модели и методики.

49-61 160
Аннотация

   Сеть «Интернет» позволяет делиться своим мнением со всем миром, и эти данные используются для анализа отношения общества к тому или иному субъекту. С течением времени эмоционально окрашенных текстов становится все больше. Современные технологии позволяют обрабатывать огромные массивы данных в кратчайшие сроки, что по-настоящему важно при реализации анализа тональности, который является одним из актуальных направлений автоматической обработки естественного языка. Нами был собран и размечен корпус текстов отзывов на медицинские услуги. Также были апробированы три способа решения задачи анализа тональности, относящиеся к методам традиционного или глубокого машинного обучения. Проведен сравнительный анализ полученных результатов. Размеченный нами корпус выложен в открытый доступ и может быть использован для других исследований.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-7900 (Print)
ISSN 2410-0420 (Online)