Preview

Вестник НГУ. Серия: Информационные технологии

Расширенный поиск
Том 20, № 3 (2022)
Скачать выпуск PDF
5-13 169
Аннотация

В статье предложена модель текста научно-технической статьи для автоматизации разметки в корпусе научно-технических текстов. Обосновано, что при создании корпуса научно-технических текстов необходимо учитывать структурные особенности текстов научно-технических статей. Показана необходимость добавления структурной разметки в корпус научно-технических текстов. Отмечено, что тексты научно-технических статей имеют одинаковую для всех текстов этого класса структуру изложения материала, а также содержат ограниченный набор структурных элементов. Проанализированы особенности композиционной организации текстов научно-технических статей. Описано примерное содержание каждого из элементов структуры статьи. Представлена композиционная структура текстов научно-технических статей в нотациях Бекуса-Наура. Предложена модель текста научно-технической статьи в виде графа, вершинами и ребрами которого являются полноценные структурные элементы научно-технической статьи. Обосновано, что представление текста научно-технической статьи в виде графа дает возможность в процессе компьютерного анализа текста определить тип структурного элемента, степень вложенности, за счет подачи научно-технической статьи в виде конечного множества ее составных частей. Обосновано, что наличие структурной разметки в корпусе научно-технических текстов значительно расширит его исследовательский потенциал и послужит базой для задач автоматической обработки научно-технических текстов.

14-28 124
Аннотация

В работе представлен полнофункциональный имитационный отладочный комплекс, предназначенный для тестирования программируемых контроллеров АСУ ТП в лабораторных условиях, но максимально приближенных к реальным условиям эксплуатации на объекте, с учетом большой зашумленности входных сигналов, воздействия на них сетевой и импульсных помех большой интенсивности, а также с учетом вариации параметров линии связи. Для имитации наиболее характерных помех разработана структура формирователя кондуктивных помех и параметров линии связи с описанием всех его элементов.

29-37 112
Аннотация

Рассматривается информационная среда Сибирского отделения Российской академии наук (СО РАН), которая начала складываться с конца девяностых двадцатого века с созданием корпоративного сайта, сайтов институтов и НГУ. Сейчас информационная среда СО РАН объединяет более 100 научных организаций и вузов Сибири, служит площадкой, на которой представлен научно-технический потенциал Востока России. В связи с санкционным давлением и информационной войной против России возникли неотложные задачи. В статье предлагается использовать информационную среду СО РАН для публикации отечественных баз открытых данных, которые заменят зарубежные информационные системы c открытыми данными типа Figshare и Zenodo. В качестве примера приводится раздел «Импортонезависимость», который создан на Портале СО РАН в мае 2022 года и содержит открытые данные.

38-50 166
Аннотация

В работе представлено исследование возможности восстановления искажённого аудио-сигнала. На основе полученных ранее результатов использования методов глубокого машинного обучения разработана концепция нейронной сети, предназначенная для коррекции искаженного звукового сигнала. На базе первоначально полученной разработано несколько новых архитектур нейронных сетей, ориентированных на восстановление аудиосигнала. В статье приведены описания разработанных архитектур с теоретическим обоснованием возможности их применения. Представленные архитектуры были протестированы для решения задачи восстановления партии конкретного инструмента в музыкальной композиции, из которой она была удалена.

51-64 175
Аннотация

Эффективное изучение дисциплины «Информатика» невозможно без широкого применения информационных технологий. Одним из основополагающих разделов информатики является алгебра логики. Применение традиционных методов тестирования обучающихся для оценки степени освоения этой темы имеет ряд определенных недостатков, что обуславливает необходимость создания других интерактивных средств для этой цели. Статья посвящена особенностям разработки и функционирования автоматизированной системы «Алгебра логики», которая предназначена для контроля формирования индикаторов достижения компетенций, полученных при изучении основ алгебры логики. Разработанная система позволяет автоматически сформировать индивидуальный вариант задания, содержащий задачи трех типов. Первое задание включает в себя построение таблиц истинности для трех логических функций, второе требует построить логическую схему, третье задание ориентировано на упрощение логического выражения. Архитектура системы включает в себя восемь независимых модулей, реализующих синтез нового комплекта заданий и его оформление, декомпозицию полученных логических функций, построение таблиц истинности, анализ и оценку результатов. В статье раскрыта концепция работы каждого модуля. Подробно описана работа модулей синтеза и анализа логических функций, приведены укрупненные графические схемы алгоритмов их функционирования. Рассмотренная автоматизированная система за время эксплуатации зарекомендовала себя положительно, она позволяет объективно оценить теоретические знания пользователей и их умения применять известные способы построения таблиц истинности. К достоинствам системы относятся небольшой объем занимаемой на диске памяти, возможность функционирования в компьютерных сетях и на локальных компьютерах, интуитивно понятный интерфейс, разнообразие генерируемых заданий и возможность автоматической проверки результатов их выполнения.

65-76 238
Аннотация

В современном мире количество научных публикаций, существующих в виде электронного текста, постоянно растет. В связи с этим задачи, связанные с обработкой текстов научных статей, становятся особо актуальными. Данная работа посвящена задаче извлечения семантических отношений между сущностями из текстов научных статей на русском языке, где в качестве сущностей выступают научные термины. Извлечение отношений может быть полезно в отдельных специализированных областях, таких как поисковые и вопросно-ответные системы, а также при составлении онтологий. В ходе работы нами был создан корпус научных текстов, состоящий из 136 аннотаций научных статей на русском языке, в которых выделены 353 отношения следующих типов: USAGE, ISA, TOOL, SYNONYMS, PART_OF, CAUSE. Данный корпус использовался нами для обучения моделей. Кроме того, мы реализовали алгоритм автоматического извлечения семантических отношений и протестировали его на уже существующем корпусе научных текстов RuSERRC. Для реализации алгоритма использовалась нейросетевая модель BERT. Мы провели ряд экспериментов, связанных с использованием векторов, полученных из различных языковых моделей, а также с двумя нейросетевыми архитектурами. Разработанный инструмент и размеченный корпус выложены в открытый доступ и могут быть полезны для других исследователей.



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 1818-7900 (Print)
ISSN 2410-0420 (Online)