Том 16, № 2 (2018)

ПОДХОД К ПОСТРОЕНИЮ РАСШИРЕННЫХ ТЕМАТИЧЕСКИХ МОДЕЛЕЙ ТЕКСТОВ НА РУССКОМ ЯЗЫКЕ

PDF (Rus)

5-18 149

Представлен новый подход для получения расширенных тематических моделей текстов научных статей на русском языке. Под расширенной моделью понимается тематическая модель, содержащая кроме однословных терминов термины, состоящие из нескольких слов (также называемые многословные термины или ключевые фразы). Такие модели лучше интерпретируются пользователями и точнее описывают предметную область документа, чем модели, состоящие только из униграмм (отдельных слов). На основе предложенного подхода была разработана система, в результате работы которой для каждого документа предоставляется набор содержащихся в нем тем с указанными вероятностями, ключевыми словами и фразами для каждой темы. Предложенный в статье подход может быть полезен при построении рекомендательных систем и систем автореферирования.

МЕТОДИКА ПОВЫШЕНИЯ ПРОИЗВОДИТЕЛЬНОСТИ НЕБОЛЬШИХ ИНФОРМАЦИОННЫХ СИСТЕМ ЗА СЧЕТ ОПТИМАЛЬНОЙ РЕСТРУКТУРИЗАЦИИ ДАННЫХ НА ОСНОВЕ МНОГОМОДАЛЬНОГО РАСПРЕДЕЛЕНИЯ АТРИБУТОВ

И. В. Бельченко, Р. А. Дьяченко

PDF (Rus)

19-30 145

Аннотация

Рассматривается системный подход к повышению производительности небольших информационных систем за счет оптимальной реструктуризации табличных структур данных. Авторами сформулирована задача оптимизации количества информационных блоков, необходимых для выполнения группы запросов на считывание информации, предложена целевая функция и структурные ограничения. Проанализирована невозможность использования грубых методов поиска оптимального решения. Предложена методика многомодального распределения атрибутов в зависимости от частоты появления в группе запросов. Проведен эксперимент, подтверждающий эффективность разработанной методики для небольших информационных систем.

РАЗРАБОТКА СЕРВИСА ЗАДАНИЯ СЦЕНАРИЕВ ПРЕДЪЯВЛЕНИЯ СТИМУЛОВ С ИСПОЛЬЗОВАНИЕМ МОДЕЛЬНО-ОРИЕНТИРОВАННОГО ПОДХОДА

И. В. Брак, Ю. И. Сазонова

PDF (Rus)

31-40 107

Аннотация

Современная физиология не может обойтись без методов количественного анализа данных. Необходимым условием для использования математической статистики, анализа сигналов и машинного обучения является наличие должным образом собранных, размеченных и подготовленных данных. С возможностью совместной обработки данных, собранных в разных условиях и в рамках разных протоколов экспериментов, появилась потребность в наличии структурированной метаинформации. В настоящее время существует множество программных систем, позволяющих создавать, редактировать и запускать сценарии представления стимулов. Их проблемой является сложность использования реализованного сценария как в рамках других систем, так и для аннотирования данных, полученных экспериментально. Целью работы является разработка сервиса, позволяющего зада-вать сценарии представления стимулов с помощью графического интерфейса с возможностью сохранять мета-информацию эксперимента в независимом от платформы формате и исполнять в закрытых системах. В предлагаемом решении используется модельно-ориентированный подход. В основе платформенно-независимой модели лежит открытый формат эксперимента PsychoPy. Для исполнения полученного сценария используется платформа Neurobs Presentation. С помощью преобразования общей модели сценария эксперимента в модель платформы и описания синтаксической структуры предметно-ориентированного языка Presentation автоматически формируется программный код. Реализация данного подхода может быть расширена для других систем представления стимулов.

MEDILUX - СЕРВИС ИНТЕЛЛЕКТУАЛЬНОГО ФОРМИРОВАНИЯ РАСПИСАНИЯ ПОСЕЩЕНИЙ МЕДИЦИНСКИХ УЧРЕЖДЕНИЙ

И. Е. Букшев

PDF (Rus)

41-48 149

Аннотация

Предложен новый вид обслуживания - «интеллектуальная регистратура»: в мобильном приложении обеспечена возможность выбора сотрудников медицинского учреждения, далее происходит анализ графика работы выбранного врача и свободного времени пользователя при помощи алгоритмов программирования в ограничениях с целью определения наилучшего времени записи на прием. База знаний о свободном времени пользователя формируется на основе задач, которые агрегируются с мобильного устройства и популярных сервисов по управлению задачами. Для случая, если пользователь не знает, к кому обратиться, продукт снабжен «умным» чатом, в котором можно описать проблему. Текст отправится на сервер, где произойдет синтаксический разбор и семантическое сопоставление с конкретной специальностью врача. В базе данных хранится информация обо всех посещениях и врачебных выписках (электронная медицинская карта), что позволяет, например, напоминать пользователю о необходимости принятия медикаментов. Практическая ценность продукта заключается в автоматизации бизнес-процесса «прием пациентов», что приводит к экономии времени пациентов, обеспечению высокой доступности услуг и оптимизации трудовых затрат в медучреждениях.

СИСТЕМА АНАЛИЗА И ВИЗУАЛИЗАЦИИ ДЛЯ КРОСС-ЯЗЫКОВОЙ ИДЕНТИФИКАЦИИ АВТОРОВ НАУЧНЫХ ПУБЛИКАЦИЙ

В. В. Исаченко, З. В. Апанович

PDF (Rus)

49-61 147

Аннотация

Представлена система разрешения неоднозначности авторства статей на английском языке с использованием русскоязычных источников данных. Система позволяет находить и исправлять ошибки в определении авторства научных публикаций, что может улучшить результаты поиска статей определенного автора и подсчета индекса цитируемости. В качестве исходного хранилища публикаций использовалась база link.springer.com, для получения достоверной информации об авторах и их статьях использовалась научная электронная библиотека eLIBRARY.ru. Система предоставляет интерактивную визуализацию результатов и возможность редактирования для повышения качества экспертного анализа. Подходы, используемые в данной системе, применимы для разрешения неоднозначности авторства публикаций из различных библиографических баз данных.

КОЛЛАБОРАТИВНАЯ ФИЛЬТРАЦИЯ ДЛЯ ПОСТРОЕНИЯ РЕКОМЕНДАЦИЙ НА ОСНОВЕ ДАННЫХ О ЗАКАЗАХ

А. А. Князева, О. С. Колобов, И. Ю. Турчановский, А. М. Федотов

PDF (Rus)

62-69 184

Аннотация

Рассматривается возможность применения методов коллаборативной фильтрации в процессе создания рекомендательной системы на основе данных о заказах документов из библиотечного фонда. Приводится сравнительный экспериментальный анализ трех методов коллаборативной фильтрации: на основе документов, на основе пользователей и на основе гибридного метода, являющегося комбинацией первых двух методов.

БИНАРНЫЕ ОПЕРАЦИИ В ИНФОРМАЦИОННОЙ СИСТЕМЕ «МОЛЕКУЛЯРНАЯ СПЕКТРОСКОПИЯ»

А. В. Козодоев, Е. М. Козодоева

PDF (Rus)

70-77 154

Аннотация

Представлен подход, использованный при разработке и реализации модуля, выполняющего бинарные операции над данными в ИС «Молекулярная спектроскопия». Приводится формализация бинарных операций над наборами спектроскопических данных с учетом особенностей предметной области. Описываются алгоритм действий и интерфейс пользователя для проведения бинарных операций - единые для имеющихся баз данных по различным веществам и нескольким типам спектроскопических данных.

РАЗРАБОТКА И РЕАЛИЗАЦИЯ АЛГОРИТМОВ РАЗРЕШЕНИЯ КОНФЛИКТОВ ПО ДОСТУПУ К ПАМЯТИ В ДИНАМИЧЕСКОМ КОМПИЛЯТОРЕ JAVA ДЛЯ ПРОЦЕССОРА «ЭЛЬБРУС»

А. Е. Малых

PDF (Rus)

78-85 126

Аннотация

Рассмотрены особенности разработки алгоритмов разрешения конфликтов по доступу к памяти и их реализация в динамическом компиляторе Java для отечественной платформы «Эльбрус». Эти алгоритмы позволяют существенно расширить возможности планировщика инструкций - ключевой оптимизации VLIW-процессоров. В работе исследуются статические и динамические подходы к анализу зависимостей по памяти, и приводится сравнение эффективности реализованных алгоритмов на основе стандартной тестовой сюиты SpecJVM2008.

ОБ ОПЫТЕ МИГРАЦИИ ПРИЛОЖЕНИЙ НА СВОБОДНО РАСПРОСТРАНЯЕМОЕ ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ С ОТКРЫТЫМ КОДОМ

С. Н. Трошков

PDF (Rus)

86-94 137

Аннотация

Важной проблемой современного программирования является поддержка и сопровождение наследственного программного обеспечения (ПО). Функциональность приложений, написанных в старых окружениях, ценна и по-прежнему актуальна. Устаревшее ПО не позволяет использовать их на современных машинах и развивать в дальнейшем. В работе описан опыт миграции на примере двух приложений - Архива академика А. П. Ершова и системы «Библиотека», которые используются в ИСИ СО РАН не один десяток лет. В качестве платформы с открытым кодом для создания новых приложений был выбран CMF Drupal, который значительно облегчает разработку и перенос модели данных. Миграция включает в себя реинжиниринг приложения с сохранением бизнес-логики, модели данных, а также перенос самих данных.

ИСПОЛЬЗОВАНИЕ ГОРИЗОНТАЛЬНО МАСШТАБИРУЕМОЙ ИНФРАСТРУКТУРЫ ПРИ ПОИСКЕ СХОДСТВА В ГЕНОМНЫХ ДАННЫХ ЭКОСИСТЕМ

А. А. Цхай, С. В. Мурзинцев

PDF (Rus)

95-103 127

Аннотация

Рассмотрена проблема выявления генетического сходства при анализе баз данных (БД) геномов организмов. Такая проблема возникает с развитием методов метагеномики, сравнительной геномики, технологий высокопроизводительного секвенирования ДНК, а также инструментов оценки и прогнозирования состояния экосистем. Для быстрого сравнения геномов с целью выявления повторяющихся наборов нуклеотидов разработана специализированная компьютерная система. Из-за большого объема данных, возникающих при обработке исходной информации, осуществлен переход к нереляционным БД, как к более гибким и масштабируемым. В качестве основы подхода использованы распределенная нереляционная БД MongoDB и алгоритм обработки данных Winnowing. При использовании нереляционной БД для выявления генетического сходства предложен вариант представления отпечатков структурных вариаций геномов в виде «ключ - значение». Выполнена программная реализация разработанной модели. Проведены вычислительные эксперименты: 1) загрузка данных в БД с использованием одной и трех шард (серверов, где хранятся данные и осуществляются поиск и обработка информации); 2) поиск совпадений выбранных наборов нуклеотидов с БД геномов с использованием одной и трех шард; 3) расчет скорости поиска геномовв БД; 4) расчет скорости загрузки геномов в БД. Результатом экспериментов стало подтверждение возможности использования предложенного способа поиска генетического сходства. Продолжение работы может быть в направлениях: 1) решения задачи об определении момента, когда необходимо добавлять узел к кластеру при возрастании рассматриваемого количества выбранных наборов нуклеотидов и увеличении числа геномов в БД организмов; 2) практического наполнения создаваемой БД как можно большим количеством реальных геномов организмов; 3) исследования геномных нарушений с целью оценки вероятности генетических отклонений на этапе распознавания потенциально возможного неблагоприятного развития организма.

АВТОМАТИЗАЦИЯ ПОСТРОЕНИЯ ТРЕХМЕРНЫХ ГЕОЭЛЕКТРИЧЕСКИХ МОДЕЛЕЙ ДЛЯ МЕТОДА ЗОНДИРОВАНИЯ СТАНОВЛЕНИЕМ ПОЛЯ В БЛИЖНЕЙ ЗОНЕ НА ОСНОВЕ РЕЗУЛЬТАТОВ ОДНОМЕРНОЙ ИНВЕРСИИ

М. В. Чубаров, А. А. Власов

PDF (Rus)

104-112 137

Аннотация

Предложен алгоритм автоматизации построения трехмерных геоэлектрических моделей для метода зондирования становлением поля в ближней зоне на основе результатов одномерной инверсии с целью расчета синтетических сигналов для трехмерных моделей, а также ускорения получения качественной оценки полевых материалов и сведения к минимуму ошибок интерпретации. Важной частью алгоритма является автоматическое формирование трехмерных расчетных сетей, необходимых для расчета синтетических сигналов в моделях. Результаты работы алгоритма представляют собой подготовленные трехмерные модели изучаемой среды с рассчитанным синтетическим электромагнитным сигналом. Алгоритм апробирован на данных электромагнитного мониторинга последствий землетрясения, произошедшего в 2003 г. в Республике Алтай.

СЕМАНТИЧЕСКИЙ ПОДХОД К МОДЕЛИРОВАНИЮ ФОНДА ОЦЕНОЧНЫХ СРЕДСТВ

Г. Э. Яхъяева, А. Р. Абсайдульева

PDF (Rus)

113-121 174

Аннотация

Фонд оценочных средств является составной частью нормативно-методического обеспечения системы оценки качества освоения студентом учебного материала. Онтологический подход к моделированию фонда оценочных средств позволяет формировать актуальные оценочные документы, которые учитывают не только всевозможные пожелания экзаменатора, но и степень усвоения различных компетенций и степень овладения различными профессиональными функциями. В статье приведено описание онтологии, семантической и нечеткой моделей фонда оценочных средств. Описан алгоритм порождения шаблона оценочного документа, состоящий из трех этапов: сужение, ограничение и определение. На каждом этапе генерируется соответствующая нечеткая модель, в рамках которой проверяется непротиворечивость заданного шаблона и выполнимость данного шаблона на имеющейся базе оценочных средств. Для формирования комплекта оценочных документов используется алгоритм CLOPE, позволяющий кластеризовать категорийные данные.

Сведения об авторах

Редакционная Статья

PDF (Rus)

122-123 119

Информация для авторов

Редакционная Статья

PDF (Rus)

124-124 124

Логин
Пароль
	Запомнить меня
Регистрация нового пользователя Забыли Ваш пароль?

Войти

Вестник НГУ. Серия: Информационные технологии

Использование куки-файлов