Модель редактора сложноструктурированных информационных единиц, управляемого метаинформацией, и его реализация

Описываются модель и методы реализации расширяемого средства редактирования инвариантной по отношению к технологическим пространствам (предметным областям) сложноструктурированной информации различных уровней абстракции в привычной для ее носителей системе понятий и форме представления – без специального обучения последних или участия в этом процессе специалистов-посредников.

Введение

Одной из важнейших задач при разработке и сопровождении интеллектуальных систем является формирование и сопровождение баз данных и баз знаний. Данная задача относится к классу задач «заказа информации» [1], в которой заказчиком является компьютерная программа, а носителем – человек (специалист или эксперт предметной области).

В этом случае возможны два подхода к решению задач заказа информации: заказ с посредником и заказ без посредника. В первом случае посредником является человек, который непосредственно взаимодействует с носителем в процессе формирования запроса и ответа на него, а затем преобразует ответ в необходимую форму и вводит его в компьютер. Такой подход широко использовался на раннем этапе работ по формированию экспертами баз знаний для интеллектуальных систем, где в качестве посредника выступал инженер знаний. Однако этот подход является неудобным и дорогим, особенно в случаях, когда передаваемая информация обширна и имеет сложную структуру, а также когда с течением времени носитель должен периодически вносить в эту информацию изменения, что как раз и имеет место, когда речь идет о базах знаний. В случае же заказа информации без посредника, либо носитель должен иметь необходимую специальную подготовку, чтобы самостоятельно передавать информацию компьютерной программе, либо компьютерная программа должна иметь такой интерфейс, чтобы, пользуясь им, носитель мог сам, без посторонней помощи передать необходимую информацию.

При разработке таких интерфейсов иногда используется метафора непосредственного общения заказчика и источника, на основе которой разрабатываются различные вопросно-ответные системы. Если же передаваемая информация имеет большой объем и сложную структуру, то в качестве подходящей метафоры для разработки таких интерфейсов предпочтительнее использовать одну из таких «технологий» решения задачи заказа информации, которая знакома носителю этой информации.

В случае если носителем информации является эксперт, а информация, которую должна получить от него компьютерная программа (интеллектуальная система), есть база знаний, эксперт, как правило, не станет тратить свое «драгоценное» время на получение специальной подготовки, чтобы научиться передавать интеллектуальной системе свои знания. Кроме того, в процессе использования интеллектуальной системы ее база знаний постоянно нуждается в изменениях, которые в нее должен время от времени вносить эксперт. Поэтому в инструментарий для разработки интеллектуальных систем должна входить подсистема формирования и модификации баз знаний. Такие системы получили название редакторов баз знаний.

К настоящему времени созданы такие редакторы, как Neologism, Moki, Knoodl, Ontowiki, SOBOLEO, PoolParty и WebProtégé, в которых делаются попытки дать возможность экспертам формировать базы знаний и другие сложноструктурированные информационные единицы без посредников. Однако в основу этих редакторов положена парадигма объектно-ориентированных онтологий [11–14], незнакомая большинству реальных и потенциальных экспертов, что вызывает в их работе значительные трудности, а иногда делает ее практически невозможной. Опыт формирования и сопровождения реальных баз знаний и других сложно-структурированных информационных единиц показывает, что проблема создания редакторов баз знаний еще далека от своего окончательного решения.

Описывается модель редактора орграфов информации, управляемого орграфами метаинформации, его основная функциональность, а также механизм расширения функциональности редактора, обеспечивающий возможность подключения к нему внешних модулей. Расширяемый редактор ориентирован на носителей целевой информации (экспертов и специалистов в различных областях знаний), которые формируют и сопровождают ее через генерируемый по соответствующей метаинформации интерфейс в привычной для них системе понятий и форме представления.

Цикл работы структурного редактора орграфов информации, управляемого орграфом метаинформации

В основу модели редактора орграфов информации, управляемого орграфом метаинформации, положен процесс порождения орграфа информации по орграфу метаинформации, который обеспечивает соответствие между дугами орграфа информации и орграфа метаинформации. На первом шаге орграф информации представлен единственной начальной вершиной, которая автоматически становится активной и текущей.
Текущей является активная нетерминальная вершина, являющаяся начальной для некоторой подграфа орграфа. Каждой текущей вершине соответствует одно или более состояний процесса редактирования.
Активными (в текущем состоянии редактора) являются следующие вершины: а) начальная вершина, б) каждая отображаемая нетерминальная вершина, которую пользователь выбрал в качестве активной, в) каждая отображаемая терминальная вершина, г) каждая отображаемая вершина, не принадлежащая редактируемому орграфу информации. Отображаемые нетерминальные вершины, не являющиеся активными относятся к неактивным. Не отображаемые в некоторый момент редактирования вершины не относятся ни к одному из этих множеств.
Состояние относится лишь к представлению (а не к содержимому) редактируемого орграфа и характеризуется тем, что для навигации/редактирования доступен только подграф с текущей вершиной в качестве начальной. В процессе редактирования накапливается история состояний. При возврате к одному из предыдущих состояний все последующие состояния уничтожаются (содержимое орграфа при этом не меняется).
Затем выполняется основной цикл работы редактора. Формирование орграфа информации осуществляется сверху вниз. Процесс редактирования может быть завершен по желанию пользователя в любом состоянии, при этом орграф информации оказывается формально полным или неполным относительно орграфа метаинформации.

Основной цикл работы редактора состоит из двух этапов:

  1. автоматическое формирование фрагмента орграфа информации, выполняемое при активации некоторой вершины орграфа – согласно состоянию орграфа информации, содержимому орграфа метаинформации и правилам порождения орграфа информации по орграфу метаинформации выполняются порождения исходящих дуг (и их конечных вершин); если порождаются дуги, исходящие из активной вершины орграфа информации, то их концы становятся активными вершинами (при условии, что автоматическое порождение из них невозможно). Если конец дуги, исходящей из вершины в орграфе метаинформации, соответствующей активной вершине, имеет спецификатор «копия» и ограничитель «порождение» или спецификатор «последовательность» и по данной дуге ещё не выполнено ни одно порождение, то по данной дуге выполняется порождение копии вершины из метаинформации или первого элемента последовательности соответственно и входящей в порожденную вершину дуги.
  2. выбор пользователем очередного действия и его выполнение – на этом этапе пользователь может:
    1. просмотреть значения полей вершины орграфа информации;
    2. активировать вершину орграфа информации;
    3. деактивировать активную вершину в орграфе информации;
    4. у активной вершины орграфа информации:
      • инициировать изменение значений ее полей, с их последующим изменением и сохранением,
      • просмотреть исходящие из неё дуги,
      • инициировать формирование исходящих из неё дуг, с их последующим созданием (включая их конечные вершины, которые становятся активными),
      • сделать её текущей, т.е. начальной вершиной подграфа орграфа информации для последующего редактирования этого подграфа (кроме терминальных вершин),
      • изменить порядок исходящих из нее дуг,
      • удалить входящую в нее дугу (кроме текущей вершины);
    5. вернуться к предыдущему состоянию редактирования подграфа, начальная вершина которого является текущей;
    6. отобразить в интерфейсе редактора весь порожденный подграф орграфа информации, начальная вершина которого является текущей (при этом все вершины этого подграфа становятся активными);
    7. скрыть в интерфейсе редактора весь порожденный подграф орграфа информации, начальная вершина которого является текущей (при этом все вершины этого подграфа, кроме начальной, становятся неактивными)

Результат всех действий, выполненных на первом этапе цикла работы редактора отображается через интерфейс редактора. Редактирование орграфа информации (на втором этапе) возможно в пределах, которые не нарушают соответствие между орграфами информации и метаинформации.

Интерфейс структурного редактора, определяемый орграфами информации и метаинформации

Интерфейс редактора отображает уже порожденную часть орграфа информации, начальная вершина которого является текущей (на рис.1а текущая начальная вершина – «Сложный сервис») следующим образом:

1

Рис. 1. Интерфейс структурного редактора орграфов информации

Режим просмотра отличается от режима редактирования тем, что в нем отсутствуют иконки для инициации процесса редактирования полей активных вершин, иконки для удаления входящих в активные вершины дуг, а также список гиперссылок, соответствующих дугам из метаинформации, служащих для инициации порождения по ним дуг, исходящих из активной нетерминальной вершины, и их концов. Значение поля «комментарий» у активных нетерминальных вершин помимо всплывающей подсказки отображается также на бледно-сером фоне сразу под метками соответствующих вершин.