Модель порождения орграфов информации по орграфу метаинформации для двухуровневой модели сложноструктурированных информационных единиц

Для орграфовой связной двухуровневой модели информационных единиц описывается модель порождения орграфов информации по орграфу метаинформации, которая может быть положена в основу компьютерных средств редактирования инвариантной по отношению к технологическим пространствам (предметным областям) сложноструктурированной информации различных уровней абстракции в привычной для ее носителей системе понятий – без специального обучения последних или участия в этом процессе специалистов-посредников.

Введение

В предыдущем документе описана орграфовая связная двухуровневая модель информационных единиц, соответствующая метафоре анкетирования. Для этой модели предложены языки представления орграфов информации и метаинформации. Данная модель направлена на преодоление трудностей, с которыми сталкиваются пользователи систем извлечения экспертных знаний, в основе которых лежит объектно-ориентированная парадигма представления метаинформации и информации.

В настоящем документе описывается модель соответствия между орграфами информации и метаинформации, модель порождения орграфов информации по орграфу метаинформации, а также методы клонирования вершин и подграфов орграфов информации. Рассматриваются два способа формирования орграфов, представляющих сложноструктурированную информацию, – путем их порождения по орграфу, представляющему метаинформацию, а также путем зависимого и независимого клонирования подграфов орграфов, представляющих информацию. При этом в обоих случаях обеспечивается соответствие между орграфами информации и метаинформации.

Соответствие между орграфами информации и метаинформации

В орграфовой связной двухуровневой модели анкеты (см. предыдущий документ) начальной вершине орграфа информации соответствует начальная вершина орграфа метаинформации.

Орграф информации соответствует орграфу метаинформации (т.е. представляет систему экземпляров понятий для системы понятий, представленной орграфом метаинформации, или, что то же самое, представляет формально правильно заполненную анкету), если существует такое однозначное всюду определенное соответствие между множеством дуг орграфа информации и множеством дуг орграфа метаинформации, что выполнены следующие условия: Пример 1.
Соответствие между дугами орграфа на рис.1 и дугами орграфа на рис.2, представленными в работе предыдущем документе, приведено в табл.1 (дуги метаинформации пронумерованы числами, дуги информации – числами и буквами):

Таблица 1. Соответствие между дугами орграфов на рис.1 и 2.
Дуга в метаинформации Дуги в информации
1 База наблюдений →[=]genГруппы а) База наблюдений в области офтальмологии → Группы
2 База наблюдений →[=]genНаблюдения
3 Группы →[=]gen Группа а) Группы → Главные жалобы;
б) Группы → Дополнительные жалобы
4 Группа →+genГруппы
5 Группа →[=]allНаблюдения а) Главные жалобы → Наблюдения;
б) Дополнительные жалобы → Наблюдения
6 Наблюдения →+genНаблюдение а) Наблюдения → Светобоязнь;
б) Наблюдения → Ощущение инородного тела в глазу;
в) Наблюдения → Головная боль;
д) Наблюдения → Температура
7 Наблюдение →=all Тип области возможных значений а) Светобоязнь → Тип области возможных значений;
б) Ощущение инородного тела в глазу → Тип области возможных значений;
в) Головная боль → Тип области возможных значений;
д) Температура → Тип области возможных значений
8 Тип области возможных значений →=all Составные значения а,б) Тип области возможных значений → Составные значения (2 дуги)
9 Тип области возможных значений →=all Качественные значения а-е) Тип области возможных значений → Качественные значения (6 дуг)
10 Тип области возможных значений →=all Числовые значения а) Тип области возможных значений → Числовые значения
11 Составные значения →+all Характеристика а,б) Составные значения → Присутствие (2 дуги);
в,г) Составные значения → Характер начала (2 дуги);
д) Составные значения → Степень проявления;
е,ж) Составные значения → Периодичность (2 дуги);
з) Составные значения → Длительность;
и) Составные значения → Сторона
12 Характеристика →=all Тип области возможных значений а) Присутствие → Тип области возможных значений;
б) Характер начала → Тип области возможных значений;
в) Степень проявления → Тип области возможных значений;
г) Периодичность → Тип области возможных значений;
д) Длительность → Тип области возможных значений;
е) Сторона → Тип области возможных значений
13 Качественные значения →+all Значение а) Качественные значения → отсутствует;
б) Качественные значения → имеется;
в) Качественные значения → острое;
г) Качественные значения → постепенное;
д) Качественные значения → слабая;
е) Качественные значения → умеренная;
ж) Качественные значения → резкая;
з) Качественные значения → постоянно;
и) Качественные значения → периодически;
к) Качественные значения → кратковременная;
л) Качественные значения → продолжительная;
м) Качественные значения → справа;
н) Качественные значения → слева
14 Числовые значения →=all Тип значений а) Числовые значения → Тип значений
15 Числовые значения →[!]all Единица измерения а) Числовые значения → оС
16 Тип значений →!allЦелые значения
17 Тип значений →!allВещественные значения а) Числовые значения → 34,0 – 42,0
Будем говорить, что орграф информации является формально полным относительно орграфа метаинформации, если орграф информации соответствует этому орграфу метаинформации.

Порождение орграфа информации по орграфу метаинформации

В орграфовой связной двухуровневой модели анкеты редактор информации порождает орграф информации по орграфу метаинформации с помощью следующего порождающего процесса, в котором пользователь разрешает неопределенности, возникающие на каждом шаге процесса порождения (выбирает ответы из предлагаемых списков, либо их формулирует): Пример 2.
Процесс порождения орграфа информации по орграфу метаинформации, приведенному на рис.1 в предыдущем документе, может быть представлен следующим образом:
По дуге 1 порождается дуга 1а: {1 – 1а}, по дуге 3 порождается дуга 3а: {3 – 3а}, и так далее – согласно порядку дуг в орграфе метаинформации и порядку дуг в орграфе информации, соответствующих дуге из орграфа метаинформации. Финальным является порождение {17 – 17а}.
Заметим, что в процессе порождения орграфа информации по орграфу метаинформации, орграф информации может находиться в состояниях, в которых он не является формально полным относительно этого орграфа метаинформации.

Пример 3.
Состояние орграфа информации не является формально полным на всех шагах порождающего процесса примера 2, кроме двух, и является формально полным после выполнения шагов порождения {13 – 13м}, {13 – 13н} и {17 – 17а}.

Два особых случая в соответствии орграфов информации и метаинформации

До сих пор рассматривался случай, когда дана некоторая система понятий, представленная орграфом метаинформации в орграфовой связной двухуровневой модели информационных единиц, и по ней порождается система экземпляров понятий, представленная орграфом информации в этой модели.

Однако в некоторых случаях необходимо из заданной вершины орграфа информации: Для обеспечения таких возможностей в орграф метаинформации необходимо ввести специальный тип вершин (будем обозначать их символом ), а соответствие между орграфами информации и метаинформации дополнить следующими условиями: Пример 4.
На рис. 1 представлен орграф метаинформации, описывающий структуру шаблонов сообщений, посредством которых агенты облачной платформы IACPaaS взаимодействуют друг с другом.

Рис. 1. Орграф метаинформации, описывающий структуру шаблонов сообщений платформы IACPaaS, и орграф информации, описывающий устройство шаблона сообщений «Шаблон Запрос от агента Вид»

С одной стороны данная структура фиксирует то, что каждый шаблон сообщений имеет внутреннее имя, содержательное описание назначения (на естественном языке) и, возможно, исполняемый код шаблона сообщений (байт-код), представляющий его процедурную часть. С другой стороны, поскольку шаблон сообщений определяет, по существу, язык представления некоторого множества сообщений, данная структура должна позволять для каждого шаблона сообщений описать структуру (синтаксис языка представления) содержательной информации, передаваемой в сообщениях, формируемых по данному шаблону (содержимого сообщений) – в случае, когда шаблон сообщений описывает не просто сообщения-команды, а сообщения, которые должны содержать некоторые данные. Структура содержимого сообщений в каждом шаблоне сообщений описывается произвольным орграфом, представленным на языке метаинформации. Начальной вершиной этого орграфа является вершина «Шаблон Запрос от агента Вид». Спецификатор дуги «пропуск» имеет символьное обозначение «~».

Пример 5.
На рис. 2 представлен орграф метаинформации, описывающий структуру технологии разработки интегрированных интеллектуальных решателей задач (ИИРЗ). Эта технология (как понятие) имеет два атрибута, значениями которых являются компоненты ИИРЗ (онтология базы знаний и решатель задач). Каждый атрибут имеет также ссылку на работу, с помощью которой создается соответствующая компонента. Решатель задач имеет фиксированную структуру, которая представлена соответствующим орграфом метаинформации, хранящимся в фонде платформы IACPaaS; на эту метаинформацию и ссылается соответствующий атрибут. Онтология базы знаний является произвольной метаинформацией; поэтому значением атрибута «Онтология базы знаний» является символ «».

Рис. 2. Орграф метаинформации, описывающий структуру технологии по разработке интегрированных интеллектуальных решателей задач, и орграф порожденной по нему информации, описывающий проект такого решателя

По метаинформации, представляющей технологию, порождается информация, представляющая проект конкретного ИИРЗ (в данном случае ИИРЗ медицинской диагностики). Экземпляр понятия «Проект ИИРЗ по медицинской диагностике» имеет те же два атрибута. Значением атрибута «Онтология базы знаний» является произвольный орграф метаинформации, создаваемый при работе над проектом ИИРЗ, а значением атрибута «Решатель задач» – ссылка на решатель задач по медицинской диагностике, порождаемый по метаинформации «Структура решателя задач».

Зеркальным является случай, когда из вершины орграфа метаинформации выходит дуга, которая входит в вершину орграфа информации. В этом случае действует следующее условие на соответствие между орграфами информации и метаинформации: если из вершины w орграфа метаинформации выходит дуга D', которая входит в вершину v орграфа информации (значение ограничителя дуги D' в этом случае есть «ссылка», а значением спецификатора могут быть только «копия» и «возможное отсутствие»), и в орграфе информации вершина v0 соответствует вершине w, то в орграфе информации из вершины v0 выходит дуга d', которая входит в вершину v и соответствует дуге D' орграфа метаинформации.

Пример 6.
Продолжая описание рис. 2, отметим, что разработка онтологии базы знаний должна выполняться согласно работе по созданию онтологии базы знаний, описанной в соответствующем орграфе информации, а разработка интегрированного решателя задач – согласно работе по созданию интегрированных решателей задач (которая так же описывается в соответствующем орграфе информации). В метаинформации это задаётся дугами «Онтология базы знаний =ref Работа по созданию онтологии базы знаний» и «Решатель задач =ref Работа по интеграции решателя задач» соответственно. При разработке интегрированного решателя задач по данной технологии в порождаемом информационном ресурсе по данным дугам порождаются, соответственно, следующие: «Онтология базы знаний Работа по созданию онтологии базы знаний» и «Решатель задач Работа по интеграции решателя задач», концами которых являются те же вершины, что находятся на концах дуг из метаинформации.

Для этих двух особых случаев могут быть сформулированы и правила порождения орграфа информации по орграфу метаинформации.

Клонирование вершин, множеств вершин и орграфов информации

Порождение вершин и дуг орграфа информации по вершинам и дугам орграфа метаинформации является не единственным способом построения орграфа информации. Другим способом является клонирование вершин и дуг некоторого орграфа информации g1 при построении другого орграфа информации g2 (при этом соответствие между орграфом g2 и его орграфом метаинформации G2 должно выполняться). Обозначим v' вершину орграфа информации g1, а v – вершину орграфа информации g2, которая должна быть получена клонированием v'. Клонирование может быть независимым и зависимым.

При независимом клонировании вершины в орграфе информацииg2 создается вершина v, у которой: В дальнейшем изменение значений полей и набора выходящих дуг для этих вершин, никак не связаны между собой.

При независимом клонировании множества вершин в орграфе информации g2создается множество вершин v1, ..., vn, количество которых совпадает с количеством вершин в клонируемом множестве, такое, что каждый его элемент является независимым клоном соответствующей вершины из орграфа информации g1.

Клонирование орграфа информации g, не имеющего вершин, одновременно принадлежащих и какому-либо другому орграфу информации g', можно рассматривать как независимое клонирование множества вершин орграфа g. Клонирование орграфа информации g, имеющего вершины v1, ..., vn, одновременно принадлежащие некоторым другим орграфам информации g1, ..., gm, в которые входят дуги d1, ..., dk, выходящие из вершин орграфа g, имеет два варианта: Пример 7.
Рассмотрим процесс создания резервной копии базы знаний о заболеваниях. Такая база содержит ссылки на базу наблюдений – на признаки и их значения. На рис. 3 представлены слева направо: метаинформация базы наблюдений, сформированная на её основе база наблюдений в области офтальмологии, исходная база знаний – база знаний о заболеваниях в области офтальмологии и её основа – метаинформация базы знаний о заболеваниях (со ссылками на понятия метаинформации базы наблюдений, по которым в порождаемой информации также необходимо порождать ссылки в информацию, описывающую наблюдения). С течением времени знания эксперта расширяются, и он стремится модифицировать свою базу знаний о заболеваниях, при этом логичным является сохранение резервной отлаженной копии исходной базы знаний. При создании копии такой базы знаний создаётся информация, приведённая в правой части рис. 3. Она строится по той же метаинформации (База знаний о заболеваниях); её начальная вершина имеет имя, отличное от имени исходной базы («Копия базы знаний в области офтальмологии»); вершины, которые принадлежали исходной базе знаний, имеют свои независимые клоны в копии с такими же полями и исходящими дугами («Клинические проявления», «Клиническое проявление для признака Головная боль», 1, 1, 1 - 10; к вершинам из орграфа базы наблюдений в области офтальмологии «Головная боль» и «имеется» (в Базе наблюдений) идут дуги, так же как в исходной Базе знаний в области офтальмологии.

Рис. 3. Независимое поверхностное клонирование базы знаний о заболеваниях в области офтальмологии

Пример 8.
Рассмотрим процесс передачи информации от одного эксперта другому на примере медицинской диагностики в области офтальмологии. Первый эксперт создаёт базу наблюдений и базу знаний и наполняет их, приводя к некоторому качественно-полезному состоянию (тривиальный пример см. на рис. 4, спецификатор дуги «непустая последовательность» на нем имеет символьное обозначение «^»). Далее ему требуется передать эту пару баз знаний другому эксперту, для того чтобы тот начал их использовать в своих целях. При выполнении глубокого клонирования этой информации создается информация с начальной вершиной «Копия базы наблюдений в области офтальмологии» и информация с начальной вершиной «Копия базы знаний в области офтальмологии». Их метаинформации – те же что и у исходной информации (соответственно). В информации «Копия наблюдений в области офтальмологии» создаются вершины-клоны для вершин «Головная боль», «отсутствует», «имеется». В информации «Копия базы знаний в области офтальмологии» создаются клоны исходных вершин «Острый конъюнктивит», «Клинические проявления», «Клиническое проявление для признака Головная боль», 1, 1, 1-10. А также от вершины «Клиническое проявление для признака Головная боль» создаётся дуга к вершине-клону «Головная боль» (находящейся в орграфе «Копия базы наблюдений в области офтальмологии») и от вершины 1 (соответствующей вершине в орграфе метаинформации «Период динамики») создаётся дуга к вершине-клону «имеется».

Рис. 4. Независимое глубокое клонирование базы наблюдений и базы знаний о заболеваниях в области офтальмологии

При зависимом клонировании вершины v' в орграфе информации g2 создается вершина v, у которой значение поля «значение» совпадает со значением этого поля у клонируемой вершины v'. В дальнейшем при редактировании:

При зависимом клонировании множества вершин в орграфе информации g2 создается множество вершин v1, ..., vn, количество которых совпадает с количеством вершин в клонируемом множестве, такое, что каждый его элемент является зависимым клоном соответствующей вершины из орграфа информации g1. В дальнейшем при редактировании:

Пример 9.
В процессе контекстно-зависимого порождения орграфа информации g2, описывающего простую базу знаний о нормальных значениях в области офтальмологии, по орграфу метаинформации G2, описывающему простые базы знаний о нормальных значениях в различных разделах медицины (рис. 5), с использованием орграфа информации g1 (орграф его метаинформации G1, описывающий простые базы наблюдений в различных разделах медицины, представлен на рис. 6), описывающего простую базу наблюдений в области офтальмологии, в качестве контекста, требуется, чтобы (рис. 7):
  1. в g2 множество потомков вершины «Простая база знаний о нормальных значениях: офтальмология», которой соответствует вершина «Простая база знаний о нормальных значениях» в орграфе G2, было результатом зависимого клонирования множества вершин – потомков вершины «Простая база наблюдений: офтальмология» в орграфе g1, которой соответствует вершина «Простая база наблюдений» в орграфе метаинформации G1;
  2. в g2 для каждой вершины со значением p*, которой в G2 соответствует вершина «признак», множество потомков было результатом зависимого клонирования элементов непустого подмножества вершин – потомков вершины в g1 со значением p*, которой в G1 соответствует вершина «наблюдение».

Рис. 5. Орграф метаинформации для простых баз знаний о нормальных значениях в различных разделах медицины


Рис. 6. Орграф метаинформации для простых баз наблюдений в различных разделах медицины


Рис. 7. Контекстно-зависимое порождение орграфа информации, описывающего простую базу знаний о нормальных значениях в области офтальмологии

Отношение между вершинами и множествами вершин орграфа информации и их зависимыми клонами аналогичны отношению между орграфами метаинформации и порожденными по ним орграфами информации.