автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Организация сетевых структур знаний, поддерживающая их редактирование
Автореферат диссертации по теме "Организация сетевых структур знаний, поддерживающая их редактирование"
На правах рукописи
Новиков Александр Петрович
Организация сетевых структур знаний, поддерживающая их редактирование
Специальность 05.13.11 -Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
Автореферат диссертации на соискание ученой степени кандидата технических наук
1 1 ОКТ 2012
Москва-2012
005052854
Работа выполнена на кафедре информационных технологий в управлении Российской академии народного хозяйства и государственной службы при Президенте Российской Федерации (РАНХиГС).
Научный руководитель: доктор технических наук, профессор Данчул Александр Николаевич
Официальные оппоненты: Болотова Людмила Сергеевна, доктор технических наук, профессор, ведущий научный сотрудник Федерального государственного автономного научного учреждения «Государственный научно-исследовательский институт
информационных технологий и телекоммуникаций «ИНФОРМИКА», профессор кафедры «Вычислительная техника» МГТУ МИРЭА
Ревунков Георгий Иванович, кандидат технических наук, доцент, МГТУ им. Н.Э.Баумана, доцент кафедры «Системы обработки информации и управления»
Ведущая организация: Федеральное государственное
автономное научное учреждение «Центр информационных технологий и систем органов исполнительной власти»
Защита состоится 9 ноября 2012 года в 15.30 на заседании диссертационного совета Д.212.131.05 при федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Московский государственный технический университет радиотехники, электроники и автоматики» (МГТУ МИРЭА) по адресу: г. Москва, пр. Вернадского, д.78.
С диссертацией можно ознакомиться в библиотеке МГТУ МИРЭА. Автореферат разослан 3 октября 2012 года. Ученый секретарь
диссертационного совета, кандидат технических наук, доцент
Андрианова Елена Гельевна
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы исследования. В настоящее время среди программных продуктов, внедряемых в сферу производства, доминируют информационные системы, в которых информационную поддержку для принятия решений обеспечивают знания о текущем состоянии предметной области, интенсивно меняющиеся на этапе эксплуатации информационной системы. В рамках диссертационной работы такие программные продукты будем называть информационными системами на основе динамических знаний. Актуальность и достоверность динамических знаний в информационных системах поддерживается массовым пользователем, не являющимся специалистом в области информационных технологий.
В современных информационных системах все большее внимание уделяется сложно формализуемым знаниям (тяжело поддающимся унификации, структуризации и динамичным). В этом случае необходим доступный массовому пользователю редактор, в котором используется язык манипуляций знаниями, приближенный к языку манипуляций знаниями концептуального уровня, применяемому в повседневной практике общения субъекта. В рамках редактора знаний, доступного массовому пользователю, необходимы автоматические преобразования знаний и операций редактирования между концептуальным и формально-логическим уровнями. Препятствием для создания такого редактора стали трудности реализации автоматических преобразований сетевых структур. Основным признаком сетевой структуры, является наличие хотя бы одного узла, имеющего более одной входящей и более одной исходящей дуг. Изменения во множестве исходящих связей такого узла могут быть необходимы в рамках некоторых входящих связей и недопустимы в рамках остальных входящих связей. Пример редактирования, не содержащий семантики предметной области, приведен на рис. 1.
До настоящего времени не получены решения вопросов автоматического контроля наличия более чем одной входящей связи для конкретного узла и реализации автоматического многовариантного редактирования во множестве исходящих связей такого узла.
Решение задачи автоматических преобразований знаний и операций редактирования между концептуальным и формально-логическим уровнями может быть получено созданием новой организации сетевых структур знаний, т.е. при новых подходах в представлении знаний, реализуемых в оболочках интеллектуальных (в т.ч. экспертных) систем.
а) диаграмма редактируемого узла
б) диаграмма фрагмента знаний (результат редактирования)
Рис. 1. Пример редактирования узла сетевой структуры, не содержащий семантики предметной области
Актуальность поиска новых подходов к решению задачи представления знаний отмечается в работах ведущих специалистов в области информационных технологий и искусственного интеллекта в частности. Так, по мнению проф. Кузина: «В настоящее время достижения в направлении представления в компьютерных системах плохо формализуемых областей знаний весьма скромны. Это объясняется тем, что разработчики ... программного обеспечения пытаются описывать сложные проблемные среды, в которых решаются информационно сложные задачи, посредством однообразных регулярных структур (реляционных таблиц, объектов, фреймов, продукций и т.п.), слишком примитивных для отображения всего многообразия смысловых оттенков проблемной среды, хотя и удобных для последующей обработки информации». Как отмечает Гаврилова Т.А.: «Необходимость создания теоретического базиса науки о методах разработки систем, основанных на знаниях, ... обосновывается в работах Поспелова Г.С., Поспелова Д.А., Попова Э.В., Стефанюка В.Л., Шенка Р., Минского М. ... Немногочисленные попытки создания методологии (работы Осипова Г.С., Хорошевского В.Ф., Вилинга Б., Слэйгла Д.) ... ориентированы на определенный класс задач, моделируемый в рамках конкретного программного инструментария».
Создание доступного массовому пользователю редактора сложно формализуемых динамических знаний должно привести к получению программного инструментария инвариантного к классам задач. При этом круг проблем многоаспектной задачи представления знаний в рамках работ по созданию такого редактора может быть ограничен конкретным аспектом. Такая конкретизация аспекта задачи представления знаний может быть выполнена составлением перечня концепций представления знаний, которые принимаются априори.
Задача разработки организации сетевых структур знаний, позволяющей выполнять автоматические преобразования знаний и
операций редактирования между концептуальным и формальнологическим уровнями, является актуальной для поддержания актуальности и достоверности сложно формализуемых знаний в информационных системах на основе динамических знаний.
Объектом исследования являются информационные системы на основе динамических знаний.
Предметом исследования является сетевая структура как универсальная форма представления знаний, наполняемая содержанием (семантикой) предметной области.
Цель диссертационной работы заключается в создании новой организации сетевых структур, обеспечивающей автоматические преобразования концептуальной модели представления знаний в формально-логическую модель (первоочередное условие доступности массовому пользователю актуализации сложно формализуемых знаний).
Задачи исследования:
1. Рассматривая возможное многообразие структур знаний о реальном мире и познавательные процедуры субъекта, сформулировать концепции представления знаний, обеспечивающие выполнение требований к пользовательским характеристикам информационных систем на основе динамических знаний.
2. Предложить преобразования традиционных семантических сетей в структуры со связями, типизированными в соответствии с типами адекватностей, для фиксации которых они используются.
3. Сформировать формализованную модель представления знаний, отображаемую квазиграфом, и реализующую выявленные концепции представления знаний.
4. Формализовать представление экземпляров понятий при новой организации сетевых структур.
5. Выявить минимальный состав и способы компьютерной реализации операций по редактированию знаний на концептуальном уровне представления. Сформулировать концепцию автоматических преобразований знаний и операций редактирования между концептуальным и формально-логическим уровнями.
6. Проверить реализуемость предложенных методов путем построения редактора классификационных сетей и универсальность этого редактора путем применения его в различных областях.
Методы исследования. Для выявления концепций представления знаний (получения гносеологической модели) применено ассоциирование с процедурами реального процесса познания. Для
отображения формально-логической модели применены методы структурного синтеза и теории графов. Новая организация сетевых структур знаний основана на использовании методов организации цепных списков с двунаправленной связью и методов адресного представления имен указателей.
Научная новизна:
1. Предложена организация сетевых структур, в которой предусмотрена возможность фиксации нового вида типизированных связей, соответствующих адекватностям пяти типов, являющихся основой работы редактора, доступного массовому пользователю. Показано, что наличие в сетевых структурах адекватностей 3, 4 и 5-го типов определяет их принципиальное отличие от структур дерево и лес, для описания которых достаточно адекватностей первого и второго типа.
2. Предложены преобразования традиционных семантических сетей в структуры с типизированными связями, соответствующими пяти типам адекватностей.
Практическая ценность. Применение предложенной организации сетевых структур позволило создать редактор сложно формализуемых знаний, в котором знания и команды, соответствующие операциям редактора, вводимые массовым пользователем на концептуальном уровне, автоматически преобразуются в формально-логический уровень. Результаты диссертационного исследования использованы при создании ОЭС 'Т1С0Ж)С8". Эта оболочка прошла государственную регистрацию и внедрение в четырех предметных областях реального производства: АРМ испытателя (ЦНИИ Монолит); АРМ патентоведа (Нижегородский машиностроительный завод); АРМ информационного обеспечения конструктора стиральных машин автоматов (НИИ машиностроения, г. Дзержинск); АРМ руководителя (фабрика первичной обработки шерсти, г. Токмак, Киргизия).
Апробация результатов работы. Результаты диссертационной работы отражены в 19 публикациях (в т.ч. в материалах 4 семинаров и 6 конференций), а также доложены на научном семинаре и заседании кафедры информационных технологий в управлении РАНХиГС при Президенте РФ.
Структура и объем работы. Диссертация состоит из введения, трех глав, заключения, списка литературы и приложений. Общий объем диссертационной работы составляет 240 страниц, в том числе 104 страницы приложений.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении рассмотрено четыре принципиально различных метода реализации в инструментальных системах решения задачи представления сетевых структур знаний:
■ реализация в продукционных системах;
■ метод реализации наборов записей, основанный на использовании массивов указателей;
■ метод реализации наборов, с применением указателей, которые эффективно связывают записи. Эти связи позволяют последовательно совершать переходы между всеми записями с возвратом к исходной записи;
■ представление знаний средствами реляционных СУБД (традиционная организация).
Обзор достижений в представлении сетевых структур знаний показал, что в настоящее время инструментальные системы позволяют фиксировать в явном виде два типа связей, соответствующих первому и второму типам адекватностей, а возможности выявления неявно указанных связей сильно преувеличены. Т.о. актуализация сложно формализуемых знаний в информационных системах, созданных на базе существующих инструментальных средств, может быть доступна массовому пользователю, только если структура знаний не выходит за рамки структур дерево и лес.
Рассмотрение задачи доступности массовому пользователю редактора сложно формализуемых знаний позволило установить, что ее решение находится в новых подходах к представлению знаний в проектируемых инструментальных системах и не может быть получено модернизацией интерфейса получивших распространение, оболочек.
Обоснована актуальность темы диссертационного исследования, сформулированы цель, задачи, объект и предмет исследования, научная новизна и практическая значимость работы.
В первой главе для выявления концепций представления знаний, реализация которых позволяет создать редактор сложно формализуемых знаний, доступный массовому пользователю, рассмотрено многообразие структур знаний об области реального мира, и рассмотрены процедуры процесса познания субъекта. Т.к. при традиционном толковании семантическая сеть является отображением области предметного мира и только частичным отображением области реального мира, рассмотрена трансформация структур традиционных семантических сетей в структуры, содержащие возможность выражения типизированных связей по типам адекватностей.
В первом параграфе рассматривается семантическая сеть, определяемая как многообразие структур знаний отображаемых в виде ориентированного псевдографа с поименованными узлами и дугами, в котором понятия (объекты) представляются как узлы, а отношения между понятиями - как связи между узлами (дуги). При таком толковании семантической сети всякая структура знаний является ее частным случаем. Основываясь на том, что массовый пользователь в практике актуализации знаний информационной системы может столкнуться со структурами знаний во всем их многообразии, при рассмотрении семантической сети были выявлены ее свойства, которые разделены на две группы.
1. По многообразию структур знаний;
2. По реальным размерам конкретных баз знаний и условиям эксплуатации, соответствующим размерам баз знаний.
Во втором параграфе рассматриваются процедуры реального процесса познания "выявление экземпляров сущностей и их отражение в гносеологической модели", "типизация" и др.
Структурную единицу концептуальной модели, ассоциируемую с сущностью реального мира, принято именовать понятием. Концептуальная модель реального мира (понятийная модель) содержит множество экземпляров каждого из множества понятий. Каждый экземпляр конкретного понятия находится в конкретном месте сетевой структуры знаний, которое определяется понятиями ближайшего окружения. Диаграмма основного признака сетевой структуры (рис. 1-а) фактически является диаграммой двунаправленного определения понятия в структуре знаний. При таком толковании определения все они имеют типовую структуру. Множество сущностей проявления конкретной сущности составляют определяющую часть основного направления в определении исходной сущности. В диссертационной работе множество понятий, соотносимое с таким множеством сущностей, организовано в список, который именован "семантическим списком прямого перехода". Множество сущностей, для которых исходная сущность является проявлением при выявлении, составляют определяющую часть второго направления в определении исходной сущности. В диссертационной работе множество понятий, соотносимое с таким множеством сущностей, организовано в список, который именован "семантическим списком обратного перехода". В дальнейшем, при моделировании реального мира любое из этих направлений может быть назначено основным.
Гносеологическая модель, представима множеством определений каждого из множества понятий, в котором части каждого определения (метка понятия и два множества меток понятий) соединены типизированными связями, соответствующими типам адекватностей. При рассмотрении процедур процесса познания принималось, что понятия в гносеологической модели равнозначны, а не поделены априори на объекты и отношения, как это принято в моделировании предметного мира. Было принято, что гносеологическая модель предметной области должна быть многомерной, а не составленной из множества однородных моделей этой предметной области. Установлено, что связи в гносеологической модели типизированы. Типизацией связей выделяются различные типы адекватностей. Понятие адекватности играет ключевую роль в рассмотрении гносеологической модели. Адекватность - это субъективно устанавливаемое сходство в гносеологической модели нескольких понятий, или нескольких экземпляров одного понятия, определяющее их структурную семантику (примеры см. рис. 2). На формальнологическом уровне адекватность выражается типизированной (по одному из структурных свойств) двунаправленной связью внутри или между ячейками гносеологической модели, которая устанавливается на части одной или двух ячеек гносеологической модели, соответствующих структурным единицам;
б) в)
*\
/ ! ' !/
г) '
Рис. 2. Фрагменты сетевой структуры знаний, отражающие адекватности с 1 по 5 тип
На формально-логическом уровне: Адекватность 1 типа - это принадлежность узла к семантическому списку прямого или обратного перехода. На рис. 2-а, 2-6 и 2-в - эти связи отражены стрелками, объединяющими в списки технические узлы (уь у2, ... ,уп), и изделия (иь и2, ... ,ик);
❖ Адекватность 2 типа - отражается связью узла с его семантическими списками прямого и обратного переходов. На рис. 2-а - эти связи с
затемненным узлом отражены сплошными и штриховыми стрелками, показывающими порядок в списке адекватных;
❖ Адекватность 3 типа - это сходство узлов, имеющих переход на один и тот же семантический список прямого перехода. На рис. 2-6 -эти связи отражены стрелками, объединяющими в список агрегаты (аь а2, ... ,ат);
❖ Адекватность 4 типа - это сходство узлов, имеющих переход на один и тот же семантический список обратного перехода. (На рис. 2-в - эти связи отражены стрелками, объединяющими в список агрегаты (аь а2, ... ,ар);
❖ Адекватность 5 типа - это сходство узлов, к которым подсоединена одна и та же висячая вершина. Им соответствует одно и то же имя в базе имен. (На рис. 2-г - такая связь отражена стрелкой между затемненными узлами).
В третьем параграфе приведена трансформация структур традиционных семантических сетей в структуры, содержащие возможность выражения типизированных связей по типам адекватностей. Трансформация фрагментов семантической сети состоит из двух преобразований.
Диаграмма исходного Результат первого Трансформированный
фрагмента преобразования псевдограф
трансформации
6 О (^ИмР)
Иот (^Ио. С -М^Ио,
Где: Иов — естественно-языковое имя объекта;
Иот - естественно-языковое имя отношения.
Рис. 3. Трансформация бинарного отношения псевдографа
В первом, каждая дуга заменяется вершиной и двумя неименованными дугами (см. рис. 3). Преобразование призвано свести операции актуализации знаний на концептуальном уровне к простейшим из множества. По сути своей множество понятий-объектов и множество понятий-отношений являются понятиями, ассоциируемыми с сущностями, которые в свою очередь даны нам в
проявлениях. Нет оснований различать редактирование определения "понятия-объекта" и редактирование определения "понятия-отношения". Редактирование конструкций "объект-отношение-объект" содержит интегральные операции, состоящие из простейших. Во втором преобразовании к каждой вершине добавляется висячая вершина, на которую переносится имя исходной вершины. Это преобразование призвано решить две задачи: 1) отделить проблемы организации базы имен от проблем организации сетевых структур и получить их независимые решения; 2) запретить подвергать имена интеграции-декомпозиции. В результате получена структура трансформированного псевдографа.
Во второй главе получено формализованное выражение гносеологической модели (квазиграф), которое реализует выявленные в главе 1 концепции представления знаний. В основу квазиграфа положены методы организации цепных списков с двунаправленной связью и методы адресного представления имен указателей. Как результат реализации этих методов предложена структура кортежа соответствующего экземпляру метки узла квазиграфа. Сформулирована концепция автоматических преобразований знаний и операций редактирования между концептуальным и формально-логическим уровнями. Описана реализация этой концепции и решение сопутствующих задач.
В первом параграфе на примере агрегатной модели приведена диаграмма однообразной регулярной структуры квазиграфа (см. рис. 4). На диаграмме отражены адекватности пяти типов, возможность фиксации которых должна быть предусмотрена при новой организации сетевых структур в базах знаний. Приведена методика преобразований трансформированного псевдографа, получаемого из семантических сетей традиционного толкования, в структуру квазиграфа. А также выполнена формализация микроструктуры квазиграфа (предложена структура кортежа для новой организации).
Одинаковые семантические списки прямого и обратного переходов присутствуют в квазиграфе в одном экземпляре. Тем самым обеспечиваются важнейшие в эксплуатации систем, основанных на знаниях, качества сетевых структур: изменения, однократно вносимые в определение понятия, распространяются в сетевой структуре знаний на все множество меток использования этого так определенного понятия. Методика преобразования трансформированного псевдографа в квазиграф иллюстрируется рис. 5:
Семантический список обратного перехода. Изделия 1
Семантический список обратного перехода. Изделия 2
Семантический список обратного перехода. Изделия к
Семантический список прямого перехода. Изделия
Семантический список прямого
Семантический список прямого перехода. Изделия к
Семантический список прямого перехода узла 1
Семантический список прямого переход узла 2
Семантический список прямого перехода узла п
Рис. 4. Фрагмент квазиграфа: Агрегатная модель "ячейки гносеологической модели" в сетевой структуре
а) Исходный фрагмент модели знаний.
О-
азс^-.....-о— оч>о~о
-■О. о^/л^в
б) Семантические списки для узлов исходного фрагмента модели знаний, размещаемые в
в) Квазиграф. Структурная семантика соответст- г) Окончательная версия квазиграфа вует структурной семантике исходного фрагмента исходного фрагмента модели знаний, модели знаний.
Рис. 5. Пример отображения фрагмента модели знаний квазиграфом.
1. Формируются семантические списки всех узлов. Кортежи в каждом списке объединяются в цепной список с двунаправленными связями. Адекватность первого типа. Для каждого узла указываются семантические списки прямого и обратного переходов. Диаграмма "4-6".
2. Сформированные списки прямого и обратного переходов размещаются в произвольном порядке. Каждый кортеж каждого узла соединяется со своими списками прямого и обратного переходов в соответствии с тем как это показано на диаграмме "4-в" (адекватность второго типа).
3. Просматривая семантические списки, выявляются те, на которые направлено более одного указателя. Кортежи, от которых выявлены
указатели на один и тот же семантический список прямого перехода, объединяются в цепной список с двунаправленными связями (адекватность третьего типа). Диаграмма "4-г".
4. Кортежи, от которых выявлены указатели на один и тот же семантический список обратного перехода, объединяются в цепной список с двунаправленными связями (адекватность четвертого типа). Диаграмма "4-г".
5. Кортежи квазиграфа, имеющие указатели на одно и то же имя в базе имен, объединяются в цепной список с двунаправленными связями (адекватность пятого типа).
Экземпляру метки узла квазиграфа поставлен в соответствие кортеж, в состав которого входят несколько атрибутов, фиксирующих связи по типовым адекватно стям.
< й„ е5ш, ин ..., ип >
В формуле: (</, )- имя понятия, определямого этим кортежем;
сБт - принадлежность кортежа к цепным спискам Бт соответственно (выраженная двунаправленной связью). т — количество типов адекватностей, учитываемых оболочкой; иь ..., и„- указатели на другие структурные элементы базы знаний. п - количество указателей, с помощью которых можно, например:
1) именовать понятия (с размещением имен в базе имен);
2) устанавливать авторизованную ответственность за конкретное понятие, размещаемое в гносеологической модели; и т.п.
Принадлежность кортежа к цепному списку фиксируется двумя указателями. Конкретное понятие единственным экземпляром соотносится с каждым экземпляром сущности. В квазиграфе конретное понятие представлено множеством определений, в каждом из которых присутствует своим экземпляром.
Формализованное описание экземпляра понятия или узла сетевой структуры, позволяет представить все многообразие структур знания в виде множества экземпляров метки каждого из множества понятий.
Во втором параграфе описано выявление минимального состава и способов компьютерной реализации операций по редактированию знаний на концептуальном уровне представления. А также сформулирована концепция автоматических преобразований знаний и операций редактирования между концептуальным и формальнологическим уровнями.
Наполнение базы знаний знаниями и редактирование знаний - это манипуляция фактами, которые состоят из простейших фактов.
Простейший факт состоит из объекта и предмета, соединенных ориентированной связью.
Не пакетный режим обработки знаний позволяет организовать для всякого шага локации по сетевой структуре знаний отображение на экране монитора конкретного однонаправленного определения конкретного понятия. Находясь в рамках конкретного определения, человек актуализирует простейшие факты, т.е. манипулирует именами проявлений, и при этом ассоциирует свою работу с актуализацией определения.
Рассмотрение ситуаций, требующих вызова редактора знаний, в однонаправленном определении понятия, позволило установить минимальный состав простейших операций редактора. Это внесение, дублирование, изменение текста, перемещение и удаление понятия.
Практика внедрения ОЭС РЮТЫОСБ подтвердила необходимость и достаточность состава простейших операций редактора для актуализации знаний любых, возникающих на практике структур. А также показала, что массовый пользователь с успехом, не испытывая затруднений, интегрирует простейшие операции для решения стоящих перед ним задач актуализации знаний.
Ограниченное количество простейших операций редактора на концептуальном уровне позволяет рассмотреть их результат на ограниченном многообразии набора характеристик определения. Это позволяет разработать редактор с автоматическими преобразованиями знаний и операций редактирования между концептуальным и формально-логическим уровнями.
Т.о. редактор можно получить как матрицу решений. В этом случае результирующие варианты правильных преобразований фрагментов знаний отрабатываются на этапе проектирования оболочки.
В третьем параграфе доказана необходимость и достаточность параметров формулы метки понятия для работы редактора сложно формализуемых динамических знаний. Доказательство использует крупноблочное описание минимально допустимого состава операций по редактированию знаний. Все операции поддерживают целостность сетевой структуры и не содержат необходимости сканирования базы данных, т.е. базы сетевой структуры, которая через интерпретатор, содержащийся в программных блоках, соотносится со знаниями, концептуальной модели предметной области.
В третьей главе показано, что практическая реализуемость теоретических результатов диссертационного исследования, в первую очередь, представления знаний с использованием квазиграфов, была
подтверждена созданием редактора знаний в оболочке классификационных экспертных систем (ОКЭС) РГСОМОСБ. ОКЭС РКЮЖЗСБ включена в отраслевой фонд алгоритмом и программ. Характеристики ОКЭС РГСОМОСБ, выгодно выделяющие ее во множестве других оболочек экспертных систем, обусловленные наличием редактора знаний, доступного массовому пользователю, подтверждены экспертной комиссией и отражены в программной документации. Описаны работы по внедрению в информационное обслуживание на реальном производстве интеллектуальных информационно поисковых систем, которые базировались на комплексе программ РГСОЖЭСБ и его адаптации на такое применение в конкретных предметных областях.
В первом параграфе описано применение комплекса программ Р1СО>ТОС8, нацеленное на автоматизацию информационного обслуживания в реальном производстве. Перечислены одиннадцать предметных областей, в которых проработано использование комплекса программ РГСОМОСБ для создания интеллектуальных информационно поисковых систем. Проработана формализация декларативных, а так же одного из вариантов процедурных знаний.
На конкретном рабочем месте могут применяться несколько удачных формализмов для конкретной предметной области, которые последовательно вводятся в состав интеллектуальной информационно поисковой системы. Удачный формализм - это результат формализации некоторой, подвергаемой интенсивной актуализации в период эксплуатации информационной системы, части предметной области, позволяющий выделить данные из знаний. Результат формализации реализуется в программных блоках информационной системы (в ССУБД).
Структура интеллектуальной информационно поисковой системы, основанной на комплексе программ РГСОМЭСБ, приведена на рис. 6.
На рисунке: ОКЭС - оболочка классификационных экспертных систем;
F/ - интерактивный интерфейс локации по сетевой структуре знаний для поиска объекта или класса;
- интерактивный интерфейс редактора классификационных сетей;
ДТСБЗ - данные о текущем состоянии базы знаний;
ПрЛ - протокол локации по сетевой структуре знаний в текущем сеансе работ;
I - порядковый номер ввода формализма в состав интеллектуальной информационно поисковой системы;
БД(ВСО), — база вторых семантических образов для конкретного формализма;
ССУБД; - специализированная СУБД, выполняющая специфические функции с конкретной базой вторых семантических образов.
БД(ВСО), ССУБД1
• • •
БД(ВСО),, ССУБД,,
База сетевой структуры
База имен понятий
Программные блоки ОКЭС "F1CONOCS"
F, F2
ПрЛ
ДТСБЗ
Рис. 6. Структура интеллектуальной информационно поисковой системы, основанной на комплексе программ FICONOCS
При параллельной актуализации знаний специалистами из различных предметных областей необходимо согласование их действий. Для обеспечения такого согласования предусмотрена организация цепей пояснений и работа с ними (использование пояснений в практике получения информационной поддержки, формирование и актуализация цепей пояснений).
Во втором параграфе описаны обоснование и практические работы (в т.ч. конкретный пример) по адаптации комплекса программ FICONOCS для применения в качестве интеллектуальной информационно поисковой системы предметной области. Как оболочка классификационных экспертных систем комплекс программ FICONOCS инвариантен к предметным областям. К тому же широкий спектр предметных областей, проанализированных с точки зрения применимости в них разработанного комплекса программ, показал универсальность редактора знаний, которая подтвердилась его внедрением в четырех предметных областях. Внедрение в реальное производство комплекса программ FICONOCS в качестве интеллектуальной информационно поисковой системы выполнялось в той части информационного обслуживания, работы в которой в настоящее время не автоматизированы по причине плохой формализуемости знаний предметной области. На примере конкретной
предметной области: "Патентная информация" рассмотрены задачи "АРМ патентоведа на промышленном предприятии". Показано, что в каждой предметной области можно выделить сложно формализуемые знания и несколько удачно формализуемых областей. Адаптация комплекса программ Р1С(ЖОС8 рассматривалась как формализация (удачная для предметной области и конкретного рабочего места) и включение формализмов в общую модель знаний о предметной области. Описаны способы адаптации комплекса программ РГССЖОСБ к предметным областям и решаемые задачи при создании формализмов и включении их в комплекс программ. Применение новой технологии интеллектуальных информационно поисковых систем делает информационную систему адаптивной к предметным областям, легко настраиваемой на потребности конкретного рабочего места конкретного предприятия.
В третьем параграфе описано обобщение опыта работ по внедрению комплекса программ РЮОЫОСБ в реальное производство. В т.ч. описаны работы по созданию массовым пользователем стартовой базы знаний в предметной области бытовые пылесосы при внедрении комплекса программ РГСОЫОСБ в патентном подразделении Нижегородского машиностроительного завода. А также отмечено, что практический опыт автоматизации информационного обслуживания на реальном производстве показал востребованность интеллектуальных информационно-поисковых систем на базе комплекса программ РТССЖОСЯ и возможность его адаптации на такое применение в любых конкретных предметных областях. Показано, что заложенные в основе разработки комплекса программ РГСОМОСБ методы представления знаний, обеспечивают характеристики программной системы, востребованные реальным производством. В т.ч.:
1. Работы по созданию стартовой базы знаний на нескольких внедрениях позволили убедиться, что редактор сложно формализуемых знаний доступен массовому пользователю, а практическая ценность информационной системы наступает при количестве узлов сетевой структуры знаний более 100.000. Базы знаний таких размеров могут создаваться только повседневным трудом массового пользователя (специалиста в своей конкретной области, а не в области информационных технологий).
2. Эксплуатационные характеристики комплекса программ РЮСЖОСБ (независимость времени реакции программной системы на всяком шаге интерактивного взаимодействия, отсутствие ограничений на диапазоны параметров сетевой структуры знаний и др.) были подтверждены
тестированием и востребованы в работах по созданию стартовых баз знаний. Это является подтверждением, практической значимости научных результатов диссертационной работы (методов организации знаний на квазиграфах).
В заключении диссертации сформулированы основные результаты, полученные в ходе исследования:
1. При рассмотрении многообразия структур знаний о реальном мире и процедур процесса познания сформулированны концепции представления знаний, обеспечивающие выполнение двух групп требований к пользовательским характеристикам информационных систем на основе динамических знаний.
■ по многообразию структур знаний о реальном мире;
■ по реальным размерам конкретных баз знаний и условиям эксплуатации, соответствующим размерам баз знаний.
2. Предложены два этапа преобразований традиционных семантических сетей в структуры с типизированными связями.
3. Сформирована формализованная модель представления знаний, отображаемая квазиграфом, и реализующая выявленные концепции представления знаний.
4. Предложена структура кортежа при новой организации сетевых структур, которая соответствует формализованной модели знаний и основана на применении цепных списков с двунаправленной связью.
5. Эмпирически выявлен минимальный состав операций редактора знаний на концептуальном уровне представления, состоящий из внесения, дублирования, изменения текста, перемещения и удаления понятия, а также предложены способы их компьютерной реализации. Сформулирована концепция автоматических преобразований знаний и операций редактирования между концептуальным и формальнологическим уровнями.
6. Предложенная организация сетевых структур знаний реализована в оболочке классификационных экспертных систем с редактором знаний, доступным массовому пользователю. Разработанная оболочка была использована при создании и исследовании интеллектуальных информационно-поисковых систем в одиннадцати предметных областях.
В заключении предложены конкретные рекомендации по совершенствованию новой организации сетевых структур знаний и расширению многообразия областей ее применения.
Основные положения диссертационной работы отражены в следующих публикациях:
1. Данчул А.Н., Новиков А.П. Представление знаний о предметной области на основе гносеологической модели // Информационные технологии № 10 - 2009. С. - 44 - 50 (из перечня ВАК ведущих рецензируемых научных журналов и изданий).
2. Данчул А.Н., Новиков А.П. Толкование понятия, именуемого термином "знания". // Реинжиниринг бизнес-процессов на основе современных информационных технологий. Системы управления знаниями (РБП-СУЗ-2012). Материалы XV научно-практической конференции в МЭСИ - М., 2012. С. 46 - 51.
3. Данчул А.Н., Новиков А.П. Области применения оболочек систем, основанных на знаниях // Исследование и информатизация управления социально-экономическими, политическими и административными процессами: Сборник научных статей / Под общей ред. А.Н. Данчула. - М.: Изд-во РАГС, 2010 год. - С. 59 - 70.
4. Данчул А.Н., Новиков А.П. Анализ проблемы представления знаний о предметной области // Автоматизация в промышленности. Материалы 3-й Научной конференции в Институте проблем управления РАН. июнь 2009 года. - М.: - С. 92 - 112.
5. Дьячко А.Г., Данчул А.Н., Новиков А.П. Автоматизированное рабочее место менеджера целевых проектов // Автоматизация в промышленности. Материалы 3-й Научной конференции в Институте проблем управления РАН. июнь 2009 года. - М.: - С. 215 - 238.
6. Данчул А.Н., Новиков А.П. Конструктивный взгляд на использование семантических сетей в информационных системах поддержки решений. // Ситуационные центры и перспективные информационно-аналитические средства поддержки принятия решений. Материалы научно-практической конференции РАГС. 25-27 апреля 2007 года. - М.: Изд-во РАГС, 2008 год. - С. 251 - 257.
7. Данчул А.Н., Новиков А.П. Самопрограммируемость интеллектуальных систем. // Автоматизация в промышленности. Материалы 2-й Научной конференции в Институте проблем управления РАН. 14 апреля 2008 года. -М.: - С. 171 - 181.
8. Дьячко А.Г., Новиков А.П. Организация «базы процедурных знаний» для расширяемых систем. // Автоматизация в промышленности. Материалы 2-й Научной конференции в Институте проблем управления РАН. 14 апреля 2008 года. - М.: - С. 161 - 170.
9. Дьячко А.Г., Новиков А.П. Организация «базы имен» объектов и отношений семантической сети для неконтролируемого (бесконтрольного) ее использования. // Автоматизация в промышленности. Материалы 2-й Научной конференции в Институте проблем управления РАН. 14 апреля 2008 года. - М.: - С. 147 - 161.
10. Данчул А.Н., Новиков А.П. Автоматизированное рабочее место специалиста управленческого аппарата предприятия // Методы и технологии информатизации управленческой деятельности: Сборник научных статей / Под общей ред. А.Н. Данчула. - М.: Изд-во РАГС, 2007 год.-С. 190- 198.
11. Новиков А.П. Данчул А.Н. Автоматизированное рабочее место руководителя на основе семантических сетей // Ситуационные центры: модели, технологии, опыт практической реализации. Материалы научно-практической конференции РАГС. 18-19 апреля 2006 года. -М.: Изд-во РАГС, 2007 год. - С. 130 - 137.
12. Морозов В.А. Новиков А.П. Автоматизация маркетинга информационной продукции и услуг // Программирование и практика применения ПЭВМ. Материалы семинара в Московском доме научно-технической пропаганды им. Ф.Э. Дзержинского. М.: Изд-во общества «Знание» РСФСР. - 1991 год. - С. 68 - 71.
13. Новиков Л.С., Новиков А.П. Основные принципы построения и редактор базы знаний экспертной системы поиска и прогнозирования новых технических решений // - Сборник ВОТ, Серия 3, Выпуск 6 (236), 1990 года,- М.: С. 13 - 19.
14. Морозов В.А., Новиков А.П. Реализация семантической сети в оболочке классификационной экспертной системы ИСОТЧОСБ. // Методы и системы принятия решений. Системы поддержки процессов проектирования на основе знаний. Сборник научных статей 1990 года. Рига.: Изд-во Риж. техн. ун-та. - С. 156 - 161.
15. Морозов В.А., Новиков А.П. Оболочка классификационной экспертной системы «Р1СО>ТОС8» // Программное обеспечение ПЭВМ в компьютеризации. Материалы семинара в Московском Доме научно-технической пропаганды имени Ф.Э.Дзержинского. - 1990 год. М.: Общество «Знание» РСФСР. С. 122 - 127.
16. Морозов В.А. Новиков А.П. Оболочка экспертной системы «РГСОМОСБ» как интерфейс между человеком и ЭВМ в расширяемых системах // Адаптируемые средства программирования. Материалы всесоюзного семинара в Кишиневском сельскохозяйственном институте им. М.В.Фрунзе. 25-29 июня 1990 года. - Кишинев: Молдавское республиканское правление союза НИО СССР. Дом науки и техники МРП СНИО СССР. С. 76 - 79.
17. Морозов В.А., Новиков А.П., Бронивецкая Л.Д. Оболочка экспертной системы РГСОКЮСБ (версия 3) // Информационный листок о научно - техническом достижении № 92-1170 УДК 681.518.2 Рубрика 50.41.21 // Всероссийский научно-исследовательский институт межотраслевой информации.
18. Новиков А.П. (исполнитель) Комплекс программ «Р1СОЖ)С8», Техническая документация, - М.: ЦНИИ ЭИСУ, 1988. С. 156.
19. Новиков А.П. Методика разработки программ: «Диалог ввода исходных данных в режиме изменения с использованием прототипов, создаваемых пользователем» // Проблемы создания и развития САПР, АСТПП, ГПС в отрасли. Материалы отраслевого семинара в Центральном научно-исследовательском институте информации и технико-экономических исследований. 17-19 декабря 1985 года. М. -С. 25-29.
Автореферат диссертации на соискание ученой степени кандидата технических наук
Новикова Александра Петровича
Тема диссертационного исследования
Организация сетевых структур знаний, поддерживающая их редактирование
Научный руководитель доктор технических наук, профессор Данчул Александр Николаевич
Изготовление оригинал - макета Новиков Александр Петрович
Подписано в печать 02 октября 2012 г. Объем 1,0 усл. п.л. Заказ №672. Тираж 100 экз.
Отпечатано в ООО «Реглет»
г. Москва, Проспект Вернадского, д. 39 тел. (495) 661-60-89, (495) 363-78-90 e-mail: reglet@mail.ru
Оглавление автор диссертации — кандидата технических наук Новиков, Александр Петрович
ВВЕДЕНИЕ.
ГЛАВА 1. КОНЦЕПЦИИ ПРЕДСТАВЛЕНИЯ ЗНАНИЙ НА ОСНОВЕ ГНОСЕОЛОГИЧЕСКОЙ МОДЕЛИ.
1.1. Характеристики структур знаний о реальном мире, выражающие их многообразие.
1.2. Концепции представления знаний в гносеологической модели.
1.3. Преобразование структур традиционных семантических сетей в структуры с типизированными связями, соответствующими пяти типам адекватностей.
Выводы по главе 1.
ГЛАВА 2. ОРГАНИЗАЦИЯ СЕТЕВЫХ СТРУКТУР В БАЗАХ ЗНАНИЙ.
2.1. Квазиграф как формализованный вариант гносеологической модели.
§
2.2. Состав простейших операций по редактированию знаний на концептуальном уровне представления.
2.3. Необходимость и достаточность параметров формулы метки понятия для работы редактора знаний доступного массовому пользователю.
Выводы по главе 2.
ГЛАВА 3. РЕАЛИЗАЦИЯ ПРЕДЛОЖЕННОЙ ОРГАНИЗАЦИИ СЕТЕВЫХ СТРУКТУР В БАЗАХ ЗНАНИЙ.
3.1. Автоматизация информационного обслуживания с применением интеллектуальных информационно поисковых систем на базе созданной ОКЭС ИС01Ч0С8.
3.2. Адаптация комплекса программ ИСОІЧОСв к предметной области на конкретном примере.
3.3. Обобщение опыта по созданию комплекса программ ИСОІЧОСв и его внедрению в различных предметных областях.
Выводы по главе 3.
Введение 2012 год, диссертация по информатике, вычислительной технике и управлению, Новиков, Александр Петрович
В настоящее время среди программных продуктов, внедряемых в сферу производства, доминируют информационные системы, в которых информационную поддержку для принятия решений обеспечивают знания о текущем состоянии предметной области, интенсивно меняющиеся на этапе эксплуатации информационной системы. В рамках диссертационной работы такие программные продукты будем называть информационными системами на основе динамических знаний. Актуальность и достоверность динамических знаний в информационных системах поддерживается массовым пользователем - специалистом в своей конкретной предметной области, который по определению не обязан быть специалистом в области информационных технологий.
В современных информационных системах все большее внимание уделяется сложно формализуемым знаниям (тяжело поддающимся унификации, структуризации и динамичным)1 [1]. В оболочках интеллектуальных (в т.ч. экспертных) систем ввод знаний и их актуализацию выполняют инженеры по знаниям. По мнению проф. Макаровой Н.В.: «Разработка программных комплексов экспертных систем . находится на уровне скорее искусства, чем науки. Это связано с тем, что . каждый последующий этап разработки . приносит новые идеи, которые могут повлиять на предыдущие решения и даже привести к их переработке» [2, С. 606]. Т.о. коллектив инженеров по знаниям в силу ограниченности возможностей каждого из них не способен достаточно оперативно поддерживать актуальность сложно формализуемых знаний в информационных системах. Необходим доступный массовому пользователю редактор, в котором используется язык манипуляций знаниями, приближенный к языку манипуляций знаниями концептуального уровня, применяемому в повседневной практике общения субъекта. В рамках редактора знаний, доступного массовому пользователю, необходимы автоматические преобразования знаний и
Толкование понятия, именуемого термином "сложно формализуемые знания" см. в приложении 1. операций редактирования, между концептуальным и формальнологическим уровнями. Редактор знаний, рассчитанный на массового пользователя, должен с успехом работать на всем многообразии структур знаний. Препятствием для создания такого редактора стала нерешенность вопросов автоматического многовариантного редактирования сетевых структур знаний. Основным признаком сетевой структуры, является наличие хотя бы одного узла, имеющего более одной входящей и более одной исходящей дуг. Изменения во множестве исходящих связей такого узла могут быть необходимы в рамках некоторых входящих связей и недопустимы в рамках остальных входящих связей. Пример редактирования, не содержащий семантики предметной области, приведен на рис. 1.
Рис. 1. Пример редактирования узла сетевой структуры, не содержащий семантики предметной области
До настоящего времени не получены решения вопросов автоматического контроля наличия более чем одной входящей связи для конкретного узла и реализации автоматического многовариантного редактирования во множестве исходящих связей такого узла.
Решение задачи автоматических преобразований знаний и операций редактирования между концептуальным и формально-логическим уровнями может быть получено созданием новой организации сетевых структур знаний, т.е. при новых подходах в представлении знаний, реализуемых в оболочках интеллектуальных (в т.ч. экспертных) систем. Актуальность поиска новых подходов к решению задачи представления знаний отмечается в работах ведущих специалистов в области информационных технологий и ИИ в частности. Так, по мнению проф. Кузина: «В настоящее время достижения в направлении представления в компьютерных системах плохо формализуемых областей знаний весьма скромны. Это объясняется тем, что разработчики . программного обеспечения пытаются описывать сложные проблемные среды, в которых решаются информационно сложные задачи, посредством однообразных регулярных структур (реляционных таблиц, объектов, фреймов, продукций и т.п.), слишком примитивных для отображения всего многообразия смысловых оттенков проблемной среды, хотя и удобных для последующей обработки информации» [3]. Как отмечает Гаврилова Т.А.: «Необходимость создания теоретического базиса науки о методах разработки систем, основанных на знаниях, . обосновывается в работах Поспелова Г.С., Поспелова Д.А., Попова Э.В., Стефанюка В.Л., Шенка Р., Минского М. . Немногочисленные попытки создания методологии (работы Осипова Г.С., Хорошевского В.Ф., Вилинга Б., Слэйгла Д.) . ориентированы на определенный класс задач, моделируемый в рамках конкретного программного инструментария» [4, С. 1].
Создание доступного массовому пользователю редактора сложно формализуемых знаний должно привести к получению программного инструментария инвариантного к классам задач, использующих традиционные классы моделей знаний. При этом круг проблем многоаспектной задачи представления знаний в рамках работ по созданию такого редактора может быть ограничен конкретным аспектом. Такая конкретизация аспекта задачи представления знаний может быть выполнена составлением перечня концепций представления знаний, которые принимаются априори2.
Задача разработки организации сетевых структур знаний, позволяющей выполнять автоматические преобразования знаний и операций редактирования между концептуальным и формально-логическим уровнями, является актуальной для поддержания актуальности и достоверности сложно формализуемых знаний в информационных системах на основе динамических знаний.
2Перечень концепций представления знаний, которые принимаются априори см. в приложении 2.
Степень разработанности проблемы.
Разработчики инструментальных систем (СУБД и оболочек систем, основанных на знаниях) в документации к инструментальной системе описывают методы внесения в базу знаний узлов, имеющих более чем одну входящую связь и более чем одну исходящую связь (узлов сетевой структуры). Т.о. поясняется возможность создания (с применением конкретной инструментальной системы) сетевой структуры, присущей неоднородным моделям знаний. Создание сетевой структуры в рамках той или иной инструментальной системы целесообразно, если предоставлена возможность обработки неоднородной модели знаний сетевой структуры (в т.ч. поиск по сетевой структуре), которая должна быть заложена в механизме обработки знаний.
Как отмечает Гаврилова Т.А.: "В подавляющем большинстве систем, основанных на знаниях, механизм вывода представляет собой небольшую по объему программу." [5, С. 26]. "Процедуры, реализующие поиск, обычно «зашиты» в механизм вывода, поэтому в большинстве систем инженеры знаний не имеют к ним доступа и, следовательно, не могут в них ничего изменять по своему желанию" [5, С. 28]. "При разработке стратегии управления выводом важно определить., какую точку в пространстве состояний принять в качестве исходной? От выбора этой точки зависит и метод осуществления поиска - в прямом или обратном направлении" [5, С. 28]. Разработанные в настоящее время оболочки не содержат процедур вывода кроме процедур, именованных процедурами прямого и обратного выводов. Рассмотрение процедур прямого и обратного выводов позволяет определить их как локацию (в прямом или обратном направлениях) по какой-либо из вертикалей иерархической структуры. Такие возможности вывода удовлетворяют потребностям обработки однородных моделей знаний иерархических структур, т.е. структур дерево и лес.
Неоднородную модель знаний можно рассматривать как множество однородных моделей знаний, объединенных в виде "органически " единой модели знаний. Наличие в модели знаний связей между однородными моделями знаний позволяет утверждать, что рассматривается неоднородная модель. Это определение неоднородной модели знаний позволяет получить обоснованный ответ на вопрос: "Рассматриваемая конкретная модель знаний может быть названа неоднородной или это все та же однородная модель, у которой не удалось сформулировать и именовать примененную однородность?" В настоящее время в публикациях не встречается рассмотрение характера таких связей между однородными моделями знаний. Для обработки неоднородной модели знаний недостаточно множества функций механизма обработки знаний, используемых при обработке однородных моделей знаний. Отметим также, что однозначность прямого или обратного выводов требует, чтобы каждое понятие в однородной модели знаний было представлено единственным определением (единственным экземпляром в структуре знаний).
При рассмотрении механизма по обработке знаний у конкретной оболочки (как равно и в конкретной СУБД) не удается выделить функции этого механизма, которые не используются для обработки однородных моделей знаний структур дерево или лес, и которые предположительно могли бы использоваться для обработки неоднородных сетевых моделей знаний. Пользователи каждой конкретной оболочки, создавая модели знаний, не создают узлов сетевой структуры, т.к. механизмом обработки знаний эти узлы воспринимаются как узлы структур дерево или лес. Редактирование таких узлов (редактором знаний конкретной оболочки) может привести к неожиданному результату. В сложившейся ситуации легко сделать ложное заключение о том, что создание неоднородных моделей знаний сетевой структуры не востребовано практикой, т.к. не наблюдается в практических работах пользователей оболочек.
Недостаточное внимание к изучению возможностей и ограничений по работе с сетевыми структурами в рамках инструментальных систем (СУБД и оболочек систем, основанных на знаниях) обусловило пробел в исследованиях по теме: "Неоднородные сетевые модели знаний".
Исследования по теме диссертационной работы позволили установить, что для неоднородных моделей знаний сетевой структуры можно предложить новое представление (организацию), в котором используются типизированные связи в соответствии с типами адекватностей (в т.ч. выявленными), для фиксации которых они используются. Сформирована диаграмма связей узла в сетевой структуре, позволяющая фиксировать связи пяти типов. Эту диаграмму предложено считать базовой диаграммой. В приложении 2 рассмотрены реализации в инструментальных системах четырех типовых решений задачи представления знаний. Показаны возможности формирования с применением этих реализаций базовой диаграммы. В результате исследований установлено, что связи 3, 4 и 5 типов не могут фиксироваться существующими в настоящее время инструментальными средствами. Таким образом, многообразие смысла простейших фактов, связанных с конкретным понятием, при описании предметной области ограничивается первым и вторым типами связей, то есть должно укладываться в структуры дерево и лес. Следовательно, решение задачи доступности массовому пользователю редактора сложно формализуемых знаний находится в новых подходах к представлению знаний в проектируемых инструментальных системах и не может быть получено модернизацией интерфейса получивших распространение оболочек.
Цель диссертационной работы заключается в создании новой организации сетевых структур, обеспечивающей автоматические преобразования концептуальной модели представления знаний в формально-логическую модель (первоочередное условие доступности массовому пользователю актуализации сложно формализуемых знаний).
Объектом исследования являются информационные системы на основе динамических знаний.
Предметом исследования является сетевая структура как универсальная форма представления знаний, наполняемая содержанием (семантикой) предметной области.
Гипотеза исследования: Создание и массовое распространение персональных компьютеров инициировало тенденцию доработки интерфейсов программных продуктов в соответствие с требованиями массового пользователя (не специалиста в области информатики). В настоящее время исключением из общей тенденции оказалась доработка интерфейса редактора сложно формализуемых знаний. Исследования по теме диссертационной работы позволят выявить и разрешить проблемы доработки интерфейса редактора сложно формализуемых знаний.
В соответствии с выделенными целью, объектом и предметом исследования, были поставлены и решены следующие задачи исследования:
1. Рассматривая возможное многообразие структур знаний о реальном мире и познавательные процедуры субъекта, сформулировать концепции представления знаний, обеспечивающие выполнение требований к пользовательским характеристикам информационных систем на основе динамических знаний.
2. Предложить преобразования традиционных семантических сетей в структуры со связями, типизированными в соответствии с типами адекватностей, для фиксации которых они используются.
3. Сформировать формализованную модель представления знаний, отображаемую квазиграфом и реализующую выявленные концепции представления знаний.
4. Формализовать представление экземпляров понятий при новой организации сетевых структур.
5. Выявить минимальный состав и способы компьютерной реализации операций по редактированию знаний на концептуальном уровне представления. Сформулировать концепцию автоматических преобразований знаний и операций редактирования между концептуальным и формальнологическим уровнями.
6. Проверить реализуемость предложенных методов путем построения редактора классификационных сетей и универсальность этого редактора путем применения его в различных областях.
Методы исследования: Для выявления концепций представления знаний (получения гносеологической модели) применено ассоциирование с процедурами реального процесса познания. Для отображения формальнологической модели применены методы структурного синтеза и теории графов. Новая организация сетевых структур знаний основана на использовании методов организации цепных списков с двунаправленной связью и методов адресного представления имен указателей.
Научная новизна:
1. Предложена организация сетевых структур, в которой предусмотрена возможность фиксации нового вида типизированных связей, соответствующих адекватностям пяти типов, являющихся основой работы редактора, доступного массовому пользователю. Показано, что наличие в сетевых структурах адекватностей 3, 4 и 5-го типов определяет их принципиальное отличие от структур дерево и лес, для описания которых достаточно адекватностей первого и второго типа.
2. Предложены преобразования традиционных семантических сетей в структуры с типизированными связями, соответствующими пяти типам адекватностей.
Практическая ценность. Применение предложенной организации сетевых структур позволило создать редактор сложно формализуемых знаний, в котором знания и команды, соответствующие операциям редактора, вводимые массовым пользователем на концептуальном уровне, автоматически преобразуются в формально-логический уровень. Результаты диссертационного исследования использованы при создании ОЭС 'Т1СО>ЮС8". Эта оболочка прошла государственную регистрацию и внедрение в четырех предметных областях реального производства: АРМ испытателя (ЦНИИ Монолит); АРМ патентоведа (Нижегородский машиностроительный завод); АРМ информационного обеспечения конструктора стиральных машин автоматов (НИИ машиностроения, г. Дзержинск); АРМ руководителя (фабрика первичной обработки шерсти, г. Токмак, Киргизия).
Диссертация состоит из введения, трех глав, заключения, списка литературы и приложений.
Заключение диссертация на тему "Организация сетевых структур знаний, поддерживающая их редактирование"
Выводы по главе 3
1. Практическая реализуемость теоретических результатов диссертационного исследования, в первую очередь, представления знаний с использованием квазиграфов и метода адресного представления имен указателей, была подтверждена созданием комплекса программ Р1СОМЭС8, включенного в отраслевой фонд алгоритмом и программ.
2. Широкий спектр предметных областей, проанализированных с точки зрения применимости в них разработанного комплекса программ, показал универсальность нового редактора знаний, которая подтвердилась его внедрением в четырех предметных областях.
3. Практический опыт автоматизации информационного обслуживания на реальном производстве показал востребованность интеллектуальных информационно-поисковых систем на базе комплекса программ Р1СОЖ)С8 и возможность его адаптации на такое применение в конкретных предметных областях.
4. Работы по созданию стартовой базы знаний на нескольких внедрениях позволили убедиться, что новый редактор знаний доступен массовому пользователю, а практическая ценность информационной системы наступает при количестве узлов сетевой структуры знаний более 100.000. Базы знаний таких размеров могут создаваться только повседневным трудом массового пользователя (специалиста в своей конкретной области, а не в области информационных технологий).
5. Эксплуатационные характеристики комплекса программ Р1СОЫОС8 (независимость времени реакции программной системы на всяком шаге интерактивного взаимодействия, отсутствие ограничений на диапазоны параметров сетевой структуры знаний и др.) были подтверждены тестированием и востребованы в работах по созданию стартовых баз знаний. Это является подтверждением, практической значимости научных результатов диссертационной работы, методов организации знаний на квазиграфах.
127
ЗАКЛЮЧЕНИЕ.
В процессе проведенного диссертационного исследования были получены следующие результаты:
1. При рассмотрении многообразия структур знаний о реальном мире и процедур процесса познания сформулированны концепции представления знаний, обеспечивающие выполнение двух групп требований к пользовательским характеристикам информационных систем на основе динамических знаний. по многообразию структур знаний о реальном мире; по реальным размерам конкретных баз знаний и условиям эксплуатации, соответствующим размерам баз знаний.
2. Предложены два этапа преобразований традиционных семантических сетей в структуры с типизированными связями.
3. Сформирована формализованная модель представления знаний, отображаемая квазиграфом, и реализующая выявленные концепции представления знаний.
4. Предложена структура кортежа при новой организации сетевых структур, которая соответствует формализованной модели знаний и основана на применении цепных списков с двунаправленной связью.
5. Эмпирически выявлен минимальный состав операций редактора знаний на концептуальном уровне представления, состоящий из внесения, дублирования, изменения текста, перемещения и удаленияпонятия, а также предложены способы их компьютерной реализации. Сформулирована концепция автоматических преобразований знаний и операций редактирования между концептуальным и формально-логическим уровнями.
6. Предложенная организация сетевых структур знаний реализована в оболочке классификационных экспертных систем с редактором знаний, доступным массовому пользователю. Разработанная оболочка была использована при создании и исследовании интеллектуальных информационно-поисковых систем в одиннадцати предметных областях.
Новая организация сетевых структур знаний, создание которой было целью диссертационной работы, а так же другие результаты теоретической части работы позволили сделать редактор знаний оболочки Р1СОМОС8 доступным массовому пользователю. Перечисленные в диссертации области применения редактора знаний, доступного массовому пользователю, в составе программной системы РЮСЖОСЭ, составляют лишь часть возможных областей применения.
Совершенствование новой организации сетевых структур знаний и расширение многообразия областей ее применения могут быть реализованы в рамках совершенствования программной системы РЮОЫОСБ. На основе предложенной организации структур знаний может быть представлена любая модель из традиционных классов моделей. Из множества задач совершенствования программной системы Р1СОЫОС8, в решении которых важна такая особенность новой организации сетевых структур, отметим только две, не углубляясь в их сущность. Включение в программную систему Р1С(ЖОС8 механизма по созданию шаблон-структур, в дальнейшем принимаемых структурными единицами модели знаний. Из них формируется виртуальная сетевая структура знаний, которая затем редактируется и обрабатывается. А также совершенствование механизма обработки знаний для работы в условиях постоянно растущего многообразия шаблон-структур. Шаблон-структура - это фрагмент структуры знаний, которая может быть реализована с применением той или иной оболочки. Получившие распространение оболочки реализуют модели знаний, структура которых не выходит за рамки структур "дерево" и "лес". Поэтому, многообразие шаблон-структур будет ограничено, если создание такого механизма будет выполняться в рамках доработки оболочек с применением моделей, соотносимым с традиционными классами. Отсутствие ограничений на структуру, при применении новой организации сетевых структур знаний, позволит получить большее многообразие шаблон-структур. Задача передачи компьютеру инициативы по накоплению знаний в базе знаний и поддержанию базы знаний в актуальном состоянии. Решение этой задачи в рамках доработки оболочек с применением моделей, соотносимым с традиционными классами, будет несовершенным настолько, насколько структуру "дерево" можно назвать несовершенной "сетевой структурой". Решение этой задачи при применении новой организации сетевой структуры знаний можно охарактеризовать как совершенствование человеко-машинного интерфейса в направлении самообучаемости.
Создание редактора знаний, доступного массовому пользователю, позволяет по-новому оценить аспект простоты в организации сетевых структур знаний. Из необходимости простоты в эксплуатации технического изделия (например: автомобиля или телевизора) не следует необходимость простоты конструкции этого изделия. И все же, естественно предположить, что там, где есть возможность ограничиться более простой моделью знаний из традиционных классов моделей, будет применена простая модель. Выбор перспективных задач базировался на том, что реализация решения этих задач в рамках совершенствования программной системы Р1СОЫОС8 будет более качественной, более соответствующей потребностям сегодняшнего дня. Такой подход к выбору перспективных задач базируется на противопоставлении двух вариантов ожидаемых результатов решения: 1) решение в рамках совершенствования программной системы Р1СОМЭС8; 2) решение в рамках доработки оболочек с применением моделей из традиционных классов.
Возможен другой базис для выбора перспективных задач совершенствования новой организации сетевых структур знаний и расширения многообразия областей ее применения. Доступ в реальное производство неограничен. Однако наибольший интерес представляет задача, которая не может быть решена существующими программными средствами. Анализ причины, потребовавшей создания новой организации сетевых структур знаний, позволяет сделать вывод, что доступность массовому пользователю редактора знаний потребовала устранения любого регламента в вопросах представления знаний. Поэтому, перспективны те направления развития, темы диссертационной работы, где решения не могут быть получены с применением моделей знаний традиционных классов. Из множества задач, относящихся к этим направлениям, отметим только две:
Задача первичной идентификации. Общение двух субъектов начинается с некоторой процедуры и сопровождается интенсивным применением этой процедуры, которая может быть именована "первичной идентификацией". Завершение процедуры "первичной идентификации" происходит в тот момент, когда с применением механизмов логического мышления оба субъекта конкретизировались на понятиях модели области реального мира (у каждого субъекта своя модель), которые ассоциируется субъектами с одной и той же сущностью реального мира. Создание механизма первичной идентификации во многом базируется на результатах создания словарей простых и составных имен. Механизм применения словарей для первичной идентификации будет эффективным, если состав словарей, а также правила формирования составных имен будут активно подстраиваться к потребностям конкретной группы пользователей на этапе эксплуатации программной системы. Составные имена формируются применением (к окружению именуемого понятия) некоторых правил, перечень которых не может быть ограничен априори. Во избежание регламента на составные имена модель знаний не должна иметь искусственных ограничений по структуре, как это имеет место в моделях знаний традиционных классов.
Задача генерации гипотез. Механизм логического вывода неотделим от организации знаний в модели знаний. «Системы, основанные на знаниях, . по своему замыслу, должны обладать способностью рассуждать и выводить заключения на основе знания некоторых общих закономерностей мира, сведений о текущем целевом состоянии объекта управления и т.п.» [41, С. 5] Достижения в создании такой способности систем, основанных на знаниях, сконцентрированы в системах, основанных на автоматическом гипотезировании, т.е. на порождении гипотез. Однако, «Необходимы новые идеи для придания "второго дыхания" системам автоматизации рассуждений» [41, С. 7]. Концентрированное выражение проблемы в том, что знания, не содержащиеся в базе знаний, не могут быть получены традиционным механизмом логического вывода. Возможен только перевод знаний из разряда опосредованных (косвенных) в разряд прямых. Задача создания генератора высокоинтеллектуальных умозаключений несомненно является актуальной. Ее конструктивное решение может быть найдено, если новую организацию структур знаний дополнить возможностью фиксации связей еще одного типа. Новый тип адекватности условно может быть назван "порождающей адекватностью". Порождающая адекватность отражает незавершенность познания по процедуре выявления сущности в пространстве единства реального мира. Она фиксирует существование некоторого сходства вновь выявляемой сущности с ранее выявленной сущностью, никак не характеризуя это сходство. Пример: дельфин - это млекопитающее, приспособившееся к проживанию в водной среде. Для характеристики понятия, именуемого термином "дельфин", будет возможно сгенерировать гипотезу, обратившись к понятию, именуемому термином "млекопитающее". В дальнейшем практика субъекта позволит переквалифицировать эту гипотезу в факт или ложный факт. Предлагаемый аспект рассмотрения задачи генерации гипотез можно признать конструктивным, однако, нереализуемым с применением простых моделей знаний традиционных классов. Выявление новых типов связей в гносеологической модели, а также внесение их в организацию структур знаний актуально для расширения возможностей оболочек систем, основанных на знаниях, и созданных на их основе приложений.
-
Похожие работы
- Веб-редактирование
- Семантическая модель контента образовательных электронных изданий
- Разработка и исследование моделей, методов и средств редактирования информационного наполнения компьютерных банков знаний
- Инструментальные средства интерактивного редактирования данных в сети Интернет
- Граф-модели и средства решения геоинформационных задач при проектировании магистральных газопроводов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность