автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Теория и технология построения баз знаний на основе взаимодействия методов приобретения знаний
Автореферат диссертации по теме "Теория и технология построения баз знаний на основе взаимодействия методов приобретения знаний"
РГб од
•'! пив ш
российская академия наук ВЫЧИСЛИТЕЛЬНЫЙ ЦЕНТР
На правах рукописи
Осипов Геннадий Семенович
Теория и технология построения баз знаний на основе ^анмодействия методов приобретения знаний.
Специальность 05.13.17 - Теоретические основы информатики
Автореферат диссертации на соискание ученой степени доктора физико-математических наук.
МОСКВА - 1993
Работа выполнена в Институте программных систем Российской академии наук.
Официальные оппоненты: доктор физико-математических наук К.В.Рудаков, доктор физико-математнчесих наук Э.М.Погосян, доктор технических наук В.Н.Вагин.
Ведущая организация: Институт проблем передачи информации РАН.
Защита состоится "Ю"с^-аЬ^зСциЛ 199 г. в час на
заседании специализированного совета Д 002.32.06 при Вычислительном центре РАН.
С диссертацией можно ознакомиться в библиотеке Математического института им. В.А.Стеклова РАН.
Автореферат разослан " (С" ^й/ад 1991/ Г.
Ученый секретарь специализированного совета Д 002.32.06 к.ф.-м.н. СММг*^ С.М.Шварт
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность проблемы. С начала 60-х годов усилия исследователей в области искусственного интеллекта были сконцентрированы на поиске общих методов решения широкого класса задач и использовании их в универсальных программах. Считалось, что на этом пути моделируется процесс мышления.
Однако, оказалось, что чем шире класс задач, которые предполагалось решать с помощью одной программы, тем беднее ее возможности при решении конкретной задачи. Кроме того, большинство практически важных задач возникает в сложных контекстах социальных или физических явлений, не поддающихся строгому и точному описанию. Специалисты, решая эти задачи, достигают высоких'результатов благодаря своему опыту и знаниям. Знания и методы, используемые специалистами одной области, не! обязательно переносимы на все остальные.
В конце 70-х годов возникло понимание, что если программы писать таким образом, что они смогут обращаться к этим знаниям и применять их, то они тоже достигнут высокого качества работы.
Это понимание означало возникновение новой парадигмы решения задач разделение 'программы решения задачи на собственно алгоритм и модель предметной области, которую стали называть базой знаний.
В базу знаний помещаются описания устойчивых связен и зависимостей между объектами предметной области и их совокупностями, в частности, связи между элементами" условия задачи, информация об их важности, сведения о том, каким об-' разом эти связи и зависимости могут быть использованы.
Эта информация может носить разнородный характер: среди связей и зависимостей могут оказаться аналитические, количественные и качественные; среди информации о том, как это использовать, могут оказаться логические''гусловия, правила и эвристики; иногда задачу требуется решать при неполных исходных
данных.
Чем большее количество такой информации будет вынесено за пределы алгоритма, тем проще описание собственно алгоритма, тем большее число задач решает алгоритм и тем легче эту информацию использовать для решения других задач.
С конца семидесятых годов вопрос построения базы знаний становится центральным в исследованиях по искусственному интеллекту.
В работе рассматриваются методы и научные основы технологии построения баз знаний, что и свидетельствует о ее актуальности.
Цель работы. Целью работы является создание теории и новой технологии построения баз знаний на основе не использованной ранее идеи установления соответствия знаний из различных источников структуре модели предметной области, позволяющей интегрировать их в единое представление.
Методы исследования. Предложенный в работе способ представления знаний описан и исследован с помощью средств общей теории алгебраических систем. Для решения некоторых проблем, связанных с выявлением знаний, использованы идеи когнитивной психологии и лингвистической семантики. Для построения интегрированных стратегий выявления знаний и решения других проблем построения баз знаний использованы методы теории алгоритмов, теоретического программирования, распознавания образов и другие методы теоретической информатики.
Использованные в работе понятия и подходы когнитивной психологии и лингвистической семантики уточнялись так, чтобы исключить более одного понимания; вся существенная информация, связанная с их использованием вводилась явным образом.
Научная новизна.
Предложена и теоретически обоснована новая архитектура инструментальных средств построения систем, основанных на знаниях.
Предложены интегрированные стратегии приобретения знаний из различных источников, в которых впервые, благодаря взаимодействию методов, слабые стороны одних методов приобретения знаний компенсируются сильными сторонами других.
Предложен новый аппарат для описания моделей предметных областей - неоднородные семантические сети, исследованы его свойства и обоснована адекватность.
Установлено соответствие объектов неоднородной семантической сети типам экспертных знаний.
Предложен метод прямого приобретения знаний системой от экспертов на основе человеко - машинного диалога, управляемого синтаксисом языка представления знаний.
Предложена стратегия поиска отображения из множества высказываний о предметной, области в множество отношений неоднородной семантической сети. Показана корректность стратегии и полнота ее в классе отношений неоднородной семантической сети.
Исследована семантика связей, выявляемых в процессе приобретения знаний.
Сформулирован эмпирический принцип наименьшей сложности экспертизы, описывающий устройство достаточно большого класса высказываний о предметной области.
Предложен принцип интерактивной компиляции модели предметной области.
Практическая значимость. На основе результатов работы создано семейство новых, инструментальных средств построения систем, основанных на знаниях: ЭМЕИ, БИЧЕИ+Мт, БМЕЕ+МШ+КАО, 31МЕК+Мт+КАО+ТЕХТ, явившихся основой новых технологий построения систем, основанных на знаниях и позволяющих строить такие системы в режиме прямого диалога с экспертом предметной области (Б1МЕН, БНМЕК+МГЯ), в режиме взаимодействия обучения на примерах с приобретением знаний от эксперта (81МЕК+М1К+КАО), в режиме взаимодействия выявления знаний из текстами обучения на
примерах с приобретением знаний от эксперта предметной области
(БМЕИ+МШ+КАО+ТЕХТ).
Научные результаты работы использованы при выполнении
тем:
1. Плана работ, утвержденных распоряжением Президиума
РАН:
1.1 Разработка программных средств представления знаний в базах знаний (номер государственной регистрации 01870018859).
2Р V и
1 осударственнои . научно-техническои программы "Перспективные информационные технологии":
2.1. N 637. "Реализация экспертных систем диагностики и выработки рекомендаций по лечению в области медицины" (шифр "ДИАГНОЗ") 1990 -1991г.г.-научное руководство.
2.2. N 638. "Разработка и реализация технологии создания экспертных систем ( шифр ТЕХНОЛОГИЯ ЭС") 1990 - 1991 г.г.- научное руководство.
2.3. N 855. "Методы и программные средства приобретения и интеграции знаний из различных источников" (шифр "ЗНАНИЯ") 1992-1993г.г.-научное руководство.
2.4. N 929."Разработка и реализация технологии создания интегрированных интеллектуальных систем" (шифр "ТЕХНОЛОГИЯ ЭС") 1991 - 1993 г.г.-научное руководство.
3. Плана фундаментальных и прикладных поисковых научно - исследовательских работ (Решение Государственной комиссии N 58 от 24.04.91):
3.1. "Исследование и разработка базового программного обеспечения систем с элементами искусственного интеллекта'^ (шифр "КИОТ-АН") 1990 - 1993 г.г.-научное руководство. 3.2. "Исследование и разработка систем извлечения и накопления знаний" ( шифр "КИНЕСКОП - АН") 1990 1993 г.г.-научное руководство.
4. Межотраслевой научно-технической программы создания прикладных систем искусственного интеллекта (Решение Коллегии Комитета Российской федерации по информатизации, N 13 от
-728.09.93):
4.1. Экспертная система прогнозирования неотложных состояний у детей ("Надежда").
4.2. Экспертная система дифференциальной диагностики генетических'заболеваний у детей ("Диагноз").
Апробация работы. Основные результаты работы докладывались на международных конференциях и семинарах по »Проблемам и применению искусственного интеллекта (Варна, ВНР. 1987), по искусственному интеллекту и управлению роботами (Смоленице, ЧССР, 1987), по развитым диалоговым системам и анализу естественного языка (Сувалкн, ПНР, 1987), по методам искусственного интеллекта и их применению (Пхеньян, КНДР, 1988), по теории и применению искусственного интеллекта (Созопол, БНР,1989), по методологии, системам и приложениям искусственного интеллекта (Албена, БНР.1990), по приобретению знаний для систем, основанных на знаниях (Банфф, Канада, .1990), на советско-итальянском семинаре по системам, основанным на (Знаниях (Рим, 1990), на международной конференции по рассуждениям, основанным на знаниях (Пасифик Гропз, Калифорния, США, 1991); на всесоюзных конференциях по искусственному интеллекту в Переславле-Залесском (1988), Минске (1990), конференции по искусственному интеллекту стран СНГ в Твери (1992), на постоянно действующем семинаре по искусственному интеллекту в Переславле-Залесском (1987), на общемосковском семинаре по искусственному интеллекту (1989), на семинарах в Московском доме научно-технической пропаганды (1989, 1992), на республиканской школе-семинаре в Кишиневе (1987) и других семинарах и конференциях.
По теме диссертации опубликовано свыше 40 печатных рабйт (5 из них-за рубежом).
Структура и объем работы. Диссертация состоит из введения, шести глав, заключения и 3-х приложений, содержит 33 таблицы и 6 рисунков; список литературы - из 78 наименований. Основной текст изложен на 200 страницах.
СОДЕРЖАНИЕ РАБОТЫ.
Во введении обоснована актуальность решаемых в диссертации проблем, сформулированы цели исследования и дана аннотация глав диссертации.
В первой главе рассмотрены основные методы выявления знаний, необходимые для построения моделей предметных областей, и системы, в которых эти методы использованы. Указываются недостатки существующих подходов и формулируются задачи, решаемые в работе.
В первом параграфе рассмотрено существующее состояние исследований в области приобретения знаний и формулируются трудности, существующие в приобретении знаний:
В параграфе 2 приведена сравнительная характеристика методов представления знаний и сформулированы требования к способу представления, которые обеспечивали бы его-выразительные возможности и эффективность нотации.
На основании этого анализа в третьем параграфе формулируются следующие задачи, решаемые в диссертационной работе:
разработка методов и теоретических основ инструментальных средств построения баз знаний, которые бы обеспечивали:
1.Уменьшение роли инженеров по знаниям в создании прикладных систем.
2.Уменьшение субъективности и затрат времени на приобретение знаний.
3.Устранение "пробелов в знаниях".
4.Включение в технологию построения баз знаний методов выявления невербальных знаний.
5.Обеспечение совместимости баз данных с различными схемами с базой знаний интеллектуальной системы.*
6.Интерпретацию результата работы алгоритмов обучения на примерах в способе представления, поддерживаемом в интеллектуальной системе.*
7.Выявление отсутствующей эксплицитно в тексте информации о свойствах семантических связей.
8.Создание словаря предметной области в процессе приобретения
о
знании.
9.Реализацию способа представления знаний, который бы:
а) позволял описывать все существенные с точки зрения будущих задач объекты, их свойства, признаки и связи;
б) позволял пренебрегать несущественными свойствами объектов и области вообще;
в) рассматривал состояние описания, при котором какие-либо объекты отсутствуют или имеют неописанные свойства, не как чрезвычайное, а как естественное;
)и ч
предоставлял средства описания не только целевого знания, но и всех промежуточных его состояний, через которые проходит система.
д) обладал бы устойчивостью: небольшие изменения мира должны отражаться небольшими изменениями в системе.*
е) обладал бы монотонностью: увеличение объема знаний должно улучшать качество работы системы.
Примечание: знаком "*" отмечены проблемы, впервые сформулированные нами.
Во второй главе рассмотрена структура и типология фрагментов описаний действительности, необходимых для построения моделей предметных областей. Выделены формы и типы таких описаний.
Основной единицей любого описания является имя. Через всю лексику проходит различение индивидных имен, общих имен и метанмен.
Индивидные имена обозначают конкретные объекты действительное<и.
Общие имена соотносят предложения с множеством понятий. Общее имя, являясь именем множества, определяет объем понятия. В отличие от этого совокупность признаков характеризует вторую сторону понятия - его содержание.
Имена участвуют в образовании семантических связей.
Под семантической связью будем понимать отношение понятий в понятийной системе предметной области. При этом мы полагаем, что каждый носитель знаний о предметной области (эксперт) обладает некоторой концептуальной моделью области, и свойства семантических связей, если о таковых ему приходится сообщать, согласуются с этой моделью.
Представителями семантических связей в лексике являются предикаторы, т.е. лексемы, представляющие предикаты.
Предикаторы не обозначают свойств, отношений, функций, они лишь представляют эти объекты. Это обстоятельство имеет принципиальное значение: кроме выявления предикаторов, необходимо выявление внелексических свойств семантических связей.
В работе выделено 17 видов семантических связей, среди которых
- дестинативная связь Des, один компонент которой обозначает назначение для другого компонента;
- директивная связь Dir, в которой один компонент обозначает путь, направление второго' компонента;
- инструментальная связь Ins, один компонент которой обозначает орудие действия, обозначаемого другим компонентом;
- каузальная связь Cous, один компонент которой обозначает причину проявления другого компонента спустя какое-то время;
- трансгрессивная связь Trg, в которой один компонент обозначает результат превращения второго, и другие.
Во втором параграфе диссертации изучаются свойства семантических связей. Представим их в таблице 1.
Табл. 1.
Значения свойств связей
Вид связи Tr Ntr Atr Rf Nrf Arf Sm Апэ As Ns
Gen + + +
Des + + +
Ins + + +
Cous + + +
Com + + +
Cor + + +
Lim + + +
Med + + +
Neg -f + +
Pos + + +
Pot + + +
Res + + +
Rep + + +
Sit + -f +
Dir + + +
Trg + + +
Fin i- + +
о о Т"* О
где свойства связей, такие как 1 г, от и другие
соответствуют интуитивно понимаемым транзитивности, симметричности и т.д.:
СВОЙСТВА ОБОЗНАЧЕНИЯ
Транзитивность Тг
Нетранзитивность Ntr
Антитранзитивность Atr
Симметричность Sm
Антисимметричность Ans
Асимметричность Аз
Несимметричность N8
Рефлексивность 1Н
Антирефлексивность АИ
Нерефлексивность Ш
Легко видеть, что применение к табл.1., процедура факторизации, т.е. отнесение в одну подтаблицу всех связей,, обладающих одинаковыми наборами свойств,, дает 9 подтаблиц,. соответствующих типам семантических связей,, которые мы будем; называть и обозначать следующим образом.-
1.Генеративная связь - "X является элементом У" : Сеп(Х,У);
2.Инструментальная связь - "X является средством У": 1пз(Х,У)~
3.Каузально-трансгрессивная связь - "X вызывает У Соиз(Х,У);
4.Комитативная связь - "X сопровождается У" . Сош(Х,У);-
5.Коррелятивная связь-"X иногда увеличивает возможность* возникновения У":Сог(Х,У);
6.Ситуативная связь - "X находится в ситуации У":8и:(Х,У);
7.Потенсивная связь-"Х увеличивает возможность развития: У":Ро1(Х,У);
8-Финитивная связь -"X является целью У": Рш(Х,У); 9.Негативная связь -"X отрицает У": Ыев(Х,У);
В параграфе 3 исследовано выражение типов, семантических: связей синтаксическими средствами. Оказалось, что каждому типу-семантической связи соответствует некоторое множество, семантико-си'нтаксических единиц русского языка, называемых: синтаксемами. Это является свидетельством, "ответственности^ синтаксем за семантику связи и представляющего ее высказывания^ Приводятся таблицы синтаксем для всех полученных типов семантических связей.
Приведем, в качестве примера, три из них..
Каузально - трансгрессивная связь. Синтаксемы
Cous по+дат., за+твор., к+предл., по+предл.
Тгв в+вин.
Res из+род., из-за+род., от+род.
Rep из-за+род., от+род., с+род.
Здесь и далее слева от знака "+ "указан предлог, справа -форма имени.
Ситуативная связь. Синтаксемы
Ь'нп в+предл., твор.
под+твор., в+предл., на+предл.
0'!Г по+дат., сквозь+вин., к+дат., твор., над+твор.
Инструментальная связь. Синтаксемы
Оез для+род., к+дат., на+вин., под+вин.
1пэ имен., из+род., с+род., в+внн., на+вин., на+предл.
Мес! по+дат., на+вин., через., твор., на+предл.
Роз род., у+род.
В четвертом параграфе второй главы исследуется интуитивная семантика высказываний, представляющих семантические связи в лексике. На основании анализа канонических форм высказываний и соответствующих примеров делаются выводы о том, что
а) при описании действительности человек часто использует высказывания, имеющие не более двух субъектов (или объектов),
б) что человек практически не употребляет сложных кванторных приставок.
На основании этих выводов в параграфе 5 формулируется эмпирическое заключение, которое называется принципом наименьшей сложности экспертизы.
В третьей главе строится и исследуется точная семантика рассмотренных во второй главе понятий. В результате возникает новый формализм для представления знаний - неоднородные семантические сети (НСС). Устанавливается соответствие объектов НСС типам экспертизы, рассмотренным во второй главе. Обосновывается адекватность НСС как способа представления знаний.
Семантическую сеть обычно задают совокупностью множества S имен предметов и процессов действительности и семейства R отношений на множестве S
; w={S,R] о)
; В диссертации рассматривается общий случай, когда требуется представлять не только имена объектов и процессов действительности , но и множества их свойств, которые частично отражают содержание соответствующих понятий, а также некотоые зависимости на свойствах, позволяющие по значениям каких-либо свойств одного объекта вычислять значения или факт наличия/отсутствия свойств второго объекта.
Пусть D - некоторое (определяемое предметной област-ью) семейство множеств D = {Di,D2,...,Dn}, где каждое множество Di называется множеством атрибутов, а всякому объекту или процессу ставится в соответствие некоторое подмножество Д кортежей из декартова произведения
Dk =Д хД х...хД ,(к<п)
'1 'г 'v '
некоторых множеств из D, называемое его экстенсионалом или объемом.
Пара <s, А > называется в этом случае событием с именем s и экстенсионалом (множеством экземпляров) А и представляет
товорить, что пара (5,, s2 ) принадлежит отношению Щ
В дальнейшем для упрощения записи верхний индекс f у Д будем опускать.
Утверждение 3.7. Rj транзитивно, нерефлексивно, несимметрично.
Параграф 4. посвящен обоснованию адекватности неоднородных семантических сетей как способа представления знаний. В частности, Теорема 3.1 показывает, что для некоторого отображения Ф
Ф(Л,) = Com(X,Y);
Ф(Лг) = Мсош(Х,У);
Ф(Л3) = Cor(X,Y);
Ф(Л4) = Neg(X.Y);
Ф(/?5) = Ins(X.Y); Ф(/^) =Sit(X,Y);
Ф(Л7) =Cous(X.Y);
Ф(Д) =Pot(X,Y);
Ф (R,) = Fin(X.Y);
Ф(/?10) — Gen(X,Y), где в правом столбце таблицы -^обозначения типов семантических связей из второго параграфа главы 2.
В четвертой главе вводится понятие интенсиональной НСС и устанавливается связь функциональной ' НСС, введенной в третьей главе и интенсиональной НСС. Формулируется метод интерактивной интерпретации экспертных знаний (или интерактивной интерпретации экспертизы) и на этой основе предлагается метод отображения сообщений источников знаний (высказываний) в конструкции НСС. Предлагаются интерактивные процедуры поиска этого отображения - стратегии интерактивного прямого приобретения знаний. Вызов стратегий
управляется синтаксисом языка представления знаний. Показывается корректность стратегии выявления сходства и ее полнота в классе отношений неоднордной семантической сети.
В параграфе 1 вводится понятие интенсиональной семантической сети. Связано это с тем, что экстенсиональное (т.е.посредством перечисления всех экземпляров) задание событий далеко не всегда оказывается возможным, поэтому, в этих
случаях, вместо пары е — ) удобнее рассматривать
соответствующую ей пару
р = Г, >.
где Г, = {рг(А}Д),р/(&¡^„..¿»(к, а означает
подмножество множества , элементы которого являются значениями одноименных признаков события Множество
таким образом определенных объектов р называется множеством событий-прототипов и обозначается через Р.
Пусть <р - отображение из в Ц (1 < 7 < п), такое что:
а) для всякого с/ е Д = (Л;
б)декартовы произведения множеств из О переводятся в совокупности тех же множеств, а именно, для каждого типа <1,ш,...,п> декартова произведения £),х/)тх...х/)п ¡р-.и, х!)тх...х£)п —...,£>„} так что для всякого
принадлежащего £); х Отх...хПп,
д>{5) = {{1А)Лщс1т),...,{п,с1п)}.
Пусть е - событие из р - событие-прототип из Р. Лемма 4.1. (р{е) - р Лемма 4.2. Если то <р{8) => р.
Это позволяет распространить интенсионально определенные на множестве $ отношения из семейства Я на множество
Р.
Для этого всюду в определениях 3.5.-3.13. из главы 3.
заменим 6 на у(у = $>(<5)), 5 на р, выражение ^=>5 на Ц на . Например, для Определения З.З.:
Определение 3.3. Если 5,,32 => £2), такое
что £> 2 с: с>,, то будем говорить, что пара • (.V,, Л2) принадлежит отношению
в результате замен получим
Определение 4.1. Если Уу]3у2(у] => => /?2), такое что ^С/,, то будем говорить, что пара (/>,,р2) принадлежит отношению .
Что касается аналогов функций из семейства Р, то в (4) они будут действовать из совокупностей множеств { Д, Д,,..., Д } в множества Д из О таким образом, что
и оказываются частичными: каждая из функций будет определена лишь на тех у — {{1,с11), {т^(1т),...,(п,с1п)}, для которых найдется 86 А, что у — Для остальных / е Г значения этих функций
будут считаться неопределенными. !
Таким образом, вместо четверки (3) из главы 3, получаем четверку
ИП=<ДЛЛ'Р) (4),
которую будем называть интенсиональной НСС.
Интенсиональная сеть это то, что мы можем построить на основе информации, которую чаще всего удается получить из источников знаний (за исключением того случая, когда в нашем распоряжении имеются все примеры всех событий предметной области, но это - раритет). !
Теорема 4.1. (р есть гомоморфизм УУ в IV'. ?
Функциональную НСС IV' будем называть моделью мира, а интенсиональную НСС IV-моделью знаний.
Программную систему, реализующую функции поддержки модели мира, будем называть экстенсиональной базой знаний,
Программную систему, реализующую функции поддержки модели знаний, будем называть интенсиональной базой знаний. Приобретение знаний в этом случае есть процесс построения интенсиональной базы знаний, а расширение последней в режиме решения задач - построение экстенсиональной базы знаний.
Во втором параграфе описывается процесс построения интенсиональной базы знаний как интерактивная интерпретация сообщений эксперта, управляемая формальной грамматикой языка представления знаний.
Пусть заданы: формальная грамматика G, нетерминальные символы которой соответствуют сигнатурным символам модели W: типам отношений, событиям, признакам. Множество терминальных символов грамматики G, кроме терминальных констант, соответствующих именам отношений, именам сообытий, именам и значениям признаков, содержит функциональные символы всех синтаксических классов; множество программ 0 такое, что каждая программа из 0, подставляясь на место соответствующего функционального символа грамматики G, выдает значение некоторой терминальной константы. Каждая программа из 0 называется стратегией прямого приобретения знаний.
Тогда программу I , которая выполняет следующие действия:
1. Для всякого терминального выражения, если в нем присутствуют функциональные символы грамматики G, подставляет на место функционального символа одну из стратегий прямого приобретения знаний в соответствии с некоторой таблицей и строит копию этого выражения;
2.Выполняет стратегию прямого приобретения знаний и подставляет терминальную константу, выявленную стратегией, в построенную копию формулы языка, порожденного G на место функционального символа;
3.Еслн в формуле все терминальные символы - константы, выполняет компиляцию этой формулы в интенсиональную НСС, будем называть интерактивным интерпретатором экспертных
экспертных знании в интенсиональную НСС (ИЭЗ).
Среди стратегий интерактивного интерпретатора - известные стратегии разбиения на ступени и репертуарной решетки и предложенные нами стратегии выявления сходства, подтверждения сходства и аналогии.
Стратегия выявления сходства основана на установлении в интерактивном режиме некоторых свойств высказываний, а именно, сохранения или изменения истинности высказывания при перестановке имен событий; сохранения или изменения истинности высказывания при подстановке имен совпадающих событий,-сравнении истинности двух высказываний, отличающихся одно от другого модальностью; на изменении формулировки высказывания путем уточнения предикатора, и порождении на этом основании гипотез о принадлежности пар событий тем или иным отношениям Rk из семейства R. Стратегия выявления сходства состоит в последовательном выполнении критериев, которые используются для выявления свойств высказываний и соответствующих им семантических связей, описанных в главе 2.
Для этих целей используются критерии подстансвки, перестановки и трансформации.
Критерий подстановки используется для выявления свсЗств Rf, Nrf или Arf, критерии трансформации - для выявления свойств Тг, Ntr, Atr.
Для определения свойства Sm или отсутствия такового используется Критерий перестановки. Опишем его вкратце.
Критерий перестановки. Вместе с истинным высказыванием "А<предикатор>В", эксперту предъявляется высказывание, в котором объект А заменен на В, а В - на А с призывом подтвердить истинность этого второго высказывания.
В случае утвердительного ответа, высказыванию приписывается свойство Sm, в случае отрицательного - Ns. Выполняется процедура Р3(Д) пополнения множества А/<ч: для каждого высказывания Li — "А <предикатор> В" из £ в
множество М1А помещаются пары (А,В) и (В,А).
Полагается Р= Р3(£\ Ц)и?3(Ц).
Лемма 4.4.Отношение Р3(/.) симметрично.
Дбказываются следующие утверждения.
Теорема 4.2. (О корректности стратегии). Если высказыванию Ц ' А<предикатор>В", (где А и В - имена конкретных событий) стратегией выявления сходства приписан некоторый тип семантической связи, то этот тип - единственный.
Теорема 4.3. Каждое высказывание, отнесенное стратегией к некоторому типу, однозначным образом преобразуется в элемент некоторого бинарного отношения на множестве событий прототипов.
Теорема 4.4. Стратегия выявления сходства есть отображение из множества высказываний в семейство отношений Я.
Пятая глава посвящена взаимодействию методов анализа текста и обучения на примерах с методом прямого приобретения знаний, описанным в предыдущей главе.
В первом параграфе и п.1 второго параграфа используются результаты наших совместных работ с коллективом, возглавляемым Б.Ю.Городецким.
В первом параграфе описан подход к реализации прикладного морфологического анализа словоформ текста и выделению устойчивых сочетаний.
Целью этого анализа является автоматическое выделение из текста имен и кандидатов в предикаторы.
Морфологический анализ не использует словаря предметной области и выполняется с использованием словарей окончаний, служебных слов (союзов, наречий, предлогов и т.д.) и готовых форм (местоимений, числительных).
Во втором параграфе рассматривается выявление семантических связей из текста.
Мы исходим из того, что семантические связи в языке выразимы посредством высказываний, рассмотренных во второй
-23-
О о
главе. Структурные схемы семантических связей тогда есть высказывательные формы; иначе говоря, семантические связи описываются несколькими именными группами, связаныыми между собой предикаторами.
К предикаторам можно отнести глаголы, имеющие семантику движения, глаголы конкретного действия или каузативного воздействия, глаголы со значением каузации превращения, глаголы с семантикой соответствия (несоответствия), глаголы, выражающие отношения принадлежности и т.д. В соответствии со сказанным выше, предикаторы нельзя рассматривать в качестве имен предикатов и, следовательно, использовать для классификации последних. Предикаторы лишь представляют предикаты в лексике. Далее рассматривается общее описание метода выявления семантических связей.
Метод выявления каузальных связей описан
М.Н.Михайловым.
Общая же схема алгоритма выявления семантических связей и иных, описанных нами типов, должна включать обнаружение в тексте предикаторов и (или) синтаксем (см.гл.2), выделение именных групп, выделение предикативных структур и попытку отнесения выделенной структуры к тому или иному типу семантической связи. Если таковая завершается успешно, то процесс можно считать законченным, если же нет, то решение ищется во взаимодействии с методами, описанными в предыдущей главе.
Представителями семантических связей в тексте являются соответствующие семантические конструкции, включающие именные группы, предикаторы, синтаксемы. Семантические конструкции могут представлять собой последовательности простых предложений различной структуры, сложные предложения, а также сверхфразовые единства.
В тексте содержатся языковые средства, позволяющие обнаруживать семантические конструкции, находить их границы и выделять их компоненты - объект и субъект.
Эти конструкции могут быть выражены:
\ /И »• I» 1Г \
а) союзами и союзными словами (, потому что , поэтому и др.) г
б) синтаксемами, приведенными в табл. 10-18 работы;
в) существительными в связочной функции ("влияние на",,
п и п н \
причина , ситуация и др.) и
г) предикаторами.
Используется морфологический и терминологический анализ, описанные в параграфе 5.1 диссертации.
В третьем параграфе описывается взаимодействие интерактивного интерпретатора экспертизы с методом выявления семантических связей.
В том случае, если при выявлении семантической связи из текста на основании подхода, описанного во втором параграфе, обнаруженной конструкции оказались поставлены в соответствие два или более типа связей, например, Соиэ(Х,У) и Ро[(Х,У), тр выполняется вызов стратегии выявления сходства с целью уточнить свойства, различающие эти два (или более) типа связей. После такого уточнения выполняется компиляция формулы <предикатор> Як (А,В) в интенсиональную семантическую сеть.
В четвертом параграф описано взаимодействие методов обучения на примерах с прямым приобретением знании для пополнения базы знаний новыми отношениями, как бинарными, так и многоместными (при нашем способе предстазления моделируемыми с помощью бинарных). При этом сам метод обучения не фиксируется. Здесь нас интересует обеспечение совместимости баз данных с различными схемами с базой знаний, способы установления соответствия областей значений полей базы данных событиям и признакам событий базы знаний и преобразование результата обучения на примерах в способ представления знаний, описанный в гл.З.
Пусть П - один из алгоритмов поиска закономерностей на основе обучения на примерах. Пусть для конкретной предметной области фиксирован набор признаков А1, Аг,..., Ап, с помощью
которых характеризуются объекты данной области. С каждым признаком Д. связан фиксированный набор его возможных значений Д (1), Д (2),..., Д (»).
Будем полагать,что закономерности, которые обнаруживает алгоритм, могут быть представлены в виде правил
(Д(А'), ДДг),($)). Содержательно они означают следующее: всякий объект, который обладает г-м значением признака A¡ ,..., э-м значением признака А , также обладает и к-м значением признака Д.
Задача пополнения базы знаний на основе выявления знаний из данных есть тогда задача сопоставления каждому
правилу (Д (к), Д (г),..., А3(х)), полученному в результате
работы алгоритма обучения на примерах, некоторого отношения Ц из Л.
При этом предполагается, что с помощью методов прямого приобретения знаний и анализа текста уже сформирована понятийная система базы знаний, т.е. пара (П,Р).
Первой задачей является установление соответствия значений полей базы данных концептуальным элементам базы знаний.
Не вдаваясь в технические детали, базу данных (БД) будем рассматривать как двумерную таблицу:
Ап(Вп],...,В^,...,Впт) / = 1,2,...,«, ] = 1,2,..,т, где Д - *1-ое поле базы данных,
Я - ]-ое значение поля Д..
Нужно иметь в виду, что некоторое значение В1} поля Д может
отсутствовать. Тогда речь идет о том, что для некоторого подмножества А множества полей'А базы данных и для каждого элемента множества значений В, поля Д. необходимо найти синонимически соответствующее подмножество понятий из Р и /) из семейства О базы знаний. Установление такого соответствия может производиться не для всех Д множества А, так как некоторые из них могут быть не существенны для решения задачи (например, несущественно поле, обозначающее порядковый номер записи базы данных). Установление такого соответствия производится в интерактивном режиме. Выбор информативных Д производится во время фазы прямого приобретения знаний.
Так как базы данных могут иметь различные схемы и структуры данных, то для повышения уровня технологичности системы и более быстрой работы программы поиска зависимостей на следующем этапе выполняется конвертирование тех полей БД, для которых были установлены соответствия, во внутренний формат.
Количество конвертированных записей БД может быть меньше или равно общему количеству записей БД, так как некоторые записи БД можно пометить .маркером удаления.
Поиск закономерностей начинается с выбора наиболее информативных значений полей (если таковые не определены на этапе прямого приобретения знаний) с помощью специальной оценочной функции.
После нахождения закономерностей выполняется их интерпретация во взаимодействии с интерактивным интерпретатором экспертизы.
В частности, если правило имеет в своей левой части два и более коньюиктов, то интерпретатором делается попытка формирования многоместного отношения путем поиска в базе знаний множества событий, являющегося покрытием левой части правила.
Если такого покрытия найти не удалось, то происходит обращение к стратегии выявления сходства интерактивного интерпретатора экспертизы и эксперту предлагаются гипотезы о наличии более слабых связей 2,/?3 или Л, события из правой части правила с каждым событием из левой части.
Если правило имеет в своей левой части только один коньюнкт, то ищется либо одно событие, либо множество событий в базе знаний (если коньюнкт является свойством события в базе знаний), и если коэффициент уверенности больше определенного значения, то для события из левой части правила генерируется гипотеза о наличии сильной положительной или отрицательной связи (/?,,Л7 или /?4) и происходит обращение к интерактивному интерпретатору экспертизы для подтверждения или опровержения гипотезы. В противном случае, при частичном покрытии событием левой части правила генерируется гипотеза о наличии коррелятивной сязи (Л3) между событиями, входящими в левую и правую часть правила.
При положительном ответе эксперта на предлагаемые ему гипотезы происходит создание соответствующих конструкции в базе знаний.
В шестой главе показывается, что описанная в работе архитектура является основой новой технологии создания систем, основанных на знаниях, в которой уменьшается число стадий инженерии знаний, минимизируется роль инженера по знаниям и, благодаря этому, повышается технологический уровень инструментальных средств.
С точки зрения предложенной архитектуры, необходимы следующие стадии построения систем, основанных на знаниях:
1. Идентификация проблемы.
На этой стадии уточняется задача, определяются источники знаний, формулируются цели проекта, выясняются классы решаемых задач, и делается вывод о возможности или невозможности применения инструментальных средств.
Предложен критерий такого вывода - принцип наименьшей сложности экспертизы (гл.2)
2. Приобретение знаний.
На этой стадии выполняется приобретение знаний с помощью методов приобретения знаний из текстов, от экспертов и ;з примеров.
3.Тестированиед
На тестовых примерах проверяется правильность заполнения базы знаний и выполняется коррекция, или пополнение базы знаний в случае обнаружения ошибок и/или неполноты.
Таг ;им образом, вместо пяти стадий инженерии знаний использование предложенной нами архитектуры предполагает лишь, три стадии.
Использование технологии, теоретические основы которой предложены в настоящей работе, для создания большого числа прикладных систем и проведенный при этом сравнительный анализ, продемонстрировало ее высокую эффективность.
Заключение содержит научные результаты и практическую значимость работы.
Приложение 1 содержит список предикаторов.
(
В приложении 2 приведены некоторые функции реализации базового уровня архитектуры.
В приложении 3 приведен перечень экспертных систем, построенных в различных организациях и коллективах с помощью инструментальных средств, реализованных на основе результатов настоящей работы.
Основные научные результаты диссертационной работы отражены в следующих публикациях автора:
ЛИТЕРАТУРА I. Г.С.Осипов,В.Я.Жолондзь. О псевдофизических логиках в семиотических моделях. Изсестия АН СССР. Техническая кибернетика, 1983, N 3, стр. 84-99.
Г.С.Осипов. Об одном обобщении языков представления знаний. Школа -семинар "Кутаиси-85" "Семиотические аспекты
формализации интеллектуальной деятельности" (Тезисы докладов).Москва, ВИНИТИ, 1985.
3. Г.С, Осипов, А.П.Инфанов. Язык байсл для представления знаний.Известия АН СССР. Техническая кибернетика. 1986, N.5, стр.29-42.
4. С.А.Голубев, С.М.Гукова, Е.П.Куршев, Г.С.Оснпов. Пустая система для диагностики технических объектов. Технология разработки экспертных систем. Тезисы докладов республиканской школы - семинара. Кишинев, 1987, стр.52-54.
5. Г.С.Осипов. Об одной модели знаний для прикладных интеллектуальных систем. Технология разработки экспертных систем. Тезисы докладов республиканской школы - семинара. Кишинев, 1987, стр.105- 111.
6. А.П.Инфанов, Г.С.Осипов. Формирование концептуальной модели предметной области. Вопросы кибернетики. Проблемно-ориентированные вычислительные системы. Москва, 1987, стр.103111.
7. Г.Осипов, Г.Назаренко, Д.Малаховский, С.Комаров. SIMER: система для исследования понятийной структуры предметной области! В сб. трудов первого международного семинара "Теория и применение искусственного интеллекта" София. Техника,
1987,стр.150-153.
8. Г.С.Осипов. О формировании модели для плохо структурированной предметной области. Известия АН СССР.Техническая кибернетика, N 5,1987, стр.198-200.
9. Г.С.Осипов. Метод формирования и структурирования модели знаний одного типа предметных областей.//Известия АН СССР. Техническая кибернетика, 1988.Ы2,стр.З-12.
10. Г.С.Осипов. Выявление "грубой" модели предметной области. Всесоюзная конференция по искусственному интеллекту. Тезисы докладов, том I, Москва, 1988, стр. 512-513.
11. С.И.Комаров, Д.Е.Малаховский, Г.И.Назаренко, Г.С.Осипов, Ю.Г.Шапошников. Архитектура системы SIMER. Всесоюзная конференция по искусственному интеллекту. ПереславльЗалесский.
Тезисы докладов, том I, Москва,1988, стр.501-502.
12. Г.Осипов. Принципы прямого приобретения знаний. В сборнике трудов . Второго международного семинара "Теория и применение искусственного интеллекта". Том 2, Созопол, 1989, стр.254-261.'
13. Г.С.Осипов, С.И.Комаров. Автоматизация прямого приобретения знаний. Материалы семинара "ЭВМ новых поколений и перспективы их использования в народном хозяйстве". Московский,.Дом научно-технической пропаганды. Москва, 1989,
стр.48-53.
14. Г.С.Осипов., Предисловие к русскому изданию монографии К.Таунсенда. и .. К.Фохта "Проектирование и программная реализдцпия экспертных , систем .на персональных ЭВМ": Пер. с англ.-Москва.:Финансы и статистика,. 1990, стр.5-13.
15. Г.С.Осипов. Построение моделей предметных областей. Неоднородные семантические сети. Известия АН СССР. Техническая кибернетика, 1990, N 5,стр.32-45.
16. Г.С. Осипов. Инструментарий для экспертных систем. Технология БШЕЯ+МШ//Программные продукты и . системы..
1990, N.3.
17. Г.С;Осипов. Формирование моделей предметных областей. Лекции Всесоюзной школы по проблемам искусственного интеллекта и интеллектуальных систем. Часть 2. Минск,1990, стр.56-74.,
18. Г.С.Осипов. Стратегии прямого приобретения знаний. Там же,стр. 74-80.
. А.Н.Аверкин, А.Ф.,Блишун,Т.А.Гаврилова, Г.С.Осипов.. Приобретение и, формализация знаний. Справочник "Искусственный интеллект", книга Модели и методы, Москва, "Радио,и .связь", 1990, стр.65-76. 20. С.И'.Комаров, Е.П.Куршев, Г.С.Осипов. Построение моделей предметных областей. 4.2.Прямое приобретение знаний в системе БШЕ^'- Изв. АН СССР. Тех.кибернетика, N 3, 1991, стр.192197.,
21.. Г.С.Осипов. . Специальные знания и синтез механизма
рассуждений в задачах концептуального анализа. Известия РАН. Техническая кибернетика, 1992, стр. 22-21.
22. Г.С.Осипов. Специальные знания, их выявление и синтез механизма рассу;:;дений. Материалы семинара "Экспертные системы и басы данных". Центральный Российский Дом знаний. Москва, 1992, стр.42-50.
23. Г.С.Осипов. Интегрированная технология построения прикладных интеллектуальных систем на основе приобретения знаиял из различных источников. Российская академия наук. Юбилейный сборник трудов институтов Отделения информатики, вычислительной техники и автоматизации. Том II. Москва, 1993, стр.57-76.
24. G.S.Ocipov,Y.P.Kurshev,S.I.Komarov, S.M.Gukova. Expert systems tools for badly structured fields. Artificial Intelligence and Information Control Systems of Robots - 87. Elsevir Science Publishers B.V. (North-Holland), 1987, pp.393-397.
25. G.S.Osipov.The Method of direct Knowledge Acquisition from human experts. Proceeding of the 5th Banff Knowledge Acquisition for Knowledge-Based Systems Workshop, Banff, Canada, November,1990 , fp.104-116.
Лит 3.331 T.120
-
Похожие работы
- Модели, методы и программные средства распределенного приобретения знаний для автоматизированного построения баз знаний интегрированных экспертных систем
- Применение объектно-ориентированных интеллектуальных систем в подготовке специалистов в области химии и химической технологии
- Разработка математического и программного обеспечения систем управления знаниями на основе семантических сетей для поиска информации
- Алгоритмическое обеспечение базы знаний автоматизированной системы управления освоением радиотехнических средств
- Алгоритмы распознавания когнитивных изображений на основе разнородных экспертных знаний для задач диагностики
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность