автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Модель нечетко-значной вероятностной логики в интеллектуальных системах
Автореферат диссертации по теме "Модель нечетко-значной вероятностной логики в интеллектуальных системах"
РГ& од
2 9 МАЙ 1995 На правах рукописи
НГ7ЕН ШШЬ ХАЙ '
МОДЕЛЬ НВЧЕТКО-ЗНАЧНОЙ ВЕРОЯТНОСТНОЙ ЛОГИКИ В ННТЕШКТУАЛЬШХ СИСТЕЫАХ
Специальность 05.13.16 - Применение вычислительной техника, математического моделирования и математических методов в научных исследованиях
АВТОРЕФЕРАТ диссертации на соискание ученое степени доктора фазико-иатематическнх наук
Москва - 1995
Работа выполнена в Вычислительном Центре РАН
Научный консультант - Академик АЕН РФ, доктор технических наук, профессор Поспелов Д.А.
(фатальные оппоненты:
- доктор технических наук, профессор Вагин В.Н. ■
- доктор физико-математических наук, с.н.с. Макеев С.П.
- доктор физико-математических наук, с.н.с. Осипов Г.С.
Ведущая организация - Институт проблем управления РАН
Защита диссертации состоится 1995г.
в часов $0 мин. на заседании диссертационного совета Д002.32.06 при Вычислительном Центре РАН по адресу: 117967, Москва ГСП-1, ул. Вавилова, 40, конференц-зал.
С диссертацией можно ознакомиться в библиотеке МИ РАН.
Автореферат разослан.^?^,
1995г.
Ученый секретарь диссертационного Совета
Кандидат физико-математических .наук ¿^^^Т'с.М. Швартин
—7/
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы исследования. Исследование и построение моделей нетрадиционных логик является важным направлением в математической кибернетике и теории интеллектуальных систем. Такие модели составляют основу самых различных интеллектуальных систем, используемых для управления технологическими процессами, технической и медицинской диагностики, обучения и тренировки, обработки информации при проведении научных исследований, моделировании рассуждения, автоматизации инженерии знаний и пр.. Усиленно развиваются исследования моделей немонотонных, псевдо-физических, нечетких логик и правдоподобных рассуждения.
Нечеткая логика, являясь главным инструментом для представления и обработки нечеткой информации, является наиболее широко распространенной в практике среди ' нетрадиционных логик. Эффективные применения нечеткой логики в разных областях народного хозяйства и в научных исследованиях в последние годы укрепили ее положение.
Источники нечеткости информации достаточно разнообразны и невозможно представить все типы нечеткой информации с помощью одной модели, т.к. не существует универсальной модели, адекватной относительно любого типа нечеткой информации. Поэтому проблема представления и обработки нечеткой информации в информационных системах актуальна и побуждает исследователей к созданию новых нечетких математических формализмов и соответствующих моделей нечеткой логики для
различных прикладных областей на их основе.
Модель нечеткой логики состоит из адекватного математического формализма для представления нечеткой информации в системе и механизма распространения нечеткой информации в процессе принятия решений или получения заключений. Существующие модели в зависимости от используемой формы представления нечеткой информации могут оыть разбиты на три группы. К первой группе относятся модели, в которых нечеткость задается одним числом: модель коэффициентов уверенности в MYCIN , вероятностная логика Нильссона . Вторая группа включает в себя интервально-значные модели: теория свидетельств Шейфера , теория возможностей Заде, модель голосования Белдвина. Последняя группа - группа нечетко-значных моделей, в частности, лингвистических: например, лингвистическая модель в MII/DRD.
Построение механизма распространения нечеткой информации во многом зависит от интерпретации природы представляемой информации в модели. В одних моделях нечеткая информация имеет вероятностный характер, и следовательно, механизм распространения нечеткости подчиняется вероятностным законам. В других нечеткая информация представляется лингвистически, и семантическая структура лингвистических единиц управляет этим механизмом. Иначе говоря, характер взаимодействий между информационными единицами управляет механизмом
распространения нечеткой информации и поэтому должен быть отражен в правилах вывода. В большинстве случаев эти правила вывода являются обобщением классических, например, правил
z
"модус поненс" и "модус толленс".
В настоящей работе предлагается модель нечетко-значной вероятностной логики, которая позволяет использовать аппарат теории нечетких множеств для представления и обработки с помощью универсального формального подхода нечетких знаний, имеющих вероятностную интерпретацию. Нечеткость информации в этой модели представляется в виде распределения возможностей вероятности истинности явления, выражающегося предложением (формулой) логики высказываний или логики предикатов. Механизм распространения нечеткости в модели построен на основе похода анализа множества возможных миров, главная идея; которого состоит в том, что множество предложений базы знаний рассматривается в качестве модели всех возможных миров. В этой модели вероятность явления определяется суммой вероятностей тех миров, в которых соответствующее предложение оказывается истинным.
Цель работы. Разработка модели нечетко-значной вероятностной логики, которая позволяет использовать разные вероятностные знания в интеллектуальнцх системах на основании логики высказываний. Изучение свойств полученной модели и построение на ее основе эффективных механизмов приближенного рассуждения . Изучение и развитие модели интервальной вероятностной логики и сравнение . ее с другими теориями. Расширение модели на случай логики предикатов. Разработка модели качественного рассуждения, использующей нечетко-значную вероятностную логику для представления вероятностных лингвистических переменных. Реализация системы автоматического
рассуждения на основе модели нечетко-значной вероятностной логики.
Метода исследований. В работе используются методы математической логики, теории вероятностей, теории нечетких систем, математического программирования и теории интеллектуальных систем.
Научная новизна. Все результаты диссертации являются новыми, получены автором и опубликованы в его работах. В диссертации впервые предложена модель нечетко-значной вероятностной логики для представления и обработки нечетких вероятностных знаний на основе использования распределения возможностей в качестве аппарата представления нечеткой информации и подхода анализа возможных миров для построения механизма распространения нечеткости. Свойства модели изучены и сформулированы в виде новой математической теории, которая играет важную роль при построении эффективных стратегий вывода. Взаимосвязи между распределениями возможностей знаний, выражающиеся схемами вывода относительно множеств уровня, представляют основу интервальной вероятностной логики. Правила вывода модус поненс, модус толленс и другие силлогизмы в этой модели изучены и сравниваются с соответствующими правилами вывода в других теориях. Разработана процедура самообучения в модели, которая позволяет одновременно повысить информативность представления информации в базе знаний и получаемых результатов в процессе вывода. Предложено семантическое расширение модели на логику преда: атов. Показана совместимом ^ между свойствами модели и структурой
и
вероятностной лингвистической шкалы и на этой основе предложена модель качественного рассуздения с использованием вероятностных кванторов. Реализован механизм автоматического рассуждения на основе модели нечетко-значной вероятностной логики.
Положения, выносимые на защиту.
1) Модель нечетко-значной вероятностной логики
- Подход анализа возможных миров для определения семантики распределения возможностей вероятности истинности.
- Свойства модели нечетко-значной вероятностной логики и свойства правил вывода.
- Процедура самообучения в нечетко-значной вероятностной логики.
2) Модель интервальной вероятностной логики. Правила вывода этой модели.
3) Расширение модели интервальной вероятностной логики на случай исчисления предикатов. Правила вывода с кванторами.
4) Качественное рассуждение щ основе интервальной вероятностной логики.
Практическая и теоретическая ценность. В диссертации развивается модель нечетко-значной вероятностной логики, которая позволяет использовать нечеткие вероятностные знания в интеллектуальных системах. Результаты проведенных исследований могут найти применение в задачах управления, принятия решений, приближенных рассувдений в нечетких условиях. Они 'также являются основой для разработки новых методов обработки
информации в целом ряде важных направлений, таких, как анализ изображений, дедуктивные базы данных, нечеткие языки программирования и др.
Апробация работы. Результаты диссертации излагались на семинаре "Инженерия знаний" под руководством проф. Фана Д.3. (Ханой, 1991 и 1992г.г.), на заседании факультета информатики Ханойского Политехнического института (Ханой, 1992), ва семинаре Института информатики Варшавского Университета технологии (ICS, WUT) под руководством профессора Павляка 3.(Варшава, 1992), на семинаре отдела "Проблем искусственного интеллекта" ВЦ РАН под руководством Академика АЕН РФ и МАИ проф. Поспелова Д.А. (1994 и 1995Г.г.), на Всероссийской конференции по искусственному интеллекту (Рыбинск, 1994) и на семинаре механико-математического факультета МГУ им. М.В.Ломоносова "Нечеткие множества и их приложения" под руководством Акад. МАИ и АТН РФ проф. Кудрявцева В.Б.(1995г.).
Публикации. Основные результаты диссертации опубликованы в 10 работах, список которых приводится в конце автореферата.
Объем работы. Диссертация состоит из введения, блести глав, двух приложений и списка литературы. Обьем работы 241 стр., в том числе 3 рис. Список литературы содержит 184 наименований.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении приведена краткая характеристика основных теоретических и прикладных аспектов нечеткой логики и дан
е
обзор основных результатов диссертации.
В первой главе излагается роль нечеткой логики в информационной технологии. Первый параграф зтой главы посвящен описанию всего диапазона применений нечеткой логики от систем управления базами данных до нечетких языков и срод программирования.
Во втором параграфе первой главы излагаются проблема . представления нечетких знаний и механизм вывода в нечетких системах. Дан анализ используемого в разных нечетких системах аппарата представления нечеткой информации. Правила вывода в перечисленных моделях описаны в удобном виде для дальнейшего сравнительного исследования.
Вторая глава посвящена проблеме представления нечеткой вероятностной .информации с помощью аппарата теории нечетких множеств.
В первом параграфе второй главы изложены основные понятия теории нечетких множеств, которые используются при разработке модели представления нечетких знаний. Пусть X - произвольное непустое множество. Нечетким множеством А на множестве X называется множество пар:
А={<^1а(х)/х>}, где х € X, цА(х) € [0,1] (2.1.1)
Функция : X-► 10,1] называтся функцией пржЮлежности
нечеткого множества А, а X - базовым лножествол, цА(х) € [0,1] понимается степенью принадлежности элемента х нечеткому множеству А. Примем, что в множество А не включаются элементы <ЦА(Х)/Х>, для которых ЦА(Х)=0.
(V
Носителем нечеткого множества А называется подмнЬкество А •
множества X, содержащее те элементы из X, для которых значения функции принадлежности цА(х)>0.
Множествам а-уровня Аа нечеткого множества А называется подмножество множества X, определяемое так:
Аа ={хеХ/цА(х)^а). (2.1.2)
IV
Нечеткое множество А назовем нормальным, если для а=1 Аа*0.
В нечеткой математике часто встречается случай, когда базовым множеством X является множество всех действительных чисел Я. Для это случая вводятся следующие определения.
Нечеткое множество А на И называется выпуклым если для любых трех чисел х, у, г таких, что х<усг мы имеем цА(у)йл1п{цА(х), цд(г)>.
Нечетким числом называется выпуклое нечеткое множество на
И.
В этом параграфе также введено определение операторов Т-нормы, Б-конормы и отрицания, которые являются обобщениями теоретико-множественных операций пересечения, объединения и дополнения.
Т-нормой является отображение:
Т:10,11x10,1 ] —► £0.1], удовлетворяющее следующим аксиомам:
Т1. Т(а,0)=Т(0,а)=0; Т(а,1)=Т(1,а)=а;
Т2. Т(а,Ь)=Т(Ь,а);
ТЗ. Т(а,Ь)>Т(с,(1) V а,Ь,с,й€(0,11 а>с, ЬМ;
Т4. Т(Т(а,Ь),с) Т(а,Т(Ь,с)).
Б-конормой называется функция Б:
Б:(0.1]х[0,13 —► [0,1],
для которой выполнены следующие аксиомы:
51. S(a,1)=S(1,a)=1; S(a,0)=S(0,a)=a;
52. S(a,b)=S(b,a);
53. S(a,b)^S(c,d) V a.b,c,d€f0,1) a»c, bxl;
54. S(S(a,b),c)=S(a,S(b,c)). Операцией отрицания называется функция:
п:(0,п —. 10,11. n(a)=1-a VatíO.11. На основе этих операций введены расширенные Т-нормы и S-конормы с любом числом переменных следующими рекурсивными формулами:
Т(а1.....a^-T^.Tfag.....ап>), (2.1.3)
S(a1.....an)=S(a1,S(a2.....а^)). (2.1.4)
и для них доказана следующая лемма:
Леша 2.1. Для любой треугольной нормы Т и конормы S мы имеем:
Ка.,...^) < Т(а. .....а, ) (2.1.5)
i n i1 im
S(a
^....вд) > SOj.....а^) (2.1.6)
где п»3, га<п и 1^(1.....п), / если 3 Ф к.
Во втором параграфе второй главы описаны некоторые метода построения функции принадлежности нечеткого множества. Все методы построения функции принадлежности нечетких множеств можно разделить на две группы: прямые и косвенные. К первой группе относятся такие метода, в которых степени принадлежности элементов множества X непосредственно задаются либо одним экспертом, либо коллективом экспертов. Косвенные
метода основаны на более "осторожном" использовании человека в качестве измерительного прибора и применяются для снижения субъективного влияния на результаты построения функции принадлежности. Например, подход аксиоматизации понятия функции принадлежности Норвича и Турксена; методология, основанная на теореме эквивалентного представления нечеткого множества бесконечным семейством четких отображений, удовлетворяющих условию антитонности; метод попарных сравнений для определения функции принадлежности нечеткого множества. В третьем параграфе источники нечеткости анализуются в контексте инженерии знаний с целью выяснить их роль в формировании как нечетких объектов, так и модели предметной области.
Источники нечеткости разнообразны и могут быть разделены на четыре группы: неточность, недоопределеннооть, неоднозначность и нечеткость. При инженерии знаний нечеткость накапливается главным образом на двух стадиях:, концептуализации и моделирования. Целью стадии концептуализации является создание множества понятий, необходимых для отражения объективных предметов исследуемой области, их свойств и атрибутов, связей между ними и т.д. Это множество понятий образует одну часть базы знаний. Формально, каждое понятие представляет собой некоторую совокупность своих проявлений (эталонов). В случае плохо формализованной предметной области дать точное определение этой совокупности не всегда возможно и понятие стало неясным или нечетким. На стадии моделирования формулируется модель предметной области, состоящая из фактов,
но
утверждений, отношений, правил и законов и т.д. Эти объекты могут быть неясными по природе или по причине наличия в своем составе нечетких понятий, сформированных на стадии концептуализации. Например, в стадии моделирования предметной области используются нечеткие высказывания, нечеткие утверждения, лингвистические переменные и др..
Четвертый параграф второй главы посвящен разработка модели представления нечеткой информации с вероятностной природой, на основе которой будет построена база знаний, являющаяся обьектом исследования настоящей работы.
Формально, вероятностны пространством является тройка <Х,Л,Р>, где X - пространство элементарных собыий, взаимо исключающих друг друга, Л - о-алгебра на X, Р - отображение Л — [0,11, называемое вероятностной мерой. Элементы о-алгебры Л называются измеримыми событиями. Под случайных соОышел понимается любое отображение А: X —» (0,1). Случайное событие, соответствующее отображению А, также обозначается через А.
С помощью теоремы об эквивалентном представлении нечеткого множества бесконечной последовательностью его множеств уровня{Аа), ае[0,1) можно определить "нечеткую вероятность" нечеткого события А (нечеткого множества) на пространстве X как распределение возможностей вероятности (<а/Р(Аа)>) на множестве измеримых событий вероятностного пространства <Х,Л,Р>. Элемент <а/Р(Аа)> говорит о том, что со степенью уверенности а можно считать вероятность Р(Аа) множества а-уровня А„ вероятностью нечеткого события А.
■44
■1
Благодаря вложенности случайных событий САа>. предствлявдих нечеткое событие, можно утверждать, что распределение возможностей {«х'Р(Аа)>) имеет вид нечеткого числа на интервале [0,1].
В дальнейшем считается, что база знаний состоит из событий вместе с их распределением возможностей вероятности. Под событием в базе знаний понимается любое предложение в исчислении .высказываний, которое используется для описания наблюдения явления реального мира. Тогда база знаний имеет следу одий формальный вид:
в*{<8,Цд>},
где Б - предложение, ца - распределение возможностей вероятности Б.
В третьей главе развивается модель нечетко-значной вероятностной логики на основе исчисления высказываний. В первом параграфе этой главы дано формальное определение исчисления высказываний и кратко описываются его теоретические основы для обосновании дальнейшего изложения.
Во втором параграфе третьей главы предложен подход анализа возможных миров для определения семантики распределения возможностей вероятности, выдвигаемого во второй главе в качестве аппарата представления нечеткой информации. Подход описывается следующем боразом.
Пусть й - язык классической логики высказываний и Я -множес-чо всех интерпретаций логики высказываый. Каждая интерпретация может расматриваться как присвоение истинностных значений и или I (ложь или истинна) всем формулам
языка й, которое обладает свойствами
а/ Каздой аксиоме присвоено значение I, б/ Если А и А=»В присвоены значениями I, то так же и В присвоено это значение (Модус поненс). Можно рассматривать каждую интерпретацию как "возлохный лир" для всей логики высказываний а так же и для любого множества £ ее формул.
Пусть £ = (Б1.....,Б11) - множество предложений (формул й).
Булевый вектор (о1,...,о11) (0^(0,1)) называется %-совлестилыл если существует возможный мир, в котором истинностное значение
предложения уа1(81)=о1 (1=1.....ь). Иначе говоря, вектор
(о1.....о^) называется ^-совместимым если существует
интерпретация 7а1:£—»(0,1} такая, что ▼аНв^)«^ (1=1,...,Ь).
Множество всех разных ^-совместимых векторов позволяет определить эквивалентное отношение (^-эквивалентное) на множестве всех возможных миров В с разбиением В = И^и.-.и №к.
^-эквивалентные классы образуют пространство базовых событий, на котором можно определить вероятностное распределение Р=(р1,...,рк). Если считается, что реальный мир, в котором мы живем, должен попасть в один из этих классов, то это вероятностное распределение характеризует то, что с вероятностью р^ реальный мир находится в классе (также говорим, что р1 - вероятность проявления класса И^). Сейчас вероятностью истинности каждого предложения в £ считается сумма вероятностей проявления всех классов, в которых истинно. Это может быть выражено матричным уравнением:
П=и.Р ' (3.2.1) .
¿3
"15
где П - вектор, состоящеий из вероятностей истинности предложений в и - базовая матрица, каждый столбец которой -^-совместимый вектор; Р - некоторое вероятностное распределение. Уравнение (3.2.1) называется уравнением вероятностей истинности для
В случае, когда используются условные вероятности в предложениях, эти условные вероятности определяются следующим образом.
Сначала строится новый язык из £ следующим образом а/ Если ¿ее, то АеЕ*; б/ Если А.Всг, то А|В, В|А€£*.
Пусть £ - база знаний, а £ - множество предложений в Я, £ с Тогда Г создается из 2 следующим способом а/ Сначала Г=0; б/ Для всех БсЕ
- если Бей, то добавляем Б к Г;
- если БеЦ и Б=А | В, то к Г . добавляется множество {А.В.АЛВ).
Ясно, что построенное таким образом Г - подмножество языка и следовательно, можно использовать этот йЬдход для создания уравнения вероятностей истинности Г . Вероятности истинности предложений в £ определяются следующим образом. Пусть БеЕ- Если Бей, то *=г(Б).Р, где г(Б) - вектор истинностных значений предложения Б в базовой матрице Г; - Если Б=А|В, то с условием г(В).РИО
х= Г<АЛВ).Р Г(В).Р
где г(АЛВ) и г(В) - векторы истинностных значений предложений АЛВ и В соответственно в базовой матрице Г. На основе предложенного подхода в третьем параграфе развивается модель нечетко-значной вероятностной логики.
В этой логике, каждое предложение Б дано шесте с нечетким множеством —► [0,11. Значение хеС0.13 понимается
как вероятность истинности, а Цд(х) - мера доверия к тому, что предложение Б принимает х в качестве своей вероятности истинности. функция Цд(х) называется распределением возможностей предложения Б.
Теперь база знаний 9 дана множеством предложений
2={Б1.....Бь> ' вместе с их распределениями возможности ц^
(1=1.....Ь):
»={<Б1,|а31>1 1=1.....Ь) (3.3.1)
Пусть Б - некоторое предложение. Для удобства используется следующие обозначения: если Б€£, то N=1 и можно допустить, что Б=БМ=Б11; если Б<2, тогда N=1+1 и Б=5М. Обозначим:
Г=(Б1,...
Ясно, что Г=2 если Б«Е и Г=Е и если Б^.
Для Г вписано уравнение вероятностей истинности :
П=и.Р (3.3.2)
Через 9(Бн,»,х) обозначается множество всех вероятностных распределений Р таких, что предложение Бы принимает значение х в качестве своей вероятности истинности в (3;3.2):
SHSjj.S.xMPIriS^.P»*}. Тогда распределение возможностей предложения SN относительно базы знаний 9В. обозначаемое через цПВ.^], определяется для каждого фиксированного xelO.l] следупдей формулой:
iHS.Sjg] (х)= шах Т(Цд (х^ ).....Hg <зсь)) (3.3.3)
P^.S.X) 1 ь
где x^rtS^.P - вероятность истинности предложения S^ Т -некоторая триангулярная норма. Ясно, что ^HSjj.S.x) -ограниченное и закрытое множество, а Т - неперерывное отображение. Поэтому tUS.Sj,], определенная в (3.3.3), достигает своего максимума в $(Sj|,8,x).
Пусть S база знаний, SN - предложение и n(8,SN] - его распределение возможностей относительно базы знаний , определенное формулой (3.3.3). Тогда записывается: » ь- <Sn,M.C»,SnI> В дальнейшем рассмотрены некоторые характерные свойства этой логики. Они будут служить метазнаниями, на основе которых можно построить эффективные приближенные правила вывода и стратегии рассуждения.
Teqpeua 3.1. Пусть » - база знаний, <S,Hg>€8 и »J=8\C<S,ns». Мы имеем:
li[*,S](x) = KMgix), n(8\S](x)) или короче: ц[8,Б] = Т(Цд , ni8',Sl). Теорема 3.1 дает метод корректировки распределения возможностей предложения: если Т понимается как пересечение нечетких множеств, то корректировка распределения возможностей предложения S с учетом базы знаний 8 эквивалентна пересечению
его прежнего и выводимого из В распределений возможностей. Теорема 3.2. Пусть 8ий' - две базы знаний таких, что 8'с 8. Тогда:
UtS.S] с ntB'.S), где с - отношение вложения нечетких множеств. Это показывает монотонность этой логики в том смысле , что результат, выводимый дедукцией из части базы знаний, всегда грубее выводимого из всей базы знаний. Иначе говоря, чем богаче база знаний, тем информативнее выводимый результат. Теорема 3.3. Пусть 8 любая база знаний; nS - отрицание S. Мы имеем:
ц[8,п8] (x)=nt8,Sl (1-х) Теорема показывает симметрию утверждения и его отрицания,
выводимого из одной и той же базы знаний. Это свойство оказывается подходящим для моделей приближенного рассуждения- с использованием лингвистических переменных когда множество лингвистических термов имеет структуру биполярной шкалы.
В случае, когда в качестве Т-нормы выбирается операция min доказаны следующие свойства.
Теорема 3.4. Пусть 8 - база знаний; R, S - два разных
предложения и T=mln в (3.3.3). Если:
¡8 ь- <S»p.tSB,S]>; 8 <R,n[»,R)>; 8'=8и{<Н,ц[8,Н)»; 8' <S,ji'(8,,S]>. Тогда: fiiS.SJ^'IS'.SJ.
По индукции из этой теоремы получается следствие: Следствие 3.1. Пусть 8 - база знаний, 8* - любое множество выводимых из s знаний, S - некоторое предложение. Мы
имеем:
IIIS.SJ^ISUS'.S] Следствие 3.1 показывает, что добавление выводимых из 8 знаний к самой базе знаний 8 не повысит мощности дедукции. Поэтому, в процессо рассуждения можно разделить базу знаний на две части: первичная и выводимая, и применить методы вывода только к первичной части. В случае, когда база знаний содержит количество .первичных знаний значительно меньше количества выводимых, применение этого следствия оказывается полезным.
Из теорем 3.1, 3.2, 3.4 также следует: Следствие 3.2. Пусть 8, S, и ®2 - базы знаний такие, что 8.,с® и Для любого предложения Б мы имеем:
UlB.Sl (xJOnliHnlS, ,S) (X) ,H182,S] (x)) короче: ц(8,Siedls, ,S)nn[82,SJ. Следствие 3.3. Пусть 8, 8, и 8г - базы знаний такие, что S1d8 и Sg£®. Для любой пары предложений S и R, если: ».,►- <R,n[»1,Rl>, S*=S82Ui<R,nl3i1 (RJ), В'н- <S,ix[S' ,S]>,
и
8 »— <S,(i(S,S]>
то
Hf8,S) с niB'.S). Когда в (3.3.3) вместо Т используется операция min, множества а-уровня распределений возможностей знаний в любом множестве знаний ( часть базы знаний или база знаний в целом) полностью определяют множество а-уровня распределения возможностей выводимого из не/о результата. Это будет
л*
сформулировано в следующей теореме.
Теорема 3.5. Совокупность множеств a-уровня распределений возможностей в базе знаний полностью определяют множества a-уровня выводимого из нее результата, если Т=ш1п.
Нечеткие числа оказываются адекватным средством для отражения семантики лингвистических переменных и хорошо изучены в ряде работ по нечеткой логике и особенно по нечеткому управлению. Следующая теорема показывает замкнутость множества нечетких чисел относительно правила вывода (3.3.3) при использовании rain вместо триангулярной нормы Т. Теорема 3.6. Пусть 8 - база знаний, T=rain в (3.3.3), »►-<S,n(S,S)> и ц3(х) - нечеткие числа. Тогда iiIS.S] является нечетким числом.
Четвертый параграф этой главы посвящен изучению стабильности базы знаний. Пусть дана база знаний В и <S,|A3>eSB. С помощью формулы (3.3.3) получается HÍS.S1. Вообще p.[S,S3 отличается от Это значит, что знание данной базы знаний не всегда выводимо из самой этой'базы знаний. Отсюда возникают вопросы: существует ли база знаний, непротиворечивая с даной базой знаний, любое знание которой может быть выводимо из нее; и если такая база знаий существует, то как она получется из начальной базы знаний. В этом параграфе введено определение стабильности базы знаний и предложена процедура саммообучения, которая по любой базе знаний строит стабильную базу знаний, более информативную и непротиворечущую исходной. Определение 3.1. База знаний ÍB называется стабильной если
аЭ
«Б.ЦдН» и 8 I— <8,ц(8,8]> следует: ц3=ц18,31. Иначе говоря, все знания в стабильной базе знаний выводимы из нее.
Процедура самообучения заключается в следующем. Процедура самообучения.
Вход: Любая база знаний 8о={<51,ц31>1 1=1,1). Условно
обозначим цд1 через Выход: Стабильная 8 Шаг I: к=0;. Шаг 2: 8кИ=0.
Для каждого 1=1,1:
- применять правило вывода (3.3.3):
8к — ^.цП^.Б^
- добавить <31,ц[8к,51]> к 8к+,:
и «З^ЦЙ^!» Шаг 3: Если хотя бы одно знание в 8к+1 не совпадает с соответствующем в 8к , то к=к+1 и повторить шаг 2; В противном случае 8=8к+1 и процедура остановится. Теорема 3.7. Процедура самообучения сходится и порождает стабильную базу знаний 8. В цикле жизни базы знаний постоянно происходит процесс накопления новых знаний, которые либо даны экспертами вне зависимости от существующих знаний в базе знаний, либо выводимы из самой базы знаний. Добавление этих знаний к базе знаний вообще нарушает ее стабильность , и поэтому требуется повторно осуществлять процедуру самообучения каждый раз, когда случается добавление. Следующая теорема показывает, чт^ при . добавлении к стабильной базе знаний выводимых из нее знаний
сохраняется ее стабильность.
Теорема 3.8. Пусть треугольная норма Т=т1п„ в - стабильная база знаний, Б - любое предложение, 8 •— <3,цС8,31>. Тогда 81Я<8,ц[8,3]>) является стабильной. В пятом параграфе изучены свойства нечетких правил вывода типа модус поненс, модус толленс, принцип резолюции, силлогизм. Эти свойства отражены в следующих теоремах. Теорема 3.9. (Модус поненс).
Пусть Б^Р, Бг=Р —► О, БИЗ, аЫ^.ц^ >,<8а.ц^»; ,
8 <3,ц(8,3)>. Множества а-уровня распределений ца , ^ -(а,А] и СЬ.ВЗ соответственно. Тогда с
условием А+ВЯ мы имеем:
ца[8,3]=[шах(0,а+Ь-1 ),В].
Теорема 3.10. Дана база знаний 8={<31,цв1>1 1=1.....Ь), где
Э1=Р1, Б1=(Р1_1 — РА) 1=2,...,Ь. Пусть 8 ь- <Рь,ц(8,Рь)>
Обозначим:
82=«31 .Цд^.^.Ц^» ®1=£<Р1-1 'Р1-1 ]>.<81.Ц31>}, 1=3,Ь.
Тогда
ц[Вь.Рь]^»1».Рь1.
Теорема ЗЛО показывает, что можно заменить сложный процесс вывода последовательным применением правила модус поненс. Это имеет большое значение в разработке и реализации ■
стратегий вывода, и одновременно, уменьшает значительно временные затраты в процессе рассуждения. Теорема 3.II. (Модус толленс).
Пусть S^Q, S2=P —► Q, S=P: 8={<S,,n^>,<S2.na >>;
8 <S,nl8,Sl>. Множества а-уровня распределений ца , - ib,B) и (а,А] соответственно. Тогда с
условием А>Ь мы имеем:
Ha(8,S)=C1-A,mln(1,1-a+B)J. Теорема 3.12.(Принцин резолюции).
Пусть S^RVQ, S2=nRVP, S=QVP; 8={<S, ,ц3 >,<S2,na >);
8 <S,nlS,SJ>. Множества а-уровня распределений
u„ , li_ -(Ъ,В) и [a,A3 соответственно. Тогда с si ?
условием А+В>1 мы имеем:
Ha(8,S]=(max(0,a+b-1 ),1). Правило вывода силлогизм в этой логике можно рассматривать как частный случай принципа резолюции. Поэтому его свойство отражено следующим следствием. Следствие 3.4.(Силлогизм). Пусть = R=»Qf S2 = Q=~P, S = R=>P; 8={<S1,ns >,<S2,M.s^>>;
8 <S,n(8,S]>. Множества а-уровня распределений , ца
[b.BJ и (а,А) соответственно. Тогда с условием А+В>1 ш имеем:
zz
jialS,S)=lmax(0,a+b-1 ),1 J.
Показано, что нечетко-значная вероятностная логика инвариантна относительно эквивалентных преобразований. Теореиа 3.13.
Пусть база знаний S=(<S1, Cai,A1)>, 1=1.....L>, Sj-
предложения в £ ; 8'={<Sj,ta1,A1)>, 1=1,...,L), где S't получается из применением к St некоторого эквивалентного преобразования ф±. Тогда если S' - результат применения эквивалентного преобразования ф к S, то имеется:
HÎ8,S]=ntS\S'J. Следствие 3.5. Если применять к предложениям в базе знаний тождественные преобразования, т.е. 8=8', то выполняются следующие равенства:
ц[8, (АЛА) ]=ц.(8,А] ;
(IIB, (AVA)]=fi!8,A];
(1(8,т|А]=ц[8,А);
ц(8,-1(АЛВ))=ц18лАУпВ];
ц18,СУ(АЛВ)]=ц!8, (CVA)A(CVB)];
ц[8,СЛ(АУВ)]=ц(8,(СЛА)У(СЛВ)1;
(AÎ8, (А=»В))=ц18,пАУВ].
Теорема 3.13 служит теоретической основой, которая оддершвает преобразование базы знаний к более простому виду построение эффективных механизмов вывода.
В шестом параграфе на основе полученных в предыдущих
параграфах результатов разработана система приближенного рассуждения.
В четвертой главе показаны взаимосвязи между множествами уровня распределений возможностей знаний в базе знаний и выводимых из нее результатов в случае, когда распределения возможностей имеют вид нечетких чисел и операция т1п используется вместо Т-нормы. Множества уровня могут рассматриваться как частный случай распределений возможности -равномерные распределения, и следовательно, можно развивать модель интервальной вероятностной логики с множествами уровня.
Первый Параграф четвертой главы дает интерпретацию множеству а-уровня как интервала [Р(А1),Р(Аа)1, который содержит вероятности всех множеств уровня Ад, ,
нечеткого события А. И следовательно, -если отождествлять нечеткое событие А с его множеством уровня,А^, то можно взять значение Р(Ар)еСР(А1 ),Р(Аа)1 в качестве."вероятности" А.- Иначе говоря, интервал СР(А1),Р(Аа)1 содержит все приближенные
/V
оценки вероятности нечеткого события А со степенью уверенности а. :
С этой интерпретацией во втором параграфе четвертой главы развивается модель интервальной вероятностной логики, в которой база знаний имеет вид
8={<Б1,181>, 1=1.Ь), где - некоторое предложение, а 1д1- интервал всех возможных значений вероятности истинности предложения Б1. Глобальное правило вывода также записывается в виде схемы
8 Ь- <8,1д>.
Показано, что нахождение интервала 1д эквивалентно решению
двух проблем линейного программирования:
а=ш!п г(Б) .Р, р=шах г(Б).Р (4.2.4)
на множестве ограничений: к
Г Е Рх=1. р^ (1=1.....К) (4.2.5)
1 г(Б1).Р €131 (1=1.....Ь) (4.2.6)
где К - число ^-эквивалентных классов возможных миров.
Свойства этой логики - следствия свойств нечетко-значной вероятностной логики - перечисляются в следующем. Следствие 4.1. Пусть 8 - база знаний, <Б,1>е8, 8'=8\{<Б,1>}. Тогда:
Пв.БЫППВ'.Б) Следствие 4.2. Пусть 8, 8' - две базы знаний, Б - предложение.
Если 8=®\ то П8,Б]э1[8' ,Б] Следствие 4.3. Пусть 8 - база знаний; Б и Т - два разных предложения, 8 <3,1[8,3)>, 8 <Т,118,Т]>. Поставим 8'=8и{<Т,1[8,Т)>>. Тогда 118,3]=1[8',Б1. Следствие 4.4. Пусть 8, 8,, В2 - базы знаний такие, что 8,^8 и В2=В. Для любого предложения Б мы имеем: 1[8,Б]с1[81 ,Б]П1[8г,Б1. Следствие 4.5. Пусть 8, 8,. 8г - базы знаний такие, что 8,«в и 82=В; Б, Т - два предложения; В^в^^Т.ПВ, ,Т1». Мы имеем: 1[8,Б]=1[8^,Б].
Следствие 4.6. Пусть В - база знаний; Б - предложение; чБ -отрицание Б. Если 1[В,Б]=[а,А] и 1(8,пБ]=(Ь,В], то
Ь=1-А И В=1 -а.
Следствие 4.7. Пусть 8={<51,11>. 1=1.....Ь> - база знаний, в
которой Б^А,, 51=А1_1=»А1 (1=2.....Ь). Если
(<Б1,1)>,<32,12>} <Аг.Ц>, «А1_1,1;_1>,<51.11>> <А1,1^> (1=3.....Ь)
и
8 Ь- <АЪ.1>
то 1=1^.
Следствие 4.8. Допустим, что Г^Б^-.-.Б^Б) - множество
предложений; Р,.....Рт являются пропозициональными
переменными, возникающими в предложениях Г; А1,..,Ат представляют собой пропозициональные формулы;
Б}.....получаются из Б1.....БЬ,Б путем замены
каждого появления Р± формулой А1 соответствено. Если
8=(<Б1,11>, 1=1.....Ь) и 8,={<Б^,11>, 1=1.....Ь).
то ПВ'.БЧсПВ.Б).
В третьем параграфе изучены локальные правила вывода со схемой
<Б1.11> <Б,1>
где пары типа <Б±,11>, находящиеся наверху линии, составляют базу знаний, а <Б,1> - выводимое знание относительно этой базы знаний. Вместо с <Б,*> показаны условия (а-)совместимости
базы знаний. Сравнительное исследование правил вывода интервальной вероятностной логики с соответствующими правилами других существующих теорий также проводилось на протяжении
главы 4.
Пятая глава посвящена семантическому продолжению модели штервальной вероятностной логики на £с - множество замкнутых формул исчисления предикатов, т.е., формул без свободных геременных. Полученная модель позволяет использовать кванторы 1 предложениях, описывающих более сложные реальные явления. !равила вывода с кванторами изучены. Во втором параграфе ¡ключей список нескольких знакомых правил.
Шестая глава посвящена развитию метода качественных ассуждений на основе разработанной интервальной вероятностной огики. Качественные рассуждения требуются при разработке и еализации систем с дружественным интрефейсом. Такие системы элжны обладать следующими свойствами:
» Общаться с пользователем на естественном языке:
■ Поддержать схему приближенных рассуждений, характерную пя пользователей системы, 'т.е. .настроиться на схемы эиближенных рассуждений экспертов, соответсвуицие разным )стям базы знаний, и осуществить глобальный вывод на их ;нове;
• Обеспечить парадигмы представления знаний, которые могут ■ражать человеческий взгляд на реальный мир с факторами,
рицающими такие традиционные свойства формальных систем, как чность, полноту, определенность, корректность. Поэтому в слодне« время использование лингвистических переменных в
интеллектуальных системах является повсеместным.
В первом параграфе шестой главы описана структура вероятностной лингвистической шкалы типа 5={КАК ПРАВИЛО. ОЧЕНЬ ЧАСТО, ЧАСТО, НЕ ОЧЕНЬ РЕДКО, НЕРЕДКО И НЕ ЧАСТО. ВРЕМЯ ОТ ВРЕМЕНИ, ИНОГДА, РЕДКО, ОЧЕНЬ РЕДКО}. Рассмотрено отношение порядка на элементах шкалы и на основе этого отношения шкала моделируется решеткой
<5,<, КАК ПРАВИЛО. ОЧЕНЬ РЕДКО>.
Также рассмотрено более сложное пространство описаний и, элементы которого представляют собой либо элементы лингвистической шкалы, либо объединения ее нескольких последовательных элементов и задаются парами Ст1 ,тг], т, г1<тг- На этом пространстве можно определить отношение вложения, с, между его элементами, отражающее их семантическую специфику. Кроме того, можно продолжать- отношение порядка лингвистической шкапы на целом пространстве. С этими отношениями пространство описаний становится бирешеткой • Ш,<,£,0,СОЧЕНЬ РЕДКО,КАК ПРАВИЛО],0).
Предложено представить семантику элементов подинтервалами интервала (0,11, и, на этой основе, моделировать пространство описаний с помощью лингвистической переменной.
Во втором параграфе рассмотрена возможность использования лингвистических переменных в модели интервальной вероятностной логики. Анализ свойств интервальной вероятностной логики показывает, что интервальная вероятностная логика является адекватным носителем семантики лингвистических переменных, моделирующих вероятностные кванторы.
&в
Во третьем параграфе предложена модель качественного рассудения с использованием лингвистических переменных на основе интервальной вероятностной логики. В этой модели вместо распределений возможностей предложения используются термы лингвистических переменных и база знаний имеет вид 8={<81,л1>; Б^Г, л±сЛ).
Правило вывода пишется
S >—
Локальные правила модели введены в виде предварительно-вычисленных таблиц, которые сохраняются вместе с базой знаний. Это позволяет уменьшать временные затраты при проведении рассуждения.
Разработана и реализована система качественного рассуждения FUZZY 2.0.
Основные результаты диссертации могут быть сформулированы следующим образом:
1) Разработана модель нечетко-значной вероятностной логики на основе исчисления высказываний, каждый элемент которой представляет собой пару <S,ns>, где: S - предложение исчисления высказываний, используемое для описания реального явления; цд - распределение возможностей вероятности истинности предложения S.
2) Развит подход анализа возможных миров для определения семантики распределения возможностей вероятности истинности.
3) Изучены свойства модели нечетко-значной вероятностной логики и свойства правил вывода. Введено понятие стабильности базы знаний и предложена процедура самообучения,' которая
Z9
позволяет привести любую базу знаний к стабильной стадии. В этой стадии база знаний информативнее, но непротиворечива с исходной. Рассмотрены свойства стабильной базы знаний.
4) Исследованы взаимосвязи множеств уровня распределений возможностей в модели нечетко-значной вероятностной логики и на этой основе развита модель интервальной вероятностной логики. Разнообразные правила вывода этой модели изучены в сравнении с соответствующими правилами других теорий.
. 5) Проведено расширение модели интервальной вероятностной логики на случай исчисления предикатов. Введены правила вывода с кванторами.
6) Разработана и реализована система качественного рассуждения на основе интервальной вероятностной логики.
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Аверкин А.Н., Нгуен М.Х. Использование нечеткого отношения моделирования для экспертных систем. М.: ВЦ АН СССР, 1988.
2. Аверкин А.Н., Нгуен М.Х. Использование нечетких отношений в моделях представления знаний.// Изв. АН СССР. Тех. Кибернетика, *5, 1989.
3. Нгуен М.Х. Применение нечетких отношений в классификации // Нечеткие системы поддержки принятия решений. Калинин, 1989.
4. Нгуен М.Х. О системе управления нечеткостью FUZZY в экспертных системах.// Нечеткие системы: модели и программные средства. Тверь, 1991.
5. Нгуен М.Х. Моделирование приближенных рассуждений с помощью нечетко-значной вероятностной логики.// Изв. РАН. Тех. Кибернетика, JS6, 1993.
6. Нгуен М.Х. Модель нечетко-значной вероятностной логики. М.: ВЦ РАН, 1995.
7. Нгуен М.Х. Правило модус поненс в нечетко-значной вероятностной логике. М.: ВЦ РАН, 1995.
8. Нгуен М.Х. Нечетко-значная вероятностная логика и операция min. М.: ВЦ РАН, 1995.
9. Нгуен М.Х. Проблема самообучения в нечетко-значной вероятностной логике. М.: ВЦ РАН, 1995.
10. Нгуен М.Х. Лингвистико-значная вероятностная логика и качественное рассуждение. М.: ВЦ РАН, 1995.
-
Похожие работы
- Модель представления нечеткой информации на основе нечетко-значной логики
- Разработка моделей и методов нечеткого логического вывода для управления производственными объектами в условиях априорной неопределенности
- Разработка и исследование системы автоматического управления технологическим процессом химводоочистки на теплоэлектроцентрали с использованием аппарата нечеткой логики
- Нечеткие интервальные модели функциональных систем
- Исследование и разработка методов построения нечетких стратегиий решения проблем на основе триангулярных норм
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность