Методы извлечения и анализа экспертных знаний

Асанов, Артем Асхатович

Управление в социальных и экономических системах

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.10, диссертация на тему:Методы извлечения и анализа экспертных знаний

кандидата технических наук: Асанов, Артем Асхатович
город: Москва
год: 2002
специальность ВАК РФ: 05.13.10

Диссертация по информатике, вычислительной технике и управлению на тему «Методы извлечения и анализа экспертных знаний»

Оглавление автор диссертации — кандидата технических наук Асанов, Артем Асхатович

Введение.

Задача экспертной классификации.

1.1 Определения, постановка задачи.

1.2 Обзор методов классификации.

1.2.1 Методология KADS.

1.2.2 Метод ELECTRE TRI.

1.2.3 Метод классификации с линейной функцией полезности.

1.2.4 Построение согласованной системы правил классификации.

1.2.5 Семейство методов Вербального Анализа Решений.

1.2.5.1 Алгоритм ОРКЛАСС.

1.2.5.2 Алгоритм ДИФКЛАСС.

1.2.5.3 Алгоритм КЛАНШ.

1.2.5.4 Алгоритм STEPCLASS

1.2.6 Алгоритм расшифровки монотонных функций алгебры логики.

1.3 ВЫВОДЫ.

Выявление экспертных знаний: алгоритм ЦИКЛ.

2.1 Основные идеи.

2.2 Формальное изложение.

2.3 Свойства алгоритма.

2.3.1 Полнота классификации.

2.3.2 Непротиворечивость классификации.

2.3.3 Оценка вычислительной сложности.

2.4 Сравнение алгоритмов.

2.4.1 Процедура.

2.4.2 Результаты.

2.5 Задачи большой размерности.

2.6 Выводы.

Анализ экспертных знаний: построение решающих правил.

3.1 Экспертные решающие правила.

3.2 Определения.

3.3 Характеристики правил.

3.4 Постановка задачи.

3.5 Выявление решающих правил.

3.5.1 Комбинаторный алгоритм.

3.5.2 Генетический алгоритм.

3.5.2.1 Представление и создание популяции.

3.5.2.2 Целевая функция.

3.5.2.3 Оператор селекции.

3.5.2.4 Оператор скрещивания.

3.5.2.5 Оператор мутации.

3.5.2.6 Оператор отбора.

3.5.2.7 Построение решения.

3.5.2.8 Схема эволюции.

3.5.3 Оценки эффективности.

3.6 Выводы.

Применения.

4.1 Диагностика медикаментозных отравлений.

4.1.1 Особенности задачи.

4.1.2 Построение базы знаний.

4.1.3 Архитектура системы.

4.1.4 Выводы.

4.2 Оценка качества банковских кредитов.

Введение 2002 год, диссертация по информатике, вычислительной технике и управлению, Асанов, Артем Асхатович

Множество подходов, применяемых сегодня при решении задач в области искусственного интеллекта можно разделить на две большие группы, которые условно характеризуются, как 1) методы, имитирующие результат решения человеком интеллектуальных задач и 2) методы, имитирующие процесс их решения человеком [Russell, Norvig, 1995], [Гаврилова, Хорошевский, 2000].

Объединяющий принцип подходов первой группы можно сформулировать следующим образом: «Не имеет значения, как устроен интеллектуальный агент. Главное, чтобы на одинаковые входные воздействия он реагировал также, как и человек». Этот принцип обосновывается тем соображением, что люди совершенно не обязаны следовать природе в своих научно-технологических поисках. В частности, известно множество успешных изобретений, у которых отсутствуют прямые аналоги в природе (например, колесо). Использование подходов этой группы привело к созданию множества математических моделей, методов и алгоритмов, которые позволили разработать большое количество успешных интеллектуальных программ, особенно в области хорошо структурированных задач (например игра в шахматы).

Методы второй группы стараются имитировать структуры и процессы в человеческом мозге. Здесь основной принцип: «Единственный, известный в настоящее время мыслящий объект - это человек, его мозг. Следовательно искусственный интеллектуальный агент должен имитировать мыслительную деятельность человека.». Действительно, человек не превзойден в эффективности и скорости решения огромного множества задач, которые принято называть интеллектуальными. Наиболее ярко преимущества человека проявляются при решении слабоструктурированных задач (в т.ч. перевод текстов, распознавание образов). В тоже время можно заметить, что слабоструктурированные задачи составляют большинство проблем, с которыми приходится иметь дело людям - «качественные, трудноформализируемые и неопределенные факторы имеют тенденцию доминировать» [Simon, 1972]. Поэтому разработка методов, позволяющих создавать машинные копии людей, представляет собой задачу огромной важности.

В настоящее время среди моделей когнитивной психологии преобладает так называемый информационный подход (computational view of thought) [Hunt, 1989], рассматривающий человека как систему переработки информации [Newell, Simon, 1972], [Simon, 1981], [Солсо, 1996]. Знание в рамках этого подхода рассматривается как комплекс объективно существующих элементов (символов, паттернов*), хранящихся в мозге человека [Simon, 1993]. Они обрабатываются подобно структурам данных и кода в памяти компьютера и непосредственно отвечают за интеллектуальное поведение человека. В данном случае несущественно, как именно представлены эти символы на нижнем уровне - уровне межнейронных связей в мозге. Само слово символ может обозначать некоторый (может быть довольно сложный) внутренний образ (паттерн). При этом знание рассматривается как взаимосвязанный набор таких символов, паттернов. Они относительно статичны, но модифицируемы, их можно хранить, извлечь и передать другому человеку или формализовать в компьютерной системе. Построение и успешное применение таких программ, как модель памяти и обучения ЕРАМ [Feigenbaum, 1963], ACT* [Anderson, 1983], SOAR [Laird et al, 1987], THEO [Mithcell, 1990] показало адекватность их функционирования поведению человека в психологических экспериментах.

Принято называть людей наиболее грамотно, быстро и корректно решающих задачи в свой профессиональной области экспертами. Экспертное знание формируется в результате долгого обучения, решения множества задач, проб и ошибок. Существует распространенное мнение [Ericsson, 1996], что человеку требуется время как минимум 10 лет для того, чтобы стать экспертом

Смысл английского термина pattern заметно отличается от своих русских аналогов: образец, модель, шаблон, поэтому за неимением лучшего мы будем применять далее термин паттерн. в своей области. Эта оценка приблизительно справедлива для самых разных профессий - врачей, шахматистов, композиторов. Она остается применимой даже для таких вундеркиндов, как Моцарт или Фишер [Chase, Simon, 1973], [Ericsson et al, 1993].

За столь продолжительное время значительно увеличивается объем знаний и претерпевает существенные изменения способ мышления и обработки информации. В результате этих трансформаций эксперт достигает способности принимать решения очень быстро и практически безошибочно. Было установлено, что мышление экспертов при решении задач значительно отличается от мышления новичков.

Исследования мыслительных процессов при игре в шахматы показали, что, в частности, гроссмейстеры выбирают лучшие, в отличие от любителей, ходы не за счет более глубокого поиска при переборе вариантов, а за счет более качественной оценки текущей позиции [de Groot, 1965]. Последующие исследования мышления опытных шахматистов привели к созданию теории экспертного мышления, основанной на механизмах распознавания паттернов [Chase, Simon, 1973]. Эта теория позволяет объяснить быстрое и корректное решение экспертами сложных задач в условиях ограниченных возможностей человеческой системы обработки информации, в частности ограниченного объема кратковременной памяти [Миллер, 1964].

Исследование мыслительных процессов экспертов проводились во многих областях, в том числе и в области медицинской диагностики. Было показано [Schmidt, Boshuizen, 1990], что аналогично шахматистам опытные врачи не только обладают большим объемом знаний, чем новички, но и структура и содержание этих знаний существенно отличаются. В время обучения начинающие врачи запоминают сложные причинно-следственные зависимости заболеваний в терминах патофизиологических процессов. Однако в практической работе эти знания постепенно дополняются когнитивными структурами более высокого уровня, так называемыми сценариями заболеваний (illness scripts),- которые представляются уже в терминах клинических признаков и симптомов. Именно такие паттерны наиболее активно используются экспертом в качестве проверяемых и подтверждаемых шаблонов при постановке диагноза.

Таким образом экспертное знание обладает несколькими важными характерными чертами:

1) В процессе принятия решений эксперты оперируют когнитивными структурами - паттернами, представляющими собой образы существенных явлений в заданной предметной области. Эти структуры формируются в мозге эксперта на основе декларативных знаний в результате длительного (более 10 лет) обучения и практической работы. Они достаточно устойчивы и могут быть извлечены и с некоторой точностью формализованы.

2) Проявлением мышления на основе распознавания является наблюдаемый у экспертов прямой вывод (forward reasoning), когда на основе известных фактов непосредственно выдвигается гипотеза решения, что характеризуется быстротой решения задачи и малым числом ошибок. Напротив, новички преимущественно используют обратный вывод (backward reasoning), т.е. перебор возможных вариантов решения, одновременно осуществляя подбор аргументов в пользу каждого из них. Этот путь требует значительно большего количества времени и существенно больше подвержен ошибкам [Patel, Ramoni, 1997].

3) Экспертное знание как правило подсознательно - в большинстве случаев эксперты не могут сформулировать правила, которые они используют в принятии решений. Правила, которые они все же могут явным образом вербализовать, охватывают лишь подмножество самых простых задач, которые они могут решить. Поэтому, можно считать что в результате многолетнего интенсивного обучения и практики у экспертов формируются правила распознавания, значительная часть которых находится на подсознательном уровне [Kihlstrom, 1987]. Причем существует знание, первоначально имевшее явное, декларативное представление, но затем со временем ставшее автоматическим, не требующим сосредоточения внимания и размышления.

Однако существует и неявное (implicit) знание, которое изначально не представимо в явном виде и было сформировано как результат длительной интенсивной практики [Berry, 1987]. Многочисленные психологические эксперименты дают основания считать, что «сложные структуры, лежащие в основе языка, общения, восприятия, умения играть в сложные игры, возникают неявно и подсознательно» [Reber et al, 1980]. Именно подсознательный характер экспертного знания вызвал значительные трудности при построении экспертных систем, а извлечение экспертных знаний было названо «узким местом» искусственного интеллекта [Feigenbaum, McCorduck, 1983].

Настоящая работа посвящена развитию алгоритмов и методов выявления подсознательного экспертного знания, построения экспертных баз знаний в тех предметных областях, где отсутствуют объективные модели принятия решений и эталоном качества решения задачи является опытный человек-эксперт. Работа также имеет своей целью разработку формальных методов анализа экспертного знания - выявление решающих правил, представляющих собой отражение когнитивных структур-паттернов, применяемых экспертами при решении задач.

Получены следующие новые научные результаты:

• Разработан алгоритм ЦИКЛ построения полных и непротиворечивых баз экспертных знаний, позволяющий значительно повысить эффективность процесса выявления экспертного знания, а также расширить круг задач порядковой экспертной классификации, которые могут быть решены с его помощью.

• Построено обобщение метода, позволяющего сравнить эффективности алгоритмов решения задачи экспертной классификации, на случай задач произвольной размерности. Получены новые данные об эффективности алгоритмов ЦИКЛ, КЛАСС, алгоритмов расшифровки монотонных функций алгебры логики.

• Разработаны методы декомпозиции, позволяющие свести задачи экспертной классификации большой размерности, сложность которых выходит за рамки возможностей человеческой системы переработки информации, к серии успешно решаемых подзадач меньшей размерности.

• Предложен формальный аппарат описания экспертных решающих правил. Сформулирована оптимизационная многокритериальная задача выявления решающих правил.

• Построены два алгоритма (комбинаторный и генетический) решения задачи выявления решающих правил.

• Разработан и проведен вычислительный эксперимент по сравнению эффективности алгоритмов выявления решающих правил.

• Получено подтверждение обоснованности, корректности и эффективности предложенной серии методов на примере решения двух практических задач - построение медицинской диагностической экспертной системы и системы поддержки принятия решений для коммерческого банка.

Во введении рассматриваются основания задачи выявления экспертного знания с точки зрения информационного подхода - доминирующей системы взглядов и методов в современной когнитивной психологии. Обсуждаются различные способы построения интеллектуальных систем, их различия и их применимость для решения хорошо структурированных и слабо структурированных задач. Рассматриваются особенности мышления экспертов, обуславливающие сложность и важность проблемы выявления подсознательного экспертного знания при построении интеллектуальных систем в слабоструктурированных предметных областях.

В первой главе приводится формальная постановка задачи экспертной классификации, даются основные определения: полная, непротиворечивая классификация, отношение доминирования, граничные элементы. Далее делается обзор современных методов классификации с акцентом на различные подходы к извлечению и представлению экспертного знания. Проводится аналогия с задачами расшифровки монотонных функций в области алгебры логики. На основе анализа формулируются проблемы и ставится цель диссертационного исследования.

Вторая глава содержит описание и формальный анализ алгоритма ЦИКЛ построения порядковой экспертной классификации. Предлагается обобщение метода сравнения эффективности алгоритмов построения классификации [Нарыжный, 1998] для задач произвольной размерности. Рассматриваются постановка и результаты вычислительного эксперимента, показывающего высокую эффективность разработанного алгоритма ЦИКЛ. Предлагается техника декомпозиции задачи классификации большой размерности на серию подзадач невысокой размерности. Она позволяет решать задачи экспертной классификации с учетом ограничений человеческой системы переработки информации.

Третья глава посвящена задаче построения экспертных решающих правил. Предлагается формальный аппарат описания решающих правил, формулируются их характеристики, ставится оптимизационная многокритериальная задача выявления решающих правил. Обсуждается влияние случайных и систематических ошибок в процессе выявления экспертного знания на точность описания экспертной классификации решающими правилами. Предлагается сведение многокритериальной оптимизационной задачи к однокритериальной. Далее в главе рассматриваются два алгоритма решения задачи построения решающих правил. Первый из них ориентирован на поиск в базе знаний сходных структур потенциально определяемых искомыми решающими правилами. Второй алгоритм основан на подходе эволюционного моделирования. Описывается вычислительный эксперимент, направленный на получение оценок эффективности предложенных алгоритмов. Полученные результаты позволяют утверждать, что генетический алгоритм позволяет достаточно надежно выявлять экспертные решающие правила в задачах, осложненных неустойчивостью экспертного знания.

В четвертой главе описаны практические системы, использующие разработанные методы извлечения и анализа экспертных знаний. Рассматривается задача диагностики острых медикаментозных отравлений. 8

Приведены описание специфики задачи, метода построения базы экспертных знаний, архитектуры и принципов работы экспертной системы для диагностики острых медикаментозных отравлений ЭСТЕР. Далее в главе описана система поддержки принятия решений для оценки качества кредитного портфеля в коммерческом банке. Обсуждается технология выявления экспертных знаний в сложной многоуровневой задаче классификации, использованная при построении системы.

Заключение содержит обзор основных достижений и результатов, представленных в настоящей работе.

Заключение диссертация на тему "Методы извлечения и анализа экспертных знаний"

4.1.4 Выводы

Способность экспертной системы вести себя, как человек, является критическим фактором при ее применении. Разработанная система ЭСТЕР обладает обширной базой знаний и механизмом вывода, близко имитирующими знания и рассуждения эксперта в области диагностики отравлений лекарственными препаратами.

Система дает пользователю возможность использовать активный и пассивный способ взаимодействия. Когда система берет инициативу на себя и начинает опрашивать пользователя, тот может использовать такое взаимодействие для повышения своей квалификации. Пользователь может сравнивать свое собственное предварительное заключение с выводом эксперта-автора базы знаний системы.

Важно отметить, что открытая архитектура системы ЭСТЕР позволяет добавлять новые классы (причины отравлений) и новые диагностические признаки для этих классов. Также возможна коррекция базы знаний для любого класса решений с использованием знаний более опытного (в отравлениях этого класса) врача.

4.2 Оценка качества банковских кредитов

После кризиса 1998 года сложилась благоприятная ситуация для увеличения объемов кредитования банками реального сектора экономики. Это вызвано, с одной стороны, временным отсутствием высокодоходных спекулятивных инструментов, с другой, острой потребностью в заемных средствах "оживших" импортозамещающих предприятий. При этом, необходимость выполнения достаточно жестких нормативов ЦБ РФ и краткосрочная структура пассивов многих коммерческих банков привели к исчерпанию ими лимитов кредитования. В этой связи и в условиях продолжающегося экономического роста, всегда актуальная проблема определения качества кредитов приобретает новое значение.

Управление кредитным риском, наряду с рыночным и операционным, является повседневной практикой любого банка. Оценка кредитного риска может и должна осуществляться на разных этапах процедуры кредитования. Можно сказать, что в наличии и четком исполнении такой процедуры и заключается сущность управления риском, а его уровень зависит от проработанности и пунктуальности в исполнении процедуры.

В кредитном процессе принимают участие следующие структурные подразделения и службы банка: кредитный комитет, управление кредитования*, отдел анализа кредитных рисков, юридическое управление, служба

В зависимости от размера банка подразделения могут быть отделами, департаментами и т.п. безопасности, бухгалтерия, управление внутреннего контроля. Отдел анализа кредитных рисков в составе управления анализа рисков должен быть независим от управления кредитования. Задачи его сотрудников состоят в представлении кредитному комитету собственного заключения по каждому кредитному проекту каждого заемщика, основанного на экспертных оценках всех упомянутых выше служб и подразделений. Кроме заключений на этапе одобрения кредита, отдел анализа кредитных рисков должен периодически предоставлять руководству банка отчет о качестве существующего кредитного портфеля банка, в том числе классификацию кредитов по группам риска, и давать свои предложения по изменению кредитной политики банка.

4.2.1 Метод решения

Получение достаточно надежных оценок качества кредитов является сложной задачей, так как нет единого индикатора вероятности невозврата средств. Существует множество индикаторов (факторов, критериев), которые необходимо принимать во внимание. Каждый такой фактор вносит определенный вклад в общую оценку. Например, методика ЦБ РФ классификации кредитного портфеля по группам риска для формирования резерва на возможные потери по ссудам, учитывает два фактора - качество обеспечения и качество текущего обслуживания кредита. Наряду с этим, классификация кредитов для внутренних нужд банка может и должна учитывать и другие параметры кредитного проекта, фирмы заемщика. Общее качество кредита является достаточно сложной функцией отдельных его составляющих. Эта функция не может быть определена путем объективных расчетов. Обстановка, в которой работает банк, непрерывно изменяется из-за изменения общей экономической ситуации. Следовательно, правила оценки качества кредитов могут быть основаны только на политике руководства банка, на интуиции и опыте его руководителей.

Классификация банковских кредитов по группам риска может осуществляться либо на основе экспертной оценки опытного кредитного работника, либо с помощью регулярной процедуры агрегирования оценок отдельных параметров кредита, полученных от профильных специалистов банка или привлеченных экспертов. При грамотной постановке процесса кредитования параллельно используются оба метода. Известны автоматизированные системы классификации, построенные на основе статистических методов, нейронных сетей. Однако такие процедуры требуют "хороших" статистических рядов, отсутствующих в современной российской банковской практике, поэтому они не позволяют проследить "логику" классификации и, следовательно, избежать ошибок. Следует добавить, что большинство параметров, описывающих кредитный проект, имеют качественный характер и формальная оцифровка оценок при использовании статистических процедур создает лишь видимость точности. Представляется логичным использовать опыт руководящих лиц банка - членов кредитного комитета для определения существенных (в данных экономических условиях) параметров кредитного проекта и построения правил классификации в полученном пространстве всевозможных сочетаний этих параметров. Собственно, такая классификация при двух критериях построена в Инструкции ЦБ РФ от 30.06.1997 № 62а. При большем количестве критериев выполнить классификацию без использования специального метода затруднительно.

Методы выявления и анализа знаний, рассмотренные в главах 2 и 3, позволяют психологически корректным образом выявить экспертное знание, обеспечить полноту и непротиворечивость полученной информации и построить решающие правила в задаче классификации. На основе этих методов в отделе "Теория и методы принятия решений" ИСА РАН был разработан программный комплекс ORCLASS Suite, предназначенный для построения баз знаний и автоматизации принятия решений в задачах классификации.

4.2.2 Пакет ORCLASS Suite

Программный комплекс ORCLASS Suite состоит из двух модулей. Модуль OrClass предназначен для 1) формирования структуры задачи в виде набора критериев, оценок по критериям и классов решений; 2) построения порядковой классификации на множестве объектов, описываемых набором оценок по заданным критериям. Модуль ОгЕх предназначен для формирования в режиме диалога с пользователем или импорте из базы данных описаний объектов классификации, выдачи их класса решения и объяснения результатов. Система работает в среде операционных систем MS Windows 9X/ME/NT/2000/XP и предоставляет удобный пользовательский интерфейс, возможность экспорта и импорта данных в различных форматах.

Пакет ORCLASS Suite не привязан жестко к какой-либо предметной области. Он может применяться для решения задач, допускающих описание в терминах набора критериев, упорядоченных по характерности значений на шкалах критериев и упорядоченных классов решений. Специфика предметной области отражается при формировании такой структуры.

4.2.3 Разработка и внедрение системы

Разработка и внедрение системы классификации качества банковских кредитов осуществлялось рабочей группой, состоявшей из сотрудников Института Системного Анализа РАН, членов кредитного комитета банка, начальника кредитного управления и одного из его заместителей, сотрудников отдела анализа кредитных рисков, службы безопасности, управления автоматизации и юридического отдела банка. Работу можно условно подразделить на ряд этапов:

1) определение количества и описание классов качества банковских кредитов;

2) определение существенных параметров описания банковских кредитов, т.е. системы критериев;

3) построение классификации на множестве всех возможных кредитов на основе опыта членов кредитного комитета банка;

4) пробная классификация кредитного портфеля банка с использованием полученной системы и корректировка полученного на предыдущих шагах решающего правила.

104

После ряда итераций, проведенных при методологическом руководстве консультантов из ИСА РАН, были выделены классы качества банковских кредитов и разработана система критериев. Большое количество критериев -более 20 - не позволило непосредственно построить классификацию с использованием всех критериев. Поэтому была применена техника декомпозиции иерархическая свертка (см раздел 2.5). В приложении V приведено описание классов решений и сформированной иерархической системы классификации.

Далее были построены правила классификации по всем уровням многокритериального описания качества кредитов. Сначала специалистами соответствующих подразделений банка с помощью инженера по знаниям решались шесть (по количеству критериев верхнего уровня) подзадач классификации. Затем, используя классы решений задач нижнего уровня в качестве значений по шкалам критериев верхнего уровня, строилась итоговая классификация. В итоге были получены решающие правила определения качества произвольного кредита. На Рис. 4-4 приведен экран модуля ОгОаББ, используемого для построении классификации. Ш

ORCLASS - [обеспеченность, arc]

В] Файл Правка Опрос Вид Окно ?

Ъют! г iriait.

Bf ■

Классифицируйте объект

Вопрос: 32 Объект: 1211

Задача:

Классы peu« .— —2— —— — . оценка предполагаемого обеспечения: удовлетворительная (непокрытый кредит).

A. Обеспече

B. Обеспече обеспечете: нелквсвидное.

C. Обеспече прогноз стошиости обеспечения: неопределенность. оценочная стоимость не покрывает сумма кредита, проценты и расходы по реализации (с учетом возможного удешевления).

Критерии:

0. оценка пр

1.ЛИКВЦДН01

2. прогноз с гтом возмож учетом B03iv

А Обеспеченность кредита: отличная в. Обеспеченность кредита: удовлетворительная С. Обеспеченность кредита: неудовлетворительная

Г" Исключение

ОК

Назад Отмена

Лом.г I Изменить. I Для получения справки нажмите F1

Т i

Рис. 4-4. Построение системы классификации банковских кредитов. 4.2.4 Выводы

Оценка качества кредитных проектов в коммерческом банке с учетом российских реалий является типичным примером сложной слабоструктурированной задачи с многими параметрами. Проведенный анализ задачи, рассмотрение проблемы с точки зрения теории принятия решений позволили сформулировать ее как задачу порядковой классификации. В результате выполненной совместно с сотрудниками банка работы была сформирована многоуровневая структура задачи классификации, построена полная и непротиворечивая база знаний, выработаны согласованные правила оценки кредитных проектов.

Заключение

Накопленный опыт построения интеллектуальных систем, основанных на знаниях, показывает, что качество базы знаний является одним из наиболее значимых факторов для их успешного применения. Качество базы знаний, в свою очередь, определяется, прежде всего, точностью и полнотой представления экспертных знаний. Поэтому этап выявления и анализа экспертного знания во многом определяет качество, жизнеспособность и эффективность разрабатываемой интеллектуальной системы, основанной на знаниях. В тоже время, проведенный анализ современных методов выявления и представления экспертного знания показал, что на этом этапе имеется ряд серьезных трудностей, связанных необходимостью учета возможностей и ограничений человеческой системы переработки информации, особенностей экспертного знания, обеспечения полноты и согласованности извлекаемого знания.

В диссертационной работе предложен новый подход к выявлению и анализу экспертного знания в задачах классификации. Разработанная серия алгоритмов и методов основана на методологии Вербального Анализа Решений, разработана с учетом психологических характеристик человеческой системы переработки информации. Учтены и используются результаты изучения особенностей экспертного знания, полученные в ИСА РАН. Предложенный подход предоставляет эффективную процедуру построения полных и непротиворечивых баз экспертного знания, средства для анализа полученной информации, алгоритмы восстановления решающих правил, которыми пользуются эксперты в своей профессиональной деятельности. Особое внимание уделено корректной обработке возможных человеческих ошибок и областей неустойчивости экспертного знания.

В работе предложен новый метод ЦИКЛ порядковой классификации многокритериальных альтернатив. Его отличие от существующих аналогов состоит, во-первых, в большей общности - способности работать с произвольными порядковыми шкалами критериев и произвольным количеством классов решений, и во-вторых, в значительно большей эффективности, понимаемой как минимизация времени, затрачиваемого экспертом.

Предложена серия методов декомпозиции структуры задач экспертной классификации. Их применение открывает возможность построения баз экспертных знаний в задачах классификации большой размерности.

Разработано обобщение способа сравнения эффективности алгоритмов порядковой классификации. Предложенная процедура применена для сравнения показателей алгоритма экспертной классификации ЦИКЛ и алгоритма расшифровки монотонных функций алгебры логики В.Б. Алексеева. Полученные результаты показывают, что алгоритм ЦИКЛ, немного уступая в самом сложном случае, значительно более эффективен в среднем.

Построены комбинаторный и генетический алгоритмы построения экспертных решающих правил в задачах порядковой и номинальной классификации. Для этих алгоритмов разработан метод сравнения эффективности. Проведен вычислительный эксперимент, результаты которого говорят о том, что предложенные алгоритмы позволяют достаточно надежно и точно восстанавливать экспертные решающие правила в задачах классификации. При этом генетический алгоритм обладает хорошими показателями эффективности в сложных случаях, когда в базе экспертных знаний существуют области неустойчивости.

Предложенные алгоритмы реализованы в виде программной системы на платформе MS Windows® 9X/ME/NT/2000/XP. Использование при разработке компонентной объектной технологии MS СОМ обеспечивает высокую степень повторной используемости модулей системы, возможность их включения в другие программные системы, возможность задания сценариев автоматической обработки данных.

Разработанные системы и методы были использованы при создании экспертной системы для диагностики острых медикаментозных отравлений

Библиография Асанов, Артем Асхатович, диссертация по теме Управление в социальных и экономических системах

1. Azibi, R., Vanderpooten, D. (2002). Construction of rule-based assignment models. European Journal of Operational Research, vol. 138/2, pp. 274-293.

2. Berry, D. C. (1987). The problem of implicit knowledge. Expert Systems, vol. 4., N 3.

3. Chase, W. G., Simon, H. A. (1973). The Mind's Eye in Chess. In: Chase W.G. (Ed.) Visual Information Processing. New York: Academic, pp. 215-281.de Groot, A. D. (1965). Thought and choice in chess. Netherlands: Mouton Publishers, The Hague.

4. Ericsson, K. A., Krampe, R. T., Tesch-Romer, C. (1993). The role of deliberate practice in the acquisition of expert performance. Psychological Review, 100(3), pp. 363-406.

5. Feigenbaum, E. A. (1963). The simulation of verbal learning behavior. In: Feigenbaum, E.A., Feldman, J. (Eds) Computers and thought. McGraw-Hill, New York.

6. Feigenbaum, E. A., McCorduck, P. (1983). The 5-th generation. Addison-Wesley, Massachusetts, 266 p.

7. Goldberg, D., E. (1989). Genetic algorithms in search, optimization and machine learning. Addison-Wesley.

8. Hansel, G. (1966). Sur le nombre des fonctions booléennes monotones de n variables. C. r. Acad. Sci., 262, 1088-1090. (Русский перевод: Ансель, Ж. (1968). О числе монотонных булевых функций n переменных. В «Кибернетич. сб.» нов. сер., вып. 5, М.: Мир)

9. Hickman, F. R., Killin, J. L., Land, L., Mulhall, T., Porter, D., Taylor, R. M. (1989). Analysis for knowledge-based systems: a practical guide to the KADS methodology. Ellis Horwood Ltd., Chichester.

10. Hoffman, R. R., Shabolt, N. R., Burton, A. M., Klein, G. (1995). Eliciting knowledge from experts: a methodological analysis. Organizational Behavior and Human Decision Processes, vol.62, №2, pp.129-158.

11. Holland, J. H. (1975). Adaptation in natural and artificial systems: an introductory analysis with application to biology, control, and artificial intelligence. University of Michigan.

12. Hunt, E. (1989). Cognitive science: definition, status and questions. Annual Review of Psychology, 40.

13. Kahneman, D., Slovic, P., Tversky, A. (1982). (Eds.) Judgment under uncertainty: heuristics and biases. Cambridge: Cambridge University Press.

14. Kihlstrom, J. F. (1987). The cognitive unconscious. Science, vol. 237, pp. 1445-1452.

15. Miller, R., Masarie, F. (1989). Use of the Quick Medical Reference (QMR) program as a tool for medical education. Methods of Information in Medicine, 28.

16. Mitchell, T. M. (1990). Becoming increasingly reactive (mobile robots). In: Proceedings of the 8th National Conference on Artificial Intelligence (AAAI-90), vol.2, pp 1051-1058, Boston, Massachusetts, MIT Press.

17. Newell, A., Simon, H. A. (1972). Human problem solving. Englewood Cliffs, NJ: Prentice-Hall Inc.

18. Patel, V. L., Ramoni, M. F. (1997). Cognitive models of directional inference in expert medical reasoning. In: Feltovich P., Ford K., Hoffman R. (Eds.) Expertise in Context: Human and Machine, AAAI Press, Menlo Park, CA.

19. Quinlan, J. R. (1993). C4.5: programs for machine learning. Morgan Kaufmann, San Mateo, CA.

20. Reber, A. S., Kassin, S. M., Lewis, S., Cantor, G. (1980). On the relationship between implicit and explicit models of learning a complex rule structure. Journal of Experimental Psychology: Human Lerning and Memory, 6, pp. 492502.

21. Roy, В., Bouyssou, D. (1993). Aide multicritere á la décision: méthodes et cas. Paris: Economica.

22. Russell, S. J., Norvig, P. (1995). Artificial intelligence: a modern approach. NJ: Prentice-Hall Inc.

23. Simon, H. A. (1981). Information-processing models of cognition. J. Amer. Soc. Information Science, 9.

24. Simon, H. A. (1993). The human mind: the symbolic level. Proceedings of the American Philosophical Society, v. 137, №4.

25. Slowinski, R., Zopounidis, C. (1995). Application of the rough set approach to evaluation of bankruptcy risk. International Journal of Intelligent Systems in Accounting, Finance and Management, 4, 1:27-l :41.

26. Turing, A. M. (1950). Computing machinery and intelligence. Mind, 59:433-460.

27. Warner, H. (1992). The ILIAD program: an expert computer diagnostic program. Journal of Medical Practice Management, 8(2).

28. Wielinga, B. J., Schreber, А. Т., Breuker, J.A. (1992). KADS: A modelling approach to knowledge engineering. Knowledge Acquisition, 4(1), pp. 5-53.

29. Алексеев, В. Б. (1976). О расшифровке некоторых классов монотонных многозначных функций. Журнал Вычислительной Математики и Математической Физики, т. 16, № 1.

30. Асанов, А. А., Борисенков, П. В., Ларичев, О.И., Нарыжный, Е.В., Ройзензон, Г. В. (2001). Метод ЦИКЛ многокритериальной классификации и его применение для решения проблемы анализа кредитного риска. Экономика и Математические Методы, том 37, вып. 2.

31. Асанов, А. А., Кочин, Д. В. (2002). Метод выявления решающих правил в задачах экспертной классификации, Искусственный Интеллект, №2.

32. Асанов, А. А., Ларичев, О. И. (1999). Влияние надежности человеческой информации на результаты применения методов принятия решений. Автоматика и Телемеханика, № 5.

33. Асанов, А. А., Ларичев, О. И., Нарыжный, Е. В., Страхов, С. И. (2000).

34. Экспертная система для диагностики лекарственных отравлений. Труды 7-й Национальной Конференции по Искусственному Интеллекту, том 2, Переславль-Залесский.

35. Асанов, А., Подлипский, О. (2001). Опыт построения большой базы экспертных знаний. В сб. Методы поддержки принятия решений, под ред. О.И. Ларичева, УРСС, Москва.

36. Аткинсон, Р. (1980). Человеческая память и процесс обучения. М.: Прогресс.

37. Гаврилова, Т. А., Хорошевский, В. Ф. (2000). Базы знаний интеллектуальных систем. СПб: Питер, 384 с.

38. Гэри, М., Джонсон, Д. (1982). Вычислительные машины и труднорешаемые задачи. М.: Мир.

39. Коробков, В.К. (1965). О монотонных функциях алгебры логики. В сб. «Проблемы кибернетики», вып. 13, М.: Наука.

40. Курейчик, В., М. (1998). Генетические алгоритмы. Таганрог: издательство ТРТУ, 185 с.

41. Ларичев, О. И. (1994), Структуры экспертных знаний в задачах классификации. Доклады Академии Наук, т. 336, № 6, с. 750-752.

42. Ларичев, О. И. (1995). Структуры экспертных знаний. Психологический журнал, №3.

43. Ларичев, О. И., Асанов, А. А. (2000). Метод ЦИКЛ порядковой классификации многокритериальных альтернатив. Доклады Академии Наук, том 375, № 5.

44. Ларичев, О. И., Асанов, А. А. (2001). Эффективность методов порядковой классификации многокритериальных альтернатив. Труды конгресса "Искусственный интеллект в XXI веке", том 1, Дивноморское.

45. Ларичев, О. И., Болотов, А. А. (1996). Система ДИФКЛАСС: построение полных и непротиворечивых баз экспертных знаний в задачах дифференциальной диагностики. НТИ, сер. 2, Информ. процессы и системы, М.: ВИНИТИ, № 9, с. 9-15.

46. Ларичев, О. И., Борисенков, П. В., Асанов, А. А., Нарыжный, Е. В., Ройзензон, Г. В. (2001). Разработка и внедрение автоматизированной системы оценки качества кредитов в коммерческом банке, Аудит и Финансовый Анализ, №1.

47. Ларичев, О. И., Мечитов, А. И., Мошкович, Е. М., Фуремс, Е. М. (1989). Выявление экспертных знаний. М.: Наука, 128 с.

48. Ларичев, О. И., Мошкович, Е. М. (1996). Качественные методы принятия решений. М.: Наука.

49. Ларичев, О. И., Мошкович, Е. М., Ребрик, С.Б. (1988). О возможностях человека в задачах классификации многокритериальных объектов. Системные исследования (ежегодник).

50. Ларичев, О. И., Нарыжный, Е. В. (1996). Компьютерное обучение экспертным знаниям в задачах классификации. НТИ, Серия 2, Информационные процессы и системы, М.: ВИНИТИ, №9.

51. Ларичев, О. И., Нарыжный, Е. В. (1998). Компьютерное обучение экспертным знаниям. Доклады Академии Наук, т. 362, № 3.

52. Миллер, Дж. (1964). Магическое число семь плюс-минус два. О некоторых пределах нашей способности перерабатывать информацию. В кн.: Инженерная психология, М.

53. Нарыжный Е. В. (1996). Построение оптимальной стратегии запросов к полной базе экспертных знаний. Научно-техническая информация, серия 2 -Информационные процессы и системы, №9.

54. Нарыжный Е. В. (1998). Построение интеллектуальных обучающих систем, основанных на экспертных знаниях. Диссертация на соискание ученой степени кандидата технических наук, М.: ИСА РАН.115

55. Осипов, Г. С. (1997). Приобретение знаний интеллектуальными системами. М.: Наука. Физматлит. 109 с.

56. Пархоменко, П. П (1970). Теория вопросников: обзор. Автоматика и Телемеханика, №4.

57. Саймон, Г. (1972). Науки об искусственном. Пер. с англ. М.: Мир, 147с.

58. Соколов, Н. А. (1982). Об оптимальной расшифровке монотонных функций алгебры логики. Журнал вычислительной математики и математической физики, т. 22, № 2, с. 449-461.

59. Соколов, Н. А. (1987). Оптимальная расшифровка монотонных булевых функций. Журнал вычислительной математики и математической физики, т. 27, № 12, с. 1878-1887.

60. Солсо, Р. Л. (1996). Когнитивная психология. Пер с англ. М.: Тривола, 600с.

61. Фуремс, Е. М., Гнеденко, Л. С. (1996). 8ТЕРСЬА88 система извлечения экспертных знаний и проведения экспертизы для решения диагностических задач. Научно-техническая информация, серия 2 -«Информационные процессы и системы», № 9.1. Список иллюстраций

62. Рис. 1-1. Формирование концептуальной модели в методологии КАЭБ.15

63. Рис. 2-1. Среднее число обращений к оракулу алгоритма^* 11, 0=2).50

64. Рис. 2-2. Среднее число обращений к оракулу алгоритма ЦИКЛ (N=11, 0=2). 51

65. Рис. 2-3. Среднее число обращений к оракулу алгоритма^* (N=4, 0=6).52

66. Рис. 2-4. Среднее число обращений к оракулу алгоритма ЦИКЛ (N=4, 0=6). .52

67. Рис. 2-5. Эффективность алгоритма Л* (Ы—11, 0=2).54

68. Рис. 2-6. Эффективность алгоритма ЦИКЛ (N=11, 0=2).54

69. Рис. 2-7. Эффективность алгоритма А* (N=5, 0=4).55

70. Рис. 2-8. Эффективность алгоритма ЦИКЛ (N=5, 0=4).55

71. Рис. 2-9. Эффективность алгоритма^* (N=4, 0=6).56

72. Рис. 2-10. Эффективность алгоритма ЦИКЛ (N=4, 0=6).56

73. Рис. 2-11. Средняя эффективность алгоритма^*.58

74. Рис. 2-12. Средняя эффективность алгоритма ЦИКЛ.58

75. Рис. 2-13. Метод иерархической свертки.61

76. Рис. 3-1. Эффективность алгоритмов Си Р (N=8, 0=2).87

77. Рис. 3-2. Эффективность алгоритмов С и Р (N=6, 0=3).87

78. Рис. 3-3. Эффективность алгоритмов С и Р {N=4, 0=4).88

79. Рис. 4-1. Оптимальное дерево решений.94

80. Рис. 4-2. Основные модули системы ЭСТЕР и их взаимодействия.95

81. Рис. 4-3. Экспертная система ЭСТЕР в режиме консультации.97

82. Рис. 4-4. Построение системы классификации банковских кредитов.105117

Похожие работы

Информатика, вычислительная техника и управление
05.13.00