автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Комплекс средств адаптации информационных систем поддержки принятия решений в области экономики

доктора технических наук
Романов, Виктор Петрович
город
Москва
год
2004
специальность ВАК РФ
05.25.05
Диссертация по документальной информации на тему «Комплекс средств адаптации информационных систем поддержки принятия решений в области экономики»

Автореферат диссертации по теме "Комплекс средств адаптации информационных систем поддержки принятия решений в области экономики"

На правах рукописи

Романов Виктор Петрович

КОМПЛЕКС СРЕДСТВ АДАПТАЦИИ ИНФОРМАЦИОННЫХ СИСТЕМ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ В ОБЛАСТИ ЭКОНОМИКИ

Специальность: 05.25.05 - «Информационные системы и процессы, правовое обеспечение информатики»

Автореферат диссертации на соискание ученой степени доктора технических наук

Москва - 2004

Работа выполнена в Российской Экономической Академии им. Г.В. Плеханова.

Официальные оппоненты:

Доктор технических наук, профессор Колин К.К.

Доктор технических наук Романов А.А.

Доктор технических наук Черненький В.М.

Ведущая организация:

Российский Научно-исследовательский институт информационных технологий и систем автоматизированного проектирования.

Защита диссертации состоится 19 мая 2004 г. в 14 ч. на заседании диссертационного совета Д 502.006.17 Российской академии государственной службы при Президенте Российской Федерации (2-ой корпус), 119606, Москва, проспект Вернадского, 84.

С диссертацией можно ознакомиться в библиотеке Российской академии государственной службы при Президенте Российской Федерации

Автореферат разослан «_»_2004 г.

Ученый секретарь

Диссертационного совета Д 502.006.17 к.ф-.м.н., доцент

Митин А.И.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность исследования. На современном этапе, когда законодательная база и условия функционирования экономических объектов постоянно изменяются, принятие решений в экономике в значительной мере связано с кризисными экстремальными проблемными ситуациями, которые являются нетипичными, редко повторяющимися, заранее не предсказуемыми событиями. Решение по таким ситуациям необходимо принимать в отсутствии исчерпывающей априорной информации и при жестких временных ограничениях.

Принятие эффективных решений по таким ситуациям невозможно без информационных систем (ИС) поддержки принятия решений. Однако существующие технологии проектирования (CASE-технологии) не пригодны для создания ИС, работающих в динамично меняющихся условиях, поскольку основываются на предположении, что структура и функции объекта стабильны и неизменны на период разработки и создания ИС, а разработчик располагает всей полнотой информации об объекте информатизации. Кроме того, длительность процесса разработки обычных систем превышает или соизмерима со "временем жизни" такой экстремальной проблемной ситуации. В результате принятие решений производится в условиях неполноты информации или неадекватности описания в ИС объектов предметной области их реальным свойствам и отношениям.

В данных условиях для лица, принимающего решения (ЛПР), могут оказаться неразличимыми позитивные и негативные состояния объекта, таким образом, может стать невозможным эффективное принятие решений. Необходимые для адекватного описания объектов предметной области такие компоненты ИС, как схемы баз данных, классификаторы, тезаурус, база знаний, кластеры, агрегаты данных, входящие в состав информационного (ИО), лингвистического (ЛО) и математического обеспечения (МО), имеют чрезвычайно высокую трудоемкость разработки.

Традиционные ИС, как правило, не имеют в своем составе элементов адаптации. Их адаптация по существу заключается в повторной разработке и смене версий. Необходимое для смены версии время (1-2 года) неприемлемо для информационной поддержки принятия решений в экстремальных проблемных ситуациях. В диссертации изложены научно обоснованные технические и технологические разработки, имеющие существенное значение для экономики страны в части разработки

адаптивных информационных систем поддержки решений в области экономики.

Целью данного исследования является разработка методологии, моделей, алгоритмов и программных средств автоматизации создания {синтеза) информационного и лингвистического обеспечения ИС поддержки принятия решений, обеспечивающих повышение производительности разработки и последующую адаптацию ИО и ЛО к изменениям предметной области, и на этой основе - повышение пертинентности и своевременности выдачи информации лицу, принимающему решение и в конечном итоге - повышение качества и эффективности решений в области экономики.

Для достижения указанной цели в работе поставлены следующие задачи:

1. На основе анализа процесса принятий решений выявить компоненты информационного обеспечения, автоматизация разработки и последующая адаптация которых обеспечивает сокращение сроков создания ИО и ЛО и определяет способность ИС описывать состояние объектов и отношений динамично изменяющейся предметной области с требуемым для принятия решений уровнем детальности.

2. Разработать математическую модель прогнозирования интенсивности потока запросов к распределенной базе данных ИС и метод адаптации (тьюнинга) БД к изменениям интенсивности потока запросов.

3. Разработать математическую модель, алгоритмы и программные средства автоматического формирования запросов к базе документальных данных на основе обратной связи как средства повышения комфортности естественно-языкового интерфейса и адаптации ИС к изменениям информационной потребности пользователей.

4. Разработать модели, алгоритмы и методы построения автоматического построения классификационной схемы полнотекстовой базы данных.

5. Разработать математическую модель, алгоритмы и программные средства синтеза псевдотезауруса как основы динамически формируемой базы знаний, отслеживающей изменения предметной области.

6. Разработать модели и программные средства формирования и адаптации концептуальной схемы базы данных к проблемной ситуации и составу приложений.

-57. Разработать модели и программные средства многокритериальной оценки и выбора вариантов решений на основе фактов, хранящихся в базе данных, и весовых оценок их значимости для гипотез.

Объектом исследования являются информационные системы поддержки решений, параметры и структура которых настраиваются на проблемную ситуацию за счет применения программных средств анализа данных об объекте информатизации. Предметом исследования являются:

- процессы и модели принятия решений в проблемных экономических ситуациях, основанные на современных информационных технологиях поддержки решений;

- технология автоматизированного создания компонент информационного и лингвистического обеспечения;

- базы реальных данных большого объема систем поддержки принятия решений, содержащие описания динамических проблемных ситуаций.

Научная новизна исследования заключается в следующем:

1. Впервые обосновано теоретическое положение, в соответствии с которым компоненты информационного и лингвистического обеспечения, определяющие выразительную . силу языка информационной системы, и как следствие, эффективность и качество решений, должны автоматически формироваться и настраиваться на проблемную ситуацию и стадию ее решения.

2. Впервые исследовано и обосновано включение в состав ИС в качестве постоянного компонента модуля адаптации, реализованного в виде комплекса математических моделей и алгоритмов самообучения, кластерного анализа, интеллектуального анализа данных и формирования базы знаний. В отличие от существующих методов проектирования ИС (структурного - SADT, быстрой разработки приложений - RAD), которые предусматривают главным образом автоматизацию документирования разработки ИС и требуют исчерпывающего априорного описания предметной области, предлагаемая методология реализует первоначальный синтез элементов концептуальной структуры ИС и последующую их подстройку к изменениям структуры и функций объекта. Это позволяет приступать к созданию ИС при отсутствии исчерпывающей информации о структуре и функциях объекта информатизации, а в последующем корректировать ее параметры.

Методы исследования. Основные результаты работы получены на базах реальных данных большого объема систем "Маяк" (задачи "Справки", "Архив", "Письма"), МИД РФ (задачи "Двусторонний договор" и "Многосторонний договор" подсистемы Правового Управления), ГАС "Выборы" (функциональный комплекс задач "Право"), в разработке которых принимал участие автор, с использованием методов математической статистики, исследования операций, логики предикатов, теории решеток.

Достоверность полученных результатов проверялась в процессе приемо-сдаточных испытаний и последующей эксплуатации информационных систем, разработанных с участием автора и использовавших предложенные в настоящей работе модели и методы. Адекватность полученных с применением предлагаемых моделей и программных средств результатов реальным условиям функционирования системы оценивалась путем их содержательной интерпретации пользователями.

Практическая значимость результатов работы определяется тем, что реализован и внедрен комплекс алгоритмов и программ в виде специального программного обеспечения (СПО), который прошел испытания и показал эффект в виде повышения производительности разработки компонент ИО и ЛО по оценкам, полученным в ходе испытаний в 1,8 раза, и увеличении скорости итерационного поиска необходимой для принятия решений информации на больших (свыше 50 тыс. записей) массивах в 2 раза. На основе предлагаемых моделей и методов был разработан и внедрен комплекс средств адаптации элементов концептуальной структуры информационных систем принятия решений в области экономики, реализующий следующие функции:

- прогнозирование интенсивности потока запросов и адаптацию базы данных к ее изменению;

- естественно-языковый интерфейс с базой данных, включая автоматическое уточнение запроса на основе обратной связи, автоматическое формирование псевдотезауруса и его применение в качестве навигатора при осуществлении направленного поиска в динамически формируемой базе документов для вновь возникшей проблемной ситуации;

-7- моделирование обработки информации для принятия решений с использованием Байесовских деревьев вывода, теории уверенности Шортлифа, Бьюкенена, Демпстера-Шейфера;

- синтез и последующую адаптацию логической структуры базы данных за счет повторного построения матрицы инциденций атрибутов и применения алгоритмов оптимального разрезания представляющего ее графа.

Внедрение результатов.

Предлагаемый в работе комплекс моделей, методов и программных средств внедрены и прошли апробацию в процессе разработки и эксплуатации информационных систем с элементами искусственного интеллекта, в создании которых принимал участие автор. К числу этих систем относятся Государственная автоматизированная система «Выборы»

- функциональный комплекс задач "Право", АИС "Налог", Подсистема Правового управления Информационной Системы МИД РФ, ИС "Маяк", Сеть автоматизированных центров Научно-технической информации (САЦ НТИ) и ряд других систем общегосударственного уровня. Ряд методов и систем внедрены в учебный процесс в МИРЭА и в РЭА им. Г.В. Плеханова в виде комплекса лабораторных работ и заданий по дипломным проектам и курсовым работам.

Естественно-языковый интерфейс, включая поиск с использованием алгоритмов обратной связи по релевантности, автоматического формирования базы знаний (псевдотезауруса), создание и использование навигатора нашли применение при создании ИС поддержки принятия решений "Маяк", ИС МИД РФ, АИС ГАС ВЫБОРЫ.

Результаты работы были использованы также при постановке курсов лекций и практических работ по дисциплинам "Моделирование информационных систем", "Банки и базы данных и знаний" в МИРЭА, курсов лекций и лабораторных работ по дисциплинам "Информационные системы", "Проектирование информационных систем", "Математические основы информационных систем " в РЭА им. Г.В. Плеханова, отражены в пяти учебных пособиях, одно из которых находится в печати в издательстве "Экзамен". Кроме того, одно из этих учебных пособий, а также учебный план по дисциплине "Информационные системы в экономике" и учебный курс "Интеллектуальные информационные системы" выполнены по гранту Международного банка реконструкции и развития в РЭА им. Г.В. Плеханова.

Теоретическая ценность. Основные теоретические результаты работы, включая модели, алгоритмы и методы кластерного анализа, интеллектуального анализа данных и дискретной оптимизации, представлены в опубликованных по теме диссертации пяти учебных пособиях: "Теоретические основы информатики" (1993), "Теоретические основы информатики. Информационные структуры и фактографический поиск информации" (1996), "Интеллектуальные информационные системы в экономике" (2003), "Основы информатики "(в соавторстве) (2003), "Проектирование информационных систем" (в соавторстве) (2004) (в печати).

Апробация работы. Результаты диссертации докладывались на следующих семинарах, конференциях и симпозиумах:

1. 5-ая Международная конференция "Информационное общество Информационные технологии. Телекоммуникации" "НТИ-2000". Москва, ВИНИТИ, 22-24 ноября 2000 г.

2. Пятнадцатые Международные Плехановские чтения: Москва, 23-25 апреля 2002 г.

3. Координационное общественное научно-методическое объединение-совет Минобразования РФ по специальностям информатика, прикладная информатика, информационные системы (по областям). КООИНФ: Годичная сессия КОСИНФО, Москва, 17 мая 2001г. Минобразования РФ.

4. XII Международная конференция "Информационные технологии в образовании" ("ИТО-2002" Москва, 4-8 ноября 2002 г.

5. 7-ая Международная конференция "Информационное общество Информационные технологии. Телекоммуникации" "НТИ-2002". Москва, ВИНИТИ, 14-16 октября 2002 г.

6. Международный конгресс конференций "Информационные технологии в образовании". ШП Международная конференция "Информационные технологии в образовании", Москва, УДН, 16-20 ноября 2003 г.

Публикации, отчеты, диссертационные работы аспирантов. По теме диссертации опубликовано пять учебных пособий, 76 научных работ. Кроме того, результаты исследования отражены в научных отчетах, технических заданиях и технических проектах, разработанных в НИИ "Восход", а также в технических заданиях и отчетах по темам по фантам Международного банка реконструкции и развития в РЭА им. Г.В. Плеханова. Данное исследование частично базируется на результатах

кандидатских диссертаций аспирантов Карасева С.А., Житкова Г.Н., Терещенко С.С., Королевой Г.А., руководство которыми осуществлял авгор данной диссертационной работы.

Структура и объем работы. Работа состоит из введения, четырех глав, заключения, пяти приложений и содержит 303 страниц, 37 рисунков и 9 таблиц.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность работы и поясняется, что в современных условиях все большая доля проблемных ситуаций носит экстремальный или чрезвычайный характер: для них характерны нестандартность, непредсказуемость и короткий период времени их развития и разрешения. Качество управления, оцениваемое при помощи рисков выбора вариантов решений в проблемных ситуациях, зависит от выразительной силы языка, используемого для описания проблемной ситуации, то есть таких элементов информационного обеспечения, как логическая структура базы данных, язык описания данных, система классификации, информационно-поисковый тезаурус, средства интерфейса. Между тем, современные технологии реинжиниринга бизнес-процессов объекта информатизации и разработки компонент информационного и лингвистического обеспечения даже при применении СЛ8Е-технологий требуют затрат времени, соизмеримых со временем жизни таких экстремальных проблемных ситуаций. Отсюда вытекает актуальность крупной научно-технической проблемы сокращения сроков создания элементов концептуальной структуры ИС за счет разработки методологии их синтеза и введения компоненты адаптации как составной части структуры ИС.

Глава. 1. Анализ современных технологий разработки и реализации решений и информационных систем в области экономики 1.1. Технология разработки и реализации управленческого решения

В основе деятельности пользователя системы подготовки принятия решений (СППР) лежит процесс обнаружения, описания и разрешения проблемных ситуаций (ПС). Процесс принятия решения состоит из ряда упорядоченных определенным образом этапов (процедур), содержание которых описывается в терминах цели, проблемы, проблемной ситуации, альтернативы и самого решения как результата выбора альтернативы (варианта действий).

Под целью мы понимаем ожидаемое и желаемое состояние системы, в которое она должна перейти под действием управляющих воздействий и внутренних законов движения объекта. Проблемная ситуация -содержательное описание проблемы совместно с комплексом условий, факторов и обстоятельств, вызвавших ее возникновение. Внутренние факторы описывают состояние собственной среды предприятия как системы (экономической, организационной, материальной и т.д.). Внешние неконтролируемые факторы отражают состояние среды, в которой функционирует предприятие. Данные факторы внешней среды не могут регулироваться (а нередко, и прогнозироваться) организацией, но именно они, как правило, вызывают изменение стоящих перед ней целей. Внешние контролируемые факторы отражают непосредственное окружение объекта, с которым у него существует тесное прямое или косвенное взаимодействие, - это поставщики, потребители, посредники, конкуренты. Анализ проблемной ситуации - совместное рассмотрение проблемы в контексте вызвавших ее факторов. Решение является реакцией на возникшую проблему, оно есть идентификатор программы или плана разрешения проблемной ситуации. В зависимости от рассматриваемого вопроса и стадии его решения, ЛПР находится в различных состояниях: интерпретации, структурировании и диагностике, классификации, проектировании и выборе решения. Соответственно этим состояниям должны строиться и адаптироваться к ним элементы концептуальной структуры информационной системы и сам процесс информационной поддержки решений.

1.2. Основные классы информационных систем в сфере экономики

Системы поддержки принятия решений предъявляют к информационному обеспечению следующие требования:

- направленность на решение слабоструктурированных, плохо формализуемых задач (реализация мягких моделей);

- способность к развитию системы и извлечению знаний из накопленного опыта конкретных ситуаций;

- возможность получения и использования информации, которая явно не хранится, а выводится из имеющихся в базе данных;

- развитые коммуникативные способности: возможность обработки произвольных запросов в диалоге на языке максимально приближенном к естественному (система естественно-языкового интерфейса - СЕЯИ);

- способность к обобщениям и выводам по аналогии.

-11В современных информационных системах (ИС) различного класса не в полной мере учитываются принципиальные отличия сферы принятия решений от других сфер, что не позволяет эффективно использовать информационные системы в ряде важных случаев. Такими принципиальными отличиями являются:

1. Пользователями системы являются руководители высокого уровня, работающие в условиях дефицита времени. Высокой стоимости риска ошибочного решения, предъявляющие повышенные требования к комфортности интерфейса с ИС.

2. Проблемные ситуации (ПС) являются уникальными, редко повторяющимися, заранее непредсказуемыми событиями вследствие чего к соответствующим ИС не применима традиционная технология структурного или RAD- проектирования.

3. Период времени от возникновения до разрешения проблемной ситуации и соответственно формирования базы документов и данных, их обработки и анализа ограничен достаточно жестко;

4. База данных, ее состав и структура изменяются существенным образом по мере поступления новых данных и документов.

Отечественными и зарубежными авторами рассматривались вопросы автоматизированного проектирования информационных систем. Пионерская работа Модина А.А., Зингера И.С., Коротяева М.Ф. посвящена исследованию и анализу потоков информации на промышленных предприятиях. В работах Аскерова Т.М. предлагаются подходы к построению информационной модели экономического объекта. Мамиконов А.Г., Цвиркун А.Д., Кульба В.В. подробно анализируют вопросы автоматизации проектирования АСУ. Модели синтеза оптимальных логических структур локальных баз данных рассматриваются в книге "Теоретические основы проектирования оптимальных структур распределенных баз данных" авторов Кульба В.В., Ковалевский С.С., Косяченко С.А., Сиротюк В.О. Шемакиным Ю.И. рассматривались вопросы автоматизации создания тезауруса и других компонент информационного обеспечения.

Проблемы оптимизации плана исполнения запросов к реляционной базе данных освещены Мейером Д. Ученые Тиори Т., Фрай Дж., Хаббард Дж. рассматривают вопросы автоматизированного проектирования баз данных и оптимизации их физической структуры. Тем не менее, необходимо отметить, что предлагаемые этими авторами модели и методы

ориентированы на проведение предварительных расчетов на стадии проектирования системы, кроме того, основываются на предположении о наличии исчерпывающего описания автоматизируемой системы. Они не образуют комплекса программных средств и моделей, непрерывно производящих сбор и обработку информации об условиях функционирования системы и анализ интенсивности потоков заданий и запросов по различным тематическим направлениям, а также использования полученных данных для коррекции первоначально принятых проектных решений.

Современные технологии структурного проектирования (SADT), так же как и технология быстрой разработки приложений (RAD), не обеспечивают автоматизации разработки элементов информационного (ИО) и лингвистического (ЛО) обеспечения, составляющих концептуальную структуру ИС, и по существу являются технологиями документирования. Традиционные ИС, как правило, не имеют в своем составе элементов адаптации, таким образом, их адаптация заключается к повторной разработке и смене версий.

Вместе с тем, такие компоненты концептуальной структуры, как схема базы данных, классификаторы, тезаурус, база знаний, кластеры, агрегаты данных, включаемые обычно в состав ИО и ЛО, имеют чрезвычайно высокую трудоемкость разработки.

Эти компоненты информационной системы должны автоматически адаптироваться и видоизменяться, по мере того как менеджер переходит от одной проблемы к другой или от одной фазы решения ПС к другой. К сожалению, многие методы проектирования и построения современных информационных систем не обеспечивают эффективных средств автоматизации создания их компонент.

1.3. Место и назначение комплекса средств адаптации в информационной системе принятия решений

Из обзора существующих систем сделан вывод, что они имеют жесткую структуру, привязанную к жизненному циклу изделия. Поскольку цикл перепроектирования достаточно длительный (1-2 года), а изменения внешней среды (состав пользователей, состав приложений, предметная область) могут быть достаточно быстрыми, то в течение значительного времени будет иметь место несоответствие характеристик системы изменившимся условиям ее функционирования. В связи с этим возникает проблема создания комплекса средств адаптации элементов

концептуальной структуры ИС и интеграции его в схему традиционной ИС.

На рис. 1.1 представлена обобщенная схема информационной системы, содержащая предлагаемый комплекс средств адаптации (выделено темным). Первичные документы пользователя при помощи экранных форм ввода, разработанных с применением средств разработки приложений, преобразуются в записи, поступающие в базу данных. При этом используется навигатор по базе данных, функционирующий на основе псевдотезауруса и классификаторы.

Поток запросов формируется с использованием естественно-языкового интерфейса и в режиме итерационного поиска с использованием навигатора, псевдотезауруса и классификаторов. Через средства информационного поиска в виде индексов, В-деревьев и реляционного механизма базы данных осуществляется поиск документов в БД и выдача их в аналитические модели для оценки риска и выбора оптимальных вариантов решений.

Хранилище данных используется вместе с технологией OLAP для свертывания и развертывания данных по измерениям гиперкуба и выдаче агрегированной информации в аналитические модели для принятия решений. В случае необходимости следует обращение во внешние базы данных для ввода данных о внешних контролируемых и неконтролируемых факторах или для поиска информации во внешних базах. База данных является адаптивной; ее структура, и размещение информации настраиваются на предметную область и интенсивность потока запросов. С помощью средств информационного поиска, включающих поисковые индексы, будет найдена соответствующая запись базы данных. Если запись, соответствующая запросу, не обнаружена, поиск может осуществляться и во внешних БД. Далее формируются отчёты о проделанной работе, и поток отчётов направляется на АРМ пользователя. Как видно из рисунка, предлагаемый комплекс средств адаптации элементов концептуальной структуры ИС является функционально полным, поскольку он охватывает все процессы функционирования ИС.

Анализ процесса принятия решений с одной стороны, и структуры современных информационных систем поддержки принятия решений с другой стороны позволили выделить основные стадии подготовки решения: интерпретацию, структурирование и диагностику.

эксперт

Ж Сред-

За- ства

про- поиска

сы ^ ин-

на фор-

поиас мации

Формирование псевдотезауруса

Обратная связь по релевантности

Рис. 1.1. Функциональная структура информационной системы

классификацию, проектирование и выбор решения. Соответственно этому для каждой стадии формулируются проблемы, подлежащие исследованию в данной диссертации: оптимизация хранения, формирование тезауруса и схемы базы данных, кластеризация записей базы данных, анализ и выбор моделей оценки и выбора решений, контроль исполнения решения. Глава 2. Модели и алгоритмы адаптации информационных систем принятия решений в экономике 2.1. Обобщенная модель информационной системы В данной работе принято определение информационной системы, данное Скоттом Д. На интуитивном уровне информационная система представляет собою описание моделируемой предметной области в виде совокупности предложений об отдельных различных объектах предметной области. В свою очередь объект предметной области может быть задан как множество истинных на нем предложений. Пусть D - фиксированное множество, элементы которого называются элементами данных или утверждениями. Элементы D можно называть также информационными объектами или конечными объектами данных. Одни элементы множества D могут быть менее информативными, чем другие. Пусть А обозначает специальный элемент из D как информационный объект с наименьшей информацией. Пусть Con (D) или просто Con обозначает выделенное множество конечных подмножеств D. Элементы из Con трактуются как непротиворечивые множества информационных объектов или совместные множества утверждений. Информационной системой называется рефлексивное и транзитивное бинарное отношение |- с Con(D) x D, удовлетворяющее свойствам:

— Con содержит все одноэлементные множества;

— Con как множество множеств замкнуто относительно подмножеств;

— совместность множества данных сохранится, если добавить к нему любое его следствие;

— наименьшее по информативности данное следует из любого совместного множества.

Не любая комбинация информационных объектов описывает возможный элемент предметной области, вследствие чего возникает необходимость понятия непротиворечивости. В информационной системе содержатся утверждения об отдельных различимых элементах или объектах предметной области. Различимость элементов системой означает, что совокупность утверждений, известных ИС о конкретном

объекте, полностью его определяет. Если принять этот принцип, то состояния можно отождествить с множеством истинных на них предложений; формально можно утверждать, что X ={ х еОд I х истинно на X }. Это множество состояний называется област^А^оторая определяется данной системой и I А I является полной решеткой. Итак, для простоты в качестве множества состояний можно взять просто множество элементов данных или информационных объектов. Состояние

экономического объекта может быть описано как конечное множество формул языка исчисления предикатов без переменных, то есть в виде конъюнкции литералов, переменные которых интерпретируются экзистенциально. Мы будем представлять такие конъюнкции как конечное множество литералов.

Неформально можно сказать, что множество всех истинных на некотором возможном состоянии предложений должно быть 1) непротиворечиво и 2) замкнуто относительно следования (т.е. дедуктивно замкнуто). Множество предложений, замкнутое относительно выводимости, является теорией: Понятие

теории можно ввести, используя операцию замыкания со свойствами:

1. рефлексивность,

2. идемпотентность,

3. монотонность.

Для всякого предложения существует такое конечное

множество предложений Утверждают, что теория Т1

дефинициально эквивалентна теории Т2 тогда и только тогда, когда существуют определения DT2 терминов теории Т2 в терминах теории Т1 и определения БТ1 терминов теории Т1 в терминах теории Т2 таких, что Сп (Т| и ОТг) эквивалентна Сп (Тг и Теория 8 «слабее» некоторой

теории Т, если S эквивалентна собственной подтеории Т. Для нас понятие "слабая" теория является синонимом недостаточной различительной силы языка ИС. Структуризация предметной области может быть выполнена путем построения решетки концептов, при этом должна быть обеспечена различимость исходной и целевой ситуаций в процессе подготовки и реализации решения.

-172.2. Модель адаптации к интенсивности потока обращений к базе данных в сети

Характеристики оперативности поиска и выдачи информации являются одними из важнейших для информационных систем. Проблема заключается в том, чтобы прогнозировать частоту обращения к данным и сохранять в оперативной памяти часто запрашиваемые данные, переводя редко запрашиваемые данные в менее быстродействующую память.

Задача оптимального размещения массивов информации может быть в общем виде сформулирована следующим образом. Необходимо выбрать типы и размеры устройств хранения так, чтобы среднее время доступа к единице хранимой информации было минимальным, а стоимость всей системы хранения не превышала заданной. Обозначим через С максимально допустимую стоимость всей системы хранения информации. Информацию, подлежащую хранению, разделим на массивы в зависимости от частоты спроса и для ее описания введем следующие обозначения: п- количество массивов информации;

1М,- количество единиц информации в /-ом массиве (1 = 1,2,...,п); Р, — вероятность обращения к /-ому массиву, £ Р, = 1.

Систему хранения информации можно считать состоящей из т устройств или уровней памяти. Для описания каждого уровня памяти примем следующие обозначения:

М1- максимальная допустимая емкость]-го уровня (/=/,2.....т);

— стоимость хранения единиц информации любого массива в уровне;

7}- время выборки единицы информации из_/-го уровня;

количество единиц информации массива, хранящихся в

уровне.

Постановка задачи: требуется разместить п массивов информации по т уровням памяти таким образом, чтобы при наличии определенных условий минимизировалось среднее время выборки единицы информации:

Для анализа процесса генерации запросов рассмотрим сеть состоящую из множества источников документов, центров распределения информации, информационных систем. Процесс поступления запросов в

центр рассматривается как случайный, реализацией которого является

функция, \Х,.1еТ} ставящая в соответствие каждому моменту

времени /еГ одно из возможных значений X, - числа запросов. Первичные запросы проистекают непосредственно из задач, поставленных перед пользователем, они инициируются пользователем. Вторичные запросы инициируются в результате функционирования информационной системы и оповещения пользователей с помощью информационных систем. Запросы /-го поколения вообще могут порождаться в результате ознакомления пользователя с информацией, выданной ему на ¡-1 -ом шаге. В работе получено приближенное выражение для математического ожидания числа запросов на интервале времени

I -/120л

для (Л, Ф Л2р0)

™7|Я|Г е л,'(р0 + р,/!,/) для Л, - Л2р

Р о

Ми т>

0,9

ад

0,7016 0,5 04 013 02 СИ

I

0 I-

/7оД=а7;Л,=02Я Ад= 0.8Ц=02Я

Я,=02;/!|=0.5Л

О 10 20304050 60 70 80 90 100110120130

Рис. 2.1. Теоретическая функция распределения числа запросов по времени

Приравняв производную от полученного выражения по I при т=сопз1, найдем положение экстремума 1|тах и 12тах для каждого их двух случаев. Анализ условий положительности 1|т11Х и 12тах приводит к следующему результату, общему для обоих случаев. Если то распределение

имеет максимум. Если то распределение не имеет максимума и

убывает с самого начала. В случае Я/= Х2Р0, при распределение

убывает монотонно; при р„<р, распределение имеет максимум (рис. 2.1). Результаты экспериментов по моделированию изменения потока запросов во времени и адаптации базы данных представлены в Главе 4.

2.3. Алгебраические модели поиска, поиск с обратной связью по релевантности

Описывается модель, предложенная автором и реализованная в виде совокупности программных модулей, которые допускают объединение в полноценную систему полнотекстового поиска, работающую совместно с СУБД. Вначале рассмотрим модель поиска с обратной связью по релевантности. Постановку задачи поиска с обратной связью по

релевантности можно рассматривать как итерационный метод решения задачи наименьших квадратов. Искомый вектор запроса может быть получен из

нормальной системы

А' (/>- Ах )

ЛеК""", ЬбГ, т>п

уравнений, в которой А будем интерпретировать как базу данных, х -неизвестный вектор запроса, Ъ - оценку со стороны пользователя подмножества записей. Эта система л всегда имеет решение, матрица А' А неотрицательно г определена. Качество работы системы по выдаваемым из базы данных записям, будем оценивать с помощью минимального расстояния:

г=Л-Л* 1

где х - оптимальное решение нормальной системы

уравнений. Пользуясь соотношением <1 = А1 Ь и учитывая введенные обозначения, нормальную систему запишем в виде: Рх-<1 = 0. Поиск в документальной базе данных будем рассматривать как разновидность метода релаксаций:

Анализ алгоритма произведем,

вводя обозначения: 1-аР-И , используя соотношение (/-{/)

тт г =

1Й-/1* 2, А1 {Ь - Ах ) = О,

Рис. 2.2. Схема алгоритма поиска с обратной связью порелевантности

С учетом введенных обо^иячр.тгай ттптдгам-

хы л-си! + хк{1-аР) или хк,.)=ас1 + их1.

Для оптимального решения справедливо х = и + 1!х, что позволяет записать:

к = О

Схема алгоритма поиска с обратной связью по релевантности приведена на рис. 2.2.

-212.4. Применение алгоритмов типа АВО (алгоритм вычисления оценок) для построения итерационных алгоритмов

Класс АВО исходит из того, что неизвестно, какие сочетания дескрипторов наиболее информативны, поэтому критерий соответствия запроса и документа вычисляется при сопоставлении всех возможных (или определенных сочетаний) дескрипторов. Тестом таблицы Ат называется совокупность столбцов t б 0,, таких, что после удаления из Ап всех столбцов за исключением тех, которые принадлежат блоку в,, в полученной таблице Л„(0,) все пары строк, принадлежащих разным классам, различны. Тест tq называется тупиковым, если никакая из его частей не является тестом. В АВО рассматриваются системы опорных множеств, составленные из всех подмножеств множества дескрипторов фиксированной длины, либо из всех непустых подмножеств множества дескрипторов. В методе поиска с обратной связью по релевантности, в зависимости от результата сравнения меры релевантности термина с одним из нескольких порогов, термины помещаются в одну из нескольких категорий. После этого формируется новый булевский запрос путем формирования дизъюнкции терминов в каждой категории либо по одному, если они имеют самую высокую релевантность (частоту среди релевантных документов), либо посредством объединения терминов в пары знаком конъюнкции, если они попадают в категорию менее частых, либо, наконец, в виде троек, если термины попадают в категорию еще менее частых.

2.5. Модель поиска с учетом зависимости терминов и позиции их в тексте

Пусть мы имеем запись фиксированной длины, так что в ней на М позициях могут быть расставлены термины, которые соответствуют L возможным основам словаря. Пусть истинными терминами,

содержащимися в оригинале документа, будут x¡.....Х\/. Пусть zi,...,zm- веса

терминов в запросе, присвоенные им первоначально индексаторами, а затем корректируемые автоматически в процессе итерационного уточнения запроса. Пусть Q — реальная оценка релевантности документов пользователем, Q = Qu документ не релевантен («нет»)=д^кумент релевантен («да»). Минимизируемый функционал запишем в виде: min Е lV(z.x)P(z/x,Q) P(x,Q),

где P(z/x,Q) =P(zi,...,Zh/xi,—,Xu,Q) - вероятность приписывания терминам запроса значений zi,...,z\f при условии, что реально в поисковых образах документов (ПОДах) содержатся термины х/,...,хщ; IV(z,x) = W(zi,...,zsi,xi,...,xst) — потери, вызванные присвоением терминам запроса весов 2/,...,Zy. Положим для простоты P(Zi.....2(Д/.....X\t,Q) =Y\P(z/Xi),

i—l,2,...,M, т.е. фактически появляющийся в ПОД термин зависит только от соответствующего истинного. Предположим также, что вероятности истинных терминов связаны обобщенной Марковской цепью P(x/xi,...,xj.

где множество индексов определяет направленное дерево зависимостей. Тогда минимизируемый функционал приобретает вид:

min у W(z,.....zsllt,.....tsl) ПP(z/xhQ)P(x/xjlu,Q).

г *

Таким образом, процедура решения выбирает в процессе итерационного

поиска значения весов Z/.....г.», которые удовлетворяют условиям

оптимальности для всех (zi.....z^) е Lsl. Выбор значений весов терминов,

удовлетворяющих условиям минимальных потерь, не может быть теперь сделан независимо. Веса дескрипторов запроса теперь должны выбираться с учетом позиции слов в тексте. Оптимальная формула запроса в этом случае строится с использованием метода динамического программирования или с использованием алгоритма кратчайшего пути на сети дескрипторов, сформированной предварительно для выборки документов.

2.6. Модель и алгоритмы формирования тезауруса как базы знаний

В работе увязаны процессы создания тезауруса (ИПТ) с процессом поиска, оценкой его полноты и точности. Используя оценку «полезности» терминов, имеется возможность установить, каких именно дескрипторов, отношений или словосочетаний не хватает в ИПТ для того, чтобы улучшить качество поиска. В работе также излагаются результаты автоматизированного формирования статистически устойчивых сочетаний терминов (псевдотезауруса) на основе анализа программными средствами записей базы данных и инвертированных списков, относящихся к ограниченной совокупности документов, которые отобраны пользователем при решении проблемной ситуации.

При практической работе с ковариационной матрицей использовалось то, что она является разреженной, кроме того, к ней применялось разложение на множители Холесского. Если С - п х п симметричная и

положительно определенная матрица, то существует и единственно ее разложение на треугольные множители С=И,т, где Ь - нижняя треугольная матрица Холесского с положительными диагональными элементами. Процесс вычислений, связанный с поиском запроса, оптимальным образом выражающего информационную потребность пользователя в виде следующих шагов:

- априорное построение матрицы для подмножества записей базы данных;

- разложение на треугольные множители Холесского;

- решение треугольных систем (обращение треугольное матрицы) у = ¿гг

И /. V = .

Этот процесс, как показано, несколько упрощается в случае, если помеченный граф матрицы является монотонно упорядоченным деревом, а элементы матрицы — коэффициентами ковариации многомерного случайного процесса.

2.7. Поиск текстовой информации по ключевым словам, основанный на применении систолических массивов

Реализация алгоритмов обратной связи по релевантности с учетом взаимозависимости дескрипторов в фонде требует выполнения большого объема вычислений. Алгоритм итерационного поиска, использующий построение максимального покрывающего дерева, по логике работы и вычислительной сложности эквивалентен алгоритму обращения матрицы и имеет сложность порядка З/т-Зя + 1. В работе рассматриваются вопросы организации параллельных (конвейерных) вычислений при применении алгоритмов итерационного поиска.

2.8. Формирование концептуальной структуры базы данных

Формирование логической структуры базы данных производится посредством алгоритма, состоящего из нескольких шагов. Шаги эти следующие. Для данной совокупности атрибутов формируем матрицу С, в которой обозначено использование или частота появления атрибутов в приложениях и/или запросах. Затем формируем матрицу >К=ССГ, в которой для каждой пары атрибутов указана частота их совместной встречаемости. Рассмотрим граф, соответствующий данной матрице связей атрибутов 6'=(Г,Л'), где Г- множество ребер, Х - множество вершин. Вершины графа соответствуют атрибутам, каждая вершина имеет вес, соответствующий длине атрибута, ребро имеет вес, отражающий частоту совместного использования атрибутов в приложениях. Рассмотрим

проблемы разбиения атрибутов на группы таким образом, чтобы сумма весов вершин не превосходила данного ограничения, а связность показателей внутри групп была максимальной. Пусть разбиение А графа

О определяется как набор к подграфов /¡,/ = 1,2,...,Л, таких, что

I-1

= Последнее условие не обязательное, так как возможно дублирование показателей, может быть условие вида

заданная величина. Определим степень сцепления разбиения А как сумму весов ребер внутри всех г р у = е к т или стоимость

I .€/,

разбиен Я = ££с„5деляется как сумма весов разрезаемых вершин.

Оптимальное разбиение ,1,„„ ={Я|,/Г,.....} - такое, в котором каждая группа

удовлетворяет ограничению по суммарному весу вершин в пределах групп и, кроме того, либо достигается минимум дефекта разбиения, либо максимум связности групп:

Для разбиения дерева на поддеревья используется алгоритм динамического программирования. Полученные данные используются для распределения данных приложений по базам данных и таблицам. Для этого используются алгоритмы разбиения дерева или графа на подграфы (поддеревья) сумма весов ребер которых (индекс связности) максимальна, а сумма весов вершин (объем базы данных) не превышает заданного ограничения. На рис. 2.3 показаны экранные формы, иллюстрирующие работу программы.

Далее для неключевых атрибутов, которые прямо и косвенно функционально зависимы от ключевых, мы разрываем их прямые функциональные зависимости от ключевых атрибутов. Алгоритмически это реализуется следующим образом:

-251. Сформируем матрицу М, где 1 и 0 обозначают те элементы в матрице ', для которых например, атрибуты, встречающиеся хотя бы

один раз в приложении (задаче).

Рис. 2.3. Работа программы разбиения графа

-262. Построим ориентированный граф О, где пары атрибутов, для которых в матрице М проставлены 1, соединены ориентированным ребром. Таким образом, 1 в поле матрицы Л/(/,7) указывает на то, что существует путь от узла I к узлу I.

3. Следующая операция должна исключить транзитивные зависимости неключевых атрибутов от ключевых. В результате такого исключения ожидается, что строки матрицы М будут указывать на атрибуты, входящие в состав одного отношения, которое отвечает третьей нормальной форме. Из множества атрибутов, представленных в матрице М, исключим те сочетания атрибутов, в которых ключевые атрибуты являются транзитивно или непосредственно зависимыми от неключевых.

Возводя матрицу М в квадрат, получим матрицу и выявим

сочетания атрибутов, которые зависят друг от друга через третий атрибут. Единица в поле результирующей матрицы Q(I.J) указывает на то, что узел / достижим из I через другой узел. Для того чтобы выявить неключевые атрибуты, связанные либо прямо, либо косвенно (или атрибуты, связанные как прямо, так и косвенно) мы логически поэлементно умножаем матрицы Л/ и Q , либо логически поэлементно складываем: Т/ = М лQ, 7% = Л/ .

Таким образом мы продолжаем до тех пор, пока не получим нулевую матрицу , что будет означать разрыв всех прямых или транзитивных зависимостей неключевых атрибутов от ключевых. В конечном итоге полученная матрица М, рассматриваемая построчно, представляет собою перечень таблиц схемы базы данных, находящихся в третьей нормальной форме. Рассмотрев строки и исключив из них те, состав атрибутов которых является подмножеством состава атрибутов других строк либо является их перестановкой, получаем схему базы данных.

Полученные результаты определяют схему базы данных, первичные ключи и связи таблиц. Приведенный алгоритм дает возможность динамически формировать базу данных по мере развития ситуации. Это означает, что будут появляться дополнительные логические структуры данных, и важность существующих структур будет изменяться. В этих условиях алгоритм, подобный описанному выше, позволит формировать логические структуры из описания реальности базы данных. 2.9. Модель системы естественно-языкового интерфейса

В разделе рассматривается модель системы, реализованной средствами логического языка программирования ПРОЛОГ. База данных

состоит из основных предикатов и совокупности правильно построенных формул (ППФ), которые могут быть получены из них в силу описанных правил. Предположим, что семантика базы данных заключается в том, чтобы определить, кто должен поставлять данный тип изделия для данной стройки и какова сумма штрафа, ожидаемого с поставщика в случае несвоевременной поставки изделия.

Пусть примерами предикатов в системе будут: Р/ (х//;, х/12, х//д) -поставляет (КР, К1, К8):Р? (х,Н\, х/14, х//^ - местонахождение поставщика (КР.МР, УР);Р} (х/О. х/г* х7/ь) - местонахождение стройки (КБ, Щ У8);Р4 ( хт/Ь, Х(/гл) - стоимость изделия (К1, 1М);Р5 (х/13, х/14, хуу - договор о поставках (КБ, ОБ, К1);Р6 (х,/''/. хА. хц/1ц) - размер штрафа (КР, БР, М);Р7 (х,3/1,3, Х1:А12) - тариф (7Т, 5К).

Система с подобным набором предикатов представляет упрощенную модель, способную хранить и выдавать информацию относительно правовых вопросов, связанных с договором по поставкам оборудования, ведению работ по реконструкции и строительству предприятий и санкциями за нарушение сроков. База знаний модели включает продукции, позволяющие определить данные о предприятии-поставщике, ответственном за поставку изделий, а в случае задержки монтажа оборудования из-за несвоевременной поставки определить размер компенсации, исходя из времени задержки и тарифа. Контекстно-свободная грамматика записывается в виде системы продукций, в качестве обозначения операции конкатенации в ней принят знак " + ". 2.10. Синтез элементов концептуальной структуры методом интеллектуального анализа данных

Рассматривается неструктурированное описание данной проблемы в виде совокупности фактов в базе данных и структурированное описание ранее решенных проблем (прецедентов). Проблема заключается в поиске решения новой проблемы, опираясь на прецеденты. Различают интенсивная (интешп) понятия (концепта) или его описание через свойства объектов и экстенсивнал (экстент), который представляет собой совокупность объектов, образующие множество, составляющее понятие. Рассмотрим подробнее модель формирования понятий, опирающуюся на теорию решеток.

Определение 1. Контекст - это тройка (О, A, R), где О - множество объектов, А - множество атрибутов, Я - бинарное отношение между О и А, т.е.

Определение 2. Определяются два оператора вывода (порождения) р:2* -> 2" иЛ:2" -> 2* определяются следующим образом:

.9 с А, р(х) = ¡о е 0\Ма 6 5,(о,а)е л} X с О, Л(х) = {а е А\Уо е Х,(о,а) е л}

Определение 3. Формально концепт С - это пара (Х,$),Х с 0,5с А,

удовлетворяющая условию р(5) = Л',А(Л') = 5, X и S называются экстенсионалом и интенсионалом концепта соответственно. В том случае, когда экстент концепта С2 включен в экстент концепта С\, мы говорим, что С, является суперконцептом С2 {С2 является субконцептом С]). Основная теорема гласит, что множество всех возможных формальных концептов из контекста (O,A,R) связанное с отношением суперконцепт-субконцепт образует полную решетку. Она называется решеткой понятий или решеткой Галуа и обозначается L((),A,R). Кроме того, существует естественная двойственность между экстентами (объектами) и интентами (атрибутами) в контексте, т.е. акр определяют соответствие Галуа между 2" и 2'1. Различают три проблемы обучения в решетках Галуа:

р1. Неинкрементальное построение иерархии О——♦//.

р2. Инкрементальное редактирование решетки концептов ¿и |о* }->£*.

рЗ. Инкрементальное редактирование иерархии концептов

- иерархия концептов, которой предстоит

обучиться, о* - редактируемый экземпляр объекта ¿*, Н'- редактируемые

решетка и иерархия концептов в случае, когда встретилось

показывает, что обучение выполняется в пространстве гипотез

Разработанные в настоящем исследовании алгоритмы обеспечивают потенциально необходимую для решения проблемной ситуации детальность ее описания.

В главе показано, что поддержка решений по переводу состояния экономического объекта из фактического состояния в целевое должна обеспечивать устранение различий в их описаниях, в связи с чем предложены средства адаптации базы данных и ее концептуальной структуры, а также тезауруса как элементов ИО и ЛО ИС, определяющих детальность описания объекта предметной области. Предложена модель

системы естественно-языкового интерфейса, обеспечивающего непосредственный доступ конечного пользователя с использованием бизнес-терминов к базе данных.

Глава 3. Информационное обеспечение разработки и выбора решений 3.1. Информационная поддержка Парето-оптимальных решений

Рассматривается ситуация, когда управление может находиться в

одном из состоян гБеБ. у с т ь Б - конечное множество возможных -чО

альтернатив действий, - множество всех подмножеств, элементы которого можно отождествить с различными наборами возможных действий в разных ситуациях. Пусть на множестве Б задана некоторая совокупность критериев, т.е. функций 0->Я, Я - множество вещественных чисел. В многокритериальной задаче выбора по критерию Парето решение принимается в соответствии с правилом:

Ся(х)={ уеХ):<р,(у)><р/х) } или в эквивалентной записи:

X 11яучН<й,(х)ъч>/у))И(<р4х)><1>/у)) }.

Пусть Ф = <Р1,(х) матрица оценок вариантовхг по критериям фу } = 1,...п; к

= 1,2,...т. Сформируем матрицы С* , к=1,2.....т попарного сравнения

вариантов по критерию В этой матрице элемент

принимает значение +1, если по критерию <Рк(х) вариант х, предпочтительнее варианта Выполним нормировку критериев таким образом, чтобы выполнялось условие:

Сц =sgn(tp^(x,)- <р\,(х)), где к - номер критерия, у - номер варианта.

С использованием матриц и учитывая таблицу

истинности логических функций в трехзначной логике Лукасевича, сформулируем отношение для Парето-оптимальных решений в виде

логической функции следующего вида: я1Г(х1,х/л(с(1>/ л у с"' или

эквивалентно К, (х,, х1) = (х,, х)) л Ч] (л,, ).

В данном случае Парето - оптимальное решение составит множество пар элементов множества решений (х1%х) тех пар множества решений, для которых соответствующие элементы матрицы Я, равны 1. Недостатком рассмотренного выше метода является отсутствие возможности корректировать принимаемое решение по мере поступления новых данных. Разработанные в последующих разделах методы и алгоритмы позволяют преодолеть этот недостаток.

-303.2. Принятие решений с использованием Байесовских деревьев

вывода

Анализ проблемы с помощью дерева решений и формулы Байеса заключается в том, чтобы представить проблему в виде дерева, которое имеет два вида вершин: вершины выбора решений и выбора случаем. Выбор агента обозначается квадратом, а выбор случая — кругом. Каждой вершине случая приписывается условная вероятность события. Вершина дерева представляет начальную ситуацию, в то время как каждый путь, исходящий из корня, соответствует одному возможному сценарию. Последовательность вершин, выражает количественную меру полезности ситуации, создаваемой всем путем. Цель нахождения оптимальной стратегии может быть достигнута возвратным анализом: начиная от листьев и, перемещаясь последовательно к корню, мы помечаем каждую вершину полезностью ситуации, которую она представляет. Каждая вершина случайного выбора помечается ожидаемой полезностью ее последователей, и каждая вершина выбора помечается максимальной полезностью ее последователей.

Рассмотрим рис. 3.1, иллюстрирующий выбор агентом одной из двух возможных альтернатив, связанных с инвестированием одного из двух проектов, причем решение принимается на основании результатов предварительно проводимой экспертизы (аудита) обоих потенциальных объектов инвестирования. На дереве отражены выбор (экспертиза или отсутствие экспертизы), изучение результатов тестирования выбранного проекта и, наконец, оценка фактического состояния объекта, его стоимости и ожидаемой прибыли. Выполним процесс возвратного анализа с выбором максимального значения:

- вычислить среднюю полезность для каждой случайной вершины;

- вычислить максимальную полезность в каждом узле, после выделения оптимальной ветви;

- проследить отмеченные ветви от корня и вниз, чтобы найти желанный оптимальный план.

Результат применения этой процедуры к дереву показан на рис. 3.1, где стоимость экспертизы вычтена из платежей соответствующих последствий. Оптимальный план получается прослеживанием от корня к листьям с выбором в каждом разветвлении ветви с максимальной полезностью. Оптимальный план на рис. 3.1. выделен жирной линией.

-3233. Обработка свидетельств в условиях неуверенности и нечеткости. Модель Шортлифа и Бьюкенена

Учитывая трудоемкость подготовки статистических данных, необходимость работы в условиях редко повторяющихся ситуаций, когда трудно говорить о представительности выборки, Шортлиф и Бьюкенен предложили модель, посредством которой можно делать выводы на основе неполных знаний. Описываемая ниже модель по существу является аппроксимацией условных вероятностей. Если совокупность всех релевантных данных или свидетельств обозначить -

ь ая гипотеза (проблемная экономическая ситуация), тогда р(Ъ/х) -условная вероятность того, что для наблюдаемого объекта имеет место ситуация Л, в свете свидетельств х, р(И/х) может быть вычислена из компонент условных вероятностей:

здесь - априорная вероятность гипотезы, например, если всего

альтернативных гипотез п; р(х/И,) — вероятность появления значений признака, свидетельств х в пределах объектов класса Выражение для условной вероятности есть в действительности выражение правила принятия решения или вероятностного вывода. Модель Шортлифа и Бьюкенена требует оценки экспертами данных в пользу гипотезы или в пользу ее отрицания. Шортлиф и Бьюкенен ввели понятие меру уверенности - MB и меру неуверенности - MD для обозначения весомости свидетельств. Таким образом, мы можем определить:

Л/ М1тх]=рМ-р<к'*\ 0<МВ[И,х]<1,

1 Р( А) 1 1 Р(А) ' J

0<МВ[Кх]<1.

Шортлиф ввел также коэффициент уверенности:

С77/г,х/ =МВ[И,х]-МО[И,х], -1< СР[к,х] <1.

В данном разделе показана модель выбора решения на основании данных, хранящихся в БД, с использованием логических комбинаций функций уверенности. Показано, что модель допускает корректировку решения по мере поступления новых данных. Программная реализация модели, приводимая ниже, показывает связь процессов концептуализации проблемной ситуации и выбора оптимального варианта решения.

-333.4. Принятие решений с использованием модели Демпстера -Шейфера

Основным понятием теории Демпстера - Шейфера (DST) является пространство (фрейм) исходов 0 , обозначающее исчерпывающее множество взаимоисключающих событий. Пусть А будет подмножеством в . Базовое вероятностное число для А, обозначаемое т(А), — это вероятность, приписываемая множеству А. Функция называется базовым приписыванием вероятностей, если удовлетворяет двум свойствам: 1) базовое вероятностное число нулевого события есть 0 (т(0)=О) и 2) сумма базовых вероятностных чисел для всех подмножеств в равна 1. Функция Bel называется функцией веры, если она удовлетворяет следующим условиям: 1)вера в нулевую гипотезу рав- в наО, Ве1(0) =0; 2) вера выесть /,Ве1(9 )=1\ 3) сумма вер в А и —¡А меньше или равна /. Предположим, что т1 и IÏÏ2 — два базовых приписывания вероятностей. Тогда ортогональная сумма есть:

т{®т1(А) = К ^m^-m^Y),

где К— константа нормализации К'[ = ^mt(X)-m2(Y), если А=0, тогда по

определению m/ ® nt2(0) =0.

Если К'=0, то ортогональная сумма не существует, и т1 и mi называют полностью взаимоисключающими. Величина (log К) называется весом конфликта между Bel/ и Bel. Таким образом, если Bel1 и Bel, не находятся в конфликте, то К=1 и если Ве1\ и Ве12 полностью противоречивы, то /Г'= 0. Р'(А) = / - Beir-iA) . Здесь Bel(A) — вера (или поддержка) А и Р (А) — возможность или верхняя граница A. Bel (А) — таким образом, мера полного количества веры в А и в его подмножества и Р (А) — степень, до которой невозможно сомневаться в Л.Свидетельства комбинируются по правилу комбинирования Демпстера: ^

В главе предложен комплекс алгоритмов и моделей, обеспечивающий принятие решений в различных классах проблемных ситуаций, в том числе формализация поведения действий лица, принимающего решения с использованием модальной логики знаний и

теории агентных систем как агента, знающего состояние экономического объекта и в соответствии с протоколом выбирающего последовательность действий с максимальным значением ожидаемой полезности. Комплекс приведенных моделей в сочетании с методами автоматической классификации позволяет выбрать модель, адекватную текущей ситуации, и тем самым обеспечивает динамическую адаптацию элементов концептуальной структуры информационных систем поддержки решений. Глава 4. Моделирование, внедрение и эксплуатация комплекса средств адаптации информационных систем поддержки решений

4.1. Эксперименты по адаптации базы данных к изменению потока запросов

Проводилась экспериментальная проверка адекватности модели генерации потока обращений в фонд реальному процессу. Эксперимент состоит из двух частей: модельного эксперимента на ЭВМ и эксперимента на массиве запросов за 5 лет в фонд автоматизированной системы «Информатика» ВИНИТИ. Целью эксперимента на массиве запросов в фонд «Информатика» является проверка согласия теоретического и эмпирического распределения среднего числа запросов по времени. В качестве реального массива взяты запросы за 5 лет по 45-ти наименованиям отечественных и зарубежных журналов, пользующихся наибольшим спросом (6 тыс. запросов). Эксперимент показал, что качество прогноза по критерию Колмогорова подтверждает адекватность модели. Модель позволяет администратору базы данных перемещать записи, частота обращения к которым упала ниже определенного уровня, переводить в архивное хранение.

4.2. Внедрение и опытная эксплуатация алгоритмов поиска с обратной • связью по релевантности

Рассмотренные в разделе 2.3. модели документального поиска с обратной связью по релевантности были реализованы в виде программных комплексов с различными модификациями. Система документального поиска, использующая описанные выше идеи, была реализована в составе ИС «МАЯК» в виде программного комплекса ПОИСК (ПК ПОИСК). ПК ПОИСК предназначена для осуществления информационного обслуживания пользователей на основе текстов и других реквизитов нормативного и правового характера.

ПК ПОИСК позволяет обрабатывать тексты документов, имеющих произвольную структуру и фактически неограниченную длину. В процессе

индексирования лексика текста, хранимого в базе данных, никаким изменениям не подвергается. Итерационный поиск строится на принципах предварительного «обучения» правильному распознаванию полезных (релевантных) документов, находящихся в информационном фонде. Обучение производится на нескольких примерах полезных документов, выбираемых непосредственно пользователем как образцов. Применение итерационного поиска с обратной связью по релевантности сокращает в два раза время поиска и предоставляет пользователю дополнительный комфорт при работе с системой.

4.3. Экспериментальное исследование поиска с учетом зависимости терминов и позиции их в тексте

На фрагменте сети взаимосвязанных терминов для подмножества документов с постановлениями Правительства РФ, посвященных вопросам образования, проверялся предлагаемый метод вместе с гипотезой о том, что при уточнении запроса выбор дескрипторов, стоящих на оптимальном пути, обеспечивает семантически согласованные модификации терминов. По сравнению со случаем, когда алгоритм независимо модифицирует произвольные термины запроса, совместная модификация терминов значительно сокращает перебор.

Реализация алгоритмов обратной связи по релевантности с учетом взаимозависимости дескрипторов в фонде требует выполнения большого объема вычислений. Алгоритм итерационного поиска, использующий построение максимального покрывающего дерева по логике работы и вычислительной сложности, эквивалентен алгоритму обращения матрицы и имеет сложность порядка 3п2-зп + 1. В работе рассматриваются вопросы организации параллельных (конвейерных) вычислений при применении алгоритмов итерационного поиска. При этом предлагается применение для построения оптимального запроса специализированных процессоров типа систолических массивов, обеспечивающих выполнение необходимых вычислений и подключаемых через интерфейсную плату к персональному компьютеру. Применение специализированных процессоров должно сократить время обработки запросов, что сделает более удобным общение конечного_пользователя. Данные технические решения разрабатывались в рамках ИС "Маяк" для реализации задач типа "Справка" и "Архив", "Письма", имеющих большие объемы базы данных, которая состоит преимущественно из текстов постановлений Правительства РФ и писем граждан, адресованных директивным органам.

-364.4. Результаты автоматического формирования тезауруса в информационных системах МИД РФ и ГАС ВЫБОРЫ

В работе излагаются экспериментальные данные построения

псевдотезауруса Ял, а также использования транзитивного замыкания Ял отношения Ял с применением алгоритмов построения максимального покрывающего дерева и поиска максимального/кратчайшего пути на графе. Для реализации был использован алгоритм Дейкстры. Термины и значения весов извлекались из БД, содержащей документы системы «Маяк», с присвоенными им тематическими рубриками. Псевдотезаурус строился по отдельности для каждой тематической рубрики. Алгоритм поиска максимального/кратчайшего пути строился как модификация предыдущего алгоритма. Было показано, что совокупность терминов, входящих в максимальное покрывающее дерево, может включать достаточно длинные цепочки терминов (4-5 терминов), характерные для данной проблемной ситуации и необходимые для поиска. Далее совокупности терминов, лежащие на максимальном/кратчайшем пути между двумя заданными, однозначно определяют допустимые замены терминов при итерационном поиске. Для преодоления размерности ковариационной матрицы терминов в работе рассматривалось подмножество терминов тезауруса (насчитывавшего 14000 терминов), соответствующее определенной тематической рубрике и составляющее в этом случае 2000- 3000 терминов.

Исходные данные, полученные на основании анализа статистических характеристик записей БД, послужили основанием для разработки на языке программирования «Си» комплекса программ с использованием БД и ее фактического наполнения аннотированными текстами документов (двусторонние договоры и соглашения, заключенные РФ с зарубежными странами) в количестве 2000. С использованием описанных выше методов была реализована информационно-справочные задачи «Двусторонний договор» и "Многосторонний договор" Правового управления МИД РФ, предназначенные для автоматизированного информационного обслуживания пользователей, для выполнения функциональных обязанностей которых необходима информация договорно-правового характера.

Графический навигатор был внедрен в ГАС "Выборы" в составе функционального комплекса задач "Право". Навигационная карта имеет форму полукруга, в центре которого находится выбранное для поиска

слова, а связанные с ним слова, составляющие его окрестность, располагаются по линии полуокружности и связаны с выбранным словом лучами разной толщины. Продвижение по навигационной карте помогает составить представление о содержании БД и взаимосвязи терминов в ней, что ускоряет поиск, делая его целенаправленным.

Рис. 4.1. Графический навигатор, отображающий часть окрестности теhмина "попядк"

Просматривая высвеченное на экране дерево (рис. 4.1), пользователь получает представление (на начальном этапе довольно общее) о содержимом БД. В соответствии со своей информационной потребностью он выбирает определенный путь на дереве (помечая или высвечивая его с помощью нажатия функциональных клавиш). Термины, встречающиеся на этом пути, автоматически помещаются в условие запроса, и осуществляется поиск записей в БД. 4.5. Концептуализация проблемной ситуации

Была реализована процедура, позволяющая осуществить адаптацию существующей структуры данных к новым условиям и в соответствии с вновь поступившими данными. В результате анализа записей БД "Справка" с текстами постановлений Правительства РФ тематической рубрики 02337 "Реконструкция производства" тематического классификатора юридического отдела было сформировано максимальное

покрывающее дерево, соответствующее ситуации "реконструкция" (рис. 4.2). По описанной выше методике сформированы следующие отношения базы данных, позволяющих адекватно отобразить содержание документов, принадлежащих данной тематической рубрике в результате применения к тестам программы автоматического излечения фактов из текстов. Домены базы данных: RG- регион (СОАТО), ОЕ - отрасль экономики (ОКОНХ), ER -экономических районов (ОКЭР), RS - работ и услуг в машиностроении (ОКРУМ), GU - органов госуправления (СООГУ), РО -предприятий и организаций.

Рис. 4.2. Максимальное покрывающее дерево ситуации "Реконструкция "

После заполнения такой базы данных фактами возможны вопросы вида: "Кто поставляет оборудование (объект, регион)" и т.д. Структура сети событий, ведущих от начальной ситуации к конечной, может быть графически выражена в виде графа рис. 4.3 и совокупностью правил базы знаний в виде структуры следующего вида: А > В > [ С; D] > [Е; F] > G >Н > (Р) ^ ( Р )} > [I; J], где А - выпуск постановления об увеличении производства стали, В - выделение фондов, С - строительство, D -реконструкция, Е - поставки оборудования, F - поставки приборов, G -монтаж, Н - ввод в эксплуатацию, I - увеличение производства стали, J —

-39-

улучшение использования металлолома.

С

Е I

О Р

Рис.4.3. Сеть событий, ведущая от начальной ситуации к целевой

В соответствии с этим база знаний системы содержит следующие правила:

/УВЕЛИЧЕНИЕ_ПРОИЗВОДСТВА_СТАЛИ/, "ВЫПОЛНЕНИЕ_ПОСТАНОВЛЕНИЯ_№" Р8(Т4,Т5,У1 ,У2,"объект" ОВ,"предприятие" РР, "процент_1" РС1,Т10, "процент_2" РС2, Т11):-"ВЫДЕЛЕНИЕ" УУ("вид ресурса" УЯ, "исполнитель" 18, "цель" А1, "получатель" РЬ, "срок" Т2), "РЕКОНСТРУКЦИЯ" ЯС('объект" ОВ,"предприятие" РР, "регион" Яв, "ведомство" ^С, "срок" Т5", "цель" А1); "СТРОИТЕЛЬСТВО" ВБ ("объект" ОВ,"предприятие" РР,"срок" ТЗ, "цель" А1), "ПОСТАВКИ_ПРИБОРЫ" Р1 ("вид изделия"У1, "поставщик" Р8, "объект" ОВ,"предприятие" РР,"срок" Т1),

"ПОСТАВКИ_ОБОРУДОВАНИЯ" Р2 ("вид изделия'У1, "поставщик" Р8, "объект" ОВ,"предприятие" РР,"срок" Т1), "МОНТАЖ" МК( "вид_обрудования" WO, "объект" ОВ, "предприятие" РР, "срок" ТЗ, "цель" А1), ВВОД_В_ЭКСПЛУАТАЦИЮ WЕ("объект" ОВ,"предприятие" РР,"срок" ТЗ, "цель" А1), "ИСПОЛЬЗОВАНИЕ_МЕТАЛЛОЛОМА ("процент_1" РС1, Т10, "процент_2" РС2, Т11), "ПРИРОСТ" 1К(Т4,Т5,У1,У2,"объект" ОВ,"предприятие" РР).

-404.6. Экспериментальное исследование модели СЕЯИ

Предполагается, что множество запросов на естественном языке укладывается в рамки некоторой формализованной грамматики, которая формально описывает синтаксическую структуру предложения запроса. При анализе предложения естественного языка оно рассматривается как цепочка, образуемая операцией конкатенации двух других цепочек.

Правила синтаксического анализа записаны в виде продукций языка ПРОЛОГ с использованием встроенных предикатов concatO - сцепление и member() - элемент множества. Предложение определяется как цепочка, полученная в результате конкатенации именной и предикативной групп, слияние которых образует исходное предложение, содержащееся в переменной. Приведем некоторые из этих правил:

1.sent(W,Hl, V4.D5):-sente(W,Hl, V4,D5).

Предложение в данном случае определяется через частный случай предложения, в котором подлежащее выражено существительным в единственном числе.

2. sente(W.H1, V4.D5):- пре (Y2),vp (VI,D5), concat (Y2, VI, W).

Предложение определяется как цепочка, полученная в результате

конкатенации именной и предикативной групп, слияние которых образует исходное предложение, содержащееся в переменной.

3. Распознавание семантического типа осуществляется сравнением со списком семантически сходных глаголов, которыми может быть выражено отношение "поставщик". Соответствующие правила на языке ПРОЛОГ: snd (D5):- vsemtype (TQ,-) ,member (D5, TQ).

vsemjype (["высылает", "отправляет", "поставляет"], snd).

Принадлежность к списку [] с именем TQ устанавливается при помощи встроенного предиката member(), устанавливающего принадлежность элемента множеству терминов данного семантического типа.

4. Синонимичность терминов устанавливается следующими правилами: ent synonym (ES, ENT):-synonym (ES, ENT); ent_synonym (ES, ES).

5. Предикат send (Z,TT,EL) - заголовок правила, включающего в качестве конъюнкции ряд предикатов. Причем send() соответствует отношению "поставляет (КР, К/, KS) "; предикат IN() - отношению "используется (KS, KI) "; предикат PR () - отношению "изготавливает (КР, KI)"; предикат BL - отношению "входит в объединение (ОВ.КР)"; DS -отношению "задержкамонтажа(KS, КР, KI)".send(ZZ, ТТ, V4):-gt(A, TT),IN(A, V4),R(Z,А), BL(ТТ, A),DS(TT, A, V4)

-416. Предикаты osnova (ТТ, HI) и osnova (ЕТ, V4) осуществляют нормализацию терминов, входящих в запрос путем выщеления основы с тем, чтобы слова в нормализованном виде передать в виде параметров ТТ и V4 предикату send (), осуществляющему поиск в базе данный: osnova (TT,NN):-concat (ТТ, "у?", NN);concat(TT, "у?", NN).

7. Предикат write (V4,F1,XX,Z) печатает ответ из слов, входящих в запрос. Демонстрация возможностей системы естественно-языкового интерфейса показывает его возможности, эффективность и естественность использования для этих целей языка ПРОЛОГ. 4.7. Программная реализация алгоритма Парето-оптимального решения

Программа реализована на языке С++, допускает переменное число строк (вариантов) и критериев. Формируются матрицы С* , к=1,2,3,4 попарного сравнения вариантов по критерию <pk(x). В этой матрице элемент С/, ij=1.2,3,4 принимает значение +/, если по критерию <Рк(х) вариант предпочтительнее варианта

номер критерия, ij - номер варианта. С использованием матриц Ск, (k = 1, 2, 3, 4) и учетом таблицы истинности логических функций в трехзначной логике сформулируем отношение для Парето-оптимальных решений в виде логической функции следующего вида: = л(С')" л vC' или

эквивалентно R,(= Программа выдает в

качестве Парето-оптимального решения множество пар элементов множества решений, для которых соответствующие элементы матрицы равны У. Матрица R\ имеет единицы только в том случае, если для данной пары х/ ни по одному из критериев не уступает Xj. R] как мы видели, содержит элемент г,/ = / в том и только в том случае, когда вариант xt превосходит вариант х) хотя бы по одному из критериев. Таким образом, в этом случае R^- =R;r' aR^ = R^'. Каждый элемент результирующей матрицы в нашем случае:

Эта операция гарантирует нам, что единицы будут стоять в результирующей матрице только для равноценных вариантов или тех

вариантов, которые или превосходят вариант х^ по каждому из критериев, или, по крайней мере, не уступают им. Тогда конъюнкция и Я; означает, что вариант, имеющий 1 в результирующей матрице по одному из критериев, не уступает и хотя бы по одному превосходит другой элемент пары.

4.8. Программная реализация выбора решения в модели Шортлифа и Бьюкенена

Рассматривается пример ситуации, полученной в результате анализа документов реальной базы данных постановлений правительства из системы "Маяк". Аргументируется выбор одного из двух вариантов инвестирования проектов в экспертной системе. Пусть мы имеем модель выбора с двумя альтернативными вариантами: реконструкция производства и строительство нового предприятия. При этом в качестве основных факторов, определяющих выбор, можно было бы условно принять следующие:

- ожидаемый прирост товарной продукции;

- ожидаемая прибыль;

- ожидаемая себестоимость товарной продукции;

- ожидаемый прирост производительности труда;

- необходимый прирост численности работающих;

- ожидаемое увеличение среднегодовой производственной мощности;

- требуемый объем капиталовложений;

- требуемый объем капитальных вложений на строительно-монтажные работы;

- лимит капитальных вложений;

- фондоотдача;

- ожидаемые сроки завершения;

- затраты на обеспечение мероприятий по защите окружающей среды. Вводятся оценки, полученные инженером по знаниям от экспертов для

величин - количественная мера одного из

двенадцати приведенных факторов, как для одного, так и для другого варианта (реконструкция или новое строительство). Здесь А,,у = 1,2-соответственно одна из гипотез, - доля уверенности в том, что

будет принят вариант на основании данных

Ввиду большей трудоемкости формирования таблиц р(И/х) вводятся также полученные инженером по знаниям результаты обобщения этих данных в виде правил, которые составляют базу вида: «Если вариант И) обеспечивает прирост товарной продукции и обеспечивает увеличение прибыли, то вариант будет принят»

На основании оценок субъективных вероятностей соответствующих простых гипотез программа рассчитывает значения Р(И,/х), Р(И1/х), Л/В,, МВ2, ЛШ,, Мй2, СТ^. Далее рассчитываются вероятности

гипотез, изменяющиеся по мере поступления данных (Таблица 1). 4.9. Программная реализация модели Демпстера-Шейфера

В качестве примера, взятого из дипломной работы, выполненной под руководством автора в РЭА им. Г.В. Плеханова, рассмотрим применение расчета по методу Демпстера-Шейфера нескольких вариантов предприятия по переработке природного газа. Предполагается, что вначале производится расчет экономических характеристик проектов, а затем группа экспертов оценивает различные комбинации вариантов. Таблица!. Коэффициентыуверенности сложныхгипотез, накапливаемыхпомере

интеграции данных

Формула гипотезы мв, £ 8 ■г; 1 § 5

0,4 0.6 0 0.6 0 0.6

0.52 0.8 0 0.6 0.4 0.6

0.52 0.8 0 0.68 0 0.2

0.81 0.8 0 0.68 0.6 0

0.88 0.9 0 0.68 0.4 0.5

На предприятиях газопереработки и газохимии выпускаются лишь сера, этан, сжиженные газы, а в стадии проектирования и строительства находятся производства по изготовлению полиэтилена и метанола. Расширение номенклатуры выпускаемой продукции за счет углубления

переработки природного газа и газового конденсата обеспечит повышение экономической эффективности всей деятельности предприятия.

Для оценки критериев эффективности газохимических производств были разработаны бизнес-планы инвестиционных проектов производства следующих химических продуктов: уксусная кислота, винилацетат, уксусный ангидрид, поливинилацетат. Решетка всего подмножества стратегий для наших вариантов представлена на рис.4.4.

___ ЛВСОЕ

7

Рис.4.4. Решетка подмножеств стратегий

Проведен расчет коэффициентов эффективности всех возможных вариантов бизнес-плана инвестиционного проекта производства ценных химических продуктов. На этой схеме серым цветом выделены реальные стратегии, водород (В) должен присутствовать во всех стратегиях, так как является попутным продуктом для всех процессов. Белые прямоугольники означают неосуществимые стратегии производства для принятой технологической схемы. Наша цель - подобрать наилучший вариант переработки природного газа. В зависимости от вида выпускаемой продукции будет меняться стоимость всего проекта, так как изменяется количество требуемого оборудования, затраты на монтаж и наладку производства и т.д. Проведен расчет коэффициентов эффективности всех возможных вариантов бизнес-плана инвестиционного проекта производства ценных химических продуктов. Для выбора наилучшего проекта полученные коэффициент эффективности обработаны с помощью

разработанной на Visual C++ программы. Отсортированные по возрастанию функции веры результаты расчета представлены на рис. 4.5.

-- DST - ir>sl31

I^J з^пип Edit Данные Yiew Winduw uelp

D|GS|H| 1 -M •

В«рм<эмт 1 M(A) I Нормир M(A) I Bel(M(A))

EOCSA 0 01140 1070 7446 7 281756 9030S

EDBA 0 081S2 7655 60898 240758 56146

ЕСВА 0 05051 4743 29421 224870 34285

EDCB 0 04082 3833 45948 224190 82825

EDB 0 29406 27613 73462 191933 32050

ЕВА 0 29671 27862 55611 191407 38958

ECB 019183 18014 06048 179740 54747

ЕВ 1 31959 123916 99690 153355 08592

DCBA 0 00632 59319748 67046 44765

DBA 003319 3116 72833 53709 66465

DCB 002171 2038 58672 50812 57677

CBA 0 02485 233359752 50333 43516

DB 011676 10964 49995 40402 56898

BA 010851 10189 46943 39628 43657

CB 0 08915 8371 40107 37809 49009

В 0 31 349 29438 08902 29438 08902

A 0 00001 0 87811 0 87811

CA 0 00000 0 00000 0 87811

DA О 00000 0 00000 0 87811

OCA 0 00000 0 00000 0 87811

EA 0 00000 0 00000 0 87811

ECA 0 00000 0 00000 0 87811

EDA 0 00000 0 00000 0 87811

EDCA 0 00000 0 00000 0 87811

С 0 00000 о ooooo 0 ooooo

D 0 00000 0 ooooo 0 ooooo

DC 0 00000 0 ooooo 0 ooooo

E 0 00000 0 ooooo 0 ooooo

EC 0 00000 0 ooooo 0 ooooo

ED 0 00000 0 ooooo 0 ooooo

EDC 0 00000 0 ooooo 0 ooooo

Рис 4.5. Экранная форма программы выбора решения по методу Демпстера-Шейфера

Экспериментальная проверка комплекса алгоритмов и программ выбора оптимального варианта решения на основе моделей Байеса, Парето, Шортлифа, Бьюкенена, Демпстера и Шейфера показала, что в совокупности они покрывают потребности оценки и выбора вариантов решений и их комбинаций во всех наиболее часто встречающихся проблемных ситуациях, то есть представляют собою функционально полный набор моделей и методов.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

Разработана с использованием современных моделей и методов кластеризации, интеллектуального анализа данных и теории принятия решений методология адаптации элементов концептуальной структуры информационных систем поддержки принятия решения в области экономики. Методология реализована и внедрена в виде комплекса средств адаптации, получившего практическое применение в форме специального программного обеспечения (СПО) в информационных системах МИД РФ, "«Маяк»", ГАС "Выборы". Комплекс показал свою эффективность, обеспечив повышение производительности разработки компонент ИО и ЛО по оценкам, полученным в ходе испытаний, в 1,8 раза и увеличение скорости итерационного поиска на больших массивах (свыше 50 тыс. записей) в 2 раза. В результате проведенных исследований решены следующие задачи:

1. Выполнен системно-информационный анализ процесса принятия решений, в результате которого показано, что необходимым условием разрешения проблемной ситуации, то есть перевода объекта из данного в желаемое состояние, является способность информационной системы различать эти состояния. Выявлены компоненты ИО и ЛО (тематический рубрикатор, тезаурус, концептуальная схема базы данных, агрегаты, кластеры, база знаний), автоматизация разработки и последующая адаптация которых определяет способность ИС описывать состояние объектов и отношений динамично изменяющейся предметной области с требуемым для принятия решений уровнем детальности.

2. Разработаны и внедрены в ВИНИТИ математическая модель прогнозирования интенсивности потока запросов к распределенной базе данных ИС и метод адаптации (тьюнинга) БД к изменениям интенсивности потока запросов, позволяющие перераспределять единицы хранения по уровням оперативности доступа в зависимости от интенсивности спроса с целью минимизации времени доступа.

3. Разработаны и внедрены в ИС "Маяк" математическая модель, алгоритмы и программные средства автоматического формирования запросов к базе документальных данных на основе обратной связи как средства повышения комфортности естественно-языкового интерфейса и адаптации ИС к изменениям информационной потребности пользователей.

4. Разработаны модели, алгоритмы и методы построения автоматического построения классификационной схемы полнотекстовой

базы данных, получившие практическое применение для корректировки тематического рубрикатора задачи "Письма" ИС "Маяк".

5. Разработаны математическая модель, алгоритмы и программные средства синтеза псевдотезауруса как основы динамически формируемой базы знаний, отслеживающей изменения предметной области, реализованные в виде СПО в задаче "Двусторонний договор" ИС ВПВ МИД РФ и задаче "Право" ГАС "Выборы".

6. Разработаны модели и программные средства формирования и адаптации концептуальной схемы базы данных к проблемной ситуации и составу приложений. Модели и программные средства внедрены в виде комплекса лабораторных работ по дисциплине "Базы и банки данных и знаний" в МИРЭА.

7. Разработаны модели и программные средства многокритериальной оценки и выбора вариантов решений на основе фактов, хранящихся в базе данных и весовых оценок их значимости для гипотез. Модели и программные средства внедрены в РЭА им. Г.В. Плеханова при выполнении работ по фанту Международного банка «Поиск, установление и обновление информационных банков данных для экономического образования (в рамках формирования межотраслевого образовательного комплекса)».

Основные результаты диссертации отражены в следующих работах

1. Романов В.П. Интеллектуальные информационные системы в экономике: Учебное пособие/ Под ред. д.э.н., проф. Н.П. Тихомирова. -М.: Издательство "Экзамен", 2003. - 496 с.

2. Романов В.П. Теоретические основы информатики. Информационные структуры и фактографический поиск информации.- М.: Изд-во РЭА им. Г.В.Плеханова, 1996. - 190 с.

3. Романов В.П., Теоретические основы информатики. - М.: Изд-во РЭА им. Плеханова, 1993, - 159 с.

4. Романов В.П., Курбаков К.И., Партыка Т.Л., Попов И.И. Основы информатики: Учебное пособие/. Романов В.П., Курбаков К.И., Партыка Т.Л., Попов И.И.- М.: Издательство "Экзамен", 2003. - 224 с.

5. Романов В.П., Королева Г.А. Математическая модель генерации потока обращений в справочно-информационный фонд // Информационные процессы и системы НТИ. -1979. - Сер. 2. - №7. - С. 22- 28.

-486. Романов В.П. Эволюция образовательных технологий в свете интеллектуализации информационных систем (об одном подходе к

7. формированию информационного образовательного ресурса)// Международная конференция-выставка «Информационные технологии в образовании» (ИТО - 99). Минобразования РФ, Москва, 9-12.Х1-99г. Сборник трудов участников конференции. Часть II. - М.: Изд-во МИФИ, 1999.-С. 60-61.

8. Романов В.П. Информационные системы в экономике: складирование данных, аналитические технологии, открытие знаний // Тринадцатые международные Плехановские чтения: Тезисы докладов профессорско-преподавательского состава РЭА им. Г.В. Плеханова 18-21 апреля 2000 г. С. 106.

9. Романов В.П. Интеллектуальный анализ больших массивов данных с использованием MST-алгоритма // НТИ-2000. "Информационное общество, информационные ресурсы и технологии телекоммуникации". 5-я Международная конференция. 22-24 ноября 2000 г., Москва. Материалы конференции. - М.: Изд-во ВИНИТИ, 2000. - С. 280-281.

Ю.Романов В.П. Синтез элементов концептуальной структуры информационных систем принятия решений // НТИ-2002. "Информационное общество, интеллектуальная обработка информации, информационные технологии. "Международная конференция, 16-18

11 октября 2002 г., Москва. Материалы конференции. - М.: Изд-во ВИНИТИ, 2002. - С. 444-447 .

12.Романов В.П., Синельников И.Б., Кулешова ЕА АИС "Электронный деканат" и проблема управления корпоративными знаниями ВУЗА //Международный конгресс конференций "Информационные технологии в образовании": Сборник трудов участников конференции. Часть V. - М.: Просвещение, 2003. - С. 239-240.

Автореферат

Диссертация на соискание ученой степени доктора технических наук Романов Виктор Петрович

Тема диссертационного исследования

Комплекс средств адаптации информационных систем поддержки принятия решений в области

экономики

Изготовление оригинал-макета Романов Виктор Петрович

Подписано в печать Тираж экз.

Усл. п.л. Я, 4 .

Российская академия государственной службы при Президенте Российской Федерации

Отпечатано ОПМТ РАГС. Заказ № /У^Г

119606, Москва, проспект Вернадского, д. 84.

011516

Оглавление автор диссертации — доктора технических наук Романов, Виктор Петрович

Введение.

Глава 1. Анализ современных технологий разработки и реализации решений и информационных систем в области экономики.

1.1. Технология разработки и реализации управленческого решения.

1.1.1. Системы поддержки принятия решения.

1.1.2. Хранилища данных.

1.1.3. Витрины данных (Рынки данных).

1.1.4. Оперативная аналитическая обработка данных (OLAP).

1.1.5. Структура репозитария хранилища.

1.1.6. Средства интеллектуального анализа данных ORACLE.

1.2. Основные классы информационных систем в сфере экономики.

1.3. Место и назначение комплекса средств адаптации в информационной системе принятия решений.

Выводы по первой главе.

Глава 2. Модели и алгоритмы адаптации информационных систем принятия решений в экономике.

2.1 Обобщенная модель информационной системы.

2.1.1. Состояния системы.

2.2. Модель адаптации к интенсивности потока обращений к базе данных в сети.

2.3. Алгебраические модели поиска с обратной связью по релевантности.

2.4. Применение алгоритмов типа ABO (вычисления оценок) для построения итерационных алгоритмов поиска.

2.5. Модель поиска с учетом зависимости терминов и позиции их в тексте.

2.6. Модель и алгоритмы формирования тезауруса как базы знаний.

2.7. Поиск текстовой информации по ключевым словам, основанный на применении систолических массивов.

2.8. Формирование концептуальной структуры базы данных.

2.9. Модель системы естественно-языкового интерфейса.

2.9.1. Бесконтекстная грамматика ФАЕЯЗ - формальной аппроксимации естественно-языковых запросов.

2.10. Синтез элементов концептуальной структуры методом интеллектуального анализа данных.

Выводы по второй главе.

Глава 3. Информационное обеспечение процесса разработки и выбора решений.

3.1. Информационная поддержка Парето-оптимальных решений.

3.2. Принятие решений с использованием Байесовских деревьев вывода.

3.3. Обработка свидетельств в условиях неуверенности и нечеткости. Модель Шортлифа и Бьюкенена.

3.4. Принятие решений с использованием модели Демпстера-Шейфера.

3.4.1. Комбинация функций веры.

3.5.Формализация процесса обработки знаний и принятия решений на теории агентных систем.

3.6. Моделирование временных отношений в информационных системах.

3.6.1. Представление времени в базах данных.

3.6.2. Структуры, основанные на событиях.

Выводы по третьей главе.

Глава 4. Моделирование, внедрение и эксплуатация комплекса средств адаптации информационных систем поддержки решений.

4.1. Эксперименты по адаптации базы данных к изменению потока запросов.

4.2. Внедрение и опытная эксплуатация алгоритмов поиска с обратной связью по релевантности.

4.3. Экспериментальное исследование поиска с учетом зависимости терминов и позиции их в тексте.

4.4. Проект программно-технической реализации поиска по ключевым словам, основанного на применении систолических массивов.

4.5. Результаты автоматического формирования тезауруса в информационных системах МИД РФ и ГАС ВЫБОРЫ.ч.

4.5.1. Партициальный алгоритм кластеризации.

4.5.2. Агломеративный алгоритм кластеризации по методу минимального расстояния.

4.6. Концептуализация проблемной ситуации на примере ИС «Маяк».

4.7. Экспериментальное исследование модели СЕЯЕИ.

4.8. Программная реализация алгоритма выбора Парето-оптимального решения.

4.9. Программная реализация выбора решения в модели Шортлифа и

Бьюкенена.

4.12. Программная реализация модели Демпстера-Шейфера.

Выводы по четвертой главе.

Введение 2004 год, диссертация по документальной информации, Романов, Виктор Петрович

Актуальность темы исследования. В течение последних 3-5 лет произошло значительное расширение сферы практического применения информационных технологий и систем в управления в социальных и экономических системах. В определенной степени это объясняется появлением на рынке готовых к использованию информационных систем (ИС) различного класса (DSS - систем поддержки принятия решений, MIS - информационных систем менеджмента, EIS - информационных систем контроля исполнения решений, RMIS - информационных систем риск-менеджмента и других). Появились технологии организации, хранения и отображения данных, адаптированные специально к сверхбольшим массивам экономической информации, такие как хранилища и витрины данных, интеллектуальный анализ данных, оперативная аналитическая обработка [35]. Необходимо отметить, эти программные имеют высокую стоимость и сами по себе сложны в инсталляции и эксплуатации [1], но еще более трудоемкой и сложной является задача подготовки для них информационного обеспечения, адекватно отображающего объекты и связи предметной области.

В современных условиях принятие решений в области экономики связано с проблемными ситуациями, которые являются редко повторяющимися уникальными, заранее не предсказуемыми событиями; решение необходимо принимать в отсутствии исчерпывающей априорной информации, при жестких временных ограничениях. В этих условиях не применимы обычные методы структурного проектирования информационных систем, а существующие ИС с фиксированной жесткой структурой не обеспечивают требуемое качество информационной поддержки решений в условиях динамично изменяющихся проблемных ситуаций.

Традиционные ИС не имеют, как правило, в своем составе элементов адаптации, их адаптация по существу заключается в повторной разработке и смене версий. Между тем, такие компоненты концептуальной структуры как схема базы данных, классификаторы, тезаурус, база знаний, кластеры, агрегаты данных, включаемые обычно в состав ИО и ЛО, имеют чрезвычайно высокую трудоемкость разработки. Зн ачительные сроки разработки информационного обеспечения становятся особенно неприемлемыми в случае динамично изменяющихся предметных областей [77]. Компоненты информационной системы должны автоматически адаптироваться и видоизменяться соответственно состоянию проблемной ситуации и стадии подготовки и принятия решения.

Предлагаемые в диссертационной работе модели, алгоритмы и информационные технологии адаптации ИС позволяют им работать в ритме деятельности лица, принимающего решение и перестраивать компоненты информационного обеспечения по мере того, как пользователь переходит от одной проблемной ситуации к другой. Благодаря этому достигается повышение точности, полноты и своевременности выдачи информации лицу, принимающему решение. В диссертации изложены научно обоснованные технические и технологические разработки, имеющие существенное значение для экономики страны в части разработки адаптивных информационных систем поддержки решений в области экономики.

Целью данного исследования является разработка методологии, моделей, алгоритмов и программных средств автоматизации создания {синтеза) информационного и лингвистического обеспечения ИС поддержки принятия решений, обеспечивающих повышение производительности разработки и последующую адаптацию ИО и ЛО к изменениям предметной области, и на этой основе - повышение пертинентности и своевременности выдачи информации лицу, принимающему решение и в конечном итоге — повышение качества и эффективности решений в области экономики.

Для достижения указанной цели в работе поставлены следующие задачи:

1. На основе анализа процесса принятий решений выявить компоненты информационного обеспечения, автоматизация разработки и последующая адаптация которых обеспечивает сокращение сроков создания ИО и ЛО и определяет способность И С описывать состояние объектов и отношений динамично изменяющейся предметной области с требуемым для принятия решений уровнем детальности.

2. Разработать математическую модель прогнозирования интенсивности потока запросов к распределенной базе данных ИС и метод адаптации (тьюнинга) БД к изменениям интенсивности потока запросов.

3. Разработать математическую модель, алгоритмы и программные средства автоматического формирования запросов к базе документальных данных на основе обратной связи, как средства повышения комфортности естественно-языкового интерфейса и адаптации- ИС к изменениям информационной потребности пользователей.

4. Разработать модели, алгоритмы и методы построения автоматического построения классификационной схемы полнотекстовой базы данных.

5. Разработать математическую модель, алгоритмы и программные средства синтеза псевдотезауруса как основы динамически формируемой базы знаний, отслеживающей изменения предметной области.

6. Разработать модели и программные средства формирования и адаптации концептуальной схемы базы данных к проблемной ситуации и составу приложений.

7. Разработать модели и программные средства многокритериальной оценки и выбора вариантов решений на основе фактов, хранящихся в базе данных и весовых оценок их значимости для гипотез.

Объектом исследования являются информационные системы поддержки принятия решений, параметры и структура которых настраиваются на проблемную ситуацию за счет применения программных средств анализа данных об объекте информатизации;

Предметом исследования являются:

• Процессы и модели принятия решений в проблемных экономических ситуациях, основанные на современных информационных технологиях поддержки решений.

• Технология автоматизированного создания компонент информационного и лингвистического обеспечения, основанная на применении сочетания статистических алгоритмов, алгоритмов кластерного анализа методов дискретной оптимизации и интеллектуального анализа данных;

• Базы реальных данных, большого объема в сфере управления в социальных и экономических системах "МАЯК" (задачи "Справки", "Архив", "Письма"), МИД РФ (задачи "Двусторонний договор" и "Многосторонний договор" подсистемы Правового Управления), ГАС "Выборы" (функциональный комплекс задач "Право") и других, содержащие описания динамических проблемных ситуаций, используемых для адекватного отображения в структуре адаптивной информационной системы.

Научная новизна выносимых на защиту положений заключается в следующем:

Впервые обосновано теоретическое положение, в соответствии с которым компоненты информационного и лингвистического обеспечения, определяющие выразительную силу языка информационной системы и как следствие, эффективность и качество решений должны автоматически формироваться и настраиваться на проблемную ситуацию и стадию ее решения.

Впервые исследовано и обосновано включение в состав ИС в качестве постоянного компонента модуля адаптации, реализованного в виде комплекса, математических моделей и алгоритмов самообучения, кластерного анализа, интеллектуального анализа данных и формирования базы знаний. В отличие от существующих методов проектирования ИС (SADT, RAD), которые предусматривают главным образом автоматизацию документирования разработки ИС и требуют исчерпывающего априорного описания предметной области, предлагаемая методология реализует первоначальный синтез элементов концептуальной структуры ИС и последующую их подстройку к изменениям структуры и функций объекта. Это позволяет приступать к созданию ИС при отсутствии исчерпывающей информации о структуре и функциях объекта информатизации, а в последующем корректировать ее параметры.

С целью повышения эффективности принимаемых решений в условиях, когда проблемные ситуации являются редко повторяющимися уникальными, заранее не предсказуемыми событиями, предложены модели, алгоритмы и программные средства оценки гипотез, использующие методы экспертных систем (критерии Шортлифа-Бьюкенена и Демпстера-Шейфера);

Разработаны модели и алгоритмы естественно-языкового общения пользователей с ИС принятия решений в экономике с использованием привычных для него бизнес-понятий, учитывающие современные требования повышения комфортности интерфейса пользователей -руководителей высокого уровня, действующих в условиях высокой степени риска, дефицита времени на подготовку решений;

Предложена методология синтеза элементов концептуальной структуры ИС на основе статистического анализа ковариационных связей и оценки параметров распределения потока заданий и запросов, модель итерационного поиска и формирования базы знаний (псевдотезауруса) с учетом статистической зависимости бизнес-терминов, алгоритмов кратчайшего пути и минимального покрывающего дерева;

• Разработана модель прогноза числа запросов к записям базы данных в сети взаимосвязанных информационных центров на основе теории ветвящихся случайных процессов для адаптации базы данных к изменениям интенсивности потока запросов. Методы исследования. Основные результаты работы получены на базах реальных данных большого объема систем "МАЯК" (задачи "Справки", "Архив", "Письма"), МИД РФ (задачи "Двусторонний договор" и "Многосторонний договор" подсистемы Правового Управления), ГАС "Выборы" (функциональный комплекс задач "Право"), в разработке которых принимал участие автор, с использованием методов математической статистики, исследования операций, модальной логики, теории решеток.

Достоверность полученных результатов проверялась в процессе приемосдаточных испытаний и последующей эксплуатации информационных систем, разработанных с участием автора и использовавших предложенные в настоящей работе модели и методы. Адекватность полученных с применением предлагаемых моделей и программных средств результатов пользовательским требованиям оценивалась также путем их содержательной интерпретации пользователями системы.

Практическая значимость результатов работы определяется тем, реализован и внедрен комплекс алгоритмов и программ в виде специального программного обеспечения (СПО), прошедший испытания и показавший эффект в виде повышения производительности разработки компонент ИО и ЛО по оценкам, полученным в ходе испытаний в 1,8 раза и увеличении скорости итерационного поиска на больших (свыше 50 тыс. записей) в 2 раза. На основе предлагаемых моделей и методов был разработан и внедрен комплекс средств адаптации элементов концептуальной структуры систем принятия решений в области экономики, реализующий следующие функции:

- Прогнозирование интенсивности потока запросов и адаптацию базы данных к ее изменению;

- Естественно-языковый интерфейс с базой данных, включая автоматическое уточнение запроса на основе обратной связи, автоматическое формирование псевдотезауруса и его применения в качестве навигатора при осуществлении направленного поиска в динамически формируемой базе документов для вновь возникшей проблемной ситуации;

- Моделирование обработки информации для принятия решений с использованием Байесовских деревьев вывода, теории уверенности Шортлифа, Бьюкенена, Демпстера-Шейфера;

Синтез и последующую адаптацию логической структуры базы данных, за счет повторного построения матрицы инциденций атрибутов и применения алгоритмов оптимального разрезания представляющего ее графа.

Внедрение результатов.

Предлагаемый в работе комплекс моделей, методов и программных средств внедрены и прошли апробацию в процессе разработки и эксплуатации информационных систем с элементами искусственного интеллекта, в создании которых принимал участие автор. К числу этих систем относятся Государственная автоматизированная система «Выборы» - функциональный комплекс задач "Право", АИС "Налог", Подсистема Правового управления Информационной Системы МИД РФ, ИС "Маяк", Сеть автоматизированных центров Научно-технической информации (САЦ НТИ) и ряда других систем общегосударственного уровня.

Естественно-языковый интерфейс, включая поиск документов с использованием алгоритмов обратной связи по релевантности, автоматического формирования псевдотезауруса, создание и использование навигатора нашли применение при создании ИС «Маяк», ИС МИД РФ, АИС ГАС ВЫБОРЫ. Результаты работы были использованы при постановке курсов лекций и практических работ по дисциплинам "Моделирование информационных систем", "Банки и базы данных и знаний" в МИРЭА, курсов лекций и лабораторных работ по дисциплинам "Информационные системы",

Проектирование информационных систем", "Математические основы информационных систем " в РЭА им. Г.В. Плеханова, отражены в двух монографиях "Теоретические основы информатики", а также в работе по подготовке учебного плана по дисциплине "Информационные системы в экономике" и учебного курса и учебного пособия "Интеллектуальные информационные системы", выполненных по гранту Международного банка реконструкции и развития в РЭА им. Г.В. Плеханова. Разработан и внедрен также комплекс лабораторных работ, программно реализующих все основные стадии полнотекстового поиска документов, автоматизации формирования и оптимизации структуры баз данных и базы знаний.

Теоретическая ценность. Основные теоретические результаты работы представлены в опубликованных по теме диссертации трех монографиях: "Теоретические основы информатики" - 1993 г., "Теоретические основы информатики. Информационные структуры и фактографический поиск информации" - 1996 г., "Интеллектуальные информационные системы в экономике" - 2002 г.

Апробация работы. Результаты диссертации докладывались на следующих семинарах, конференциях и симпозиумах:

• Международная научно-методическая конференция «Наукоемкие технологии образования». Головной совет межвузовской комплексной программы «Наукоемкие технологии образования». Таганрогский Государственный радиотехнический университет. Таганрог 5-7 июля 1999г.

• IX международная конференция-выставка ИТО'99 «Информационные технологии в образовании». Министерство образования России. Институт Юнеско по информационным технологиям образования. Москва. МИФИ 912 ноября 1999г.

• XII международные Плехановские чтения. РЭА им. Г.В. Плеханова. Москва 20-22 апреля 1999г.

• XIII международные Плехановские чтения. РЭА им. Г.В. Плеханова. Москва 18-21 апреля 2000г.

• X Международная конференция-выставка ИТО-2000 «Информационные технологии в образовании». Министерство образования России. Институт Юнеско по информационным технологиям образования. Москва, МИФИ 710 ноября 2000г.

• 5-ая Международная конференция "Информационное общество Информационные технологии. Телекоммуникации" "НТИ-2000". Москва, ВИНИТИ, 22-24 ноября 2000 г.

• Четырнадцатые международные Плехановские чтения. 17-20 апреля 2001 г.

• Координационное общественное научно-методическое объединение-совет Минобразования РФ по специальностям информатика, прикладная информатика, информационные системы (по областям). КООИНФ: Годичная сессия КОСИНФО, Москва, 17 мая 2001г. Минобразования РФ.

• XII Международной конференции "Информационные технологии в образовании" ("ИТО-2002" Москва, 4-8 ноября 2002 г.

• 7-ая Международная конференция "Информационное общество Информационные технологии. Телекоммуникации" "НТИ-2002". Москва, ВИНИТИ, 14-16 октября 2002 г.

Публикации, отчеты, диссертационные работы аспирантов. По теме диссертации опубликовано три монографии, 76 научных работ, результаты исследования отражены также в научных отчетах, технических заданиях и технических проектах, разработанных в НИИ "Восход", а также в технических заданиях и отчетах по темам, но грантам Международного банка реконструкции и развития в РЭА им. Г.В. Плеханова. Данное исследование частично базируется на результатах кандидатских диссертаций аспирантов Карасева С.А., Житкова Г.Н., Терещенко С.С., Королевой Г.А., руководство которыми осуществлял автор данной диссертационной работы.

В данной работе излагаются разработанные автором и внедренные в ряде информационных систем общегосударственного уровня принципы синтеза элементов концептуальной структуры ИС на основе анализа предметной области и условий их функционирования, в том числе:

- автоматизация формирования концептуальной схемы базы данных системы,

- автоматизация формирования структуры базы данных и базы знаний системы,

- автоматизация управлением размещением данных с учетом динамики обращения.

В работе ставится и решается задача синтеза элементов структуры ИС, обеспечивающих требуемые характеристики оперативности и разрешающей силы ИС в целом.

В основу данной работы положены исследования и работы, проводившиеся автором в ВИНИТИ в области распознавания образов и кластерного анализа в 1965- 1973 гг., в области разработки Государственной автоматизированной системы научно-технической информации (подсистемы АСУ ГАСНТИ и сети автоматизированных центров научно-технической информации - САЦ НТИ) в 1974- 1985 гг., а также работы в НИИ "ВОСХОД" в области создания ряда автоматизированных информационных систем высших органов государственного управления в 1985 - 1998 гг. и, наконец, работы в РЭА им Г.В. Плеханова по разработке ряда систем управления экономическими процессами.

Заключение диссертация на тему "Комплекс средств адаптации информационных систем поддержки принятия решений в области экономики"

Выводы по четвертой главе

1. Экспериментальная проверка комплекса средств адаптации элементов концептуальной структуры информационных систем принятия решений в области экономики, внедрение его в состав сданных в промышленную эксплуатацию информационных систем показали высокую эффективность комплекса, заключающуюся в сокращении времени поиска информации в 1,8 — 2,5 раза, сокращении' сроков разработки компонент информационного обеспечения в 2 раза.

2. Эксперименты по адаптации базы данных к изменению интенсивности потока запросов показали возможность увеличения оперативности обслуживания запросов при том же объеме пространства для хранения информации в 1,5 раза.

3. Внедрение и опытная эксплуатация в составе задач "Письма" и "Справки" системы "Маяк" адаптационных алгоритмов поиска с обратной связью по релевантности, в том числе с учетом зависимости терминов показала

4.16) н к налогообложения; Са и Са - учетная стоимость активов на начало и конец возможность увеличения оперативности обработки запросов при одинаковых значениях параметров полноты и точности в 2.5 раза.

4. Реализация поисковых задач "Двусторонний договор", "Многосторонний договор" в составе информационной системы МИД РФ, задачи "Право" в составе ГАС Выборы с использованием методов кластеризации для построения тематического рубрикатора, автоматического формирования тезауруса, используемого в качестве графического навигатора, позволило ускорить внедрение систем в опытную эксплуатацию и обеспечить оперативную настройку к изменению состава информационного фонда по мере его роста.

5. Методы и комплекс программ синтеза логической структуры базы данных, испытанные на примере задач "Справки" и " Письма" ИС "Маяк" позволяют автоматически формировать и видоизменять основные элементы концептуальной структуры баз данных в процессе сбора информации по вновь возникшей проблемной ситуации, обеспечивая более высокую оперативность и динамику в сравнении методами CASE и RAD - технологий.

6. Экспериментальная проверка работоспособности модели естественноязыкового интерфейса показала правильность заложенных в ее основу принципов и ее эффективность, обеспечивая гибкость и удобство общения с системой для непрограммирующего пользователя — лица, принимающего решения.

7. Экспериментальная проверка комплекса алгоритмов и программ адаптации и выбора оптимального варианта решения на основе моделей Байеса, Парето, Шортлифа, Бьюкенена, Демпстера и Шейфера показала, что в совокупности они покрывают потребности оценки и выбора вариантов решений и их комбинаций во всех наиболее часто встречающихся проблемных ситуациях, то есть представляют собою функционально полный набор моделей и методов.

Заключение

Разработана с использованием современных моделей и методов кластеризации, интеллектуального анализа данных и теории принятия решений методология адаптации элементов концептуальной структуры информационных систем поддержки принятия решения в области экономики. Методология реализована и внедрена в виде комплекса средств адаптации, получившего практическое применение в форме специального программного обеспечения (СПО) в информационных, системах МИД РФ, "Маяк", ГАС "Выборы". Комплекс показал свою эффективность, обеспечив повышение производительности разработки компонент ИО и ЛО по оценкам, полученным в ходе испытаний, в 1,8 раза и увеличение скорости итерационного поиска на больших массивах (свыше 50 тыс. записей) в 2 раза. В результате проведенных исследований решены следующие задачи:

1. Выполнен системно-информационный анализ процесса принятия решений, в результате которого показано, что необходимым условием разрешения проблемной ситуации, то есть перевода объекта из данного в желаемое состояние является способность информационной системы различать эти состояния. Выявлены компоненты ИО и ЛО (тематический рубрикатор^ тезаурус, концептуальная схема базы днных, агрегаты, кластеры, база знаний), автоматизация разработки и последующая адаптация которых определяет способность ИС описывать состояние объектов и отношений динамично изменяющейся предметной области с требуемым для принятия решений уровнем детальности.

2. Разработаны и внедрены в ВИНИТИ математическая модель прогнозирования интенсивности потока запросов к распределенной базе данных ИС и метод адаптации (тьюнинга) БД к изменениям интенсивности потока запросов, позволяющие перераспределять единицы хранения по уровням оперативности доступа в зависимости от интенсивности спроса с целью минимизации времени доступа.

3. Разработаны и внедрены в ИС "Маяк" математическая модель, алгоритмы и программные средства автоматического формирования запросов к базе документальных данных на основе обратной связи, как средства повышения комфортности естественно-языкового интерфейса и адаптации ИС к изменениям информационной потребности пользователей.

4. Разработаны модели, алгоритмы и методы построения автоматического построения классификационной схемы полнотекстовой базы данных, получившие практическое применение для корректировки тематического рубрикатора задачи "Письма" ИС "Маяк".

5. Разработаны математическая модель, алгоритмы и программные средства синтеза псевдотезауруса как основы динамически формируемой базы знаний, отслеживающей изменения предметной области, реализованные в виде СПО в задаче "Двусторонний договор" ИС ВПВ МИД РФ и задаче "Право" ГАС "Выборы".

6. Разработаны модели и программные средства формирования и адаптации концептуальной схемы базы данных к проблемной ситуации и составу приложений. Модели и программные средства внедрены в виде комплекса лабораторных работ по дисциплине "Базы и банки данных и знаний" в МИРЭА.

7. Разработаны модели и программные средства многокритериальной оценки и выбора вариантов решений на основе фактов, хранящихся в базе данных и весовых оценок их значимости для гипотез. Внедрены в РЭА им. Г.В. Плеханова при выполнении работ по гранту Международного банка «Поиск, установление и обновление информационных банков данных для экономического образования (в рамках формирования межотраслевого образовательного комплекса)».

Библиография Романов, Виктор Петрович, диссертация по теме Информационные системы и процессы, правовые аспекты информатики

1. Справочник-каталог «Softel: 100 компьютерных программ для бизнеса», «ХАМТЕК ПАБЛИШЕР», стр. 61-69.

2. Абрамов А. Е. Основы анализа финансовой, хозяйственной и инвестиционной деятельности предприятия в 2-х ч.- М.: Экономика и финансы. АКДИ, 1994-96.-512 с.

3. Андрейчиков A.B., Андрейчикова О.Н. Анализ, синтез, планирование решений в экономике.- М.: Финансы и статистика, 2000. 363 с.

4. Аскеров Т.М. Микропроцессорная система информационного моделирования. Л.: СЗПИ. 1982. стр. 36-54.

5. Аскеров Т.М. Информационная модель экономического объекта и ее обработка на ЭВМ. Труды IV Международного симпозиума по общим вопросам управления и информации. Варна. 1973. стр. 143.

6. Ахо А., Ульман Дж. Теория синтаксического анализа, перевода и компиляции, том 1. М.: Мир, 1978.-612с.

7. Баканов М. И. Шеремет А. Д. Теория экономического анализа. М.: Финансы и статистика, 1994.-352 с.

8. Балабанов И. Т. Финансовый менеджмент. М.: Финансы и статистика, 1994.-314 с.

9. Бауэр Ф.Л., Гооз Г. Информатика. Часть 1. М.: Мир, 1990.- 324 с.

10. Боровиков В.П. Ивченко Г.К. Прогнозирование в системе STATISTICA в среде Windows. Основы теории и интенсивная практика на компьютере: Учеб. Пособие -М.: Финансы и статистика, 2000. 384 е.: ил.

11. Бромович М. Анализ экономической эффективности капиталовложений: Пер с англ.- М.: ИНФРА-М, 1996.- 432 с.

12. Буч Гради. Объектно-ориентированный анализ и проектирование с примерами приложений на С++. Пер. с англ. под ред. Романовского Н. и Андреева Ф.-М.:БИНОМ,1998, 560 с.

13. Быкадоров В.Л., Алексеев П.Д. Финансово-экономическое состояние предприятия. Практическое пособие. М. "Издательство ПРИОР". 1999.-412 с.

14. Вагин В.Н. Дедукция и обощение в системах принятия решений.- М.: Наука. Гл. ред. Физ.-мат. Лит. 1988.- 384 с.

15. Вендров A.M. CASE-технологии. Современные методы и средства проектирования информационных систем. М.: Финансы и статистика, 1998.- 176 е.: ил.

16. ГАС "ВЫБОРЫ" Техническое задание на выполнение работ НИИ "Восход" по совершенствованию ФКЗ "Право" в соответствии с исходными данными Заказчика к формированию распределенной БД "Право", 1996. 4 с.

17. ГАС ВЫБОРЫ" Частное техническое задание на разработку ТКЗ "Текст". НИИ "Восход", 1996 г. 14 с.

18. Гинзбург С. Математическая теория контекстно-свободных языков. М.: Мир, 1970.-345 с.

19. Горелик А.Л., Скрипкин В.А. Методы распознавания. М.: Высшая школа, 1989.-232 с.

20. Грачева М.В. Анализ проектных рисков: Учеб. Пособие для вузов. М.: ЗАО "Финстатинформ" 1999.- 216 с.

21. Гудман С., Хидетниеми С. Введение в разработку и анализ алгоритмов. -М.: Мир, 1981.-366 с.

22. Дебок Г., Кохонен Т. Анализ финансовых данных с помощью самоорганизующихся карт/ Пер. С англ. М.: издательский Дом «АЛЬПИНА», 2001.-317 с.

23. Деловое планирование (Методы. Организация. Современная практика): Учеб. пособие / Под ред. В.М. Попова. М.: Финансы и статистика, 1997. -368 с.

24. Дракин В.И., Попов Э.В., Преображенский А.Б. Общение конечных пользователей с системой обработки данных. М., "Наука", 1989. 294 с.

25. Дубров A.M., Лагоши Б.А., Хрусталев Е.Ю. Моделирование рисковых ситуаций в экономике и бизнесе: Учебное пособие/ Под ред. Б.А. Лагоши.-М.: Финансы и статистика, 1998.- 176 е.: ил.

26. Дьяконов В.Н. Справочник по алгоритмам и программам на языке бейсик для персональных ЭВМ. М.: Наука, 1989. - 240 с.

27. Егоров Ю.Н., Варакута С.А. Планирование на предприятии. М.: ИНФРА-М, 2001.-176 с.

28. Ефимов Е.И. Решатели интеллектуальных задач.- М.: Наука, Главная редакция физико-математической литературы, 1982. 320 с.

29. Журавлев Ю.И., Гуревич И.Б. Распознавание образов и анализ изображений.//Искусственный интеллект, кн. 2. Модели и методы/ под ред. Поспелова Д.А. М.: Радио и связь, 1990.- 324 с.

30. Забелин П.В. , Моисеева Н.К. Основы стратегического управления: Учеб. Пособие.- М.: Информационно-внедренческий центр "Маркетинг", 1998.195 с.

31. Интеллектуальные информационные системы.- Мн.: НТООО "Тетра-система", 1997.- 368 с.

32. Информационные системы в экономике. Под ред. Дика В.В.-М.: Финансы и статистика, 1997.-269 с.

33. Калянов Г.Н. Консалтинг при автоматизации предприятий. Подходы, методы, средства.- М.: СИНТЕГ, 1997.-316 с.

34. Карманов В.Г. "Математическое программирование", М. "Наука", 1986.216 с.

35. Карминский A.M., Нестеров П.В. Информатизация бизнеса.- М.: Финансы и статистика, 1997.- 416 с.: ил.

36. Кириллов В.И., Старченко A.A. Логика: Учебник для юридических вузов. -Изд. 5-е, пераб. И доп. М.: Юристь, 1998.- 256 с.

37. Кныш М.И., Перекатов Б.А., Тютиков Ю.П. Стратегическое планирование инвестиционной деятельности: Учеб. Пособие. СПб. Изд. дом "Бизнесс-Пресса". 1998.-132 с.

38. Князевская Н.В., Князевский B.C. Принятие рискованных решений в экономике и бизнесе.- М.:"Контур", 1998.- 160 с.

39. Ковалев В.В. Методы оценки инвестиционных проектов.- М.: Финансы и статистика, 1998.- 144 с.

40. Контроллинг в бизнесе. Методологические и практические основы построения контроллинга в организациях/ A.M. Карминский, Н.И. Оленев, А.Г. Примак, С.Г. Фалько. М.: Финансы и статистика, 1998.- 226 е.: ил.

41. Котлер Ф. Основы маркетинга: Пер. с англ. / Общ. ред. и вступ. ст. Е.М.Пеньковой. М.: Прогресс, 1990. - 736 с.

42. Кульба В.В., Ковалевский С.С., Косяченко С.А., Сиротюк В.О.

43. Теоретические основы проектирования распределенных баз данных. Серия "Информатизация России на пороге XXI века."- М.: СИНТЕГ, 1999, 660 с.

44. Ладенко И.С., Тульчинский Г.Л. Логика целевого управления. М.: Наука, 1988.-206 с.

45. Ларичев О.И., Мошкович Е.М. Качественные методы принятия решений. -М.: Наука. Физматлит, 1996. 188 с.

46. Лоусон Ч., Хенсон Р. Численное решение задач метода наименьших квадратов. М.: Наука, 1986. - 230 с.

47. Люстерник Л.А., Соболев В.И. "Элементы функционального анализа", М. "Наука", 1965.-315 с.

48. МалпасДж. Реляционный язык ПРОЛОГ и его применение. М.: Наука, 1990.-463 с.

49. Мамиконов А.Г., Цвиркун А.Д., Кульба В.В. Автоматизация проектировании АСУ. М.: Энергоиздат, 1981. 381 с.

50. Малышев Н.Г., Бернштейн Л.С., Боженюк A.B. Нечеткие модели для экспертных систем в САПР М.: Энергоатомиздат", 1991.-136 с. ил.

51. Мейер Д. Теория реляционных баз данных: Пер. с англ. — М.: Мир, 1987.608 е., ил.

52. Мелихов А.Н., Берншейн Л.С., Коровин С.Я. Ситуационные советующие системы с нечеткой логикой.- М.: Наука. Гл. ред. Физ.-мат. лит., 1990.- 272 с.

53. Мишенин А.И. Теория экономических информационных систем: Учебник.-4-е изд. доп. и перераб. М.: Финансы и статистика, 1999. — 240 е.: илл.

54. Моделирование языковой деятельности в интеллектуальных системах /под ред. Кибрика А.Е., Нариньяни A.C. М.: Наука, 1987. - 279 с.

55. Модин A.A., Зингер И.С., Коротяев М.Ф. Исследование и анализ потоков информации на промышленных предприятиях. М.: Наука, 1970. - 242 с.

56. Морозов В.П., Тихомиров В.П., Хрусталев Е.Ю. Гипертексты в экономике. Информационная технология моделирования: Учеб. Пособие.- М.: Финансы и статистика, 1997.- 256 е.: ил.

57. Нейронные сети. STATISTICA Neural Networks: Пер. С англ. М.: Горячая линия - Телеком. 2000. — 182 с.

58. Никольский A.A. Васильева Н.Э., Афанасьев В.А. Технология принятия управленческих решений. М.: Финансы и статистика, 1998. - 110 с.

59. Новиков Д.А., Петраков С.Н. Курс теории активных систем, Серия "Информатизация России на пороге XXI века"- М.: СИНТЕГ, 1999.-108 с.

60. Новости искусственного интеллекта №. М.: издательство Анвик, 1998.195.

61. Озкархан Э. Машины баз данных и управление базами данных. -М.: Мир, 1989.-695 с.

62. Ойхман Е.Г., Попов.Э.В. Реинжиниринг бизнеса.-М.: Финансы и статистика, 1997.-332 с.

63. Орловский С.А. Проблемы принятия решений при нечеткой исходной информации. М.: Наука. Главная редакция физико-математической литературы, 1981.- 208 с.

64. Ортега Дж., Рейнболдт В. "Итерационные методы решения нелинейных систем уравнений со многими неизвестными", пер. с англ. под ред. И.В.Коновальцева, М. "Мир", 1975.-612 с.

65. Осипов Г.С. Приобретение знаний интеллектуальными системами: Основы теории и технологии М.: Наука. Физматгиз, 1997,- 112 с.

66. Пападимитриу X., Стагинец К. Комбинаторная оптимизация. Алгоритмы и сложность. М.: Мир, 1985. - 510 с.

67. Писанецки С. Технология разреженных матриц. М., "Мир", 1988.- 411 с.

68. Поспелов Г.С. Искусственный интеллект основа информационной технологии. М.: Наука, 1988. - 280 с. ил.

69. Романов А.Н., Одинцов Б.Е. Советующие информационные системы в экономике: Учеб. Пособие для вузов.- М.: ЮНИТИ-ДАНА, 2000.- 487 с.

70. Романов В.П., Ачильдиев Е.Ю. Изделие М-400. Порядок работы службы информационного обслуживания пользователей ATJ1I.600.000 ИЭ5. НИИ "Восход", инв. № П-06882,1984г. 36 с.

71. Романов В.П. Государственная автоматизированная система "Выборы". Функциональный комплекс задач "Право". Описание применения. Общие сведения. ИРЦВ. 80179-01 31 01-1-ЛУ, 1996.-34 с.

72. Романов В.П. Интеллектуальные информационные системы в экономике. М., Изд-во "Экзамен". 2003,- 560 с.

73. Романов В.П. Модель итерационного поиска и отбора устойчивых словосочетаний. Вопросы спецрадиоэлектроники, вып.7, 1989 г., стр. 2432.

74. Романов В.П. Ситуационное представление данных и дедуктивные выводы в АСОУ. Вопросы спецрадиоэлектроники, вып.З, 1990 г., стр.36-42.

75. Романов В.П., Автоматизированная информационная система аппарата ВС РСФСР. Задача «Справка». Техническое задание. НИИ "Восход", 1989 г.- 12

76. Романов В.П., Автоматизированная информационная система по внешнеполитическим вопросам (АИС ВПВ). Подсистема Международно-правового управления. Техническое задание. 1990 г.- 15 с.

77. Романов В.П., Автоматизированная информационная система по внешнеполитическим вопросам (АИС ВПВ). Подсистема Международно-правового управления. Технический проект. НИИ "Восход", 1991 г.- 90 с.

78. Романов В.П., Бирюков А.В., Шемакин Ю.И. Концептуальное индексирование запросов в системе подготовки решений. Вопросы спецрадиоэлектроники, вып.2, 1990 г. стр. 18-25.

79. Романов В.П., Государственная автоматизированная система Российской Федерации «Выборы». Техническое задание на разработку функционального комплекса задач Право., НИИ "Восход". 1995.- 19 с.

80. Романов В.П., Гуков Л.И., Дадушко В.Н. Применение систолическихмассивов для поиска текстовой информации по ключевым словам. Вопросы спецрадиоэлектроники, вып.7, 1989 г., стр. 41-49.

81. Романов В.П., Журавлев C.B. ГАС «Выборы». Функциональный комплексзадач Право РБД. Описание применения. НИИ "Восход", 1997 г.-90 с.

82. Романов В.П., Королева Г.А. Математическая модель генерации потокаобращений в справочно-информационный фонд. Научно-техническая информация, сер.2, №7, 1979 г., стр. 22- 28.

83. Романов В.П., Королева Г.А. Разработка АСУ ГСНТИ. Отчет по НИР. №

84. Госрегистрации 72034347, Б6442092, 1974.- 598 с.

85. Романов В.П., Павлов И.К. Рабочий проект по задаче "Кадры". АТЛ1.600.126.ТО. НИИ "Восход", 1985 г.- 70 стр.

86. Романов В.П., Полякова М.П. ГАС «Выборы». Функциональный комплекс задач. Право версии 2.0. Техническое задание. НИИ "Восход", 1998г. -13 стр.

87. Романов В.П., Солянкин Н.Н, Модель адаптации в информационной системе организационного управления . Вопросы спецрадиоэлектроники, вып. 1 1985 г. стр. 35-43.

88. Романов В.П., Тарасов Е.В., Кулебякин А.З. Техническое задание на создание сети автоматизированных центров научно-технической информации. Изд-во ВИНИТИ.- М.: 1988.- 26 с.

89. Романов В.П., Теоретические основы информатики. Информационные структуры и фактографический поиск информации. М., Изд-во РЭА им. Г.В.Плеханов. 1996.-190 с.

90. Романов В.П., Теоретические основы информатики. М., Изд-во РЭА им. Плеханова, 1993. -159 с.

91. Романов В.П., Федорец О.Л. Рабочий проект по задаче "Письма". АТЛ1.600.126.ТО. НИИ "Восход", 1985.- 70 стр.

92. Романов В.П., Шемакин Ю.И., Воронин В.А. Технический проект по спецсистеме. Информационное обеспечение. Лингвистическое обеспечение поиска информации АТЛ1.600.100 ПЗ/16. НИИ "Восход", 1980 г., инв. №ТП0-ТНЗ.: 1977 .-115 с.

93. Романов В.П., Шемакин Ю.И., Игнатьев А.Б. Реализация итерационного поиска средствами матричной обработки. Вопросы спецрадиоэлектроники, вып.6, 1987 г.,46-53.

94. Романов В.П., Шемакин Ю.И., Константинова И.Л. Повышение эффективности поиска посредством адаптации тезауруса к информационной потребности пользователей и составу информационного фонда. Вопросы спецрадиоэлектроники, Вып. 15, 1980г. стр. 76-85.

95. Рубашкин В.Ш. Представление и анализ смысла в интеллектуальных информационных системах. М.: Наука, 1989. - 190 с.

96. Савчук В.П., Прилипко С.И., Величко Е.Г. Анализ и разработка инвестиционных проектов. Учебное пособие. - Киев: Абсолют-B, Эльга, 1999.-304 с.

97. Скотт Д.С. Области в денотационной семантике. Математическая логика в программировании: Сб. статей 1980-1988 гг. Пер с англ. М.: Мир, 1991 -стр. 58- 118.

98. Стратегическое планирование / Под ред. Уткина Э.А. — М.: Ассоциация авторов и издателей «ТАНДЕМ». Издательство ЭКМОС, 1998. 440 с.

99. Тауб Дж., Васильковский X., Вожьянковский X. Информация, неопределенность, сложность. М.: Мир, 1988. - 183 с.

100. Тельнов Ю.Ф. Интеллектуальные информационные системы в экономике. Учебное пособие. Серия "Информационная Россия на пороге XXI века".-М.: СИНТЕГ, 1999,216 с.

101. Тиори Т., Фрай Дж. Проектирование структур баз данных: В 2-х кн. Кн. 1 Пер. с англ.- М.: Мир, 1985. 287 е., ил.

102. Тиори Т., Фрай Дж. Проектирование структур баз данных: В 2-х кн. Кн. 2 Пер. с англ.- М.: Мир, 1985. 320 е., ил.

103. Трахтенгерц Э.А. Компьютерная поддержка принятия решений: Научно-практическое издание. Серия "Информатизация России на пороге XXI века".- М.: СИНТЕГ, 1998 376 с.

104. Фальцман В.К. Оценка инвестиционных проектов и предприятий. М.: 1999.-207 с.

105. Фатхутдинов P.A. Разработка управленческого решения: Учебник для вузов.- 2-е изд., доп.- М.: ЗАО "Бизнес-школа Интел-Синтез", 1998.- 272с.

106. Хаббард Дж. Автоматизированное проектирование баз данных.: Пер. с англ. М.: Мир, 1984.

107. Черный А.И. Введение в теорию информационного поиска. М.: Наука, 1975.-238 с.

108. Чечкин А.В. Математическая информатика. М.: Наука, 1991.- 412 с.

109. Шемакин Ю.И. Введение в информатику. М.: Финансы и статистика, 1985.- 190 с.

110. Экономическая стратегия фирмы: Учебное пособие/ Под ред. проф. Градова А.П.-СП6.: "Специальная литература" 1998. 411 с.

111. Экспертные системы. Принципы работы и примеры: Пер с англ./ А.Браунинг, П.Джонс, Ф. Кокс и др., Под ред. Р. Форсайта. М.: Радио и связь, 1987.-224 е.: ил.

112. Юдин Д.Б. Вычислительные методы теории принятия решений. М.: Наука, 1989. - 320 с.

113. Alterman R. A Dictionary Based on Concept Coherence //Artificial Intelligence, vol. 25, 1985, p. 153-181.

114. Bernardo, J. and A. Smith. (1994). Bayesian Theory. New York: John Wiley and Sons.- 342 pp.

115. David W. Embley. Object Database Development. Concepts and principles. Addison-Wesley, 1998.- 877 pp.

116. Efraim Turban, Jay E. Aronson. Decision Support Systems and Intelligent Systems, 1998.-351 pp.

117. Eom S.B. Decision support systems research: reference disciplines and a cumulative tradition. The International Journal of Management Science, 23, 5, October 1995, p. 511-523.

118. Ginzberg M.J., Stohr E. A. A decision support: Issues and Perspectives. -Processes and Tools for Decision Support. Amsterdam, North Holland Publ. Co, 1983.- 290 pp.

119. Golub G.H., Van Loan Ch. F. Matrix Computations. London: North Oxford Acad, 1986. - 476 p.

120. Heckerman, D., D. Geiger and D. Chickering. (1995). Learning Bayesian networks: the combination of knowledge and statistical data. Machine Learning 20: 197-243.

121. Howard, R. Decision analysis: perspectives on inference, decision, and experimentation. Proceedings of the IEEE v.58: 1970. pp. 632-643.

122. Koslowski, P . Neuro- Fuzzy Techniques for Intelligent Information Systems. 1999.-479 pp.

123. Lauritzen, S. Graphical Models, Cleverendon Press.-1996.- 420 pp.

124. Lecture Notes № 58. Logic, Language and Computation, vol. 1. Ed. By Jerry Seligman & Dag Westerstàhl. CSLI Publications, Stanford, California. 1997, 590 pp.

125. Lewandowski, A., Wierzbicki A.P. Aspiration Based Decision Support Systems, Lecture Notes in Economics & Mathematica Series #331, 2000.- 271 pp*

126. Motoda, H., Lu, H. J., Liu, H. Knowledge Discovery & Data Mining: Techniques & Applications. World Scientific. 1997, 359 pp.

127. Omlin, Christian W. Knowledge Acquisition & Representation in Reccurrent Neural Networks: Progress in Neural Processes, 1998.

128. Pau, Lois F. Economic&Financial Knowledge-Based Processing, 2000.-4521. PP

129. Pearl, Judea. Probabilistic Reasoning in Intelligent Systems: Networks of Plausible Inference. Morgan Kaufmann Publishers, Inc. 1998.- 552 pp.

130. Proceedings, Lecture Notes in Computers. Science Series #1676, 1998. -678 pp.

131. Robert M. Colomb. Deductive Databases and Their Applications. Taylor&Francis. 1998.- 263 pp.

132. Robert R.Trippi, Jae K. Lee. Artificial Intelligence in Finance&Investing. IRWIN Professional Publishing. 1998.- 246 pp.

133. Rose D.J., Tarjan R.E., and Lueker G.S. Algoritmic aspects of vertex elimination on graphs. SIAM J.Comput .5, 1976, pp : 266-283.

134. Salton G., Voorhes E., Fox E.A. A Comparison of two methods for boolean query relevancy feedback.// Information Processing & management, vol. 20, 1984, pp. 637-651.

135. Simon H.A. The new science of management decision. Englewood Cliffs, N.J., Prentice Hall Inc.- 1975.- 365.

136. Simonovic A., Slobodan P. Decision support for sustainable water resources development in water resources planning in a changing world. -Proceeding of International UNESCO symposium, Karlsruhe, Germany, p. III., 1994, pp: 3-13.

137. Slovic P., Fichhoff B., Lichtenstein S. Behaviorial decision theory. Annu. Phychol. Rev. vol. 28, 1997, pp: 74- 82.

138. Tarjan R.E. Depth first search and linear graph algorithm. SIAM J.Comput.l, 146-160, 1972, pp: 146-160.

139. Tjoa, A.M.,Mohania,M. Data Warehousing & Knowledge Discovery: First International Conference DaWaK'99, Florence, Italy, August 30- September 1,1999, pp: 341-360.

140. Winkler, R. The assessment of prior distributions in Bayesian analysis. American Statistical Association Journal v. 62, 1967, pp: 776-800.