автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.06, диссертация на тему:Исследование и разработка методов анализа и обеспечения достоверности информации о НИР в области медицины

кандидата технических наук
Волков, Игорь Алексеевич
город
Москва
год
1990
специальность ВАК РФ
05.13.06
Автореферат по информатике, вычислительной технике и управлению на тему «Исследование и разработка методов анализа и обеспечения достоверности информации о НИР в области медицины»

Автореферат диссертации по теме "Исследование и разработка методов анализа и обеспечения достоверности информации о НИР в области медицины"

 МОСКОВСКИЙ ОРДЕНА ТРУДОВОГО КРАСНОГО ЗНАМЕНИ ИНЖЕНЕРШ-ФИЗИЧЕСКИЙ ИНСТИТУТ

На правах рукописи

ВОЛКОВ Игорь Алексеевич

УДК 681.5.017 : 61.001.89

. ИССЛЕДОВАНИЕ И РАЗРАБОТКА МЕТОДОВ АНАЛИЗА И ОБЕСПЕЧЕНИЯ ДОСТОВЕРНОСТИ ИНФОРМАЦИИ 0 НИР В ОБЛАСТИ МЕДИЦИНЫ

05.13.06. - Автоматизированные системы управления 14.00.33. - Социальная гигиена и организация здравоохранения

' АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Мэсква - 1990

— — 1 ! 1

Работа выполнена во Всесоюзном Научно-Исследовательском Институте Систем управления, Экономических исследований и Научно-Технической Информации. Научные руководители: кандидат технических наук, доцент ЕЭ. Вэльфенгаген; кандидат медицинских наук А. К Ханьков Официальные оппоненты: доктор технических наук, профессор Ы. А. Ястребенецкий. кандидат технических наук А.Е Оганесян. Ведущая организация :

указана в решении специализированного совета. Защита состоится "/" сиеЖ.^'к^ 1990 г. в час.

т-

з/рове

_мин. на заседании специализированного совета Д053.03.04

в Московском инженерно-физическом институте по адресу: 115409, Москва, Каширское шоссе , д. 31 тел. 324-84-98.

С диссертацией можно ознакомиться в библиотеке МИФИ.

Автореферат разослан " "_ .

Просим принять участие в работе совета или прислать отзыв в одном экземпляре, заверенный печатью организации.

Ученый секретарь

специализированного совета ^ А. Д. Модяев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы исследования. Курс ЦК КПСС на перестройку организационной и экономической структуры управления народным хозяйством предъявляет повышенные требования к .качеству работы автоматизированных систем управления (АСУ). "Основные направления экономического и социального : развития СССР на 1986-1990 г. г. и на период до 2000 года" и Постановление ЦК КПСС и СМ СССР об общегосударственной I программе создания, развития, производства и эффективного ! использования вычислительной техники и автоматизированных систем на период до 2000 года указывают на необходимость развития и совершенствования автоматизированных систем уп- | равления с использованием технологии искусственного интел- \ лекта и совершенных средств общения человека с ЭВМ. ;

Среди факторов, влияющих на показатели эффективности и ! качества АСУ, важную роль играют методы и средства проекта- 1 рования. Применение эффективных методов и средств проектирования для задач анализа данных (в частности, контроля информации) в АСУ позволяет, с одной стороны, снизить затраты на их создание, сократить сроки разработки, с другой -обеспечить более глубокое исследование объекта управления, определить наиболее эффективные средства использования вычислительной техники и математических методов. Бее это определяет величину экономического эффекта от АСУ .

Диссертация посвящена разработке методов и средств проектирования программного обеспечения для задач анализа данных ( в частности, контроля информации) в автоматизированных системах управления (АСУ) с целью совершенствования технологии проектирования, снижения трудоемкости разработки ! . и повышения эффективности их эксплуатации. |

В ряду основных задач в программах научно-техническо- | го прогресса стоит создание автоматизированных систем уп- < равления (АСУ) с использованием технологии искусственного интеллекта и эффективных средств общения человека с ЭВМ. Совершенствование технологии проектирования информацион-

но- программного обадпёчйм 1

ных вопросов их разработки. !

Цель работы. Целью работы является исследование, теоре- \ тическое обоснование, инженерная реализация и практическое ; внедрение инструментальных средств для задач анализа и \ обеспечения достоверности (защите от ошибок). информационно- ! го обеспечения АСУ. Среди различных подходов к проблемам | проектирования систем анализа данных (САД) АСУ активно развиваются концептуальные методы проектирования на основе се- | мантических сетей. 1

Исследования проводились в направлении комплексного решения следующих задач • • ;

- исследовать теоретические основы концептуального про- ; ектирования САД АСУ НИР медицинского профиля, обеспечиваю- : щие адекватное отображение предметной области по специфика- ' циям, базирующимся на понятиях конечного пользователя; !

- разработать инженерные методы проектирования САД на основе семантических сетей таблиц решений; :

- использовать полученные результаты при разработке про- ; мьшленной технологии конструирования и производства САД | АСУ в системе АМН СССР и Ыинмедпрома СССР. |

Штоды исследования. В диссертации использованы теория | пар, методы искусственного интеллекта, методы кластерного I анализа, методы экспертных оценок, методы многомерного шкалирования и аппарат таблиц решений.

Научная новизна работы. Новыми научными результатами, полученными лично автором, и основными положениями, выносимыми на защиту, являются: I

1. схема проектирования систем анализа данных для задач | контроля информации в АСУ на примере АМН СССР и Ыинмедпрома СССР; |

2. вычислительная модель языка проектирования САД;

3. новый метод формализации элементов задач анализа данных, описанных с помощью таблиц решений и отношений естественного языка;

4. лингвистическая и семантическая модели решения задач ! анализа данных ыедивобиологического профиля с использовани- !

ем теории пар и семантических сетей;

5. архитектура и функциональный состав САД, включающие операции по созданию базы данных, базы знаний и разнообразные сервисные операции.

Практическая значимость и внедрение результатов. Разра- | ботана инструментальная диалоговая система САД в исчислении i предикатов первого порядка, допускающая общение с помощью ¡ таблиц решений и включающая сервисные средства, позволяющие ! получать информацию о системе в процессе работы, что снижа- i ет требования к знанию пользователем методов логического вывода и языков представления знаний.

Ш базе системы САД построена подсистема контроля информации АСУ АШ СССР и Минмедпрома СССР.

Разработана система обмена данными (СОД) на базе таб- ¡ лиц решений, позволяющая обеспечить информационную связь ВЦ Президиума АМН СССР в рамках АСУ отрасли с другими ВЦ АМН ■ СССР и Ю СССР. Система обмена данными объединяет в локажъ- | ную сеть ICL 2904 и две ГОШ ICL 1500. Связь между ЭВМ и j ГОШ происходит по протоколу канала RS-232. Была опробована i связь по каналу RS-232 и ICL 2904 и ПЭВМ "Apricot" (аналог IBM PC/XT).

Система САД и система обмена данными (СОД) внедрены:

- в виде подсистемы, используемой при эксплуатации АИСПУ-Ш ВНШШ МЗ СССР; '

- в виде программного обеспечения для информационных подсистем Президиума АМН СССР:

1. МЕДЕЮ - подсистемы для учета отечественного и импортного оборудования НИУ АШ СССР;

2. ЫЕДУКС - подсистемы для обработки показателей отчетности государственных капитальных влодений, анализа пятилетних планов капитального вложения и для обработки технической документации; ;

3. МЕДЭКС - подсистемы для обработки фактографической ] и экспертной информации об организационной и научной дея- j тельности научных советов и проблемных комиссий;

4. МЕДНИР - подсистемы для анализа планов НИУ по тема- j

_HI______________................1

тическим и отчетным картам.

Программное средство "Программа проверки вводимой информации" принято в ГОСФАП N П006116.

Программное средство "Система обмена данными" принято в информационную часть ГОСФАП N 50850000111. |

Разработанное методическое и программное обеспечение | внедрено в виде системы поддержки принятия решений "Конкурс" в рамках проводимого Экспертным советом при Институте | питания АМН СССР конкурса предложений по формированию Государственного заказа здравоохранения. Диссертационная работа велась в рамках научно-технической проблемы ТОП N 0.80.10 ! " Создать новые и усовершенствовать действующие АСУ в сфере . торговли, просвещения, культуры и здравоохранения" в соот- ; ветствии с приказом Минздрава СССР N 1285 " О совершенство- ; вании методов и форм организации и управления медицинской I наукой" по техническому заданию ГКНГ N 0.80.10.04.28.06 1 "Разработать и ввести в эксплуатацию комплексы взаимосвязан- : ных задач подсистемы планирования и учета научно-исследова- | тельских работ АСУ различных уровней", |

Диссертация выполнена в ВЦ Президиума АМН СССР, от- ! деле систем организации управления ВНИИСЭНГИ НПО "Медбио-экономика", кафедре "Кибернетики" МИФИ и полностью соответствует тематике работ по планам новой техники и подготовки производства, тесно связана с разработкой промышленной тех- | нологии конструирования к производства АСУ . ;

.Апробация. Результаты диссертационной работы докладыва- 1 лись на конференциях и научных семинарах, в том числе: |

- на межведомственной комиссии по приемке технорабо-чего проекта на Автоматизированную систему обработки информации Президиума АМН СССР (1 очередь}- Постановление ГКНГ 1 N 332 от 24.07.80 N гос. регистрации 81012554. АМН СССР, ! Москва, 1982; !

- на межведомственной комиссии по приемке в промышленную эксплуатацию Комплекса Взаимосвязанных Задач "Планирование и учет НИР" АСОИ Президиума АМН СССР - задание ГКНГ ! и Госплана СССР N. 0.80.10.04.28.06. А2 N гос. регистрации \ 589.1897624.00557. АМН СССР, Москва, 1985; '

- на 5-ом Всесоюзном симпозиуме "Проблемы системотехники", Ленинград, 1983;

- на 4-ом Всесоюзном симпозиуме по применению математических методов и ЭВМ в медикобиологйческих исследованиях, Гагры, 1985;

- на семинаре "Концептуальное проектирование банков I данных", МДНТП, 1986, 1989; !

- и еще на 7 Всесоюзных конференциях. Основные поло- ; линия работы изложены в 9 печатных работах и 3 научно-технических отчетах.

Структура работы. Диссертация состоит из введения, 4-х ! разделов, заключения, списка литературы и 7 приложений;содержит 231 страницу машинописного текста, в том числе 14 < рисунков и 4 таблицы, список литературы из 69 наименований | и 7 приложений. |

СОДЕРЖАНИЕ РАБОТЫ |

В первом разделе диссертационной работы проанализированы особенности проектирования систем анализа данных. Приведена общая характеристика предметной области,проанализированы ее особенности, связанные с реальными условиями АСУ АМН СССР и Минмедпрома СССР.

Анализ организации вычислительного процесса на всех этапах проектирования (на примере АСУ Президиума АМН СССР и Минмедпрома СССР) показал, что основными проблемами здесь являются: разработка удобного лингвистического интерфейса с пользователем, создание лексической, семантической и функциональной модели диалога, а также технология организации обработки информации. ; |

Требование достоверности информации является сущест- • ! венным для любой системы управления, но для АСУ оно стано- | вится жизненно необходимым. Это объясняется высокой эконо- { мической ценой ошибок, большим объемом обрабатываемых дан- ; ных и широким использованием технических средств связи и ЭВМ. Если в системах с ручной обработкой данных руководитель любого подразделения в принципе имеет возможность про- |

1____ш___________________'_________!

верить работу каждого сотрудника, то при использовании ЭВМ подобная проверка практически исключена. Это связано с отсутствием общей технологической и информационной модели анализа и контроля часто меняющихся форм документов, моде- ; ли, позволяющей формальными средствами проводить обработку документов, поступающих на вход АСУ, причем процесс анализа и контроля конкретного документа приходится вести в инте- ! рактивном режиме путем перебора различных методов обработки I информации на основе знаний пользователя ЭВМ. Специальный , ) информационный поиск, проведенный автором и сотрудниками | ШИШИ МЗ СССР в ГОСФАП СССР, показал, что, несмотря на пот- | ребности практики, работы по обеспечению достоверности ин- ; формации о НИР в медицине находятся в стадии постановки за- ; дачи. |

При анализе задачи проектирования систем анализа данных в АСУ, в диссертации выработана общая характеристика предметной области и выделены следующие особенности систем > анализа данных в АСУ научно-исследовательскими учреждениями | (НИУ): I

- сложность организационной структуры систем управления НИУ, наличие значительного количества объектов управления (в АМН СССР более 400 НИУ, в Минмедпроме СССР более 600 НИУ), объединенных большим числом связей различной природы; !

- высокая динамичность изменений в структуре и процес- ! се функционирования самих объектов управления (организация ! финансирования, поставка оборудования и т. д.); !

- многоаспегегвость процесса управления и нечеткое за- ; дание критериев и целей лицами, принимающими решения (ЛПР). 1

Опыт решения информационных задач АШ СССР и Шнмед- | прома СССР показал, что при анализе данных на яепротиворе- | чивость и достоверность, необходимо учитывать знания и осо- | бенности описания объекта управления каждым экспертом или ЛПР , т.е. использовать технологию экспертных систем (ЭС). ;

В работе дана общая характеристика технологии и сформулированы основные требования к проекту систем анализа и обеспечения достоверности информации в АСУ:

-удобство общения с ЭШ за счет лексической и графичес- |

!

_______!£]._

мой модели диалога; |

-распознавание ситуаций анализа данных в условиях не- !

полной или нечеткой информации за счет наличия в базе зна- ! ний системы концептуальной модели предметной области ;

-выбор определенной модели-, решения задачи анализа ин- |

формации, используя вычислительную модель базы знаний ; I

-организация взаимодействия БЗ пользователя с интегри- 1 рованной БЗ системы и возможность информирования пользователя о ходе вычислительного процесса;

-возможность расширения.лексического словаря БЗ системы и другие сервисные операции.

На основании исследования в работе особеннностей систем анализа данных в АСУ НИУ (на примере наиболее известных

программных систем) сделан вывод; что современные системы ;

анализа данных в СССР используют традиционный математичес- ; кий аппарат систем управления базами данных (СУБД), который

недостаточно, эффективен и не предназначен для описания про- |

цесса обеспечения достоверности информации, исходя из кри- '

териев ЛПР. Схема проектирования требует либо участия спе- <

циалистов на прикладном, математическом и программном уров- 1

нях разработки системы, либо квалифицированных программист- |

ских навыков от пользователя. Существующая технология обра- !

ботки информации обеспечивает структурную непротиворечи- |

вость при,полной фиксации схемы контроля, что неэффективно |

при динамически изменяющихся формах документов АСУ отрасли. ! В данной работе применяется технология экспертных систем (ЗС) , требующая создания схемы проектирования, использующей по сравнению с нефиксированной семантической структурой

базы знаний (БЗ) в инструментальных ЭС специальную семанти- !

ческую структуру БЗ о НИР. I

В работе принято, что достоверность информации опреде- |

ляется достоверностью элементов данных и связей между ними. |

Определены основные задачи для отображения предметной об- |

ласти АСУ в концептуальную, логическую и физическую струк- !

туру БЗ АСУ. ;

Показано, что эффективным дополнением к традиционным

методам анализа НИР является системный подход, разрабатыва- <

емый автором, основанный на теории пар, многомерном икали- ) реванш и теории нечетких множеств. Этот подход при постро- | ении моделей анализа данных позволяет: !

- использовать для описания компонентов задачи анализа ; данных приближенные, субъективные оценки экспертов, выраженные с помощью нечетких понятий, отношений и таблиц реше- ; ний, которые используются для представления высказываний | естественного языка в ЭВМ;

- формализовать качественные понятия, отношения и выс- I называния на основе использования лингвистической перемен- I ной и нечеткого отношения;

- оперировать полученными формализованными представлениями в соответствии с процедурами построения моделей БЗ;

- представлять результаты решения задачи с помощью | таблиц решений и отчетов произвольной формы. (

Показано, что в целях ускорения вычислительного про- | цесса необходимо загрузить БД системы на терминальную ПЭВМ, | входящую в состав многомашинного комплекса АСУ отрасли, тем ;' самым сделав эту ГОШ интеллектуальным терминалом. Благода- | ря такой архитектуре конечный пользователь будет обеспечен удобными средствами общения с ЭВМ и мощными вычислительными средствами с развитой периферией и высокой скоростью вычис- |. лительных процессоров АСУ . !

Во втором разделе работы приведены теоретические основы метода проектирования САД, изложены основные принципы построения логико-лингвистических моделей при нечеткой исходной информации о различных элементах объекта управления , на основе разрабатываемого автором подхода. Рассмотрена ме- ; тодика решения задач классификации предметной области с целью обеспечения операций абстракции и специализации объ- ; ектов АСУ. |

Большое внимание в диссертации уделено выработке тре- > бований к диалогу и самому процессу человеко-машинного общения с учетом специфики предметной области, от эффективной | реализации которых зависят удобство, естественность и ско- I рость общения. Эти требования рассмотрены с точки зрения I таких критериев, как лаконичность, обучаемость, расширяв- !

ЗАДАЧИ

Концептуальная модель ПО

ТЕОРЕТИЧЕСКИЙ УРОВЕНЬ

Теория пар, -> кластерный анализ

многомерное шкалирование

СИСТЕМНЫЙ • УРОВЕНЬ

Описание объектов > и признаков ПО

Вычислительная модель БЗ

Аксиоматическая -> теория языка К

Описание базовых -> правил анализа данных

Алгоритмическое обеспечение

Аппарат таблиц -> решений

Схема взаимодействия -> правил БЗ и ограничений пользователя

Интерфейс

с пользователем —

I

V

Лингвистическая ■>и графическая модель диалога

Схема диалога

—>

Рис. I. Схема проектирования САД.

ПРОГРАММНЫЙ УРОВЕНЬ

Классификатор

>

V

Коррелятор

>

I

V

Анализатор

>

У

Генератор

шсть и время отклика системы. Исследования основаны на анализе материалов лингвистических обследований, проведен- ] ных для 4-х предметных областей - подсистем АСУ Президиума | АМН СССР. В работе показано, что формы документов и запро- !■ сов конечных пользователей информационных подсистем являют- ¡ ся лексически достаточно близкими подмножествами. Сделан ¡ вывод, что внутренняя формализованность и функциональная | определеннсть каждого документа изапроса, наличие конкретных модельных ситуаций анализа информации достаточны для | разработки концептуальной и вычислительной модели БЗ АСУ . ] НИР отрасли. |

В работе исследованы существующие подходы к проектиро- ■! ванию систем анализа и обеспечения достоверности информации ;

. САД в АСУ и показано, что схемы проектирования подобных | систем в области медицины находятся в стадии становления. Отмечено, что подобные системы ориентированы в основном на технологию вычислительного процесса, использующую СУБД без ; интегрированной базы знаний; они не обладают средствами ! разбиения исходной сложной задачи анализа информации на от- j дельные подзадачи, решаемые тем или иным процессором. В • связи с этим при разработке схемы проектирования САД, ocho- j ванной на технологии экспертных систем, центр тяжести смещается с лингвистического процессора ( выполняющего традиционные функции - синтаксический и семантический анализ от- ' дельных предложений документов), на семантический и прагматический процессоры, работающие на основе представления I знаний о предметной области в интегрированной БЗ АСУ- Про- j цессы интерпретации запроса на анализ информации в значи- 1 тельной степени определяются тематической структурой диало- ! га, зависящей от информационной подсистемы АСУ отрасли. \

В связи с этим при построении теоретических, основ ме- | тода проектирования САД автором выделены три основные зада- ; чи, для решения которых потребовалось провести теоретические исследования. На базе теоретических иследований выделены три уровня разработки, в рамках уровней выделены этапы раз- ] работки САД - Рис.1. j

Основное назначение разработанной в диссертации схемы j

• ......_J

______„ли..;.........................I

проектирования заключается в отражении специфики предметной области АМН СССР и Минмедпрома СССР и различных подходов к анализу медикобиологической информации каждым конечным пользователем системы. Схема проектирования создавалась, исходя из следующих условий: эксперты, инженеры знания, пользователи и ЭВМ рассматриваются как единая информационная система ; модель диалога описывает функционирование системы при ограничениях, задаваемых экспертами, инженерами знания и пользователями, осуществляющими настройку базы знаний на конкретную задачу анализа информации; тематическая и целевая структура диалога рассматриваются как единая тематическая структура диалога о НИР, причем настройка на уровне представления знаний предусматривается лишь на тематическом уровне, несущем основную смысловую нагрузку диалога, а знания о глобальной и локальной структуре диалога представлены процедурно.

Предлагается описание модели процесса анализа данных (М пр), как лексической экспертной системы,в виде стандартной аксиоматической четверки: м пр - ( г, е, и, п),

где Ъ - знаки языга, Е - правила синтаксиса, и - аксиомы, П - правила вывода, позволяющие из исходных аксиом получать новые правила решения (высказывания). При необходимости, множество принимаемых САД решений может содержать обращения к субъекту. Это происходит, когда в некоторой ситуации возможно принятие решений,а факторы, определяющие выбор одного из них, пока не выявлены.

С учетом условий и отмеченных особенностей предметных областей АСУ модель диалога (М д) САД состоит из лингвистической, вычислительной моделей и модели языка представления знаний (рис.1).причем прагматическая часть диалога описывает тематическую взаимосвязь персональных БЗ и интегрированной БЗ АСУ, реализованных в виде семантической сети таблиц решений. Таким образом, задача организации диалогового режима САД сводится к построению отображения знаний пользователя в семантическую сеть таблиц решений.

При решении первой задачи теоретического уровня - кон_____________ш...................................;

цепгуадьного описания 1Ю - использованы методы многомерного шкалирования и кластерного анализа В ходе описания структуры ПО разработана методика решения задач классификации САД,которая состоит из трех этапов:

- на первом этапе эксперт и инженер знания выбирают

. меры близости объектов. В качестве наиболее приемлемых для I описания ПО в результате эксперимента признаны меры близос- I ти Фреше-Никодима и Хемминга; !

- на втором этапе эксперт или пользователь производит [ выбор шкалы измерения концептов конкретного документа. В работе показана и обоснована необходимость комбинирования различных шкал измерения, а именно: номинальной, порядковой, отношений и интервальной, причем у пользователя остается возможность ввести свою шкалу измерений;

- на третьем этапе САД автоматически выдвигает гипотезы о взаимосвязи объектов и признаков в психологическом пространстве пользователя и эксперта. На выходе из системы полу- : чаются классы близких объектов, понятия, характеризующие I класс и иерархию классов в психологическом пространстве пользователя или эксперта. Таким образом, создана методика, использующая методы многомерного шкалирования и кластерного' анализа для введения упорядоченности на классах объектов • ПО. .

В ходе решения задачи построения вычислительной модели БЗ принято положение, что модель диалога состоит из трех моделей : лингвистической , вычислительной и модели языка представления знаний пользователя.

Основными свойствами лингвистической модели языка опи-, сания проекта САД являются формальная расширяемость и возможность параллельных вычислений. Лингвистическая модель (Мд) состоит из тройки :

Мл- см>

где V - структура словарей;

й - способы поровдения выражений; !

М см - семантическая модель. |

Семантическая модель (М см) САД является параметрической, где параметром являются подсистемы АСУ отрасли. |

_____________Ш_________...................;

Дальнейшая детализация семантической модели стандартным образом привела к описанию множества запросов, множества моделей, множества значений и оценочной функции:

М см (р) - { Sent.M,V,Val > где р - параметр подсистемы АСУ,

Sent- множество запросов, состоящее из конъюнктивных и дизъюнктивных формул,

М - множество моделей ПО. Основные концепты:

s - способ, г - ресурсы, i - приоритетность, о -объект, g - цель, t - время; V - множество значений концептов:

Vi, Vt - порядковая и интервальные шкалы, Vs,Vo, Vr,Vg - номинальные шкалы; Val - оценочная функция Val: (Sent х Val ) -> V. Особенностью синтаксических ограничений является положение, что следствие зафиксировано,( т.е. на выходе из системы мы должны получить ответ, является ли данная информация достоверной или она ошибочна).

При разработке Ш языка проектирования R, описывающего базовые правила анализа данных, использован аппарат упорядоченных пар, отражающих специфику Ш. Схема вычислительной модели языка R стандартным образом состоит из алфавита, ин-I дивидной константы, переменных и формул.- Базисный формализм ; аппарата теории пар расширен за счет введения операторов ': структурного программирования и маркеров процесса.

Аксиомы порождения выражений теории пар были расширены на этапе создания вычислительной модели группами аксиом логических выводов, процесса и сокращения. Для описания логических выводов о достоверности информации -введены аксиомы логических выводов: А( 0) Svxvyl А( х) &А( у) ;=> А( С х, у]) У=> лгхАС х) Г<~ >0-0;

F<—>10-0; ¡

if A then В else С <—> ASBvTA&C, I

где 0 - индивидная константа, х, у - переменные, А, В, С- ! формулы, Т, F - логические фомулы. \

Аксиомы процесса введены для разбиения задач на подза-

■ _____ т___'___________l.„J

дачи и введения иерархии вычисления: ! ! do Т - done Т ;do F - done F ;do т A - Tdo A, j где do и done - маркеры начала и конца вычислительного j процесса. • Для описания дерева решений и сокращения формул в ра! боте введены аксиомы сокращения: I ) (do А!) <—> do А ; (done F)! <—> done F; • i (done T)! <--> done T ; J ; дД done V: - a and A) v F --> ОД done V:- a and A) or B>! ! Весь этап формализации структур БД и БЗ выполнен в рамках языка R (языка предикатов первого порядка). Расс- ■ , мотрим пример описания на языке R правила БЗ:"Анализируе-- мые документы имеют связь по цели, если цели совпадают или i являются подцелями общей цели":

I do if Prl (xi, Х8) and Prl (xj, X8)and Prl ('xm, XI) ' ! and Prl3 (xm, xj)and Pri (xl, XI) and Prl3 (xl,xj)

j and PrlO (xm, xl) and Рг2 (хш, У2) \

j then Prll (Pr6 (xl, xj, X2) - T, \.

j где Prl - отношение "быть элементом класса", Рг2 - отноше- |

| ние "иметь имя", Ргб - отношение "иметь связь", Prl0 - от- j

| ношение "быть равным", Prll - отношение "быть выявленным", ■ |

| Рг13 - отношение "являться частью", Л - понятие "элементы i

j характеристик", У2 -понятие "цель", 78 - понятие "элементы >

I задач", xi, xj - характеристики первого и второго докумен- j

| та НИР, xm, xl - характеристики других документов БД НИР. j

| Данный метод формализации документов НИР ' позволил • j

! обеспечить внутреннюю непротиворечивость БЗ системы - Рис.!. . ;

\ - <

I При.исследовании задачи описания ограничений и правил !

j контроля информации в работе выдвинута и обоснована кон- j

i цепция языка представления знаний Т в САД - языка таблиц I

' решений (TP). В диссертации разработано формализованное •

I описание языка Т, как входного языка пользователя САД. '

j Основной особенностью данного языка является наличие ; семантической сети таблиц решений, описывающих взаимосвязь процессов анализа информации. Разработана методика отображения знаний эксперта и пользователя в дизъюнкты ТР. Язык

ТР_ позволил осуществить одну из практических целей созда-______j

________________[¿Щ_________L______;____I

"нш~Ш^-'~66есШщ?ть удобный' интерфейс" с' непрограммирующим пользователем.

Вся БЗ САД разбивается на данные и процессы обработки. Каждый процесс обработки может быть разбит на подпроцессы и так до тех пор, пока не достигается возможность формализации контроля информации с помощью ТР.

Третий раздел диссертации посвящен инженерным методам проектирования САД, проведено подробное описание разработанной автором архитектуры системы, алгоритмического, программного и информационного обеспечения САД.

В данном разделе основное внимание уделено способам определения и использования схем анализа данных промежуточного типа между жесткой схемой фиксации диалога в системах, ориентированных на реализацию с помощью технологии СУБД и отсутствием фиксации диалога с пользователем - в экспертных системах и системах о ограниченным естественноязыковым интерфейсом.

В основу архитектуры САД положено требование удобного интерфейса с пользователем. С учетом этого требования осуществлено распределение функций процесса проектирования анализа документов между человеком и ЭВМ. Функции человека оказалось возможным ограничить связями ситуаций анализа с соответствующими правилами БЗ и описания этих связей в виде таблиц решений. При этом архитектура САД (согласно функциональным процедурам: сервисным, концептуального и формализованного описания, загрузки КЗ и генерации выходных отчетов и сообщений).состоит соответственно из программных комплексов: Сервис, Классификатор, Коррелятор, Анализатор и Генератор.

В алгоритмическое обеспечение САД заложены следующие возможности: возможность объединения знаний нескольких экспертов на уровне БЗ и БД; рассмотрение одновременно нескольких одинаково приоритетных линий рассуждений; возможность использования нескольких стратегий анализа ( по отклонениям , шаблонам , по упорядоченности, экспертных оценок).

Процедура описания анализа информации пользователем САД на системном уровне в рамках рассмотренного теорети-

!

•ческого аппарата состоит из 3-х процедур: процедуры описа- I ния модели; процедуры вывода решения; процедуры генерации [ сообщения. На первом этапе происходит именование объектов. В ' качестве набора базовых понятий используется концепты: | цель, ресурс ... и отношения: теть имя , быть элементом | класса и др.. !

На втором этапе происходит определение иерархии связи | ; (приоритетности обработки) между структурами БД. Основные , ! \ понятия: иметь связь, увеличивать связность, осуществлять I координирование... .Основные отношения: приоритетность, ; направленность, иметь связь внутри документа, осуществлять | координирование, согласование и др..

На третьем этапе происходит выбор методов анализа информации: пользователь может использовать операции прямого контроля, косвенного контроля или описать свой метод контроля с помощью словарей, шкал и таблиц решений.

На последнем этапе происходит выполнение программы анализа информации. На выходе пользователь получает: сообщение о результате анализа информации ; линию рассужде- "I ния САД , отраженную в трассировке правил анализа; и воз- ! можные варианты исправления найденных противоречий в БЗ. На ■ этом этапе пользователь может . запомнить весь ход своих | рассуждений и использовать БЗ других экспертов. |

I Диалог САД состоит из следующих основных компонентов: |

' описания понятий, иерархии отношений, функций анализа и | ! правил анализа. ' • ;

На этапе инициализации диалога пользователь или экс- I перт вводит фамилию и выбирает информационную подсистему. ,Затем происходит описание основных концептов ВД

На следующем этапе определяются понятия документа, . | | которые подлежат анализу, выбираются функции анализа , ; ; описывается приоритетность обработки. •• | | На последнем этапе диалога пользователь с помощью | предлагаемых таблиц решений окончательно детализирует ло-! гические правила.контроля информации. Затем происходит вы- -полнение программы и на выходе пользователь получает сообщение об анализируемой информации или ошибке(если | ! информация противоречит БЗ АСУ или правилам контроля), ли-____

и.___________ж._________________________

нига рассуждения' и~вЬ¥мошыё"'варианты исправления " ошибки.'

Согласно схеме проектирования САД (Рис. 1) проведена реализация, внедрение и экспериментальная проверка разработанных методов: На программном уровне все разработанные на системном уровне функции и правила анализа информации ' нашли свое воплощение в архитектуре программного комплекса САД, состоящей из управляющей программы -монитора Сервис и программных комплексов: Классификатор, Коррелятор, Анализатор и Генератор.

Каэдый из программных комплексов состоит из подпрограмм. Например, Классификатор состоит из подпрограмм: IHELP-помощи и объяснения,IEYE - просмотра структур БД,INAME -именования объектов ,ICLOB -классификации.

Реализация программного обеспечения САД в Президиуме АМН СССР проведена в сети ЭВМ: ICL-2904, двух ПЭВМ ICL-1500, связанных по каналу RS-232 с помощью программного комплекса СОД. В НПО "Медбиоэкономика" реализация САД проведена на ПЭВМ IBM PC/XT. Данное архитектурное решение позволило обеспечить комфортное время обработки запроса за счет работы ПЭВМ с медленно обрабатывающими информацию устройствами: выдачи на печать и обмена с накопителями на магнитной ленте (НМЛ).

Основной особенностью разработанного программного обеспечения является использование языков Фортран, Кобол, Ассемблер. Язык Фортран использовался при создании программы ] Классификатора. Выбор язьпса Кобол как основного языка САД обусловлен использованием в качестве БД - БД Find 2 (с языком Sequel, обеспечившим быстрый обмен с накопителями на магнитных дисках (1Щ) и кошактность программного кода).

В 1986 г. ' САД принята в промышленную эксплуатацию межведомственной комиссией под председательством первого заместителя министра Минздрава СССР и президента АЫН СССР. Экспериментальная проверка и промышленная эксплуатация подтвердили рекомендации, приведенные в инженерной и теоретической части работы, касающиеся технологии обработки.

В основу эксплуатации САД, как инструментального средства АСУ, положены результаты решения задачи создания удобного интерфейса с пользователем : лингвистическая и

• ___т._______________________

•графическая модели диалога. САД, как инструментальное средство, эксплуатировалось в рамках 4-х программных подсистем : МЕДНИР, МЕДНО,МЕДЭКС,МЕДУКС. Основной производственный персонал составляли научные сотрудники, инженеры и операторы соответствующих отделений Президиума АМН | СССР. Концептуальную модель ПО описывали эксперты и научные ! сотрудники;вычислительную модель БЗ - системные програм-: мисты и лица, отвечающие за контроль документов; конкретные \ документы - инженеры и операторы.

! Проведена экспертная классификация проблемной струк-

туры НИР АМН СССР по сорока одному научному совету АМН ; СССР, что позволило построить концептуальную модель пред: метной области НИР и выявить основные классы связей в базе | знаний АСУ. В качестве основного направления НИР в АМН | СССР выделен кластер, содержащий проблемы по генетическим ! последствиям влияния внешних факторов на хромосомный аппарат человека.

По сравнению с системами анализа и контроля информации, работающих в настоящее время в Центральной СЭС КЗ СССР, АСУ МЗ РСФСР и отраслевой АСУ Минмедпрома СССР, система САД обладает более удобным и быстрым лингвистическим интерфейсом за счет использования методов классификации для настройки диалога на предметную область каадого пользователя САД.

В ходе исследования рабочих характеристик и оценки эффективности программного обеспечения получены следующее ! характеристики: время обработки запроса в САД - около трех секунд - для операций прямого анализа по персональной БЗ .пользователя и 30 секунд - для операций косвенного анализа по интегрированной БЗ АСУ отрасли на массиве свыше 7000 I НИР. Бремя работы САД линейно зависит от величины БД и эк-| споненциально от величины БЗ. Компактная внутренняя модель I БЗ позволила реализовать и эксплуатировать САД на основной | ЭШ 1СЬ-2904 с оперативным запоминающим устройством (ОЗУ) | 512 КБ, с четырьмя НМД по 60 МБ и двумя накопителями на магнитных лентах.

В приложениях к диссертации приведены документы, подтверждающие внедрение программных средств, формы вход-,

ной и выходной информации, основные~пон¥тия базы "знаяий ; САД и видеограммы экранов, отражающие работу САД. САД внедрена по проблеме ГННТ 0.80.1D и заданию ГКНТ и ГОСПЛАНА СССР - КВЗ НИР. Теоретические и инженерные результаты диссертации внедрены в работу АСОИ Президиума АМН СССР, АСУ ВНИИМИ Ш СССР, Института литания AMI СССР, БОНД АМН СССР и НПО"Медбиозкономика" Минмедпрома СССР.

САД и СОД оформлены в ГОСФАП СССР. Об идя экономическая эффективность от внедрения АСОИ МЕДИАНА в работу Пре- ; зидиума АЩ СССР, рассчитанная в технорабочем проекте, ; составила около 128 тыс. рублей. Экономическая эффективность от внедрения и эксплуатации САД (программное обеспечение САД разработано лично автором) составила 36.4 тыс. рублей ежегодно. Результаты диссертационной работы - методическое, математико-статистическое и программное обеспечение по анализу и обеспечению достоверности данных-приняты I в опытную эксплуатацию по теме отдела организации управле- : ния отраслью НПО "Медбиоэкономика". Экономический эф- I фект от внедрения каждой программной системы на ПЭВМ типа ! ЕС-1840 составляет от 3 до 5 тысяч рублей ежегодно. Зффек- : тивноеть достигнута за счет ускорения процесса обработки информации и освобождения части научных сотрудников отде- j лений АМН от рутинной работы по контролю информации. j

i

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ j

■ |

В диссертационной работе подучено новое решение актуальной научной проблемы совершенствования методов анализа | и обеспечения достоверности информации в АСУ отрасли. Обоснована необходимость использования технологии экспертных систем для описания знаний лица, принимающего решения (ЛПР), о контролируемой информации.

1. К теоретическим результатам следует отнести формализованную многоуровневую модель базы знаний, которая обеспечила: адекватное отображение ПО;однородное представление как декларативных, так и процедурных компонентов модели; точное представление семантики с учетом иерархии __уровней проектирования системы. ________i

2. Сформулированы определявшие архитектуру системы условия декомпозиции процесса анализа информации по уровням абстракции, обеспечивающие независимость и адекватность слоев, возможность их автономной реализации и совершенствования.

3. В рамках рассмотренного теоретического аппарата выполнена формализация типовых функций контроля информации

| АМН СССР. Для описания как оценок, так и оцениваемых поня-1 тий в системе используются лингвистические переменные. Для I фиксации логических связей между понятиями базы знаний ис-| пользован вариант логики предикатов первого порядка, поз-I воляющий представлять конструкции типа "объект-признаки", ; необходимые для описания процесса анализа информации в АСУ | НИР. Для описания основных правил базы знаний анализа НИР предложен язык Я, ориентированный, в отличие от языков ЛИСП и ПРОЛОГ, на работу в сети ЭВМ и ПЭВМ.

4. Разработаны инженерные методы построения системы анализа данных АСУ НИР, которые включают: методику анализа ГО и классов экспертов с помощью методов экспертных оценок; методику построения базы знаний системы, которая содержит иерархическую стуктуру понятий АСУ АМН СССР. Правила в БЗ выражают семантические, причинно-следственные, ассоциативные и другие виды связи БД с функциями анализа информации.

Предложенный алгоритм работы САД позволяет описать процесс принятия решения экспертом и предоставить пользо-| вателю средства обнаружения и объяснения противоречий в контролируемой информации.

5. Теоретические и инженерные результаты диссертации внедрены в работу АСОИ Президиума АМН СССР, АСУ ШШШМ МЗ СССР, института питания АМН СССР,' ВОНЦ АМН СССР, НПО "Мед-биоэкономика" Минмедпрома СССР.

Экспериментальная проверка проектирования и работы | САД показала, что применение методов и инструментальных | средств, предложенных в работе снижает трудоемкость анализа и контроля информации за счет автоматизации процесса анализа и обеспечения достоверности информации и, таким образом, сокращает объем программирования; обеспечивает

[гг!

модульность архитектуры программных средств, относительную ] простоту ее изменения, что позволяет совершенствовать пол- > ноту выводов системы, увеличить достоверность обрабатываемой в АСУ информации; эффективность конкретной модели анализа данных зависит от адекватности знаний эксперта о ПО.

Основные результаты' диссертации отражены в 12 научных ; работах, написанных в соавторстве (в том числе 3 отчета о НИР). Наиболее важными из них являются:

1. Волков И. А. ,-■ Петриков М.Е, Старосельская Л. II Разработка экспертной системы для подготовки и принятия решений по проблемам медицинской науки. В кн.: II Всесоюзная конференция по статистическому и дискретному анализу нечисловой информации и экспертным оценка}«. Таллин, 1984. Тез. докл.. М.: ВИНИТИ, 1984,с.354

2. Раушенбах Г. В., Волков И. А., Сатаров Г. Л., Заславский А. А. Проблемы анализа близости при обработке разнотипной медико-йиологической информации. В кн.: Бионика и биомедкибернетика-85. Том 3. Биомедицинская информатика. Методология. Ленинград, 1985. Тез. докл. - Л.: АН СССР НС ' "Кибернетика", 1986,с. 74-76 :

3. Старосельская Л. Е , Амбарцумова Г. Е , Волков И. А., ■ Петриков М. К Информационное обеспечение Президиума АМН 1 СССР с использованием вычислительной техники. - В кн.: 1У Симпозиум по применению математичёских методов и ЭВМ в ; медико-биологических исследованиях, г. Гагра, октябрь 1985 1 г. Тез. докл.- М.: Минздрав, 1985, с.302-303 . . !

4. Волков И. А. Программа проверки вводимой информа- ! ции Программное средство. М.: ВНШМИ, ГОСФАП N601, 15.12. | 1982 , 38 с.

. 5. Волков И. А., Стернин М. Ю., Петриков М. В., Иншкина К Г., Евдокушкина Г. Е Система обмена данными. Программное средство. М.: ВНИИМИ, ГОСФАП N 50850000111, 25.03.85, 147 с.

6. Волков И. А., Петровский А. Е , Стернин М. Ю., Петриков М. Е , и др.. Технорабочий проект на автоматизированную систему обработки информации ( 1 очередь) номер

ш

• гос. регистрации 81012554, дек. 1982 Ii: АМН СССР, 25бС..

7. Волков И. А., Старосельская JL К, Лапшинский В. А., Амбарцумова Г.Е , Петриков М. Е Технорабочий проект: Разработка комплекса взаимосвязанных задач подсистемы "Планирования и учет НИР" номер гос. регистрации

. 58971897624700557, Ы.: АМН СССР, 1985, 47с.

8. Волков И. А. Система автоматического анализа данных по проблемам планирования и управления НИР в области медицины. - В кн.: Концептуальное проектирование банков данных. Материалы семинара М.: ЩНТП, 1986, с. 58-59

9. Волков И. А., Гедзенко Е Ф., Разин Е Л , Ханыков А. Е Повышение качества анализа экономических показателей на основе использования технологии экспертной системы. Тез. докл. - М.: НПО Мэдбиозкономика, 1989,с. 11-12

Л.%?5^Подписано к печати /3 /«Рзаказ ъШ Тираж 100. i

■ 1 ' ........ 1 ■ ■ i

Типография МИФИ, Каширское ш., д. 31.