автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.09, диссертация на тему:Автоматизированные системы управления и обработки информации для архивов медицинских документов

кандидата технических наук
Трояновская, Ольга Вадимовна
город
Санкт-Петербург
год
1999
специальность ВАК РФ
05.13.09
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Автоматизированные системы управления и обработки информации для архивов медицинских документов»

Автореферат диссертации по теме "Автоматизированные системы управления и обработки информации для архивов медицинских документов"

кв Ой

- - ¡Р '

На правах рукописи

Трояновская Ольга Вадимовна

АВТОМАТИЗИРОВАННЫЕ СИСТЕМЫ УПРАВЛЕНИЯ И ОБРАБОТКИ ИНФОРМАЦИИ ДЛЯ АРХИВОВ МЕДИЦИНСКИХ ДОКУМЕНТОВ

Специальность: 05.13.09 — управление в биологических

и медицинских системах (включая применение ВТ)

Автореферат диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург— 1999

Работа выполнена в Санкт-Петербургском государственном электротехническом университете (ЛЭТИ).

Научный руководитель -

кандидат технических наук, доцент Манило Л. А.

Официальные оппоненты:

доктор технических наук, профессор Фомин Б. Ф. кандидат технических наук Шаповалов В. В.

Ведущая организация -

Санкт-Петербургская медицинская академия последипломного образования

Защита состоится » А " д^^р-а 1999 г. в 4О часов на заседании диссертационного совета Д063.36.09 Санкт-Петербургского государственного электротехнического университета (ЛЭТИ) по адресу: 197376, Санкт-Петербург, ул. Проф. Попова, 5.

С диссертацией можно ознакомиться в библиотеке университета.

Автореферат разослан" 1- " 1999 г.

Ученый секретарь диссертационного совета

Юлдашев З.М.

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В настоящее время в обеспечении эффективной работы архивов медицинских документов все большую роль играет автоматизированная обработка больших массивов информации. Основными требованиями, предъявляемыми к автоматизированным системам управления и обработки информации (АСУиО), являются следующие:

1. Быстрая подготовка и адекватное представление входной медицинской информации.

2. Оперативное предоставление полных и точных ответов на запросы пользователей.

3. Возможность проводить централизованную обработку данных, принадлежащих медицинским архивам различных лечебных учреждений.

Вопросы, относящиеся к электронной форме представления медицинской информации о пациенте, способам автоматизированной обработки медицинских сведений на естественном, в частности, русском языке, а также методам быстрого поиска данных, обеспечивающих наиболее полный и точный ответ на запрос пользователя, не проработаны в полной мере.

Автоматизированные системы, эксплуатирующиеся сегодня в российских архивах медицинских документов, решают узкоспециализированные задачи и работают с неполной или искаженной информацией об объекте исследования, представленной набором кодов из стандартных классификаторов. Принципы, на которых основана подготовка данных для таких систем, не обеспечивают возможности эффективного ввода данных, требуют больших затрат ручного труда медицинских работников.

Важность адекватного компьютеризированного представления медицинской информации о пациенте обусловлена переходом медицинского обеспечения населения на принципы страховой медицины и подготовкой лечебным учреждением возрастающего потока статистической отчетности. Электронные записи пациентов должны соответствовать определенным стандартам для создания национальных регистров, а также интеграции с другими автоматизированными системами в России и за рубежом.

В связи с вышеизложенным представляется актуальным создание удовлетворяющих современным требованиям АСУиО для архивов медицинских документов.

Цель диссертации: разработка принципов и методов автоматизированного анализа и классификации естественно-языковых (ЕЯ) медицинских данных о пациенте, а также реализация их в автоматизированной системе обработки документов медицинского архива. Задачи диссертации:

1. Исследовать методы и принципы обработки информации в естественно-языковой форме как в автоматизированных медицинских архивах, так и в других областях применения.

2. Синтезировать лингвистическую модель для анализа медицинских сведений на естественном языке с последующей их формализацией.

3. Построить модель интерпретации для работы с абстрактным представлением медицинских сведений о пациенте.

4. Разработать язык отображения естественно-языковых сведений о пациенте на модель интерпретации.

5. Провести тестирование моделей на объекте исследования.

6. Создать формальную систему, позволяющую оперировать абстрактными представлениями медицинских сведений о пациентах, и проверить применимость системы для решения задач классификации последних по запросам пользователей.

Методы исследований. Теоретические и прикладные разделы диссертации разработаны с применением теории формальных грамматик, теории распознавания образов (РО), теории операций, теории множеств, теории матриц, операций математической логики, элементов математической статистики.

Экспериментальные исследования проводились в Архиве военно-медицинских документов. В качестве объекта исследования использованы архивные материалы в виде историй болезни 4-х тысяч раненых и 6-ти тысяч больных военнослужащих, принимавших участие в локальных конфликтах.

Новые научные результаты.

1. Синтезирована лингвистическая модель представления медицинских сведений о пациенте на русском языке, позволяющая проводить формализацию персональной медицинской информации в терминах тезауруса предметной области.

2. Построена модель интерпретации для описания формализованных медицинских сведений о пациенте. Модель имеет 5 разновид-

ностей по числу лингвистических групп входного текста на профессиональном медицинском языке.

3. Предложен и реализован в автоматизированной системе метод лингвистической обработки персональных медицинских документов, отображающий ЕЯ информацию в формализованное представление.

4. Построена алгебра цепочек, которая позволяет оперировать формализованными представлениями медицинских сведений и включает восемь операций. В основу алгебры положена комбинация логических и структурных методов РО.

5. Разработан классификационный алгоритм, определяющий сходство формализованных медицинских сведений пациента и запроса пользователя на основе алгебры цепочек.

Основные положения, выносимые на защиту.

1. Модель предметной области автоматизированных систем для медицинских архивов должна быть представлена гибридным способом. Основные составляющие модели: тезаурус понятий предметной области, лингвистическая модель естественно-языковых медицинских сведений о пациенте и модель интерпретации для формализации этих сведений.

2. Для корректной автоматизированной обработки естественноязыковых медицинских сведений о пациенте с последующим преобразованием в формализованное представление используют знания семантико-синтаксической структуры текста, которая описана лингвистической моделью.

3. Обеспечить высокое качество автоматической классификации формализованных описаний пациентов в соответствии с запросами пользователей можно при учете не только синтаксиса, но и семантики формализованных представлений, что достигается применением структурных и логических методов распознавания образов. Реализацию классификации необходимо осуществлять в алгоритме, использующем операции специально разработанной алгебры цепочек. Практическая ценность работы.

1. Предложен метод полуавтоматического приобретения знаний из медицинских текстов для построения тезауруса предметной области в сфере персональной медицинской информации.

2. Разработан алгоритм кодирования, который в ходе тестирования на 896-ти медицинских документах пациентов показал высокое качество автоматической формализации данных, исключающей субъективный фактор при обработке медицинской информации.

3. Предложена архитектура автоматизированной системы, выполняющей кодирование медицинских сведений о пациенте и их классификацию в соответствии с запросами пользователей, для работы в медицинских архивах.

4. Разработанный классификационный алгоритм протестирован на 896-ти реальных медицинских документах. Получены результаты: отклик системы равен 0.99, точность поиска - 1.00, что превышает показатели зарубежных аналогов.

Реализация результатов работы. Предложенные методы и алгоритмы реализованы в прототипе автоматизированной системы обработки данных, который эксплуатируется в Архиве военно-медицинских документов.

Апробация работы. Основные результаты и положения диссертационной работы докладывались и обсуждались на: Всероссийской научной конференции "Медицинская информатика накануне 21 века" (г. Санкт-Петербург, 1997 г.); Международном семинаре "Biomedical Engineering & Medical Informatics'97" (г.Гливице, Польша,

1997 г.); научно-технической конференции "Диагностика, информатика, метрология, экология, безопасность - 98" (г.Санкт-Петербург,

1998 г.); Международной конференции по мягким вычислениям и измерениям-99 (г.Санкт-Петербург, 1999 г.); 2-й Международной технической конференции "Медико-экологические информационные технологии - 99" (г. Курск, 1999 г.); научно-технических конференциях профессорско-преподавательского состава СПбГЭТУ (1998-1999 гг.).

Публикации. По теме диссертации опубликовано 8 печатных работ, из них 4 статьи и 4 доклада на конференциях и семинарах.

Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав с выводами, заключения, списка литературы, включающего 100 наименований, трех приложений. Основная часть работы изложена на 148 машинописных страницах. Работа содержит 11 рисунков и 10 таблиц.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность темы, сформулированы требования, предъявляемые к автоматизированным системам управления и обработки информации для медицинских архивов, определены цель и задачи диссертационной работы, основные положения, выносимые на защиту, изложено краткое содержание работы.

В первой главе рассмотрены основные проблемы обработки ЕЯ сведений о пациентах, которые стоят перед медицинскими учреждениями. В работе российских медицинских архивов существует высокая загрузка врачей рутинной подготовкой различных документов; выходная информация в виде отчетов, сводок и т.д. имеет низкое качество и длительные сроки исполнения. Проведен обзор методов решения подобных проблем в зарубежных госпиталях. Следование стандартам, автоматическая обработка данных и переход к компьютеризированным историям болезни дают положительные результаты. Вместе с тем отмечается, что автоматическое кодирование по стандартным классификаторам приводит к значительной потере и искажению обрабатываемой информации о пациенте. Альтернативой служит ЕЯ представление информации, но такой способ не обеспечивает полноту выборки информации по запросу. Описаны разнообразные модели медицинской информации, используемые в западных медицинских учреждениях и ориентированные на английский, немецкий и французский языки. Проведен анализ существующих систем и выделены основные функции, которые должны ими выполняться: а) способность к логическому выводу, б) обеспечение поддержки принятия решений, в) понимание ЕЯ информации, г) способность к обучению. Сформулированы требования к проектированию автоматизированных систем. Перечислены результаты, получаемые от внедрения интеллектуальных систем в медицинские архивы.

Во второй главе рассмотрены формы и методы представления знаний для выбора модели предметной области. Обоснована необходимость использования нескольких формализмов с целью построения гибридной модели, включающей тезаурус понятий предметной области, лингвистическую модель ЕЯ медицинских сведений, модель интерпретации для формализации этих сведений, механизм отображения лингвистической модели на модель интерпретации. Основное предназначение тезауруса - обеспечение набора понятий для гомоморфного отображения ЯЗ сведений о пациенте или запросе пользователя в формализованное представление. Описаны две составляющие тезауруса - лексико-морфологический словарь медицинских понятий, включающий в себя термины, их синонимы, родственные слова, варианты написания и сокращений, и семантическая сеть (СС), в которой медицинские понятия представлены узлами, а отношения, их связывающие, - дугами. Это позволило каждому ЕЯ

медицинскому понятию словаря поставить в соответствие его формализованный эквивалент - узел СС. Определено четыре класса отношений на сети: родовидовые, функциональные, грамматические, причинно-следственные. Количество узлов сети превышает 1000, число статей - 1500. Тематические деревья образованы дугами с родовидовыми отношениями, соединяющими семантически родственные узлы. В работе сформировано 13 таких деревьев.

Проектирование модели интерпретации выполнено на базе синтаксического подхода РО. Модель, предназначенная для описания на формализованном языке ЕЯ сведений о пациенте и поисковых запросов, представлена в' виде:

-ит, щ,=с„ (1)

1=1

N

где - конкатенация N элементов IV, N - нечетное число; II т, С к -

ы

условные обозначения (у. о.) соответственно щ-го медицинского понятия и к - ой взаимосвязи между понятиями в цепочке (см. табл.); знак + означает присутствие в цепочке, по крайней мере, одного элемента; Ск е{"@",".",'',", "&","+", "-", "*", ">"}.

Перечень взаимосвязей между медицинскими понятиями

' Л» • * и/и • Название взаимосвязи ; : Условное обозначение Тип взаимосвязи

1 Принадлежность мягкая

2 Равноправие • мягкая

3 Перечисление ? мягкая

4 Соединение & жесткая

5 Дополнение 1-го порядка с включением + жесткая

6 Дополнение 1-го порядка без включения - жесткая

7 Дополнение 2-го порядка * жесткая

8 Причинность . > жесткая

Третья глава посвящена синтезу лингвистической модели, описывающей ЕЯ сведения. Для построения модели проанализирована обучающая выборка с текстами из 5-ти тысяч историй болезни. Сделано заключение, что тексты ограничены по тематике и

используемым лингвистическим структурам, т. е. язык медицинских документов (внешний язык) требует построения специализированной лингвистической модели.

В работе обоснована целесообразность построения модели на основе индексной грамматики, определены критерии построения. Описан метод полуавтоматического создания алфавита грамматики внешнего языка, который заключается в построении полного конечного множества используемых терминальных и нетерминальных элементов. Для этого в текстах на внешнем языке были выделены 5 групп сходных по своей форме и законченных смысловых сегментов текста, им поставлены в соответствие группы описания: 1) "Ранения, травмы, ожоги/отморожения" (РТО), 2) "Заболевания", 3) "Осложнения", 4) "Последствия РТО", 5) "Лечение". Внутри групп выделена устойчивая подгруппа «Локализация», описывающая анатомическую локализацию организма, которая может входить в состав любой группы, а также другие повторяющиеся подгруппы. В каждой группе было выделено одно главное - опорное слово (ОС) и его характеристики - дополняющие и описывающие его слова.

Все лексические единицы (ЛЕ) сгруппированы по определенным критериям в 17 категорий: ОС и характеристики группы «РТО»; ОС и характеристики подгруппы «Локализация»; функциональные слова, выражающие отношения между ЛЕ, (по, вследствие, в<резупьтате\виде\стадиа\фарме>, с\со, без, после, по <типу\линии>, осложненный; где в < > через | - варианты контекста) и т. д. Каждой группе, подгруппе описания и категории присвоены имена, составляющие нетерминальный словарь. Терминальный словарь включает все ЛЕ с частотой встречаемости выше заданного порога.

Подробно описан разработанный метод ручного вывода грамматики, приведены правила подстановки. Предложен метод лингвистической обработки сведений о пациенте с использованием построенной модели. На первой стадии каждой ЛЕ присваивают одну из 17-ти категорий. Вторая стадия состоит из 6-ти этапов и оптимизирована по времени обработки путем эвристического подбора как группы описания анализируемого сегмента текста, так и набора правил грамматики. В случае неверного синтаксиса документ изымается из обработки. Проверенные сегменты поступают на стадию семантической интерпретации для их формализации.

Семантика внешнего языка Ь описана в виде 5 = <р(Ь), где 5 -множество смыслов, (р - интерпретирующее отображение Ь в 5. Элементы множества 5 - цепочки формальной порождающей грамматики внутреннего языка. Для формализации текста отображают: ЕЯ медицинское понятие в у. о. узла СС; функциональное слово между медицинскими понятиями в у. о. взаимосвязи. Языку Ь поставлена в соответствие денотационная семантика на основе интерпретации I = /у), где 1т и I; - логические функции, 1т соотносит каждое ЕЯ понятие с понятием тезауруса, Ту - каждое функциональное слово с взаимосвязью при учете контекста, В - область интерпретации -множество грамматически правильных цепочек. Алгоритм работы функции 1т сведен к поиску понятия тезауруса, описанного таким же набором слов, что и анализируемое понятие в тексте, и записи соответствующего у.о. узла СС в цепочку. С помощью специально разработанного языка сформулированы правила отображения, в соответствии с которыми функциональные слова отображаются в свои формализованные эквиваленты. Синтаксис языка имеет вид: <правило>:: ~< антецедент'?' —>< консекеент> <антщедент>::= {<условие>}+

<условие>::=(И{<выражение>}+ /ИЛИ{<выраж.>}+) /(НЕ<выраж.) <консеквент>:: =<тип взаимосвязи> /<узел СС> /<вид операции> / <позиция символа> <тип взаимосвязи >::-

<узел СС>::-<опасаниеузла1> !<опис. узла2> I... /<опис. узлак> <вид операции>::~г

А )и /е

<позиция симеола>::=1 ¡2 / ... 1п, где в о - имя синтаксической категории; знак означает определение левой части выражения через правую; {}- определяет повторы; | - обозначает варианты; () - для группирования; + - означает присоединение, <выражение> - это логическое выражение со значениями истина или ложь представляет собой один из 4-х сформулированных в работе базисных типов утверждений; <тип взаимосвязи> - тип взаимосвязи, возвращаемый функцией Т} для записи в цепочку; <узел СС> - у. о. одного из к понятий СС, возвращаемого функцией 1т для записи в цепочку; <аид операции> - одна из 4-х предложенных в работе операций по

нормализации текста на внешнем языке из множества {г, ь\ и, е}; <позиция симеола> - позиция в цепочке, куда помещают анализируемый символ формализованного описания длиной п.

Разработан алгоритм автоматического кодирования ЕЯ информации, описанный на предлагаемом языке отображения.

В четвертой главе рассмотрены принципы и методы классификации формализованных описаний. Частные модели интерпретации разделены на однородные группы по числу групп описаний текста, например, модель для группы описания «Локализация»:

Я N Г

<Ьок>= МД; «Заболевания»: г &<Ьок>„; «РТО»:

=1 М г=1

Ы я Т , !Г Г

* р \

! + 1 5

м у т ¡V I

<Шо>=П^ »П^ &<Ьок>к£± (П^ &<Ьок>у]>>7> &<Ьок>2)

*=] У=1 2=0

Я А'

где КМ1Д - цепочка из Н подцепочек, соединенных взаимосвязью

«перечисление»; М Ь] - цепочка длиной N. в которой соседние

в

символы Ь соединены взаимосвязью «принадлежность»; [7 - цепочка длиной <2, в которой соседние символы 5 соединены взаимосвязью

т

«равноправие»; - цепочка из Т групп подцепочек А,, соединенных

5=0

взаимосвязью «перечисление», причем в случае Т - О длина цепочки = 0; Д" - дерево с обозначением т и рангом п, который задает порядок следования медицинских понятий в формализованном описании,

Примеры моделей интерпретации приведены с у. о. узлов СС в виде медицинских понятий, записанных в угловых скобках. Фрагменту текста «Огнестрельное сквозное осколочное ранение правого плеча с переломом диафиза плечевой кости со смещением и повреждением лучевого нерва» соответствует модель «РТО»: <огнестрельный>*<сквозной>ф <осколочный>* <ранение>& <пра-вый>@<плечо>+<пврелом>&<диафиз>@<плечевая костъ># <сме~ щение>&<лучевой нерв># <повреждение>&<лучевой перв>.

В медицинские тексты входят понятия, связанные с узлами СС разных уровней тематических деревьев. В работе выделены три случая соотношения уровней узлов в цепочках пациента и запроса и предложено использовать единый терминальный уровень анализа информации. Для этого все цепочки приводят к уровню описания, на котором символы цепочки - элементы основного словаря грамматики внутреннего языка, а каждому нетерминальному узлу поставлено в соответствие множество терминальных узлов. В случае пациента это множество может быть представлено в виде дизъюнкции* элементов (дизъюнктивное множество), в случае запроса - конъюнкции

п

элементов (конъюнктивное множество): РV Р' - дизъюнктивное множество для г -го узла цепочки пациента с п терминальными

т

потомками PJ, а 1к = л2'и - конъюнктивное множество к -го узла цепочки запроса с т терминальными потомками.

В работе приведена и описана функциональная схема автоматизированной системы. После обработки ЕЯ сведений о пациенте, полученный набор цепочек проверяется на корректность и поступает в базу данных (БД), в которой накапливается информация по массиву пациентов. Аналогично запрос пользователя преобразуется в формализованное описание. При обработке система использует информацию из базы знаний о тезаурусе, грамматиках и т.д. Для получения ответов на запросы система производит вначале поиск по символам цепочки запроса, включенным в индексные файлы, с записью найденных сведений во временную БД, затем классификацию отобранных цепочек. В работе показано, что средствами одного поиска нельзя обеспечить необходимую точность выбора информации из БД, последовательный же анализ всех записей БД не удовлетворяет требованиям времени ответа на запрос, обосновано включение в индексные файлы только терминальных символов подгруппы "Локализация". На этапе классификации набор цепочек по каждому пациенту временной БД сопоставляют с цепочками запроса для принятия решения о соответствии описания пациента запросу.

Для выбора наиболее адекватного метода классификации в работе были исследованы подходы РО. Обоснована неприменимость стандартных методов для классификации цепочек. Сравнение цепочек

Здесь и далее используются отдельные термины, заимствованные из алгебры логики, но отличающиеся тем, что они применены в области символьных операций.

пациента и запроса осложнено тем, что помимо синтаксического необходимо проверять и семантическое сходство, используя родовидовые отношения. Сформулированы следующие критерии релевантности описания пациента запросу:

1) цепочка пациента включает в себя все узлы или их потомки, которые указаны в цепочке запроса;

2) взаимосвязи между соответствующими семантическими группами медицинских понятий и внутри этих групп в цепочке запроса и цепочке пациента одинаковы.

В работе показано, что критерии смыслового соответствия сравниваемых цепочек тесно связаны с их синтаксисом. Эта связь положена в основу построенной алгебры цепочек, которая предназначена для определения релевантности описания пациента запросу. В качестве множества допустимых цепочек приняты цепочки, удовлетворяющие формуле (1), объединенные с множеством цепочек произвольного вида и цепочкой нулевой длины Л, принятой за единичную цепочку. Определены следующие операции алгебры:

1. Дробление узла.

2. Расслоение составной цепочки.

3. Группировка.

4. Разбиение цепочки на подцепочки, соединенные жесткими взаимосвязями.

5. Посимвольное взятие дополнения цепочки.

6. Умножение простых цепочек.

7. Умножение составных цепочек.

8. Сравнение с символьным нулем.

В работе подробно описаны операции, приведены примеры. 1. При приведении цепочки к терминальному уровню нетерминальные узлы представляют в виде множества терминальных (со штрихами). Цепочка пациента, состоящая из узлов 1] и Р2, соединенных взаимосвязью С, представима как Р~РХСР2, где

р1 = {рт - Рщ >Рт , РипК рг={р2п , рт , Кг } • В результате дробления:1 Р = РтСРт v РшСРт v Рп,CPV, v РтCPYi...,Рт1 СРп,

m

\ n

далее получают: P= v PCP., где n,m - количество терминальных

j=i 1 j

j=A

узлов y нетерминальных узлов P1 и Pj соответственно. В случае

запроса: лZ,,CZ;, где - количество терминальных узлов у

к=1 ¡=1

нетерминальных узлов 2к и соответственно.

2. При оперировании цепочками с более чем одной жесткой одноименной взаимосвязью (см. табл.) или с одной взаимосвязью «перечисление» (составные цепочки) возникают неоднозначные ситуации. Такие цепочки представимы в виде множества простых, в которых отсутствуют подобные взаимосвязи. Расслоение составной

цепочки B¡ - это преобразование цепочки в конъюнктивное множество п простых цепочек вида В.А л.В12 л...лВ1я. Например, составная цепочка <осколочпый>*<рапеиие>&<голова>,<область>@<ухо> после расслоения будет преобразована в две простые: <осколочиь1й>*<ранс1ше>&<голоеа> и <осколочный>*<ранение>& <область>@<ухо>

3. Третья операция основана на справедливости коммутативного закона. Пусть составная цепочка запроса после операций расслоения и дробления нетерминальных узлов представлена в виде комбинации

простых цепочек: ( 2п л 2п ) л( 2и л 2гг л ). После группировки образуется конъюнктивное (для запроса) и дизъюнктивное (для пациента) множество, эквивалентное в информационном смысле исходной цепочке. Для данного случая:

(гп дги)д(2п лг21)л(гп лгв)л(2цл2г1)л(г12 л2а)л(ги лг2г)

Пример. Составная цепочка запроса имеет вид <ранение>& верхняя конечность>,<нижняя конечность>. После расслоения получают две простые цепочки: 1) <ранение>& <верхняя копечпость>, 2) <рапе-иие>&<нижняя коиечность>. После дробления нетерминальных узлов <верхняя конечность> и <нижняя конечностъ> получают для первой простой цепочки - <ранение>&<плечо> Л <ранение>&<пред-плечье> Л <ранение>&<ладонь> Л <ранение>&<запястье> Л <ране-ние>&<кистъ>, для второй цепочки - <ранение>&<бедро>Л<ране-ние>&<голенъ> /\<ранепие>&<колено> Л <ране/ше>&<подошва> Л <ранение>&<пятка>А<ранение>&<стопа>. Тогда конъюнктивное множество запроса: {<ранепие>&<плечо> Л<ранение>&<бедро>; <рапение>&<плечо>Л <ранение>&<голень> ... <ранение>&<пред-плечье> Л <ранение>&<голень> ... <ранение>&<кисть> Л <ранен иё>& <стопа>}

4. Все взаимосвязи по их роли в цепочке разделены на жесткие и мягкие (см. табл.). Мягкие взаимосвязи допускают вариации местоположения узлов в цепочке без искажения ее смысла, жесткие -не допускают. После разбиения цепочка представлена как последовательность подстрок, соединенных жесткими взаимосвязями.

5. Пятая операция преобразует цепочку в строку, где каждый символ L представлен в виде своего дополнения L . При перемножении таких символов получают единичную цепочку: L х L = Я .

6. Шестая операция умножения двух простых цепочек заключается в получении цепочки, у которой внутри каждой группы, разделенной жесткими взаимосвязями, перемножаются символы с соответствующими им дополнениями. Например, цепочки:

Z¡ = rR2 &L6+RS & Lu и Z, = R3~ R¡' R2 S¿Lg умножают на

P = R2 • Rá ■ Rt &Л2 @L6 @L9 +R7 -i?, &I,, @Ln . В результате получают:

ZlxP = RA-L2 @L9R7 -La@; Z2 xP = R^L2 @L6 @+ R7 ■ Rs &LA@Ln .

7. Умножение составных цепочек. Пусть запрос - это составная цепочка, включающая две простые Zx и Z2, цепочка пациента - это три простые цепочки Р{, Рг, Рг. Тогда произведение составных цепочек имеет вид: ( Z, a Z2 )х (л Рг л ), т.е. сведено к умножению простых. Эмпирически получают следующее выражение: (Zl xPlvZ¡xP2vZl хРг)л (Z2 xP]vZ2xP1vZ2xPj.

п т

В общем виде: Z/P = л v Z х Р (2), где п. т - число простых

цепочек Z,, Р запроса и пациента соответственно.

8. Сравнение с единичной цепочкой (символьным нулем). Положительными цепочками считают такие, которые не содержат ни одного символа дополнения, отрицательными - цепочки, содержащие хотя бы одно дополнение.

Для разделения цепочек пациентов на два класса, релевантных и нерелевантных запросу, в работе введено понятие сходства. Сходство двух цепочек - это логическая переменная, принимающая значение "истина", когда сравниваемые цепочки принадлежат одному классу, "ложь" - в противном случае. Сходство цепочки пациента и цепочки запроса истинно, если истинно сходство хотя бы одного элемента из

дизъюнктивного множества терминальных цепочек пациента с одним из элементов конъюнктивного множества терминальных цепочек запроса. Сходство 2-х простых цепочек истинно, если в результате посимвольного взятия дополнения цепочки запроса и умножения на цепочку пациента получена неотрицательная цепочка. Сходство составных цепочек вычисляют на основе формулы (2).

Если 2, Р - это множества соответственно цепочек запроса и пациента, то для определения релевантности пациента запросу определяют сходство каждой пары цепочек декартова произведения 2хР. Для этого паре z¡,pJ ставят в соответствие произведение г, х pJ алгебры цепочек. Используют операцию умножения матриц. Множеств}' 2 поставлена в соответствие матрица-столбец Ъ, множеству Р - матрица-строка Р . Произведение Ъ х Р - И - матрица размера т х п. Каждый элемент матрицы - это произведение цепочек множеств Р, содержащих соответственно т, п терминальных цепочек.

Рг

ЪРп

Если хотя бы одна цепочка в паре является составной, приме-

няют 7-ю операцию. Сравнение каждого элемента матрицы с символьным нулем позволяет сделать заключение о сходстве цепочек пациента и запроса. Предложенный в работе алгоритм классификации создан на основе алгебры цепочек и позволяет определить принадлежность описания пациента запрашиваемому классу.

В работе приведены экспериментальные данные, обосновывающие преимущества построенной автоматизированной системы по сравнению с существующими системами путем оценки результатов ручной и автоматической обработки текстов, оценки качества классификации данных, подготовленных программой и врачом. Проанализированы причины ошибок при автоматическом способе кодирования и проведено сравнение с подобными системами. Сделан вывод, что результаты автоматической обработки не уступают зарубежным аналогам. Результаты классификации, полученные на обучающей (614 цепочек) и контрольной выборках (282 цепочки), показали: отклик системы равен 0,99, точность - 1,00.

ЗАКЛЮЧЕНИЕ

Основные результаты диссертационной работы:

1. Построен тезаурус предметной области, описывающий терминологию военной медицины.

2. Синтезирована лингвистическая модель медицинских сведений о пациенте на русском языке, позволяющая проводить формализацию информации в терминах тезауруса. Модель описана средствами индексной грамматики.

3. Построена модель интерпретации для описания формализованных медицинских сведений о пациенте. Модель имеет 5 разновидностей по числу лингвистических групп текста на профессиональном медицинском языке.

4. Предложен и реализован в автоматизированной системе метод лингвистической обработки медицинских документов, включающий три стадии: лексико-морфологический анализ, грамматический анализ и семантическую интерпретацию. На последней стадии осуществляется отображение естественно-языковой информации в формализованное представление.

5. Разработан язык отображения лингвистической модели на модель интерпретации, при помощи которого описана и программно реализована процедура кодирования. Результаты работы алгоритма кодирования на 896-ти медицинских документах пациентов показали высокое качество автоматического кодирования.

6. Предложена архитектура автоматизированной системы, осуществляющей обработку естественно-языковых сведений о пациентах с последующей формализацией и занесением в БД. По запросам пользователей система классифицирует информацию, хранящуюся в БД.

7. С целью проведения синтаксического анализа построена алгебра цепочек, позволяющая оперировать формализованными представлениями медицинских сведений и включающая 8 операций. В основу алгебры положена комбинация логических и структурных методов распознавания образов.

8. Разработан классификационный алгоритм для получения ответов на запросы пользователей путем выполнения алгебраических операций над формализованными описаниями. Апробация алгоритма на 896-ти реальных медицинских документах дала следующие результаты: отклик системы равен 0.99, точность поиска -1.00, что превышает показатели зарубежных аналогов.

Предложенные методы и алгоритмы разработаны с использованием материалов 10-ти тысяч историй болезни и реализованы в прототипе автоматизированной системы, эксплуатирующимся в Архиве

военно-медицинских документов.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Крутов B.C., Трояновская О.В. АИПС в архиве Военно-медицинского музея!УОтеч. арх.-М.,1996.-№ 5.-С. 103-105.

2. Крутов B.C., Трояновская О.В. Теоретические основы построения автоматизированной системы о раненых и больных!!Воен.-мед. журн. -1997. -№ 12. - С. 4-8.

3. Крутов B.C., Трояновская О.В. Автоматизированная интерпретация персональной медицинской информации как альтернатива ручному кодированию!'/Мед. информатика накануне 21 века: Тез. докл. Всерос. науч. конф., г. Санкт-Петербург, 27-29 мая 1997 г.- СПб, 1997.-С. 220-221.

4. Трояновская О.В. Система искусственного интеллекта для автоматизированной обработки персональной медицинской информации!УВопр. техн. обеспечения мед.-биол. исслед.: Сб. науч. тр.,- СПб., 1998,- С. 43-48,- (Изв. ТЭТУ, вып. 518).

5. Трояновская О.В. Лингвистические модели представления клинических данных на естественном языке для автоматизированного анализа медицинской информации II Диагностика, информатика, метрология, экология, безопасность: Тез. докл. науч,-техн. конф., г.Санкт-Петербург, 30 июня-2 июля 1998,- СПб., 1998. -С.145-146.

6. Трояновская О.В., Манило JI. А. Система перевода медицинских документов с естественного на формализованный язык!/Междунар. конф. по мягким вычислениям и измерениям-99:Сб. докл., г.Санкт-Петербург, 25-28 мая 1999. - СПб, 1999. Т.2.- С. 173-176.

7. Трояновская О.В., Манило J1. А. Автоматизированный анализ медицинских документов!IMqjxhko-жопот . информ. технологии: Тез. докл. 2-й Междунар. техн. конф., г. Курск, 19-21 мая 1999.-Курск, 1999,-С. 19-21.

8. Troyanovskaya О., Manilo L. Personal Medical Information Classification in Compliance with Dynamic Formed Classes!fRiomQ-dical Engineering & Medical Informatics'97 : Proc. Intern. Workshop, Gliwice, Poland, September 2-5, 1997. - Gliwice, 1997. - P. 154-158.

Оглавление автор диссертации — кандидата технических наук Трояновская, Ольга Вадимовна

ВВЕДЕНИЕ.

1. ИНТЕЛЛЕКТУАЛЬНЫЕ СИСТЕМЫ В МЕДИЦИНСКИХ АРХИВАХ.

1.1. Основные проблемы обработки медицинской информации.

1.2. Пути решения проблем.

1.2.1. Следование стандартам при автоматизации работы архива.

1.2.2. Задача уменьшения объема рутинных операций в деятельности медицинского персонала.

1.2.3. Переход к компьютеризированным историям болезни.

1.2.4. Обеспечение полных и точных ответов на запросы пользователей.

1.3. Основные функции, которые должна выполнять интеллектуальная система.

1.3.1. Способность к логическому выводу.

1.3.2. Обеспечение поддержки принятия решений.

1.3.3. Понимание естественно-языковой информации.

1.3.4. Способность к обучению.

1.4. Принципы построения интеллектуальных систем.

1.5. Результаты внедрения интеллектуальных систем в медицинские архивы.

ВЫВОДЫ.

2. РАЗРАБОТКА ФОРМАЛИЗОВАННОГО ЯЗЫКА ПРЕДСТАВЛЕНИЯ ПЕРСОНАЛЬНОЙ МЕДИЦИНСКОЙ ИНФОРМАЦИИ.

2.1. Уровни абстрактного рассмотрения информации.

2.2. Построение концептуальной модели предметной области.

2.2.1. Построение модели предметной области как процесс приобретения знаний.

2.2.2. Формы и методы представления знаний.

2.2.3. Критерии выбора модели представления знаний.

2.2.4. Тематические направления и источники приобретения знаний.

2.3. Построение первой компоненты модели предметной области.

2.3.1. Назначение модели и предъявляемые к ней требования.

2.3.2. Лексико-морфологический словарь - экстенсиональная составляющая тезауруса.

2.3.3. Семантическая сеть - интенсиональная компонента тезауруса.

2.3.4. Роль врача-эксперта в построении модели.

2.3.5. Практические результаты.

2.4. Синтез модели интерпретации медицинской информации.

2.4.1. Предназначение модели и предъявляемые к ней требования.

2.4.2. Решение задач классификации с позиций теории распознавания образов.

2.4.3. Общая модель интерпретации.

Перечень взаимосвязей между медицинскими понятиями.

2.4.4. Частные модели интерпретации.

ВЫВОДЫ.

3. ЛИНГВИСТИЧЕСКАЯ ОБРАБОТКА ПЕРСОНАЛЬНОЙ МЕДИЦИНСКОЙ ИНФОРМАЦИИ О ПАЦИЕНТЕ НА ЕСТЕСТВЕННОМ ЯЗЫКЕ.

3.1. Понимание текста на естественном языке.

3.2. Особенности языка описания персональной медицинской информации.

3.3. Выбор формализма описания входных текстов.

3.4. Синтез лингвистической модели.

3.4.1. Критерии построения лингвистической модели.

3.4.2. Составление алфавита языка входных текстов.

3.4.3. Вывод грамматики языка входных текстов.

3.5. Представление грамматических структур входного текста.

3.6. Методика лингвистической обработки входного текста.

3.6.1. Этапы и виды лингвистической обработки.

3.6.2. Лексическо-морфологический анализ.

3.6.3. Грамматический разбор.

3.6.4. Семантическая интерпретация естественно-языковой информации.

3.6.4.1. Нормализация входного текста.

3.6.4.2. Отображения медицинских понятий входного текста в условные обозначения понятий модели интерпретации.

3.6.4.3. Отображение функциональных слов входного текста во взаимосвязи модели интерпретации.

3.6.4.4. Язык отображения моделей.

ВЫВОДЫ.

4. КЛАССИФИКАЦИЯ ПЕРСОНАЛЬНОЙ МЕДИЦИНСКОЙ ИНФОРМАЦИИ В СООТВЕТСТВИИ С ДИНАМИЧЕСКИ ЗАДАВАЕМЫМИ КЛАССАМИ.

4.1. Нормализация формализованного описания.

4.2. Уровни представления сведений.

4.3. Приведение цепочек к терминальному уровню.

4.4. Описание работы системы.

4.4.1. Индексный поиск.

4.4.2. Синтаксический анализ.

4.4.2.1. Методы классификации.

4.4.2.2. Классификационные принципы.

4.5. Алгебра цепочек.

4.5.1. Алгебраические операции.

4.5.2. Определение сходства цепочек.

4.6. Оценка качества автоматической обработки.

4.6.1. Оценка результатов лингвистической обработки и интерпретации входных текстов.

4.6.2. Оценка качества классификации.

ВЫВОДЫ.

Введение 1999 год, диссертация по информатике, вычислительной технике и управлению, Трояновская, Ольга Вадимовна

В настоящее время в обеспечении эффективной работы архивов медицинских документов все большую роль играет автоматизированная обработка больших массивов информации.

Основными требованиями, предъявляемыми к автоматизированным системам управления и обработки (АСУиО) информации, являются следующие:

1. Быстрая подготовка и адекватное представление входной медицинской информации.

2. Оперативное предоставление полных и точных ответов на запросы пользователей.

3. Возможность проводить централизованную обработку данных, принадлежащих медицинским архивам различных лечебных учреждений.

Вопросы, относящиеся к электронной форме представления медицинской информации о пациенте, способам автоматизированной обработки медицинских сведений, сформулированных на русском языке, а также методам быстрого поиска данных, обеспечивающих наиболее полный и точный ответ на запрос пользователя, не проработаны в полной мере [49].

Автоматизированные системы, эксплуатирующиеся сегодня в российских архивах медицинских документов, решают узкоспециализированные задачи и имеют собственные жестко заданные форматы данных, что позволяет работать только с неполной или искаженной информацией об объекте исследования, представленной набором кодов из стандартных классификаторов [20].

Принципы, на которых основана подготовка данных для таких систем, при возрастающих потоках входной информации не обеспечивают возможности эффективного ввода данных в компьютер, требуют больших затрат ручного труда медицинских работников.

Алгоритмы, которые лежат в основе функционирования подобных систем, не позволяют реализовывать гибкую программу исследования, при которой пользователь получает возможность задавать параметры изучаемого объекта и менять их в зависимости от получаемых результатов.

Важность компьютерного представления медицинской информации о пациенте возрастает также в связи с переходом медицинского обеспечения населения на принципы страховой медицины и подготовкой возрастающего потока статистической отчетности, которую лечебное учреждение обязано направлять в вышестоящие организации. Электронные записи пациентов должны соответствовать определенным стандартам для создания национальных регистров, а также интеграции с другими автоматизированными системами в России и за рубежом. Необходимость решения этой задачи подтверждает активное развитие телемедицины и взаимодействие врачей из разных стран посредством Internet [75].

В связи с вышеизложенными недостатками эксплуатирующихся в медицинских архивах автоматизированных систем, нерешенными проблемами и существующими перспективами развития медицинских технологий представляется актуальной создание АСУиО для архивов медицинских документов, удовлетворяющей современным требованиям.

Целью диссертационной работы является разработка принципов и методов автоматизированного анализа и классификации естественноязыковых медицинских данных о пациенте, а также реализация их в автоматизированной системе обработки документов медицинского архива.

Для достижения этой цели в работе требуется решить следующие задачи:

1) исследовать принципы и методы обработки информации, представленной в естественно-языковой форме как в существующих автоматизированных медицинских архивах, так и в других областях применения;

2) спроектировать лингвистическую модель для анализа медицинских сведений на естественном языке и на основе модели произвести их формализацию; 7

3) построить модель интерпретации для работы с абстрактным представлением медицинских сведений о пациенте;

4) разработать язык отображения информации, содержащейся в естественно-языковых медицинских сведений о пациенте, на модель интерпретации;

5) провести тестирование моделей на объекте исследования;

6) создать формальную систему, позволяющую оперировать абстрактными представлениями медицинских сведений о пациентах и проверить применимость формальной системы для решения задач классификации формализованных медицинских сведений в соответствии с запросами пользователей.

Методы исследований. Теоретические и прикладные разделы диссертации разработаны с применением теории формальных грамматик, теории распознавания образов, теории операций, теории множеств, теории матриц, операций математической логики, элементов математической статистики.

Экспериментальные исследования проводились в Архиве военно-медицинских документов. В качестве объекта исследования использованы архивные материалы в виде 4-х тысяч историй болезни раненых и 6-ти тысяч больных военнослужащих, принимавших участие в локальных конфликтах на территории республик, входивших в состав бывшего СССР.

Новые научные результаты.

1. Синтезирована лингвистическая модель представления медицинских сведений о пациенте на русском языке, позволяющая проводить формализацию персональной медицинской информации в терминах тезауруса предметной области.

2. Построена модель интерпретации для описания формализованных медицинских сведений о пациенте. Модель имеет 5 разновидностей по числу лингвистических групп входного текста на профессиональном медицинском языке.

3. Предложен и реализован в автоматизированной системе метод лингвистической обработки персональных медицинских документов, 8 осуществляющий отображение естественно-языковой информации в формализованное представление.

4. Построена алгебра цепочек, которая позволяет оперировать формализованными представлениями медицинских сведений и включает восемь операций. В основу алгебры положена комбинация логических и структурных методов распознавания образов.

5. Разработан классификационный алгоритм, определяющий сходство формализованных медицинских сведений на основе алгебры цепочек.

Основные положения, выносимые на защиту.

1. Модель предметной области автоматизированных систем для медицинских архивов должна быть представлена гибридным способом. Основные составляющие модели: тезаурус понятий предметной области, лингвистическая модель, описывающая медицинские сведения о пациенте на естественном языке, и модель интерпретации, при помощи которой эти сведения формализованы.

2. Для корректной автоматизированной обработки естественно-языковых медицинских сведений о пациенте с последующим преобразованием в формализованное представление используют знания семантико-синтаксической структуры текста, которая описана лингвистической моделью.

3. Обеспечить высокое качество автоматической классификации формализованных описаний пациентов в соответствии с запросами пользователей можно при учете не только синтаксиса, но и семантики формализованный представлений, что достигается применением структурных и логических методов распознавания образов. Реализацию классификации необходимо осуществлять в алгоритме, использующем операции специально разработанной для предметной области алгебры цепочек.

Практическая ценность работы.

1. Предложен метод полуавтоматического приобретения знаний из медицинских текстов для построения тезауруса предметной области в сфере персональной медицинской информации. 9

2. Разработан алгоритм кодирования, который в ходе тестирования на 896-ти медицинских документах пациентов, показал высокое качество автоматической формализации данных, позволяющей исключить субъективный фактор при обработке персональной медицинской информации.

3. Предложена архитектура автоматизированной системы, выполняющей кодирование персональной медицинской информации и ее классификацию в соответствии с запросами пользователей, для работы в медицинских архивах.

4. Разработанный классификационный алгоритм протестирован на 896-ти реальных медицинских документах. Получены следующие результаты: отклик системы равен 0.99, точность поиска - 1.00, что превышает показатели зарубежных аналогов.

Реализация результатов работы. Предложенные методы и алгоритмы реализованы в прототипе автоматизированной системы обработки данных [48], который эксплуатируется в Архиве военно-медицинских документов.

Апробация работы. Основные результаты и положения диссертационной работы докладывались и обсуждались на: Всероссийской научной конференции "Медицинская информатика накануне 21 века"(г. Санкт-Петербург, 1997 г); Международном семинаре "Biomedical Engineering & Medical Informatics'97" (г. Гливице, Польша, 1997); научно-технической конференции "Диагностика, информатика, метрология, экология, безопасность - 98" (г. Санкт-Петербург, 1998); Международной конференции по мягким вычислениям и измерениям-99 (г. Санкт-Петербург, 1999); 2-й Международной технической конференции "Медико-экологические информационные технологии - 99"; научно-технических конференциях профессорско-преподавательского состава СПбГЭТУ (1998-1999 гг).

Публикации. По теме диссертации опубликовано 8 печатных работ, из них 4 статьи и 4 доклада на конференциях и семинарах.

Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав с выводами, заключения, списка литературы,

Заключение диссертация на тему "Автоматизированные системы управления и обработки информации для архивов медицинских документов"

Выводы

1. Разработаны стандартизованные формы моделей интерпретации для формализованного представления отдельных лингвистических групп входного текста.

2. Выбран единый способ описания формализованных представлений сведений, указанных в запросе, и ПМИ с целью их сравнения. Каждой цепочке, независимо от того, к какой модели интерпретации она относится, поставлена в соответствие стандартная форма в виде множества, состоящего из элементов, тождественных отдельным составляющим этой цепочки. Все множество эквивалентно по семантике исходной цепочке.

3. Предложена архитектура системы, выполняющая классификацию формализованных описаний пациентов, хранящихся в БД, в соответствии с запросами врачей. Обработка сведений производится в две ступени:

1-я ступень - индексный поиск; 2-я - синтаксический анализ.

Для проведения индексного поиска все формализованные описания пациентов подвергаются индексированию. Для оптимизации процедуры классификации выделены наиболее важные критерии, в соответствии с которыми проводится индексирование БД.

156

4. Разработана алгебра цепочек для проведения синтаксического анализа, включающая 8 операций. В основу алгебры положена комбинация логических и структурных методов распознавания образов.

5. Процедура классификации реализована в виде алгоритма, результаты работы которого проверены на материалах обучающей и контрольной выборок, включающих 614 и 282 цепочки соответственно. Проведено сопоставление результатов работы алгоритма с подобными автоматизированными системами и ручным способом обработки.

157

Заключение

Основными результатами диссертационной работы являются следующие:

1. Построен тезаурус предметной области, описывающий терминологию военной медицины. Для построения тезауруса разработана методика полуавтоматического приобретения знаний из медицинских текстов. Тезаурус представлен двумя составляющими. Экстенсиональная составляющая - это лексико-морфологический словарь медицинских понятий, включающий в себя термины, их синонимы, родственные слова, варианты написания и сокращений. Интенсиональная составляющая - это семантическая сеть, в которой медицинские понятия представлены узлами, а отношения, их связывающие, -дугами.

2. Синтезирована лингвистическая модель представления медицинских сведений о пациенте на русском языке, позволяющая проводить формализацию информации в терминах тезауруса. Модель описана средствами индексной грамматики.

3. Построена модель интерпретации для представления формализованных медицинских сведений о пациенте. Модель имеет 5 разновидностей по числу лингвистических групп входного текста на профессиональном медицинском языке.

4. Предложен и реализован в автоматизированной системе метод лингвистической обработки медицинских документов, включающий три стадии: лексико-морфологический анализ текста, грамматический анализ и семантическую интерпретацию. На последней стадии осуществляется отображение естественно-языковой информации в формализованное представление.

5. Разработан язык отображения лингвистической модели на модель интерпретации, при помощи которого описана и программно реализована процедура кодирования. Правила языка имеют расширенную нормальную форму Бэкуса. Результаты работы алгоритма кодирования на 896-ти медицинских документах пациентов показали, что качество автоматического кодирования значительно выше ручного способа (см. табл. 4.1).

Предложена архитектура автоматизированной системы, осуществляющей лингвистическую обработку естественно-языковых медицинских сведений о пациентах с последующей их формализацией и занесением в БД. По запросам пользователей система классифицирует формализованные описания, хранящиеся в БД, в две ступени:1-я ступень - индексный поиск; 2-я - синтаксический анализ. С целью проведения синтаксического анализа построена алгебра цепочек, которая позволяет оперировать формализованными представлениями медицинских сведений и включает восемь операций. В основу алгебры положена комбинация логических и структурных методов распознавания образов.

Разработан классификационный алгоритм для получения ответов на запросы пользователей путем выполнения алгебраических операций над формализованными описаниями. Апробация алгоритма на 896-ти реальных медицинских документах дала следующие результаты: отклик системы равен 0.99, точность поиска - 1.00, что превышает показатели зарубежных аналогов (см. табл.4.4).

Предложенные методы и алгоритмы разработаны с использованием материалов 10-ти тысяч историй болезни и реализованы в прототипе автоматизированной системы обработки данных, который эксплуатируется в Архиве военно-медицинских документов.

159

Библиография Трояновская, Ольга Вадимовна, диссертация по теме Управление в биологических и медицинских системах (включая применения вычислительной техники)

1. Арикава С., Синохара Т., Мияхара Т. Теория индуктивных выводов/ЛТриобрете-ние знаний. Под ред. Осуги С., Саэки Ю,- М.: Мир, 1990. С. 179.-237.

2. Ашманов А. И., Башлыков А. М., Руссова Н. В., Соколов А. А. Автоматизация обработки текстов. Прикладная система лингвистического обеспечения работы с текстами на русском языке //Изв. РАН. Теория и системы управления. 1998. - № 3 -С. 144- 148.

3. Вишневский A.A., Шрайбер М. И. Военно-полевая хирургия//Руководство для врачей и студентов,-М.: Медицина, 1975, -319 с.

4. Волкова В. Н., Денисов А. А. Основы теории систем и системного анализа. СПб.: изд. СПбГТУ, 1997,-510 с.

5. Военно-полевая хирургия/Под ред. К. М. Лисицына, Ю. Г. Шапошникова. -М.: Медицина, 1982,- 335 с.

6. Военно-полевая хирургия/Под ред. П. Г. Брюсова, Э. А. Нечаева.- М.:Мед. изд. «ГЭОТАР», 1996,- 414 с.

7. Воробьев В. П., Синельников Р. Д. Атлас анатомии человека в 3-х томах. М.: Медгиз, 1946.

8. Вудс У. А. Основные проблемы представления знаний/ЛГИИЭР. 1986, Т.74,-№10. - С. 32-46.

9. Гладкий А. В. Синтаксические структуры естественного языка в автоматизированных системах общения,- М.: Наука. ГРФМЛ, 1985. 144 с.

10. Горелик А. И., СкрипникВ. А. Методы распознавания. М.: Высшая школа, 1989. - 231 с.

11. Гуманенко Е. К. Боевая хирургическая травма.- СПб:ВМА, 1997,- 69 с.

12. Даренский И. Д. Распознавание и сопоставление гуманитарных образов//5-я Национальная конференция с международным участием «Искусственный интеллект -94», Рыбинск, 15-21сент, 1994, Сб. научн. тр. Т.2.- С. 227- 231.

13. Евстигнеев В. А. Теория графов: Алгоритмы обработки деревьев Новосибирск.: Наука, 1994.-360 с.

14. Емелин И.В. О стандартах электронного обмена медицинскими документа-ми//Компьютерные технологии в медицине.: Изд. Русское слово, 1996. № 1.-С.43-47.

15. Елисеева И. И., Рукавишников В. О. Группировка, корреляция, распознавание образов. -М.: Статистика, 1977,- 144 с.

16. Журавлев Ю. И., Гуревич И. Б. Распознавание образов и анализ изображений// Справочник «Искусственный интеллект» в 3-х т.-М.: Радио и связь, 1990. Т. 2,- С. 149-191.

17. Закс Л. Статистическое оценивание/Пер. с нем. М.:Статистика, 1976. - 598 с.

18. Кононенко И. С. Экспериментальная система понимания коротких текстов//5-я Национальная конференция с международным участием «Искусственный интеллект -94», Рыбинск, 15-21сент, 1994, Сб. научн. тр. Т.2.- С. 395- 399.

19. Кругов B.C., Трояновская О.В. АИПС в архиве Военно-медицинского музея//Отеч. архивы,- М.:-1996, -№ 5. С. 103-105.

20. Крутов B.C., Трояновская О.В. Теоретические основы построения автоматизированной системы о раненых и больных//Воен.-мед. журн. -1997. -№ 12. С. 4-8.

21. Кувакин В. И. Управление военно-медицинской службой как научная и учебная дисциплина//Воен.-мед. журн.- 1998. № 4,- С. 4-13.

22. Кузнецов О. П., Адельсон-Вельский Г. М. Дискретная математика для инженера. -М.: Энергоатомиздат, 1988. 480 с.

23. Мазуров В. Д. Метод комитетов в задачах оптимизации и классификации -Новосибирск: Наука, Физматлит., 1990. 245 с.

24. Марселлус Д. Программирование экспертных систем на Турбо Прологе,- М.: Финансы и статистика, 1994,- 356 с.

25. Мартин Дж. Организация баз данных в вычислительных системах/Пер. с англ. -М. Мир, 1980.- 662 с.

26. Математический Энциклопедический словарь/Под ред. Ю. В. Прохорова,- М.: Сов. Энциклопедия, 1988,- С. 58.

27. Новоселов М. М. Абстракци//Философский энциклопедический словарь. М.:Сов. энциклопедия, 1993. - С.7.

28. Озкарахан Э. Машины баз данных и управление базами данных/Пер. с англ. под ред. Я.И.Фета.- М.:Мир,1989.-С.539-560.

29. Осипов Г. С. Приобретение знаний интеллектуальными системами. М.: Наука, Физматлит, 1997. - 112 с.

30. Петухова С. Г. Извлечение знаний в системах оперативно-диспетчерского управления сложными процессами//5-я Национальная конференция с международным участием «Искусственный интеллект 94», Рыбинск, 15-21сент, 1994, Сб. научн. тр. -Т.1.- С. 49- 52.

31. Погодин Ю.И., Григорьев А.И., Ивлев A.C. Основные цели и задачи автоматизации лечебно-диагностической работы в военно-медицинском учреждении//Воен -мед. журн. 1996. - N 7. -С.4-8.

32. Попов Э. В., Фоминых И. Б., Кисель Е. Б., Шапот М. Д. Статические и динамические экспертные системы. -М.:Финансы и статистика, 1996,- 320 с.

33. Пособие по номенклатуре, развернутой характеристике и примерной формулировке диагнозов внутренних болезней/Авт. коллектив под рук-вом Комарова Ф. И Л.: BMA, 1976,- 130 с.

34. Поспелов Д. А. Основные проблемы представления знаний//ТИИЭР. 1986, Т.74,-№ 10. - С. 3-4.

35. Поспелов Д. А. Уровни понимания// Справочник «Искусственный интеллект» в 3-хт.-М.: Радио и связь, 1990. Т. 2-С. 110-115.161

36. Построение экспертных систем /Под ред. Ф. Хейс-Рот, Д. Уотерман, Д. Ленат,- М.: Мир, 1987.-442 с.

37. Сигорский В. П. Математический аппарат инженера. К.:Техника, 1975. - 766 с.

38. Совпель И. В. Понимание текстов на естественном языке// Справочник «Искусственный интеллект» в 3-х т./Под ред. Д. А. Поспелова. М.: Радио и связь, 1990. --Т. 2.-С.115-121.

39. Столяр B.JI. Тенденции использования компьютеров в здравоохранении США //Компьютерные технологии в медицине.: Изд. Русское слово, 1996,- N2,- С.54-62.

40. Страхович Э. В. Двухкомпонентная модель грамматического разбора и ее реализация//Изв. РАН. Теория и системы управления. 1997,- № 5. - С. 48 -52.

41. Таунсенд К., Фохт Д. Проектирование и программная реализация экспертных систем на персональных ЭВМ/Пер. с англ.- М.: Финансы и статистика, 1990. 318 с.

42. Тейз А, Грибомон П. Логический подход к искусственному интеллекту: от модальной логики к логике баз данных. М.: Мир, 1998. - 494 с.

43. Толковый словарь по вычислительным системам/Под. Ред. В.Иллингуорта, Э.П.Глейзера. Пер.с англ.- М.Машиностроение, 1990,- С.489.

44. Трояновская О.В. Система искусственного интеллекта для автоматизированной обработки персональной медицинской информации//Вопр. технического обеспечения медико-биологических исследований: Сб. научн. тр. Известия ГЭТУ, вып. 518,- СПб., 1998,- С. 43-48.

45. Трояновская О.В, Манило Л. А. Автоматизированный анализ медицинских документов//Медико-экологические информационные технологии 99: Тез. докл. 2-й Междунар. техн. конф. г. Курск, 19 -21 мая 1999,- Курск, 1999. - С. 19-21.

46. Ту Дж., Гонсалес Р. Принципы распознавания образов. М.: Мир, 1978. - 412 с.

47. Фор А. Восприятие и распознавание образов. М.: Машиностроение, 1989. - 272с.

48. Ханенко В. Н. Информационные системы. Л.: Машиностроение, 1988. - 127 с.

49. Шенк Р. Обработка концептуальной информации. М.: Энергия, 1980. - 360 с.

50. Шлеер С., Меллор С. Объектно-ориентированный анализ: моделирование мира в состояниях. Киев: Диалектика, 1993. -240 с.

51. Экспертные системы: инструментальные средства разработки/Уч. пос., рец. В. М. Зеленин,- СПб.: Политехника, 1996. -220 с.

52. Albrecht M., Altus M, Buchholz E. The Rapid Application and Database (RADD) Workbench A Comfortable Database Design Tool// Proceedings of 7-th Int. Conference on Advanced Information Systems Engineering Berlin, 1995. - P. 327 - 340.

53. Bassoe C. F. Automated Diagnoses From Clinical Narratives: A Medical System Based on Computerized Medical Records, Natural Language Processing, and Neural Network Technology//Neural Networks. 1995,- V. 8 -N. 5. - P. 313-319.

54. Board of Directors. Standarts for Medical Identifiers, Codes, and Messages Needed to Create an Efficient Computer-stored Medical Record//JAMIA. 1994.-V. 1,- N. 1,- P. 1-7.

55. Campbell K., Das A., Musen M. A Logical Foundation for Representation of Clinical Data.//JAMIA.- 1994. -V.l.-N 3,-P.218-232

56. Chung M., Moldovan D. Applying Parallel Processing to Natural Language Process-ing//IEEE Expert Intelligent Systems and Their Applications. 1994. - V. 9. - N 1.

57. Cimino J., Clayton P., Hripcsak G. Knowledge-based Approaches to the Maintenance of a Large Controlled Medical Terminology// J AMI A 1994. - Vol. 1. - N. 1. - P.35-50

58. Cristodoulou E., Keravnou E. T. Integrating multiple problem solvers in knowledge-based systems//Knowl. Eng. Rev. -1997.-V.12,-N.2-P.181-207.

59. Day W. Discovering Consensus Molecular Sequences//Information and Classification: concepts, methods and application. Proc. Of the 16-th Ann. Dortmund, Apr. 1992. - P.393-402.

60. Dorda W., Haidl B., Sachs P. Processing Medical Natural Language Data by the System WAREL//Methods of Information in Medicine. -1988. V. 27,- N 2. - P.67-72.

61. Fischer R. J. Pseudoroots as Descriptors for a Thesaurus Based on Wiedtman's Diagnosis Table of Pediatrics//! nformation and Classification: concepts, methods and application. Proc. Of the 16-th Ann. Dortmund, Apr. 1992,-P. 461-468.

62. Friedman C., Cimino J., Johnson S. A Schema For Representing Medical Language Applied to Clinical Radiology//JAMIA.-1994.- V.l.- N 3. P.233-248.

63. Friedman C., Alderson P. et. al. A General Natural-language Text Processor of Clinical Data//JAMIA.-1994.- V.l.- N 2. P. 161-174.

64. Fu. L. M. Neural Networks in Computer Intelligence, New York: Mc.Graw-Hill, Inc., 1994. -460 p.

65. Gazdar G., Mellish C. Natural Language Processing In Prolog. An Introduction to Computational Linguistics. Addison-Wesley Company, 1990. - 504 p.

66. Goldberg E., Driedger N. Using Natural Language Processing to Produce Weather Forecasts// IEEE Expert.- 1994,- V. 9,- N 2,- P. 45-53.

67. HuffS. et. al. An Event Model of Medical Information Representation/^ AMI A.-1994.-V.2.-N2. P. 116-134.

68. Kannry J. et. al. Portability Issues for a Structure Clinical Vocabulary: Mapping from Yale to the Columbia Medical Entities Dictionary//JAMIA.-1994.- V.3.- N 1. P.66-78.

69. Kramer J.M. Medical Resourseces and the Internet//Arch. Intern. Med. -1996.-V. 156 -Apr 22.-P. 833-842.

70. Linberg D., Humphreys B.Medical Informatics//JAMA. 1996. V. 275,- N 23,- P. 18211822.

71. Long W., Sacco W., Copes W., et. al. An Evaluation of Expert Human and Automated Abbreviated Injury Scale and ICD-9-CM Injury Coding//The Journal of Trauma. 1994. -V.36.-N. 4,-P. 499-503.163

72. Lussier Y. Are we closer to standart medical coding?//Canadian Medical Informatics.-1995,- Sept.-Oct.- P. 19

73. Manago M. Learning Disjunctive concepts//Lecture Notes in AI: Knowledge Representation and Organisation in Machine Learning. Berlin.: Springer-Verlag, 1983,- P. 211-227.

74. Musgrave D. Document scanning, OCR and goodbye to the "paper-jam"//Canadian Medical Informatics. -1995. -N2. -P.32-34.

75. Opdahl A. L., Sindre G. Concents for Real-World Modelling/ZProceedings of 5-th Int. Conference on Advanced Information Systems Engineering. Paris.- 1993. - P. 309 -327.

76. Ousterhout J.K. В 21 век с языками описания сценариев// Computer Weekly.-1998.-№25,-P. 27-30.

77. Ozbolt J., Fruchtnicht J. et. al. Toward Data Standarts for Clinical Nursing Information// JAMIA.-1994.- V.l.- N 2. P. 175-185.

78. Pazzani M. Creating High Level Knowledge Structures from Simple Elements. // Lecture Notes in AI: Knowledge Representation and Organization in Machine Learning. Berlin.: Springer-Verlag, 1989,-P. 258-288.

79. Rada R. A Knowledge-Intensive Learning System for Document Retrieval// Lecture Notes in AI: Knowlege Representation and Organization in Machine Learning. Berlin.: Springer-Verlag, 1989,- P. 65 -85.

80. Rector A. L., Glowinski W. et. al. Medical-concept Models and Medical Records: An Application Based on GALEN and PEN&PAD//JAMIA.-1994.- V.2.- N 1. P. 19-35.

81. Rosenthal D., Sokolowski R. Voice-enabled, structured medical reporting// IEEE Expert: Intelligent Systems and Their Applications. -1998. V. 13,- № 1,- P. 70-73.

82. Sager N, Lyman M., Bucknall C. Natural Language Processing and the Representation of Clinical Data// J AMIA. -1994,- V. 1. -N. 2. P. 142-160.

83. Sánchez J. A., Benedi' J. M. Statistical Inductive Learning of Regular Formal Languages// IEEE Expert: Intelligent Systems and Their Applications.- 1998. V. 13,- № 1.- P. 130-138.

84. Schrepp J. Acquisition of Syntactical Knowledge from text// Information and Classsifi-cation: concepts, methods and application: Proc. Of the 16-th Ann. Dortmund, Apr. 1992 P. 356-365.

85. Seltveit A. H. Based Rule Approach to Large-Scale Information Systems Development// Proceedings of 5-th Int. Conference on Advanced Information Systems Engineering Paris.1993,-P. 328 -351.

86. Singh H. S. Data Warehousing. Concepts, Technologies, Implementations, and Management. Prentice-Hall.- Inc., 1998,- 332 p.

87. Stock O. Natural Language in Multimodal Human-Computer Interfaces//IEEE Expert.1994.-N2.-P. 40-44.164

88. Troyanovskaya O., Manilo L. Personal Medical Information Classification in Compliance with Dynamic Formed Classes//Proc. Intern. Workshop. "Biomedical Engineering & Medical Informatics'97" Gliwice, Poland: September 2-5, 1997. P. 154-158

89. Tzafestas S. G., Kokkinaki, Valavanis K. P. A. I. An overview of Expert sys-tems//Expert Systems in Engineering Applications. Berlin.:Springer-Verlag, 1993,- P. 3-24.

90. Wade A. Retaining core data in progress notes is essential//Canadian Medical Information. 1995. -N 5. -P.8.

91. Warren J. R. Better, More Cost-Effective Intake Interviews// IEEE Expert: Intelligent Systems and Their Applications. 1998. V.13. - № 1,- P. 40-48.

92. Wrobel S. Demand-driven Concept Formation/ZLecture Notes in AI: Knowledge Representation and Organisation in Machine Learning. Berlin.: Springer-Verlag, 1983,- P. 289319.166