автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Экспертная система диагностики дисплазии соединительной ткани у детей

кандидата технических наук
Шабалина, Ирина Михайловна
город
Петрозаводск
год
2002
специальность ВАК РФ
05.13.18
Диссертация по информатике, вычислительной технике и управлению на тему «Экспертная система диагностики дисплазии соединительной ткани у детей»

Оглавление автор диссертации — кандидата технических наук Шабалина, Ирина Михайловна

Введение

1. Постановка задачи диагностики дисплазии соединительной ткани (ДСТ) и первичная статистическая обработка данных

1.1. Концептуальная модель проблемы диагностики дисплазии соединительной ткани.

1.2. Сбор исходных статистических данных и формирование обучающей выборки.

1.3. Математическая модель классификации обследуемых объектов по степеням ДСТ.

1.4. Постановка задачи диагностики степеней ДСТ.

1.5. Первичная статистическая обработка.

1.6. Исследование зависимости признаков ДСТ.

1.7. Статистическая проверка гипотез в задаче диагностики ДСТ.

1.8. Доверительный интервал для неизвестной вероятности.

1.9. Исследование связи ДСТ с другими заболеваниями.

Выводы по Главе 1.

2. Частотные методы формирования знаний и их использование при разработке ЭС "Дисплазия"

2.1. Частотный метод построения функции принадлежности для диагностики ДСТ.

2.1.1. Основные предположения математической модели частотного метода.

2.1.2. Построение функции принадлежости.

2.1.3. Алгоритм расчета и его программная реализация.

2.1.4. Пример использования функции принадлежности.

2.2. Полипроцедурный подход для определения наиболее надежного диагноза при диагностике ДСТ.

2.2.1. Суть полипоцедуного подхода.

2.2.2. Применение полипроцедурного подхода.

2.2.3. Результаты применения полипроцедурного подхода при диагностике ДСТ.

2.3. Разработка экспертной системы диагностики дисплазии соединительной ткани.

2.3.1. Назначение и основные характеристики экспертной системы диагностики степени ДСТ.

2.3.2. Архитектура и режимы работы ЭС "Дисплазия".

2.3.3. Принятие решений в ЭС "Дисплазия".

2.3.4. Приобретение и представление знаний в ЭС "Дисплазия".

Выводы по Главе 2.

Методы формирования знаний в ЭС "Дисплазия"

3.1. Использование информационных характеристик исходных данных при формировании правил продукций.

3.1.1. Определение прогностических коэффициентов.

3.1.2. Использование энтропии при построении правил.

3.2. Анализ главных компонент (АГК).

3.2.1. АГК и его геометрическая интерпретация.

3.2.2. Реализация процедуры компонентного анализа и полученные результаты.

3.3. Эталонные методы построения правил продукций

3.3.1. Геометрический подход к формированию знаний.

3.3.2. Механический подход к формированию знаний.

3.4. Логические методы формирования знаний.

3.4.1. Теоретическая основа логических методов.

3.4.2. Представление исходных данных с точки зрения логических методов.

3.4.3. Описание метода построения покрытия.

3.4.4. Пример использования алгоритма построения покрытия.

3.4.5. Реализация алгоритма, его достоинства и недостатки.

3.5. Сравнительная характеристика правил продукций, формируемых ЭС "Дисплазия".

Выводы по Главе 3.

Введение 2002 год, диссертация по информатике, вычислительной технике и управлению, Шабалина, Ирина Михайловна

Актуальность темы.

Одной из наиболее актуальных и основных проблем медико-биологических исследований является диагностика заболеваний человека. Исключительная сложность и многообразие различных биологических систем и процессов, происходящих в них, является причиной того, что в настоящее время многие эффективные методы диагностики, терапии и профилактики заболеваний не имеют в ряде важных случаев обоснованного научного фундамента из-за отсутствия обоснованных количественных методов диагностики заболеваний. Особенно остро проблема диагностики заболеваний стоит в педиатрии, так как в детстве закладываются основы здоровья будущей жизни человека.

В настоящее время из-за сложности и многообразия клинических методов диагностики, терапии и профилактики врачи подразделяются на врачей широкого профиля (педиатр, терапевт, семейный врач) и врачей-специалистов, которые специализируются в области нескольких сходных, близких по тем или иным признакам, заболеваний (невропатолог, нефролог, офтальмолог и др.) Врачи-специалисты обладают глубокими знаниями и опытом в области диагностики, лечения и профилактики заболеваний своей специализации, но при этом лишь общими сведениями по заболеваниям других специализаций. Известно, что среди врачей-специалистов есть выдающиеся, а иногда и гениальные — специалисты "экстра-класса", и есть специалисты среднего уровня.

Применение достижений специалистов "экстра-класса" осуществляется через научные публикации и рекомендации научно-исследовательских организаций лечебным учреждениям, что в общем случае требует достаточно больших временных затрат.

Чтобы приблизить клиническую практику к уровню новейших достижений специалистов "экстра-класса" применяются различные методы. Одним из наиболее эффективных методов, позволяющих учитывать достижения специалистов различного профиля и оперативно использовать их в клинической практике, является разработка и внедрение компьютерных экспертных систем, уже доказавших свою работоспособность в ряде областей медицины (в медицинской диагностике [43], [11], наблюдении за пациентами, выборе эффективного лечения [55], [20] и др.)

Однако исследования и разработки в области экспертных систем диагностики дисплазии соединительной ткани до сих пор не проводились. Исходя из изложенного можно сделать вывод о том, что тема диссертационной работы, посвященная разработке компьютерной экспертной системы для диагностики дисплазии соединительной ткани в детском возрасте является актуальной и имеет большое практическое значение.

В общем случае задачи диагностики заболеваний с математической точки зрения сводятся к известным задачам классификации и теории распознавания образов. Однако разработка конкретных дискретных систем требует предварительных исследований для выбора наиболее эффективных методов классификации или синтеза новых методов, учитывающих специфику рассматриваемой предметной области, что представляет собой существенный научный интерес.

Кроме того, исследование и разработка конкретной компьютерной системы требует выполнения больших объемов высококвалифицированной работы для синтеза рациональных продукционных блоков и удобного интерфейса для пользователя, учитывающего специфические условия практического применения.

Цель работы. Таким образом, конечной целью данной работы является разработка компьютерного программного комплекса — экспертной системы диагностики степени ДСТ, предназначенного для определения степени ДСТ у обследуемых детей по наличию ряда внешних признаков ДСТ.

Для достижения поставленной цели в ходе исследования были решены следующие задачи:

1. Сбор статистических данных и первичная статистическая обработка данных (исследование зависимостей, регрессионный анализ), включая разработку компьютерных программ для сбора, хранения и обработки данных.

2. Разработка математической модели и методов диагностики (определения) у пациентов степеней ДСТ.

3. Выбор методов формирования наиболее эффективных продукционных правил для экспертной системы диагностики ДСТ, разработка нового частотного метода формирования правил.

4. Компьютерная реализация методов формирования наиболее эффективных правил продукций, разработка процедуры диагностики, использующей эти правила.

5. Объединение разработанных процедур диагностики и реализация программного комплекса "Дисплазия".

При решении указанных задач используются методы теории экспертных систем, теории вероятностей, математической статистики, теории распознавания образов, математической логики, теории множеств и теории принятия решений.

Научная новизна.

• В данной работе впервые предложена и обоснована математическая модель диагностики ДСТ у обследуемых детей по наличию у них внешних признаков из определенного набора.

• Предложены новые математические методы формирования знаний для экспертной системы, использующие частотные характеристики обучающей выборки.

• Обоснована и разработана экспертная система диагностики дие-плазии соединительной ткани у детей, использующая данные обучающей выборки для формирования знаний.

Основные положения, выносимые на защиту.

1. Обосновано применение экспертной системы для решения проблемы диагностики степени ДСТ у обследуемых детей.

2. Предложен новый частотный метод диагностики степени ДСТ [64]. Предложен также полипроцедурный подход для вычисления степени надежности диагноза, полученного при использовании нескольких продукционных правил, сформированных разными математическими методами.

3. Адаптированы известные математические методы диагностики применительно к проблеме диагностики ДСТ (метод прогностических коэффициентов, энтропия, компонентный анализ, эталонные методы, логические методы [61], [62], [63]).

4. Разработан и внедрен в опытную эксплуатацию программный комплекс "Дисплазия", предназначенный для диагностики степени ДСТ у обследуемых детей.

Объем и структура диссертации.

Диссертация состоит из введения, трех глав и приложений. Материал работы, изложенный на 125 страницах машинописного текста, включает список литературы, содержащий 70 наименований.

Заключение диссертация на тему "Экспертная система диагностики дисплазии соединительной ткани у детей"

Основные выводы и рекомендации.

1. Одним из наиболее эффективных способов использования достижений специалистов "экстра-класса" различных профилей и оперативно использования этих достижений в клинической практике является разработка и внедрение компьютерных экспертных систем. Однако исследования и разработки в области экспертных систем диагностики дисплазии соединительной ткани ранее не проводились, и поэтому разработанная компьютерная программная системы для диагностики ДСТ имеет важное практическое значение.

2. Сбор статистических данных и первичная статистическая обработка данных (исследование зависимостей, регрессионный анализ) показали, что применение стандартных математических методов при решении проблемы диагностики ДСТ оказалось недостаточно эффективным, поэтому задача диагностики ДСТ требовала адаптации известных методов, применяемых в диагностике и разработки новых методов.

3. Среди разработанных новых и адаптированных известных методов формирования продукционных правил для экспертной системы диагностики ДСТ наиболее эффективным и научно обоснованным является частотный метод формирования правил, основанный на использовании частотных характеристик обучающей выборки.

4. Для определения наиболее надежного диагноза использовался полипроцедурный подход, который обобщает диагнозы, полученные различными правилами, и при этом учитывает степени надежности этих диагнозов.

5. Разработанный программный комплекс "Дисплазия" внедрен в опытную эксплуатацию и используется для диагностики ДСТ у детей.

6. Методы, реализованные в программной системе "Дисплазия", применимы при решении задач создания экспертных систем диагностики заболеваний (состояний), характеризующихся некоторыми наборами признаков (симптомов) и несколькими степенями или формами. Таким образом, возможно использование результатов данной диссертационной работы не только в области диагностики ДСТ, но и в других проблемных областях.

Пунктирными линиями на рис. 2 показана схема работы ЭС "Дисплазия" в режиме консультации (или диагностики). Пользователь заносит в БД информацию о пациенте, запускает программу вывода, которая на основании правил вывода, правил представления знаний из БЗ и поступивших в БД сведений делает заключение о степени ДСТ у объекта и показывает, насколько ЭС уверена в этом результате. Объяснение полученного результата состоит в том, чтобы показать выводы, полученные различными диагностическими правилами и степени надежности этих выводов. При желании пользователь может занести полученный результат в БД и тем самым пополнить обучающую выборку для извлечения знаний.

2.3.3. Принятие решений в ЭС "Дисплазия".

Библиография Шабалина, Ирина Михайловна, диссертация по теме Математическое моделирование, численные методы и комплексы программ

1. Айвазян С. А., Бежаева 3. ИСтароверов 0. В. Классификация многомерных наблюдений. М.: Статистика. 1974. 256 с.

2. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: классификация и снижение размерностей. М.: Финансы и статистика. 1989. 606 с.

3. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: основы моделирования и первичная обработка данных. М.: Финансы и статистика. 1983. 471 с.

4. Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика: исследование зависимостей. М.: Финансы и статистика. 1985. 448 с.

5. Андерсон Т. Введение в многомерный статистический анализ. М.: Физматгиз. 1963. 500 с.

6. Афифи А., Эйзен С. Статистический анализ. Подход с использованием ЭВМ. М.: Мир. 1982. 488 с.

7. Бейли Н. Математика в биологии и медицине. М.: Мир. 1970. 328 с.

8. Бутенин Н.В., Лунц Я. Л., Меркин Д. Р. Курс теоретической механики. Т. 2. М.: Наука. 1985. 496 с.

9. Вайнцвайг М. Н. Алгоритм обучения распознаванию образов "Кора" // Алгоритмы обучения распознаванию образов. М.: Советское радио. 1973. С. 110-116.

10. Гладун В. П. Эвристический поиск в сложных средах. Киев: Наукова думка. 1977. 166 с.

11. Горбатенко С.А. ЭС "Острый живот" с точки зрения интерниста // Актуальные вопросы гастроэнтерологии. Сб. науч. ст. М. 1991. С. 76-81.

12. Горбатовский Я. А., Филимонов С. Н., Лотош Е. А. Прогнозирование вероятности развития инфаркта миокарда по генетическим и фенотипическим маркерам // Терапевтический архив. 1996. № 9. С. 47-52.

13. Горелик A. Л., Гуревич И. Б. Современное состояние проблемы распознавания. М.: Радио и связь. 1985.

14. Горелик А. Л., Скрипкин В. А. Методы распознавания. М.: Высшая школа. 1989. 232 с.

15. Гублер Е. В., Генкин А. А. Применение непараметрических критериев статистики в медико-биологических исследованиях. М.: Медицина. 1973.

16. Гублер Е. В. Вычислительные методы анализа и распознавания патологических процессов. М.:Медицина. 1978. 326 с.

17. Дюк В.А. Компьютерная психодиагностика. СПб.: Братство. 1994. 364 с.

18. Загоруйко Н. Г. Прикладные методы анализа данных и знаний. Новосибирск: Издательство Института математики. 1999. 269 с.

19. Заде Л. Понятие лингвистической переменной и его применив к принятию приближенных решений. М: Мир. 1976. 165 с.

20. Зайдинер В. М. Выбор режима лекарственного болеутоляющего // Нетрадиционные методы в онкологии. Материалы Всерос. науч.-практ. конференции онкологов. Ростов-на-дону. 1991. С. 143-147.

21. Земцовский Э. В. Соединительнотканные дисплазии сердца. СПб.: Политекс. 1998. 96 с.

22. Иберла К. Факторный анализ. М.: Статистика. 1980. 398 с.

23. Искуственный интеллект. Системы общения и экспертные системы. В 3-х кн. Кн. 1. / Под ред. Э. В. Попова. М.: Радио и связь. 1990. 464 с.

24. Искуственный интеллект. Модели и методы. В 3-х кн. Книга 2. / Под ред. Д. А. Поспелова. М.: Радио и связь. 1990. 304 с.

25. Кульбак С. Теория информации и статистика. М.: Наука. 1967.

26. Лбов Г. С. Методы обработки разнотипных экспериментальных данных. Новосибирск: Наука. 1981. 211 с.

27. Левин Р., Дранг Д., Эделсон Б. Практическое введение в технологию искусственного интеллекта и экспертных систем с иллюстрациями на Бейсике. М.: Финансы и статистика. 1990. 239 с.

28. Логический подход к искусственному интеллекту: от модальной логики к логике баз данных / Под ред. Г. П. Гаврилова. М.: Мир. 1998. 494 с.

29. Лорьер Ж.-Л. Системы искуственного интеллекта / Пер. с фр. под ред. В. Л.Стефановича. М.: Мир. 1991. 568 с.

30. Лоули Д., Максвелл А. Факторный анализ как статистический метод. М.: Мир. 1967. 144 с.

31. Мандель И. Д. Кластерный анализ. М.: Финансы и статистика. 1988. 176 с.

32. Марселлус Д. Н. Программирование экспертных систем на Turbo Prolog. М: Финансы и статистика. 1994. 256 с.

33. Меллер Ф., Капекки В. Роль энтропии в номинальной классификации // Математика в социологии. Моделирование и обработка информации / Под ред. А. Г. Аганбегяна, Ф. М. Бородкина и др. М.: Мир. 1977. С.

34. Миркин Б. Г. Анализ качественных признаков и структур. М.: Статистика. 1980. 319 с.

35. Миркин Б. Г. Группировки в социально-экономических исследованиях. М.: Финансы и статистика. 1985. 223 с.

36. Миркин Б. Г. Модели качественного анализа социально-экономической информации // Математика в социологии. Моделирование и обработка информации / Под ред. А. Г. Аганбегяна, Ф. М. Бородкина и др. М.: Мир. 1977. С.

37. Миркин Б. Г. Проблема группового выбора. М.-Статистика. 1974. 256 с.

38. Нейлор К. Как построить свою экспертную систему. М.: Энерго-атомиздат. 1991. 286 с.

39. Нечеткие множества в моделях управления и искуственного интеллекта / Под ред. Д. А. Поспелова. М.: Наука. 1986. 312 с.

40. Нилъсон Н. Д. Искусственный интеллект. Методы поиска решений. М.: Мир. 1973. 272 с.

41. Осуга С. Обработка знаний. М.: Мир. 1989. 293 с.

42. Пиотровская Н. В. ЭС PRINF, прогнозирующая возникновение сердечной недостаточности у больных острым инфарктом миокарда // Труды Тбилисского университета. Тбилиси. 1991. С. 74-79.

43. Поспелов Д. А. Моделирование рассуждений. М.: Радио и связь. 1989. 184 с.

44. Представление и использование знаний / Под ред. X. Уэно, М. Исид-зука. М.: Мир. 1989. 220 с.

45. Приобретение знаний / Под ред. С. Осуги, Ю. Саэки. М.: Мир. 1990. 303 с.

46. Растригин Л. А., Эренштейн P. X. Методы коллективного распознавания. М.: Энергоиздат. 1981. 79 с.

47. Ротаръ В. И. Теория вероятностей. М.: Высшая школа. 1992. 368 с.

48. Рыжиков Ю. И. Решение научно-технических задач на персональном компьютере. СПб.: КОРОНА принт. 2000. 272 с.

49. Системы управления базами данных и знаний. Справочное издание / Под ред. А. Н. Наумова. М.: Финансы и статистика. 1991. 352 с.

50. Смирнов Н. В., Дунин-Барковский И. В. Курс теории вероятностей и математической статистики для технических приложений. М.: Наука. 1969. 512 с.

51. Степанова Е. Н., Широков Б. М. Издательская система LATEX. Петрозаводск: Издательство ПетрГУ. 1999. 156 с.

52. Тейз. А., Грибомон. П., Луи. Ж. Логический подход к искусственному интеллекту. От классической логики к логическому программированию. М.: Мир. 1990. 432 с.

53. Телемедицина. Новые информационные технологии на пороге XXI века / Под редакцией проф. Р.М.Юсупова и проф. Р.И.Полонникова. Санкт-Петербург. 1998.

54. Темиров А. А. Экспертная система динамического наблюдения и выбора лечения в кардиологии // Информатизация в деятельности медицинских служб: Респ. сб. науч. тр. 4.2. М. 1992. С. 31-36.

55. Факторный, дискриминантный и кластерный анализ / Под ред. И.С.Енюкова. М.: Финансы и статистика. 1989. 216 с.

56. Фомина Л. Н., Аббакумов В. Л. Критерий диагностики степени выраженности ДСТ у детей // Тезисы докладов республиканской научно- практической конференции "Новое в диагностике и лечении внутренних болезней". Петрозаводск, 18-19 апреля 2000. С. 101103.

57. Фу К. Последовательные методы в распознавании образов. М.: Наука. 1971. 225 с.

58. Харман Г. Современный факторный анализ. М.: Статистика. 1972. 486 с.

59. Чернецкий В. И. Математическое моделирование стохастических систем. Петрозаводск: Издательство ПетрГУ. 1994. 488 с.

60. Шабалина И. М., Чернецкий В. И. Частотный метод построения функции принадлежности для определения степеней ДСТ // Прикладная математика и информатика. Труды ПетрГУ. Вып. 8. Петрозаводск: Издательство ПетрГУ. 1999. С. 129-138.

61. Шабалина И. М. Разработка процедуры построения диагностических правил для определения степеней ДСТ // Прикладная математика и информатика. Труды ПетрГУ. Вып. 8. Петрозаводск: Издательство ПетрГУ. 1999. С. 117-128.

62. Шабалина И. М. Механический подход к определению весов признаков ДСТ // Прикладная математика и информатика. Труды Петр-ГУ. Вып. 8. Петрозаводск: Издательство ПетрГУ. 1999. С. 139-148.

63. Шабалина И. М. Разработка математической модели и компьютерная реализация методов диагностики дисплазии соединительной ткани // Обзор прикладной и промышленной математики, Т. 8. Вып. 1. М.: Научное издательство ТВП. 2001. С. 376.

64. Шабалина И. М. Математические модели и методы диагностики дисплазии соединительной ткани // Тезисы докладов VI международной конференции "Контроль и управление в сложных системах" (КУСС-2001) 5-12 октября 2001г., Украина, Винница, 2001. С. 59.

65. Экспертные системы. Принципы работы и примеры./ Под ред. Р. Форсайта. М.: Радио и связь. 1987. 224 с.

66. Юдин Д. Б. Задачи и методы стохастического программирования. М.: "Советское радио". 1979. 392 с.

67. Яковлева А. А. Гипермобильный синдром. //Медицинская газета. № 7. 25 февраля 2000. С. 8.

68. Spiros G. Tzafestas Fuzzy systems and fuzzy expert control: An overview. // The Knowledge Engineering Review. Vol 9:3. 1994. P. 229268.