Моделирование техногенного воздействия на здоровье и продолжительность жизни человека для систем поддержки принятия решений

Муратова, Светлана Юрьевна

Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)

автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Моделирование техногенного воздействия на здоровье и продолжительность жизни человека для систем поддержки принятия решений

кандидата технических наук: Муратова, Светлана Юрьевна
город: Москва
год: 1999
специальность ВАК РФ: 05.13.16

Автореферат по информатике, вычислительной технике и управлению на тему «Моделирование техногенного воздействия на здоровье и продолжительность жизни человека для систем поддержки принятия решений»

Автореферат диссертации по теме "Моделирование техногенного воздействия на здоровье и продолжительность жизни человека для систем поддержки принятия решений"

ч ^

На правах рукописи МУРАТОВА Светлана Юрьевна

МОДЕЛИРОВАНИЕ ТЕХНОГЕННОГО ВОЗДЕЙСТВИЯ НА ЗДОРОВЬЕ И ПРОДОЛЖИТЕЛЬНОСТЬ ЖИЗНИ ЧЕЛОВЕКА ДЛЯ СИСТЕМ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ

Специальность 05.13.16. - Применение вычислительной техники,

математических методов и математического моделирования в научных исследованиях

Автореферат диссертации на соискание ученой степени кандидата технических наук

Москва 1999

Работа выполнена на кафедре АСУ Московского Государственного института стали и сплавов (Технологического университета)

Научный руководитель: к.т.н. доцент Косарев В.А.

Официальные оппоненты: проф., д.т.н. Мастрюков Б.С. доц., к.т.н. Сергеев Л.Г.

Ведущая организация: Российский Государственный Гуманитарный Университет

Зашита состоится ".У" «^^/^О/ еЯ 2000 г. в^^ часов на заседании диссертационного совета Д.053.08.07 в Московском Государственном институте стали и сплавов (Технологическом университете) по адресу: 117936, г. Москва, Ленинский просп.,4.

С диссертацией можно ознакомиться в библиотеке Московского Государственного института стали и сплавов (Технологического университета)

Автореферат разослан 1999 г.

диссертационного сов

Ученый секретарь

к.т.н., профессор Е.А. Калашников

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы обусловлена критическим состоянием экологии в 'оссии. Согласно выводам ученых, около 40 млн. человек, проживающих в 86 города, испытывают воздействие вредных веществ, з 10 раз и более превышающих нор-(ы ПДК. Особенно тяжелое положение сложилось в городах, в которых расположены [редприятия черной и цветной металлургии, нефтедобывающей н нефтеперерабаты-ающей отраслей, топливно-энергетического комплекса.

На сегодняшний день в мире не существует моделей, связывающих уровень агрязненш окружающей среды с продолжительностью жизни. До сих пор такая за-,ача не ставилась и не решалась, хотя, несомненно, это одна из важнейших проблем в кологии человека. Давно уже настал момент, когда люди должны осознавать лоелед-твия своей экологической безграмотности, легкомысленного отношения к окру-сающей среде, преступного отношения к своим потомкам, наследующим после них еградирующую, неустойчивую среду обитания.

Анализ же существующих математических моделей показал, что они реша->т иные задачи и описывают влияние загрязняющих веществ на заболеваемость и мертность только для больших групп населения (взрослые, дети; мужчины, женщи-ы и т.д.), на основе которых невозможно оценить изменение продолжительности жни. Оценка заболеваемости и смертности в лучшем случае осуществляется с чень обобщенном виде, в худшем случае она просто некорректна.

В связи с этим остается актуальной задача оценки техногенного воздейст-ия на здоровье и продолжительность жизни человека.

Существующие модели обладают следующими недостатками: смысловой некорректностью (в линейных моделях регрессии присутствуют отрицательные коэффициенты, искажающие характер влияния загрязнителей на здоровье человека).

неоднозначностью результатов (при этом разница оцениваемых коэффициентов может достигать нескольких раз),

методическими погрешностями (полученные коэффициенты слишком завышены вследствие неправильного учета совокупности загрязняющих факторов).

Сложившаяся ситуация объясняется тем, что имеющаяся у исследователя нформация неполна, часто противоречива и недоступна для точного измерения.

Вместе с тем накопленный опыт, аккумулирующий результаты сгатистиче-сих исследований, а также субъективно-интуитивные знания экспертов, позволяет зстроить комбинированную модель техногенного воздействия на здоровье к про-мжительность жизни человека, учитывающую противоречивость и разнородность чформационного пространства, характерной для данной предметной области.

Цель работы.

На основе анализа предметной области и существующих методов моделирования разработать:

• комбинированную математическую модель техногенного воздействия, позволяющую оценить заболеваемость, смертность и продолжительность жизни для различных групп населения с возможной персонификацией этих показателей для конкретного человека, как среднестатистического носителя учитываемых в ней факторов.

• алгоритм идентификации комбинированных математических моделей, оперирующих с разнородными параметрами в разнородной информационной среде.

• диалоговую систему идентификации комбинированных моделей на основе экспертных оценок.

• Апробировать полученную модель для оценки техногенного воздействия на здоровье и продолжительность жизни человека с использованием данных одного из металлургических городов России.

Методика исследований включала:

- изучение проблематики рассматриваемой предметной области, существующих моделей и методов ее исследования;

изучение теории нечетких множеств и использования экспертных знаний при исследовании и моделировании сложных, слабо структурируемых предметных областей;

- изучение известных способов идентификации нечетких, комбинированных моделей.

Научная новизна диссертации заключается в следующем:

• Проведен сравнительный анализ существующих моделей и методов оценки воздействия загрязняющих веществ на здоровье и продолжительность жизни человека.

• Выявлена информационная специфика исследуемой предметной области.

• Сформулирована задача синтеза многоцелевой математической модели техногенного воздействия.

• Разработана комбинированная математическая модель техногенного воздействия на здоровье человека, позволяющая оценить заболеваемость, смертность и продолжительность жизни для различных групп населения с возможной персонификацией этих показателей для конкретного человека, как среднестатистического носителя учитываемых в ней факторов.

• Разработан алгоритм и диалоговая экспертная процедура идентификации класса комбинированных моделей, оперирующих с разнородными параметрами в разнородной информационной среде и состоящий из двух основных этапов. На первом этапе осуществляется идентификация параметров модели с использованием классических методов (например, методом наименьших квадратов). На втором этапе осуществляется корректировка с использованием многовариантной процедуры на-

стройки с помощью изменения параметров функций принадлежности коэффициентов модели и исходных данных.

Практическая ценность обусловлена тремя аспектами применения:

1) в обучающих интеллектуальных компьютерных тренинговых системах для воспитания экологической культуры у эксплуатационно-технического персонала (ЭТИ) и студентов высших и средних специальных учебных заведений, для оценки вреда, наносимого здоровью людей, в том числе обучаемого, в результате предпринятых им технологических действий;

2) в гигиенической практике для прогноза состояния здоровья населения, принятия решений и оценки последствий размещения того или иного производства;

3) для оценки уязвимости лиц, устраивающихся на экологически опасное производство, при профотборе.

Апробация работы. Основные положения и результаты работы обсуждались на научных семинарах кафедры АСУ МИСиС, на седьмой международной конференции «Проблемы управления безопасностью сложных систем», Москва, 1999 год.

Публикации. По теме диссертации опубликовано три работы.

Структура я объем диссертации. Диссертация состоит из введения, четырех глав, заключения, приложения и списка литературы, включающего 67 наименований. Основной текст занимает 131 машинописных страниц, в том числе 31 рисунок, 6 таблиц, 2 графика и 4 диаграммы.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность проблемы, сформулированы; цели и задачи исследования.

В первой главе приводится постановка задачи исследования, концептуальные принципы построения модели, обзор и сравнительный анализ существующих моделей и методов оценки техногенного воздействия на здоровье человека и продолжительность жизни; анализируются специфика информационного пространства рассматриваемой предметной области, существующие методы идентификации комбинированных моделей, их недостатки и ограничения.

Хотя при проектировании промышленного объекта в режимы его функционирования законодатель закладывает принцип экологической чистоты (установлено более 600 ПДК в селитебных зонах, более чем для 1200 веществ установлены безопасные ориентировочные уровни воздействия, определены нормы предельно допустимых выбросов в атмосферу и нормы предельно допустимых сбросов загрязняющих веществ в водные объекты), центры черной металлургии находятся, тем не менее, в бедственной экологической ситуации. Ее основными причинами являются следующие:

отсутствие очистных сооружений и установок (1/3 всех источников загрязнений не имеют очистных установок);

частая поломка или низкая эффективность имеющихся очистных сооружений (1/5 всех пылегазоочистных установок не работает или работает неэффективно, только половина сточных вод очищаются до установленных нормативов); - экологическое несовершенство собственно технологических процессов.

Именно поэтому огромное количество публикаций, специальных изданий посвящены техническим и технологическим проблемам разработки эффективных очистных сооружений, внедрению новых безотходных или малоотходных технологий. Прогресс в данной области очевиден, однако их установка - дело дорогостоящее, требующее немалых капитальных вложений, что на современном этапе для многих российских предприятий является крайне затруднительным. В связи с этим предлагается там, где это возможно, иной подход, суть которого состоит в следующем: выбирать технологические режимы, объем загрязняющих веществ (ЗВ) от которых будет минимальным или соответствовать существующим нормативам. Такой режим назовем условно экологическим, а саму задачу - задачей выбора условно экологического режима. Наличие очистных сооружений при таком подходе только усилит выходной эффект (т.е. уменьшит объем загрязняющих веществ, поступающих в окружающую среду (ОС)), а сами условно экологические режимы будут способствовать меньшему износу очистных сооружений, их более эффективной работе. Подготовка специалиста с элементарной экологической культурой и как следствием этого - экологической ответственностью - становится одной из главных целей формирования кадрового потенциала металлургического производства.

Включив экологическую подсистему в интеллектуальные компьютерные тре-нинговые системы (ИКТС), можно формировать у эксплуатационно-технического персонала (ЭТП) «хорошие» экологические навыки, экологическую культуру поведения, чувство ответственности за свои технологические «действия». Воспитание нового глобального ноосферного мышления становится особенно актуальным в преддверии нового века, с которым человечество связывает надежды на более высокие экологические стандарты качества жизни.

Одним из основных компонентов ИКТС подготовки ЭТП экологически опасного производства является модель техногенного воздействия (МТВ), связывающая уровень загрязнения окружающей среды с состоянием здоровья человека и продолжительностью жизни.

При оценке уровня загрязнения в результате мониторинга окружающей среды (простых измерений концентраций ЗВ) предлагающаяся модель может использоваться в общепринятой гигиенической практике для оценки и анализа состояния здоровья населения, для прогноза последствий размещения того или иного производства и принятия решений при его проектировании, модернизации и оценки экологического ущерба.

Кроме того, модель техногенного воздействия предлагается использовать дм профотбора персонала. Человек, устраивающийся на работу на экологически опасное

производство, должен сознавать степень риска и его возможные последствия для жоего здоровья.

Таким образом, предлагаемая модель носит универсальный характер для многоцелевого использования и имеет следующие структурные особенности (Рис. 1):

Рис. 1. Модельная структура техногенного воздействия на человека

На Рис. 1: вектор С - вектор концентраций ЗВ, вектор д - искомый вектор обобщенной или персонифицированной заболеваемости или смертности, на основе соторош рассчитывается продолжительность жизни.

Математическая модель техногенного воздействия состоит из двух частей -збобщенной модели и персонифицированной:

I. Обобщенная модель строится для эталонных групп населения без учета временного фактора их нахождения в «грязной» среде и описывает влияние ЗВ на заболеваемость ¡-ой болезнью во всех возрастных группах для эталонных групп населения.

>. Персонифицированная модель строится для различных групп населения и отражает влияние ЗВ на конкретного индивида как среднестатистического носителя присущих ему качеств. При этом учитываются возраст, пол, район проживания, вредные привычки (курение), экология рабочего места, избыточный вес, семейное положение, уровень образования и временной фактор воздействия ЗВ на здоровье.

При использовании МТБ в процессе обучения, характеристики технологи-¡еского режима интерпретируются с точки зрения субъективных качеств обучаемого.

Прогнозируется вероятность заболеваемости 1-ой болезнью и, для усиления психологического воздействия, изменение продолжительности предстоящей жизни (ППЖ) конкретно для него самого и его ближайших потомков (детей, внуков).

Продолжительность жизни детей и внуков рассчитывается по тем же формулам, что и ППЖ обучаемого. Главное различие между ними заключается в следующем:

- в длительности воздействия ЗВ;

- в концентрациях ЗВ - в рабочей зоне они значительно выше, чем в селитебной зоне, однако и влияние их на детский организм в несколько раз более существенный;

- в возможности возникновения аварийных ситуаций с сильным токсическим воздействием.

Характерной особенностью многофункциональной ИКТС для экологически опасного производства является необходимость моделирования штатных и внештатных ситуаций. Для моделирования техногенного воздействия аварийных ситуаций предлагается использовать известную функцию Гаусса (функцию ошибок).

Анализ исследований, посвященных оценке влияния ЗВ на здоровье человека, показал, что большинство из них неприемлемы либо из-за своей смысловой некорректности, либо из-за многозначности.

Известные модели техногенного воздействия решают иные задачи и описывают влияние ЗВ на заболеваемость и смертность только для больших групп населения (взрослые, дети; мужчины, женщины и т.д.), на основе которых невозможно оценить изменение продолжительности жизни. Оценка заболеваемости и смертности в лучшем случае осуществляется в очень обобщенном виде, в худшем случае она просто некорректна.

До сих пор не ставилась и не решалась проблема оценки индивидуальной уязвимости человека как среднестатистического носителя присущих ему качеств. В зарубежных исследованиях были выявлены факторы, влияющие на заболеваемость и смертность, однако их оценка была очень усредненной и относилась к большим группам населения (мужчинам и женщинам старше 25 лет), что не позволило напрямую использовать полученные в них результаты для оценки заболеваемости, смертности и продолжительности жизни. После экспертных уточнений и процедуры идентификации, вредные привычки (курение), социально-демографические факторы (пол, семейное положение и уровень образования) и физические характеристики (избыточный вес человека) были введены в персонифицированную модель, на основе которой рассчитывается индивидуальная продолжительность жизни.

Особые трудности возникают при построении функций <2(С) для воды и почвы. Известные оценки влияния уровней загрязнения этих сред на здоровье человека в основном носят качественный характер.

В целом же, имеющиеся результаты исследований характеризуются разнородностью полученной информации. Одни оценки выявленных зависимостей, в силу их методической убедительности и корректности, можно рассматривать как детерминированные, четкие оценки, другие - в силу их. предположительности, субъективизма,

отсутствия четкого подтверждения (в силу разных причин) - как размытые, нечетко-множественные.

В связи с этим для оценки техногенного воздействия на здоровье человека предлагается использовать другие методы - методы теории нечетких множеств, которые, как правило, применяются для исследования слабоструктурируемых систем, характеризующихся недостатком или отсутствием научных представлений, а также неоднозначностью, разнородностью и размытостью входной и выходной информации.

Модели, оперирующие с разнородными параметрами в разнородной янфор-мациониой среде, называются комбинированными моделями. Для их идентификации должны использоваться специальные экспертные, диалоговые процедуры.

Проведенный анализ известных методов идентификации показал, что все они предполагают наличие достаточного количества экспериментальных денных, выходные значения которых получены либо в результате измерений, либо з результате экспертного опроса. На практике часто возникает ситуация, когда эксперт не может гипотетически создать обучающую выборку достаточной мощности или провести измерения, пусть и неточные. Он должен довольствоваться только той информацией, которая у него имеется и часто этой информации бывает очень мало и ее получение крайне затруднено из-за недостаточности или отсутствия материальных ресурсов, либо научных представлений.

Кроме того, во всех изученных работах входные значения обучающей выборки рассматриваются как четкие числа. Это условие является довольно желтим. Часто из-за вышеперечисленных особенностей объекта оно невыполнимо и ограничивает область применения представленных методик. Так, при оценке влияния загрязняющих веществ на здоровье человека неправомерно рассматривать их уровни концентраций как четкие числа. Можно говорить лишь об их очень приблизительных, усредненных значениях, так как и пункты наблюдения за качеством ОС расположены очень редко (если модель используется для оценки заболеваемости и смертности в общепринятой гигиенической практике), и процессы, протекающие в воде, г.очЕе и особенно в атмосфере, описываются с большими упрощениями (если модель привязана к результатам другой модели, прогнозирующей уровни загрязнения той или иной среды в зависимости от учитываемых в ней компонентов) и факторов, влияющих на уровни загрязнения, великое множество, и их далеко не всегда можно учесть.

В одних работах накладываются ограничения на структуру модели - они должны быть линейными, в других - на экспериментальные данные: четкие входы, нечетко-числовые выходы.

В связи с этим для класса задач, в которых:

- обучающая выборка недостаточна;

- экспериментальные данные и оцениваемые параметры представлены четкими и нечеткими числовыми, интервальными и лингвистическими оценками;

- на структуру модели не накладываются никакие ограничения, предлагается процедура идентификации, изложенная в главе 3.

Во второй главе приводятся модель техногенного воздействия на здоровье человека, принципы ее построения, а также ограничения, допущения и предположения, которые учитывались при ее разработке. Нечетко-множественный сегмент модели задается нечеткой базой знаний. Приводится алгоритм диалоговой процедуры построения функций принадлежности.

Структурно экспертно-аналитическую систему моделирования техногенного воздействия на здоровье человека можно представить в виде схемы, представленной на Рис. 2.

Рис. 2. Структурная схема экспертно-аналитической системы моделирования техногенного воздействия на здоровье человека и его продолжительность жизни.

На схеме приняты следующие обозначения: — фоновая заболеваемость;

<Ь>М > Чо ~ модельное и реальное значение заболеваемости для эталонной группы населения = ^ );

(¡пИ > Чп ~ персонифицированные модельное и реальное значения заболеваемости

Дд , Ад0 - невязки между модельной и реальной заболеваемостью в обобщенной и персонифицированной моделях;

С = (С1,...,СИ) ~ вектор значений концентраций ЗВ;

аг - коэффициент заболеваемости ¡-ой болезнью от ] -ого загрязнителя;

ц,а,р ~ соответственно: функции принадлежности, значения а-уровней и модификаторов, которые используются для идентификации коэффициентов ¿¡у (см. главу 3), а также для преобразования их в количественную форму представления.

Яс» ч'п ~ прогнозируемые обобщенная и персонифицируемая заболеваемости, полученные на основе идентифицируемых коэффициентов а,

Р, Р1 - соответственно субъективные факторы, влияющие на заболеваемость, и их формализованное представление;

По, Пп - эталонная и персонифицированная продолжительность жизни.

Предстоящая продолжительность жизни в возрасте д: в общепринятом виде рассчитывается следующим образом:

100-г

П'Р -+0,5 (1)

и определяется на основе данных, содержащихся в таблицах смертности, которые являются одним из основных инструментов демографического анализа. В формуле (1):

Ь - годы предстоящей жизни. В таблицах смертности в качестве конечного возраста дожития берутся 100 или 110 лег, \х - число доживающих до х лет.

4 = 4-/(7-^ (2)

При х = 0 формула (1) определяет среднюю продолжительность жизни. - вероятность смерти в течение года от момента достижения возраста х-1.

В предлагаемой модели (1) используется 5-ти летиие интервалы, как это принято в кратких таблицах смертности (тогда вместо 0,5 надо записать 2,5). Поэтому 1Х - число доживающих до возрастной группы, к которой принадлежит * (далее -возрастная группа л:), а л, - это вероятность смерти в возрастной группе х.

с/ - число умирающих в возрастной группе*.

(3)

Вероятность смерти в возрастной группе л: складывается из вероятностей смерти от разных причин, в том числе из вероятностей смерти от разных болезней.

(4)

где - вероятность смерти в возрасте х от ¡-ой болезни (¡' = 1,М), $гх -вероятность смерти в возрасте х от других причин ( г = 1, /? )•

Вероятность смерти от других причин (второе слагаемое) будем рассматривать как константу, не влияющую на изменение продолжительности жизни от загрязняющих веществ.

Исходя из того , что смертность от Ьой болезни составляет определенный процент от заболеваемости ею, то

где прирост заболеваемости ¡-ой болезнью, вызванный загрязнением ОС,

- коэффициент смертности в возрастной группе х от ¡-ой болезни.

Структура модели, отражающей прирост заболеваемости, была разработана на основе анализа и синтеза результатов отечественных и зарубежных исследований, и базируется на следующих представлениях и допущениях:

- между заболеваемостью и уровнем загрязнения ОС существует линейная связь;

- некоторые комбинации ЗВ особенно опасны для человека, даже при их малых концентрациях;

- индивидуальные особенности человека влияют на заболеваемость и продолжительность жизни.

Таким образом, заболеваемость ¡-ой болезнью в возрастной группе х можно записать в виде 2-х зависимостей: обобщенной модели:

ч° =<?Г + ¿1 п-(^Х,-лсЛ) (6)

1.1 ^ «,| ЧУ-1 ))

и персонифицированной:

я" =чу,ЛП-/,Г (П-^и (?)

где:

д*"- - фоновая заболеваемость ¡-ой болезнью в возрастной группе х. Л* - количество загрязняющих веществ в к-ой среде;

к - индекс среды, в которой находится загрязнитель: воздух, почва, вода; к

= 13 ;

аь - коэффициент заболеваемости ¡-ой болезнью в возрастной группе х. Отражает прирост заболеваемости из-за повышения концентрации .¡-ого ЗВ на 1 ПДК или на 1 мг/м3 в к-ой среде.

АС)к - степень превышения предельно допустимой концентрации (ПДК) .¡-ого загрязняющего вещества в к-ой среде.

г -СпДК

О, СЛ<С™

Наряду с АСво всех формулах, в которых отражена зависимость между заболеваемостью и уровнем загрязнения ОС, может присутствовать Сд — концентрация ]-ого ЗВ в к-ой среде.

К™„"/'~ п_ь'й коэффициент комбинированного воздействия ЗВ для ¡-ой болезни в к-ой среде для возрастной группы х, п = \5дг ;

(/ (Г) ~ функция, отражающая влияние экспозиции Т на заболеваемость

¡-ой болезнью в возрастной группе х;

- функция субъективных оценок для возрастной группы х, учитывающая влияние на заболеваемость ¡-ой болезнью таких факторов как пол, вредные привычки, экология рабочего места, масса тела, семейное положение, уровень образования.

Рассмотрим компоненты формул (6) и (7).

- фоновая заболеваемость )-ой болезнью в возрастной группе х в регионе - берется из статистических данных местного здравотдела для «чистого» района.

ак,]Х - коэффициенты заболеваемости - формируются либо на основе известных количественных данных, которых может быть довольно много, но и разброс значений которых бывает существенным; либо на основе качественных знаний (нечетких лингвистических оценках), преобразованных с помощью аппарата нечетких множеств в количественные соотношения на выбранной шкале оценок.

В связи с этим, коэффициенты ащх - разнородные по своей сути величины -могут быть представлены в виде нечетких чисел («коэффициент (щх равен примерно числу а»), нечетких интервалов («коэффициент находится примерно в интервале от а до Ь»), а также в нечетких терминах естественного языка, отражающих гипотетическое представление эксперта о существующих связях между входными и выходными данными. В последнем случае взаимосвязь между выходом и ]-ым входом С; описывается простейшей моделью-продукцией типа: «Если уровень концентрации .¡-ого загрязняющего вещества С, (С) е С}), то заболеваемость ¡-ой болезнью -<7/ (Я/ £ 2/)», где Су и у, - нечеткие переменные (термы) из терм-множества О,).

АС'¡I - степень превышения ПДК .¡-ого загрязняющего вещества в к-ой среде, зависит от Су (8), которое определяется либо в результате использования специализированной программы «ОНД86», либо по формуле:

С, = а„„,т ■ С']""'" ■ (г) (9)

где - степень очистки дымовых газов;

£дш.га,. _ концентрация .¡-ого ЗВ в отходящих газах.

Я/г) — функция распределения концентрации .¡-ого ЗВ по удалении (г) от источника загрязнения.

Кроме того, эти данные можно получить в результате мониторинга окружающей среды (простых измерений концентраций ЗВ). В этом случае предлагающаяся модель может использоваться в общепринятой гигиенической практике для оценки, анализа и прогноза состояния здоровья населения, динамики его изменения.

/а** Функция субъективных оценок - формируется на основе известных

количественных значений и на основе качественных знаний (нечетких лингвистиче-

ских оценках), преобразованных с помощью аппарата нечетких множеств в количественные соотношения на выбранной шкале оценок.

/Г (F)-tlK ■ t[FL(factor) (10)

/=I /=Г+1

где /•' и ff {factor)- соответственно коэффициент или функция, отражающие степень влияния 1-ого фактора на заболеваемость i-ой болезнью с учетом возрастной группы х или без него.

При отсутствии у индивида или группы населения 1-ого фактора р1 ~ i.

у/. (Г) ~ функция, отражающая влияние экспозиции Т на заболеваемость i-ой

болезнью в возрастной группе х. Предполагается, что в течение всего этого периода среднесуточные (если моделируемый период < месяца) или среднегодовые (если моделируемый период - год и более) концентрации ЗВ постоянны.

WJX) и (F) отражают влияние, которое оказывают на заболеваемость и

продолжительность жизни особенности конкретного человека, как их среднестатистического носителя.

коэффициенты комбинированного воздействия ЗВ - формируются на

основе известных качественных данных - нечетких лингвистических оценок. С помощью аппарата нечетких множеств преобразуется в количественные соотношения на выбранной шкале оценок.

В общем случае, при имеющихся данных о воздействии ЗВ на заболеваемость и смертность, персонифицированная ППЖ рассчитывается по формулам:

100-х f w, >

2^■ ' S(■ у<'">•>)+ X/+■С"

П" = —-^-[П -L + 2,5 (11)

где М, - количество болезней, по которым в моделях учитывается заболеваемость,

М - М) - количество болезней, по которым в моделях учитывается смертность.

Р»™ ' веРоятносгь поражения эксплуатационно-технического персонала в

результате аварии на производстве, которая моделируется с помощью известной функции Гаусса.

кх — коэффициент дополнительной уязвимости ЭТП во время аварии для возрастной группы х по сравнению с эталонной группой.

Произведение кг • РЦ,П отражает дополнительную смертность ЭТП в результате возможных аварий. Для остальных групп населения у . р3™ - о.

Аналогично рассчитывается обобщенная ППЖ.

Обобщенный и персонифицированный показатели смертности рассчитываются по тем же формулам, что и заболеваемость ((6)-(11)). В этом случае коэффициенты akijx отражают влияние загрязнения ОС на уровень смертности.

В случае моделирования сложных слабоструктурированных объектов с множественными нечеткими связями, отражаемыми в нечетких коэффициентах и параметрах используются, как правило, условные предложения PI, Pli, РЗ иР31: Pli=JX(x),-+Y№

Р11> = XfxJi-ïYfrU

P3j = X(xJ^nX(xn.d(n.iy, л ...f)X(x!)n Y(y)r,

P31i = X(x4JniПX(x4(n,l))(n.1j, (U-Cl X(x4l)n Y(yh

где i - номер правила, i~\,m,m- количество правил, n — количество входных переменных, х и у — лингвистические переменные, определенные с помощью нечетких множеств, X, Y, Z- нечеткие множества, гч/ - четкая числовая переменная.

С их помощью предполагается получить информацию о степени влияния j-эй входной переменной x-s на выходную переменную у. При этом степень детализации i входов и выходов определяется целями исследования, имеющимися на текущий момент знаниями и материальными ресурсами.

Нечеткие оценки-заключения могут быть числовыми и лингвистическими.

Числовые нечеткие оценки-заключения подразделяются на нечеткие числа и 1ечеткие интервалы.

Для описания нечетких оценок-заключений на выбор эксперта предлагается юпользовать следующие функции принадлежности: квадратичную, на основе экс-1ертных оценок и кусочно-линейную.

Алгоритм диалоговой процедуры построения функций принадлежности разбивается на три основные части: анализ информационного поля функционирования |бъекта, формирование правил, то есть построение продукционной модели, и по-троение функций принадлежности нечетких переменных.

В третьей главе приводится универсальный алгоритм идентификации для омбинированных моделей произвольной структуры, оперирующих с разнородными араметрами в разнородной среде.

Укрупненная схема диалоговой процедуры идентификации в общем виде редставлена на Рис. 3.

Рис. 3. Основные этапы диалоговой процедуры идентификации комбинированной

модели.

На первом этапе эксперт строит гипотетическую модель, которая, на его взгляд, наилучшим образом описывает исследуемую им систему или явление. При проведении структурной идентификации модели (6) была принята гипотеза о линейной зависимости между заболеваемостью и уровнями загрязнений атмосферы.

На втором этапе эксперт, используя свои опьгг и знания, а также результаты проводимых ранее исследований, определяет коэффициенты то есть, по сути, взаимосвязь между выходом и входами С,-. При этом коэффициенты аух могут быть

представлены экспертом как среднестатистические оценки (четкие числа), полученные в результате исследований, которым он доверяет. В этом случае коэффициенты считаются определенными, заносятся и хранятся в базе знаний (БЗ) в виде обычных чисел (четкая часть БЗ). В процессе настройки остальных коэффициентов они рассматриваются как константы.

Кроме того, как уже говорилось, коэффициенты ащ могут быть представлены в виде нечетких оценок.

Нечеткие числа, интервалы и переменные задаются функциями принадлежности, построение которых является центральным моментом данного этапа. При этом формируется нечеткая часть БЗ. Подробно алгоритм диалоговой процедуры построения функций принадлежности рассмотрен в главе 1.

На третьем этапе формируется обучающая выборка в виде массива нечетких чисел. Здесь решаются три проблемы: проблема дефицита экспериментальных данных, их нечеткости и разнородности.

Сначала решается проблема разнородности экспериментальных данных, которая сводится к тому, что качественные данные — нечеткие лингвистические оценки -с помощью аппарата нечетких множеств преобразовываются в количественные соотношения на выбранной шкале оценок.

Затем решается проблема дефицита информации как проблема недостатка экспериментальных данных и их нечеткости. Для этого имеющиеся эксперименталь-

ные данные предлагается рассматривать как нечеткие множества с выбранными экспертом функциями принадлежности. Такое представление экспериментальных данных позволяет в наибольшей степени охватить исследуемый объект или процесс, обеспечивая гибкость и простор для идентификации его модели. Недостающие элементы обучающей выборки предлагается разыграть в доверительных интервалах имеющихся экспериментальных данных и затем рассматривать их как нечеткие множества (в случае, когда число экспериментальных данных равно числу неизвестных или ненамного больше их). При этом для них строятся функции принадлежности того же вида, что и для имеющихся элементов обучающей выборки. Полученный массив нечетких чисел дополняет недостающую часть базы данных.

На четвертом этапе осуществляется собственно идентификация модели, целью которой является получение четких оценок параметров модели и который разбивается на следующие операции:

1. Определение областей варьирования выходных переменных и допустимых значений настраиваемых параметров.

2. Настройка параметров модели с использованием оптимизационных процеДУР-

3. Расширение области варьирования выходных переменных с помощью модификации их функций принадлежности.

4. Настройка параметров модели с помощью изменения а-уровня.

5. Настройка параметров модели с помощью модификации их функций принадлежности.

Первые две операции являются обязательными. Последовательность выполнения остальных определяет эксперт.

Рассмотрим процедуру настройки на примере идентифицируемого фрагмента модели (6):

Сначала эксперт определяет допустимые, на его взгляд, области варьирования выходных переменных, которые задаются с помощью окрестностей приемлемых значений экспериментальных данных { }. Для этого он задает о^-уровень1 для их функций принадлежности {ад> 0,5 )• Тогда 1-ая область варьирования - есть множество точек, в которых функции принадлежности /х(д,)>ач, то есть К = {<?/ I Ь) ^ ач)' Кроме того, с помощью «^-уровня2 эксперт задает область допустимых значений для а/. а е Ц. | ) > аа) ■

1 Индекс ^ указывает на функции принадлежности для выходных данных.

2 Индекс а указывает на функции принадлежности для коэффициентов а,.

После того, как области варьирования входных и выходных переменных определены, методом наименьших квадратов (МНК) осуществляется классическая процедура параметрической идентификации. Формируется и решается задача: '-9

(14)

• Ш1П

чГ-Сд^+Яч-с,)

Применение МНК обусловлено целесообразностью и простотой его использования в случае линейных моделей. Для моделей, имеющих более сложную структуру, нелинейные связи, можно использовать другие процедуры оптимизации, как безусловные, так и условные. В последнем случае область допустимых значений, определенная на предыдущем этапе, становится ограничением и далее проверяется только выполнение условия (17).

Для оценки качества настройки коэффициентов а,, ее динамики, воспользуемся следующим известным критерием, показывающим среднюю величину квадрата ошибки:

о*)

где д* и - модельный и экспериментальный выходы в/-ой точке.

Далее необходимо проверить, удовлетворяют ли полученные точки следующим условиям:

а,' с{а;\м(а;)>а„} (16)

то есть принадлежат ли они области допустимых значений, заданной экспертом, а также:

д'еУ, VI = Ц (17)

где У/ = и (18)

При выполнении условий(16)-(17), коэффициенты считаются найденными и модель идентифицированной. Эксперту выдается вся интересующая его информация, использовавшаяся при настройке коэффициентов а,-.

В случае, если одно из условий не выполняется, в зависимости от значений а', аи и ацвозможны следующие варианты идентификации (Рис. 4):

1) понижение аа и ач до 0,5 и проверка условий (16)-(17);

2) модификация области варьирования выходных переменных;

3) модификация области допустимых значений;

4) настройка параметров модели с помощью изменения а-уровня в их функциях

принадлежности;

5) изменение обучающей выборки;

6) изменение гипотезы о степени влияния загрязнителя на заболеваемость.

Настройка коэффициентов а, с помощью изменения а-у ровня осуществляет-:я последовательно для каждого коэффициента, начиная с самого значимого. При щентификации как нечеткого числа, новое значение коэффициента определяется ю формуле:

а*=агЕ0/(а,)=(г,) (19)

и =1 -Н-Г, а, >аш;„, (20)

где А и <%„,„ - соответственно шаг изменения а-уровня и его минимальное начение - задаются экспертом, / - номер итерации.

Расчет осуществляется до тех пор, пока либо не будет найдено решение, то сть выполняться условия (16)-(17), либо а, не достигнет своего минимального уров-я В последнем случае, коэффициент а, фиксируется на том значении, на кото-ом критерий качества (15) минимальный, и осуществляется переход к следующему оэффициенту.

В случае, если результат не получен, эксперт может воспользоваться вари-тгами 3,5,6.

Отличие нечетко-интервального алгоритма от нечетко-числового заключатся в дополнительной операции перебора интервальных значений, при которых (а^ : а^ е [а'уЬ! ;а"'п])-\, начиная от середины интервала к его границам с шагом

, установленным экспертом.

случае, когда в модель входит несколько коэффициентов, заданных нечеткими ин-рвалами, при настройке одного их них, остальные интервальные коэффициенты

_ <ЕЗ ,„"ВЗ _

жсируются на своем среднем значении: а _ > > V } = 1, Ых -1, где Л'; -

1 2

личество параметров, заданных нечеткими интервалами.

Настройка параметров модели, заданных термами лингвистических пере-иных, осуществляется либо по алгоритму настройки нечетких чисел, либо нечетких тервалов в зависимости от их функций принадлежности. Особенность состоит в м, что настраиваемые значения отражают влияние уровня загрязнения ,}-ого ЗВ на 5олеваемость в целом (а не прирост заболеваемости при увеличении загрязнения здуха на 1 мг/м3 или 1 ПДК) и входят в идентифицируемый фрагмент (13) без сол/

ожителя С,;, то есть + ^Гй С, > где Л/ - количество ЗВ, описываемых

>мами лингвистической переменной, И- количество загрязняющих веществ всего, оцедура идентификации модели (7) состоит из двух основных контуров с много-говыми настройками входящих в нее коэффициентов. Первый контур идентифика-г! относится к обобщенной модели (6) и предполагает настройку сначала козффи-:нтов а,р а затем коэффициентов . Второй контур идентификации относится к

унифицированной модели (7) и предполагает настройку коэффициентов

Р, а

же уточнение влияния временного фактора - Т. При этом коэффициенты а,/ и

Начало

ЗИ

Определение области варьирования выходных переменных с помощью се

Определение области допустимых значений для настраиваемых коэффициентов с помощью а

Опт £ I /=1 зеделение МНК: чов + с,) I-1 2 —» 1Ш1

в и ^ = о/ -С„ v/ = 1,1

< 0,у = му да

а] = шш й>иш /*(<*])

Настройка параметров модели с помощью изменения а - уровня

Конец

Изменение обучающей

_выборки_

Рис. 4. Возможные схемы идентификации параметров модели.

считаются настроенными и входят в модель (7) как четкие параметры.

Сама процедура идентификации, используемая для настройки коэффициентов в моделях (6) н (7) , является однотипной для их обеих.

В главе 4 описывается диалоговая система идентификации комбинированных моделей, показана сходимость заложенного в ней алгоритма, представлены МТВ и полученные на их основе данные о заболеваемости, смертности и продолжительности жизни.

Процедура идентификации, предложенная в данной работе, показала свою эффективность при настройке параметров МТВ для различных болезней, в различных половозрастных группах.

Одна из реализаций иллюстрируется настройкой параметров модели заболеваемости острой пневмонией в возрастной группе 14-19 лет, результаты которой представлены в Таблице 1:

Район города 1 2 3 4 5 Критерий качества J

Результат моделирования по уравнению = 3,28 + 0,2*С1 + 0,17*С2 + 0,36*СЗ 3,79 4,38 4,65 4,89 5,93 0,0463

Результат моделирования по уравнению ц = 3,28 + 0,046*КСУМ 3,68 4,24 4,67 4,94 5,97 0,0472

Экспериментальные данные: 3,79 4,05 4,67 5,02 5,97

Таблица 1. Результаты идентификации коэффициентов модели заболеваемостью острой пневмонией в возрастной группе 14-19 лет.

Ниже приведены примеры полученных зависимостей заболеваемости острым бронхитом в возрастной группе 30-39 лет от концентраций ЗВ:

1) для мужчин (два варианта):

A)q = 2,86 + 0,13*С1 + 0,23*С2 + 0,065*СЗ (21)

B)q = 2,86 + 0,033*Ксуи. (22)

2) для женщин:

A)q = 2,08 + 0,09*С1 + 0,15*С2 + 0,2*СЗ (23)

Б) q = 2,07 + 0,0273*Ксум (24)

где С1 - концентрация в воздухе пыли, С2 -сернистого ангидрида, СЗ - двуокиси азота, Ксум - показатель суммарного загрязнения атмосферы.

Персонифицированная заболеваемость для мужчин 30-39 лет со стажем курения от 5 до 20 лет в зависимости от района проживания представлена на диаграмме!.

□ ижурлш!« Н5 Лег ЩШЛч ¡315 Д«

Диаграмма 1.

Прогнозируемое изменение продолжительности жизни у мужчин, проживающих в экологически неблагоприятном городе (обобщенный показатель, без учета отягчающих субъективных факторов) - на диаграмме 2.

И}МСН(И11С врозолжнтельяости прсдстояцдсК жшня (мужчины). К(ум. " 17

то.о —г'"";

| □Экояопгеесжи чистый город ВЭкоаогичгски небпагопрттнмй город

Диаграмма 2.

Таким образом, разработанные МТВ позволяют оценивать и прогнозиро-ггь ущерб, наносимый здоровью населения. Полученные оценки применимы в сис-:мах принятия решений для выработки мероприятий по обеспечению экологической гзопасности и оценки их эффективности.

Заключение

Основные результаты работы состоят в следующем: Проведен анализ информационного пространства исследуемой предметной области и существующих подходов и методов моделирования техногенного воздействия, в результате которого показаны недостатки существующих моделей и сформулирован подход к построению новых эффективных моделей с использованием методов искусственного интеллекта.

Разработана комбинированная математическая модель техногенного воздействия, использующая разнородную качественную н количественную информацию, позволяющая оценить заболеваемость, смертность и продолжительность жизни для различных групп населения с возможной персонификацией этих показателей для конкретного человека, как среднестатистического носителя учитываемых в ней факторов.

Разработан алгоритм идентификации комбинированных математических моделей с ограниченной обучающей выборкой, оперирующих с разнородными параметрами в разнородной информационной среде.

Разработана диалоговая система идентификации комбинированных моделей. В результате использования разработанной модели проведена оценка воздействия загрязняющих веществ на здоровье человека и продолжительность жизни в крупном металлургическом центре.

Разработанная модель техногенного воздействия ориентирована на использование:

1) в обучающих интеллектуальных компьютерных тренинговых системах для :питания экологической культуры производства у эксплуатационно-технического эсонала и оценки вреда, наносимого здоровью людей, в том числе обучаемого, в ¡ультате предпринятых им технологических действий;

2) в гигиенической практике для прогноза состояния здоровья населения, при-гия решений и оценки последствий размещения того или иного производства;

3) для оценки уязвимости лиц, устраивающихся на экологически опасное про-юдство, при профотборе.

Основные результаты диссертации опубликованы в следующих работах

Косарев В.А., Муратова С.Ю. Проблемы экологического тренинга в многоаспектной подготовке эксплуатационно-технического персонала металлургических производств // Информационные технологии в образовании и металлургии: Сборник научных трудов. -М.: МИСИС, 1999.

2. Косарев В.А., Муратова С.Ю. Модель оценки комплексного воздействия выбросов металлургического производства на здоровье человека //Информационные технологии в образовании и металлургии: Сборник научных трудов. -М.: МИСИС, 1999.

3. Косарев В.А., Муратова С.Ю. Метод идентификации сложной композиционной модели экологической безопасности. //Проблемы управления безопасностью сложных систем: Материалы VII международной конференции. -М.: РГГУ, 1999.

Московский Государственный Институт Стали и Сплавов (Технологический Университет)

Ленинский просп.,4.

Заказ_, объем 1 п.л., тираж 100 экз.

Типография ЭОЗ МИСиС, ул. Орджоникидзе, 8/9.

Похожие работы

Информатика, вычислительная техника и управление
05.13.00