автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Дискретные стохастические модели и вычислительные алгоритмы для исследования динамики социально значимых заболеваний

кандидата физико-математических наук
Леоненко, Василий Николаевич
город
Омск
год
2012
специальность ВАК РФ
05.13.18
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Дискретные стохастические модели и вычислительные алгоритмы для исследования динамики социально значимых заболеваний»

Автореферат диссертации по теме "Дискретные стохастические модели и вычислительные алгоритмы для исследования динамики социально значимых заболеваний"

005008767

На правах рукописи

о

Леоненко Василий Николаевич

Дискретные стохастические модели и вычислительные алгоритмы для исследования динамики социально значимых заболеваний

05.13.18 — математическое моделирование, численные методы и комплексы программ

Автореферат диссертации на соискание учёной степени кандидата физико-математических наук

2 0ЕВ 2012

Омск — 2012

005008767

Работа выполнена в Омском филиале Учреждения Российской академии наук Института математики им. С. Л. Соболева Сибирского отделения РАН

Научный руководитель: доктор физико-математических наук,

профессор Перцев Николай Викторович

Официальные оппоненты: доктор физико-математических наук,

профессор Войтишек Антон Вацлавович

Защита состоится 1 марта 2012 года в 14:15 на заседании диссертационного совета ДМ 212.179.07 при Омском государственном университете им. Ф. М. Достоевского по адресу: 644099, г. Омск, ул. Певцова, 13, ОФ ИМ

С диссертацией можно ознакомиться в библиотеке Омского государственного университета им. Ф. М. Достоевского.

Автореферат разослан «/3» января 2012 г.

кандидат физико-математических наук, доцент Добровольский Сергей Михайлович

Ведущая организация: Учреждение Российской академии наук

Институт Вычислительной математики РАН

СО РАН.

Учёный секретарь диссертационного совета

Семёнов А. М.

Общая характеристика работы

Актуальность темы. Социально значимые заболевания, такие как туберкулёз, СПИД, злокачественные новообразования, охватывают широкие слои населения и являются одной из основных причин смертности в различных странах мира. Для снижения ущерба, вызываемого социально значимыми заболеваниями, необходимо осуществление контроля за их распространением и проведение мероприятий, направленных на выявление и лечение больных. Одним из способов исследования динамики заболеваний и оценки эффективности программ обследования является метод математического моделирования. Среди учёных, занимающихся этим направлением, можно назвать Роберта Мэя (Robert May), Роя Андерсона (Roy Anderson), Карлоса Кастильо-Чавеса (Carlos Castillo-Chavez), Салли Блоуэр (Sally Blower), Кэтлин Карли (Katheleen Carley), Перри Пикхардта (Perry J. Pickhardt), Г. И. Марчука, М. И. Перельмана, А. А. Романюху, К. К. Авилова, О. А. Мельниченко, А. В. Бухановского и многих других. Для изучения динамики заболеваний используются модели на основе систем разностных, дифференциальных и интегродифференциальных уравнений, цепей Маркова, случайных процессов рождения и гибели, ветвящихся процессов. Рост быстродействия ЭВМ в конце XX века привёл к развитию имитационного моделирования (в том числе на основе индивидуум-ориентированного подхода), особенно эффективного при исследовании распространения заболеваний в популяциях с неоднородной структурой1. Излишне детализированные имитационные модели неудобны в обращении и результаты их работы сложно интерпретировать, в связи с этим является актуальным поиск компромисса между реалистичностью разрабатываемых моделей и их наглядностью2. Одним из способов решения этой задачи является использование имитационных моделей динамики социально значимых заболеваний на основе систем стохастических разностных уравнений с целочисленными переменными (см., например, Grenfell et al., 2002, Akhtar et al., 2007, Nishiura, 2011), а также их индивидуум-ориентированных модификаций. Такие модели являются мощным инструментом изучения распространения заболеваний: в них корректно учитывается фактор случайности, возможен учёт особенностей отдельных индивидуумов, модели легко настраиваются на реальные данные, не требуют длительного времени для проведения вычислительных экспериментов и в ряде случаев могут быть подвергнуты аналитическому исследованию.

Целью данной работы является разработка семейства дискретных стохастических моделей, вычислительных алгоритмов и программ, предназна-

1 Бейли Н. Математика в биологии и медицине. М.: Мир, 1970.

2Watts D. J., Muhamad R., Medina D. С., Dodds P. S. Multiscale, resurgent epidemics in a hierarchical metapopulation model // Proceedings of the National Academy of Sciences. 2005. Vol. 102, № 32. P. 1115711162.

ченных для изучения динамики социально значимых заболеваний и оценки эффективности различных программ обследования индивидуумов.

В задачи работы входит:

1. Разработка дискретных стохастических популяционных моделей распространения ВИЧ-инфекции и туберкулёза органов дыхания (ТОД), а также индивидуум-ориентированных моделей распространения ТОД и оценки эффективности выявления полипов у индивидуумов, предрасположенных к развитию колоректального рака (КРР).

2. Исследование популяционных моделей распространения ВИЧ-инфекции и ТОД с помощью вспомогательных систем разностных уравнений на математические ожидания численностей групп индивидуумов популяции.

3. Разработка алгоритмов и программ для осуществления экспериментов с построенными моделями на персональных и высокопроизводительных

ЭВМ.

4. Проведение вычислительных экспериментов для оценки уровней заболеваемости и эффективности программ обследования.

Научная новизна:

1. Разработаны популяционные модели распространения ВИЧ-инфекции и ТОД на основе систем стохастических разностных уравнений, индивидуум-ориентированные модели распространения ТОД и оценки эффективности выявления полипов у индивидуумов, предрасположенных к КРР, на основе совмещения популяционного и дискретно-событийного описаний.

2. Исследована динамика математических ожиданий численностей групп индивидуумов в популяционных моделях распространения ВИЧ-инфекции и ТОД с использованием вспомогательных систем разностных уравнений; получены достаточные условия затухания ВИЧ-инфекции и верхние оценки на численности групп индивидуумов популяционной модели ТОД.

3. Созданы алгоритмы имитационного моделирования и моделирующие программы для проведения вычислительных экспериментов с моделями на персональных и высокопроизводительных ЭВМ, включая системы с общей памятью, массивно-параллельные системы и вычислительные комплексы на основе графических процессорных устройств.

4. По результатам вычислительных экспериментов с моделями оценки эффективности выявления полипов у индивидуумов, предрасположенных к развитию КРР, обоснована целесообразность применения метода виртуальной колоноскопии (ВКС) для массового обследования населения.

Основные положения, выносимые на защиту:

1. Способы разработки дискретных стохастических популяционных и многокомпонентных индивидуум-ориентированных моделей динамики социально значимых заболеваний.

2. Построение и исследование систем уравнений, описывающих динамику верхних оценок на математические ожидания численностей групп индивидуумов в популяционных моделях распространения ВИЧ-инфекции и ТОД.

3. Способ построения алгоритмов и моделирующих программ для индивидуум-ориентированных моделей динамики социально значимых заболеваний на основе многокомпонентного подхода.

4. Применение технологий параллельных и распределённых вычислений в разработке моделирующих программ для индивидуум-ориентированных моделей динамики социально значимых заболеваний, предназначенных для проведения вычислительных экспериментов на персональных и высокопроизводительных ЭВМ.

Личный вклад. Все основные результаты диссертации получены соискателем самостоятельно.

Теоретическая и практическая значимость. Предложенные способы построения и исследования дискретных стохастических моделей могут применяться для моделирования динамики различных социально значимых заболеваний. Разработанные модели распространения ВИЧ-инфекции, ТОД и КРР могут быть использованы для анализа и обработки реальных данных по динамике рассматриваемых заболеваний в регионах РФ и планирования мер по снижению заболеваемости.

Методы исследования. В работе использованы методы теории разностных уравнений, теории вероятностей и математической статистики, численные методы Монте-Карло, свойства невырожденных М-матриц, технологии параллельных и распределённых вычислений.

Достоверность изложенных в работе результатов обеспечивается корректностью постановок рассматриваемых задач и адекватностью алгоритмов и моделирующих программ рассматриваемым математическим моделям.

Апробация работы. Основные результаты работы докладывались на ХЬУ1 Международной научной студенческой конференции «Студент и научно-технический прогресс» (Новосибирск, 2008 г.), Международной научной конференции «Современные проблемы прикладной математики и математического моделирования» (Воронеж, 2009 г.), II сессии научной школы-практикума молодых учёных и специалистов «Технологии высокопроизводительных вычислений и компьютерного моделирования» в рамках VI Всероссийской межвузовской конференции молодых учёных (Санкт-Петербург, 2009 г.), Всероссийской конференции по вычислительной математике КВМ-2009 (Новосибирск, 2009 г.), Международной школе-семинаре «Новые алгебро-логические методы решения систем уравнений в алгебраических системах» (Омск, 2009 г.), III сессии научной школы-практикума молодых учёных и специалистов «Технологии высокопроизводительных вычис-

лений и компьютерного моделирования» в рамках VII Всероссийской межвузовской конференции молодых учёных (Санкт-Петербург, 2010 г.), Международной конференции «Стохастические модели в биологии и предельные алгебры» (Омск, 2010 г.), VI Московской международной конференции по исследованию операций 011М-2010 (Москва, 2010 г.), V Всероссийской научно-практической конференции по имитационному моделированию и его применению в науке и промышленности «Имитационное моделирование. Теория и практика» ИММОД-2011 (Санкт-Петербург, 2011 г.), III конференции «Математические модели и численные методы в биоматематике» (Москва, 2011 г.), семинаре «Математическое моделирование в иммунологии и медицине» Института вычислительной математики РАН (Москва, 2010 г.), семинаре «Методы Монте-Карло в вычислительной математике и математической физике» Института вычислительной математики и математической геофизики СО РАН (Новосибирск, 2011 г.), семинарах лаборатории теоретико-вероятностных методов Омского филиала Института математики им. С. Л. Соболева СО РАН.

Публикации. Основные результаты по теме диссертации изложены в 11 печатных изданиях, 4 из которых изданы в журналах, рекомендованных ВАК, 7 — в сборниках тезисов и трудов.

Объём и структура работы. Диссертация состоит из введения, трёх глав, заключения и приложения. Основная часть диссертации содержит 155 страниц текста с 31 рисунком и 18 таблицами, б страниц занимает приложение. Список литературы включает 152 наименования.

Содержание работы

Во введении обосновывается актуальность исследований, проводимых в рамках данной работы, формулируется цель, ставятся задачи работы.

В первой главе представлен обзор работ, посвящённых моделированию социально значимых заболеваний.

Вторая глава посвящена разработке дискретных стохастических популяционных моделей социально значимых заболеваний, вычислительных алгоритмов и программ для проведения вычислительных экспериментов. В п. 2.1 приводится описание цепочечно-биномиальных моделей Енько, Гамильтона и Рида-Фроста, популяционных моделей на базе систем детерминированных и стохастических разностных уравнений. В п. 2.2 построена популяционная модель общего вида на основе следующих предположений:

• население некоторого региона рассматривается как совокупность групп индивидуумов С = {Аь Л2,..., А,};

• внутри каждой группы А{ € С индивидуумы неразличимы между собой;

• время модели дискретное, единица времени выбирается исходя из длительности характерных процессов, происходящих с индивидуумами;

б

• изменение численностей групп вызывают процессы заражения восприимчивых индивидуумов, развития заболевания, выявления и лечения заболевших индивидуумов, миграции, естественной смертности индивидуумов и их гибели от заболевания;

• на каждом промежутке времени (4 — 1; ¿] индивидуумы ведут себя независимо друг от друга и от событий, предшествовавших моменту 1—1.

Модель задаётся системой стохастических разностных уравнений с целочисленными переменными на величины х^Ь) — численности индивидуумов групп А;, г = 1,п, в момент

хг(г) = хх(г) - ^2 ии(0 + ^2 + Л(г)> М

к=2уп 1=2, п

Хп&)=хп(1)- ^2 ипк{1)+ ^2 мм(0 + /п(0> (2)

А:—1,тг— 1 ¿—1,71— 1

£¡(0) = х,№), г = 1,гг; I = 1,2,.... (3)

Здесь3 ~ Вгп(х;(£ - 1), р,) — количество индивидуумов группы А* 6 С, доживших от £ — 1 до £, /¡(¿) > 0 — случайная величина (с. в.), отражающая приток населения в группу А* € С за (£ — 1; £]; и^(Ь) > 0 — с. в., отражающая количество индивидуумов группы А; £ С, совершивших переход в группу Aj € С,] ф г за (¿-1; £] ( ^ ру < 1, А* 6 С); > 0 — с. в., отражающая

начальные численности групп.

Численности групп индивидуумов вычисляются прямым моделированием величин системы (1)—(3) в моменты Ь = 0, Т с помощью методов Монте-Карло, где Т — общее время моделирования. Моделируется N реализаций процесса с разными начальными значениями последовательности псевдослучайных чисел, по полученным выборкам оцениваются математические ожидания и дисперсии наблюдаемых переменных. В моделирующих программах используются датчики псевдослучайных чисел ИВМиМГ СО РАН.

П. 2.3 посвящён построению популяционной модели динамики ВИЧ-инфекции на основе дифференциальной модели распространения ВИЧ в социально неоднородной популяции4. Рассматриваются группы индивидуумов, восприимчивых к ВИЧ: А\ — социально адаптированные, Аг — с высоким риском развития патологии, Аз — с хроническим алкоголизмом, А4 — с наркотической зависимостью, и ВИЧ-инфицированных: А5 — социально адапти-

З3десь и далее под записью £ ~ Лт(х(4),р1(-)), где 6 (0; 1) — константа или функция от переменных модели, понимается следующее: «При фиксированных ¿, х(1), рх(-) с. в. £ распределена по биномиальному закону с параметрами ¡г(£),

4Романюха А. А., Носова Е. А. Модель распространения ВИЧ-инфекции в результате социальной дезадаптации // «Управление большими системами». 2011. №34. С. 227-253.

7

рованные, Ац — с высоким риском развития патологии, А7 — с хроническим алкоголизмом, А% — с наркотической зависимостью. Единица времени модели — один год. Система уравнений модели имеет вид:

xi(£) = xi(t) - un{t) - u15(t) + «21 (О + /i(i), (4)

x2(t) = x2{t) - u2i(t) - u23(t) - u24{t) - u2e(£) + u12(t)+ (5)

+«32 (0 + «42 (£) + f2(t),

*3(0 = X3{t) - «32 (0 - u37(t) + u23(t), (6)

Xi(t) = X4(£) - Ui2(t) - «48(0 + «24(0. (7)

^(0 = ^(0 + «15(0 + «65(0. (8)

Х'б(0 = ^б(0 — «6б(0 + «2б(0 + «76 (0 + «8б(0> (9)

x7(0 = j7(0 - «76(0 + «37(0. (io)

X8(0 = is(0 - «86(0 + «48(0. (11)

Xi(0) = ж|0), г = 178; £=1,2,__________ (12)

Притоки в группы Ai, А2 за (£ — 1; i] описываются с. в. /i(£) и /2(0-Переходы, связанные с инфицированием ВИЧ, задаются с помощью обобщённого закона Рида-Фроста: «is(0 ~ Bin(xi(t) — «12(0.^15(0). «2б(0 ~

Bin(x2(t) - «2l(0 “ «2з(0 “ «24(0. /¿26(0). «37(0 ~ Bin(x3(t) - «32(0. М37(0).

8

«48(0 ~ Bin(Xi(t) - «42(0.^48(0). гДе Vij{0 = 1 “ fj(l “ Гц)*^4 ~ ВерОЯТ-

j=5

ность инфицирования индивидуума группы Л; за время (£ — 1; £], Гу 6 [0; 1) — вероятность контакта индивидуума группы А* с индивидуумом группы Aj с последующим инфицированием за (£ — 1; £], г = 1,4, j = 5,8. Прочие переходы задаются вероятностями р12, Р21, Р23. Р24. Р32. Р42, Рб5. Р76 € [0; 1), количество совершивших переход индивидуумов моделируется биномиальным и мультиномиальным распределениями. Получены следующие утверждения.

Утверждение 1 Пусть для модели (4)-(12) существуют конечные mf^ = Ех^, г = 1,8, и для каждого £ = 1,2,... существуют конечные E/i(£), Е/г(£). Тогда для математических ожиданий т,(£) = Е:Г{(0 справедливы оценки 0 < т;(0 < t — 1,2,..., г = 1,8, где величины m^(t) удовле-

творяют системе

mi(0 = B-mi(f-l) + f(£), (13)

• m2(£) = C(mi(t- 1)) ■ m2(t - 1), (14)

m*(0) = Exf1, г = 178, £ = 1,2,..., (15)

rrii(£) = col(ml(l),m2(t),m3(t),m4(t)), В = (6y); by = const > 0, i,j = 1,4;

ma(£) = col{m*5{t),ml(t), m*7{t), mg(Q), C(mJ(£-l)) = (cki), сы(т|(£-1)) > 0,

t = \,2,...,k,l = 1,4; f(£) = co/(E/!(0, E/2(£),0,0).

8

Утверждение 2 Пусть для модели (4)-(12) выполнено: 1) существуют

конечные nxf^ i = 1,8; 2) для каждого t = 1,2,... величины

E/i(í), Е/г(£) существуют и ограничены; 3) существуете 6 (0;+оо);

О < niî(£) < m = const при t = 0,0 + 1,... ; 4) I ~ C(m) — невырожденная

М-матрица. Тогда математические ожидания m¿(£) = Ex¿(£) таковы, что

lim m¡(£) = О, i = 5,8.

(->+00 w ’

Утверждение 3 Пусть выполнены условия 1)-3) утверждения 2 и p¡ + h'(0) < 1, где pi ~ max Pj> функция h(x) определяется выражением

h(x) = (1 - с-™)(1 - p12)p1m1 + (1 - с-^*)(1 - Р21 - Р23 - p2iy (16) •р2т2 + (1 - е_Гз/Х)(1 - р32)р3т3 + (1 - е_Г4,Т)(1 - рА2)р\пц,

г и = max (pjln----------), i = 1,4. Тогда величина E(x¡ (t) + Xÿ(t.) + x7(t) +

1 — Tij

+a;8(í)) = m¡{t) —> 0 при t —> oo.

Выполнение утверждений 2 или 3 влечет затухание инфекции в популяции: значения Xj(t), j = 5,8, стремятся к нулю с вероятностью 1 при í —> оо.

В ходе вычислительного эксперимента получены статистические оценки математических ожиданий численностей восприимчивых (ms(í) = E(xi(£) + +x2{t) + x3(t) + X4(£))) и инфицированных (m¡(t) = E(x5(í) + xe{t) + x7(t) + +x8(¿))) индивидуумов по выборке из N = 100 реализаций на двух наборах параметров. Для первого набора параметров I — С(т) является невырожденной М-матрицей, что обеспечивает затухание инфекции; для второго набора

1—С(т) не является М-матрицей, m¡(t) выходит на ненулевой стационарный уровень.

В п. 2.4 построена стохастическая популяционная модель динамики ТОД, основанная на детерминированной модели распространения туберкулёза5. Взрослое население некоторого региона (индивидуумы старше возраста ai = 16 лет) делится на группы индивидуумов: S — восприимчивые к ТОД, L — инфицированные, D — невыявленные больные без бактериовыделения (БК-), В — невыявленные больные с бактериовыделением (БК+), D0 — выявленные БК- индивидуумы, Bq — выявленные БК+ индивидуумы. Единица времени модели — одни сутки. Система уравнений имеет вид:

xs(t) = xs(t) - uS:L[JD(t) + fs(t), (17)

XL(t) = XL(t) + Us,l{t) + UD,b(t) + UD0,L(t) - UL,o{t) + h(t), (18)

Xo{t) = Xo(t) + Usto(t) + ULtß(t) + Ußß(t) — U£),/,(i)— (19)

-Идв(0 - UD,Da(t) + /ö(£),

5Perelman M. L, Marchuk G. L, Borisov S. E., Kazennykh B. Ya., Avilov K. K., Karkach A. S., Romanyukha A.A. Tuberculosis epidemiology in Russia: the mathematical model and data analysis // Russ. J. Numer. Anal. Math. Modelling. 2004. Vol. 19, № 4. P. 30&-314.

xs(t) = xs{t) + -ип,в(0 - UBß{t) - ub,bo(0 + 1в{Ь), (20)

Xß0(t) = XD0{t) + UD,D0{t) + UB0,D0(t) - V>Do,Bo{t) ~ UD0,b(t) + fü0{t), (21)

XBo(t) = XBa(t) + UBß0(t) + UDoiBo(t) - UBo,D0(t) + /в0(*)> (22)

xH(0) = xfI>, H €C,t=l,2,.... (23)

Притоки в группы H £ С за (£ — 1; £] задают с. в. /я (£). Количество инфицированных за (£ - 1; £] индивидуумов групп S и L задаётся с помощью обобщённого закона Рида-Фроста: «s.ujßW ~ Bin(xs{t), /4^)) и Ui,o(t) ~ Bin{xL{t),^), где nf1 = 1 - (1 - XsSs)^ >+i' 01, M(L) = 1 - (1 -_0Х) _ \LsLYtB)+^Bo). Здесь с.в. ^ß), — количество мест, посещённых

за (£ - 1; i] индивидуумом группы В я Bq соответственно, Л#,<5я € [0; 1) — вероятности посещения индивидуумом группы Н 6 {S, L} одного такого места и инфицирования в этом месте соответственно. Для фиксированного us.ujßW полагаем ws,l(£) = «s.ujßW - us,D{t) (с вероятностью 1), где us,D(t) ~ Bin(uSlL\jD{t)', Ps,d)- Прочие переходы описываются биномиальным и мультиномиальным законами распределения. Получены следующие утверждения.

Утверждение 4 Пусть для модели (17)-(23) выполнено: 1) существуют конечные т$ = Ех$, Н € С; 2) для ecext = 1,2,... существуют конечные E^ifü); 3) для всех £ = 1,2,... Е/н(£) < f*H = const, Н 6 С. Тогда для величины mz(t) = Е(£НбС £#(£)) справедливо неравенство:

mz(t) < max{m^, t = 0,1,2,..., (24)

1 - Pc

где pc = max{pH}, fc=Yl тя-

ЯеС нес нес

Утверждение 5 Пусть для модели (17)-(23) выполнено: 1) существуют

конечные вторые моменты Ж(х$)2, Н 6 С; 2) для всех £ = 1,2, ...,Т, Н 6

С, существуют конечные вторые моменты Е(/я(£))2, Е(ф[^)2, Е(ф[^)2;

3) величины rn*H{t) задаются системой

ms(0 = Psm*s(t ~ _ Xs5s{pBrm*B{t - 1)+ (25)

+рВо ■ kr ■ m*ßo(t - 1)) + 0((Ä5, ¿s)2)) + E/5(£), т*М = Ps( 1 - Ps,d) m*s{t - 1) (1 - F(\s, ös,---))+ (26)

+PLmi(t - 1)(1 - BL) (1 - \Lh{pBrm*B{t - 1) + pBokrm*Bo(t - 1))+

+0((Al, 6l)2)) + pDPD,Lm*D{t - 1) + PDaPD^LTn*Do{t - 1) + E/L(£),

m*D{t) < PDPD,Dm*D[t - 1) + Ps,DPsm*s(t - 1)(1 - F(As, 6s, ■ ■ ■))+ (27)

+pL,rn*i(t - 1)(1 - (1 - 9l)F(Xl,Sl, • ■■)) + PBPB,Dfn*B{t - 1) + Е/д(£),

mB(t) = pBPB,Bm*B{t - 1) + PD,BPD™b{t ~ О + Е/в(0> (28)

10

тЬо(0 = РА,РА,,А)тЬ0(£ - !) + Ро,ОоРвт*0(1 - 1)+ (29)

+РВо,А>РВотВо^ _ Х) + е/а>(*)>

тв0(1) = Рв0Рв0,в0т*Во(£ - 1) + Рв,в0Рвт*в(1 - 1)+ (30)

+РА),А>РД)тЬ0(* ” 1) + Е/в0(0> < = 1,2,...,

ти(0) = Е®^, Я € С. (31)

где Р(х,у,...) = (1-хуу°'тЬа-1НеВокгтЪо(ь-1)' Тогда ¿)ЛЯТПн= Е(а://(0) справедливо неравенство 0 < тя(£) < тя(0; £ = 1,2,..., Т, Я 6 С.

Результаты вычислительных экспериментов показывают, что за счёт подбора остаточных членов О^А^я)2)), 0((\ь&ь)2)) в виДе некоторых констант £1 > 0, £2 > 0 можно обеспечить близость верхних оценок 771^ (£) к статистическим оценкам значений тя(£). Это позволяет использовать систему (25)—(31) для аналитического и численного исследования поведения тя(£)-Третья глава посвящена разработке многокомпонентных индивидуум-ориентированных моделей динамики заболеваний, вычислительных алгоритмов и моделирующих программ для персональных и высокопроизводительных ЭВМ. В п. 3.1 приводятся примеры моделей распространения заболеваний в неоднородных популяциях, включая многокомпонентные системы моделирования на основе индивидуум-ориентированного подхода. В п. 3.2 разработан способ построения многокомпонентной индивидуум-ориентированной модели на основе совмещения популяционного и дискретно-событийного описаний. Из совокупности С = {А].,..., Ап} выделяются группы больных индивидуумов и индивидуумов в состоянии ремиссии: Р = {Ат+1,..., Ап}. Каждый индивидуум хн,Н £ Р, характеризуется значением непрерывного параметра тяжести заболевания Д1н(£). События с индивидуумами хц описываются дискретно-событийной подмоделью развития и выявления заболевания, состояниями которой являются группы Я^. Для формального описания дискретно-событийной подмодели используются соотношения:

Ат+/"Мг)М, Ат+2Р™М]М, ...

. Рт+1.1(0 , д Рт+1д(0 д

Ат+1 > •'М! Ат+1 ► лп,

Ап ——► А\, ... Ап ► Ап~ 1,

л р<к*‘® л

где М — состояние, отвечающее гибели индивидуума, запись Аь ► Л; означает переход индивидуума х из состояния Аь £ Р в состояние А; 6 С за

время

(£ —1; £] с вероятностью р$(£), зависящей от Дх(£). Также применяется

Ax(t)>A

запись вида A/¡ —► A¡, означающая переход индивидуума х из состояния Ак е F в состояние Ai G С за (£ - 1; £] с вероятностью 1 при Дх(£) > Д.

Численности групп совокупности C\F = {Аи ..., Ат} описываются первыми т уравнениями системы (1)—(3), численности групп совокупностиF вычисляются после моделирования всех событий с индивидуумами хя, Н € F, за (£ — 1; £]. Если существует совокупность G С F, такая что для любого индивидуума хн, Н е G, вероятности событий для любого промежутка (í—1; £], t = 1,2,..., не зависят от численностей j — 1, п, то события с индивидуумами x¡j моделируются независимо от других индивидуумов с момента £ перехода индивидуума х в группу Л; 6 G до момента £е (времени покидания рассматриваемой популяции, перехода в группу Aj £ G или окончания модельного времени) в отдельном модуле обособленных процессов. Этот модуль может быть реализован в вариантах с единичным или переменным шагом по времени, в последнем случае возрастает скорость вычислений, облегчается модификация программного кода и появляется возможность использовать различные законы распределений времён событий с индивидуумами из G.

Приведена модульная структура моделирующей программы, разработанная на основе объектно-ориентированного подхода. Выделение отдельных модулей внутри программного кода позволяет разрабатывать программы для моделирования различных заболеваний с использованием уже имеющихся модулей и вносить изменения в описание служебных функций и модельных процессов, не затрагивая общую структуру программы.

В п. 3.3 построены две индивидуум-ориентированные модификации популяционной модели ТОД с учётом неоднородности индивидуумов относительно текущей тяжести заболевания. В первой модели предполагается, что тяжесть заболевания влияет на вероятности дожития, выявления больного индивидуума и его перехода в состояние ремиссии. Совокупность F состоит из групп больных ТОД: F = {D, В, Dq, Во}. Формальное описание дискретно-событийной подмодели имеет вид:

D^m, ВР^

JT-J Рд,1.(0 £ Дx>hbk+

Рв,в0М PdIíW

D -----> tío, V о ->

где Рд£(0 = e-aDL'^{t\ aDL _

P{D,D0(t) = 1 - е-^°-Д‘М, aDDo > 0, p{gBo(t) = 1 - е-°ватМ0, авщ > 0;

Рн\ь) = Рне~ан'АЛ1), ан > О, Н е F; htk+ > 0 — пороговая тяжесть при бактериовыделении. Предполагалось, что Дх(£) = Дх(£ - 1) • ехр(-а +

+6^ • £), Дх(0) = До, £ ~ Л/”(0; 1), где До > 0 — с.в. с заданным распре-

12

'м, D0^M, Bo^M,

В, DP°Ht} Dq, В D,

L, DoAi^Bo, D ^x^hbk+ j-v D 0 ► Uq.

> Ро1,ь(Ь) ~ б'“™l-Ai(í)j ащь > 0,

делением; а > 0, Ь(х) > 0: а « (Ь(х>)2/2, — индивидуальный постоянный

параметр с заданным законом распределения6. Во второй модели динамики ТОД были учтены особенности туберкулёза, не отражённые в предыдущей модели: более высокий риск рецидива излечённых по сравнению с инфицированными индивидуумами и влияние продолжительности активных форм болезни на вероятность дожития индивидуума. В популяционное описание добавлены две группы населения, Я и Но — индивидуумы в состоянии ремиссии, невыявленные и выявленные. В совокупность Г включаются группы

О, В, Юо, Во, Я, До- Формальное описание дискретно-событийной подмодели имеет вид:

где p$(t) = рне~Ах{ь\ рн 6 (0; 1), H в F. Параметр Ax{t) = max^^i) -

отражает снижение эффекта воздействия заболевания за счёт ремиссии. Величины Wg\t),

отражают продолжительность пребывания индивидуума х во всех группах F до момента £; •уо, 1в, 7d0i 7b0i <Ы, > 0 — параметры модели.

Вычислительные эксперименты показали, что вариация параметров, связанных с воздействием заболевания на вероятности дожития конкретных индивидуумов хн, H £ F, может приводить к значительному перераспределению численностей групп. Это, в свою очередь, влияет на выбор наиболее эффективной программы по уменьшению смертности от ТОД.

Разработаны программы для проведения вычислительных экспериментов с моделями распространения ТОД на персональных и высокопроизводительных ЭВМ на основе системы распределённых вычислений MONC, технологий ОрепМР и MPI. Применение распределённых вычислений позволяет добиться быстродействия моделирующих программ, достаточного для проведения экспериментов в популяциях с большим количеством индивидуумов.

П. 3.4 посвящён построению имитационных моделей обследования индивидуумов, предрасположенных к возникновению колоректального рака

6Закон получен дискретизацией решения стохастического дифференциального уравнения динамики индекса тяжести, см. Марчук Г. И. Математические модели в иммунологии. М., Наука, 1980.

м,

А)

дуума х. Величина ^(г) = ■у+ 7в^в,М +7А>шДо(0 + 1ва^Во^ учитывает негативное воздействие активных форм ТОД, величина (£) =

(КРР). КРР — это злокачественное новообразование, вызываемое перерождением полипов на внутренних стенках толстой кишки. Ежегодная заболеваемость КРР достигает 1 млн случаев, а ежегодная смертность превышает 500 тыс. случаев. Снизить масштаб заболеваемости КРР призвано периодическое обследование индивидуумов с целью выявления и удаления полипов. Наиболее точным диагностическим методом является фиброколоноскопия (ФКС); в последнее время популярность набирает метод виртуальной колоноскопии (ВКС), несмотря на его меньшую чувствительность7. Внедрение ВКС обусловлено низкой степенью инвазивности8 метода, способствующей увеличению посещаемости обследований. В связи с началом использования метода ВКС в медицинских учреждениях РФ возникает задача оценки эффективности программы обследования населения РФ, ориентированной на ВКС.

Разработаны две многокомпонентные модели оценки эффективности обследования индивидуумов, предрасположенных к КРР. Развитие и выявление полипа у конкретного индивидуума описывается дискретно-событийной подмоделью, построенной на основе следующих предположений.

• Продолжительность жизни индивидуума без учёта КРР определяется случайной величиной т с заданной функцией распределения FT(s).

• В течение года у каждого индивидуума группы риска (возраста а\ лет и больше) может возникнуть полип с вероятностью Ра„(а).

• В любой момент t > 0 индивидуум имеет не более одного полипа.

• Начальный размер полипа г^ является случайной величиной, текущий размер полипа r(s) у конкретного индивидуума в момент s описывается заданной неубывающей функцией со случайными параметрами.

• При r(s) > 10 мм индивидуум переходит в состояние предрака, время в до его гибели от КРР имеет функцию распределения Fg(s).

• Индивидуумы возраста а = аШ, аШ = aS + {к - 1) • Aascr, /с > 1, не наблюдающиеся у врача, приглашаются на обследование по программе скрининга. Индивидуум соглашается на первое своё обследование с вероятностью Padh (адгерентность), на последующие — с вероятностью Рстр (комплаент-ность). Значения РСтр зависят от метода обследования.

• В течение года индивидуум может обратиться к врачу по своим причинам с вероятностью Pext. При обращении он соглашается на проведение обследования с вероятностью 1.

• Индивидууму, прошедшему обследование, назначается повторное обследование через т лет. Индивидуум соглашается на него с вероятностью Рстр, в случае отказа он перестаёт наблюдаться у врача.

• На обследовании полип выявляется с вероятностью Pdet, зависящей от метода обследования и размера полипа. Полипы больше 6 мм удаляются.

7 Чувствительность — доля позитивных результатов обследования в группе больных пациентов

8Инвазивиость — степень агрессивности диагностических или лечебных манипуляций

14

Индивидуум с полипом характеризуется размером^полипа в момент Ь Дх(£) = г(£) > 0 и дискретным вектором состояний к = {к1,к2,к3), где к\ = аи сц + 1, • •. — текущий возраст индивидуума, к2 = 0,1 отражает, был ли индивидуум на обследовании, к3 = — 1,... ,т — 1 — время до очередного обследования (у индивидуума, не наблюдающегося у врача, к3 — —1).

Совмещением дискретно-событийной подмодели с двумя популяционными получены модели выявления индивидуумов, предрасположенных к КРР: с фиксированной популяцией и с популяцией переменной численности. Единица времени моделей — один год. Значения параметров для вычислительных экспериментов подбирались по данным работ Никифоров П. А. с соавт., 2000, РюкЬагс^ еЬ а1, 2007, сборников «Рак ободочной и прямой кишки» и «Злокачественные новообразования в России в 2009 году».

В первой модели дискретно-событийная подмодель применяется к каждому индивидууму популяции из N человек возраста а\ до момента его естественной гибели или первого обращения к врачу при размере полипа больше 10 мм. Оценивались два показателя: х — количество индивидуумов гипотетической популяции, имеющих полипы размером более 10 мм, у — количество индивидуумов с полипами размера более 10 мм, выявленных при первом обращении к врачу. Вспомогательным показателем являлась величина и = 2 . 100%. Сравнение полученных по 100 реализациям оценок показателей х, у, и для ФКС и ВКС в популяциях со средней продолжительностью жизни Ег = 65 и Ет = 75 лет показало, что ВКС имеет преимущество перед ФКС, увеличивающееся при возрастании Ет. Был реализован вариант моделирующей программы для вычислений на графических процессорах (СРи) на основе технологии СиБА, позволяющий проводить вычислительные эксперименты с большим числом индивидуумов фиксированной популяции, используя одновременно центральный и графический процессоры ПЭВМ.

Во второй модели использовалось следующее популяционное описание:

• популяция состоит из индивидуумов в возрасте от ах до а2 лет, а2 — окончание возраста наблюдения;

• для фиксированного возраста а выделяются группы индивидуумов: Ха необследованные без полипов; Уа — обследованные без полипов, переставшие наблюдаться у врача; — обследованные без полипов с повторным обследованием через г лет, г = 0, т — 1; 1¥а — индивидуумы с полипами; У^ — индивидуумы с предраком в течение з лет, 3 = 1,а2 — а,1;

• численности групп Ха, У а, %а \ У а^ в каждый момент ( = 1,2,... задаются системой стохастических разностных уравнений вида (1)—(3), численности групп 1Уа вычисляются после применения дискретно-событийной подмодели к индивидуумам \Уа, а = а\, а2;

• существует приток в группу Хаи описываемый заданной с. в. /(<).

По выборке N = 100 оценивался показатель Nexp(t) — количество обследованных индивидуумов за отрезок время (t -1; t] на 1000 человек и Tyll(t) — потерянные годы потенциальной жизни (ПГПЖ) вследствие гибели от КРР за время (t — l;i] на 1000 человек. Предполагалось, что начиная с момента Tscr 6 ¿о, Т, где io > 0 — момент начала наблюдения, проводятся массовые обследования индивидуумов на основе ФКС или ВКС, при £ = 0, Tscr полипы могут быть выявлены у индивидуумов, обратившихся к врачу по своим причинам, с использованием ФКС. В первой серии экспериментов сравнивались показатели Nexp(t), Tvu{t) для разных методов обследования и значений Ет при фиксированном Дascr = 5. Во второй серии экспериментов изучалась зависимость показателей N,,xp(t), Туц(£) от Aascr при использовании ВКС с = 0,65 и Рстр = 0,8. Согласно полученным результатам, введение программы массового обследования приводит к значительному снижению ПГПЖ через 10-12 лет после развёртывания программы. Первые несколько лет ФКС демонстрирует преимущество по значению ПГПЖ, но в долгосрочной перспективе предпочтительнее использование ВКС. При этом преимущество ВКС значительнее при большом Ет. Малый шаг обследования по возрасту Aascr способствует снижению ПГПЖ, но вызывает значительный рост количества обследований и, как следствие, повышение экономических затрат на программу обследования.

В заключении приведены основные результаты работы:

1. Разработан способ построения дискретных стохастических популяционных моделей и вычислительных алгоритмов для моделирования динамики социально значимых заболеваний. Показано применение предложенного способа для моделирования динамики распространения ВИЧ-инфекции и туберкулёза органов дыхания.

2. Получены верхние оценки на численности групп населения в популяционных моделях ВИЧ-инфекции и туберкулёза органов дыхания. Получены достаточные условия затухания инфекции в популяции для модели ВИЧ-инфекции.

3. Разработан способ построения индивидуум-ориентированных моделей динамики заболеваний, вычислительных алгоритмов и моделирующих программ на основе многокомпонентного подхода. Показано применение предложенного способа на примере индивидуум-ориентированных моделей распространения туберкулёза органов дыхания и моделей оценки эффективности выявления индивидуумов, предрасположенных к колоректальному раку.

4. Разработаны алгоритмы для проведения распределённых и параллельных вычислений на персональных ЭВМ с общей памятью и высокопроизводительных компьютерных системах различных классов. На основе представленных алгоритмов созданы моделирующие программы для проведения вы-

числительных экспериментов с использованием системы MONC и технологий OpenMP, MPI, CUDA.

5. Представлены рекомендации по проведению массового обследования индивидуумов, предрасположенных к развитию колоректального рака, в зависимости от метода выявления полипов, частоты обследования и средней продолжительности жизни в популяции.

В приложении приведены алгоритмы генерации случайных величин, используемые в моделирующих программах.

Публикации автора по теме диссертации

В рецензируемых изданиях, рекомендуемых ВАК:

1. Pertsev N. V., Leonenko V. N. Stochastic individual-based model of spread of tuberculosis // Russ. J. Numer. Anal. Math. Modelling. 2009. Vol. 24, № 4. P. 341-360.

2. Леоненко В. H., Логинов К. К. Вычислительные аспекты имитационного моделирования распространения туберкулёза // Научно-Технический вестник СПбГУ ИТМО. 2010. № 4. С. 99-103.

3. Перцев Н. В., Хомутова Е. Ю., Леоненко В. Н. Применение математического моделирования для оценки эффективности выявления индивидуумов, предрасположенных к колоректальному раку // Медицинская визуализация. 2011. № 2. С. 104-108.

4. Леоненко В. H., Перцев Н. В. Анализ эффективности программ выявления индивидуумов, предрасположенных к колоректальному раку, на основе имитационного моделирования // Электронное научное периодическое издание «Управление большими системами». Сборник трудов ИПУ РАН. 2011. № 35. С. 207-236.

В других изданиях:

5. Леоненко В. Н. Индивидуум-ориентированная модель распространения инфекционного заболевания // Материалы XLVI Международной научной студенческой конференции «Студент и научно-технический прогресс». 27-30 апреля 2008 г. Математика. Новосибирск: Ред.-изд. центр НГУ, 2008. С. 72-73.

6. Перцев Я. В., Леоненко В. Н. Построение верхних оценок на решения стохастической модели распространения туберкулёза // Современные проблемы прикладной математики и математического моделирования. Материалы III Международной научной конференции. Часть 1. (г. Воронеж,

2-7 февраля 2009 г.) Воронеж: Научная книга, 2009. С. 62-64.

7. Леоненко В. Н. Вычислительные аспекты имитационного моделирования распространения туберкулёза // Презентации докладов участников школы «Технологии высокопроизводительных вычислений и компью-

терного моделирования», г. Санкт-Петербург, 2009 г. [Электронный ресурс]. 1Л1Ь: http://escience.ifmo.ru/files/hpc2009/2-13-leonenko.pdf

8. Леоненко В. Н. Имитационное моделирование распространения туберкулёза на высокопроизводительных вычислительных системах // Сборник тезисов докладов конференции молодых учёных. Выпуск 5. Труды молодых учёных. СПб.: СПбГУ ИТМО, 2010. С. 92.

9. Леоненко В. Н. Применение высокопроизводительных вычислений для имитационного моделирования распространения туберкулёза // Стохастические модели в биологии и предельные алгебры. Труды международной конференции, Россия, Омск, 2-7 августа 2010. Омск: Изд-во Ом. гос. ун-та, 2010. С. 49-51.

10. Перцев Н. В., Леоненко В. Н., Хомутова Е. Ю. Математическая модель для оценки эффективности выявления индивидуумов, предрасположенных к колоректальному раку //VI Международная конференция по исследованию операций (01Ш-2010): Москва, 19-23 октября 2010 г. Труды. М.: МАКС Пресс, 2010. С. 155-156.

11. Перцев Н. В., Леоненко В. Н. Имитационное моделирование распространения ВИЧ-инфекции на основе стохастических рекуррентных уравнений // Пятая всероссийская научно-практическая конференция по имитационному моделированию и его применению в науке и промышленности «Имитационное моделирование. Теория и практика» ИММОД-2011. Труды конференции. Том I. г. Санкт-Петербург. 19-21 октября 2011. СПб., 2011. С. 234238.

В [1], [6] В. Н. Леоненко принадлежит построение системы верхних оценок на математические ожидания численностей групп индивидуумов, разработка алгоритмов, их реализация в виде моделирующих программ, планирование и проведение вычислительных экспериментов. В [2] вклад В. Н. Леоненко заключается в построении модели, разработке алгоритмов, реализации моделирующих программ, планировании вычислительных экспериментов. В [3], [4], [10] В. Н. Леоненко принадлежит формализация модели, разработка алгоритмов, написание моделирующей программы и проведение вычислительных экспериментов. В [11] вклад В. Н. Леоненко заключается в построении верхних оценок на математические ожидания численностей групп индивидуумов, получении достаточных условий на затухание ВИЧ-инфекции в популяции, реализации алгоритмов и проведении вычислительных экспериментов.

Подписано в печать 16.01.2012. Формат 60x84/16. Бумага писчая. Оперативный способ печати.

Уел. печ. л. 1,0. Тираж 100 экз. Заказ № 019.

Отпечатано в «Полиграфическом центре КАН» тел.: (3812) 24-70-79, 8-904-585-98-84.

E-mail: pc_kan@mail.ru 644050, г. Омск, ул. Красный Путь, 30 Лицензия ПЛД № 58-47 от 21.04.97

Текст работы Леоненко, Василий Николаевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ

61 12-1/566

Омский филиал Учреждения Российской академии наук Института математики им. С. Л. Соболева Сибирского отделения Российской академии наук

На правах рукописи

Леоненко Василий Николаевич

ДИСКРЕТНЫЕ СТОХАСТИЧЕСКИЕ МОДЕЛИ И ВЫЧИСЛИТЕЛЬНЫЕ АЛГОРИТМЫ ДЛЯ ИССЛЕДОВАНИЯ ДИНАМИКИ СОЦИАЛЬНО ЗНАЧИМЫХ ЗАБОЛЕВАНИЙ

05.13.18 — математическое моделирование, численные методы

и комплексы программ

ДИССЕРТАЦИЯ на соискание учёной степени кандидата физико-математических наук

Научный руководитель д.ф.-м.н., профессор Перцев Н. В.

Омск - 2012

Оглавление

Введение 6

Глава 1. Математические модели распространения заболеваний (обзор) 13

1.1 Первые исследования ..............................................13

1.2 Появление вероятностных моделей................................14

1.3 Дальнейшее развитие..............................................15

1.4 Современные модели................................................16

1.5 Выводы..............................................................17

Глава 2. Популяционные модели динамики заболеваний 19

2.1 Введение..............................................................19

2.1.1 Цепочечно-биномиальные модели ........................19

2.1.2 Популяционные разностные модели......................22

2.2 Популяционная модель динамики заболевания общего вида . . 24

2.2.1 Описание модели............................................24

2.2.2 Аналитическое исследование..............................26

2.2.3 Проведение вычислительных экспериментов ............27

2.3 Модель распространения ВИЧ-инфекции........................28

2.3.1 Введение......................................................28

2.3.2 Описание модели............................................29

2.3.3 Оценки на математические ожидания....................33

2.3.4 Вычислительный эксперимент ............................41

2.4 Модель распространения туберкулёза органов дыхания .... 44

2.4.1 Введение......................................................44

2.4.2 Описание модели............................................45

2.4.3 Оценки на математические ожидания....................50

2.4.4 Вычислительный эксперимент ............................55

2.5 Выводы...............................................56

Глава 3. Индивидуум-ориентированные модели динамики за-

болеваний 60

3.1 Введение..............................................................60

3.1.1 Моделирование эпидемий в неоднородных популяциях . 60

3.1.2 Индивидуум-ориентированные модели....................61

3.1.3 Многокомпонентные системы моделирования............62

3.1.4 Ограничения индивидуум-ориентированного подхода . 64

3.2 Индивидуум-ориентированная модель динамики заболевания общего вида..........................................................65

3.2.1 Описание модели............................................65

3.2.2 Алгоритмы моделирования................................69

3.2.3 Структура моделирующей программы....................76

3.2.4 Применение параллельных вычислений..................79

3.3 Индивидуум-ориентированные модели распространения туберкулёза органов дыхания............................................86

3.3.1 Введение......................................................86

3.3.2 Модель с учётом текущей тяжести заболевания .... 86

3.3.3 Модель с учётом суммарного эффекта воздействия заболевания ....................................................91

3.3.4 Вычислительный эксперимент ............................95

3.3.5 Методы ускорения вычислений..............101

3.4 Модели обследования индивидуумов, предрасположенных к колоректальному раку.......................107

3.4.1 Введение...........................107

3.4.2 Дискретно-событийная модель развития и выявления полипа............................109

3.4.3 Модель обследования индивидуумов фиксированной популяции ...........................114

3.4.4 Модель обследования индивидуумов популяции с переменной численностью ...................119

3.5 Выводы...............................135

Заключение 138

Список литературы

141

Приложение А. Алгоритмы моделирования случайных величин 156

А.1 Стандартные случайные величины................156

А.2 Времена событий в модели ТОД.................158

Список обозначений

В работе используются следующие обозначения:

ВИЧ - вирус иммунодефицита человека;

КРР — колоректальный рак;

ТОД — туберкулёз органов дыхания;

card(A) — мощность множества А;

col(x 1,..., хп) — вектор-столбец ..., хп);

Е£ — математическое ожидание случайной величины

— дисперсия случайной величины £; £ ~ Unif[a; Ъ] — £ равномерно распределена на отрезке [а; &]; £ ~ Вгп(п,р) — £ имеет биномиальное распределение с параметрами п, р; £ ~ Pois(X) — £ имеет распределение Пуассона с параметром Л; £ ~ A/"(/i; сг2) — £ имеет нормальное распределение с параметрами /i, а2; £ ~ Geom(p) — £ имеет геометрическое распределение с параметром р; £ ~ Ехр(Х) — £ имеет экспоненциальное распределение с параметром Л;

• ■ • Лк) ~ М(п;рьр2, • • • ,Pfc) — случайный вектор (£ь£2, ■ име-

ет мультиномиальное распределение с параметрами n, pi, • • •, Рк-

Под записью £ ~ Bin(x(t),pi(-)), rp,epi(-) G (0; 1) - константа или функция от некоторых переменных модели, понимается следующее: «При фиксированных i, x(t), pi(-) случайная величина £ распределена по биномиальному закону с параметрами x(t), pi(-)».

Аналогично запись £ ~ M(x(t);pi(-),p2(-),... ) означает, что при фиксированных t, x(t), Pi(-), Р2('), ■ • ■ случайная величина £ распределена по мультиномиальному закону с параметрами x(t), Pi(-), р2(')>

Введение

Актуальность темы

В течение всего времени существования человечества различные заболевания являются одной из главных причин гибели населения Земли. К началу XXI века ведущей причиной преждевременной смерти людей остаются инфекционные болезни, прежде всего из-за их влияния на растущее городское население развивающихся стран. Доступность лекарств и вакцин в промыш-ленно развитых странах привела в 1960-е и 1970-е годы к росту уверенности в том, что угроза заболеваний почти преодолена. Однако произошедшие за последние два десятилетия события, — появление и быстрое распространение по всему миру вируса иммунодефицита человека, лекарственно устойчивых штаммов вирусов и бактерий, вспышка во многих странах вирусной инфекции, вызывающей острый респираторный синдром, а также угроза террористических актов с применением биологического оружия, — ставят под сомнение предыдущие оптимистичные прогнозы. В ближайшие десятилетия частота вспышек новых инфекций человека, по-видимому, увеличится. Эволюции, распространению и поддержанию инфекционных болезней способствуют подвижность современного населения, постоянное увеличение как общей численности населения, так и количества плотно населённых городов [3]. Убыстряющийся ритм жизни, вызывающий повышенную нервную нагрузку на современного человека, недостаточная физическая активность, загрязнение окружающей среды стимулируют также распространение неинфекционных заболеваний, таких как онкологические заболевания, заболевания сердечно-сосудистой системы и многие другие. Предполагается, что на долю неинфекционных заболеваний и травм в будущем будет приходиться всё большая доля смертности [19]. Борьба с заболеваниями входит в программу ООН решения глобальных проблем человечества «Цели и развитие тысячелетия», принятую в 2000 году 147 главами государств и представителями 189 стран.

Радикальные изменения социально-политических и экономических условий на территории России в конце 80-х — начале 90-х годов привели к значительному росту смертности населения от заболеваний. В настоящее время, согласно данным Министерства здравоохранения и социального развития Российской Федерации, эпидемиологическая ситуация в нашей стране приобретает все более напряжённый характер (см., например, материалы сборника [62]). Экономическая и социальная нестабильность в обществе влечёт за собой рост числа случаев заболеваний, получивших название социально значимых — это заболевания, отличающиеся своим существенным отрицательным влиянием на организм человека (в том числе — сексуальное и репродуктивное здоровье), на человеческий капитал в целом, на социально-экономическое развитие страны. В 2004 году Правительством Российской Федерации был утверждён перечень социально значимых заболеваний, приведённый в таблице 1.

Таблица 1: Перечень социально значимых заболеваний

Код заболеваний по МКБ-10* Наименование заболеваний

А 15 - А 19 туберкулёз

А 50 - А 64 инфекции, передающиеся преимущественно половым путём

В 16; В 18.0; В 18.1 гепатит В

В 17.1; В 18.2 гепатит С

В 20 В 24 болезнь, вызванная вирусом иммунодефицита человека (ВИЧ)

С 00 - С 97 злокачественные новообразования

Е 10 - Е 14 сахарный диабет

Р 00 - Р 99 психические расстройства и расстройства поведения

I 10 - I 13.9 болезни, характеризующиеся повышенным кровяным давлением

* Международная статистическая классификация болезней и проблем, связанных со здоровьем (10-й пересмотр)

Для успешной борьбы с распространением социально значимых заболе-

ваний необходима возможность оценки уровней заболеваемости в различных странах и регионах, выяснения причин различий между ними, а также сравнения эффективности различных мер по ограничению распространения заболеваний в популяции. Для решения этих задач может быть использован аппарат математического моделирования.

Изучением динамики заболеваний с помощью математических моделей занимается большое количество коллективов исследователей по всему миру. Среди зарубежных учёных-представителей этого направления можно назвать Роберта Мэя (Robert May), Роя Андерсона (Roy Anderson), Карло-са Кастильо-Чавеса (Carlos Castillo-Chavez), Салли Блоуэр (Sally Blower), Кэтлин Карли (Katheleen Carley) и многих других. В России исследования в области математического моделирования в эпидемиологии опираются на работы коллектива Г. И. Марчука и его учеников, О. В. Барояна с учениками и некоторых других коллективов. Из современных направлений работ российских исследователей можно привести следующие:

• Разработка дифференциальной модели динамики туберкулёза органов дыхания (ТОД) для анализа эпидемиологической ситуации в регионах РФ (М. Е. Иерельман, НИИ фтизиопульмонологии ММА им. И. М. Сеченова, Г. И. Марчук, ИВМ РАН, с соавторами) [128];

• Изучение особенностей динамики распространения ВИЧ-инфекции и ТОД в различных регионах РФ на основе методов математического моделирования (А. А. Романюха, К. К. Авилов, ИВМ РАН; О. А. Мельниченко, МГУ; Е. А. Носова, ФГУ ЦНИИОИЗ МЗ РФ) [1], [41], [57], [122];

• Имитационное моделирование динамики ВИЧ-инфекции на основе динамических сетей контактов индивидуумов (А. В. Бухановский, С. В. Иванов, НИИ НКТ СПбГУ ИТМО, совместно с П. М. А. Сло-отом, Университет Амстердама) [137];

• Разработка и обоснование программ лечения ВИЧ-инфекции на основе методов оптимального управления математической моделью динамики ВИЧ (Д. А. Притыкин, МФТИ) [55];

• Построение и сравнительный анализ детерминированных SIR-моделей распространения инфекционных заболеваний в однородных и неодно-

родных популяциях (А. С. Новожилов, МИИТ) [123], [124];

• Имитационное моделирование распространения инфекционных заболеваний в городских условиях (В. Д. Перминов, ЦАГИ; М. А. Корни-лина, ИММ РАН) [46];

• Аналитическое исследование моделей типа Барояна-Рвачёва (А. И. Бо-родулин, Б. М. Десятков, А. Н. Шабанов, А. А. Ярыгин, ГНЦ вирусологии и биотехнологии «Вектор») [13];

• Имитационное моделирование распространения острых инфекционных заболеваний на основе агентного подхода (М. А. Кондратьев, Р. И. Ивановский, СПбГПУ; Л. М. Цыбалова, НИИ гриппа СЗО РАМН) [28];

• Разработка моделей рискованного поведения ВИЧ-инфицированных, представляющего опасность с точки зрения распространения ВИЧ-инфекции (Т. В. Тулупьева, А. Л. Тулупьев, А. Е. Пащенко, СПИИРАН) [63];

• Имитационное моделирование вспышек гриппа, атипичной пневмонии и других инфекционных заболеваний (Б. В. Боев, ГУ НИИ эпидемиологии и микробиологии им. Н. Ф. Гамалеи) [10], [11];

• Описание динамики распространения туберкулёза с помощью индивидуум-ориентированной стохастической модели в непрерывном времени (Н. В. Перцев, Б. Ю. Пичугин, ОФ ИМ СО РАН) [51];

• Описание динамики распространения туберкулёза с помощью популя-ционной модели на основе системы стохастических разностных уравнений (Н. В. Перцев, ОФ ИМ СО РАН; А. А. Романюха, ИВМ РАН; В. С. Касаткина, ОмГУ им. Ф. М. Достоевского) [53];

• и некоторые другие.

В настоящей диссертации предложен способ построения и изучения математических моделей, позволяющих оценить уровни заболеваемости в различных регионах Российской Федерации, выяснить причины различий между регионами, а также оценить эффективность различных мер по ограничению распространения заболеваний. Тематика работы соответствует пунктам «Технология снижения потерь от социально значимых заболеваний» и «Технологии и программное обеспечение распределённых и высокопроизводительных вычислительных систем», входящих в Перечень критических

технологий Российской Федерации, а также пункту «Науки о жизни» приоритетных направлений развития науки, технологий и техники РФ.

Целью работы является разработка семейства дискретных стохастических моделей, вычислительных алгоритмов и программ, предназначенных для изучения динамики социально значимых заболеваний и оценки эффективности различных программ обследования индивидуумов.

В задачи работы входит:

1. Разработка дискретных стохастических популяционных моделей распространения ВИЧ-инфекции и туберкулёза органов дыхания (ТОД), а также индивидуум-ориентированных моделей распространения ТОД и оценки эффективности выявления полипов у индивидуумов, предрасположенных к развитию колоректального рака (КРР).

2. Исследование популяционных моделей распространения ВИЧ-инфекции и ТОД с помощью вспомогательных систем разностных уравнений на математические ожидания численностей групп индивидуумов популяции.

3. Разработка алгоритмов и программ для осуществления экспериментов с построенными моделями на персональных и высокопроизводительных ЭВМ.

4. Проведение вычислительных экспериментов для оценки уровней заболеваемости и эффективности программ обследования.

Содержание работы

Работа состоит из введения, трёх глав, заключения и приложения.

В первой главе представлен обзор работ, посвящённых моделированию социально значимых заболеваний.

Вторая глава посвящена построению дискретных стохастических популяционных моделей1 социально значимых заболеваний, вычислительных алгоритмов и моделирующих программ для проведения вычислительных экспериментов. В главе приводится описание цепочечно-биномиальных мо-

1В литературе также встречаются термины «системно-динамические модели» (system dynamics models) [14], «модели пространства состояний» (state space models) [142] и компартментные модели (compartment models) [57], [87].

делей Енько, Гамильтона и Рида-Фроста, моделей на основе систем детерминированных и стохастических разностных уравнений, изложен способ построения и изучения популяционной модели общего вида, описано построение популяционных моделей динамики ВИЧ-инфекции и ТОД, получено достаточное условие затухания ВИЧ-инфекции и верхние оценки на математические ожидания численностей групп в модели динамики ТОД, приведены результаты вычислительных экспериментов.

Третья глава посвящена построению многокомпонентных индивидуум-ориентированных моделей динамики заболеваний, вычислительных алгоритмов и моделирующих программ для проведения расчётов на персональных и высокопроизводительных ЭВМ. В главе приводится обзор моделей динамики заболеваний в неоднородных популяциях, включая многокомпонентные системы моделирования на основе индивидуум-ориентированного подхода, представлен способ построения многокомпонентной индивидуум-ориентированной модели общего вида на основе совмещения популя-ционного и дискретно-событийного описаний, приведён вид последовательного и модульного алгоритмов для проведения экспериментов с моделью, представлена структура моделирующей программы на основе многокомпонентного подхода, приведены способы реализации моделирующих программ с использованием технологий параллельных вычислений. Построены многокомпонентные индивидуум-ориентированные модели динамики ТОД и обследования индивидуумов, предрасположенных к возникновению колорек-тального рака, представлены результаты вычислительных экспериментов, приведены описания моделирующих программ для расчётов на персональных и высокопроизводительных ЭВМ.

В заключении приведены основные результаты, сформулирована научная новизна, теоретическая и практическая значимость работы, перечислены публикации по теме диссертации, представлены конференции и семинары, на которых обсуждались полученные результаты.

В приложении представлены алгоритмы генерации случайных величин, используемые в моделирующих программах.

Благодарности

Автор благодарит своего научного руководителя Н. В. Перцева за постановку задач исследования, постоянное внимание и поддержку в работе.

Глава 1

Математические модели распространения (обзор)

1.1 Первые исследования

Математические методы для изучения заболеваний были впервые применены в 1760 году Даниэлем Бернулли (Daniel Bernoulli), который оценивал с помощью них эффективность различных способов прививки против оспы. В 1840 году Уильям Фарр (William Farr) успешно описал данные по смертности от оспы в Англии и Уэльсе за период с 1837 по 1839 год кривой нормального распределения. Этот метод бы