автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Модели и методы искусственного интеллекта для принятия решений в страховом бизнесе

кандидата физико-математических наук
Битюцких, Игорь Сергеевич
город
Воронеж
год
2009
специальность ВАК РФ
05.13.17
Автореферат по информатике, вычислительной технике и управлению на тему «Модели и методы искусственного интеллекта для принятия решений в страховом бизнесе»

Автореферат диссертации по теме "Модели и методы искусственного интеллекта для принятия решений в страховом бизнесе"

На правах рукописи

Битюцких Игорь Сергеевич

¡1

003490757

У

МОДЕЛИ И МЕТОДЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА ДЛЯ ПРИНЯТИЯ РЕШЕНИЙ В СТРАХОВОМ БИЗНЕСЕ

Специальность 05.13.17 - Теоретические основы информатики

АВТОРЕФЕРАТ

на соискание ученой степени кандидата физико-математических наук

научный руководитель - доктор технических наук, профессор Астахова Ирина Федоровна

Воронеж - 2009

2 8ЯНВ?010

Работа выполнена на кафедре информатики и методики преподавания математики Воронежского государственного педагогического университета

Научный руководитель: доктор технических наук,

профессор Астахова Ирина Федоровна

Официальные оппоненты: доктор физико-математических наук,

профессор Орлов Владимир Петрович

доктор технических наук,

профессор Стародубцев Виктор Сергеевич

Ведущая организация: Воронежский филиал автономной

некоммерческой организации ВПО «Московский гуманитарно-экономический институт»

Защита состоится «^февраля 2010 г. в 15 часов 10 минут на заседании диссертационного совета Д 212.038.20 при Воронежском государственном университете по адресу: 394006, г. Воронеж, ВГУ, Университетская пл., 1, ком.ЗЗЗ

С диссертацией можно ознакомиться в научной библиотеке Воронежского государственного университета.

Автореферат разослан «/3»£>/20$%

Ученый секретарь диссертационного совета

Д 212.03 8.20 кандидат физ- мат. наук, доцент Провоторов В.В.

ш

Актуальность темы. В настоящее время основные методы страхования взяты из математической статистики, предложенные методиками расчета тарифных ставок по рисковым видам страхования, утвержденными Росстрахнадзором. Эти методики хорошо применимы для стабильных портфелей известных рисков, но они не могут учесть того, что при введении нового вида страхования характеристики риска в страховом портфеле могут отличаться от общих его характеристик, полученных на основании имеющихся статистических данных.

В работах Королева В.Ю., Бенинга В.Е., Шоргина С.Я. предлагается математический аппарат, позволяющий определить модели в разных ситуациях страхования. Однако, ни одна работа не используется при принятии решения с помощью какого-либо программного продукта.

Появилось множество программ по страхованию имущества и жизни, которые не связаны с математическим аппаратом, используемым в этой отрасли. Это программы «Старый друг», «Территория без границ», «Автострахование на общих условиях», «Недавно за рулем», «Автопарк», «Семья», «Техника безопасности», «Решение», «Степень защиты», «Крылья защиты», «Горизонт», «Гарант», «Капитал», «Инвестор» т.д. Все перечисленные программы поддерживаются компаниями, которые обслуживают их с помощью программных продуктов офиса, позволяющих без труда выполнять заказы клиентов, вести статистику и.т.д., но не имеют никакого отношения к проблемам моделирования этой отрасли.

В настоящее время отсутствует инструмент, позволяющий исследовать с помощью средств вычислительной техники, информационных процессов, страхование имущества и жизни с использованием алгоритмов и методов искусственного интеллекта.

Актуальность темы исследования определяется необходимостью повышения эффективности страхового, бизнеса за счет внедрения новых информационных технологий и разработки' принципиально нового инструмента предметной области.

Цель работы и основные задачи

Целью диссертационной работы разработка и исследование нового инструмента, состоящего из комплекса моделей, методов принятия решений деятельности страховой компании и программного продукта с использованием методов искусственного интеллекта.

Достижение цели исследования включает в себя оценку современного состояния проблемы по рассматриваемой теме и предполагает решение следующих задач:

1. Разработка комплекса моделей принятия решений деятельности компании по страхованию автомобилей.

з

2. Разработка моделей актуарной стоимости пожизненной ренты, стоимости контрактов пожизненного страхования, страхования жизни на срок и с ограниченным сроком выплат.

3. Разработка модели прогноза продолжительности жизни.

4. Построение инструментальных средств в виде модели данных предметной области, алгоритмов и пакетов прикладных программ (111111) поддержки принятия решений в задачах страхового бизнеса.

5. Проведение апробации результатов работы и экспериментальных исследований на реальных примерах деятельности страховой компании.

Методы исследования

Выполненные теоретические и экспериментальные исследования базируются на использовании методов актуарной математики, теории вероятностей, нейронных сетей, методов вычислительной математики, математического моделирования, объектно-ориентированного проектирования и программирования.

Научная новизна

Научная новизна работы заключается:

• В комплексе моделей страхования, построенном на основе теории вероятностей, актуарной математики, отличающемся возможностью вычисления всех необходимых компонент страхования и использованием генетических алгоритмов;

• В моделях пожизненной ренты, страхования жизни на срок, с ограниченным сроком выплат, которых нет в актуарных вычислениях.

• В моделях прогноза деятельности компании по страхованию жизни, построенных с помощью сплайнов, нейронных сетей, отсутствующих в актуарной математики и отличающихся использованием методов искусственного интеллекта;

• В инструментальных средствах в виде моделей данных предметной области, алгоритмов и пакетов прикладных программ (ППП) поддержки принятия решений в задачах страхового бизнеса, отличающихся использованием методов искусственного интеллекта и математической теории риска.

Достоверность научных результатов. Научные положения, теоретические выводы и практические рекомендации, включенные в диссертацию, обоснованы корректным использованием математического аппарата. Они подтверждены вычислительными экспериментами и актами внедрения результатов исследования для деятельности страховой компании.

В рамках диссертационного исследования разработаны инструментальные средства в виде моделей, алгоритмов, БД и 111111, реализующих принятие решения в деятельности страховой компании.

Использование разработанных в диссертации предметно-ориентированных моделей и алгоритмов позволяет повысить качество составляемых прогнозов деятельности страховой компании, что дает положительный эффект при распределении трудовых, материальных и временных ресурсов.

Результаты диссертационной работы внедрены в деятельность страховой компании ООО «Росинвест». Эффект от внедрения — социальный.

Апробация работы. Основные материалы диссертации докладывались и обсуждались: на международных конференциях «Современные проблемы механики и прикладной математики», Воронеж, 2007; «Современные проблемы прикладной математики и математического моделирования», Воронеж, 2009; на научных сессиях Воронежского госуниверситета, 2007, 2008 гг.; на конф. молодых преподавателей и студентов Лискинского филиала ВГУ, 2007. По результатам работы подана заявка на регистрацию программы на ЭВМ «Страхование автомобилей» в Федеральный институт промышленной собственности (ФИПС) от 23 ноября 2009 года.

Публикации. По материалам диссертации опубликовано 9 печатных работ из них одна из перечня ВАК. Из совместных работ в диссертацию вошли только результаты, принадлежащие лично диссертанту. Из них 1 [7] в журнале из списка ВАК.

Структура и объем работы. Диссертация состоит из введения, трех глав, заключения по работе, списка использованных источников из 116 наименований. Работа изложена на 122 страницах машинописного текста, содержит 28 рисунков и 7 таблиц, приложение на 36 страницах.

В первой главе рассматривается анализ использования информационных технологий, моделей и методов расчета страховых рисков. Рассматриваются информационные технологии в поддержке принятия решений в страховом бизнесе, анализ использования информационных технологий и программных продуктов в страховании автомобилей и жизни, рассматривается анализ методов интеллектуальной поддержки при принятии решений в страховом бизнесе.

Вторая глава посвящена математическим моделям при страховании автомобилей. Модель индивидуального страхового риска (статическая модель страхования) в достаточно общем виде может быть формально описана следующим образом: объектом исследования является распределение случайной величины итогового страхового фонда или остатка средств (вшрЫз) страховой компании по некоторому

фиксированному множеству договоров страхования (страховому портфелю):

N

(1)

м м

где г - начальный капитал страховщика (страховой компании) по данному страховому портфелю); N - количество договоров страхования (контрактов, полисов), включенных в страховой портфель, Z — часть

полной страховой премии («брутто-премии»), зачисляемая в страховой фонд по ^му договору страхования, У. - полные (за все время действия

договоров) величины выплат страховщика (индивидуальных исков) по всем договорам портфеля (величина иска может принимать нулевое значение).

В данной схеме величины У практически всегда рассматриваются как одинаково распределенные независимые случайные величины, N бывает как детерминированной, так и случайной величиной; в имеющихся

работах всегда считаются неслучайными величинами.

Возможны две задачи в связи с рассмотренной моделью. Первая задача связана с определением асимптотики распределения случайной величины И при известной величине страховой премии (брутто-премии). Вторая задача требует определить минимальное значение г страховой премии, что результаты страховой деятельности по данному страховому портфелю будут допустимы для страховщика. Следующие условия определения страховой премии являются достаточно естественными:

- условие «средней безубыточности», при котором страховая премия должна удовлетворять условию:

где EXj _ математическое ожидание величины Х^ которая называется относительным иском (иском, рассчитанным на единицу страховой суммы);

— условие «итогового неразорения», в соответствии премия г определяется так, что выполняется неравенство:

где С> - заранее заданное число (0<(2<1). 9 выбирается страховщиком в зависимости от его склонности к риску.

2 >ЕХ-

(2)

Р(11>=0)>=<3,

(3)

Если ставка страховой премии обеспечивает условия (2) и (3) одновременно, то считается, что она удовлетворяет условию достаточности.

Если 2о — точная нижняя грань величин г, удовлетворяющих условию достаточности, то если ставка страховой премии рана этому числу го , то считается, что удовлетворяется условие умеренности.

Расчеты брутто и нетто-ставки ориентируются, прежде всего, на расчет нетто-ставки, представляющую собой один из основных показателей финансовой устойчивости и платежеспособности страховщика.

Нетго-ставка — отражает расходы страховщика на выплаты из страхового фонда. Нетго-премия — самая необходимая и неопределенная часть страхового тарифа.

2СВ(П) = £СВып, (4)

где £СВ(П) — страховые взносы (премии) страхователей;

£СВып— страховые выплаты страховщиков.

В настоящее время существует методика расчета нетто-ставки, которая состоит в установлении закономерности для вычисляемого риска. В общем случае это вероятностное распределение общего ущерба от риска на расчетный период. Кроме того, устанавливаются некоторые параметры, характеризующие данное распределение, такие как: 57, 52,..., 5и -страховые суммы, выражаются в денежном эквиваленте; ^2,..., qn — вероятности ущербов, выражается в процентном эквиваленте; Р1, Р2,..., Рп - премии от страхователей, выражаются в денежном эквиваленте; XI, Х2,..., Хп - ущербы, выражаются в денежном эквиваленте; р1, р2,..., рп -вероятность того, что страховое событие не наступит, и не приведет к затратам на покрытие ущерба, выражается в процентном эквиваленте. Применяются формулы математического ожидания, дисперсии, среднеквадратичного отклонения, коэффициента вариации. Данные формулы применяются в страховании в различных вариантах, так как методы расчета нетто-премии отличаются один от другого, в зависимости от вида страхования.

Рассматривается страхование с точки зрения клиента и со стороны страховой компании. Пусть клиент имеет начальный капитал Б, он страдает от случайных потерь X, предотвращение которых он готов застраховаться у страховой компании. Он готов заплатить страховой взнос в, который меньше некоторого Стах и при любом Сг< Отах клиент готов участвовать в страховании. Рассмотрим страхование со стороны страховой компании. Пусть страховая компания имеет начальный капитал Э] и готова страховать случайные потери клиента X. Обозначим Н1 величину страхового полиса, предлагаемого клиенту за предотвращение случайных

потерь X. Со стороны страховой компании страхование имеет смысл, если Ц а НГт. Значения Ошах и 111™" предлагается находить простым генетическим алгоритмом.

При проектировании программного комплекса по автоматизации страхового бизнеса были использованы возможности унифицированного языка моделирования ЦМЬ. ЦМЬ — это язык визуального моделирования программного обеспечения, включающий в себя определенную систему условных обозначений (нотацию), которая предназначена для выражения идей и решений, выполненных на этапе объектно-ориентированного

анализа и проектирования.

-

Требования пользователя

Анализ

Проект

Код

Диаграмма сценариев

Л1

Диаграмма ижпоиентов

Диаграмма классов

Сценарии

последовательности

Диа^елма состояния

Исходный юд

Дяахрамма Диаграмма

разве ртавакня взанмодеистеня

Рис. 1. Последовательное представление процесса разработки Совместная реализация комплекса моделей предметной области решаемой задачи выражена схемой на рис.2. Она включает элемент реализации математической модели, модуль интерфейса и базу данных предметной области.

Математические модели ПО

Интерфейс пользователя сПП

База данных предметной области

Рис.2. Совместная реализация комплекса моделей предметной области

Calculai N ч DBOutsi

/ v \............/

Operat /'Visual

SNP

Рис. 3. Диаграмма сценариев поведения системы

Действующими лицами здесь являются Operator и DBOutSi. Operator представляет пользователя системы, DBOutSi — интерфейс с внешними базами данных, вариант использования Calculai — определяет вычислительную функцию, Visual — визуализацию данных, Register — получение информации, DBSS - данные о застрахованном, SNP - данные о транспортном средстве.

База данных состоит из пяти таблиц. Все таблицы имеют общие поля. Это необходимо для точного ведения бланков строгой отчетности, также это является гарантом поддержания целостности системы.

Рис. 4, Связи таблиц БД

Register

Средствами реализации были следующие программные продукты: Case — технология POWER DESIGNER позволяет спроектировать базу данных и установить связи между таблицами. MySQL - СУБД, которая позволяет, работать с данными в сети Интернет. Apache — сервер для поддержки виртуального сайта и дающий возможность интерпретировать скрип PHP. PHP — язык программирования, предоставляющий большие возможности, для работы с СУБД MySQL.

Третья глава посвящена страхованию жизни. Рассмотрены контракты по страхованию в этом случае.

Во многих случаях люди предпочитают получать не отдельную сумму, а регулярный доход. В случае, когда такие регулярные выплаты осуществляются в течение всей жизни застрахованного, говорят о пожизненной ренте. Периодичность выплат ренты может быть произвольной: годовой, ежемесячной, ежеквартальной и т.д. Для простоты будем иметь в виду годовой период.

Пусть 1Х лиц в возрасте х заключат контракт на пожизненную ренту годовыми выплатами $1. Актуарную стоимость такой ренты обозначим через ах. Тогда в момент заключения контрактов суммарные поступления страховой компании составят: 1х-ах. Эта сумма должна обеспечить пожизненные ежегодные выплаты для всех участников. Спустя год после заключения контракта оставшиеся в живых 1х+1 участников получат общую сумму

где м> -предельный возраст в таблице дожития.

Баланс между поступлениями и выплатами будет выполнен при условии, что

W

(5)

или в сокращенной форме

W—X

К-<*х = 1>*

(6)

Учтя, что

а

получим

<*х=*1Рх + Рх + (8)

Умножая числитель и знаменатель каждого слагаемого в правой части формулы (8) на Vх, получим

' Рх Рх "Рх Рх

Поскольку согласно определению коммутационных функций

то получим сокращенное выражение для ах:

Ь.

Рх

Аналогично выведены формулы при пожизненном страховании.

Пусть 1Х лиц возраста х заключили контракт на пожизненное страхование. Если Ах - стоимость страхового полиса, то суммарные премии страховой компании составят АХ1Х. Эта сумма должна обеспечить выплаты всех страховых сумм. Спустя год поле заключения контракта лишь 1х+1 достигнет следующего возраста, а йх заключивших контракт умрут, и по их полисам будет выплачена сумма с1х = с1х • /. Ещё через год останутся в живых 1х+2 человек, а с!х+] умрут и выплаты компании составят с1х+] = с}х+] ■ 1 и т.д. Таким образом, ежегодные выплаты компании будут равны <1Х, с!х+и...,с{„.

Текущие стоимости этим сумм будут соответственно

УЧ.У2 V1"-

и, следовательно, текущая стоимость выплат по всем полисам будет равна у-с1х+у2 • с1х+1 +... + ■ .

Уравнение баланса примет вид

1Х •Ах +у2-с/х+1 + ...+ун'~*+1

откуда, разрешая относительно А„ получаем

Ах =

Аналогичным образом рассмотрены вопросы страхования жизни на срок и с ограниченным сроком выплат, в основе вывода формул лежит закон баланса между поступлениями и выплатами.

Для интерполяции таблиц дожития применим кубические сплайны, метод наименьших квадратов и нейронные сети.

Нейронная сеть обучается на основании таблицы дожития населения с помощью алгоритма обратного распространения. Затем данная нейронная сеть производит прогнозирование дожития, используя уже новые данные - те, которые в процессе обучения в данную нейронную сеть не поступали. В данной работе использовалась многослойная сеть с одним скрытым слоем.

Каждый нейрон сети реализует сигмоидальную активационную функцию

1 + е

Нейронная сеть обратного распространения состоит из нескольких слоев нейронов, причем каждый нейрон предыдущего слоя связан с каждым нейроном последующего слоя. В большинстве практических приложений оказывается достаточно рассмотрения двухслойной нейронной сети, имеющей входной (скрытый) слой нейронов и выходной слой.

Суть обучения - минимизация функционала ошибки

2 м

Хотим получить Ек = 0.

Рассмотрим теперь полный алгоритм обучения нейросети:

Шаг 1. Инициализация сети.

Весовым коэффициентам присваиваются малые случайные значения, например, из диапазона (-0.3, 0.3); задаются е - параметр точности обучения, а~ параметр скорости обучения (как правило, а »0.1 и может еще уменьшаться в процессе обучения), N - максимально допустимое число итераций.

Шаг 2. На вход сети подадим один из образов обучающей выборки и определим реальный выход сети У.

Шаг 3. Рассчитаем изменение синаптических весов:

(+1 < дЕ а

8Е 0у/

UVji

дЕ dw„

Шаг 4. Шаги 2-3 повторяются для всех векторов из обучающей выборки. Обучение завершается тогда, когда для каждого из векторов обучающей выборки ошибка сети достигает приемлемого значения е, либо после допустимого максимального числа итераций N. Ошибка сети у каждого вектора своя:

Проводилась интерполяция таблиц продолжительности жизни мужчин и женщин для следующих стран: Россия, Германия, Англии, Швеции и Италии тремя методами. При сравнении оказалось, что для экстраполяции таблиц не более чем на три шага вперед более точным является экстраполяция сплайнами. Метод наименьших квадратов дает лучшие результаты для более долговременных прогнозов и менее зависит от наличия скачков в статистических таблицах, чем два других метода.

Недостатком метода нейронных сетей является его дискретный характер, а также сильная зависимость от гладкости данных: при наличии в экстраполируемых данных резких скачков точность прогноза резко уменьшается.

Рассматривается создание рабочего места менеджера страховой компании по страхованию жизни. Рассматривается база данных и интерфейс пользователя. В качестве сервера базы данных выбран сервер Interbase, который поставляется вместе с Delphi. Начинается работа с окна:

Заполните анкету клиента

Сотрудник компании

|| О программе -

Рис. 5. Интерфейс пользователя

В результате работы программного продукта получены следующие графики:

Рис. 6. Метод сплайн-интерполяции таблицы продолжительности

жизни

Рис.7. Интерполяция таблицы продолжительности жизни методом наименьших квадратов.

Основные результаты работы:

1. Разработан комплекс моделей принятия решений деятельности компании по страхованию автомобилей.

2. Разработаны модели актуарной стоимости пожизненной ренты, стоимости контрактов пожизненного страхования, страхования жизни на срок и с ограниченным сроком выплат.

3. Разработаны и исследованы модели прогноза дожития.

4. Построены инструментальных средства в виде модели данных предметной области, алгоритмов и пакетов прикладных программ

(ГШП) поддержки принятия решений в задачах страхового бизнеса.

5. Проведена апробации результатов работы и экспериментальных исследований на реальных примерах деятельности страховой компании.

Публикации автора по теме диссертации:

1. Битюцких И.С.Математическое обеспечение решения задачи планирования в информационной технологии/ И.С.Битюцких, И.Ф.Астахова, Е.Н.Ветров// Образовательные технологии Воронеж, гос. пед. ун-т, 2006 - №2 - с. 111-114.

2. Битюцких И.С. Информационная система с web- ориентированным интерфейсом для организации деятельности страховой компании/ И.С.Битюцких // Новые технологии в образовании Воронеж, гос. Пед. Ун-т. - 2006. - С.57-58.

3. Битюцких И.С. Автоматизация работы страховой компании./И.С.Битюцких// Труды молодых ученых ГОУ ВПО «Воронежский государственный университет» - 2006. Вып. 1-2.-С.16-22.

4. Битюцких И.С. Использование генетических алгоритмов для снижения страховых рисков и нахождения оптимальных условий страхования/ И.С.Битюцких// Мат. Конф. Молодый преп. и студентов Лискинского филиала ВГУ. — Воронеж: Воронеж, госун-т, 2007.-14-17.

5. Битюцких И.С. Применение генетических алгоритмов при расчете страховых рисков/ И.С.Битюцких// Современные проблемы механики и прикладной математики труды. Межд. Конф.- Воронеж, госун-т, 2007. - Вып. 3,- С.43-44.

6. Web- технологии с базами данных./ И.Ф.Астахова, Т.В.Курченкова, Р.А.Дураков, И.С.Битюцких , Д.В.Комаров — Воронеж, Издательско-полиграфический центр Воронежского госуниверситета, 2008. - 144 с.

7. Битюцких И.С. Модели и методы искусственного интеллекта для повышения эффективности страхового бизнеса/ И.С.Битюцких//Вопросы современной науки и практики^ ¡ Серия техничекие науки. -№ 4(14), 2008-Том 2. - С.71-76.

8. Битюцких И.С. Модели и методы искусственного интеллекта для принятия решений в страховом бизнесе / И.С.Битюцких// Современные проблемы прикладной математики и математического моделирования: Мат. III межд. Научной конф.- Ч. 1. -Воронеж: Научная книга, 2009. - С. 154-156.

9. Бипоцких U.C. Создание рабочего места менеджера компании по страхованию жизни / И.С.Битюцких, И.Ф.Астахова// Современные проблемы науки и образования, 2009. - № 6. - С. 18.

Работа [7] опубликована в изданиях, соответствующих списку ВАК РФ.

Подписано в печать 30.12.09. Формат 60x84 '/¡6. Усл. печ. л. 0.93 Тираж 100 экз. Заказ 2157

Отпечатано с готового оригинала-макета в типографии Издательско-полиграфического центра Воронежского государственного университета 394000, Воронеж, ул. Пушкинская, 3.