автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Модели и методы прогнозирования исхода и управления процессом выборов депутатов
Автореферат диссертации по теме "Модели и методы прогнозирования исхода и управления процессом выборов депутатов"
На правах рукописи
Биниенко Олег Анатольевич
МОДЕЛИ И МЕТОДЫ ПГОГНОЗИРОВ АНИЯ ИСХОДА И УПРАВЛЕНИЯ ПРОЦЕССОМ ВЫБОРОВ ДЕПУТАТОВ
Специальности: 05.13.01 - Системный анализ, управление и обработка информации (технические системы) 05.13.10 - Управление в социальных и экономических системах
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Санкт-Петербург - 2005
Работа выполнена в Санкт-Петербургском государственном электротехническом университете "ЛЭТИ" им. В.И. Ульянова (Ленина).
Научный руководитель -кандидат технических наук, доцент Шеховцов Олег Иванович
Официальные оппоненты: доктор технических наук, профессор Чертовской Владимир Дмитриевич кандидат технических наук, доцент Шифрин Борис Маркович
Ведущая организация - Северо-Западный государственный заочный технический университет.
Защита диссертации состоится "31" года в часов на
заседании диссертационного совета Д.212.238.07 Санкт-Петербургского государственного электротехнического университета "ЛЭТИ" им. В.И. Ульянова (Ленина) по адресу: 197376, Санкт-Петербург, ул. Проф. Попова, 5.
С диссертацией можно ознакомиться в библиотеке университета.
Автореферат разослан "30" 005
года.
Ученый секретарь
диссертационного совета КЖ^Т^^/Г" Яшин А.И.
МШ36
1
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы В настоящее время социологи, кандидаты в депутаты и политические силы, стоящие за ними, желают на как можно более раннем этапе получить оценку и прогноз исхода выборов, чтобы заранее знать, как действовать перед началом предвыборной кампании и во время ее проведения. Сегодня кампания должна строиться с учетом информации о предвыборной обстановке, изменение которой и влияние которой на исход предстоящих выборов необходимо постоянно отслеживать
Отсюда вытекает необходимость в методах и средствах прогнозирования исхода выборов депутатов и выработки рекомендаций по управлению ведением избирательной кампании, что обуславливает актуальность темы диссертации.
Выборам депутатов посвящены труды, в которых рассмотрены РЯ и реклама, способы ведения борьбы, вопросы построения имиджа, принципы оказания информационного влияния, управление в ходе выборов и другие аспекты предвыборной кампании ("Большая книга выборов", работы Лызлова В Е, Слепенкова И.Н., Гладкова П., Воеводина А.И, Жмырикова А Н, Гладышева С. и др ), однако для большинства этих работ характерным является преимущественно описательный, неформализованный подход к описанию процесса выборов.
Существуют также такие информационные системы, как ГАС "Выборы", программа "Депутаты", системы, прогнозирующие исход выборов президента США и основанные на использовании нейронных сетей, в которых решаются различные вопросы организации процесса выборов и оценивания результатов его проведения
В вышеупомянутых трудах рассматривается лишь фиксированный неизменяемый набор факторов, влияющих на исход выборов Практически нет алгоритмов прогнозирования значений параметров, отражающих успешность выступления кандидатов в депутаты на выборах, например, числа голосов
В существующих работах управление рассматривается как деятельность кандидата в депутаты и членов его штаба во время избирательной кампании Однако, при этом отсутствуют какие-либо количественные оценки предлагаемых рекомендаций.
Поэтому, разработка и исследование методов и моделей прогнозирования исхода выборов и выработки рекомендаций на основе информации не только качественного, но и количественного характера, и создание на этой основе автоматизированной системы является актуальной задачей.
Целью диссертационной работы является повышение эффективности ведения предвыборной кампании и степени прогнозируемосги исхода выборов
Зядячи цсслеповянц^
1) Анализ процесса выборов и взаимосвязи факторов, влияющих на исход выборов, и параметров, отражающих успешность участия кандидатов в депутаты в выборах.
2) Разработка методов и алгоритмов прогнозирования исхода выборов
3) Разработка метода и алгоритмов принятия решений для управления ведением предвыборной кампании.
4) Создание системы, позволяющей автоматизировать прогнозирование исхода и принятие решений для управления процессом выборов депутатов.
Объектом исследования в данной работе является процесс выборов депутатов.
Предметом исследования являются методы н модели прогнозирования исхода и управления процессом выборов депутатов.
Методы исследования. При решении задач диссертационной работы были использованы методы математической статистики, нейронных сетей и байесовских сетей доверяя.
Научные результаты, выносимые на защиту.
1) Модель факторов социально-экономической системы, влияющих на исход выборов.
2) Методы и алгоритмы прогнозирования исхода выборов депутатов, в том числе метод на основе искусственных нейронных сетей.
3) Метод и алгоритмы принятия решений в процессе управления ходом предвыборной кампании, основанный на аппарате байесовских сетей доверия.
4) Архитектура экспертной система прогнозирования исхода выборов и управления ведением предвыборной кампании.
Научная новизна.
1) Модель факторов, влияющих на исход выборов, отличается как набором факторов, так и связями между ними, что позволяет выделить частные задачи прогнозирования исхода выборов в зависимости от имеющейся в распоряжении политического аналитика информации.
2) Метод прогнозирования исхода выборов депутатов на основе искусственных нейронных сетей отличается способом структуризации нейронной сети, подразумевающим создание набора из нейронных сетей первой, второй и третьей серии, и наличием дополнительных алгоритмов использования информации о менее информативных атрибутах, что позволяет более точно предсказать исход выборов при большом количестве атрибутов.
3) Метод управления, основанный на аппарате байесовских сетей доверия, отличается наличием операций заполнения байесовской сети по прогнозу исхода выборов и изменения байесовской сети на этапе оперативного управления, что позволяет упростить учет информации о примененных предвыборных технологиях и автоматизировать процесс перебора комбинаций возможных решений
4) Архитектура экспертной системы отличается способом комбинирования методов прогнозирования и управления, включающим наличие блока модификаторов параметров прохождения, что обеспечивает большую объективность прогноза выборов, а также схемой взаимодействия экспертной системы с пользователем, включающей возможность редактирования свойств атрибутов, таких как способы выделения категорий и способы обработки неизвестных значений, что обеспечивает гибкость системы.
Достоверность результатов исследования обеспечивается достоверностью источников, из которых получены исходные данные, и многочисленными экспериментами, подтверждающими работоспособность методов и алгоритмов.
Практическая ценность работы заключается в том, что предложенные модели и методы прогнозирования и принятия решений доведены до конкретной реализации в виде прототипа экспертной системы. Работоспособность предложенных алгоритмов, моделей и методов подтверждена в ходе экспериментов.
Внедрение результатов работы Результаты работы внедрены в Санкт-Петербургской общественной организации "Невский исследовательский центр", что подтверждается справками о внедрении Результаты работы были использованы при ведении избирательной кампании двух кандидатов в депутаты органов местного самоуправления
Апробация диссертации осуществлялась на международной конференции "Региональная информатика-2004".
Публикации. По теме диссертации опубликованы 3 работы, из них - 2 статьи и тезисы к одному докладу на международной научно-технической конференции
Структура и объем диссертации. Диссертация состоит из введения, пяти глав, заключения, списка использованной литературы, включающего 76 наименований, и десяти
' V •< 1"
приложений Основная часть работы изложена на 150 страницах машинописного текста и содержит 26 рисунков и 15 таблиц.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы диссертации, сформулированы цели и задачи исследования, отражена научная новизна и приведены основные результаты работы.
В первой главе приведено общее описание процесса выборов и управления этим процессом.
Данный процесс как объект управления характеризуется следующими особенностями:
1) Он осуществляется в конкурентной борьбе кандидатов и политических сил.
2) На исход выборов влияет большое множество объективных и субъективных факторов, как качественных, так и количественных.
3) Процесс выборов всегда происходит в условиях неопределенности, поэтому исход для конкретного кандидата может быть определен только вероятностно.
Факторы влияния
Факторы среды Численность населения Поло-возрастяой состав Социальный состав Особенности избирательной кампании Политические предпочтения Исторические условия Особенности избират. окрул Политическая активность избирателей
Форс-мажорные обстоятельства
X
Атрибуты кандидатов Исход предыдущих выборов Партийная принадлежность Пол Возраст
Национальность Образование Семейное положение Место проживания Место работы и должность Прочие атрибуты
1
Избирательные факторы Активность ведения избирательной кампании Методы ведения избирательной кампании
Денежные вложения Известность и имидж
Остальные кандидаты
Рейтинг Атрибуты кандидата в депутаты Результаты участия в прошлых выборах
Результаты выборов (для конкретного кандидата)
Рис. 1
В этих условиях управление невозможно без прогнозирования. Поэтому первой задачей, которая решалась в данной главе, являлся анализ факторов, влияющих существенным образом на исход процесса выборов Результатом такого анализа явилась модель факторов, представленная на рис. 1.
Основными сущностями (или участниками) процесса выборов являются избирательные кампании, избирательные округа, кандидаты в депутаты и избиратели.
Выделены различные критерии классификации избирателей. В частности, имеется политическая структура электората, социально-потребительская структура, электорально-психологическая структура, классификация по степени вовлеченности в текущую избирательную кампанию, по способам принятия решений о голосовании.
Различные виды факторов, представленные в модели и рассматриваемые как исходные данные, определены в диссертации как атрибуты. Атрибут—это параметр участвующей в процессе выборов сущности, который влияет на исход выборов. Атрибуты делятся на атрибуты кандидата в депутаты, атрибуты избирательного округа и атрибуты избирательной кампании. Кроме того, атрибуты классифицируются по шкале, в которой они представляются: используется шкала наименований, ранговая шкала, шкала интервалов и шкала отношений. Все атрибуты обозначены как Т)}„ где j—номер группы атрибутов, 1—
номер атрибута в группе Атрибуты кандидатов в депутаты обозначены Эц, Рп.....Ощь
атрибуты избирательных округов—Лг,, Би, Огю, атрибуты избирательных кампаний—ОзьБзг, ■•■! Озыз-
Выходными характеристиками процесса прогнозирования являются параметры прохождения. Параметры прохождения—это величины, описывающие исход выборов и характеризующие успешность участия кандидата в депутаты в предвыборной кампании. Важнейшими параметрами прохождения являются само прохождение кандидата в депутаты, вероятность прохождения, занятое место, абсолютное и относительно количество голосов, принадлежность/вероятность принадлежности к группе лидеров, середняков ми аутсайдеров.
Проанализированы источники информации о процессе выборов и их результатах. К ним относятся избирательные бюллетени, оперативные данные избирательных штабов, средства массовой информации, Интернет.
Определены две основные задачи, стоящие перед участниками избирательной кампании—прогнозирование исхода выборов депутатов и управление ведением предвыборной кампании, основным компонентом которого является выбор необходимых решений Задача прогнозирования исхода выборов депутатов состоит в том, чтобы вывести зависимость между факторами, влияющими на исход выборов, и параметрами, описывающими исход выборов, зная значения факторов, влияющих на исход выборов, получить прогноз значений этих параметров на предстоящих выборах. Критерием успешности решения задачи прогнозирования является достаточная малость ошибки при прогнозе.
Информация, имеющаяся о выборах, и множество ситуаций, в которых осуществляется прогнозирование, определяют набор из трех частных задач прогнозирования. Автором предложена составная модель, в которой выделены процедуры прогнозирования и выработки решений для последующего управления. Составная модель представлена предложенными автором моделью прогнозирования исхода выборов на основе данных предыдущей избирательной кампании, моделью второго тура на основе данных прошедших выборов, моделью выборов на основе изучения электората (в начале предвыборной кампании), моделью на основе социологического опроса, который можно проводить в любой момент времени предвыборной кампании. На основе каждой из моделей предложен метод прогнозирования, для модели на основе данных предыдущей избирательной кампании
предложено два метода—для случаев учета малого и большого числа атрибутов Эти методы названы универсальными, остальные три метода названы специализированными.
Предложены 4 типа моделей прогнозирования на основе типов переменных, используемых для прогнозирования, определено соответствие между типами моделей и методами прогнозирования.
Результаты прогнозирования могут быть уточнены с помощью предлагаемых модификаторов параметров прохождения. Есть модификаторы первого типа, для которых Е,'=Е1+А, и модификаторы второго типа, для которых Е,'=А]Е,+А2Д, где Д—поправка модификатора, Е,'—величина на выходе модификатора, Е,—величина на выходе метода прогнозирования, А] и Аз—веса. Всего разработано два модификатора: модификатор агитации - первого типа, и модификатор "Функция Р(х|у)" - второго типа.
Рассмотрено три этапа управления: выбор стратегии, выбор тактики и оперативное управление. Критерием успешности решения задачи управления является адекватность рекомендаций по управлению, выдаваемых системой прогнозирования и управления, и получение положительного результата выборов при следовании этим рекомендациям.
Подсистема управления состоит из модулей управления. Выделено два модуля управления- универсальный модуль управления, основанный на использовании байесовских сетей (модуль байесовских сетей) и модуль для решения одной из частных задач управления—модуль распределения финансовых средств.
Предвыборное законодательство подвержено изменениям В частности, недавно был принят закон об избрании Государственной Думы только по партийным спискам Поскольку изменения в предвыборном законодательстве происходят более или менее регулярно и возможны в будущем, в систему прогнозирования и управления заложена способность адаптации к этим изменениям.
Во второй главе описан случай учета малого количества атрибутов. Рассмотрены предложенные автором модели прогнозирования исхода выборов и один модификатор параметров прохождения
Универсальный метод прогнозирования, применяемый при относительно малом количестве атрибутов, вычисляет прогноз исхода выборов с помощью статистического анализа на основе коэффициентов способствования прохождению.
Атрибуты, подаваемые на вход этого метода прогнозирования, подвергаются предварительному преобразованию, состоящему из трех этапов: преобразования атрибутов к числовому виду, обработки неизвестных значений и выделения категорий.
Для номинальных переменных разработано три способа ее преобразования к числовому формату, рейтинговая оценка, использование естественного упорядочивания атрибута, использование коэффициента, показывающего, насколько то или иное значение атрибута способствует прохождению кандидата в депутаты.
Методом выделения категорий для числовых переменных является выделение интервалов, которое сводится к определению границ между интервалами Выделение категорий для номинальных переменных основано на сопоставлении каждой категории одного или нескольких значений номинальных переменных.
Имеется три способа обработки неизвестных значений- оставить значение без изменений, замена неизвестных значений атрибута на среднее значение и замена данными, сгенерированными случайным образом.
В случае большого количества атрибутов предложено отобрать для статистического анализа лишь наиболее значимые из них. Для этого вводится понятие информативности атрибутов и разработан алгоритм вычисления информативности.
Все кандидаты в депутаты разбиваются по рейтингу на три группы: лучших, середняков и худших Для каждого атрибута кандидата в депутаты вычисляется плотность ве-
\ г
6 I
роятности Р,(Г)| и к), где к—номер кампании, а I—номер атрибута Плотность распределения для кандидатов в депутаты из группы лучших обозначим Ри1(011, к), для группы середняков—Р.сСОц, к), для группы худших—РиФь, к) и для прошедших депутатов— Рида,,, к).
В результате определения того, насколько доля кандидатов в депутаты с тем или иным значением того или иного атрибута в группе лучших, в группе середняков, в группе худших и среди прошедших депутатов больше или меньше той же доли среди всех кандидатов в депутаты, получены величины Рцда^да,,), Р„да,,)/Рда,,), РщфьУР.СО!,), Рида^/Рда,,).
Коэффициент способствования атрибута прохождению кандидата в депутаты—это величина, показывающая, на сколько то или иное значение того или иного атрибута повышает шансы на прохождение. Этот коэффициент зависит как от номера атрибута, так и от его значения. Обозначим его $1)0, 0,„ к), где 1—номер атрибута, к—номер кампании, или $„0, Э,,). $1)0,01,)=(Р|Д(В,1)/Рда11))-1.
У каждого кандидата в депутаты имеется вероятность пройти, которую обозначим '
Р(,а)(), к), где }—номер кандидата, к—номер кампании, в которой он участвует Выведено
соотношение Р(,а)0, к)=Р(,)(], к)* (1+$,)0, Г),,)), где I пробегает номера атрибутов, ото-
I
бранных для использования методом прогнозирования, Р(1)0, к) вычисляется как отношение числа прошедших депутатов с теми значениями самых информативных атрибутов, которые имеются у ]-го кандидата в депутаты, к числу кандидатов в депутаты с теми же значениями самых информативных атрибутов
Для учета атрибутов избирательного округа введен условный коэффициент способствования каждого значения атрибута кандидата в депутаты его прохождению при условии такого-то значения такого-то атрибута избирательного округа. Он обозначен как $3)0, ], к, 1>1,, ЕЬД где 1 и ]—номера атрибутов кандидата в депутаты и избирательного округа соответственно, к—номер избирательной кампании. Имеет место соотношение Р(1Ь)0> к)=Р(1)(Ь к)*|~| 1, Е>1,, РгО), где 1—номер исследуемого атрибута избирательного
I
округа I
Для учета атрибутов избирательных кампаний введен условный коэффициент способствования каждого значения атрибута кандидата в депутаты его прохождению при таком-то атрибуте избирательной кампании $4)0,3, И,,, ОзД где 1 и ]—номера атрибутов избирательного округа и избирательной кампании соответственно Имеет место соотношение Р(,с)0)=Р(1)0)*П (1+*(4)0,1,0,,, ОзО).
/ I
Выделены две причины отличия оператора совместного влияния атрибутов от су- |
перпозиции операторов независимых влияний этих атрибутов: корреляция атрибутов и так называемая нелинейность влияния атрибутов (влияние воздействия атрибутов друг на друга).
Была проведена серия экспериментов, в результате которых установлено, что средняя разница между величинами Р(1>), Р(1Ь) и Р(,С) и фактической долей прошедших депутатов от общего количества кандидатов в депутаты для каждой комбинации значений атрибутов не превышает 0.02-0.04. Отсюда сделан вывод о правильности вычисления параметров прохождения данным методом прогнозирования.
Другой метод прогнозирования основывается на использовании данных социологических опросов. Если по результатам социологического опроса доля людей, сказавших, что они отдадут голос за ¡-го кандидата, составляет Е(С), то прогноз количества голосов равен Е(С)±Д. Выведено соотношение Д=^Л,(1-ла</)2 + к2Т2У2 , где пас!—надежность ис-
точнжса, проводящего социологический опрос, Т—число дней между днем проведения социологического опроса и днем выборов, V—средняя скорость изменения общественного мнения для данной избирательной кампании Получено, что к)=0 5, кг=0 00005
Один из методов прогнозирования делает прогноз выборов во втором туре Если первый тур уже состоялся, исход выборов можно спрогнозировать, исходя из его результатов. Разработано два алгоритма такого прогноза
В первом алгоритме доля голосов, набранных кандидатом, занявшим в первом туре первое место, обозначена как а, долю голосов, набранных кандидатом, занявшим в первом туре второе место, обозначена как Ь Прирост доли голосов в промежутке между турами равен соответственно а+ и Ь+. С помощью регрессии между величинами а/(а+Ь) и а+/(а++Ь+) вычисляется наиболее вероятное значение а*/(а++Ь+), а далее—прогнозируемая доля голосов после второго тура.
Другой алгоритм включает использование матрицы С. Это квадратная симметричная матрица с нулевой диагональю, коэффициенты си являются мерой сходства кандидатов в депутаты в смысле способности отнимать голоса друг у друга (такая же матрица используется и в модификаторе агитации, см ниже). Если в первом туре два лучших кандидата набрали X, и X) голосов, то ожидаемое число голосов, которые наберет кандидат 1 во N
втором туре, равно Х^С^Сж+С^). Ожидаемое число голосов, которые наберет
N
кандидат ] во втором туре, равно Х}+ ^ Хк*С^/(С1к+С,к).
м
Разработан метод прогнозирования исхода выборов, использующий информацию о структуре электората. Каждая группа избирателей обладает своей политической активностью и политическими пристрастиями. Оценка доли голосов, которые могут бьггь получены З-ым кандидатом в депутаты, определяется по формуле:
I I
где Р,—доля ьой 1руппы избирателей во всем электорате, ],—прогнозируемая явка на выборы в этой группе избирателей, Хи—доля сторонников .¡-го кандидата, в ¡-ой группе. Установлено, что относительная погрешность не превышает усредненной по группам
„
избирателей относительной погрешности: £ (ДР,/Р,)/п+^ (Д1Д)/п+^ (ДХ,уХч)/п
1-1 1=1 1=1
Для каждого из специализированных методов прогнозирования были проведены эксперименты, которые показали, что абсолютная погрешность прогнозирования вероятности прохождения и доли набранных голосов не превышает 0.10, а во многих случаях не превышает 0.05, что свидетельствует о правильности алгоритмов, положенных в основу этих методов.
Точность прогнозирования исхода выборов можно улучшить на основе сведений о влиянии предвыборной агитации на исход выборов. У каждого избирателя имеется степень приверженности (СП) к кандидату в депутаты и степень невосприимчивости к агитации (СНА). Построена модель, показывающая распределение избирателей по СП и СНА.
Для каждого ¡-го кандидата в депутаты есть некоторое суммарное количество предвыборной агитации за или против данного кандидата в депутаты Ь,. Существует матрица сходства кандидатов в депутаты С. Кандидаты в депутаты перетягивают друг у друга голоса, причем степень этого перетягивания зависит от Ь, и сц.
« ЛГ N
Выведена формула ер=ар-у(]£ Ьк*скр*ар/2+2] \*с№*%12)=эир+УгУ скр(Ър*ак-
-Ь|1*ар), где а,,—начальное количество сторонников р-го кандидата, ер—количество сторонников р-го кандидата после влияния предвыборной агитации (на день выборов), V— коэффициент масштабирования, характеризующий общую убеждаемость избирателей в кампании.
Эксперимент показал, что учет влияния предвыборной агитации действительно способен значительно повысить точность прогноза исхода выборов.
Все параметры похождения могут быть представлены в виде х± у, где х—наиболее вероятное значение, у—статистическая погрешность. Для того, чтобы получить достаточно высокую точность, нужно иметь достаточно большой размер выборки.
Размер выборки, необходимый для вычисления статистических показателей, и статистическая погрешность могут быть вычислены теоретическим и экспериментальным способом. Теоретическое вычисление возможно для некоторых типов распределений, например, нормального.
Если распределение не похоже на типовые распределения, размер выборки и статистическая погрешность могут быть вычислены только путем эксперимента В данном эксперименте принята степень доверия а=95%, с помощью датчика случайных чисел, настроенного на тот же закон распределения, который имеет и целевой параметр прохождения, генерируется 100 выборок Тогда величина у—это минимальная величина такая, что в 95 выборках из 100 фактическое значение показателя попадает в интервал х± у.
Параметры прохождения, которые некоторый метод прогнозирования вычисляет непосредственно с достаточно высокой степенью точностью, названы базовыми д ля данного метода прогнозирования. Остальные параметры прохождения названы производными для данного метода прогнозирования.
Каждый параметр прохождения представляется одним из трех способов" точечная опенка, интервальная оценка (в виде х ± А х) и оценка в виде плотности вероятности распределения. Разработаны формулы для вычисления Ах для каждого метода прогнозирования и способ перехода от интервальной оценки к оценке в виде плотности распределения
Основным методом вычисления производных параметров прохождения является оценка исходя из значений базовых параметров.
Для универсальных методов прогнозирования, использующих при прогнозировании атрибуты, возможен и другой подход к вычислению производных параметров прохождения—непосредственное вычисление исходя из значений атрибутов кандидатов в депутаты. Это оценка наиболее вероятного значения производного параметра прохождения при конкретном значении атрибута.
Если базовым параметром прохождения является прогнозируемое число голосов для всех участников избирательной кампании, и оно представлено в виде совместной плотности распределения, из числа голосов можно вывести плотность распределения вероятности того, что кандидат в депутаты займет то или иное место Математическое ожидание места, которое займет ¡-ый кандидат, равно 1+Р^ , где Р^—вероятность того, что
1
кандидат наберет больше голосов, чем 1-ый. Эту сумму можно интерпретировать как комбинацию вероятностей занятия того или иного места, например, если Р^ =2.3, то
1
это соответствует вероятности занять второе место 70%, вероятности занять третье место
<1-М£,М1-£,>
30%. Рл= | РЛ(ЕЛ)<ЙГ;)<Й?(, где Р,(Е|)—плотность распределения для числа
голосов ¡-го кандидата.
Третья глава посвящена моделированию процессов, когда учитывается большое количество атрибутов. Соответствующий метод прогнозирования основан на нейронных сетях типа МЬР.
I Разработан алгоритм предварительной обработки входных данных при использова-
нии нейронных сетей, включающий этапы шкалирования, преобразования номинальных переменных к числовому формату, выделения категорий и обработки выбросов и неиз-(I вестных (пропущенных) значений.
При обучении нейронных сетей может возникнуть проблема "проклятия размерности". Для ее решения вместо одной сети может создаваться структура из нескольких сетей, названная набором нейронных сетей. ' Обозначим выход всего набора нейронных сетей и параметр прохождения на выхо-
де метода прогнозирования как Е. Выход подмножества нейронных сетей в наборе, являющийся ¡-ым приближением к значению процента голосов, получаемому на выходе метода прогнозирования, обозначен как Е(,). 1 Нейронные сети первой серии—это сети, на вход которых подаются только атри-
буты кандидатов в депутаты Для них имеет место соотношение Е^рДРп, 1^12, ••■> О^), где Ш]—номер последнего из наиболее информативных атрибутов кандидатов в депутаты, Г—функция зависимости выхода от входов, реализованная нейронной сетью первой серии.
Нейронные сети второй серии—это нейронные сети, на вход которых подается как минимум один атрибут избирательного округа, но не подаются атрибуты избирательной кампании. Для них справедливо равенство Ер^фц, Оп, ..., Di.ni, ЕЬь Е>22> •■ , Цгтз), где т2—номер последнего из наиболее информативных атрибутов избирательного округа, Ь— | функция зависимости выхода от входов, реализованная нейронной сетью второй серии
| Нейронные сети третьей серии—это нейронные сети, на вход которых подается как
минимум один атрибут избирательной кампании. Для них имеет место формула | Е(з)=Ь](Вп, 0!2, . , П1т1, Б2Ь 022, ■ , 02т2, 0ЗЬ Т)32, ..., Озтз), где тз—номер последнего
' из наиболее информативных атрибутов избирательной кампании, Ь]—функция зависимо-
сти выхода от входов, реализованная нейронной сетью третьей серии.
Одной из проблем при построении и настройке системы прогнозирования и управления является отсутствие данных по кампаниям, которые будут проходить после настоящего момента времени, данные, полученные на основе прошлых выборов, могут не подходить для прогнозирования исхода будущих выборов. Один из путей решения этой про-1 блемы заключается в правильном выборе атрибутов и кампаний. Выбор кампаний зависит
1 от стабильности (устойчивости) факторов, влияющих на исход выборов, и от степени их
регионального различия.
* В качестве критерия степени изменения влияния атрибута на исход выборов, то
есть стабильности атрибута, используется изменение доли значения атрибута кандидата в депутаты за 4 года, обозначенное как Д(1, О],). Пусть доля депутатов, имеющих значение 1-{ го атрибута О],, в более ранней избирательной кампании составляет Х[, а в более позд-
ней—х2. Тогда Д(1, 0]|)==Х2-Х1. Введем параметр А 1(1, 01,)= X Д(1, Э^Уп, где суммирование
проводится по всем значениям атрибута, а п—число возможных значений атрибута и слагаемых в сумме.
Если возникает проблема "проклятия размерности", то она решается за счет уменьшения числа атрибутов на входе сетей путем распределения атрибутов по нейронным сетям различных серий (рис.2). Все кандидаты в депутаты разбиваются на группы,
при этом каждому кандидату в депутаты сопоставляется код группы Кл Для каждой избирательной кампании строится нейронная сеть, у которой входные переменные—атрибуты избирательных округов и код группы К1 Нейронные сети второй серии исследуют, как параметры избирательного округа влияют на исход выборов.
Имеет место соотношение Е(2)=Е(|)+Ь(К, Бл, 022, , В2т2)-Ь(К), где т?—номер последнего из наиболее информативных атрибутов избирательного округа, Ь(К, ЕЪь 022, . ., 1Э2ш2)—функция зависимости выхода от входов, реализованная нейронной сетью второй серии, Ь(К])—среднее значение параметра прохождения для кандидатов в депутаты с кодом группы К].
Рис.2
Аналогичное соотношение имеет место и для атрибутов избирательной кампании: Е(з)=Е(2)+Ь](К-2, Бзь 032, Озтз)-Ь1(К2), где тз—номер последнего из наиболее информативных атрибутов избирательных кампаний (различный для разных нейронных сетей), Ь1(К.2, Б31,1)32, ..., Озтз)—функция зависимости выхода от входов, реализованная нейронной сетью третьей серии, ^(Кг)—среднее значение параметра прохождения для кандидатов в депутаты с кодом группы К2.
Все атрибуты, не попавшие в число наиболее информативных, учитываются через значения функций Ьз, показывающих влияние этих атрибутов на прогнозируемое число голосов. К значению прогноза количества набранных голосов, полученному с помощью использования значений только наиболее информативных атрибутов, прибавляются значения функций Ьз. Если необходимо учитывать не попавшие в число наиболее информативных атрибуты кандидатов в депутаты, то вместо величины Е(1) используется величина
Е(1+)-
Е(1+)=Е(1)+ £ Ьз&Оь).
|=т,+1
Аналогичные формулы существуют и для атрибутов избирательных округов и избирательных кампаний Разработаны алгоритмы вычисления функции Ьз как для обычных атрибутов, не входящих в число наиболее информативных, так и для многозначных атрибутов.
Многие кандидаты баллотируются в орган власти несколько раз. По данным 100 прошедших депутатов построена зависимость значения доли голосов на предстоящих выборах от значения доли голосов на прошедших выборах Р(х|у), где х—прогнозируемое значение доли голосов на предстоящих выборах, Рх—функция плотности вероятности для х, у—значение этой величины на прошлых выборах.
Имеет место соотношение
£'("4,=А,*£(;,+А2*Р(х|у)
Правое слагаемое этой формулы является функцией плотности вероятности, а £(4) и —это значения Е^) и Е(3), преобразованные в функцию плотности вероятности, (") —оператор преобразования от точечной оценки к функции плотности вероятности.
А1+А2=1. Оптимальные значения коэффициентов А) и Аг зависят от отношения СКО функции Р к средней ошибке нейронной сети (Лагла). Чем меньше Иатг, тем больше А2.
Был проведен эксперимент по определению оптимального количества слоев. Из нейронных сетей с различным числом слоев выбиралась та, которая минимизирует функционал ¥(Г/) = Л(и)Сг, где Фг(1/) —совокупность частных критериев, V =(111, щ, г-1
. .ип)—вектор управляющих коэффициентов, Су—весовые коэффициенты Установлено, что оптимальное количество промежуточных слоев в нейронных сетях равно одному. Оптимальное количество нейронов в промежуточном слое находится путем перебора.
Была проведена серия экспериментов на реальных избирательных кампаниях, в которых на вход подавалось различное количество и различный набор атрибутов. Средняя контрольная ошибка не превышала 0.1, что свидетельствует об успешности обучения и эффективной работе нейронных сетей.
Для разбиения кандидатов в депутаты на группы и получения кода группы К1 или К2 использовалась сеть Кохонена. В диссертации приведен пример ее использования
В четвертой главе описаны методы и алгоритмы, используемые при решении задачи управления ведением предвыборной кампании.
Поскольку описать математически процесс управления выборами в целом сложно, рассмотрен только процесса выработки решений, которые могут бьпъ в дальнейшем реализованы в избирательной кампании
Для описания процесса выработки решений используется аппарат байесовских сетей доверия. На этой основе строится система правил экспертной системы.
Байесовская сеть состоит из групп вершин. Вершины из группы принимаемых решений содержат совокупность решений, одно и только одно из которых применятся в данной конкретной ситуации. Вершины группы форс-мажорных обстоятельств—это вершины, соответствующие событиям, наступление которых может заставить принять то или иное решение. Значения атрибутов представляют гипотезы о том, что атрибут попадает в некоторую категорию. Параметры прохождения характеризуют шансы кандидата пройти, занять более высокое место или набрать большее число голосов, чем конкуренты. Все остальные вершины отнесены к группам так называемых скрытых параметров.
Важную роль играет информация об эффективности избирательных технологий. Под эффективностью избирательных технологий, тактики предвыборной борьбы и т.д. понимается их влияние на исход выборов для некоторого кандидата в депутаты. Эффективность выражена в виде числа в диапазоне от —1 до +1. Эффективность считается положительной, если данная тактика или технология способствует прохождению, и отрицательной, если уменьшает шансы кандидата в депутаты на успех в кампании, на отрезках [1; 0] и [0; 1] она линейно зависит от вероятности события при применении технологии.
На примере (рис. 3) пунктирной линией обозначена вероятность прохождения до применения технологии. Эффективность рассчитывается по отношению к конкретному событию или параметру, например, параметру прохождения Эффективность избиратель-
ных технологий зависит от обстоятельств, при которых были применены эти технологии
Рис.3
Разработаны 4 группы операций, допустимых над байесовской сетью- операции заполнения и коррекции байесовской сети в ручном режиме, операции изменения байесовской сети на этапе оперативного управления, операции заполнения байесовской сети по прогнозу исхода выборов и операции вычисления (расчета) байесовской сети
В ручном режиме пользователь может создавать, модифицировать и удалять вершины и связи и редактировать таблицы безусловных и условных вероятностей. При создании и удалении связей таблицы условных вероятностей меняются таким образом, чтобы сохранить максимум информации о вероятностях, которые были до данного изменения байесовской сети.
Заполнение байесовской сети по прогнозу исхода выборов объединяет все действия, которые производятся с использованием результатов работы методов прогнозирования, то есть найденных параметров прохождения На каждом шагу генерируется правило, которое может быть одного из шести видов:
1) Если кандидат проходит, то атрибут А попадает в категорию с номером у (с вероятностью z);
2) Если кандидат занял место не ниже х, то атрибут А попадает в категорию у (с вероятностью z);
3) Если кандидат набрал процент голосов не ниже х, то атрибут А попадает в категорию у (с вероятностью z);
4) Если атрибут А попадает в категорию х, то кандидат проходит (с вероятностью z);
5) Если атрибут А попадает в категорию х, то кандидат занимает место не ниже у (с вероятностью z);
6) Если атрибут А попадает в категорию х, то кандидат набирает процент голосов не ниже у (с вероятностью z).
Из них первые три правила генерируются на основе прошедших выборов и используются апостериорно (анализ особенностей успешных кандидатов).
Для каждого правила создаются две вершины: вершина-предок и вершина-потомок, числа в ТУВ равны значениям вероятностей в правилах.
На этапе оперативного управления используется поступление новых свидетельств о примененных избирательных технологиях Для каждой избирательной технологии создается новая вершина и связь, соединяющая ее с той вершиной, по отношению к которой подсчитывается эффективность. Если имеются сведения о нескольких применениях избирательной технологии, то эффективность технологии равна среднему арифметическому эффективностей отдельных применений данной технологии с теми же значениями атрибутов, что и у целевого кандидата в депутаты. Значения эффективности используются для модификации значений в таблицах условных вероятностей.
В режиме вычисления пользователь задает критерий успешности участия кандидата в депутаты в избирательной кампании. Этот критерий в общем виде записывается как C]*(-Bud)+C2Par, где Ci и С2—веса, Bud—суммарная стоимость принятых решений, Par—
вероятность того, что выбранная вершина в группе параметров прохождения окажется в требуемом состоянии. Байесовская сеть перебирает наборы совместно принимаемых решений, отбрасывая те наборы, которые не удовлетворяют установленным ограничениям, и выдает на выходе ту комбинацию решений, которая максимизирует вероятность оптимального состояния выбранного параметра прохождения. Ограничения по бюджету означают, что каждому решению соответствует цена—стоимость исполнения этого решения, а стоимость исполнения принятых решений не должна превышать общего бюджета кампании.
Единственная частная задача управления, рассмотренная в диссертации—это задача распределения финансовых средств. Она заключается в том, что необходимо рассчитать, какая часть финансовых средств тратится на первую статью расхода, на вторую статью расхода и т.д. Пусть всего имеется X средств, на ¡-ую статью расходуется X, средств. Введем функцию эффективности расходования средств на ¡-ую статью от номера статьи и количества средств X,). Тогда задачу можно сформулировать следующим образом: Х,)->тах при условии ^ Х,=Х. Универсальным методом решения этой задачи является динамическое программирование.
Частный случай распределения финансовых средств—распределение средств, отведенных на агитацию, по группам населения, на которые рассчитана агитация. Выведено соотношение Д1, Х,)=Р,1,(2Х1К1,-(Х,Ки)2)(Ви-Аи)/2, где I,—прогнозируемая явка на выборы в ¡-ой группе избирателей, Р,—доля ¡-ой группы во всем электорате, Кч—убеждаемость, В, и А,—параметры распределения избирателей по СН и С ПА.
Система прогнозирования и управления была испытана на выборах в местное самоуправление 2004 года при проведении избирательной кампании кандидатов в депутаты Воробьева и Климовой Система использовалась для принятия двух решений: решений относительно выбора способа предвыборной агитации и выбора типа листовок. Система рекомендовала именно те решения, которые были наиболее эффективными в соответствии с экспертной (альтернативной) оценкой, данной экспертом "Невского исследовательского центра". При этом была выявлена высокая корреляция между оценками двух типов: оценками эксперта и оценками, вычисленными байесовской сетью, что свидетельствует о правильности работы байесовских сетей.
В пятой главе описана программа, реализующая исследовательскую версию системы прогнозирования и управления Описана ее архитектура и функционирование, методика работы с программой, место в системе каждого из алгоритмов и выбор алгоритмов.
Система прогнозирования и управления реализована как экспертная система. Она состоит из управляющего модуля и четырех подсистем (рис. 4): подсистемы баз данных, подсистемы прогнозирования исхода выборов, подсистемы управления ведением избирательной кампании и подсистемы взаимодействия с пользователем и редактирования базы данных.
г/
Подсистема взаимодействия с пользователем и редактирования базы данных
МИСБД
МВИБД
МАЗБД
Пользователь
Управляющий модуль
Подсистема управления ведением предвыборной кампании ^
МБС
МРФС
в
Подсистема прогнозирования исхода выборов
МПИТЮДШ
мпивпт
мпиводсэ
мпивоксп
мпинс
Подсистема баз данных
База данных
Рис.4
МИСБД—модуль изменения структуры базы данных, МВИБД—модуль введения информации в базу данных, МАЗБД—модуль автоматического заполнения базы данных, МБС— модуль байесовских сетей, МРФС—модуль распределения финансовых средств, МПИНС—модуль прогнозирования с использованием нейронных сетей, МПИВПТ— модуль прогнозирования исхода выборов после первого тура, МПИВОДСЭ—модуль прогнозирования исхода выборов на основе данных о структуре электората, МПИВОДСО— модуль прогнозирования исхода выборов на основе данных социологических опросов, МПИВОКСП—модуль прогнозирования исхода выборов на основе коэффициентов способствования прохождению, ^-взвешенная сумма
вычислитель взвешенной суммы
Модификаторы параметров прохождения (опционально)
1 модуль прогнозирования
>зрюв
X
2 модуль прогнозирования
т
5 модуль прогнозирования
Рис. 5
Подсистема прогнозирования исхода выборов—это подсистема, решающая задачу прогнозирования исхода выборов депутатов Она на основе информации, хранящейся в базе данных, выдает прогнозируемые (наиболее вероятные) параметры прохождения. Методы прогнозирования реализованы в виде 5 модулей (рис. 5).
Модули прогнозирования используют различные входные данные и различные алгоритмы вычисления. Взвешенная сумма вычисляется отдельно по каждому параметру прохождения. Весовые коэффициенты С, на этапе вычисления взвешенной суммы подбираются в зависимости от того, какая именно информация о выборах известна конечному пользователю и насколько она надежна.
Приводится архитектура всех модулей прогнозирования, где показан выбор методов и алгоритмов прогнозирования параметров прохождения в рамках каждого модуля
Подсистема управления ведением предвыборной кампании позволяет пользователю принять управленческие решения. Был проведен эксперимент, в ходе которого сопоставление результатов расчета байесовской сети в системе прогнозирования и управления и аналогичной сети в системе HUGIN показало хорошее совпадение расчета в системе прогнозирования и управления и, следовательно, правильность заложенных алгоритмов
Экспертная система обладает открытой архитектурой, которая позволяет добавлять новые модули прогнозирования и управления, что обеспечивает свойства гибкости и масштабируемости. Открытая архитектура обеспечивает возможность адаптации к изменениям в предвыборном законодательстве Возможность добавления новых модулей обеспечивается за счет наличия единого интерфейса для всех модулей прогнозирования (методы Init, GetResult, GetDefect) и единого интерфейса для всех модулей управления (методы Init, Calllnterface, Compute, GetDataForDrawing).
В подсистему взаимодействия с пользователем и редактирования базы данных входят модуль изменения структуры базы данных, модуль введения информации в базу данных и модуль автоматического заполнения базы данных. Последний модуль автоматически заполняет производные атрибуты по текстовым (.txt и .html) файлам с использованием элементов синтаксического анализа.
Управляющий модуль организует взаимодействие программных компонент системы на наиболее высоком уровне.
Основная часть базы данных содержит сведения об атрибутах кандидатов в депутаты, избирательных округов и избирательных кампаний Пользователь может изменять структуру этой части базы данных. Механизм изменения структуры базы данных основан на редактировании изменяемых групп атрибутов—ИГА, на включении и исключении атрибутов из этих групп Информация о структуре базы данных хранится отдельно.
Два модуля прогнозирования должны быть предварительно обучены. Перед обучением пользователь создает обучающее множество. Экспертная система имеет функцию автоматизированного отбора кампаний для обучающего множества в соответствии с наиболее важными для решения конкретной задачи атрибутами. В основе отбора кампаний лежит полный факторный эксперимент.
Пользователь имеет возможность задать основные свойства атрибута, такие как способ выделения категорий, способ обработки и устранения неизвестных значений и другие параметры, характеризующие способ обработки данных.
В заключении формулируются основные полученные результаты.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
1. Выделены основные сущности процесса выборов, предложена модель факторов, влияющих на исход выборов. Введены понятия атрибута и параметра прохождения. Произведена классификация атрибутов с точки зрения их принадлежности сущностям и возможности их численного выражения, описаны основные параметры прохождения. Сформулированы основные задачи, стоящие перед участниками избирательной кампании' задача прогнозирования исхода выборов и задача управления ходом предвыборной кампании, выделены частные задачи прогнозирования, для каждой из которой созданы отдельные методы прогнозирования.
2 Предложены методы и алгоритмы оценки параметров прохождения, используемые в пяти модулях прогнозирования и двух модификаторах, из которых состо-
ит подсистема прогнозирования исхода выборов. Для каждого метода прогнозирования были проведены эксперименты, показавшие, что погрешность прогнозирования не превышает 0.10, а во многих случаях не превышает 0.05.
3. Предложены методы и алгоритмы принятия решений в процессе управления ведением предвыборной кампании. Предложены операции взаимодействия с байесовской сетью—операции заполнения байесовской сети в ручном режиме, операции заполнения байесовской сети по прогнозу исхода выборов, операции изменения байесовской сети на этапе оперативного управления и расчета байесовской сети.
4. Разработана архитектура экспертной системы. Предложена структура компонентов экспертной системы- хранилища данных, подсистемы прогнозирования исхода выборов и подсистемы управления ведением предвыборной кампании. Открытая архитектура экспертной системы предоставляет возможность ее расширения путем разработки и добавления новых модулей прогнозирования и управления в будущем. Возможность расширения обеспечивается за счет модульной структуры и библиотечной организации.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
1. Биниенко O.A. Система прогнозирования исхода выборов депутатов и управления процессом предвыборной кампании / O.A. Биниенко // Изв. СПбГЭТУ "ЛЭТИ". Сер "Информатика, упр. и компьютер, технологии". - 2004. - Вып. 2. - С. 63-67.
2. Биниенко О А. Байесовские сети в задаче управления предвыборной кампанией / O.A. Биниенко // Изв. СПбГЭТУ "ЛЭТИ". Сер. "Информатика, упр. и компьютер, технологии". - 2005. - Вып. 1. - С. 21-26.
3. Биниенко O.A. Система управления ведением предвыборной кампании депутата / O.A. Биниенко // Региональная информатика-2004 РИ-2004- Материалы IX С.-Петерб. междунар. конф., г. Санкт-Петербург, 22-24 июня 2004 г. - СПб: Изд-во СПОИСУ, 2004. - С. 13.
Подписано в печать 06.09.05. Формат 60*84 1/16. Бумага офсетная. Печать офсетная. Печ. л. 1,0. Тираж 100 экз. Заказ 85.
Отпечатано с готового оригинал-макета в типографии Издательства СПбГЭТУ "ЛЭТИ"
Издательство СПбГЭТУ "ЛЭТИ" 197376, С.-Петербург, ул. Проф. Попова, 5
Щ8545
РНБ Русский фонд £
2006-4 íf
16540
Оглавление автор диссертации — кандидата технических наук Биниенко, Олег Анатольевич
ВВЕДЕНИЕ.
ГЛАВА 1. ПРОЦЕСС ВЫБОРОВ ДЕПУТАТОВ И ЕГО ОСНОВНЫЕ УЧАСТНИКИ. ФАКТОРЫ, ВЛИЯЮЩИЕ НА ИСХОД ВЫБОРОВ. ЗАДАЧИ ПРОГНОЗИРОВАНИЯ И УПРАВЛЕНИЯ.
1.1. Основные сущности процесса выборов.
1.2. Модель факторов, влияющих на исход выборов.
1.3. Классификация избирателей.
1.4. Атрибуты и их классификация.
1.4.1. Возможность численного выражения атрибутов.
1.5. Параметры прохождения.
1.6. Место диссертации среди других работ.
1.7. Обзор источников информации о выборах.
1.8. Задача прогнозирования исхода выборов.
1.9. Типы моделей прогнозирования.
1.10. Модификаторы параметров прохождения.
1.11. Процесс управления.
1.12. Изменения в предвыборном законодательстве и гибкость системы прогнозирования и управления.
1.13. Результаты и выводы по главе.
ГЛАВА 2. МЕТОДЫ И АЛГОРИТМЫ ПРОГНОЗИРОВАНИЯ ИСХОДА ВЫБОРОВ, ИСПОЛЬЗУЮЩИЕ АППАРАТ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ.
2.1. Обработка и отбор входных данных.
2.1.1. Предварительная обработка входных данных. Преобразование атрибутов к числовому виду и выделение категорий.
2.1.2. Обработка неизвестных значений.
2.1.3. Анализ информативности атрибутов.
2.2. Прогнозирование исхода выборов с использованием информации о способствовании прохождению.
2.2.1. Статистический анализ в рамках отдельных избирательных кампаний.
2.2.2. Исследование влияния атрибутов избирательной кампании на исход выборов
2.2.3. Исследование корреляции и нелинейности влияния атрибутов кандидатов в депутаты.
2.2.4. Экспериментальное испытание метода прогнозирования исхода выборов, основанного на использовании коэффициентов способствования прохождения.
2.3. Прогнозирование исхода выборов с использованием данных социологических опросов.!.
2.4. Прогнозирование исхода выборов с использованием сведений о структуре электората.
2.5. Прогнозирование исхода выборов во втором туре.
2.6. Модификатор агитации.
2.7. Экспериментальная проверка специализированных методов прогнозирования.
2.8. Расчет погрешности расчета параметров прохождения в универсальном методе прогнозирования, применяемом при малом числе атрибутов.
2.9. Базовые и производные параметры прохождения, связь между ними.
2.9.1. Способы представления оценок параметров прохождения.
2.9.2. Погрешность методов прогнозирования после применения модификаторов
2.10. результаты и выводы по главе.
ГЛАВА 3. ПРОГНОЗИРОВАНИЕ ИСХОДА ВЫБОРОВ С ПОМОЩЬЮ НЕЙРОННЫХ СЕТЕЙ.
3.1. Выбор типа нейронных сетей и алгоритма обучения для решения задачи прогнозирования исхода выборов.
3.2. Предварительное исследование эффективности нейронных сетей как средства прогнозирования исхода выборов.
3.3. Предварительная обработка входных данных.
3.4. Построение и обучение набора нейронных сетей, анализирующих процесс выборов.
3.4.1. Нейронные сети первой, второй и третьей серии.
3.4.2. Отбор избирательных кампаний для обучения.
3.4.3. Построение набора сетей при возникновении проблемы "проклятия размерности".
3.4.4. Учет атрибутов, не вошедших в число наиболее информативных.
3.5. Определение параметров и экспериментальное испытание нейронных сетей
3.5.1. Определение количества слоев в нейронных сетях и нейронов в слоях.
3.5.2. Экспериментальное испытание нейронных сетей.
3.6. Модификатор "Функция P(x|y)".
3.7. Разбиение кандидатов в депутаты на группы.
3.8. Результаты и выводы по главе.
ГЛАВА 4. УПРАВЛЕНИЕ ВЕДЕНИЕМ ПРЕДВЫБОРНОЙ КАМПАНИИ.
4.1. Байесовская сеть управления ведением предвыборной кампании.
4.1.1. Множества вершин байесовской сети.
4.1.2. Оценка эффективности избирательных технологий.
4.1.3. Заполнение байесовской сети в ручном режиме.
4.1.4. Заполнение байесовской сети по прогнозу исхода выборов.
4.1.5. Изменение байесовской сети на этапе оперативного управления.
4.1.6. Расчет байесовской сети.
4.2. Модуль распределения финансовых средств.
4.3. Экспериментальное испытание управления ведением предвыборной кампании в системе прогнозирования и управления.
4.4. Результаты и выводы по главе.
ГЛАВА 5. РЕАЛИЗАЦИЯ СИСТЕМЫ ПРОГНОЗИРОВАНИЯ И УПРАВЛЕНИЯ
5.1. Архитектура экспертной системы.
5.1.1. Подсистема баз данных.
5.1.2. Подсистема прогнозирования исхода выборов.
5.1.3. Подсистема управления ведением избирательной кампании.
5.1.4. Открытая архитектура экспертной системы.
5.1.5. Подсистема взаимодействия с пользователем и редактирования базы данных.
5.1.6. Управляющий модуль.
5.2. Структура и механизм редактирования базы данных.
5.2.1. Структура базы данных.
5.2.2. Структура основной части базы данных.
5.2.3. Представление избирательных технологий в базе данных.
5.2.4. Механизм изменения структуры базы данных.
5.3. Методика работы с программой.
5.3.1. Обучение экспертной системы.
5.3.2. Отбор и редактирование атрибутов для использования в вычислениях.
5.4. Результаты и выводы по главе.
Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Биниенко, Олег Анатольевич
Актуальность темы. В настоящее время социологи, кандидаты в депутаты и политические силы, стоящие за ними, желают на как можно более раннем этапе получить оценку и прогноз исхода выборов, чтобы заранее знать, как действовать перед началом предвыборной кампании и во время ее проведения. Сегодня кампания должна строиться с учетом информации о предвыборной обстановке, изменение которой и влияние которой на исход предстоящих выборов необходимо постоянно отслеживать.
Отсюда вытекает необходимость в методах и средствах прогноза исхода выборов депутатов и выработки рекомендаций по управлению ведением избирательной кампании, что обуславливает актуальность темы диссертации.
Существует много литературных источников, посвященных выборам, однако все они обладают рядом недостатков. Одним из этих недостатков является преимущественно описательный, неформализованный подход к описанию процесса выборов.
Также нет возможности учета произвольных факторов, влияющих на исход выборов. Во всех литературных источниках рассмотрен лишь фиксированный неизменяемый набор факторов, влияющих на исход выборов.
В существующих литературных источниках малое внимание уделяется прогнозированию исхода выборов, практически нет алгоритмов прогнозирования значений параметров, отражающих успешность выступления кандидатов в депутаты на выборах, например, числа голосов.
Также недостаточно освещено управление предвыборной кампанией. В существующих трудах управление рассматривается как деятельность кандидата в депутаты и членов его штаба во время избирательной кампании, но не как система принятия решений, выбора решений из ряда альтернатив. В большинстве источников присутствует лишь множество рекомендаций для кандидата в депутаты описательного плана.
Наконец, совершенно отсутствует средство (скажем, программный пакет), позволяющее хотя бы частично автоматизировать прогнозирование исхода выборов и управление ведением предвыборной кампанией, которое не только снабжает политического аналитика фактической информацией по выборам, но способно помочь ему в принятии решений во всех аспектах и этапах ведения предвыборной кампании.
В качестве средства решения стоящих перед кандидатами в депутаты и политическими аналитиками задач разработана система прогнозирования и управления.
Целью диссертационной работы является повышение эффективности ведения предвыборной кампании и степени прогнозируемости исхода выборов.
Объектом исследования в данной работе является процесс выборов депутатов.
Предметом исследования являются модели и методы прогнозирования исхода и управления процессом выборов депутатов и архитектура экспертной системы.
Методы исследования. При решении основной задачи диссертационной работы были использованы методы математической статистики, нейронных сетей и байесовских сетей доверия.
Научная новизна. В диссертационной работе получены следующие научные результаты:
По специальности 05.13.10:
1)Модель факторов, влияющих на исход выборов, задачи прогнозирования исхода выборов депутатов и управления ведением предвыборной кампании.
По специальностям 05.13.01 и 05.13.10:
2) Методы и алгоритмы прогнозирования исхода выборов депутатов, в том числе метод, использующий нейронные сети и отличающийся новым способом структуризации нейронной сети и наличием дополнительных алгоритмов использования информации о менее информативных атрибутах (спец. 05.13.01), метод, основанный на использовании аппарата математической статистики и отличающийся использованием коэффициентов способствования прохождению (спец. 05.13.01), методы, основанные на использовании информации о данных социологических опросов и о структуре электората, отличающиеся новым способом определения ошибки вычисления, методы прогнозирования исхода выборов во втором туре (спец. 05.13.10).
3) Методы и алгоритмы принятия решений в процессе управления ходом предвыборной кампании: метод, основанный на аппарате байесовских сетей доверия и содержащий операции заполнения байесовской сети по прогнозу исхода выборов и изменения байесовской сети на этапе оперативного управления (спец. 05.13.01), метод распределения финансовых средств, использующий аппарат динамического программирования (спец. 05.13.10).
По специальности 05.13.01:
4) Экспертная система прогнозирования исхода выборов депутатов и управления ведением предвыборной кампании с открытой архитектурой, механизмом применения методов и алгоритмов прогнозирования и управления и схемой взаимодействия экспертной системы с пользователем, включающей возможность редактирования таких свойств атрибутов, как способы выделения категорий и способы обработки неизвестных значений. Экспертная система отличается наличием блока модификаторов параметров прохождения, что обеспечивает большую объективность прогноза выборов.
Практическая ценность работы заключается в том, что использование предложенных моделей позволяет прогнозировать исход выборов и управлять ходом предвыборной кампании. Работоспособность предложенных алгоритмов, моделей и методов подтверждена в ходе экспериментов, алгоритмы, модели и методы реализованы в виде программы, реализующей экспертную систему, что позволяет политическим аналитикам и кандидатам в депутаты непосредственно использовать их при прогнозировании исхода выборов и управлении ведением предвыборной кампании.
Внедрение результатов работы. Результаты работы внедрены в Санкт-Петербургской общественной организации "Невский исследовательский центр", что подтверждается справками о внедрении. Результаты работы были использованы при ведении избирательной кампании двух кандидатов в депутаты органов местного самоуправления.
Публикации. По материалам диссертационной работы опубликовано 3 работы.
Объем работы. Диссертация состоит из введения, пяти глав, заключения, списка использованной литературы, включающего 76 наименований, и десяти приложений. Она изложена на 228 страницах машинописного текста, содержит 35 рисунков и 69 таблиц.
Заключение диссертация на тему "Модели и методы прогнозирования исхода и управления процессом выборов депутатов"
ЗАКЛЮЧЕНИЕ
В диссертационной работе получены следующие результаты:
1. Выделены основные сущности процесса выборов, предложена модель факторов, влияющих на исход выборов. Введены понятия атрибута и параметра прохождения. Произведена классификация атрибутов с точки зрения их принадлежности сущностям и возможности их численного выражения. Сформулированы основные задачи, решаемые в экспертной системе: задача прогнозирования исхода выборов и задача управления ходом предвыборной кампании.
2. Разработаны методы и алгоритмы оценки параметров прохождения, используемые в пяти модулях прогнозирования и двух модификаторах, из которых состоит подсистема прогнозирования исхода выборов.
3. Разработаны методы и алгоритмы, предложенные для каждого из двух модулей управления, входящих в подсистему управления ведением предвыборной кампании. Модуль байесовских сетей отличается наличием операций заполнения байесовской сети в ручном' режиме, операций заполнения байесовской сети по прогнозу исхода выборов, операций изменения байесовской сети на этапе оперативного управления и расчета байесовской сети.
4. Предложена архитектура экспертной системы. Разработана структура компонентов экспертной системы: хранилища данных, подсистемы прогнозирования исхода выборов и подсистемы управления ведением предвыборной кампании. Открытая архитектура экспетной системы предоставляет возможность ее расширения путем разработки и добавления новых модулей прогнозирования и управления в будущем. Возможность расширения обеспечивается за счет модульной структуры и библиотечной организации.
5. Достоверность научных результатов обеспечивается достоверностью источников данных, использованных в алгоритмах. Для каждого метода прогнозирования были проведены эксперименты, показавшие, что погрешность прогнозирования не превышает 0.10, а во многих случаях не превышает 0.05. Система прогнозирования и управления была успешно испытана на выборах в местное самоуправление 2004 года.
6. Практическая ценность работы состоит в возможности применения полученных результатов при прогнозировании исхода выборов депутатов и управлении ведением предвыборной кампании.
Библиография Биниенко, Олег Анатольевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
1. Автономов А.С., Морозова Е.Г. Избирательная кампания. — М.: Российский центр избирательных технологий, 1995. 80 с.
2. Амелин В.Н., Зотова З.М. Эффективное управление избирательной кампанией. М.: РЦИОТ, 2001.- 104 с.
3. Аргументы и факты, № 39, 2003, приложение "Петербург", с. 3.
4. Беленький В.З. Оптимальное управление: принцип максимума и динамическое программирование. М.: Российская экономическая школа, 2001.- 114 с.
5. Биниенко О.А. Система прогнозирования исхода выборов депутатов и управления процессом предвыборной кампании // Известия ЛЭТИ. -СПб: Издательство СПбГЭТУ, 2004, вып. 3.
6. Биниенко О.А. Управление ведением предвыборной кампании и его реализация в экспертной системе // Известия ЛЭТИ. СПб: Издательство СПбГЭТУ, 2005, вып. 1.
7. Блэк С. Паблик рилейшнз. М.: 2003. - 201 с.
8. Бокс Дж., Дженкинс Г. Анализ временных рядов, прогноз и управление. М.: издательство "Мир", 1974, вып. 1. - 408 с.
9. Борисова Н.В., Пуздрач Ю.В. Избирательная кампания команда кандидата в депутаты (Теоретические и практические основы участия профсоюзов в выборах). - М.: МФП-УИЦ, 1995. - 48 с.
10. Браун Л. Имидж: путь к успеху СПб: Питер, 1996. - 283 с.
11. Букин А.Д. Критерий согласия Колмогорова. Новосибирск: Издательство Института ядерной физики, 1998. - 20 с.
12. Воеводин А.И. Стратагемы. Стратегии войны, манипуляции, обмана. — М.: Изд-во "Белые альвы", 2002. 256 с.
13. Выборы в Законодательное собрание Приморского края: Электронный ресурс. / Владивосток. Режим доступа: http://vibor.arsvest.ru/kraiduma/kraiduma.htm.
14. Выборы в Законодательное собрание Санкт-Петербурга 6-20 декабря 1998 года: Электронный ресурс. / Санкт-Петербург. Режим доступа: http://www.elections.spb.ru/ll2-4.htm.
15. Выборы, проходившие в Тольятти // Мэрия Тольятти: Электронный ресурс. / Тольятти. — Режим доступа: http://www.tgl.ru/choice.
16. Гаврилов А.В. Лабораторный практикум по нейронным сетям: Электронный ресурс. / Новосибирск: Новосибирский Государственный Технический Университет. Режим доступа: http://vt.cs.nstu.ru/site/students/ai2.
17. Гаджиев К.С. Введение в политическую науку. М.: Логос, 1997. — 544 с.
18. Галушкин А.И. Теория нейронных сетей. М.: Журнал "Радиотехника", 2000. - 415 с.
19. Гладков П., Кудинов О. Как стать губернатором. Алгоритм победы на выборах. М.: Издательский дом "Люди", 2000. - 320 с.
20. Гладышев С. Борьба бульдогов под ковром. Секреты влияния на людей. М.: Изд-во Фаир-Пресс, 2001. - 512 с.
21. Голоскоков Д.П., Истомин Е.П., Зубарев Ю.Я. Функциональная зависимость и регрессия. Часть I. СПб: Издательство СПГУВК, 1998. -105 с.
22. Горбань А., Россиев Д. Нейронные сети на персональном компьютере. Новосибирск: Наука, 1996. - 276 с.
23. Григорьев Р.В., Шеховцов О.И. Байесовские сети как инструмент поддержки принятия решений в условиях неопределенности. СПб: Издательство СПбГЭТУ "ЛЭТИ", 2004. - 32 с.
24. Девятченко И.Д. Главные компоненты информационных матриц. Введение в факторный анализ. Магнитогорск: Издательство МГТУ, 2000. -95 с.
25. Дорогов А.Ю. Алгоритм Error Backpropagation для модульных нейронных сетей // Нейроинформатика-2000. 2-я научно-техническая конференция. Сб. научных трудов. Ч. 1. М.: МИФИ, 2000. - с. 52-60.
26. Жмыриков А.Н. Как победить на выборах. Психотехника эффективного проведения избирательной кампании. Обнинск: Изд-во "Титул", 1995.-128 с.
27. Жук Е.Е. Устойчивость в кластер-анализе многомерных наблюдений. Автореферат диссертации на соискание ученой степени д.ф.-м.н. -Минск: Издательство БГУ, 1999. 44 с.
28. Избирательная комиссия Иркутской области: Электронный ресурс. / Иркутск. Режим доступа: http://www.ikio.ru.
29. Избирательная комиссия Красноярского края: Электронный ресурс. / Красноярск. Режим доступа: http://www.iksrf.krsn.ru.
30. Избирательная комиссия Республики Коми: Электронный ресурс. / Сыктывкар. Режим доступа: http://www.rkomi.ru/izbirkom/index.html.
31. Избирательная комиссия Ростовской области: Электронный ресурс. / Ростов-на-Дону. Режим доступа: http://www.ikro.aaanet.ru.
32. Избирательная комиссия Ханты-Мансийского автономного округа: Электронный ресурс. / Ханты-Мансийск. Режим доступа: http://www.hmao.wsnet.ru/power/izcom.
33. Илларионов А.Г. и др. Применение теории вероятностей и математической статистики при планировании и анализе результатов эксперимента. М.: Издательство МЭИ, 1993. - 83 с.
34. Интеллектуальные системы управления с использованием нейронных сетей. Уфа: УГАТУ, 1997. - 91 с.
35. Керов JT.A. Архитектура экспертных систем. Д.: МИПК ЛИТМО, 1989.-90 с.
36. Коваленко И.Н., Филиппова А.А. Теория вероятностей и математическая статистика—М.: Издательство "Высшая школа", 1982. 256 с.
37. Котлер Ф. Основы маркетинга. М.: Прогресс, 1990. - 736 с.
38. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. М.: "Горячая линия - Телеком", 2001. - 384 с.
39. Круглов В.В., Дли М.И., Голуиов Р.Ю. Нечеткая логика и искусственные нейронные сети. М.: Физматлит, 2001. - 224 с.
40. Кудинов О.П. Большая книга выборов М., Издательство "Арт бизнес центр", 2003 - 664 с.
41. Лаищев И.В. Исследование и разработка моделей и методов организации информационно-поисковой системы фактографического типа с семантической надстройкой. Диссертация на соискание степени к.т.н. -Л.: издательство СПб ГЭТУ, 1990. 242 с.
42. Ланкин Ю.П. Самоадаптирующиеся нейронные сети. — Красноярск: Институт биофизики СО РАН, 1997. 22 с.
43. Лисс А.С., Степанов М.В. Нейронные сети и нейрокомпьютеры. — СПб: издательство СПбГЭТУ, 1997. 64 с.
44. Литтл Р.Дж.А., Рубин Д.Б. Статистический анализ данных с пропусками. М.: Финансы и статистика, 1990. - 336 с.
45. Логовский А.С. Применение искусственных нейронных сетей для решения задач управления динамическими объектами. Автореферат диссертации на соискание ученой степени к.ф.-м.н. М.: Московский физико-технический институт, 1998. - 17 с.
46. Лызлов В.Е. Победа, только победа! Методика предвыборной борьбы с кандидатами на выборные должности в России. М.: Издательство "ПАИМС", 1999.- 109 с.
47. Мартыненко М.В., Падерно П.И., Шеховцов О.И. Человеко-машинные процедуры поддержки организационно-управленческих решений. -СПб: Издательство СПбГЭТУ, 2001. 62 с.
48. Мешков А., Тихомиров Ю. Visual С++ и MFC СПб, БХВ-Санкт-Петербург, 1999-1026 с.
49. Миркес Е.М. и др. Нейроинформатика. Новосибирск: Наука, 1998. -296 с.
50. Мишенин А.А. Нейронные сети. Вводный курс: Электронный ресурс. / Сумы: Сумский Государственный университет, 2001. -Режим доступа: http://dl.sumdu.edu.ua/e-pub/nnetwork/index.html.
51. Нейронные сети. STATISTIC A Neural Networks—М.: Горячая линия— Телеком, 2001.- 182 с.
52. Николаев В.И., Брук В.М. Системотехника: методы и приложения— JL: Машиностроение, 1985. 199 с.
53. Официальный сайт Пермской областной избирательной комиссии: Электронный ресурс. / Пермь. Режим доступа: http://elect.pemi.ru.
54. Паппас К., Мюррей У. Visual С++. Руководство разработчика Киев, Издательская группа BHV, 2000 - 624 с.
55. Показатель по России подведен ВЦИОМ на основе среднеарифметического по Кыштыму, Владимиру и Белгороду // Виноградов М.Ю. Политическая аналитика: Электронный ресурс., 2003. Режим доступа: http://vinogradov.hl.ru/2003/gd2511 .htm.
56. Полищук В.В., Каневский М.Ф. Использование и развитие искусственных нейронных сетей радиальных базисных функций для анализа и моделирования пространственно распределенной информации. М.: ИВРАЭ, 1999. -21 с.
57. Прикладные задачи нейроинформатики. Экономика и управление производством. Аппаратная реализация нейронных сетей. Нейроии-форматика в образовании и гуманитарной сфере. Ч. 2 2000. - 233 с.
58. Рожков И.Я. Реклама: планка для профи. М.: Юрайт, 1997. - 206 с.
59. Рощин И. Art Studio и принцип открытой архитектуры: Электронный ресурс. / М. Режим доступа: http://ivr.webzone.ru/articles/artopen.
60. Слепенков И.Н. и др. Избирательная кампания: стратегия, тактики, психологические аспекты. М.: ЗЦИТ, 1995. - 68 с.
61. Список одномандатных округов по выборам депутатов Государственной Думы Федерального Собрания Российской Федерации второго созыва: Электронный ресурс. / Москва. Режим доступа: http://www.nns.ru/elects/spiski/odnoman.html.
62. Терехов В.А., Ефимов Д.В., Тюкин И.Ю. Искусственные нейронные сети и их применение в системах автоматического управления. СПб: издательство СПбГЭТУ, 1997. - 64 с.
63. Ушакова Т.Н., Латынов В.В., Павлова А.А., Павлова Н.Д. Ведение политических дискуссий. Психологический анализ конфликтных выступлений. М.: Academa, 1995. - 155 с.
64. Федеральный закон "ОБ ОСНОВНЫХ ГАРАНТИЯХ ИЗБИРАТЕЛЬНЫХ ПРАВ И ПРАВА НА УЧАСТИЕ В РЕФЕРЕНДУМЕ ГРАЖДАН РОССИЙСКОЙ ФЕДЕРАЦИИ".
65. Холзнер С. Visual С++ 6.0 СПб, Питер, 2000 - 576 с.
66. Центризбирком Республики Саха (Якутия): Электронный ресурс. / Якутск. Режим доступа:.http://www.ykt.ru/izbirkom.
67. Цуладзе A.M. Формирование имиджа политика в России М.: Книжный дом "Университет", 1999. - 144 с.
68. Чашкин Ю.Р. Математическая статистика. Основы регрессионного анализа. Хабаровск: Издательство ДВГУПС, 2000. - 92 с.
69. Шуклин Д.Е. Применение семантической нейронной сети в экспертной системе, преобразующей смысл текста на естественном языке // Ра-диолектроника и информатика. Харьков: Издательство ХТУРЭ, 2001. -№2. с. 61-65.
70. Ярославия. Официальный сайт администрации Ярославской области. Избирательная система Ярославской области: Электронный ресурс. i Ярославль. Режим доступа: http://www.adm.yar.ru/vote.
71. HyperStat Online Textbook: Электронный ресурс. / David М. Lane. -Houston: Rice University, 1993—2003. Режим доступа: http://davidmlane.com/hyperstat.
-
Похожие работы
- Методы моделирования и прогнозирования дискретных процессов на основе гибридной информации
- Задачи прогнозирования в управлении объектами социальных систем
- Научно-практические основы прогнозирования в системах управления промышленными объектами
- Управление механизмами адаптации алгоритмов прогнозирования изменения стохастических процессов
- Выбор и внедрение комплекса организационно-технических мероприятий по повышению эффективности работы районных органов управления
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность