автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Нейросетевые алгоритмы анализа поведения респондентов
Автореферат диссертации по теме "Нейросетевые алгоритмы анализа поведения респондентов"
На правах рукописи
СИЧИНАВА Зураби Иродиевич
НЕЙРОСЕТЕВЫЕ АЛГОРИТМЫ АНАЛИЗА ПОВЕДЕНИЯ РЕСПОНДЕНТОВ
Специальность: 05.13.01 - Системный анализ, управление и обработка информации (в технике и технологиях)
Автореферат диссертации на соискание ученой степени кандидата технических наук
27 НАР 20 Ц
ПЕНЗА 2014
005546497
005546497
Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Пермский государственный гуманитарно-педагогический университет».
Научный руководитель - доктор технических наук, профессор
ЯСНИЦКИЙ Леонид Нахимович
Официальные оппоненты: ШКОДЫРЕВ Вячеслав Петрович,
доктор технических наук, профессор, ФГБОУ ВПО «Санкт-Петербургский государственный политехнический университет»,
заведующий кафедрой «Системы и технологии управления» ИСТОМИНА Татьяна Викторовна, доктор технических наук, профессор, ФГБОУ ВПО «Пензенский государственный технологический университет», заведующая кафедрой «Информационные технологии и менеджмент в медицинских и биотехнических системах»
Ведущая организация: Федеральное государственное автономное
образовательное учреждение высшего профессионального образования «Московский физико-технический институт (государственный университет)»
Защита диссертации состоится 15 мая 2014 года, в 13 часов, на заседании диссертационного совета Д 212.186.04 в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Пензенский государственный университет» по адресу: 440026, г. Пенза, ул. Красная, 40.
Диссертация размещена на сайте Федерального государственного бюджетного образовательного учреждения высшего профессионального образования «Пензенский государственный университет»: http://sciemce4mzgu.n1/page/13778.
Автореферат разослан « 4-Э » л.л ¿х ^ Тсч 2014 г. Ученый секретарь диссертационного совета
Косппков Юрий Николаевич
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы исследования. Психофизиологические исследования с использованием полиграфа в правоохранительных органах, а также в ряде других организаций проводятся в России с 1976 года, в мире — с 1950-х гг. При этом постоянно возникает вопрос об адекватной оценке результатов, полученных в ходе этих исследований. Существующие полиграфные аппараты не отличаются высокой точностью. Так, система экспертной оценки (диагностики) полиграмм широко применяемого в органах МВД России полиграфного аппарата ЭПОС-7 имеет погрешность 30%, вследствие чего в судебно-следственной практике случаются ошибки.
Создание надежных полиграфных аппаратов является актуальным также и в связи с необходимостью предотвращения терроризма, борьбы с коррупцией, раскрытия экономических, политических и другого рода преступлений.
По мнению известных полиграфологов A.M. Петрова, А.П. Сошни-кова, A.B. Чстина и других причины низкой точности современных полиграфных аппаратов состоят в следующем:
1. Большинство полиграфных аппаратов работает по жестко детерминированным алгоритмам и поэтому не учитывает индивидуальных физиологических особенностей опрашиваемого человека (респондента).
2. Многие полиграфные аппараты требуют трудоемкой настройки на респондентов, выполняемой специалистом-полиграфологом, что осложняет практическое применение этих аппаратов и также может приводить к человеческим ошибкам, оказывающим влияние на точность полиграфных аппаратов.
3. При работе на полиграфных аппаратах специалисты-полиграфологи обычно вынуждены перепроверять результаты работы существующих алгоритмов оценки (диагностики) полиграмм (т.к. традиционные алгоритмы оценки полиграмм имеют погрешность около 30%), привлекая различные психологические методики, свой собственный опыт и интуицию. Поэтому результат полиграфного опроса во многом зависит от квалификации и моральных качеств полиграфолога, т.е. от так называемого «человеческого фактора».
Актуальность диссертационной работы заключается в создании алгоритмов оценки полиграмм, направленных на устранение указанных недостатков.
Целью исследования является разработка нейросетевых алгоритмов анализа информации, получаемой в результате опроса на полиграфном аппарате, которые обеспечивают минимальную погрешность заключений при минимальном времени полшрафного опроса.
Для достижения этой цели необходимо было решить следующие задачи:
1. Разработать алгоритм конвертации данных, считываемых с датчиков традиционного полиграфного аппарата, в формат, используемый при проектировании нейронных сетей.
2. Разработать алгоритм обнаружения и исключения выбросов из статистической информации, снимаемой с датчиков полиграфного аппарата.
3. С целью снижения трудоемкости применения нейросетевых полиграфных аппаратов разработать алгоритм выявления и исключения параметров, не оказывающих существенного влияния на степень достоверности заключений.
4. Разработать нейросетевые алгоритмы оценки полиграмм и исследовать их эффективность для решения конкретных классов задач.
5. Реализовать все разработанные алгоритмы в виде программного пакета, предназначенного для моделирования нейронных сетей и поддержки принятия решений в задачах инструментальной детекции лжи.
Объектом исследования является система данных, получаемых при экспертном опросе респондентов и поступающих с датчиков полиграфного аппарата и анкет.
Предметом исследования являются методы и алгоритмы обработки информации, снимаемой с респондента, предназначенные для поддержки принятия решений об истинности или ложности его ответа.
Методы исследований: методы системного анализа, методы математической статистики, теории эксперимента, а также методы графического представления и обработки результатов вычислительных экспериментов.
Соответствие паспортам специальностей. Результаты исследования соответствуют пунктам 4, 5, 13 паспорта научной специальности 05.13.01.
Научная новизна работы заключается в следующем.
1. Разработан нейроэкспертный алгоритм последовательного обнаружения и исключения выбросов из статистической информации, отличающийся от известных своей нейросетевой базой, а потому применимый в тех случаях, когда не выполняется закон нормального распределения статистических данных. Применение алгоритма не только позволяет повысить точность нейросетевых моделей, но и расширяет круг задач, для которых возможно успешное применение нейросетевых технологий.
2. Разработан нейросетевой алгоритм оценки полиграмм, названный индивидуально настраиваемым. Его принципиальное отличие от традиционных алгоритмов оценки псшиграмм состоит в том, что в его основе лежит нейронная сеть, обучаемая непосредственно на опрашиваемом респонденте. Это позволяет учитывать индивидуальные особенности именно его организма; в результате чего обеспечивается низкая погрешность полиграфных заключений. Алгоритм предназначен для особо ответственных случаев, когда требуется высокая точность полиграфных заключений, а время полиграфного опроса значения не имеет.
3. Разработан нейросетевой алгоритм оценки полиграмм, названный универсальным. Его отличие от предыдущего алгоритма состоит в том, что обучение нейронной сети осуществляется предварительно на примерах, сформированных на множестве различных респондентов, и потому при опросе конкретного респондента не требуется дополнительных настроек, за счет чего сокращается время полиграфного опроса, однако при этом увеличивается погрешность полиграфных заключений. Алгоритм предназначен для быстрых скрининговых обследований больших масс респондентов.
4. Разработан нейросетевой алгоритм оценки полиграмм, названный универсально-анкетным. Отличие универсально-анкетного алгоритма от предыдущих состоит в том, что информация в нейронную сеть подается не только с датчиков, снимающих физиологические параметры респондента, но и с заранее подготовленных анкет, характеризующих особенности его организма. Данная модификация нейросетевого алгоритма позволила получить си-нергегический эффект: существенно сократить время полиграфного обследования при незначительном увеличении погрешности заключений полиграфного аппарата. В связи с этим данный алгоритм рекомендуется для применения в большинстве случаев полиграфного тестирования как альтернатива традиционным алгоритмам.
Практическая значимость состоит в создании программного пакета, используемого для интеллектуальной поддержки принятия решений, который позволяет повысить точность экспертных заключений, уменьшает роль человеческого фактора, позволяет применять полиграфные аппараты пользователям, не имеющим специальной квалификации.
На защиту выносятся:
1. Нейроэкспертный алгоритм последовательного обнаружения и исключения посторонних выбросов из статистической информации при проектировании нейронных сетей.
2. Индивидуально настраиваемый нейросетевой алгоритм оценки полиграмм.
3. Универсальный нейросетевой алгоритм оценки полиграмм.
4. Универсально-анкетный нейросетевой алгоритм оценки полиграмм.
5. Программная реализация всех алгоритмов — программный пакет, предназначенный для моделирования нейронных сетей и поддержки принятия решений в задачах инструментальной детекции лжи.
Реализация результатов работы. Результаты диссертационной работы использованы Центром прикладной психофизиологии (г. Москва) для совершенствования методик психофизиологических опросов, в частности, выявления значимых физиологических параметров, оказывающих влияние на точность и качество заключений при использовании полиграфов.
Кроме того, основные результаты и положения диссертационной работы внедрены в учебный процесс Пермского государственного националь-
ного исследовательского университета и Пермского государственного гуманитарно-педагогического университета.
Акты об использовании результатов диссертационной работы помещены в приложении к диссертации.
Получено свидетельство о регистрации электронного ресурса «Программный продукт, предназначенный для проектирования нейронных сетей "ЗС"», выданное Сичинава З.И. Объединенным фондом электронных ресурсов «Наука и образование» Института научной и педагогической информации Российской академии образования, зарегистрированное под № 17926 20.02.2012.
Достоверность научных положений, выводов и практических результатов, сформулированных в диссертации, обеспечивается корректным использованием теории нейронных сетей, а также подтверждается регистрацией разработанного программного пакета и результатами тестирования нейронных сетей на реальных данных - результатах полиграфных опросов заключенных следственных изоляторов Пермского края.
Апробация работы. Основные положения и результаты диссертационной работы докладывались и обсуждались на российских и международных научно-технических конференциях: Международной научно-методической конференции, посвященной 90-летию высшего математического образования на Урале, «Актуальные проблемы математики, механики, информатики» (Пермь, 2006 г.); Первой Всероссийской конференции студентов, аспирантов и молодых ученых «Искусственный интеллект: философия, методология, инновации» (Москва, 2006 г.); Международной научно-практической конференции «Перспективные технологии искусственного интеллекта» (Пенза, 2008 г.); Третьей Всероссийской конференции студентов, аспирантов и молодых ученых «Искусственный интеллект: философия, методология, инновации» (Москва, 2009 г.); Всероссийской научно-практической конференции «Современные проблемы математики и ее прикладные аспекты» (Пермь, 2010 г.); Всероссийской научно-практической конференции «Актуальные проблемы механики, математики, информатики» (Пермь, 2010 г.); Всероссийской научно-практической конференции с международным участием, посвященной 50-летнему юбилею механико-математического факультета ПГУ, «Актуальные проблемы механики, математики, информатики» (Пермь, 2010 г.); Международной научно-практической конференции «Интеллектуальные технологии в образовании, экономике и управлении» (Воронеж, 2010 г.).
Публикации. По теме диссертации опубликовано 17 работ, из них 4 статьи в журналах, входящих в перечень ВАК РФ, одна монография. Зарегистрирован электронный ресурс в Объединенном фонде электронных ресурсов «Наука и образование» Института научной и педагогической информации Российской академии образования.
Все результаты, составляющие основное содержание диссертации, и выносимые на защшу положения получены и сформулированы диссертан-
том самостоятельно. Работы [1—4, 6-8, 9, 10, 12—14, 16] опубликованы в соавторстве с научным руководителем, которому принадлежат постановка задачи и разработка концепций решения проблем. Работы [2,3,6, 8,14] опубликованы в соавторстве с главным полиграфологом Пермского края, полковником МВД A.M. Петровым и заместителем директора Центра прикладной психофизиологии (г. Москва) А.П. Сошниковым, оказавшими помощь по организации экспериментов и интерпретации их результатов. Монография [1] опубликована совместно с аспирантом Ф.М. Черепановым, с помощью компьютерной программы которого была произведена вербализация обученных нейронных сетей и получены математические формулы, облегчающие процесс переноса готовых алгоритмов из одной программной среды в другую. Работы [6, 8, 13] опубликованы совместно с аспирантами А.Н. Зибатовой и С.Л. Яс-ницким, осуществлявшими сбор статистической информации и ей первоначальную обработку.
Программный пакет «ЗС» [17], реализующий все предлагаемые в диссертации алгоритмы, разработан диссертантом самостоятельно.
Структура и объем работы. Диссертация состоит из введения, трех глав, заключения, списка литературы из 109 наименований и приложения. Основное содержание диссертации включает текст и 30 рисунков общим объемом 101с. Список литературы и приложения занимают 14 с.
СОДЕРЖАНИЕ РАБОТЫ
Во введении содержится обоснование актуальности проблемы, описываются объект и предмет исследования, формулируются цель и задачи диссертационной работы, определяются методы исследования, дается краткое содержание диссертации по главам, приводятся основные положения диссертационной работы, выносимые на защиту.
В первой главе описан анализ предметной области, выявлены проблемы, возникающие при проведении тестирования на полиграфном аппарате, и предложено направление их решения.
Глава начинается с определения полиграфа, краткой истории его возникновения и развития, дается расшифровка некоторых профессиональных терминов. Описываются принцип действия современного полиграфного аппарата и классическая схема (порядок) работы с ним. Делается попытка классифицировать алгоритмы обработки снимаемой с респондентов информации:
- сервисные алгоритмы первого уровня, реализованные в виде компьютерных программ, позволяющих считывать сигналы, обрабатывать их статистическими методами, представлять в удобной графической форме - в виде полиграмм;
- сервисные алгоритмы второго уровня, реализованные в виде компьютерных программ, вычисляющих интегральные характеристики, на основании которых полиграфологами делается экспертная оценка — заключение об истинности ответа респондента;
- алгоритмы, позволяющие делать экспертные оценки автоматически - на основании результатов вычисления по данным палиграмм.
Отмечается, что полиграфологи используют в своей работе первые две группы алгоритмов и программ, а третья группа алгоритмов, предназначенная для автоматической (компьютерной) оценки полиграмм, практически не используется. Более того, в наиболее распространенной классической схеме (порядке) работы с полиграфным аппаратом, приведенной во многих руководствах и инструкциях, алгоритмами автоматической оценки полиграмм пользоваться не рекомендуется.
На этом основании в диссертации делается вывод о том, что причиной столь негативного отношения полиграфологов к математическим методам и алгоритмам диагностики (оценки) полиграмм является их высокая погрешность, являющаяся следствием устаревшей методологической основы. Причем в качестве недостатков существующих алгоритмов оценки полиграмм указываются их субъективизм, т.е. зависимость результатов полиграфных обследований от профессионализма, опыта и интуиции полиграфолога, а также высокая трудоемкость полиграфного обследования.
В качестве выхода из сложившейся ситуации в диссертации предлагается применение более современной технологической основы для построения алгоритмов автоматической диагностики палиграмм, а именно - аппарата нейросетевых технологий. Обоснованием этого предложения является, во-первых, анализ литературы, который показал, что в ряде иностранных источников уже имеются сообщения о подобных попытках. Идея применения нейросетевых технологий в полиграфном деле «витает в воздухе», но до серьезных научных исследований и, тем более, до практического применения дело пока не доходит. Во-вторых, и это главное, обширный мировой опыт создания алгоритмов принятия решений на базе нейронных сетей (А.И. Галушкин, A.B. Чечкин, А.Н. Горбань, Е.М. Миркес, В.В. Круглов, В.В. Борисов, Г.М. Алакоз, Л.С. Куравский, С.Д. Кулик, В.И. Горбачснко, А.И. Иванов, С.А. Филист, С. Хайюш, С. Рассел, С. Осовский, Дж. Ф. Люгер и др.) показывает, что нейросетевые алгоритмы исключительно объективны и во многих случаях позволяют добиваться высокой точности моделирования объектов, явлений и процессов.
Во второй главе описываются материально-техническая, мегодоло-гическая и программно-инструментальная базы, используемые для разработ-•ки и создания нейросетевых алгоритмов анализа поведения респондентов.
Описывается алгоритм применения метода нейросетевого математического моделирования. Отмечается, что успешное применение этого алгоритма в значительной степени осложнено наличием большого количества
выбросов, неизбежно присутствующих среди сигналов, снимаемых с датчиков полиграфного аппарата. Как известно, под посторонними выбросами понимаются примеры поведения предметной области, по каким-либо причинам выпадающие из общих закономерностей этой предметной области. Другими словами, это наблюдения, не удовлетворяющие закономерностям, которым подчиняется подавляющее большинство примеров поведения предметной области. Причинами появления посторонних выбросов могут быть: недостаточно чисто проведенный эксперимент (полиграфный опрос), ошибка измерений, сбой приборов и оборудования, искажение информации при формировании множества обучающих примеров.
С целью преодоления указанных трудностей автором предложен и реализован специальный алгоритм, названный нейроэкспертным алгоритмом последовательного обнаружения и исключения посторонних выбросов из статистических выборок. Идея алгоритма основана на том факте, что если выбросов в обучающем множестве сравнительно немного и если нейронная сеть имеет сравнительно небольшое число степеней свободы (небольшое количество синаптических весов), то после применения процедуры обучения нейронная сеть на примерах, которые являются выбросами, как правило, показывает более высокую погрешность обучения, чем на примерах, не Являющихся выбросами.
С учетом этого эмпирического факта алгоритм обнаружения и исключения посторонних выбросов предлагается в следующем виде:
1. Разбить множество примеров поведения предметной области на обучающее (Ь ), тестирующее (Т ) и подтверждающее ( Р ) подмножества в отношении 80% : 15% : 5%.
2. Для множества щнгмеров 11) Т , пользуясь формулами следствия теоремы Арнольда - Колмогорова - Хехт-Нильсена, рассчитать минимальное и максимальное количество скрытых нейронов двухслойного персептрона (используем самый простой из всех допустимых вариантов персептронов, удовлетворяющих условиям теоремы существования Арнольда — Колмогорова — Хехт-Нильсена):
МД
N . -->±- ■
кмя 1 + 1О82(0
N,„„.. = N.
н'шах
'в ?
—+1
=
N ■
шах Nx+Ny '
Злесь- N ■ и N - минимальное и максимальное количество скрытых
4/Wvv*'* m m щах
нейронов; iVlvmiB и Nwnmx - минимальное и максимальное количество сил синаптических связей; Nx - количество нейронов входного слоя; Ny - количество нейронов выходного слоя; Q - число элементов множества L\J Т .
3. Рассчитать число скрытых нейронов двухслойного персептрона, предназначенного для выявления посторонних выбросов, с помощью предлагаемой автором эмпирической формулы:
N = N ■ +Z(N -N ),
mm шах шш ' '
в которой \ - эмпирический коэффициент, значение данного коэффициента в первом приближении принимается, например, равным 0,1.
4. Обучить нейронную сеть на множестве ¿UT и выявить пример, для которого ошибка обучения нейросети е0 имеет максимальное значение.
5. Предоставить информацию о выявленном примере специалисту в исследуемой предметной области и согласовать с ним вопрос о возможности удаления данного примера из множества L U Т .
6. В зависимости от решения эксперта либо удалить выявленный пример из множества L\JT и перейти к п.7, либо пометить его как не подлежащий удалению, выявить следующий по величине е0 пример и перейти к п. 5.
7. Разбить очищенное множество L\JT на обучающее L и тестирующее Т подмножества в отношении 85% : 15%.
8. Обучить и протестировать нейросеть, вычислив ошибку тестирования ег на множестве Т . Результат тестирования изобразить графически,
как показано на рисунке 1.
9. Повторять пп. 2-8, пока кривая на рисунке 1 не перестанет снижаться.
10. Вычислить ошибку сети гр на подтверждающем множестве Р .
ЕГ,%
60
50
40
30
20
10
о
01234567 "
Рисунок 1 - Примерные зависимости погрешности тестирования ег от эмпирического коэффициента с и от числа итераций п по пп. 2-8 предлагаемого
алгоритма
Как видно из рисунка 1, качество получаемой таким способом нейронной сети зависит от значения коэффициента . В приведенном на рисунке примере оптимальное значение коэффициента % оказалось равным 0,1. Это значит, что любое отклонение от этого оптимального значения коэффициента ^ в сторону увеличения или в сторону уменьшения приводит к росту ошибки тестирования сети ет (а также ер). Как показали численные эксперименты, значение коэффициента ^ = 0,1 является оптимальным только для рассматриваемого в диссертационной работе класса задач. Для других же предметных областей оптимальное значение коэффициента £ может отличаться от 0,1, однако, как правило, оно не выходит за рамки интервала [0; 0,2]. В любом случае оно может быть уточнено путем построения кривых, аналогичных кривым рисунка 1.
Применение предлагаемого нейроэкспертного алгоритма обнаружения и исключения посторонних выбросов при создании нейросетевого детектора лжи позволило снизить погрешность нейронных сетей на величину от 20 до 80% в зависимости от используемой статистической выборки и используемого нейросетевого алгоритма.
Необходимо отметить, что попытки построения нейросетевых моделей без предварительного обнаружения и исключения посторонних выбросов из статистической информации в большинстве случаев вообще не приводили к положительным результатам, т.е. погрешности нейронных сетей не удавалось снизить до сколько-нибудь приемлемых для практического применения значений.
На рисунке 2 представлена схема взаимодействия элементов исследуемой в диссертационной работе системы. Как показано на схеме, информа-
ция снимается с респондента двумя путями: с помощью датчиков полиграфного аппарата и путем предварительного заполнения анкет. Информация, полученная с датчиков, обрабатывается алгоритмами первого и второго уровней полиграфного аппарата, после чего подается на входы нейронной сети. Информация с анкет сразу подается на входы нейронной сети. Нейронная сеть вычисляет результат, используемый специалистом-полиграфологом для интеллектуальной поддержки решения об истинности или ложности ответа респондента. Необходимо обеспечить минимальную погрешность заключений при минимальном времени полиграфного обследования респондента. То есть критериями оценки алгоритма являются: 1) погрешность заключений и 2) время полиграфного обследования респондента.
Рисунок 2 - Структура исследуемой системы
В третьей главе разрабатываются три нейросетевых алгоритма оценки полиграмм, названные:
- индивидуально настраиваемым,
- универсальным,
- универсально-анкетным.
Принцип действия индивидуально настраиваемого нейросетевого алгоритма является традиционным для метода нейросетевого математического моделирования. Согласно этому принципу сначала формируется множество обучающих примеров, которое в данном случае создается в результате предъявления обследуемому человеку-респонденту стимуляционных тестов. Полиграфолог задает вопросы, ответы на которые ему известны. С респондента во время ответов с помощью штатных датчиков полиграфного аппарата ЭПОС-7 снимаются физиологические показатели, которые формируют входной вектор Хч :
х1 - верхнее дыхание (грудное), число вдохов в минуту;
х2 - нижнее дыхание (брюшное), число вдохов в минуту;
Л'3 - амплитуда дыхания, амплитуда;
х4 - кожно-гальванические реакции 1-го уровня, число колебаний в
минуту;
х5 - кожно-гальванические реакции 2-го уровня, число колебаний в
минуту,
х6 - кожно-гальванические реакции, амплитуда;
х1 - фотоплетизмограмма, частота;
х& - фотоплетизмограмма, амплитуда;
х9 - кровенаполнение, скорость кровенаполнения сосудов.
Требуемый выходной сигнал нейронной сети с) формирует полиграфолог, сопоставляя ответы респондента с тем, что ему заранее известно: с1 = 1, если ответ правдивый, и ¿1 — 0, если ответ ложный.
Накопив достаточное количество примеров, обучив и протестировав нейронную сеть, можно задать опрашиваемому человеку вопрос, ответ на который заранее не известен. Нейронная сеть выдаст сигнал у , кодирующий степень истинности ответа опрашиваемым человеком: если сигнал у окажется близким к единице, то ответ считается правдивым, а если к нулю - то ложным. Причем поскольку нейронная сеть обучена на физиологических реакциях, формируемых самим опрашиваемым человеком, то ее заключение объективно учитывает индивидуальные особенности организма именно этого человека.
В ходе работ по созданию индивидуально настраиваемого алгоритма была выполнена оптимизация нейронной сети. В качестве критерия оптимальности использовалось условие минимума среднеквадратичной ошибки тестирования ет . Минимизация функции ет осуществлялась путем варьирования количества скрытых слоев, количества нейронов в скрытых слоях, типов активационных функций нейронов. Примеры кривых, позволяющих выбрать оптимальное количество нейронов скрытого слоя, приведены на рисунке 3. Результатом оптимизации явилась слоистая нейронная сеть с девятью нейронами входного слоя, одним нейроном выходного слоя и с одним скрытым слоем, включающем пять сигмоидных нейронов.
Приведенный способ создания нейросетевого алгоритма оценки полиграмм, который был назван индивидуально настраиваемым, обладает серьезным недостатком, состоящим в высокой трудоемкости, а именно: необходимо настраивать нейросеть на каждого опрашиваемого респондента, что занимает от 12 до 20 часов. Причина высокой трудоемкости заключается в том, что для каждого обследуемого человека приходится заново формировать множество обучающих примеров (порядка 20-30 вопросов), а затем обучать нейронную сеть на каждом таком множестве. После этого нейронная сеть пригодна для тестирования только одного человека, на которого она была
настроена.
е,% 80 —
1 2 3 4 Я, 6 7 8 9 10 N Рисунок 3 - Пример кривых зависимости ошибки обучения е1 и ошибки обобщения (тестирования) ег от количества нейронов скрытых слоев пер-
септроиа
Обучающее множество для индивидуально настраиваемого алгоритма состояло из девятисот примеров (по тридцать обучающих примеров для каждого респондента) и трехсот тестирующих примеров (по одному на каждого респондента). Среднее значение погрешности, полученное в результате тестирования индивидуально настраиваемого алгоритма, составило 3,37%.
Таким образом, предлагаемый способ оценки полиграмм, с одной стороны, позволяет проводить обследование с учетом индивидуальных особенностей организма респондента, что снижает погрешность с 30% (такую погрешность имеет система экспертной оценки штатного полиграфного аппарата ЭПОС-7, применяемого в МВД России) до 3,37%, а с другой - требует значительного времени полиграфного обследования: 12-20 часов на каждого респондента. Поэтому такой алгоритм можно рекомендовать только для особо ответственных случаев, когда затраты на длительное обучение нейронной сети оправданны.
С целью уменьшения времени полшрафного обследования предлагается другой способ построения нейросетевого алгоритма оценки полиграмм, названный универсальным. В отличие от индивидуально настраиваемого алгоритма, множество обучающих примеров формируется не на конкретном опрашиваемом человеке, а предварительно - на большом количестве различных людей. Таким образом, нейронная сеть настраивается на некоторого «среднего» респондента и перестает учитывать индивидуалвные особенности отдельных респондентов. Зато она становится пригодной для тестирования любого респондента без каких-либо дополнительных обучений, за счет чего достигается эффект снижения времени полиграфного обследования респондента.
В проведенных экспериментах использовались достоверные данные,
полученные экспертом-полиграфологом, причем половина из них с заключением «Правда» и половина - «Ложь». Всего было представлено 300 вопросов-ответов, составляющих множество примеров предметной области. Согласно сложившейся практике обучения и тестирования нейронных сетей множество примероз предметной области разбивалось на обучающее и тестирующее, причем объем тестирующего множества составлял примерно 10% от обучающего. Сеть подвергалась многократному обучению и тестированию по методике multifold cross-validation (многократной перекрестной проверки).
При разработке универсального алгоритма использовалась нейронная сеть структуры, аналогичной той, которая была использована для индивидуально настраиваемого алгоритма, а именно: слоистая нейронная сеть с девятью нейронами входного слоя, одним выходным нейроном и с одним скрытым слоем, включающим девять сигмоидных нейронов. Как и ранее, сеть была оптимизирована по методике, описанной выше, т.е. из условия обеспечения минимального значения ошибки тестирования гт .
Среднее значение погрешности, полученное в результате тестирования универсального алгоритма, составило 19,8%, при этом время полиграфного обследования сократилось до 40 минут на одного респондента.
Зафиксировашюе в экспериментах повышение погрешности (по сравнению с погрешностью индивидуально настраиваемого алгоритма) объясняется тем, что эта нейронная сеть, предварительно обученная на большом количестве различных людей, получилась ориентир ованной на некоторого «среднего» человека и, естественно, перестала учитывать индивидуальные особенности конкретного респондента. Использование нейронной сети стало менее трудоемким, но это привело к существенному снижению надежности заключений. Поэтому универсальный алгоритм оценки полиграмм можно рекомендовать в тех случаях, когда требуется быстро обследовать большое количество людей, например, выполнить скрининговое тестирование сотрудников крупной фирмы, пассажиров авиалайнера и т.п.
Выше были описаны и проанализированы два нейросетевых алгоритма оценки полиграмм, предназначенные для использования в полиграфных аппаратах: первый (индивидуально настраиваемый) учитывает индивидуальные особенности организма опрашиваемого человека, за счет чего обладает высокой надежностью заключений, но требует больших трудозатрат в применении; второй (универсальный) не учитывает индивидуальные особенности организма опрашиваемого человека и поэтому не обладает высокой надежностью заключений, но и не требует больших трудозатрат при применении. Перед диссертантом встала задача создания алгоритма, обладающего достоинствами двух предыдущих алгоритмов, т.е. учитывающего индивидуальные особенности организма опрашиваемого человека и не требующего больших трудозатрат при применении.
Эта задача была решена следующим образом. В схему нейронной сети, применяемой для индивидуально настраиваемого алгоритма, были добав-
лены дополнительные входные нейроны. Эти нейроны предназначены для ввода дополнительных параметров респондента, получаемых с предварительно заполненной анкеты, включающей следующие сведения: 1. Пол. 2. Возраст, легг. 3. Знак зодиака. 4. Телосложение (полное, среднее, худощавое). 5. Вид работы (интеллектуальный, физический, смешанный). 6. Рост, м. 7. Вес, кг. 8. Занимался ли человек профессионально спортом. 9. Судимость (не судим, судим, судим неоднократно). 10. Тревожность (высокая, обычная, слабая). 11. Курение (регулярное, редкое, не курит). 12. Тип характера (экстраверт, интроверт). 13. Употребление алкоголя (регулярное, умеренное, редкое, не употребляет). 14. Употребление наркотиков (регулярное, редкое, не употребляет). 15. Состоит (состоял ли) на учёте у психиатра. 16. Состоит (состоял ли) на уч&ге у невролога. 17. Состоит (состоял ли) на учёте у нарколога. 18. Наличие беременности. 19. Наличие хронических заболеваний организма. 20. Наличие хронических заболеваний сердечно-сосудистой системы. 21. Наличие хронических заболеваний системы дыхания. 22. Наличие физического или психического истощения. 23. Наличие травм головы. 24. Наличие травм позвоночника. 25. Было ли обморожение кистей рук.
Такие параметры были первоначально приняты в результате консультаций с авторитетным специалисгом-полиграфологом полковником МВД А.М. Петровым. Наша же задача состояла в том, чтобы выявить, какие из этих параметров действительно влияют на точность заключений нейронной сети. Нейронная сеть тоже обучалась на большом количестве различных людей (150 человек), с которых во время опросов снимались не только физиологические параметры, но и приведенные выше анкетные данные, характеризующие индивидуальные особенности их организма.
Первоначально были взяты все 34 входных параметра (9 физиологических параметров, снимаемых с помощью штатных датчиков полиграфного аппарата системы ЭПОС-7, и 25 анкетных данных), но результаты получались хуже на 15-20%, чем те, которые были получены с помощью универсального полиграфного аппарата. Кроме того, на заполнение анкет уходило некоторое время.
Поэтому было принято решение выявить и исключить из анкетных данных наименее значимые параметры, причем выявление наименее значимых параметров производилось путем исследования нейросетепой модели согласно следующему алгоритму:
1. Поочередное введение параметров. Для этого был проведен ряд экспериментов с обучением и тестированием нейронной сети, в каждом из которых использовались девять физиологических параметров, снимаемых с датчиков, и поочередно - один из анкетных параметров. Эксперименты повторялись по три раза (увеличение числа повторов до пяти и десяти раз приводило к изменению погрешности не более чем на 0,1%). В результате получили гистограмму распределения погрешности тестирования полиграфного
аппарата в зависимости от номера используемого анкетного параметра (рисунок 4).
2. Из векторов множества обучающих примеров были исключены те анкетные параметры, для которых погрешность тестирования нейросети согласно гистограмме (рисунок 4) оказалась больше пороговой погрешности ех = 20% (ниже показано, что это и есть оптимальное значение, обеспечивающее максимальный эффект). В итоге остались следующие анкетные параметры: 1. Пол. 2. Возраст, лег. 3. Вид работы (интеллектуальный, физический, смешанный). 4. Рост, м 5. Вес, кг. 6. Тип характера (экстраверт, интроверт). 7. Употребление алкоголя (регулярное, умеренное, редкое, не употребляет).
Было вновь проведено создание нейронной сети с использованием оставшихся параметров. Результирующая нейросеть содержала шестнадцать нейронов входного слоя, а именно: девять нейронов для ввода параметров, получаемых с датчиков полиграфного аппарата, и семь нейронов для ввода параметров, получаемых из анкеты. Как и ранее, сеть была оптимизирована по методике, описанной выше, т.е. из условия обеспечения минимального значения ошибки тестирования ег . Результатом оптимизации явилась слоистая нейронная сеть с одним скрытым слоем из пяти сигмоидных нейронов.
I 3S
1 2 3 4 5 6 7 8 0 10 11 12 13 i*} 15 26 17 1S 19 20 21 22 23 24 25 № эксперимента
Рисунок 4 - Погрешность тестирования нейросети при поочередном использовании анкетных параметров. ех - пороговое значение погрешности
Всего было представлено триста вопросов-ответов, составляющих множество примеров предметной области. Нейронная сеть подвергалась тестированию по методике, аналогичной той, которая была использована для предыдущего алгоритма. Среднее значение погрешности для этого алгоритма
составило 9,6%.
Таким образом, можно сделать вывод, что использование отобранных в результате экспериментирования анкетных данных привело к понижению погрешности предлагаемого здесь алгоритма по сравнению с рассмотренным ранее универсальным алгоритмом в среднем на 10,2%. Этот последний алгоритм был назван универсально-анкетным алгоритмом.
Как указывалось выше, данный результат был получен при исключении тех анкетных параметров, для которых погрешность тестирования ней-росега согласно гистограмме (рисунок 4) оказалась больше пороговой б5 = 20%. Попытки исключения других наборов параметров, соответствующих другим значениям погрешности е5 в интерзале от 14 до 30% с шагом 1% на гистограмме (рисунок 4), не привели к уменьшению итоговой погрешности универсально-анкетного алгоритма. Таким образом, можно считать, что исключение избыточных анкетных параметров универсально-анкетного алгоритма было выполнено оптимальным образом, т.е. решена оптимизационная задача: найден минимум целевой функции ег при варьировании cs .
Можно констатировать, что предлагаемый в диссертационной работе универсально-анкетный алгоритм сочетает в себе достоинства двух предыдущих алгоритмов (индивидуально настраиваемого и универсального), учитывает индивидуальные особенности организма респондента и его применение не требует больших затрат времени. Налицо проявление синергетическо-го эффекта.
Заметим еще раз, что идея и попытки создания детектора лжи с использованием нейросетевых технологий упоминаются в ряде иностранных источников. При этом имеются в виду индивидуально настраиваемый и универсальный алгоритмы. Идея же универсально-анкетного нейросетевого алгоритма автором диссертационной работы предложена и реализована впервые. Идея этого наиболее эффективного из трех рассмотренных здесь алгоритмов работы нейросетевого детектора лжи была впервые опубликована автором диссертационной работы в 2006 г., причем до сих пор упоминаний о существовании такого алгоритма в научной литературе не обнаружено.
Автором диссертации разработано специальное программное обеспечение - программный пакет «ЗС», предназначенный для анализа информации, поступающей с датчиков полиграфного аппарата ЭПОС-7. Программный пакет «ЗС» представляет собой специализированный нейроимитатор. Как и большинство известных нейроинструментов (NeuroSolutions, NeuralWorks, Neural Network Toolbox Matlab и др.), программный пакет «ЗС» позволяет создавать нейронные сети, выполнять их обучение, тестирование, вычисления и прогнозы. Его отличительной особенностью является ориентация на материально-техническую базу полиграфного аппарата ЭПОС-7 с его штатным программным обеспечением первого и второго уровней. В частности, программный пакет «ЗС» предоставляет возможность конвертации дан-
ных, считанных с датчиков полиграфного аппарата ЭПОС-7 и обработанных его штатным программным обеспечением первого и второго уровней. Дело в том, что данные в полиграфном аппарате ЭПОС-7 хранятся в специальном формате QT1. Кроме того, они не структурированы и хранятся в разных таблицах и файлах среди другой информации. Для упрощения и автоматизации работы с данными полиграфного аппарата ЭПОС-7 разработан модуль-конвертер. Этот модуль автоматически находит и собирает нужные данные, структурирует их и переводит в формат Excel. Окончательный выходной сигнал в программном пакете «ЗС» формируется в результате взаимодействия входных и выходных сигналов искусственных нейронов, соединенных согласно схемам, в зависимости от используемого нейросетевого алгоритма.
Отличительной особенностью программного пакета «ЗС» является также наличие блока, реализующего предложенный автором нейроэксперт-ный алгоритм последовательного обнаружения и исключения посторонних выбросов из статистической информации.
Необходимо отметить, что предпринимавшиеся ранее попытки создания нейросетевых полиграфных аппаратов на базе использования NeuroSolutions, Neural Works, Neural Network Toolbox Matlab без применения программного пакета «ЗС» к успеху не приводили из-за высокой трудоемкости ручной подготовки и обработки данных, получаемых с датчиков полиграфного аппарата, а также из-за большого количества посторонних выбросов в статистических выборках.
В приложении представлены документы, подтверждающие внедрение результатов диссертационной работы.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ
1. Разработан нейроэкспергаый алгоритм последовательного обнаружения и исключения выбросов из статистической информации, отличающийся от известных тем, что в его основе лежит нейронная сеть, спроектированная с использованием формул следствия из теорем Арнольда - Колмогорова - Хехт-Нильсена, а также предложенной в диссертации эмпирической формулы. За счет своей нейросетевой основы, в отличие от существующих алгоритмов, предлагаемый алгоритм применим в тех случаях, когда не выполняется закон нормального распределения статистических данных. Применение алгоритма не только позволяет снизить погрешность нейросетевых моделей, но и расширяет круг задач, для решения которых успешное применение нейросетевых технологий вообще возможно.
2. Разработан алгоритм, позволяющий с помощью нейронной сети выявлять наиболее значимые параметры респондента, оказывающие наибольшее влияние на погрешность заключений полиграфного опроса. В отличие от существующих, предлагаемый алгоритм, за счет своей нейросетевой
основы, нелинеен по своей природе и работает в тех случаях, когда не выполняется закон нормального распределения статистических данных. Применение разработанного алгоритма (в совокупности с другими разработанными алгоритмами) позволило спроектировать нейронные сети, обеспечивающие приемлемую погрешность полиграфных заключений при минимуме временных затрат.
3. Разработан нейросетевой алгоритм оценки полиграмм, названный индивидуально настраиваемым. Его отличие от существующих алгоритмов, традиционно использующих принципы построения экспертных систем, состоит в том, что лежащая в его основе нейронная сеть обучается на ответах опрашиваемого человека, а потому учитывает индивидуальные физиологические особенности именно его организма. В связи с этим применение алгоритма позволило обеспечить погрешность заключений нейросетевого полиграфного аппарата 3,37%, что на 26,63% ниже погрешности заключений применяемого в органах МВД России полиграфного аппарата ЭПОС-7. Однако предлагаемый алгоритм обладает недостатком, состоящим в высокой трудоемкости, а именно - необходимостью настройки нейросети на каждого опрашиваемого респондента, что занимает от 12 до 20 часов.
4. Разработан нейросетевой алгоритм оценки полиграмм, названный универсальным, отличающийся от алгоритма п. 3 тем, что лежащая в его основе нейронная сеть обучается на ответах не одного, а большого количества респондентов (100 человек), в результате чего применение этого алгоритма, в отличие от алгоритма п. 3, не требует предварительного трудоемкого обучения нейросетей на каждом респонденте, в результате чего время полиграфного обследования совращается до 40 минут на одного респондента. Недостаток алгоритма состоит в его сравнительно высокой погрешности, которая составляет 19,8%.
5. Разработан нейросетевой алгоритм оценки полиграмм, названный универсально-анкетным, отличающийся от алгоритмов п. 3 и п. 4 тем, что информация в нейронную сеть подается не только с датчиков, снимающих физиологические параметры респондента, но и с заранее подготовленных анкет, характеризующих особенности организма респондента. Благодаря этому погрешность полиграфных заключений не превышает 9,6%, а время, необходимое для настройки нейронной сети на опрашиваемого респондента, составляет не более 60 минут. Таким образом, данный алгоритм сохраняет достоинства алгоритмов п. 3 и п. 4, устраняя их недостатки.
6. Для каждого из предложенных нейросетевых алгоритмов оценки полиграмм указаны их области применения: универсально-анкетшлй алгоритм рекомендуется для применения в большинстве случаев полиграфного тестирования как альтернатива традиционным алгоритмам оценки полиграмм; индивидуально настраиваемый нейросетевой алгоритм рекомендуется применять в особо ответственных случаях, когда требуется низкая погрешность полиграфных заключений, а время полиграфного опроса значения не
имеет; универсальный алгоритм предназначен для быстрых скрининговых обследований больших масс респондентов, например, при приеме на работу, повышении по службе и др.
7. Все три предложенных нейросетевых алгоритма оценки полиграмм формализованы, в результате чего получены математические формулы. Помимо теоретического полученные математические формулы представляют и практический интерес, например, для построения индивидуальных микродетекторов лжи на базе электронных микросхем. Формулы можно занести в память микросхем, не выполняя более трудоемкого и ресурсоемкого процесса кодирования нейронных сетей. Они также облегчают процесс переноса готовых алгоритмов из одной программной среды в другую.
8. Все разработанные алгоритмы реализованы в виде программного пакета «ЗС», предназначенного для моделирования нейронных сетей. В отличие от других известных нейропакетов, программный пакет «ЗС» адаптирован для взаимодействия с полиграфным аппаратом ЭПОС-7 и предназначен для поддержки принятия решений на основании анализа информации, снимаемой с датчиков этого полиграфного аппарата.
9. Установлено, что применение разработанных в диссертационной работе алгоритмов и программного пакета «ЗС» для интеллектуальной поддержки принятия решений в практике инструментальной детекции лжи повышает точность экспертных заключений, уменьшает роль человеческого фактора, снижает необходимость привлечения опытных специалистов-полиграфологов и позволяет применять полиграфные аппараты пользователям, не имеющим специальной квалификации.
ОСНОВНЫЕ ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ Монография
1. Сичинава, З.И. Нейросетевой детектор лжи: принципы построения и опыт разработки / Л.Н. Ясницкий, З.И. Сичинава, Ф.М. Черепанов. - Saarbrucken (Germany): LAP LAMBERT Academic Publishing GmbH & Co. KG., 2012,-115p.
Публикации в изданиях, рекомендованных ВАК РФ
2. Сичинава, З.И. Сравнительный анализ алгоритмов нейросетевого детектирования лжи / Л.Н. Ясгащкий, А.М. Петров, З.И. Сичинава // Известия высших учебных заведений. Поволжский регион. Технические науки. -2010. -№1(13).-С. 64-72.
3. Сичинава, З.И. Технологии построения детектора лжи на основе аппарата искусственных нейронных сетей / Л.Н Ясницкий, А.М. Петров, З.И. Сичинава // Информационные технологии. - 2010. - № 11. - С. 66-70.
4. Сичинава, З.И. Нейросетевые алгоритмы анализа поведения респондентов ! Л.Н. Ясницкий, З.И. Сичинава // Нейрокомпьютеры: разработка, применение.-2011.-№ 10.-С. 59-64.
5. Сичинава, З.И. Нейроэкспертный алгори™ последовательного обнаружения и исключения посторонних выбросов из статистической информации при построении нейросетевых математических моделей / З.И. Сичинава // Современные проблемы науки и образования. - 2013. - № 2; ШЬ : http://www.science-education.ru/108-8903 (дата обращения: 19.04.2013).
Публикации в других изданиях
6. Сичинава, З.И. Интеллектуальный полиграф / А.Н. Зибатова, АМ. Петров, З.И. Сичинава, А.П. Сошников, Л.Н. Ясницкий И Российский полиграф. - 2006. - № 1. - С. 76-83.
7. Сичинава, З.И. Нейросетевой детектор лжи / А.Н. Зибатова, З.И. Сичинава // Искусственный интеллект: философия, методология, инновации: материалы Первой Всероссийской конференции студентов, аспирантов и молодых ученых. - М.: Интел, 2006. - С. 351-353.
8. Сичинава, З.И. Этапы создания интеллектуального детектора лжи / А.Н. Зибатова, А.М. Петров, З.И. Сичинава, Л.Н. Ясницкий // Актуальные проблемы математики, механики, информатики: материалы Международной научно-методической конференции, посвященной 90-летию высшего математического образования на Урале. - Пермь: Изд-во Ш У, 2006. - С. 125-126.
9. Сичинава, З.И. Нейросетевой детектор лжи / З.И. Сичинава, Л.Н Ясницкий // Перспективные технологии искусственного интеллекта: материалы Международной научно-практической конференции «Перспективные технологии искусственного интеллекта». - Пенза: Изд-во Пенз. ун-та, 2008. С. 81-84.
10. Сичинава, З.И. Анкетный способ построения нейросетевого детектора лжи / З.И. Сичинава, Л.Н. Ясницкий // Искусственный интеллект: философия, методология, инновации: материалы Ш Всероссийской конференции студентов, аспирантов и молодых ученых. - М.: Связь-Принт, 2009. -С. 318-320.
И. Сичинава, З.И. Алгоритмы анализа поведения респондентов на основе обработки информации с использованием нейросетевых технологий / З.И Сичинава // Интеллектуальные технологии в образовании, экономике и управлении: сборник материалов VII Международной научно-практической конференции. - Воронеж: Наука-Юнипресс, 2010. - С. 299-302.
12. Сичинава, З.И. Анкетный способ построения нейросетевого детектора лжи / З.И. Сичинава, Л.Н. Ясницкий // Современные проблемы математики и ее прикладные аспекты: материалы Всероссийской научно-практической конференции. - Пермь: Изд-во 111 У, 2010. - С. 58.
13. Сичинава, З.И. Искусственный интеллект против коррупции / З.И. Сичинава, С.Л. Ясницкий, Л.Н. Ясницкий // Актуальные проблемы механики, математики, информатики: тезисы докладов Всероссийской научно-практической конференции. - Пермь: Изд-во ЛГУ, 2010. - С. 203.
14. Сичинава, З.И. Анкетный способ построения нейросетевого детектора лжи / А.М. Петров, З.И. Сичинава, Л.Н. Ясницкий // Вестник Пермского университета. Математика. Механика. Информатика. - 2010. - Вып. 1. -С. 84-87.
15. Сичинава, З.И. К вопросу о создании алгоритма принятия решений полиграфным аппаратом, предназначенным для борьбы с коррупцией /
3 И. Сичинава // Вестник Пермского университета. Математика. Механика. Информатика. -2011.-Вып. 2.-С. 108-110.
16. Сичинава, З.И. Варианты построения нейросетевого детектора лжи / Л.Н. Ясницкий, З.И. Сичинава // Нейрокомпьютеры и их применение: тезисы докладов X Всероссийской научной конференции. - М: Изд-во МГППУ,2012.-С. 53-55.
Регистрация программного продукта
17. Свидетельство о регистрации электронного ресурса № 17926. Программный продукт, предназначенный для проектирования нейронных сетей «ЗС» / З.И. Сичинава. - Зарегистрировано Объединенным фондом электронных ресурсов «Наука и образование» Института научной и педагогической информации Российской академии образования 20.02.2012.
Научное издание
СИЧИНАВА Зураби Иродиевич
НЕЙРОСЕТЕВЫЕ АЛГОРИТМЫ АНАЛИЗА ПОВЕДЕНИЯ РЕСПОНДЕНТОВ
Специальность: 05.13.01 — Системный анализ, управление и обработка информации (в технике и технологиях)
Редактор М. Г, Коровушкина Технический редактор В. С. Худяков Компьютерная верстка В. С. Худяков
Подписано в печать 06.03.2014. Формат 60x84^16. Усл. печ. л. 1,16. № заказа: 102. Тираж 100.
Полиграфический салон «Форвард-С» 614066, Пермь, Стахановская, 54 лит М. Тел./факс: (342) 205-54-41, (342) 205-54-42; e-mail: forward-s2011@yandex.ru
Текст работы Сичинава, Зураби Иродиевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
Федеральное государственное бюджетное образовательное учреждение
высшего профессионального образования «Пермский государственный гуманитарно-педагогический университет»
На правах рукописи
04201457384
Сичинава Зураби Иродиевич
НЕЙРОСЕТЕВЫЕ АЛГОРИТМЫ АНАЛИЗА ПОВЕДЕНИЯ РЕСПОНДЕНТОВ
Специальность 05.13.01 - Системный анализ, управление и обработка информации (в технике и технологиях)
Диссертация
на соискание ученой степени кандидата технических наук
Научный руководитель: доктор технических наук, профессор Леонид Нахимович Ясницкий
Пенза 2014
Оглавление
ВВЕДЕНИЕ.............................................................................................................................4
ГЛАВА 1. АЛГОРИТМЫ РАБОТЫ ПОЛИГРАФА: КРАТКАЯ ИСТОРИЯ, ОПИСАНИЕ, ИСПОЛЬЗОВАНИЕ, ПРОБЛЕМЫ И ВОЗМОЖНЫЕ ПУТИ ИХ РЕШЕНИЯ...........................................................................................................................12
1.1 Определение и история возникновения полиграфа............................12
1.1.1 Термины и определения......................................................................12
1.1.2 Прототипы полиграфа и его алгоритмов...........................................14
1.2 Современные полиграфы и практика их применения.........................16
1.2.1 Виды и принцип действия полиграфов..............................................16
1.2.2 Классическая схема работы с полиграфом........................................18
1.2.3 Выводы: мнение диссертанта.............................................................19
1.3 Существующие алгоритмы экспертной оценки полиграмм и их анализ.............................................................................................................20
1.4 Проблемы и предлагаемое направление их решения..........................24
1.5 ВЫВОДЫ...................................................................................................28
ГЛАВА 2. МАТЕРИАЛЬНО-ТЕХНИЧЕСКАЯ, МЕТОДОЛОГИЧЕСКАЯ И ПРОГРАММНО-ИНСТРУМЕНТАЛЬНАЯ БАЗА ДЛЯ СОЗДАНИЯ НЕЙРОСЕТЕВЫХ АЛГОРИТМОВ АНАЛИЗА ПОВЕДЕНИЯ РЕСПОНДЕНТОВ
................................................................................................................................................29
2.1 Полиграфный аппарат ЭПОС-7 как материально-техническая база
для создания нейросетевой системы оценки полиграмм.......................29
2.1.1 Технические возможности полиграфного аппарата ЭПОС-7...........29
2.1.2 Возможности программного обеспечения системы ЭПОС-7...........31
2.1.3 Заключительные замечания................................................................36
2.2 Нейросетевые технологии как методологическая база для создания автоматизированной системы оценки полиграмм..................................37
2.2.1 Свойства нейронных сетей, обеспечивающие объективность и эффективность разрабатываемых алгоритмов оценки полиграмм ..............37
2.2.2 Теорема существования......................................................................39
2.2.3 Проектирование персептронов...........................................................41
2.2.4 Алгоритм применения метода нейросетевого математического мо-
делирования..................................................................................................44
2.3 Нейроэкспертный алгоритм последовательного обнаружения и
исключения выбросов из статистических выборок.................................53
2.4 Структура исследуемой в работе системы..........................................58
2.5 ВЫВОДЫ...................................................................................................60
ГЛАВА 3. РАЗРАБОТКА НЕЙРОСЕТЕВЫХ АЛГОРИТМОВ
АНАЛИЗА ПОВЕДЕНИЯ РЕСПОНДЕНТОВ.............................................................61
3.1 Постановка задачи.................................................................................61
3.2 Индивидуально настраиваемый нейросетевой алгоритм.................61
3.2.1 Постановка задачи...............................................................................61
3.2.2 Проектирование сети .........................................................................63
3.2.3 Обучение и тестирование сети...........................................................64
3.2.4 Формула, реализующая алгоритм работы нейросети ......................68
3.3 Универсальный нейросетевой алгоритм.............................................69
3.3.1 Постановка задачи..............................................................................69
3.3.2 Проектирование сети .........................................................................71
3.3.3 Обучение и тестирование сети...........................................................71
3.3.4 Формула, реализующая алгоритм работы нейросети ......................75
3.4 Универсально-анкетный нейросетевой алгоритм..............................77
3.4.1 Постановка задачи..............................................................................77
3.4.2 Проектирование сети .........................................................................82
3.4.3 Обучение и тестирование сети...........................................................85
3.4.4 Формула, реализующая алгоритм работы нейросети ......................89
3.5 Программный инструментарий построения нейронных сетей для полиграфных аппаратов..............................................................................91
3.5.1 Основные возможности и особенности программы «ЗС»................91
3.5.2 Порядок работы с программой «ЗС»..................................................93
3.6 ВЫВОДЫ...................................................................................................96
ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИОННОЙ РАБОТЫ...................99
СПИСОК ЛИТЕРАТУРЫ................................................................................102
ПРИЛОЖЕНИЕ...............................................................................................113
ВВЕДЕНИЕ
Актуальность темы исследования
Психофизиологические исследования с использованием полиграфа в правоохранительных органах, а также в ряде других организаций, проводятся в России с 1976 года, в мире - с 1950-х гг. Однако постоянно возникает вопрос об адекватной оценке полученных в ходе данных исследований результатов. Существующие полиграфные аппараты не отличаются высокой точностью. Так, система экспертной оценки (диагностики) полиграмм широко применяемого в органах МВД России полиграфного аппарата ЭПОС-7 имеет погрешность 30%, вследствие чего в судебно-следственной практике случаются ошибки.
Создание и применение надежных полиграфных аппаратов является актуальным также и в связи с проблемами предотвращения терроризма, борьбы с коррупцией, раскрытия экономических, политических и другого рода преступлений.
По мнению известных полиграфологов A.M. Петрова, А.П. Сошникова, A.B. Четина и др. причины ненадежности современных полиграфных аппаратов состоят в том что:
1. Большинство полиграфных аппаратов работают по жестко детерминированным алгоритмам и поэтому не учитывают индивидуальные физиологические особенности опрашиваемого человека (респондента);
2. Многие полиграфные аппараты требуют трудоемкой настройки на респондентов, что осложняет их практическое применение;
3. При работе на полиграфных аппаратах специалисты-полиграфологи обычно не доверяют результатам работы существующих алгоритмов оценки полиграмм, привлекая различные психологические методики, свой собственный опыт и интуицию. Поэтому результат полиграфного опроса во многом зависит от квалификации и моральных качеств полиграфолога, т.е. от так называемого «человеческого фактора».
Актуальность диссертационной работы заключается в создании алгоритмов оценки полиграмм, направленных на устранение указанных недостатков.
Цель исследования
Целью исследования является разработка нейросетевых алгоритмов системного анализа информации, получаемой в результате опроса на полиграфном аппарате, обеспечивающих минимальную погрешность заключений при минимальном времени полиграфного опроса.
Для достижения этой цели необходимо было решить следующие задачи:
1. Разработать алгоритм конвертации данных, считываемых с датчиков традиционного полиграфного аппарата, в формат, используемый при проектировании нейронных сетей.
2. Разработать алгоритм обнаружения и исключения выбросов из статистической информации, снимаемой с датчиков полиграфного аппарата.
3. С целью снижения трудоемкости применения нейросетевых полиграфных аппаратов разработать алгоритм выявления и исключения параметров, не оказывающих существенного влияние на степень достоверности заключений.
4. Разработать нейросетевые алгоритмы оценки полиграмм и исследовать их эффективность для решения конкретных классов задач.
5. Реализовать все разработанные алгоритмы в виде программного пакета, предназначенного для моделирования нейронных сетей, системного анализа информации и поддержки принятия решений в задачах инструментальной детекции лжи.
Объектом исследования является система данных, получаемых при экспертном опросе респондентов, поступающих с датчиков полиграфного аппарата и анкет.
Предметом исследования являются методы и алгоритмы системного анализа и обработки информации, снимаемой с респондента, предназначенные для поддержки принятия решений об истинности или ложности его ответа.
Методы исследования
Для решения поставленных задач использовались методы системного анализа, в частности — нейросетевые методы, методы математической статистики, теории эксперимента, а также методы графического представления и обработки результатов вычислительных экспериментов.
Соответствие паспорту специальности
Результаты исследования соответствуют пунктам 4, 5, 13 паспорта научной специальности 05.13.01.
Научная новизна работы заключается в следующем.
1. Разработан нейроэкспертный алгоритм последовательного обнаружения и исключения выбросов из статистической информации, отличающийся от известных своей нейросетевой базой, а потому применимый в тех случаях, когда не выполняется закон нормального распределения статистических данных. Применение алгоритма позволяет не только повысить точность нейросетевых моделей, но и расширяет круг задач, для которых успешное применение нейросетевых технологий вообще возможно.
2. Разработан нейросетевой алгоритм оценки полиграмм, названный индивидуально настраиваемым. Его принципиальное отличие от традиционных алгоритмов оценки полиграмм состоит в том, что в его основе лежит нейронная сеть, обучаемая непосредственно на опрашиваемом респонденте, что позволяет учитывать индивидуальные особенности именно его организма, в результате чего обеспечивается низкая погрешность полиграфных заключений.
3. Разработан нейросетевой алгоритм оценки полиграмм, названный универсальным. Его отличие от предыдущего алгоритма состоит в том, что обучение нейронной сети осуществляется предварительно на примерах, сформированных на множестве различных респондентов, и потому при опросе конкретного респондента не требуется дополнительных настроек, за счет чего сокращается время полиграфного опроса, однако при этом увеличивается погрешность полиграфных заключений.
4. Разработан нейросетевой алгоритм оценки полиграмм, названный универсально-анкетным. Отличие универсально-анкетного алгоритма от предыдущих состоит в том, что информация в нейронную сеть подается не только с датчиков, снимающих физиологические параметры респондента, но и с заранее подготовленных анкет, характеризующих особенности его организма. Данная модификация нейросетевого алгоритма позволила получить синергетический эффект: существенно сократить время полиграфного обследования при незначительном увеличении погрешности заключений полиграфного аппарата. В связи с этим данный алгоритм рекомендуется для применения в большинстве случаев полиграфного тестирования как альтернатива традиционным алгоритмам, тогда как предыдущие два нейросетевых алгоритма рекомендуется для применения в крайних случаях: универсальный алгоритм — для быстрых скрининговых обследований больших масс респондентов, а индивидуально настраиваемый - в особо ответственных случаях, когда требуется низкая погрешность полиграфных заключений, а время полиграфного опроса значения не имеет.
Практическая значимость состоит в создании программного пакета, используемого для интеллектуальной поддержки принятия решений, который позволяет повысить точность экспертных заключений, уменьшает роль человеческого фактора, снижает необходимость привлечения опытных специалистов-полиграфологов и позволяет применять полиграфные аппараты пользователям, не имеющим специальной квалификации.
На защиту выносятся:
1. Нейроэкспертный алгоритм последовательного обнаружения и исключения посторонних выбросов из статистической информации при проектировании нейронных сетей.
2. Индивидуально настраиваемый нейросетевой алгоритм оценки полиграмм.
3. Универсальный нейросетевой алгоритм оценки полиграмм.
4. Универсально-анкетный нейросетевой алгоритм оценки полиграмм.
5. Программная реализация всех алгоритмов - программный пакет, предназначенный для моделирования нейронных сетей, системного анализа информации и поддержки принятия решений в задачах инструментальной детекции лжи.
Реализация результатов работы
Результаты диссертационной работы использованы известной фирмой-разработчиком полиграфных аппаратов - Центром прикладной психофизиологии (г.Москва) в процессе совершенствования методик психофизиологических опросов, в частности, выявлении значимых физиологических параметров, оказывающих влияние на точность и качество заключений при использовании полиграфов.
Кроме того, основные результаты и положения диссертационной работы внедрены в учебном процессе Пермского государственного национального исследовательского университета и Пермского государственного гуманитарно-педагогического университета.
Получено свидетельство о регистрации электронного ресурса «Программный продукт, предназначенный для проектирования нейронных сетей "ЗС"», выданное Сичинава З.И. Объединенным Фондом электронных ресурсов «Наука и образование» Института научной и педагогической информации Российской Академии Образования, зарегистрированное под №17926 20.02.2012.
Достоверность научных положений, выводов и практических результатов, сформулированных в диссертации, обеспечивается корректным использованием теории нейронных сетей, регистрацией разработанного программного пакета, а также подтверждается результатами тестирования нейронных сетей на реальных данных - результатах полиграфных опросов заключенных следственных изоляторов Пермского края.
Апробация работы
Основные положения и результаты диссертационной работы докладывались и обсуждались на российских и международных научно-технических конференциях:
- Международной научно-методической конференции, посвященной 90-летию высшего математического образования на Урале (г.Пермь 2006 г.) «Актуальные проблемы математики, механики, информатики»;
- Первой Всероссийская конференции студентов, аспирантов и молодых ученых (г. Москва 6-8 апреля 2006 г.) «Искусственный интеллект: философия, методология, инновации»;
- Международной научно-практической конференция (г. Пенза, Пензенский ун-т, Научный Совет РАН по методологии искусственного интеллекта, 1-6 июля 2008 г.) «Перспективные технологии искусственного интеллекта»;
- Третьей Всероссийской конференции студентов, аспирантов и молодых ученых, (г. Москва 11-13 ноября 2009 г.) «Искусственный интеллект: философия, методология, инновации»;
-Всероссийской научно-практической конференции (г. Пермь 12 марта 2010 г.) «Современные проблемы математики и ее прикладные аспекты»;
-Всероссийской научно-практической конференции (г. Пермь, 12-15 октября 2010г.) «Актуальные проблемы механики, математики, информатики»;
-Всероссийской научно-практическая конференция с международным участием "Актуальные проблемы механики, математики, информатики", по-
священная 50-летнему юбилею механико-математического факультета ПГУ (г. Пермь 2010г.);
- Международной научно-практической конференции (г. Воронеж 2010г.) «Интеллектуальные технологии в образовании, экономике и управлении».
Публикации
По теме диссертации опубликовано 17 работ, из них 4 статьи в журналах, входящих в перечень ВАК РФ, одна монография. Зарегистрирован электронный ресурс в объединенном фонде электронных ресурсов «Наука и образование» Института научной и педагогической информации Российской Академии Образования.
Все результаты, составляющие основное содержание диссертации, и выносимые на защиту положения получены и сформулированы диссертантом самостоятельно. Работы [14, 16, 33, 39-42, 46, 67-70] опубликованы в соавторстве с научным руководителем, которому принадлежат постановка задачи и разработка концепций решения проблем. Работы [14, 16, 33, 67-68] опубликованы в соавторстве с главным полиграфологом Пермского края, полковником МВД A.M. Петровым, и с заместителем директора Центра прикладной психофизиологии (г.Москва) А.П. Сошниковым, у которых автор получал многочисленные консультации по полиграфному делу, полиграммы с результатами полиграфных обследований реальных заключенных, а также результаты следственных и судебных решений, необходимых для обучения и тестирования нейронных сетей. Монография [46] опубликована совместно с аспирантом Ф.М. Черепановым, с помощью компьютерной программы которого была произведена вербализация обученных нейронных сетей и получены математические формулы, облегчающие процесс переноса готовых алгоритмов из одной программной среды в другую. Работы [14-16, 42] опубликованы совместно с аспирантами А.Н. Зибатовой и C.J1. Ясницким, выполнявшими работы по сбору статистической информации и ее первоначальной обработ-
ке.
Программный пакет «ЗС» [37], реал
-
Похожие работы
- Разработка комбинированного нейросетевого способа, моделей и средств для оперативного управления сложными техническими системами
- Разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами
- Разработка методов математического моделирования на основе нормализованных радиально-базисных сетей
- Нейросетевые модели эволюции физико-механических свойств конструкционных материалов ядерных реакторов
- Синтез нейросетевых систем управления манипуляционными роботами на основе обратных динамических моделей
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность