автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Поддержка принятия решений при построении психологического портрета личности на основе нейросетевого распознавания почерка
Автореферат диссертации по теме "Поддержка принятия решений при построении психологического портрета личности на основе нейросетевого распознавания почерка"
На правах рукописи
<¿9 V
Юрьева Наталия Евгеньевна
ПОДДЕРЖКА ПРИШГГИЯ РЕШЕНИЙ ПРИ ПОСТРОЕНИИ ПСИХОЛОГИЧЕСКОГО ПОРТРЕТА ЛИЧНОСТИ НА ОСНОВЕ НЕЙРОСЕТЕВОГО РАСПОЗНАВАНИЯ ПОЧЕРКА
05.13.01 - системный анализ, управление и обработка информации (в науке и промышленности)
Автореферат диссертации на соискание ученой степени кандидата технических наук
11 НОЯ ¿013
Москва —2013
005538383
005538383
Работа выполнена на кафедре «Прикладной информатики и мультимедийных технологий» Государственного бюджетного образовательного учреждения высшего профессионального образования «Московский городской психолого-педагогический университет» (ГБОУ ВПО МГППУ).
Научный руководитель: доктор технических наук, старший научный
сотрудник Кулик Сергей Дмитриевич.
Официальные оппоненты: Яхно Владимир Григорьевич
доктор физико-математических наук, заведующий лабораторией №363, Федерального государственного бюджетного учреждения науки Института прикладной физики Российской академии наук (ИГТФ РАН).
Степанян Иван Викторович
кандидат технических наук, доктор биологических наук, старший научный сотрудник лаборатории исследований биомеханических систем, Федерального государственного бюджетного учреждения науки Института машиноведения им. A.A. Благонравова Российской академии наук (ИМАШ РАН).
Ведущая организация: Федеральное государственное казенное образо-
вательное учреждение высшего профессионального образования «Академия управления Министерства внутренних дел Российской Федерации», Москва.
Защита диссертации состоится «5» декабря 2013г. в 13 час. 00 мин. в ауд. 1258 на заседании диссертационного совета Д212.165.05 при Нижегородском государственном техническом университете им. P.E. Алексеева по адресу: 603950, г. Нижний Новгород, ул. Минина, 24.
С диссертацией можно ознакомиться в библиотеке Нижегородского государственного технического университета им. P.E. Алексеева.
Автореферат разослан «Л9 » СКДААл&МуЛ 2013г.
Ученый секретарь диссертационного совета
Суркова A.C.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы
Для поддержки принятия решений на основе эффективного нейросетевого распознавания почерка практически отсутствуют методы и средства, основанные на системном анализе параметров (характеристик человека) и объективно наблюдаемых переменных, представленных признаками его рукописного почерка.
Важными компонентами информационной технологии являются: методы и программно-технические средства обеспечивающие обработку, создание, хранение, поиск и распространение информации. Данная диссертация посвящена исследованию и разработке (с помощью средств системного анализа) методов, алгоритмов и средств информационной технологии для классификации (распознавания заданных классов) испытуемых по признакам почерка.
Доля подобных исследований в данном направлении мала, в то же время есть значительная заинтересованность специалистов МВД России, кадровых агентств, медицинских и школьных учреждений в нахождении (установлении) связи между заданными характеристиками (параметрами) человека и его признаками почерка. В связи с этим, возникает необходимость в разработке новых средств (алгоритмов, методов, методик и программных комплексов), которые позволят только по признакам почерка человека принять решение о его параметрах. Возможные сферы применения, в которых анализ почерка может оказаться эффективнее обычных тестов — определение состояния, например, операторов сложных механизмов, водителей, больных и т.п. На практике применение тестов требует значительных затрат и их можно научиться обманывать, а признаки почерка объективно проявляются в рукописи.
Многообразие и разнородность параметров (признаков), отображающихся в рукописном тексте и характеризующих личность, требует использования средств системного анализа, математических, вероятностных и статистических методов исследования, а, в дальнейшем, создания автоматизированных средств, для решения поставленной задачи.
Различные проблемы исследования рукописного письма (почерка), в том числе с учетом анализа личности, рассматривали следующие специалисты: Орлова В.Ф., Жижина М.В., Черенков A.M., Бородин А.П., Российская Е.Р., Серегин В.В., Рубцова И.И., Сысоева Л.А., Погибко Ю.Н., Сидельникова JI.B., Герасимов А.Н, Кирсанов З.И., Рогозин А.П., Кулагин П.Г., Колонутова А.И., Кошманов П.М., Кошманов М.П., Седова Е.Л., Стречень H.A., Федорович В.Ю., Гусакова С.М., Комаров A.C., Устинов В.В., Шкоропат Е.А., Левицкий А.Б., Кулик С.Д., Никонец Д.А., Алесковский С. Ю., Комиссарова Я.В., Осекова О.В., Яковлева Е.В., Симакова Е.С., Ефремов В. А., Попова O.A. и др.
Средства системного анализа, методы принятия решений, исследования операций и нейронных сети рассматривали многие специалисты, и в частности следующие: Черно-руцкий И.Г., Орлов А.И., Taxa X., Галушкин А.И., Хайкин С., Горбань А.Н., Россиев Д.А., Тархов Д.А., Рутковская Д., Осовский С., Круглов В.В. и др.
Необходимые сведения из работ этих ученых послужили теоретической и методологической основой данной диссертации.
Диссертационная работа направлена на замену долгого и трудозатратного психологического тестирования более быстрым, удобным и простым анализом почерка. То есть по признакам рукописного почерка эффективно оценивать наличие той или иной эталонной (психологической) характеристики у испытуемого. Для этого необходимо разработать способ анализа почерка, правила принятия решений, оценить эффективность правила принятия решений, разработать архитектуру системы поддержки принятия решений и, далее, автоматизировать процесс анализа почерка, т.е. разработать и реализовать программное
обеспечение.
Цель исследования
Разработка средств (процедур) поддержки принятия решений при построении психологического портрета личности на основе нейросетевого распознавания почерка для повышения качества и эффективности обработки информации и достоверности принимаемых решений специалистами различных структур.
Объект исследования — массивы данных (о рукописном почерке для выявления эталонов на примере психологических характеристик).
■ Предмет исследования — методы, алгоритмы и средства их реализации, позволяющие спрогнозировать (оцепить) эталонные характеристики личности по признакам почерка для принятия эффективных решений.
Основные задачи
В соответствии с целью, объектом и предметом исследования были определены следующие задачи:
1. Разработать и исследовать процедуру (способ) оценки информативных признаков для определения заданных характеристик (в частности психологических) на основе заданных признаков почерка.
2. Разработать и исследовать критерий оценки надежности выполненного прогноза.
3. Разработать и проанализировать архитектуру системы поддержки принятия решений при обработке эмпирических данных для определения психологических характеристик.
4. Разработать и экспериментально проверить программный комплекс, реализующий предложенный способ на практике и позволяющий обрабатывать рукописный текст в качестве входной информации, получая 1и выходе психологический портрет личности.
Методы исследования
Для решения поставленных задач был использовал комплекс следующих методов ис-следоваши: методы системного анализа, методы теории вероятностей и математической статистики, методы теории нейронных сетей, методы почерковедения и графологии в криминалистике, методы и средства программирования.
Научная новизна работы
1. Впервые разработан и исследован способ (процедура) оценки информативных признаков для определения заданных характеристик (в частности психологических) на основе признаков почерка, содержащий в качестве своих составляющих статистические методы и самообучающиеся структуры, позволяющий получать вероятностно-подобные оценки принадлежности личности к различным психологическим классам.
2. Разработан и исследован модифицированный нейросетевой алгоритм, основанный на вероятностной нейронной сети, использующий функцию близости, учитывающую значимость каждой из компонент с точки зрения дифференцируемой психологической характеристики, что повышает эффективность его применения в непараметрических задачах.
3. Разработан и исследован вероятностный критерий оценки надежности нейросетевого прогноза, формализующий процедуру отказа от принятия решения и позволяющий при многокритериальном выборе ранжировать множество субъектов внутри заданных классов.
Часть новых результатов защищена патентом №111926 на полезную модель Федеральной службы по интеллектуальной собственности (Российского агентства по патентам и товарным знакам (РОСПАТЕНТ)).
Практическая значимость результатов работы
Значимость исследования определяется тем, что полученные в ходе исследования данные, предложенные способ и система поддержки принятия решений, а также разработанное программное обеспечение могут быть использованы:
• специалистами отделов кадров для отбора кандидатов на должность;
• специалистами МВД России для поиска преступников;
• специалистами по оценке функционального состояния операторов сложных технических систем;
• психологами для проведения диагностики по почерку;
• педагогами учебных заведений при консультировании учащихся.
На практике разработанные способ и система поддержки принятия решений имеют следующие качественные и количественные преимущества:
• обеспечена возможность накапливать данные и затем корректировать показатели системы;
• высокая эффективность разработанного способа по сравнению с другими методами классификации;
• разработан критерий оценки надежности прогноза классификатора;
• имеется возможность устанавливать порог надежности классификатора в решении различных пользовательских задач (носит рекомендательный характер).
• значительно сокращается время психологической диагностики испытуемых;
• диагностика проводится без личного участия испытуемого;
• сокращаются субъективные ошибки при тестировании и его обработке;
• дается решение там, где раньше это было невозможно;
• выдается список рекомендаций (например, ранжированный список кандидатов на должность).
Предложенные в диссертации способ, алгоритм правила принятия решений и разработанное программное обеспечение для построения психологического портрета человека на основе признаков его рукописного почерка нашли применение:
• в рамках научной деятельности института судебных экспертиз (ИСЭ) МПОА им. O.E. Кутафина и ГБОУ ВПО МГППУ;
• в работе отдела кадров Климовского завода монетных заготовок ООО «ГУРТ»;
• при выполнении 3-х НИР «Разработка математических методов и моделей для исследования динамики психологических характеристик и психологической диагностики», «Разработка, программная реализация и внедрение современных технологий диагностики учащихся в рамках комплексной оценки их достижений», «Разработка и программная реализация методов математического моделирования и анализа данных для психологических исследований».
Личный вклад автора состоит в разработке способа, алгоритма принятия решений, критерия надежности прогноза классификатора, архитектуры системы поддержки принятия решений и программного обеспечения для определения психологических характеристик человека по признакам рукописного почерка, а также в проведении эксперимента, сборе и обработке экспериментальной выборки. Лично автором и при участи автора выполнена подготовка основных публикаций по выполненной работе в рамках представленной диссертации.
Результаты проведенного исследования позволяют сформулировать следующие по-
ложення, выносимые из защиту:
1. Способ (процедура), основанный на модифицированном нейросетевом алгоритме вероятностной нейронной сети для принятия решений о психологических характеристиках исполнителя рукописного текста по признакам его почерка.
2. Разработанный критерий оценки надежности выполненного прогноза позволяет установить порог по надёжности, который переведёт некоторый процент верных решений классификатора в неопределённые, но при этом значительно повысится процент успешных распознаваний (классификаций).
3. Разработанная архитектура системы поддержки принятия решений, которая обеспечивает ранжирование исполнителей рукописи по отношению к заданному описанию психологического класса.
Достоверность и обоснованность полученных результатов в работе обеспечивается методологической обоснованностью исходных положений; необходимой аргументацией и апробацией результатов на различных этапах исследования; репрезентативностью выборки; системным подходом к описанию и изучению объекта исследования; строгой логикой проведения эксперимента в соответствии с целями и задачами проводимого исследования; количественным и качественным анализом полученных экспериментальных данных, который подтвердил теоретические положения диссертации, а также корректной математической обработкой результатов исследования.
Апробация работы
Основные результаты диссертационного исследования были представлены на следующих научных конференциях, сессиях и семинарах:
1. 12-я Международная конференция и выставка «Цифровая обработка сигналов и ее применение», Москва, РНТОРЭС, 2010г.
2. XXI Международная конференция «Информатизация и информационная безопасность правоохранительных органов», Москва, Академия управления МВД России, 2012г.
3. V Международная научно-практическая конференция по криминалистике и судебной экспертизе «Криминалистические средства и методы в раскрытии и расследовании преступлений», Москва, ЭКЦ МВД России, 2011г. (работа отмечена медалью).
4. 3-я Международная научно-практическая конференция «Теория и практика судебной экспертизы в современных условиях», Москва, МГТОА имени O.E. Кутафина, 2011г.
5. XVIII, XIX Международная студенческая школа-семинар «Новые информациошше технологии», секция «Информационные технологии в экономике, юриспруденции, бизнесе, научно-техническом предпринимательстве и инновационной деятельности» Крым, Судак, 2010г. (работа отмечена дипломом 1-й степени), 2011г.
6. XVII Международная конференция. Математика. Компьютер. Образование. МКО-2010 (МСЕ), Москва, МГУ, 2010г.
7. ХП Всероссийская выставка научно-технического творчества молодежи НТТМ 2012, Москва, ВВЦ, павильон 57, 26 — 29 июня, 2012г. (работа отмечена премией президента РФ по поддержке талантливой молодежи (указ президента РФ от б апреля 2006 г. №325)).
8. XVII, XVIII и XIX Всероссийская научная конференция «Проблемы информационной безопасности в системе высшей школы», Москва, 2010г., 2011г., 2012 г.
9. IX, X и XI Всероссийская научная конференция «Нейрокомпьютеры и их применение», Москва, 2011г., 2012г. (работа отмечена дипломами первой степени), 2013г.
10. Всероссийская научная конференция «Экспериментальная психология в России: традиции и перспективы», Москва, МГППУ, 2010г.
11. IX межвузовская научно-практическая конференция студентов, аспирантов и молодых ученых «Молодые ученые столичному образованию», Москва, МГ] 111 У, 2010г.
12. X межвузовская научно-практическая конференция студентов, аспирантов и молодых ученых «Молодые ученые — нашей новой школе», Москва, МТТТПУ, 2011г.
13. Научный семинар, Москва, ИП РАН, 2010г.
14. Научный семинар «Математическая психология», Москва, МГППУ, 2011г.
15. Научный семинар (заседание клуба экспертов профессионалов (КЭП)), Москва, институт судебных экспертиз (ИСЭ) МГЮЛ, 2012г.
Публикации
Результаты диссертации (самостоятельно и в соавторстве) представлены в 28 публикациях, в тон числе: 4 работы (одна из которых без соавторов) в ведущих рецензируемых научных журналах из перечня ВАК РФ, а также 3 отчета о НИР и 1 патент на полезную модель Российского агентства по патентам и товарным знакам.
Структура диссертации соответствует логике, содержанию и результатам исследования и состоит из введения, 4 глав, заключения, списка использованных источников, приложений, содержит 38 таблиц, 48 рисунков. Общий объем работы составляет 171 страницу.
Содержание работы
Во введении обоснована актуальность и новизна диссертационной работы, сформулирована цель и решаемые задачи, а также практическая ценность диссертационного исследования. Кратко даны полученные научные результаты, объем и структура диссертации.
В первой главе проведен анализ задачи обработки больших массивов эмпирических данных для принятия решений применительно к индивидуальным параметрам, характеризующим человека с использованием данных о признаках его рукописного почерка. В исследовании рассматривается задача построения психологического портрета человека (далее под психологическим портретом будем понимать определение значений некоторых психологических характеристик) на основе признаков рукописного почерка. Дано краткое описание предметной области. Рассмотрены психологические характеристики, рукописный почерк и его признаки. Рассмотрены психологические тесты, которые позволят предварительно отнести испытуемого к определенному психологическому классу. Для дальнейших исследований автором выбраны тест Равена (оценивающий когнитивные способности) и пятифакторный опросник личности, который полностью соответствует современной и достаточно широко распространенной пятифакторной модели личности «Большая пятерка» (Big5). Эта принятая модель предполагает, что личность человека включает в себя пять общих и относительно независимых психологических черт (в данном опроснике психологическая черта (или фактор) имеет дихотомическую структуру, например, «Фактор 1 — экстраверт-интроверт). Таким образом, ставится задача создания алгоритмов, метода классификации и программных средств, позволяющих на основе признаков почерка человека отнести его к одному или нескольким психологическим классам (под психологическим классом будем понимать психологическую характеристику, например, интроверт или активный, или средний уровень интеллекта), включенным в опросник Big5 и тест Равена. Заметим, что психологические характеристики, полученные с помощью укачанных тестов, считаются эталонными. Ставится задача прогнозирования результатов психологического тестирования на основании признаков почерка человека. Представлен необходимый обзор и анализ существующих методов и программных средств для проведения различных почерковедческих исследований.
Во второй главе, отмечено, что анализируемые данные представлены в непарамет-
2
рическом виде, описывается применение метода минимума^ для оценки статистических связей между признаками почерка. Предлагается использовать систему двоичного кодирования признаков, при которой каждый признак может принимать только два значения из множества {0,1} (есть признак, нет признака), при большем числе реальных градаций признака используется кодирование по правилу один из N, что приводит к увеличению числа разрядов (компонент вектора признаков) необходимых для представления признака.
Дается описание метода классификации исполнителя рукописи по признакам его почерка, разработанного автором на основе вероятностной нейронной сети, имеющего следующие качественные преимущества перед традиционными подходами:
1) оценка достоверности прогноза (правильной классификации).
2) быстрое обучение и возможность быстрого дообучения на новых выборочных данных.
В качестве основы метода выбрана вероятностная нейронная сеть классической структуры, но традиционно используемые в нейронных сетях этого типа непрерывные признаки заменены на дискретные. Также автором предложена передаточная функция, которая чувствительна к сходствам (различиям) векторов обучающей выборки и классифицируемого вектора (не полагающей сам факт таких совпадений равнозначным для разных компонент в смысле решения классификационной задачи). В предложенном подходе используется функция близости, учитывающая значимость каждой компоненты вектора относительно анализируемой психологической характеристики. В качестве оценки значимости используется условная вероятность определенного значения каждой компоненты при условии принадлежности испытуемого к определенному классу.
Пусть « — номер признака, С =[С1,..,СП] — вектор признаков почерка, компоненты
которого могут принимать значения из множества {0,1}, G = {gl,...,g|l} — множество психологических классов, а Р(с; = <т | gj) — условная вероятность с,- = сг, где <Х одно из допустимых значений признака с(-, при условии психологического класса^- 6 О (заданного психологическим тестом), определенная по выборке испытуемых, _/' — номер психологического класса. На первом этапе решения поставленной задачи оцениваются условные вероятности всех признаков вектора С = [с15 ...,С„] для всех классов (г (психологических классов или шкал). Эти вероятности заносятся в таблицы, например, табл.1, используемые в дальнейшем алгоритмом классификации. Значения условных вероятностей выступают при этом как веса признаков. Каждая такая таблица соответствует своему классу gj, поэтому в обозначениях о' е11 и ДР- индекс у отсутствует.
Таблица 1. Пример таблицы условных вероятностей наличия (отсутствия) признака почерка
Номер признака I е {1,.., л} 1 п
Вероятность отсутствия / -го признака (с,- = 0)
Вероятность наличия / -го признака = 1)
Нейронная сеть имеет три слоя: входной, оценочный и выходной. Оценочный слой состоит из нейронов, каждый из которых соответствует одному из наблюдений обучающей выборки. Каждому психологическому классу соответствует свой выходной элемент, соединенный со всеми оценочными элементами, которые к нему относятся, и не связанный с остальными элементами оценочного слоя. Выходные элементы суммируют выходные сигналы со всех оценочных элементов, принадлежащих их классам.
Основным отличием от вероятностной нейронной сети служит предложенная функция близости классифицируемого вектора и вектора наблюдения нейрона. Она вычисляется следующим образом: если совпадают i -е компоненты вектора нейрона относящегося к классу gj и классифицируемого вектора признаков с, то к значению расстояния добавляется условная вероятность Р(с| gj), хранящаяся как элементы таблицы условных вероятностей (см. табл. 1):
" \et с , если С: = L
F(c,/)=2>/' г<5е 3 =1 ' , ' О—,"},
<=1 [ О , если Cj ф li
где F(c,l) — функция близости классифицируемого вектора с и вектора наблюдения нейрона /, п — число компонент векторов (число признаков), i — номер компоненты, ei j— соответствующая ячейка таблицы (матрицы) условных вероятностей. Если соответствующие компоненты векторов с и / не совпадают, то переходят к следующей паре компонент. Экспериментально показано, что игнорирование несовпадающих компонент, позволяет добиться большей точности классификации (меньше ошибок классификации). При классификации решение принимается в пользу того класса, на выходном нейроне которого получена большая сумма. Обучение такой сети сводится к занесению выборочных данных для разных классов и оценок условных вероятностей в специальную базу данных.
Структура модифицированной вероятностной нейронной сети показана на рис.1.
Рис. 1. Структура модифицированной вероятностной нейронной сети
На рис.1 обозначено: светлый круг — вход модифицированной вероятностной нейронной сети, темный круг — выход модифицированной вероятностной нейронной сети (выбор максимума среди и )> квадрат — вычисление/^ или , ромб — вычисление передаточной функции /-го племента^^у] или 2[7] •
Суть алгоритма модифицированной вероятностной нейронной сети состоит в следующем.
На вход алгоритма поступает вектор С = [с1,..,с„], компоненты которого могут принимать значения из множества {0,1} и необходимо принять решение об отнесен™ данного вектора к одному из двух психологических (например, интроверт - экстраверт) классов & — > §2 } > где ^ = 2 ■ Каждому классу сопоставлен соответствешю набор или Zg2
выборочных векторов I =[1Ь..,1„], относящихся к данным классам, размерность которых совпадает с размерностью с и равна п, количество векторов в этих наборах, обозначим как и \Vg25 компоненты этих векторов, так же могут принимать значения из {0,1}. Таблицы Е^ и Е&2 содержат оценки условных вероятностей компонент векторов /, а для классов g^ и £2 соответственно, используются переменные и для хранения промежуточных результатов. Алгоритм содержит следующие шаги:
1. Установить = 0, = 0, 7=1.
2. Задать компоненты вектора С, таблицы Е^ и Е^ wg\> наборы '¿^ "
3. Выполнить I =
4. Вычислить (используя таблицу £^1):
" [е: _ , если с, = /.
V
V/^ 0, переход к шагу 6.
6. Выполнить / = 2 ] .
7. Вычислить (используя таблицу Е^У-
" [е, _ , если с, = /.•
Лг=Л2+Ё^. где 5,= , /е{1,„.,/.}, е,сизЕ&г
^ [ 0 , если С; * Ц
г
8. Если j Ф И'^2то ] = 7 + 1, переход к шагу 6, если ] = , то /г2 ~-> где
\\Jg2 Ф 0, переход к шагу 9.
9. Если < то с относится к классу Я2'если > /§2>то с относится к классу
если = /^2 5 то невозможно принять решение.
Эффективность предложенного автором подхода по сравнению с другими методами классификации кратко представлено в табл. 2.
■ 1 •'в1
5. Если } Ф И^, то 7 = 7'+1 переход к шагу 3, если у = то 7 = 1, 7Я1 - ~—. где
Таблица 2. Эффективность предложенного подхода и других методов классификации
Показатель Наивный Байесовский классификатор Бинарная логистическая регрессия Предложенный подход
Фактор 1 (Экстраверсия — Интроверсия)
% успешных классификаций 67% 56% 85%
Фактор 2 (Привязанность - Обособленность)
% успешных классификаций 65% 60% 89%
Фактор 3 (Самоконтроль - Импульсивность)
% успешных классификаций 68% 60% 79%
Фактор 4 (Эмоциональная устойчивость - Эмоциональная неустойчивость)
% успешных классификаций 57% 61% 81%
Фактор 5 (Экспрессивность - Практичность)
% успешных классификаций 60% 55% 84%
Равен
% успешных классификаций 62% 58% 83%
Среднее 63% 58% 84%
Предлагается критерий оценки достоверности решения, принимаемого классификатором.
Согласно алгоритму модифицированной вероятностной нейронной сети, определен психологический класс gj, вектора С признаков почерка Известны оценки условных вероятностей признаков почерка с, для этого класса, а также оценка P{c\gj). Пусть P = P(c = [cx,...,cn\\gj). Вычисляется отношение (Р -Pmin) к величине
СРтах-Pmin)'
Z^max = max{e, 0, exx} • max{e2 0, e2,} •... ■• max{e„ 0, e„,},
/Jnin = min{e, 0,e,,} ■ min{e20,e2jI }■...• min {е„0,е,г!},
где e берутся из таблицы условных вероятностей J7 , определенных для установлен-
% i
ного при классификации класса gj), по следующей формуле (ПРИ Ртах фРттУ-
Р-Р ■
R — mln
Р -Р ■ '
1 max тт 10
где Я = 1 будет означать равенство анализируемого вектора максимально вероятному (вне зависимости от наличия такового непосредственно в выборке), а Я = 0 будет означать — равенство минимально вероятному вектору.
Далее предлагается использование пороговой функции для отсечения прогнозов с низкой оценкой надежности Я. На практике применение этого порога позволяет исключать результаты классификации, надежность которых ниже заданного уровня, который выбирается экспериментальным путем. Использование подобного подхода, приводит к незначительному уменьшению общего числа классификаций, но при этом, как правило, можно добиться значительного уменьшения ошибок классификаций. На практике при получении текущего результата классификации, надежность которого ниже заданного уровня, этот результат специалистом рассматривается как неопределенный (в этом случае принять решение не представляется возможным). Конкретное значение порога, зависит от специфики исследуемых данных и требует отдельных вычислений и исследований для каждого разрабатываемого классификатора.
Кратко схема алгоритма работы разработанного программного обеспечения представлена на рис. 2.
Отметим, что обработка рукописи содержит следующие шаги:
• пользователь (эксперт) получает рукопись, которую необходимо проанализировать;
• выделяет в рукописи последовательно признаки почерка по методическим указаниям (составлены автором);
• заполняет бланк признаков почерка с помощью пользовательского интерфейса программы;
• пользователь выбирает в окне программы психологическую характеристику или несколько характеристик, по которым необходимо провести анализ рукописи для составления психологического портрета исполнителя рукописи;
• с помощью заполненного бланка формируется бинарный вектор признаков почерка, который затем анализируется программными средствами;
• после анализа, в зависимости от задач, поставленных пользователем, выводится список психологических классов («сырые» психологические характеристики), к которым отнесен человек (например: экстраверт, активный, эмоционально устойчивый) или список ранжированных кандидатов на должность.
На рис. 2 приняты следующие обозначения: МВСН — модифицированная вероятностная сеть, блоки, выделенные пунктиром, не реализованы.
Авторизация пользователя для выбора режима работы системы.
Ввод названий и описаний признаков
Ввод обучающей выборки
Обучение МВНС
Вывод сообщения о завершении обучения
Вывод «сырых» психологических характеристик
I
^ Начало ^
Ввод данных от пользователя
Анализ и классификация, поступившего вектора признаков
I
Автоматическое выделение и ввод признаков в систему
I________
Оценка надежности классификации
т
Алгоритм классификации, разработан автором.
\ (Критерий оценки, 1 разработан автором.
Режим 1
Режим 2
Вывод ранжированного списка кандидатов
Режим 3!
.........х________
Вывод списка предпочтительных профессий
---------г~-......
___________У
^ Конец ^
Рис. 2. Схема алгоритма работы разработанного программного обеспечения
Предлагается архитектура системы поддержки принятия решений на основе прогнозов, сделанных классификатором на основе алгоритма модифицированной вероятностной нейронной сети, представленная на рис. 3.
Выделение признаков почерка проходит вручную по специально разработан' ным методическим указаниям.
Блок
выделения признаков почерка из рукописи
Рис. 3. Архитектура системы поддержки принятия решений
На рис.3 приняты следующие обозначения: МВСН — модифицированная вероятностная сеть, НС — нейронная сеть, БД •— база данных.
Допустим: задано описание X = {xi,..,xu} искомого психологического портрета, через значения выраженности и классов психологического теста, например, теста Big 5 (оно хранится в базе дагшых). Дано множество кандидатов Qe = {<7i,.,<7„} из И кандидатов. Точки этого множества имеют координаты {xt,..,xu}, являющиеся оценками надежности прогноза, сделанного по алгоритму модифицированной вероятностной нейронной сети, они передаются блоку принятия решений блоком анализа данных для каждого из кандидатов множества Qe. Вектор Л/= [/и1,..,/Яы] определяет порядок приоритетов рассмотрения классов (так же хранится в базе данных). Определена функция 0(Q) возвращающая список Парето оптимальных точек множества Q на основе критериев X, L — список кандидатов, формируемый алгоритмом, в порядке убывания приоритета. Кратко эту последовательность шагов можно представить так:
1. Установить е = О;
2. Сформировать очередное множество Qe — 0(QC );
3. Точки Qe+1 упорядочиваются по координатам X в соответствии с заданным М, список
Ь дополняется упорядоченными точками;
4. Если \ Це+1 =0 переход к шагу 5, если Це \0,е+1 то е = е + \, переход к шагу 2;
5. Вывести список кандидатов Ь.
В третьей главе представлены результаты экспериментального исследования эффективности алгоритма (рис. 4) и сравнительные оценки его эффективности относительно других известных подходов к классификации непараметрических данных.
Рис. 4. Краткая схема алгоритма работы модифицированной вероятностной нейронной сети
Эффективность алгоритма для некоторых психологических классов представлена в табл. 3 (31 класс складывается из 5 основных факторов и 25 второстепенных по тесту Big5 и 1 классу теста Равена).
Таблица 3. Эффективность модифицированной вероятностной нейронной сети для некото-
рых психологических классов
№ класса Название класса Процент успешных классификаций
2 привязанность — обособленность 89
27 любознательность — реалистичность 88
1 экстраверсия — интроверсия 85
18 ответственность — безответственность 85
5 экспрессивность — практичность 84
17 настойчивость ■— отсутствие настойчивости 84
23 депрессивпость — эмоциональная комфортность 83
31 Равен 83
15 уважение других — самоуважение 82
4 эмоциональная устойчивость — эмоциональная неустойчивость 81
В среднем по всем 31 классам 79
По данным табл. 3 видно, что вариант нейросетевого алгоритма с модифицированной вероятностной нейронной сетью имеет достаточно высокую эффективность примерно 79% в среднем по всем 31 классам.
В диссертации выполнены также исследования зависимости величины процента успешных распознаваний от количества исключенных признаков для каждого психологического класса. На рис. 5 приведен пример такой зависимости (и ее аппроксимация) для 1-го фактора Big 5 (эхстраверсия — интроверсия). Аналогичные зависимости и их анализ были
получены для других психологических характеристик. 100,00 _ 90,00
1 5 9 13 17 21 25 29 33 37 41Л5 49 53 57 6165
Количество исключенных прнзпьков
Рис. 5. Эффективность алгоритма классификации (1-й фактор Big 5)
После анализа исследований, приведенных в работе, был сделан вывод о том, что в среднем исключение от 17 до 20 признаков приводит к резкому падению эффективности алгоритма и выводит процент успешных оценок на уровень 50%, что соответствует на практике полной потере эффективности.
В табл. 4 представлены данные, показывающие, как меняется процент ошибок и общее число определенных ответов, в зависимости от уровня отсечки для основных шкал Big5 и теста Равсна при введении пороговой функции оценки результатов классификации. В табл. 4 приняты следующие обозначения: Ф1 — экстраверсия — интроверсия, Ф2 — привязанность — обособленность.
Таблица 4. Оценка эффективности классификации от уровня порога
Шкалы (выборочно) Нет отсечки Отсечка па 0,85 Отсечка на 0,9
Равен % ответов 100,00% 43,53% 11,76%
% ошибок 21,00% 2,70% 0,00%
Ф1 % ответов 100,00% 42,35% 10,59%
% ошибок 15,00% 2,78% 0,00%
Ф2 % ответов 100,00% 52,94% 10,59%
% ошибок 10,80% 0,00% 0,00%
В четвертой главе описана программная реализация. В соответствии с описанной концепцией был разработан комплекс программ, предназначенный для проведения экспериментальных исследова1ШЙ, обучения вероятностных нейронных сетей и построения выводов о психологических характеристиках исполнителя рукописи, а так же система поддержки принятия решений, работающая на их основе. Выделение признаков почерка из рукописи (рис.2 и рис.3) в дашгой реализации выполняется пользователем (экспертом) самостоятельно, вручную. При наличии необходимого эффективного автоматического устройства распознавания и выделения признаков из рукописи эта операция может быть выполнена без участия пользователя.
Следует отметить, что представленное и разработанное программное обеспечение может быть использовано для прогнозирования результатов других психологических тестов после обучения на соответствующих выборках.
В целях автоматизации проведения эксперимента, автором было разработано специальное программное обеспечение, которое позволяет проводить тестирование через Web-интерфейс, а также дает возможность в режиме администратора формировать тесты с множественным выбором. Соответственно было автоматизировано проведение исследования с использованием опросника Big 5 и теста Равена. Выгрузка данных, полученных по результатам тестирования, в базу данных может быть осуществлена с помощью приложения phpMyAdmin обеспечивающего полноценную, в том числе удаленную, работу с базами данных MySQL через браузер.
Представлена разработка и успешное внедрение специальной версии программного обеспечения Esdelatura, реализующего нейросетевой алгоритм классификации для принятия решений по составлению психологического портрета человека на основе признаков почерка, с целью поддержки учебного процесса в ИСЭ МПОА имени O.E. Кутафина подготовки будущих экспертов, выполняющих судебные экспертизы по почерку. Это средство позволяет будущему эксперту эффективно осваивать современные автоматизированные средства почерковеда. Выполненное внедрение подтверждено соответствующим актом о внедрении.
Рассмотрена версия программного обеспечения Esdelatura для ООО «ГУРТ», реализующая нейросетевой алгоритм классификации, с целью принятия решений в отделе кадров, при проведении собеседований и дальнейшем отборе кандидатов на различные должности компании. Результат внедрения подтвержден актом о внедрении.
Выполнено внедрение интерактивной Интернет-подсистемы (для ГБОУ ВПО МГППУ) PsyTestHum тестирования человека (испытуемого) включающее: подсистему формирования результатов тестирования операторов (испытуемых); подсистему хранения тестовых заданий психологических тестов; подсистему помощи (Help) человеку-оператору (испытуемому); структуру базы данных и набор ее полей и связей; базу данных тестовых заданий; программное обеспечение ядра системы Esdelatura и программное обеспечение подсистемы PsyTestHum. Результат внедрения подтвержден актом о внедрении.
С целью создания масштабируемого решения, было разработано два программных продукта, составляющих единый комплекс. Первая программа разработана для формирования архитектуры нейронной сети и ее обучения с помощью выборки, вторая для анализа данных. На основной экранной форме доступен выбор между режимами обучением системы, загрузкой и обработкой данных и завершением работы.
Делается вывод, что в ходе диссертационного исследования разработано программное средство, реализующее предложенный автором способ и нейросетевой алгоритм, и позволяющее распознавать психологический портрет исполнителя рукописи на основе выделенных из нее признаков почерка. Предложенная автором программная реализация обладает значительной универсальностью, высоким быстродействием, независимостью от внешних компонентов и хорошей масштабируемостью. В целом это средство эффективно, что подтверждается необходимыми оценками, опытной эксплуатацией, актами о внедрении и апробацией.
В заключении диссертации отражены основные полученные результаты и выводы.
В приложения вынесены краткое описание набора признаков почерка, примеры образцов почерка и краткое описание полезной модели.
ОСНОВНЫЕ ВЫВОДЫ И РЕЗУЛЬТАТЫ РАБОТЫ
Опираясь на системный анализ и выполненные исследования, получены актуальные решения научных и технических задач, имеющие большое значение для теории нейронных сетей и информационных систем в области почерковедения и психологии. Эти решения неразрывно связаны с важной проблемой разработки средств принятия решений для построения психологического портрета человека на основе признаков почерка.
В диссертации получены следующие результаты:
1. Разработан и исследован способ (процедура) оценки информативных признаков для определения заданных характеристик (в частности психологических) на основе признаков почерка, вводимых оператором информационной системы, использующий статистические критерии согласия и самообучающиеся структуры. Разработана модификация вероятностной нейронной сети для принятия решений о психологических характеристиках исполнителя рукописного текста по признакам его почерка.
2. Разработан и исследован вероятностный критерий оценки надежности нейросетевого прогноза, формализующий процедуру отказа от принятия решения и позволяющий при многокритериальном выборе ранжировать множество субъектов внутри заданных классов.
3. Разработана и проанализирована архитектура системы поддержки принятия решений (при обработке эмпирических данных для определения психологических характеристик) для ранжирования исполнителей рукописи по заданному описанию психологического портрета личности, позволяющая сотрудникам отделов кадров использовать предложенный способ оценки психологических характеристик при отборе кандидатов на различные должности на предприятии.
4. Разработан, экспериментально проверен и внедрен программный комплекс Езёе1аШга, позволяющий определять психологические характеристики личности по признакам почерка и принимать управленческие решения на основе обработанных данных.
Разработанное программное средство для персональной ЭВМ обеспечивает время принятия решения после ввода признаков почерка не более 1 с. Созданные средства (алгоритмы, ПО и БД) дают возможность накапливать сведения об образцах почерка испытуемых, результатах их психологического тестирования и результатах обработки данных. Что позволяет в дальнейшем выполнять необходимые уточнения параметров разработанных алгоритмов, правила принятия решений и показатели эффективности их работы.
Выполнено успешное внедрение полученных иаучно-технических результатов в практику работы отдела кадров ООО «ГУРТ», Института судебных экспертиз МГЮА (Московская государственная юридическая академия имени O.E. Кугафина) и в учебный процесс ГБОУ ВПО Ml 1111 У, что подтверждается соответствующими актами о внедрении.
Для работы различных специалистов были разработаны и внедрены:
а) специальная (для ИСЭ МГЮА имени O.E. Кутафина)) версия программного обеспечения Esdelatura, реализующая нейросетевой алгоритм классификации для принятия решения по составлению психологического портрета человека на основе признаков почерка, с целью поддержки учебного процесса подготовки будущих экспертов, выполняющих судебные экспертизы по почерку;
б) специальная (для ООО «ГУРТ») версия программного обеспечения Esdelatura, реализующая нейросетевой алгоритм классификации, с целью принятия решения в отделе кадров, при проведении собеседований и дальнейшем отборе кандидатов на различные должности компании, при приеме на работу с учетом принятия решения по составлению психологического портрета человека на основе признаков почерка;
в) интерактивная Интернет-подсистема (для ГБОУ ВПО МГПГГУ) PsyTcstHum тестирования человека (испытуемого);
г) программное обеспечение (ПО) ядра системы Esdelatura и ПО подсистемы PsyTes-tHum;
СПИСОК ОСНОВНЫХ ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ
Публикации в издаииях из Перечти ВАК РФ
1. Гунько (Юрьева), Н.Е. Подход к решению задачи составления психологического портрета человека по почерку/Н.Е. Юрьева //Нейрокомпьютеры: разработка, применение.—М.: Радиотехника, 2012. —№2. — С.54 — 62.
2. Кулик, С.Д. Подход к решению задачи определения психологических характеристик личности по почерку/ С.Д. Кулик, Н.Е. Гунько (Юрьева) //Экспериментальная психология, 2011. — №4. — С.62 —74.
3. Кулик, С.Д. Подход к построению психологического портрета человека на основе почерка/ С.Д. Кулик, Н.Е. Юрьева (Гунько) //Нейрокомпьютеры: разработка и применение. — М.: Радиотехника, 2012,— №9,— С.23—28.
4. Кулик, С.Д. Анализ психологических свойств личности по почерку для обеспечения информационной безопасности/ С.Д. Кулик, Н.Е. Гунько (Юрьева) //Безопасность информационных технологий. — М., 2012. — №3.— С.103 — 110.
Патент
5. Кулик С.Д, Никонец Д.А., Ткаченко К.И., Лукьянов И. А., Гунько (Юрьева) Н.Е. Патент на полезную модель №111926, Российская Федерация (RU), кл. МПК G 06 К 9/00. Устройство определения рукописных документов, принадлежащих исполнителю текста на
русском языке /С.Д. Кулик, Д.А. Никонец К.И. Ткаченко, И.А. Лукьянов, Н.Е. Гунько (Юрьева) —Россия. —Заявка№2011127077/08; Заяв. 04.07.2011; Зарегистр. 27.12.2011; Приоритет от 04.07.2011. Опубл. Бюл. №36. —4.4. —С.1098,—(РОСПАТЕНТ).
Другие публикации
6. Гунько (Юрьева), Н.Е. Поиск биометрических признаков почерка для определения психологических характеристик человека/ Н.Е. Гунько (Юрьева) //Труды РНТОРЭС им. А.С. Попова: 12-я Международная конференция и выставка «Цифровая обработка сигналов и ее применение». Выпуск XII—2. — М.: РНТОРЭС, 2010. — С. 333—334. — (есть пер. на англ. яз.: Gunko (Yuryeva) N. Search biometric features script for certain psychological characteristics of man //Proceedings of the 12-th International Conference Digital signal processing and its applications.—M.—2010.— P.334—335).
7. Гунько (Юрьева), Н.Е. Программные средства составления психологического портрета личности (злоумышленника) на основе признаков почерка/ Н.Е. Гунько (Юрьева) //Материалы 3-й Международной паучно-практической конференции «Теория и практика судебной экспертизы в современных условиях» (г. Москва, 25-26 января 2011г.).—М.: МПОА, 2011.—С.518—521.
8. Гунько (Юрьева), Н.Е. Разработка эффективных программных средств принятия решения по составлению психологического портрета человека на основе признаков почер-ка/Н.Е. Гунько (Юрьева) //Сборник научной школы-семинара «Новые Информационные Технологии», 2010.—С.237-239.
9. Кулик, С.Д., Гунько (Юрьева) Н.Е. Построение психологического портрета человека на основе признаков почерка/ С.Д. Кулик, Н.Е. Гунько (Юрьева) //Экспериментальная психология в России. Традиции и перспективы.— М.: Институт психологии РАН, 2010. — С.675—680.
10. Кулик, С.Д., Гунько (Юрьева) Н.Е. Построение психологического портрета человека на основе признаков почерка: результаты эксперимента / С.Д. Кулик, Н.Е. Гунько (Юрьева) //Сборник трудов XXI всероссийской конференции «Информатизация и информаци-опиая безопасность правоохранительных органов», 30—31 мая 2012г.—М.: Академия управления МВД России, 2012,—С.234 —238.
11. Кулик, С. Д., Гунько (Юрьева) Н.Е. Психологический портрет на основе признаков почерка/ С.Д. Кулик, Н.Е. Гунько (Юрьева) //Криминалистические средства и методы в раскрытии и расследовании преступлений. Материалы V Международной научно-практической конференции по криминалистике и судебной экспертизе (2-3 марта 2011г.). —М.: ЭКЦМВД России, 2011. — С.329—333.
12. Гунько (Юрьева), Н.Е. Использование признаков почерка для систем информационной безопасности/ Н.Е. Гунько (Юрьева) //Безопасность информационных технологий.—М., 2011. — №1. — С.87—88. — (материалы XVIII Всероссийской научно-практической конференции «Проблемы информационной безопасности в системе высшей школы»)
13. Гунько (Юрьева), Н.Е. Биометрические признаки для обеспечения информационной безопасности/ Н.Е. Гунько (Юрьева) //Безопасность информационных технологий.—М., 2010. — №1. — С.64—65. — (материалы XVII Всероссийской научно-практической конференции «Проблемы информационной безопасности в системе высшей школы»),
14. Кулик, С.Д. Устройство определения рукописных документов, принадлежащих одному исполнителю/С.Д. Кулик, Д.А. Никонец, К.И. Ткаченко, И. А. Лукьянов, Н.Е. Гунько (Юрьева) //Безопасность информационных технологий.—М., 2012.—№1.— С. 100—102.—(материалы XIX Всероссийской научно-практической конференции «Про-
блемы информационной безопасности в системе высшей школы»),
15. Гунько (Юрьева), Н.Е. Особенности построения психологического портрета на основе почерка/ Н.Е. Гунько (Юрьева) //Молодые ученые нашей новой школе: материалы X юбилейной научно-практической межвузовской конференции молодых ученых и студентов учреждений высшего и среднего образования городского подчинения /Ред. В.В. Рубцов, А.А. Марголис, Ю.М. Забродин и др.—М.: МГППУ, 2011.—С. 326—327.
16. Никонец, Д.А. Повышение эффективности работы эксперта-почерковеда/ Д.А. Ни-конец, Н.Е. Юрьева (Гунько), С.Д. Кулик, К.И. Ткаченко //Тезисы докладов. XI Всероссийская научная конференция «Нейрокомпьютеры и их применение» НКП-2013. Москва, 19 марта 2013г. — М.: МГППУ, 2013. — С.84—85.
17. Кулик, С.Д. Данные и результаты эксперимента для разработки психологического портрета человека на основе признаков почерка/ С.Д. Кулик, Н.Е. Гунько (Юрьева) //Тезисы докладов. X Всероссийская научная конференция «Нейрокомпьютеры и их применение» ШСП-2012. Москва, 20 марта 2012г. — М.: МГППУ, 2012. — С.56.
18. Кулик, С.Д. Устройство определения рукописных документов, принадлежащих одному исполнителю/ С.Д. Кулик, ДА. Никонец, К.И. Ткаченко, И.А. Лукьянов, Н.Е. Гунько (Юрьева) //Научная сессия НИЯУ МИФИ—2012. Аннотации докладов. В 3 т. Т.З: Экономические и правовые проблемы инновационного развития атомной отрасли. Методология профессионального и общего образования. Тематические конференции НИЯУ МИФИ (XIX Всероссийская научная конференция «Проблемы информационной безопасности в системе высшей школы»),— М.: НИЯУ МИФИ, 2012.— Т.З.—С.173.
19. Кулик, С.Д. Устройство распознавания исполнителя рукописных фрагментов текста/ С.Д. Кулик, Д.А. Никонец, К.И. Ткаченко, И.А. Лукьянов, Н.Е. Гунько (Юрьева) //Тезисы докладов. X Всероссийская научная конференция «Нейрокомпьютеры и их применение» НКП-2012. Москва, 20 марта 2012г. — М.: МГППУ, 2012. — С.70.
20. Гунько (Юрьева), Н.Е. Биометрические признаки для обеспечения информационной безопасности/ Н.Е. Гунько (Юрьева) //Научная сессия НИЯУ МИФИ—2010. Аннотации докладов. В Зт. Т.З: Информационно-телекоммуникационные системы. Проблемы информационной безопасности в системе высшей школы. Экономика, управление и нормативно-правовые вопросы высоких технологий. Университетское образование и инновационные образовательные технологии в Национальном исследовательском ядерном университете. М.: НИЯУ МИФИ, 2010. — Т.З. — С.148. — (краткие тезисы доклада на XVII Всероссийской научной конференции «Проблемы информационной безопасности в системе высшей школы»),
21. Кулик, С.Д. Программные средства создания психологического портрета человека на основе признаков почерка/ С.Д. Кулик, Н.Е. Гунько (Юрьева) //Тезисы докладов. IX Всероссийской научной конференции «Нейрокомпьютеры и их применение» НКП-2011. — М.: МГППУ, 2011. — С.49.
22. Гунько (Юрьева), Н.Е. Разработка эффективных программных средств принятия решения по составлению психологического портрета человека на основе признаков почерка/ Н.Е. Гунько (Юрьева) //IX научно-практическая межвузовская конференция «Молодые ученые — столичному образованию». — М.: МГППУ, 2010. — С.370—372.
23. Гунько (Юрьева) Н.Е. Биометрические признаки для обеспечения информационной безопасности/Н.Е. Гунько (Юрьева) //Тезисы. XVII Международная конференция. Математика. Компьютер. Образование. МКО-2010 (МСЕ). — [Электронный ресурс]. —ГШ/. http://www.mce.su/rus/archive/abstracts/mcel7/doc61886/ (дата обращения: 15.12.2012), 2010.
24. Юрьева (Гупько), Н.Е. Метод для построения психологического портрета человека на основе признака почерка/ Н.Е. Юрьева(Гунько) //Тезисы докладов. XI Всероссийская научная конференция «Нейрокомпьютеры и их применение» НКП-2013. Москва, 19 марта 2013г. — М.: МГППУ, 2013. — С.72—73.
25. Гунько (Юрьева), Н.Е. Особенности разработки программных средств по составлению психологического портрета личности на основе почерка / Н.Е. Гунько (Юрье-ва)//Сборник тезисов IX Международной научной школы-семинара «Новые Информационные Технологии». — М., 2011. — С.138—140.
26. Разработка математических методов и моделей для исследования динамики психологических характеристик и психологической диагностики: Отчет о НИР Центра информационных технологий для психологических исследований (промежуточный) /МГППУ. Исполнители: Куравский JI.C., Кулик С.Д., Артеменков С.Л., Гунько (Юрьева) Н.Е., Мармалюк П.А., Юрьев Г.А., Соловьев Д.В., Ткаченко К.И. — М.: МГППУ, 2011. — 330с.
27. Разработка, программная реализация и внедрение современных технологий диагностики учащихся в рамках комплексной оценки их достижений: Отчет о НИР /Департамент образования г. Москвы, ГБОУ ВПО МГППУ. Руководитель: Артеменков С.Л. Ответственные исполнители: Митина О.В., Лукин В.В. Исполнители: Артеменков С.Л., Митина О.В., Лукин В.В., Бохоров КЛО., Юрьева (Гунько) Н.Е., Думин П.Н., Кулик С.Д., Куравский Л.С., Марголис A.A., Мармалюк НА., Менчук Т.И., Новицкая H.H., Панфилова A.C., Рассказова Е.И., Сорокина В.В., Ткаченко К.И., Лукина (Фесик) Е.О., Юрьев Г.А.— Отчет по Госзаданию Департамента образования г. Москвы (Государственная программа г.Москвы на среднесрочный период (2012-2016 гг.)). Развитие образования г. Москвы («Столичное образование»): мероприятие ОЗГ0200. Оказание государственных услуг, выполнение работ государственными образовательными учреждениями высшего профессионального образования г. Москвы; Государственное задание ГБОУ ВПО МГППУ на 2012г. — (одноэтапный). — М.: ГБОУ ВПО МГППУ, 2012.— 320с.
28. Разработка и программная реализация методов математического моделирования и анализа данных для психологических исследований: Отчет о НИР (о выполнении государственной работы) /Департамент образования г. Москвы, ГБОУ ВПО МГППУ. Руководитель: Исполнители: Куравский Л.С., Алхимов В.И., Артеменков С.Л., Балтрушайтис В .В., Войтов В.В., Захаров В.К., Кулик С.Д., Лукин В.Н., Лукин В.В., Мармалюк П.А., Панфилова A.C., Перевезенцева A.C., Ушаков А.Б., Лукина (Фесик) Е.О., Юрьев Г.А., Юрьева (Гунько) Н.Е., Яшин А.Д.— Отчет по Госработам 2012г. Департамента образования г. Москвы. — М.: ГБОУ ВПО МГППУ, 2012.— 68с.
Подписано в печать:
24.10.2013
Заказ № 8966 Тираж -150 экз. Печать трафаретная. Типография «11-й ФОРМАТ» ИНН 7726330900 115230, Москва, Варшавское ш., 36 (499) 788-78-56 www.autoreferat.ru
Текст работы Юрьева, Наталия Евгеньевна, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)
Государственное бюджетное образовательное учреждение высшего профессионального образования «Московский городской психолого-педагогический университет»
ПОДДЕРЖКА ПРИНЯТИЯ РЕШЕНИЙ ПРИ ПОСТРОЕНИИ ПСИХОЛОГИЧЕСКОГО ПОРТРЕТА ЛИЧНОСТИ НА ОСНОВЕ НЕЙРОСЕТЕВОГО РАСПОЗНАВАНИЯ ПОЧЕРКА
Специальность 05.13.01 — «Системный анализ, управление и обработка информации (в науке и промышленности)»
На правах рукописи
04201450213
Юрьева Наталия Евгеньевна
Диссертации на соискание ученой степени кандидата технических наук
Научный руководитель: д.т.н., старший научный сотрудник Кулик Сергей Дмитриевич
Москва — 2013г.
СОДЕРЖАНИЕ
ВВЕДЕНИЕ..................................................................................................................4
1. АНАЛИЗ ПРОБЛЕМЫ ПРИНЯТИЯ РЕШЕНИЙ ПО ПОЧЕРКУ...................15
1.1. Исследование рукописного почерка в криминалистике, графологии и психологии..............................................................................................................15
1.2. Анализ существующих программных средств, повышающих эффективность работы специалистов в области графологии и криминалистического почерковедения...............................................................27
Выводы....................................................................................................................31
2. ПОСТРОЕНИЕ СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ДЛЯ ОПРЕДЕЛЕНИЯ ПСИХОЛОГИЧЕСКИХ ХАРАКТЕРИСТИК НА ОСНОВЕ ПРИЗНАКОВ ПОЧЕРКА........................................................................................33
2.1. Представление данных...................................................................................33
2.2. Факторизация признаков...............................................................................34
2.2.1. Исследование корреляции между признаками......................................35
2.2.2. Проверка гипотезы о наличии статистической связи в совместных распределениях признаков.................................................................................37
2.3. Модифицированная вероятностная нейронная сеть ..................................40
2.4. Оценка достоверности решения, принимаемого классификатором..........45
2.5. Пороговая функция для оценки эффективности.........................................50
2.6. Оценка эффективности классификации при исключении признаков.......51
2.7. Структура системы поддержки принятия решений....................................53
Выводы....................................................................................................................60
3. ЭКСПЕРИМЕНТАЛЬНОЕ ПОДТВЕРЖДЕНИЕ ЭФФЕКТИВНОСТИ ПРЕДЛОЖЕННОГО СПОСОБА.............................................................................61
3.1. Разработка «бланка почерка»........................................................................61
3.2. Выбор признаков почерка..............................................................................63
3.3. Психологические тесты..................................................................................67
3.4. Выборка испытуемых.....................................................................................70
3.5. Факторизация набора признаков...................................................................74
3.6. Сравнительный анализ эффективности нейронной сети со взвешиванием свидетельств и других известных подходов.......................................................83
3.6.1. Вероятностная нейронная сеть................................................................84
3.6.2. Бинарная логистическая регрессия.........................................................87
3.6.3. Наивный Байесовский классификатор...................................................90
3.6.4. Модифицированная вероятностная нейронная сеть.............................94
3.7. Построение интервальных оценок для предложенного способа...............96
3.8. Численная оценка эффективности метода при исключении признаков ... 99
3.9. Экспериментальная оценка эффективности и выбор порога...................109
Выводы..................................................................................................................114
4. РАЗРАБОТКА ПРОГРАММНЫХ СРЕДСТВ ДЛЯ ЭФФЕКТИВНОГО ПРИНЯТИЯ РЕШЕНИЙ ПО СОСТАВЛЕНИЮ ПСИХОЛОГИЧЕСКОГО ПОРТРЕТА...............................................................................................................115
4.1. Программное обеспечение для сбора данных............................................115
4.2. Построение нейросетей и оценка эффективности.....................................119
4.3. Оценка психологических характеристик по признакам почерка.............122
Выводы..................................................................................................................125
ЗАКЛЮЧЕНИЕ.......................................................................................................127
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ..............................................130
ПРИЛОЖЕНИЕ 1....................................................................................................141
ПРИЛОЖЕНИЕ 2....................................................................................................166
ПРИЛОЖЕНИЕ 3....................................................................................................169
ВВЕДЕНИЕ
Актуальность исследования
Современный уровень развития вычислительной техники открывает качественно новые возможности по анализу данных. Несколько областей, в которых перспективно применение таких возможностей — медицина, информационная безопасность, криминалистическое почерковедение, а так же психология, которые в данный момент выходят на новый технический уровень.
Для поддержки принятия решений на основе эффективного нейросетевого распознавания почерка практически отсутствуют методы и средства, основанные на системном анализе параметров (характеристик человека) и объективно наблюдаемых переменных, представленных признаками его рукописного почерка. Важными компонентами информационной технологии (ИТ) являются [23]: методы и программно-технические средства обеспечивающие обработку, создание, хранение, поиск и распространение информации. Данная диссертация посвящена методам, алгоритмам и средствам ИТ для определения психологических характеристик по признакам почерка.
Доля подобных исследований в данном направлении мала, в то же время есть значительная заинтересованность специалистов МВД России, кадровых агентств, медицинских и школьных учреждений в нахождении (установлении) связи между заданными характеристиками (параметрами) человека и его признаками почерка. В связи с этим, возникает необходимость в разработке новых средств (алгоритмов, методов, методик и программных комплексов), которые позволят только по признакам почерка человека принять решение о его параметрах. Возможные сферы применения, в которых анализ почерка может оказаться эффективнее обычных тестов — определение состояния, например, операторов сложных механизмов, водителей, больных и т.п. На практике применение тестов требует значительных затрат и их можно научиться обманывать, а признаки по-
черка объективно проявляются в рукописи. Многообразие и разнородность параметров (признаков и психологических черт), отображающихся в рукописном тексте и характеризующих личность, требует использования математических, вероятностных и статистических методов исследования, и, в дальнейшем, создания автоматизированных средств, для решения поставленной задачи.
В практической деятельности эксперты, проводящие исследование почерка выполняют на своих рабочих местах большой объем, высококвалифицированной ручной работы. Анализ известных средств автоматизации ручных операций экспертов, выполняющих исследование почерка, например, такие как, «Почерк и личность 1.0.0.1», «Prognoz» и «Priznak», man-WO-man, «GraphExpress», Manuscript, Professional Psychologist, «FHWE v. 1.0», а также и других показывает необходимость в разработке новых эффективных средств, так как имеющиеся средства не позволяют в полном объеме обеспечить решение стоящих перед экспертом практических задач. Отсутствует программное обеспечение (ПО) для разработки и реализации на практике способа анализа взаимосвязи между признаками рукописного почерка и психологическими характеристиками для принятия решения о психологическом портрете по признакам почерка. Отсутствуют необходимые алгоритмы распознавания и принятия решения. Поэтому актуальной является разработка этих средств для решения важнейших практических задач почерковедения с использованием теории нейронных сетей и современных информационных технологий.
В своей работе автор ориентировался на «Основы политики РФ в области развития науки и технологий на период до 2010г. и дальнейшую перспективу» (от 30.03.2002г. Пр-576). Исследовательская и практическая часть работы проведена в соответствии с «Приоритетными направлениями развития науки, технологий и техники» (от 07.07.2011г. Пр-899), «Перечнем критических технологий РФ» (от 07.07.2011г. Пр-899).
Полученные научные и практические результаты способствуют эффективному выполнению различных приказов:
• МВД России, в частности: №511 от 29.06.2005г., посвященный вопросам организации производства судебных экспертиз в экспертно-криминалистических подразделениях (ЭКП) [99];
• Министерства юстиции РФ, в частности: №241 от 22.06.2006г., связанный с проблемой экспертной нагрузки государственных судебных экспертов [100]; №34 от 03.03.2006 г., посвященный плану основных научно-исследовательских работ в области судебной экспертизы [98], в части дальнейшего реализации этого плана по автоматизации важнейших элементов судебно-почерковедческой экспертизы.
Научно-технические результаты диссертационного исследования обеспечивают возможность дальнейшей реализации важнейшей Программы [78] МВД России «Создание единой информационно-телекоммуникационной системы органов внутренних дел» (ЕИТКС ОВД), путем создания информационных систем для работы с объектами почерка.
Научные исследования и проведенные эксперименты, связанные с исследованием почерка и построением психологического портрета исполнителя рукописи, были выполнены в рамках плана реализации государственного задания на выполнение научно-исследовательских работ (НИР) по теме [103]: «Разработка, программная реализация и внедрение современных технологий диагностики учащихся в рамках комплексной оценки их достижений» в соответствии с государственной программой города Москвы на среднесрочный период (2012-2016 гг.); развитие образования г. Москвы («Столичное образование»): мероприятие 03Г0200; оказание государственных услуг, выполнение работ государственными образовательными учреждениями высшего профессионального образования г. Москвы; государственное задание ГБОУ ВПО МГППУ на 2012 г.
Все перечисленное выше явилось фундаментом для выбора темы исследования, которая является новой и актуальной.
Различные проблемы исследования рукописного почерка, в том числе с учетом психологии, рассматривали следующие специалисты: Орлова В.Ф., Жи-жина М.В., Черенков A.M., Бородин А.П., Российская Е.Р., Серегин В.В., Рубцова
И.И., Сысоева JI.A., Погибко Ю.Н., Сидельникова Л.В., Герасимов А.Н, Кирсанов З.И., Рогозин А.П., Кулагин П.Г., Колонутова А.И., Кошманов П.М., Кошманов М.П., Седова Е.Л., Стречень H.A., Федорович В.Ю., Гусакова С.М., Комаров
A.C., Устинов В.В., Шкоропат Е.А., Левицкий А.Б., Кулик С.Д., Никонец Д.А., Алесковский С.Ю., Комиссарова Я.В., Осекова О.В., Яковлева Е.В., Симакова Е.С., Ефремов В.А., Попова O.A. и др.
Средства системного анализа, методы принятия решений, исследования операций и нейронных сети рассматривали многие специалисты, и в частности следующие: Черноруцкий И.Г., Орлов А.И., Taxa X., Галушкин А.И., Хайкин С., Горбань А.Н., Россиев Д.А., Тархов Д.А., Рутковская Д., Осовский С., Круглов
B.В. и др.
Необходимые сведения из работ этих ученых послужили теоретической и методологической основой данной диссертационной работы.
Диссертационная работа направлена на замену долгого и трудозатратного психологического тестирования более быстрым, удобным и простым анализом почерка. То есть по признакам рукописного почерка эффективно оценивать наличие той или иной эталонной (психологической) характеристики у испытуемого. Для этого необходимо разработать способ анализа почерка, правила принятия решений, оценить эффективность правила принятия решений, разработать архитектуру системы поддержки принятия решений и, далее, автоматизировать процесс анализа почерка, т.е. разработать и реализовать программное обеспечение.
Цель исследования — разработка средств (процедур) поддержки принятия решений при построении психологического портрета личности на основе нейро-сетевого распознавания почерка для повышения качества и эффективности обработки информации и достоверности принимаемых решений специалистами различных структур.
Объект исследования — массивы данных (о рукописном почерке для выявления эталонов на примере психологических характеристик).
Предмет исследования — методы, алгоритмы и средства их реализации, позволяющие спрогнозировать (оценить) эталонные характеристики личности по
признакам почерка для принятия эффективных решений.
В соответствии с целью, объектом и предметом исследования были определены следующие задачи:
1. Разработать и исследовать процедуру (способ) оценки информативных признаков для определения заданных характеристик (в частности психологических) на основе заданных признаков почерка.
2. Разработать и исследовать критерий оценки надежности выполненного прогноза.
3. Разработать и проанализировать архитектуру системы поддержки принятия решений при обработке эмпирических данных для определения психологических характеристик.
4. Разработать и экспериментально проверить программный комплекс, реализующий предложенный способ на практике и позволяющий обрабатывать рукописный текст в качестве входной информации, получая на выходе психологический портрет личности.
Для решения поставленных задач был использован комплекс следующих методов исследования:
• методы системного анализа [2, 117, 119];
• методы теории вероятностей и математической статистики [15, 53, 56, 112];
• методы теории нейронных сетей [17, 22, 105, 118, 123, 145];
• методы почерковедения и графологии в криминалистике [114];
• методы и средства программирования [77, 127].
Научная новизна исследования 1. Впервые разработан и исследован способ (процедура) оценки информативных признаков для определения заданных характеристик (в частности психологических) на основе признаков почерка, содержащий в качестве своих составляющих статистические методы и самообучающиеся структуры, позволяющий получать вероятностно-подобные оценки принадлежности личности к различным психологическим классам.
2. Разработан и исследован модифицированный нейросетевой алгоритм, основанный на вероятностной нейронной сети, использующий функцию близости, учитывающую значимость каждой из компонент с точки зрения дифференцируемой психологической характеристики, что повышает эффективность его применения в непараметрических задачах.
3. Разработан и исследован вероятностный критерий оценки надежности нейросе-тевого прогноза, формализующий процедуру отказа от принятия решения и позволяющий при многокритериальном выборе ранжировать множество субъектов внутри заданных классов.
Некоторая часть из новых результатов защищена патентом №111926 на полезную модель Федеральной службы по интеллектуальной собственности (Российского агентства по патентам и товарным знакам (РОСПАТЕНТ)) [65].
Теоретическая значимость
Теоретическую значимость данной работы представляет глубокий анализ взаимосвязи внешних легко и объективно измеримых факторов, под которыми понимаются криминалистические и графологические признаки почерка с особенностями психики субъекта.
Для оценки вышеупомянутых признаков используются строгие, в большинстве своем легко формализуемые правила. Руководствуясь данными правилами, большинство экспертов даст одинаковую характеристику образцу почерка. Для снятия возможных противоречий автором произведен отбор и необходимое описание признаков почерка, на которые он опирался при проведении данного исследования. Разработаны специальные методические указания, в соответствии с которыми следует производить оценку данных признаков почерка при воспроизведении результатов описанного эксперимента.
Подтверждение или опровержение гипотезы о связи между признаками почерка и психологическими характеристиками человека открывает широкие возможности для проведения дальнейших исследований в данной области. Наличие же подобной связи, если она будет выявлена, позволяет делать выводы о специ-
фических особенностях отражения психологических характеристик личности в зашумленных признаках почерка.
На основе данной работы возможно проведение дополнительного более глубокого анализа структуры самих психологических характеристик, используемых автором для экспериментальной проверки предложенных элементов технологии, и особенностей их формирования.
Практическая значимость исследования определяется тем, что полученные в ходе исследования данные по отражению психологических характеристик личности в признаках почерка, предложенные способ и СППР, а также разработанное программное обеспечение могут быть использованы:
• специалистами отделов кадров для отбора кандидатов на должность;
• специалистами МВД России для поиска преступников;
• специалистами по оценке функционального состояния операторов сложных технических систем;
• психологами для проведения диагностики по почерку;
• педагогами учебных заведений при консультировании учащихся.
На практике разработанные способ, ППР и СППР имеют следующие качественные и количественные
-
Похожие работы
- Методы, модели и алгоритмы распознавания клавиатурного почерка в ключевых системах
- Модели и методы выявления закономерностей в информационном потоке на примере рукописного текста с целью установления его авторства
- Разработка и исследование нейросетевых алгоритмов управления стационарными и нестационарными объектами
- Разработка и исследование компьютерной модели динамики системы "пользователь-мышь"
- Разработка и исследование коллективных нейросетевых алгоритмов дикторонезависимого распознавания речевых сигналов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность