автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Принципы и логические средства интеллектуального анализа социологических данных
Автореферат диссертации по теме "Принципы и логические средства интеллектуального анализа социологических данных"
005012129
Михеенкова Мария Анатольевна
Принципы и логические средства интеллектуального анализа социологических данных
Специальность 05.13.17 Теоретические основы информатики
АВТОРЕФЕРАТ диссертации на соискание учёной степени доктора технических наук
1 2 ¿012
МОСКВА 2011
005012129
Работа выполнена во Всероссийском институте научной и технической информации РАН (ВИНИТИ РАН)
Научный консультант: доктор технических наук, профессор, Заслуженный деятель науки РФ Финн Виктор Константинович
Официальные оппоненты: доктор технических наук, профессор
Вагин Вадим Николаевич
Ведущая организация: Институт проблем управления им. В.А. Трапезникова
Защита диссертации состоится 28 марта 2012 г. в 11°° часов на заседании диссертационного совета Д 002.026.01 при Всероссийском институте научной и технической информации РАН (ВИНИТИ РАН) по адресу: 125190, Москва, ул. Усиевича, д. 20, комн. 502. Тел. совета (499) 155-46-21.
С диссертацией можно ознакомиться в библиотеке ВИНИТИ РАН. Автореферат разослан < _2012 г.
Учёный секретарь диссертационного совета Д 002.026.01 доктор технических наук, профессор
доктор технических наук, профессор Гаврилова Татьяна Альбертовна
доктор физико-математических наук, профессор Грушо Александр Александрович
РАН
Цветкова Валентина Алексеевна
Общая характеристика работы
Актуальность темы диссертации
Интеллектуальный анализ данных является одним из приоритетных направлений исследований в области искусственного интеллекта. Его возможности в области представления данных и знаний, создания методов обнаружения новых знаний и извлечения закономерностей особенно востребованы в областях с обширными массивами исходных фактов, нуждающихся в структурировании, упорядочении и систематизации. Широкое распространение качественных методов анализа социологических данных в сочетании с отсутствием развитых инструментов преобразования плохо структурированных данных в знания свидетельствуют о назревшей потребности интеллектуализации исследовательских эвристик, принятых в этой области, с последующей реализацией в современных компьютерных системах.
Развитие социологии как эмпирической науки неотделимо от перманентных дискуссий о соотношении теоретического, концептуального подхода к изучению социальных явлений и феноменологической составляющей этого процесса. Стремление придать социальным исследованиям по возможности объективный характер и исходное представление об общности естественнонаучного и социально-исторического познания отразилось в намерении исследователей использовать методы, обладающие достаточно развитым формальным аппаратом и принятые в естественных науках. Массовый характер многих социальных явлений и очевидные трудности учёта множества влияющих на них факторов привели к тотальному доминированию количественных и, прежде всего, статистических методов изучения социальной действительности.
Однако представление о единстве теоретико-методологических моделей естествознания и социальных наук и соответствующее ему отношение к субъекту поведения как обезличенной типической модели трудно совместимо с интересом к изучению взаимодействия мотивированных, целенаправленно действующих, учитывающих важные для них факторы индивидуумов. Отсюда естественно возникает восприятие социологии как науки, «...стремящейся, истолковывая, понять социальное действие и тем самым каузально объяснить его процесс и воздействие»1, а социального действия - как осмысленного, соотносящегося с действием других людей и ориентирующегося на него.
Стремление к развитию «понимающей» социологии (не просто воспринимающей и описывающей непосредственно эмпирические явления, но и объясняющей смысловые связи в этих явлениях), анализу форм человеческих взаимодействий, не являющихся простым проявлением воздействия социальной структуры, привело к развитию качественных - в противоположность количественным - методов, концентрирующихся на
1 М Вебер. Избранное: протестантская этика и дух капитализма. М.: РОССПЭН, 2006, с. 453.
3
социальных взаимодействиях, личностном повседневном опыте действующего субъекта. Фундаментальной слабостью качественного анализа, рассматриваемого широко как исследование, не использующее формальных средств, оказалась прямая зависимость от способностей, здравого смысла и воображения исследователя, а порождаемые эмпирические теории заслужили статус уникальных и невоспроизводимых. С развитием компьютерной техники объективизация качественных исследований первоначально пошла по пути усовершенствования обработки, структурирования и управления данными, и здесь возможности современной генерации пакетов CAQDAS2 (Computer-Assisted Qualitative Data Analysis Software) выглядят достаточно впечатляющими.
Вызванный этим сдвиг стандартов в качественном анализе в сторону строгости заставил социологов обратиться к специалистам в области искусственного интеллекта (ИИ) с призывом к развитию средств, формализующих аналитические индуктивные стратегии создания теорий и связанные с этим когнитивные процессы абдукции. С точки зрения эпистемологического содержания качественный анализ видится как «восходящая» стратегия «доказательного и последовательного» построения теории на основе эмпирических фактов. Таким образом, речь идёт о получении нового знания из эмпирического материала. Формализация этой стратегии - формализованный качественный анализ социологических данных (ФКАСД) - предполагает создание инструмента для анализа нечисловых отношений и установление причин эффектов на основе этого анализа. Использование методов искусственного интеллекта (ИИ) в этом процессе позволяет говорить об интеллектуальном анализе социологических данных (ИАСД, knowledge discovery в социологии).
Целью диссертационной работы является создание логических средств для формализованного качественного анализа социологических данных с использованием методов искусственного интеллекта, а также разработка понятийного и логического аппарата для поддержки социологических исследований. Это означает, в частности, формализацию эвристик качественного анализа социологических данных для решения задач когнитивной социологии - направления в современной социологии, использующего когнитивные средства анализа данных, - и их реализацию средствами современных компьютерных интеллектуальных систем.
Вдохновляющим основанием для такой постановки является фундаментальный тезис об основной задаче интеллектуальных систем (ИС) как задаче конструктивной имитации (возможно, лишь до некоторой степени) познавательных способностей человека3. Реализация таких способностей в ИС предполагает наличие средств извлечения знаний из баз
2 Lewins A., Silver С. Using Software in Qualitative Research: A Step by Step Guide. London: Sage Publications 2007.
3 См. Финн B.K. К структурной когнитологии: феноменология сознания с точки зрения искусственного интеллекта // Вопросы философии, 2009, № 1, с, 4 - 20.
фактов (БФ), автоматического порождения гипотез и объяснения имеющихся фактов на основании порожденных гипотез, а также способность осуществлять дедуктивный вывод из исходных и полученных знаний (баз знаний, БЗ).
Таким образом, интеллектуальный анализ социологических данных (ИАСД) - автоматическое извлечение интерпретируемых зависимостей, неявно содержащихся в массивах эмпирических данных, между различными факторами - позволяет говорить о возможности построения теории на основе эмпирических фактов средствами формализованных познавательных процедур в компьютерных системах высокого уровня. Такой анализ требует более высокого, чем это принято в качественном анализе, уровня формализации изучаемых психосоциальных явлений и нуждается в первичном структурировании данных и знаний и формировании системы отношений для них. Следующим шагом оказывается выбор адекватных предложенному представлению формальных средств анализа. В совокупности это означает создание формального языка с дескриптивной и аргументативной функциями - для представления данных и знаний (с возможностью определения их сходства) и формализации рассуждений (и выдвижения гипотез), соответственно.
Для реализации этих целей в диссертации решены следующие задачи:
- первичная структуризация данных и знаний о социальном субъекте и его поведении (действиях, поведенческих установках, мнениях);
- разработка логических и понятийных средств для формализации правдоподобных рассуждений в базах эмпирических социологических фактов с нечисловыми параметрами;
- логическая формализация принципа ситуационного детерминизма, позволяющего включать контекст поведения в структуру анализа;
- задание формальной структуры закрытых опросов - теоретической основы для представления предсказательных опросов;
- формулирование логических принципов анализа рациональности мнений;
- создание архитектуры интеллектуальной системы типа ДСМ для формализованного качественного анализа социологических данных, включающей средства распознавания рациональности мнений.
Методы исследования
В работе используются методы математической логики и интеллектуального анализа данных - ДСМ-метод автоматического порождения гипотез, прежде всего. Для создания архитектуры Интеллектуальных систем для качественного анализа социологических данных используются методологические принципы конструирования интеллектуальных систем типа ДСМ (ИС-ДСМ). При этом практические исследования требуют препроцессинга данных для настройки на класс решаемых задач, осуществляемого в рамках инженерии знаний в диалоге ИС и эксперта-социолога. Для подготовки эмпирических социологических
данных используются различные качественные методологии, а также традиционное анкетирование.
Научная новизна работы состоит в формализации исследовательских эвристик социолога современными логическими средствами, позволяющими осуществлять каузальный анализ социального действия, решая, тем самым, задачи классической «понимающей социологии». Основным инструментом такого анализа является ДСМ-метод автоматического порождения гипотез, являющийся синтезом познавательных процедур4 - эмпирической индукции (формальных расширений и уточнений индуктивных методов Д.С. Милля), структурной аналогии и абдукции (принятия гипотез на основе объяснения исходных данных) Ч.С. Пирса. Источником детерминаций поведения при этом является сходство субъектов поведения, что требует разработки принципов представления знаний о субъекте поведения и самом поведении.
Формализация и уточнение указанных процедур для использования их при анализе эмпирических социологических данных является пионерской и не имеет прецедентов в современной практике - как социологической, так и в области исследований Искусственный интеллект. Заметим, что в качественном анализе социологических данных встречается неформальное использование методов Д.С. Милля. При этом очевидной подразумевается невозможность их формализации, а даже минимальное использование логических средств (булевой алгебры) в таком анализе воспринимается как «революция» .
Расширение класса социологических задач - рассмотрение такой специфической формы поведения как мнение - потребовало адекватного расширения языка представления данных о мнениях индивидуумов и создания процедур для рассуждения «от причины - к следствию» (от сходства мнений - к сходству индивидуумов) - обратного ДСМ-метода. Включение ситуационных параметров реализации поведения (контекста поведения) также потребовало создания новых формальных средств их адекватного представления и учёта - ситуационной версии ДСМ-метода.
Существенным расширением имеющихся логических средств является реализация познавательной активности «анализ данных - предсказание -объяснение» в форме эвристики «алгебра логики - аналогия - абдукция» с использованием булевой алгебры для порождения гипотез о причинных зависимостях. При этом предлагаемые средства значительно превосходят по своим познавательным возможностям известный в мировой социологический практике инструмент качественного анализа данных - Качественный Сравнительный Анализ (Qualitative Comparative Analysis6, QCA) американского социолога Ч. Рейджина, где используется лишь одна
4 Финн В.К. Синтез познавательных процедур и проблема индукции // НТИ, Сер.2,1999, № 1-2, с. 8 - 45.
5 Vaisey S. QCA 3.0: The "Ragin Révolution" Continues // Contemporary Sociology: A Journal of Reviews 2009 vol. 38, No 4, p. 308-312.
6 Rihoux В., Ragin C.C. (eds). Configurational Comparative Methods. Qualitative Comparative Analysis (QCA) and related techniques (Applied Social Research Methods). Thousand Oaks. CA and London: SAGE Publications Inc 2009.
составляющая предлагаемой схемы: анализ сходства примеров социальных явлений средствами алгебры логики.
Другим новым направлением является точное определение закрытых опросов посредством задания формальной структуры. Предлагаемая теоретическая концепция предусматривает использование средств многозначных логик аргументации, формализующих шкалы оценок результатов опросов. В рамках этой структуры создаются логические и процедурные средства распознавания и предсказания рациональности результатов опроса, понимаемой как выбор вариантов ответов на основе аргументационной схемы. Использование средств формальной аргументации для автоматического формирования мнений меняет традиционную опросную схему и позволяет объективизировать социологические данные, являющиеся исходными для формализованных процедур рассуждений. Интеллектуальный анализ данных осуществляется, таким образом, для целого класса закрытых опросов со стабилизированным множеством ответов (при расширении множества респондентов новые варианты ответов не появляются) и формализацией когнитивных рассуждений.
Развитые теоретические принципы и логический аппарат формализации закрытых опросов позволяют охарактеризовать идеальный тип опроса, выражающий концептуализацию технологии анализа и прогнозирования мнений. Идеальный тип составляет каркас новой технологии социологического опроса - с использованием аргументационной семантики и логической структуры опроса, - допускающий возможные технологические реализации.
Наконец, формализация качественного анализа средствами ИИ, т. е. интеллектуальный анализ социологических данных, может рассматриваться как новый когнитивный инструмент, который реализуется в современных интеллектуальных системах (ИС типа ДСМ) и представляет собой формализованную оболочку для решения проблем когнитивной социологии -порождения нового знания из эмпирических социологических данных и анализа влияния когнитивной деятельности на социальное поведение.
Теоретическая и практическая значимость работы
Теоретическая значимость работы состоит в разработке средств представления и объективизации фактов (результатов эмпирических наблюдений) и знаний (результатов применения когнитивных процедур) о социальном поведении и мнении, создании концептуального и логического аппарата формализованного качественного анализа социологических данных, использующего правдоподобные (нестатистические) рассуждения - ДСМ-метод автоматического порождения гипотез. Формальный аппарат может служить не только логическим средством анализа эмпирических социологических данных о поведении социальных субъектов (как индивидов, так и социальных общностей), но и даёт возможность приближения к логической реконструкции идей классической «понимающей» социологии, в частности построения формальной теории каузального объяснения
социального поведения. Разработка теоретических принципов и логического аппарата для формализации закрытых опросов, анализа мнений и логических средств распознавания рациональности мнений, включающих средства формальной аргументации, также имеет несомненную ценность для развития объективных подходов в области социальных исследований.
Практическая ценность работы заключается в разработке научных основ технологии интеллектуального анализа социологических данных, в частности, технологии социологического опроса и нестатистического изучения мнений. Для реализации технологий такого рода предусмотрена специальная архитектура Интеллектуальной системы типа ДСМ, включающей как средства предварительной обработки эмпирических социологических данных, так и специфические процедуры для их анализа. Система дополняется инструментами анализа рациональности мнений на основе аргументационной семантики и ДСМ-рассуждений. Предложенные подходы могут быть использованы для анализа и предсказания результатов реальных опросов.
Достоверность и обоснованность результатов определяется использованием комплекса методов математической логики и интеллектуального анализа данных - ДСМ-метода автоматического порождения гипотез, прежде всего. Подтверждением этого являются практические исследования - изучение поведения рабочих на конфликтных предприятиях (совместно с Институтом социологии РАН), а также анализ электоральных предпочтений и рациональности электорального выбора студентов (совместно с РГГУ).
Основные результаты и положения, выносимые на защиту:
разработка средств представления и объективизации фактов и знаний о социальном поведении и мнении для решения задач социологии и социальной психологии;
- создание концептуального и логического аппарата формализованного качественного анализа мнений;
- формальное представление синтеза познавательных процедур, использующих алгебру логики для порождения гипотез о причинных зависимостях;
- создание новых логических средств для порождения детерминаций с учётом контекста социального поведения - ситуационного ДСМ-метода;
- задание формальной структуры закрытых от-значных (т>2) опросов и предсказательных опросов;
- создание логических и процедурных средств распознавания рациональности результатов опроса;
- предложение новой технологии опроса (с учётом некоммутативности различных видов опросов) с использованием средств многозначных логик аргументации, формализующих шкалы оценок результатов опросов;
создание архитектуры новых когнитивных инструментов - ИС-ДСМ для формализованного качественного анализа социологических данных, формализованной оболочки для решения проблем когнитивной социологии (с предварительной содержательной работой социолога).
Личный вклад автора диссертации в совместных работах с другими авторами был существенным, а во многих случаях и решающим. Автору диссертации принадлежит разработка принципов представления знаний о социальном субъекте и его поведении, формулировка основных процедур анализа данных - обратного ДСМ-метода и ДСМ-метода с параметром ситуации, а также формализация синтеза познавательных процедур с использованием алгебры логики. Автор самостоятельно проводил экспериментальные исследования (разумеется, в кооперации с экспертами-социологами для предоставления эмпирического материала) поведения и анализа электоральных мнений. В последнем, в частности, вычислялись предложенные автором критерии рациональности мнений. Автором развиты предложения по внедрению средств логики аргументации в опросные технологии для объективного формирования мнений. Формирование концепции формализованного качественного анализа социологических данных и его применения к задачам когнитивной социологии также принадлежит автору. То же относится к разработке принципов архитектуры обучающей интеллектуальной системы для анализа социологических данных, а также принципов создания информационной среды и интеллектуального интерфейса для ИС-ДСМ, реализующей ФКАСД. Реализация этих принципов осуществлена в ИС, созданных под руководством автора диссертации.
Апробация работы
Основные положения и результаты работы докладывались и обсуждались на всероссийских и международных конференциях, конгрессах, чтениях:
1. 4-я международная конференция «Интеграция. Информационные технологии. Телекоммуникации. НТИ-99», Москва, Март 17-19,1999.
2. VII Национальная конференция с международным участием «Искусственный интеллект-2000», Переславль-Залесский, Октябрь 2426,2000.
3. VIII Национальная конференция с международным участием «Искусственный интеллект-2002», Коломна, Октябрь 8-11, 2002.
4. 6-я Международная конференция «НТИ-2002»: «Информационное общество. Интеллектуальная обработка информации. Информационные технологии», 16-18 октября, 2002.
5. Сорокинские чтения-2002, «Актуальные проблемы социологической науки и социальной практики», Москва, Декабрь 17-18,2002.
6. II Всероссийский социологический конгресс «Российское общество и социология в XXI веке: социальные вызовы и альтернативы», Москва, 30 сентября - 2 октября, 2003.
7. Международная конференция «Математическое моделирование социальной и экономической динамики (ММ8ЕВ-2004)», Москва, 23 -25 июня, 2004.
8. IX Национальная конференция с международным участием «Искусственный интеллект-2004», Тверь, Сентябрь 8-11,2004.
9. I Всероссийская научная конференция Сорокинские чтения-2004: "Российское общество и вызовы глобализации», Москва, 7-8 декабря 2004.
10. Всероссийская междисциплинарная конференция «Философия искусственного интеллекта», Москва, 17-19 января, 2005.
11. Первая международная конференция «Системный анализ и информационные технологии» САИТ-2005, Переславль-Залесский, 12-16 сентября 2005 г.
12. X Национальная конференция с международным участием «Искусственный интеллект-2006», Обнинск, Сентябрь 26-28,2006.
13. III Всероссийский социологический конгресс «Глобализация и социальные изменения в современной России», Москва, 3-5 октября,
2006 г.
14. Вторая международная конференция «Системный анализ и информационные технологии» САИТ-2007, Обнинск, 10 - 14 сентября
2007 г.
15. 7-ая международная конференция НТИ-2007 «Информационное общество. Интеллектуальная обработка информации. Информационные технологии», 24-26 октября 2007 г., Москва, ВИНИТИ.
16. III Всероссийская научная конференция Сорокинские чтения: "Социальные процессы в современной России: традиции и инновации» в 5 томах, Москва, 4-5 декабря 2007.
17. XI Национальная конференция с международным участием «Искусственный интеллект-2008», Дубна, 29 сентября - 2 октября
2008 г.
18. III Всероссийский социологический конгресс «Социология и общество: проблемы и пути взаимодействия», Москва, 21-24 октября 2008 г.
19. Международная научная конференция - Первые Санкт-Петербургские социологические чтения «Питирим Александрович Сорокин и современные проблемы социологии», С.-Пб., 16-17 апреля 2009 г.
20. Третья международная конференция «Системный анализ и информационные технологии» САИТ-2009, Звенигород, 14-18 сентября
2009 г.
21. Гуманитарные чтения РГГУ-2010, Москва, 26 марта - 2 апреля 2010 г.
22. Четвертая международная конференция по когнитивной науке, Томск, 22 -26 июня 2010 г.
23. XII Национальная конференция с международным участием «Искусственный интеллект-2010», Тверь, 20 - 24 Сентября 2010 г.
24. Российско-британская конференция «Идеи Д.С. Милля об индукции и логике наук о человеке и обществе в когнитивных исследованиях и
системах искусственного интеллекта», Москва, РГГУ, 15 - 17 июня
2011г.
25. V Поспеловские чтения «Искусственный интеллект: проблемы и
перспективы», Москва, Политехнический музей, 29 - 30 ноября 2011 г.
Под руководством автора диссертации и по тематике исследования аспиранткой ВИНИТИ РАН Ж.И. Бурковской была защищена диссертация по специальности 05.25.05 - информационные системы и процессы - по теме «Создание информационной среды для Интеллектуальной системы анализа социологических данных». Содержание работы включено в лекционные курсы, читаемые автором в Отделении интеллектуальных систем Института лингвистики РГГУ и на факультете Социологии НИУ-ВШЭ.
Публикации
Содержание диссертации опубликовано в статьях в ведущих отечественных и зарубежных журналах, а также в материалах перечисленных выше конференций, конгрессов, чтений (всего 43 печатные работы, из них -13 опубликованы в журналах, входящих в Перечень ВАК). Опубликованные по теме диссертации работы полностью отражают ее содержание. В конце автореферата приведены: список работ, опубликованных в рецензируемых журналах, входящих в Перечень ВАК, список работ, опубликованных в других изданиях, а также работ, опубликованных в материалах конференций.
Структура и объем работы.
Диссертация состоит из Введения, 6 глав, Заключения и списка цитированной литературы. Объем диссертации составляет 216 страниц, 4 рисунка, 6 таблиц. Список цитированной литературы включает 182 наименования.
Содержание работы
Во Введении дан краткий обзор актуальных проблем формализации анализа качественных (неколичественных) данных в социологии, показана научная новизна и практическая значимость полученных результатов, представлено краткое содержание и основные результаты работы.
В Первой главе рассматривается процесс развития подходов к качественному анализу социологических данных - от качественного анализа как такового до использования компьютерных инструментов. Эволюция последних означает переход от простой компьютерной обработки данных к современному интеллектуальному анализу данных.
В главе представлен обзор современных средств компьютерной поддержки качественных исследований - СА(Д)А8. Если суммировать возможности последней генерации пакетов САОБАБ, можно утверждать, что главные достижения этих инструментов лежат в области обработки, структурирования и управления данными (текстами, графическими
объектами, аудио-, видео-), но никак не в области анализа - извлечения нового знания из имеющихся данных. Компьютер не обеспечивает даже простого выигрыша во времени: для более тщательной подготовки и ввода данных его требуется достаточно много. Что бесспорно - компьютер позволяет выполнить обработку данных более тщательным и систематическим образом, делает её результаты прозрачными и, соответственно, объясняемыми, позволяет обрабатывать большие объёмы информации, хотя иногда при этом возникает опасность оказаться погребенными под этими массивами. К сожалению, нельзя считать, что в общем случае компьютерный анализ даёт более надёжные, достоверные и объективные результаты - многое здесь по-прежнему зависит от самого исследователя.
Следует сказать, что большинство инструментов CAQDAS создавалось под влиянием парадигмы одной из наиболее развитых и авторитетных методологий качественного анализа - «обоснованной теории» (grounded theory)7. Эта методология предполагает построение теории на основе эмпирических фактов с использованием индуктивного анализа и ориентируется, прежде всего, на анализ свидетельств информантов, не сосредотачиваясь на фиксации процедур рассуждений.
Использование компьютера способствует реабилитации качественного анализа в глазах «жёстких» позитивистов и более широкому его распространению, в особенности там, где слабости количественного подхода очевидны. Но CAQDAS не заменяет аналитика, а лишь усиливает возможности исследователя по кодированию текстов и упорядочиванию данных. Разумеется, эффективное усиление возможно лишь там, где выбор пакета соотносится, прежде всего, с природой задачи и потребностями исследования. К сожалению, часто при работе с CAQDAS эксплуатируется лишь возможность управления данными, а более продвинутые опции остаются невостребованными. На распространении этих инструментов сказываются даже более банальные факторы: наличие пакета в распоряжении коллектива, интерес руководства к их приобретению, готовность компьютерных центров исследовательской организации осваивать и поддерживать их. Обучение работе часто происходит в процессе самой работы, а информация о пакетах распространяется их поклонниками. Это даже заставляет порой апологетов CAQDAS сетовать: «Компьютеризация социальных наук началась и закончилась статистическими пакетами» .
С момента появления «Системы логики» английского философа и логика Д.С. Милля9 теоретическую социологическую мысль прельщала возможность использования индуктивных правил для анализа социологических данных, хотя и сам Д.С. Милль, и Э. Дюркгейм, и др.
7 Glaser В., Strauss A. The Discovery of Grounded Theory: Strategies for Qualitative Research. Chicago, New York: Aldine de Gruyter. 1967.
* Fielding N. G. Automating the ineffable: Qualitative software and the meaning of qualitative research // In: Tim May (ed.). Qualitative research in action. Sage Publication Inc. London. 2003 (403 p.). p. 169.
* Последнее издание на русском языке: Милль Д.С. Система логики силлогистической и индуктивной. М.: ЛЕН АНД, 2011.
отмечали ограниченность их возможностей в этой области. Современные исследователи готовы числить методы Милля инструментальным воплощением приёмов экспериментальной социологии, но в неформальном виде - ввиду отсутствия в их распоряжении форматизаций этих методов.
Для реализации этих устремлений, для решения проблем качественной социологии в качестве инструмента современного интеллектуального анализа социологических данных предлагается ДСМ-метод автоматического порождения гипотез, реализующий формализованный качественный анализ социологических данных - формальный анализ нечисловых отношений.
Глава 2 посвящена построению формальных оснований для поиска закономерностей социального поведения. Предлагаются подходы к решению проблемы логической систематизации социологических знаний, т.е. выделения исходных отношений и установления зависимостей между ними, разрабатывается логический язык для представления данных и знаний о субъекте и поведении, а также формализации рассуждений о фактах социальной действительности. Описываются формальные средства ДСМ-метода автоматического порождения гипотез (ДСМ-метода АПГ), предназначенные для автоматического извлечения интерпретируемых зависимостей из имеющегося эмпирического материала. ДСМ-метод представляет собой специальный класс рассуждений (ДСМ-рассуждения), реализующий синтез познавательных процедур - эмпирической индукции (формальных расширений и уточнений индуктивных методов Д.С. Милля, в честь которого и назван метод), структурной аналогии (переносе гипотез о причинах на случаи с неопределенным исходом) и абдуктивного рассуждения Ч.С. Пирса как средства принятия гипотез на основе объяснения начальных данных. Будучи методом интеллектуального анализа данных, в приложении к анализу нечисловых социологических данных ДСМ-метод оказывается современным инструментом формализованного качественного анализа социологических данных (ФКАСД).
Рассматривается два класса задач: анализ социального поведения, реализующий рассуждение типа «от причины - к следствию» - прямой ДСМ-метод, - и анализ мнений, где реализуется тип рассуждений «от следствия - к причине», обратный ДСМ-метод. Соответственно, описываются предикаты и правила правдоподобного вывода (п.п.в.) для прямого и обратного методов.
Фундаментальным принципом качественного анализа данных является принцип «сходство фактов влечет наличие (отсутствие) изучаемого эффекта и его повторяемость». Конкретизируя его для реализации идеи причинности, можно сказать, что в рамках качественного анализа исследуется тип каузальности «структура-эффект» (а не «явление - явление»). Гипотетические причины представляются в виде сходств фактов, имеющих определенную структуру, т.е. «сходство» в этой схеме является нестатистическим и может анализироваться посредством логико-алгебраического подхода (С5СА) и средств интеллектуального анализа данных, включающих формализацию индуктивных процедур (ДСМ-метод
АПГ). Подчеркнем, что порождение причинно-следственных зависимостей на основе структурного сходства позволяет анализировать небольшие массивы данных (например, малые группы), что является несомненным преимуществом качественного анализа по сравнению с количественным при решении ряда проблем - прежде всего, связанных с представлениями классической «понимающей социологии» М. Вебера.
Этим проблемам соответствует круг задач формализованного качественного анализа. Соответственно, интеллектуальный анализ социологических данных (ИАСД) и реализующая его интеллектуальная система предполагают возможность
- исследования индивидуального поведения, порождения детерминант поведения и типологизации социума на их основе;
- анализа и прогнозирования мнений респондентов как варианта поведения;
-выяснения влияния ситуации на поведение индивидуума;
- анализа рациональности мнений (в т.ч. степени рациональности мнений данной социальной общности).
Из описанного принципа структурного сходства как источника детерминаций вытекает потребность первичной (до решения собственно задач ФКАСД) структуризациии данных и знаний, т.е. предварительной алгебраической формализации сходства объектов и их свойств. Однако при существующей традиции обработки эмпирических социологических данных количественными методами и, соответственно, подготовки данных именно для такого анализа реализация этой потребности трудно достижима.
В предлагаемом варианте формализованного качественного анализа социологических данных с использованием ДСМ-рассуждений указанная трудность преодолевается выделением обозримого множества характеристик социальных субъектов (как индивидов, так и социальных общностей). Основой представления знаний о субъекте является так называемый «постулат поведения» - один из основных принципов формирования БЗ в ИАСД. Этот постулат адекватно отражает представления современных социологов: «для анализа поведения необходимо знать ... структуру характера, типичного для данной социальной системы»10. Сюда же можно отнести представления Д.С. Милля о возможности предсказания поведения индивида на основе знания о его характере и настроениях.
Пусть имеются три множества характеристик, входящих в описание субъекта поведения: признаки, представляющие социальный характер" субъекта (5С); индивидуальные черты личности (1Р)\ биографические данные (ВО), Поведение В субъекта С определяется подмножеством характеристик £>е/сС таким, что Ве1 = Пе^Ве^иОе^, где с(50)&(£)е?2с(/Р))& (йе^с(ВП)), причем хотя бы одно £)е/,- Ф 0, / = 1, 2, 3. Таким образом, индивидуальные характеристики социального субъекта являются
10 Парсонс Т. О структуре социального действия. М: Академический Проект, 2000.
" В соответствии с представлением Э. Фромма (Фромм Э. Иметь шга быть. M.: ACT, 2000).
информативным основанием для порождения детерминант социального поведения и, соответственно, материалом для построения возможных моделей социальной структуры с использованием установленных детерминант поведения.
На успешное решение задач ИАСД можно надеяться, лишь опираясь на один из главных его принципов: выбор методов анализа должен быть адекватен исследуемой социальной реальности - об остроте проблемы такого соотнесения писал еще П.А. Сорокин12. Вопреки традициям количественного анализа, социальные явления по большей части не представляются множествами случайных событий, которые только и мо1уг изучаться статистическими средствами. Для анализа каузально обусловленных событий, к которым «понимающая» социология относит социальные взаимодействия, необходимы детерминистские методы. Разумеется, о причинной обусловленности социальных явлений (таких как, к примеру, индивидуальное поведение) можно говорить, имея в виду некоторые уточнения. Детерминированность здесь - это, скорее, предрасположенность к совершению поведенческих актов (действий, установок, мнений). Более того, предрасположенность эта реализуется при отсутствии противодействующих влияний (как внутренних - личностных, так и внешних - ситуационных).
Формализуемость отношения сходства между позитивными (+)- и негативными (-)-фактами (далее иногда - (±)-фактами) мира (социума) наличие в БФ позитивных и негативных примеров изучаемого эффекта поведения и предполагаемая (±)-квазисимметрия причин (существенных влияний)'3 проявления этих эффектов являются основанием для реализации основного принципа качественного анализа социологических данных. Указанные условия составляют принципиальные для успешного применения ДСМ-метода онтологические допущения и описывают класс задач, для решения которых создаются различные ИС, реализующие один тип формализованных эвристик: «сходство - аналогия - абдукция».
В ДСМ-методе автоматического порождения гипотез указанная схема формализованного качественного анализа социологических данных представляется эвристической схемой «индукция - аналогия - абдукция». Реализующий эту схему синтез познавательных процедур, примененный к объединению БФ и БЗ, порождает новое знание - расширение БЗ.
Подчеркнем, что наличие в социуме позитивных и негативных причинно-следственных зависимостей ((±)-причин) типа «подмножество характеристик субъекта есть причина наличия (отсутствия) эффектов поведения (поведенческих актов, установок, мнений)» не просто делает качественный анализ предпочтительнее статистического (количественного). Это фундаментальная характеристика социума W(±), которая является
" Сорокин П.А. Квантофрения // В кн.: Социология. Хрестоматия для вузов. Составитель А.И. Кравченко. М.: Академический проект, 2002, с. 63 - 74.
13 Мы говорим о квазисимметрии (а не о полной симметрии) позитивных и негативных влияний, так как отсутствие эффекта может быть вызвано не только наличием негативного влияния, но и явным отсутствием позитивного.
основанием для реализации двух важнейших функций формализованного эмпирического исследования. Во-первых, наличие (±)-причин позволяет автоматически порождать фальсификаторы индуктивных гипотез, что увеличивает их степень правдоподобия (что важно для правдоподобных ДСМ-рассуждений). Во-вторых, представление о наличии у каждого (±)-факта объясняющей его (±)-причины (называемое в ДСМ-методе аксиомами каузальной полноты АКП(±)) является основанием для абдуктивного принятия порождаемых гипотез, что соответствует важнейшему принципу объяснения результатов в ИАСД.
ДСМ-метод состоит из: описанных выше условий применимости; правдоподобных ДСМ-рассуждений (синтеза трех познавательных процедур), представленных в формальном языке с дескриптивной и аргументативной функциями; квазиаксиоматаческих теорий КАТ (см. ниже) для представления и систематизации открытого множества знаний о предметной области; дедуктивной имитации правдоподобных рассуждений в КАТ (гарантирующей корректность их результатов); интеллектуальных систем с Рассуждателем, реализующим ДСМ-рассуждения (ИС-ДСМ), и базой знаний БЗ, представленной соответствующей КАТ. Дополнением к этому являются средства распознавания непротиворечивости различных стратегий ДСМ-рассуждений, а также выявления законов и тенденций среди полученных эмпирических закономерностей14. Это означает реализацию в ИС-ДСМ главного принципа ИАСД - имитации познавательной деятельности «анализ данных - предсказание - объяснение» средствами формального языка с дескриптивной и аргументативной функцией.
Открытая квазиаксиоматическая теория КАТ формируется с помощью формализованных правил правдоподобного вывода на основе исходной базы фактов. КАТ есть 3 = <£, Б', 31), где 2 - открытое (допускающее пополнение) множество аксиом, лишь частично характеризующих предметную область,
- открытое множество фактов и гипотез, а 31 - множество правил 31р правдоподобного и 31л достоверного вывода, 31 = 3^ и 31^. В ИС-ДСМ множество ¿Йр правил правдоподобного вывода представлено синтезом познавательных процедур - взаимодействием индукции, аналогии и абдукции. Г представляет начальную БФ предметной области типа БЗ 2 изначально включает в себя инвариантное для всех допустимых ядро и специфицирующие предметную область аксиомы.
Для формализации ДСМ-рассуждений формулируется язык представления знаний (ДСМ-язык), включающий:
- индивидные переменные 1-го сорта X, Ъ, V, ... (быть может, с нижними индексами) - переменные для объектов и подобъектов (например, субъектов поведения); С, Сь С2,... - индивидные константы 1-го сорта;
- индивидные константы 2-го сорта У, и, ЧУ, ... (быть может, с нижними индексами) - переменные для эффектов (например, эффектов
14 Фиш В.К. 06 определении эмпирических закономерностей посредством ДСМ-метода автоматического порождения гипотез // Искусственный интеллект и принятие решений, 2010, № 4, с. 41 - 48.
поведения); С!, СЬ, СЬ, а также А, А!, А2, ... - индивидные константы 2-го сорта;
- переменные для натуральных чисел: и, т, к,...;
- функциональные символы (для булевской структуры данных): 0, —, п, и.
- двуместные предикатные символы: с (для множеств - подобъектов, объектов и множеств свойств), = (для переменных приведённых трёх сортов), >, < (для числовых переменных); =>ь =>2,3<=;
- логические связки двузначной логики: &, V, -»;
- унарные логические связки - ./-операторы Россера-Тюркетга 7-, где Р"=
(V, п) или у = (т, л), V б {1, -1, 0}, п = 0, 1, 2, ...; 1, -1, 0, т - типы истинностных значений «фактическая истина», «фактическая ложь», «фактическое противоречие» и «неопределенность», соответственно;
- кванторы V, 3 (соответственно, для трёх сортов индивидных переменных).
Термы и формулы языка определяются стандартным образом, но с добавлением формул переменной длины15 для отображения сходства конечного, но заранее не определённого числа примеров.
Пусть даны конечные множества и(1) = {с?,, 4} - множество характеристик социальных субъектов (описанных в соответствии с постулатом поведения) - и и(2) = {аь ..., а,} - множество эффектов их поведения (действий, установок, мнений). Тогда структуризация фактов и
знаний о социуме состоит в задании двух булевых алгебр ^ = <2и(,), 0, и(|),
—, п, и) и ^ = <2иР) ,0, и(2), —, п, и> и предикатов =>,: 2°"' х 2иВ у,„
2и<" х 2°в -> V,,, 3<=: 2ий х 2и<" -> V,,, где V,, - множество «внутренних» (эмпирических) истинностных значений. У,„ = «V, и)| (уе{1, -1, 0})&(иеЛ^}и{(т, и)| пеЩ, Ы-множество натуральных чисел. 1, -1, 0, т -типы истинностных значений; <у, п) - истинностные значения (и - их степень правдоподобия, выражающая число применений правил правдоподобного вывода); (т, п) - множество истинностных значений, (т, и) характеризуется рекуррентным соотношением (х, п) ={(1, и+1),<-1, п+1),<0, л+1)}и(т, и+1), которое описьшает возможные истинностные значения гипотез,
порождаемых в результате ДСМ-рассуждений, /{т,п)ф - /а „^ф^, „н>фу./(о, „+1)фу7(Т1И+1) ф.
«Внешние» истинностные значения У«= {г,у), где * и/- истинностные значения двузначной логики «истина» и «ложь», соответственно. Они приписываются формулам, построенным из термов, операций и отношений булевой алгебры множеств таким, что все вхождения термов находятся в сфере действия ./-операторов. Внутренние истинностные значения используются для представления фактов и гипотез, внешние - для
15 Скворцов Д.П. О некоторых способах построения логических языков с кванторами по кортежам // Семиотика и информатика, 1983, № 20, с. 102 - 106.
представления высказываний о фактах (фактов с оценками) и п.п.в. Ууф = t, если у[ф] = v, ~f, если v[cp] ^ v, где у[ф] - функция оценки. J(Viя)ф =
п
V
Массив начальных данных содержит высказывания типа "высказывание «субъект С обладает эффектом поведения Q» имеет истинностное значение <v, п)" (или (т, и)), что представляется формулой /<v>n)(C =>i Q) (или /(,.„)(С =>i Q)> в ДСМ-языке. Здесь ve{l, -1, 0, т} - типы фактических истинностных значений, «-номер шага вычислений, отражающий степень правдоподобия истинностного значения. Высказывания вида J(Vt o>(C=>iQ) суть факты, /(V| Л)(С =>у Q) (/' = 1,2) и /<v, В>(С' 3<= Q'), п>О, - гипотезы.
В результате применения ДСМ-рассуждений порождаются гипотезы вида J(Vf „)(С' =>2 Q) или /<у, п)(С' 3<= Q') (в зависимости от используемой стратегии анализа данных, о чем мы будем говорить ниже), п>0. J<v, Я)(С =>2 Q) означает, что «высказывание "подмножество характеристик субъекта С' есть причина эффекта поведения Q" имеет истинностное значение <v, л)"». Соответственно, J(v, Л>(С' 3<= Q') означает, что «высказывание "эффект поведения Q' предполагает наличие характеристик субъекта С'" имеет истинностное значение (v, к)». Иными словами, предикаты V W и W3<= V представляют порожденное из предиката X=>iY отношение причинности. Таким образом, в этом процессе в автоматическом режиме формируются фрагменты базы знаний (БЗ) интеллектуальной системы типа ДСМ, поскольку гипотезы о причинах, представляющие сходство фактов, являются обобщением знания. ДСМ-рассуждение формализуется средствами бесконечнозначной логики предикатов (1-го порядка для конечных моделей и слабой логики предикатов 2-го порядка для бесконечных моделей16).
Первый шаг ДСМ-рассуждения - порождение гипотез о причинах вида J(v, п){C'=>2Q). где л>0, v е{1, -1, 0}, или я)(С'=>2С>) на основании правил индуктивного вывода п.п.в,-1 (правил правдоподобного вывода 1-го рода). В этом варианте индукции - прямом методе сходства - реализуется условие «сходство субъектов поведения (предполагаемая причина) влечет наличие эффектов поведения».
Для формализации индукции определяются предикаты простого прямого сходства М"ал (V, W), ае{+, -}, где п - параметр, отображающий число применений правил правдоподобного вывода к БФ. М*^ (V, W) служит для порождения утверждений о возможных причинах наличия изучаемых свойств. Предикат включает подформулы, содержащие экзистенциальное
условие ЭУ, описывающее существование к (+)-фактов вида J^n)(Xi=>iYi), i =
к
1, ..., t, СХ, условие сходства (+)-фактов (flX,- = V) & (W0); ЭЗ, условие
" Виноградов Д.В. Формализация правдоподобных рассуждений в логике предикатов // НТИ, сер. 2, 2000 №11, с. 17-20.
причинно-следственной зависимости Уи¥,и УИ, условие исчерпываемости
сходных (+)-фактов УХУУ((У(,1П)(Х=>,У)&(УсХ))->^сУ)&( ¿(Х=Хг))));
условие нижней границы числа сходных (+)-фактов к>2 (для практических целей она может быть увеличена). Эти условия являются непременными составляющими формализации всех пяти индуктивных методов Д.С. Милля17. Аналогично определяется предикат М'^ (V, V/) для порождения кандидатов в гипотезы о причинах (-)-фактов.
Возможна и иная стратегия индуктивного анализа, определяющая обратный метод сходства, когда реализуется принцип «сходство эффектов поведения определяет сходство самих субъектов поведения». Для этого варианта с некоторыми модификациями определяются предикаты простого обратного сходства (V, V/) (ое{+, -}), которые содержат подформулы, описывающие условия, подобные условиям М"ал (У,\¥).
МНУ, ~ ЗкЙ1„0/,У/,к), где
(У,\У,*)~ЗХ,... ЭХ*ЗУ,..-ЗУ*((& У(1,„)(ХА^, Ул))&( п ХА=У)&(У^0)&
(Г№*0 & (Ш0) &\/г\//' (((/ *у)&(1< г,У * к)) ->(Х,Щ))&
УХУУ«^,,^^,У)&^сУ))-»((УсХ)&( V (У=У,))))&(£>2)).
Эмпирическая зависимость и условие исчерпываемости в обратном методе описываются подформулой VXVY((J,(lln)pí=>1Y)&(WcY))->((VcX)
(^=Уа)))), аналогично формулируются эти условия для Й'^ (V,
Собственно гипотезы о (+)-причинах в обратном методе есть результат применения правил правдоподобного вывода п.п.в.-1, имеющих следующий вид:
¿ь К„ (V, Щ&-, (V, Щ
где /(Т, я)( W 3<=У) - часть посылки (на и-м шаге неизвестно, является ли V причиной а - заключение, которое является гипотезой о
(+)-причине с истинностным значением (1, и+1) и со степенью правдоподобия, характеризующейся номером шага рассуждений и+1. Аналогично формулируются (I)", (I)° и (I)1 для заключений3<=У), з<=У) и з<=У) и посыпок, включающих, помимо
-^„(У, щщ щ&м;^, W) И
\У)&->М;п (V, V/), соответственно.
Гипотезы, порождаемые индуктивными п.п.в.-1 (1)ст для прямого метода,
17 Финн В.К. Индуктивные методы Д.С. Милля в системах искусственного интеллекта // В кн.: Милль Д.С.
Система логики силлогистической и индуктивной. М.: ЛЕНАНД, 2011. С. 787 - 828.
имеют вид или /(Т,я+1)(У=>2^ («V - причина V/» с
соответствующей оценкой), Уе{1, -1,0}, ае{+, 0, г}.
Таким образом, отношение, представленное в БФ предикатом Х=5>1У, посредством (1)° и (1)с (ае{+, -, 0, т}) порождает отношения =>2* и *3<=, соответственно. Эти отношения представлены множеством гипотез Нь являющимся фрагментом БЗ - части КАТ.
Онтологической особенностью социологических данных является наличие в исходной БФ противоречивых примеров отношения =>|*. Для анализа конфликтных вариантов поведения (мнения) - (0)-фактов -
формулируются предикаты - м1(Ч,У/,к)
воспроизводят структуру м;„ (У,Ж,к) с заменой ^(Х^У*) на
/(о,П)(Ха=?1 УА) и с/(1,„)(Х=^1У) на /(о)Я)(Х=>1 У), соответственно.
Система правил правдоподобного вывода п.п.в.-1 должна исчерпывать все возможные случаи порождения гипотез вида 3<=У) или
, огб{+, —, 0, т}. Это достигается выполнением так называемого «условия //-полноты»: дизъюнкция всех посылок, содержащих конъюнкции Л?-предикатов, должна быть общезначимой формулой. Посылки правил для порождения гипотез вида з<=У) должны
содержать V, Щ 3<=У) -
^КАУ, Щ&КЛУ, ЩW), -
Щ&-уМ'„(V, \\0&-.М°„(У, Щ. Тогда, в соответствии с требованием М-полноты, порождению гипотез вида 3<=У) для причин фактических
противоречий отвечают посылки М^ (V, W)&M;^(V, Щ, т.е.
противоречие является либо результатом «столкновения» (+•)- и (-)- условий («эпистемическое противоречие»), либо порождается только (О)-примерами (фактами) («онтологическое противоречие»).
Предикаты сходства - как прямого, так и обратного - могут быть дополнены условиями, повышающими правдоподобие порождаемых гипотез и носящими название «усиливающих добавок». Основными добавками являются условие «запрета на контрпримеры» и условие единственности причины (для прямого и обратного), а также условие единственности следствия (для обратного).
Условие «запрета на контпримеры» (Ь)+ задаётся выражением УХУУ(((УсХ&\¥сУ)Н(./(>, Л)(Х=>, У)у/(Т,Л)(Х=>, У))). Единственность причины следствия для обратного метода определяется формулой (е)+ з<=2)->(2=У)). Единственность следствия задаётся выражением (с)+ Уи(/(|,„)(и 3<=У)->(и=\\0). Соответствующие добавки (6)", (с)" и (е)~ определяются аналогично. Тогда усиления предикатов Маа/1 (V, \У) (сге {+, -})
представляются формулами М°аЬ„(у, Щ - М^(V, М^(V, Ж) «
МЦУ,Ч1)8с{с)°, - М^„(У, Щ&(ё)а, соответственно.
Построение множества индуктивных предикатов позволяет формировать
различные стратегии порождения гипотез о причинах включением различающихся по силе предикатов в посылки правил правдоподобного рода п.п.в.-1 для обратного и п.п.в.-1 для прямого методов.
Следующий шаг ДСМ-рассуждения - вывод по аналогии для уточнения неопределённостей ^„¿(у^Ж) из БФ - выполняется посредством правил правдоподобного вывода 2-го рода (п.п.в.-2). Для посылок этих правил для обратного метода формулируются предикаты П* (V, \У) (ое{+, 0, т}), позволяющие предсказывать наличие (отсутствие) эффекта поведения у субъекта V. П*(У, W) Зкй'„(У^,к).
Подформула &ВХ,(У(1, л)(У, 3<=Х,) & (Х,сУ) & ( и предиката
П выражает утверждение, что V содержит положительные причины
X], ..., Хк (полученные обратным методом) наличия свойств (мнений, действий) Уь ..., У4 соответственно, причем изучаемый эффект \У полностью
к
покрывается этими множествами свойств ( и А - параметр). В предикат
также входит запрет на включение в рассматриваемый объект V отрицательных или противоречивых причин 2, для любых подмножеств и свойств из УЩИс^ & №0) -> п)(и 3<=г) V У(0л)(2=>2и) &
(гс=т
Й;(УЖк) ~ ЗУ,... ЗУ,((&ЭХ,<У(1,„}(У,3<=Х,)&(Х,с:У)&(и Ус=Щ)&
Уи((и^)&Ш0)->-,32((7(.1>л)(и з<=Т) V
Предикат П;(У^) определяется аналогично с заменой /(1>я) на /<_,_„) И/(-!,„) На/(],„).
Для порождения гипотез о фактических противоречиях («конфликтах») вида 7(о,п+1) (Х=>,У) определим предикат П°(У,\\0:
~ ЗХ.ЗУ.ЭХзЗУгС/о.^У, з<=Х,) & /н,я)(У23а2) &
(У,пУ2*0)&(Х1<=У)& (Х2а.У)&(У,сЖ)&(У2сЩ) у ЗХЗУ(7(0 п)(У 3С=Х)& (ХсУ)& (Ус^).
П^(У,\\0 определяется естественным образом: Щ(У,\\0 — -СП;
Сформулируем теперь правила правдоподобного вывода по аналогии (п.п.в.-2):
(IIГ - .
Подобным же образом определяются правила (II)-, (II)° и (II )т с посылками й;(У,Щ П1(У,УГ) и П;(У,\¥) для порождения гипотез /<-1,«+1>(У=>1^, 7<0,П+1)(У=>,\\0 и /(т,/!+1)(У=>1^, соответственно.
Аналогично формулируются предикаты П" (V, АУ) и правила (П)° (се {+, 0, т}) для прямого ДСМ-метода АПГ с использованием гипотез о причинах гТ), уе{1, -1, 0, т}. Гипотезы, порожденные посредством (П)° и (Йобразуют множество Н2) составляющее часть БЗ.
Из определений предикатов и П* (V, V/) (сте{+, 0}) следует,
что они являются средством формализации выводов по аналогии. В качестве подформул предикаты содержат гипотезы о причинах, выражающие сходство (выявленное в результате применения индуктивных правил) примеров из БФ и полученных на предыдущих шагах гипотез о свойствах объектов. Следовательно, результат применения правил правдоподобного вывода второго рода сходен с породившими гипотезы о причинах примерами и реализует принцип структурной аналогии.
ДСМ-рассуждение состоит из последовательного применения правил правдоподобного вывода 1-го и 2-го рода до стабилизации множества порождаемых гипотез. Этот этап ДСМ-рассуждения образует цикл применения двух познавательных процедур - индукции и аналогии. Вторым этапом ДСМ-рассуждения является абдуктивное объяснение начального состояния БФ, т.е. принятие порожденных гипотез первого и второго рода посредством рассуждения, формализующего абдукцию Ч.С. Пирса.
Схема абдуктивного принятия гипотез в ДСМ-методе АПГ может быть представлена следующим образом.
БФ - множество фактов, представляющих X =>|У,
Н = Н]иН2 - множество гипотез, порожденных индукцией и аналогией,
соответственно,
Е{Н|, БФ) - реализация отношения объяснения БФ посредством Нь
\?Ъ7((Ь7еН)-» Ъ/ правдоподобна),
гЯе I = 1..... б, 11, - гипотезы, 1ц = 7<у, „>(С=>,<5), Ь2 = „>(С'=>2С>), Ь3 =
„>(<2 з<=С'), 114 = ю(С=>10), Ь3 = /(Т,„)(С'=>2(2), 116 = я)((3 з<=С'), а у е {1, -1, 0}, «>0. п - число применений правил правдоподобного вывода (п.п.в.-1 или п.п.в.-1 - индукции - и П.П.В.-2 или п.п.в.-2 - аналогии), выражающее степень правдоподобия гипотезы Ь/ чем больше и, тем меньше степень правдоподобия Ь;.
Реализация отношения объяснения БФ порожденными гипотезами о причинах Н1 формализуется посредством аксиом каузальной полноты (АКП(±) для прямого метода и АКП^ для обратного) предметной области (социума) \У(±!: «всякий эффект социального поведения У субъекта X имеет причины V-!,..., V*, его вызывающие».
АКП(+): VXVYЗaVI...ЭVJfcЗW1...ЗWi(У(I>0)(X=>IY)->Зй(&J(1^(W(з^ У() &(У,сХ)& (У^0) &(\У,*0))& ( и \У(=У))).
АКПН формулируется аналогично, поскольку, как уже говорилось, онтологической особенностью рассматриваемой социальной реальности
является представление о (±)-квазисимметрии причин. Соответственно, формулируются АКП(±) для прямого метода.
В случае наличия в исходной БФ (О)-примеров проверяется также выполнимость АКП(0): У2Уи((7(0>0)(2^1и)-^Э«П°(2, Ц)).
АКП(±) и АКП(±) являются критерием достаточного основания для принятия гипотез. Если эти аксиомы выполняются для БФ, то порожденные гипотезы принимаются на достаточном основании. В противном случае БФ расширяется для всех тех фактов, которые не объясняются - АКП(±) или АКП(±) (в зависимости от принятой стратегии рассуждений - прямой или обратной) ложны относительно соответствующих пар (С, 0), где С - объект, ад- множество его свойств. После расширения БФ ДСМ-рассуждение продолжается до достижения одного из трёх возможных исходов. (1) аксиомы каузальной полноты выполняются для всех фактов из БФ -гипотезы принимаются на достаточном основании; (2) после серии расширений БФ остается незначительная область необъясненных фактов -гипотезы принимаются на квазидостаточном основании; (3) аксиомы не выполняются и при этом возникают вновь необъясненные факты - гипотезы не принимаются.
Рассмотрим последовательность расширяемых (пополняемых новыми фактами) баз фактов Б®! с БФ2 с...с БФИ. Пусть БФ,+ и БФГ, соответственно, - множества (+)- и (-)- фактов из БФ„ / = 1, ..., т, |БФ°| -число элементов БФД сте{+, -}. Пусть, далее, БФ," с БФ,°, где БФ,° -подмножество БФ,а такое, что для каждого (сг)-факта из этого подмножества найдется объясняющая его (ст)-гипотеза (это означает выполнение аксиомы каузальной полноты АКП(а) или АКП(о)). Тогда, если существует т для назначенного порога каузальной полноты р" такое, что р"< ... < р^ > р°, где
^ ~ |ВФ°~|' ' = ■•■' т> сте(+. то будем говорить, что имеет место абдуктивная сходимость ДСМ-метода АПГ.
Формализованный качественный анализ социологических данных средствами ДСМ-метода автоматического порождения гипотез позволяет решать задачи социологии и социальной психологии. Первый тип задач предполагает исследование индивидуального поведения, порождение детерминант поведения и типологизацию социума на их основе. Проблемы как собственно социологии, так и социальной психологии решаются в рамках анализа и предсказания мнений (также с выявлением детерминаций и возможного определения структуры социума на их основе), дополняемого определением рациональности этих мнений специально созданными средствами.
Задача первого типа решалась на примере изучения солидарного поведения рабочих на конфликтных предприятиях (в частности, участия или неучастия в забастовке). Поскольку информативность представления
субъекта в этом случае превосходит информативность описания его действий, в качестве стратегии анализа был выбран прямой ДСМ-метод АПГ.
Эмпирической базой эксперимента были данные, полученные сотрудниками Лаборатории проф. В.А. Ядова Института социологии РАН при изучении рабочих двух предприятий: завода «Арсенал» в Санкт-Петербурге (157 респондентов) и Завода тракторных гидроагрегатов в г. Ельце (132 респондента). Эти предприятия существенно отличались друг от друга по социо-культурным параметрам, по состоянию трудовых отношений и стадии развития трудового конфликта (о наличии конфликтов на предприятиях было известно заранее) - фактически, по ситуационным параметрам. Впоследствии это сказалось на порождении различных детерминант различных форм коллективного поведения для этих предприятий, привело, соответственно, к различной типологизации рабочих коллективов и послужило практическим стимулом для создания ситуационного варианта ДСМ-метода, представленного в Главе 5 работы.
Первичные (исходные) данные, непосредственно полученные как ответы на вопросы интервью и тестов, агрегировались и представлялись таким образом, что определенная комбинация ответов порождала комплексную характеристику. Эти комплексные признаки конструировались исследователями на основании знаний о связях между переменными (полученных из опыта, методами факторного анализа и т.п.). Признаки были сформированы в соответствии с постулатом поведения:
социальный характер - переменные, характеризующие обобщенные установки ценностного характера, нормативные установки, характеризующие предпочитаемую стратегию поведения в социально-трудовом конфликте;
данные об индивидуально-психологических характеристиках испытуемых, полученные с помощью тестов, которые позволили выделить три психологических типа: «лидеры», «миссионеры», «зависимые»;
биографические данные - ресурсные характеристики, обусловленные объективным статусом (материальное положение, образование, наличие приработков), характеристики идентичности (наемные работники или коллектив предприятия).
В качестве детерминируемых признаков рассматривались готовности к тому или иному виду поведения в проективной ситуации забастовки: инициативный («войду в забастовочный комитет»), активный («буду участвовать в забастовке»), подражательный («поступлю как большинство»), уход («не буду участвовать в забастовке»).
В результате анализа имеющихся данных средствами ДСМ-метода автоматического порождения гипотез были выявлены детерминанты различных видов поведения и на основе этих детерминант социологами определены различные поведенческие типы, причем, как уже говорилось, они оказались различными для изучаемых предприятий. Так, например, в Санкт-Петербурге был описан тип «Крестьянин, потерявший опору» (индивидуализм, непризнание закона в сочетании с желанием
«договариваться», средний уровень материального положения). В Ельце -«Советский рабочий» (зависимость от предприятия, ощущение себя совладельцем, лояльность к директору, низкий уровень материального положения). Тип «Боязливый обыватель, одиночка» (осуждение забастовок, установка на переговоры, низкий-средний уровень материального положения) оказался универсальным - он был выделен на обоих предприятиях.
Второй этап эксперимента опирался на представление характеристик субъекта в соответствии с уровнем диспозиции переменных18. В один признак не могли войти переменные, характеризующие диспозиции разного уровня (например, переменные, характеризующие ценность солидарности, «Д», и готовность к солидарному поведению, «П»).
В результате была выстроена типологизация поведения на более глубоком уровне, позволяющем выделить ядро типа в сочетании с нюансами позиции. Так, всех рабочих завода «Арсенал», заявивших о готовности участвовать в забастовке, объединяет поведенческая установка на солидарность-П (они готовы материально поддержать бастующих другого предприятия и готовы участвовать в защите тех, кто отстаивает интересы рабочих) и слабая ресурсная база (средний-низкий и низкий уровень материального положения, отсутствие приработков, сравнительно невысокий уровень образования). Но дальше фиксируются различия, разделяющие активистов на два подтипа. «Борцы за интересы рабочих» разделяют идеологему закрытости (солидарность - только у рабочих, рабочие должны бороться за свои права, у рабочих - больше врагов, чем друзей), демонстрируют установку на мобилизацию ресурсов солидарности (готовность поддержать обращения к населению и работникам). Для них характерно ценностное обоснование солидарности в сочетании с отрицанием ценностей корпоративизма. У «Борцов за интересы трудового коллектива» ценностная и поведенческая установка на солидарность и идентичность наемного работника сочетаются с поведенческой установкой на корпоративизм, отсутствующей в первой группе. Как нюансы позиции присутствует идентичность наемного работника и поведенческая установка на консенсуализм при слабости собственных ресурсов.
Совместная работа оказалась плодотворной как для содержательного социологического исследования, так и для развития ДСМ-метода (идея аргументационного оценивания, увеличение числа типов истинностных значений - для промежуточных между +1 и -1 оценок, - ситуационное расширение). Социологами были высоко оценены возможности комбинации социального и индивидуального, повышение уровня формализации данных и знаний, формирование эмпирических социологических понятий (типологизация), которые оказались основанием для уточнения социологической модели и порождения социологической концепции.
" Ядов В.А. О диспозиционной регуляции социального поведения личности // В кн.: Социальная психология. Хрестоматия. М.: Аспект Пресс, 2000. С. 416 - 432.
Предложенные метафорические описания различных поведенческих типов представляют собой реализацию редкой возможности эмпирического формирования понятий, что, несомненно, является одной из важнейших задач когнитивной социологии. Таким образом, ДСМ-метод оказался эффективным инструментом формализованного качественного анализа данных.
Для решения второго типа задач ФКАСД - анализа и прогнозирования мнений - была выбрана стратегия обратного ДСМ-метода АПГ, поскольку информативность представления мнений значительно превосходит представление характеристик индивидуума. Реализация этой стратегии возможна лишь при наличии адекватной структуризации мнений и представлении их в виде, отвечающем условиям применимости ДСМ-метода (подобно тому, как было структурировано описание индивидуумов на основании постулата поведения). Это составляет один из разделов Главы 3. Здесь же представлены формализации /я-значных закрытых социологических опросов средствами специально созданных многозначных /„-логик. Описываются критерии рациональности результатов опроса - степень непротиворечивости, степень близости к «идеальному мнению», степень согласованности. Предложенные характеристики уточняются для предсказательных опросов, когда средствами выбранной формальной эвристики порождаются возможные ответы респондентов. Принцип классификации различных структур опросов в ИАСД является теоретической и практической основой подхода к формированию баз социологических фактов.
Рассматриваемый подход к структуризации мнений опирается на уточнение идеи «темы» (или множества «тем») в концепции немецкого социолога Н. Лумана, согласно которой опросы общественного мнения должны быть представлены как ответы на вопросы по соответствующей теме. На основе такого представления предложен вариант семантики ДСМ-метода для анализа и прогнозирования мнений. Пусть задана некоторая тема опроса Т , характеризующаяся утверждениями из множестваР = {рь ..., р„}, которое будем называть каркасом темы Т , а элементы рь ..., р„ - корнями вопросов (параметрами опроса). В результате опроса устанавливается отношение респондентов к элементам каркаса и к теме в целом. Задана функция оценки у[р,] с областью значений {1, -1, 0, т}. Каждому элементу р (/ = 1, ..., и) каркаса Р соответствует вопрос ?р;- - «Какова оценка у корня вопроса pj ?», уе{1, -1, 0, т}, ответом на который является высказывание /ур7. Лр; =если у[рз] = V; Лр,- =/, если уВД * у. ^
Ответом 7-го респондента по теме Т будем назвать максимальную конъюнкцию ер,- = /,лр1&...&/(У,рл (вид мнения), где фу - метасимвол, -
предикат графического равенства формул, Vм[р,] = vP, е{±1, 0, т}, / = 1, ..., п; у = 1, ..., 4". Такой ответ представляет собой понимание у'-м респондентом темы Т . Множество членов этой конъюнкции обозначим
.......и будем назвать составом мнения.
Множество всех возможных ответов по теме Т* с каркасом Р обозначим К,К= {фу | (фу - ... 8lJ^„)8l{vP б{±1, 0, т}), i = 1, .... n,j = 1, ...,
4"}, |Ä| = 4". Заметим, что число респондентов может превышать 4", поскольку различные респонденты могут иметь одинаковые ответы, при этом число различных ответов может быть меньше 4".
Предлагаемая семантика позволяет формализовать анализ мнений средствами ДСМ-метода АПГ в соответствии со следующей стратегией. Формулируется тема мнения, пригодная для построения модели социальной структуры. Затем задается система вопросов, раскрывающих содержание темы - каркас темы. Оценка эмпирического отношения С =>, Q («субъект -мнение») есть оценка отношения к теме в целом, Q - состав мнения субъекта С (множество {^>Рь ^лРп} образующих (атомов) мнения с оценками, Q
= [Ф])-
Пусть U(2) = & (v,e{l, -1, 0, т}), i =1, ..., п}, |U(2)| = 4п.
Задача изучения мнений сводится к изучению высказываний из БФ •^(С/=>1[фу]) - «субъект Cj имеет мнение фу». В результате применения правил индуктивного вывода обратного ДСМ-метода (п.п.в.-1) порождаются гипотезы вида 3<= Су) - «мнение определяет наличие
характеристик субъекта Су». Порожденные детерминанты мнений в дальнейшем используются для прогнозирования мнений с помощью правил вывода по аналогии (п.п.в.-2), а также служат основанием для построения модели структуры изучаемого социума. Здесь Су, С'у, [фу], Oy] - константы, Су,
С) е 2й , [фу], [%] е 2и<ч, ~ßj = (ßj, т) или Д, = (т, т) - истинностное значение, полученное применением ДСМ-метода АПГ, где ¿/уб{±1, 0}, а т -число применений ДСМ-правил правдоподобного вывода.
Социологический опрос не случайно представляется на уровне обыденного сознания «визитной карточкой» социологии. Для профессионального анализа социальной действительности опрос является универсальным и наиболее широко практикующимся источником получения эмпирического материала. При этом нельзя сказать, что формальные описания тех или иных сторон исследования совершенно выпадают из поля зрения социологов. Но поскольку для обработки полученных результатов, как правило, используются статистические методы, эти формальные средства и определяют различного рода статистические характеристики, вплоть до построения репрезентативной выборки. При этом такие задачи как формулировка вопросов с целью получения наиболее релевантных целям исследователя ответов, учет контекста опроса, уровни измерения, выбор формата для ответов и т.п. решаются почти исключительно на основании интуитивных и эмпирических представлений исследователя. При этом сама структура опроса не находит своего формализованного представления, хотя
это обеспечило бы унификацию процедур проведения опроса и позволило бы упорядочить некоторые результаты опроса на основании численных критериев рациональности для различных социальных общностей.
Рассмотрим общий случай m-значного {т>2) закрытого социологического опроса: респонденту предлагается выбрать один из т предложенных ответов. С точки зрения предлагаемой формализации т-значные закрытые опросы являются обобщением закрытых булевских опросов (»2=2), со шкалой оценок {0, 1}, где 0 - истинностное значение «ложь» (оценка для ответа «нет»), а 1 - истинностное значение «истина» (оценка ответа «да»). Логическими средствами формализации от-значного опроса являются m-значные логики Jm и исчисление эквивалентных формул ИЭФ-У„19. Таким образом, задано множество оценок переменных Vm = {О, ^l,..., fEf, 1} (разумеется, социологически интерпретируемых), заданы атомарные оценки v(i)[p,] = v/°, i= 1, ..., m",j = 1, ..., п. Функция оценки v[<p] формул логики Jm определяется индуктивно по сложности формулы ср и принимает значение из {0, 1}. Таким образом, для формул ф логики Jm имеет
место У(0[ф]=ф(у(0[р1], ..., vw[pn]), где г=1..... тп, а рь ..., р„- все
переменные, входящие в ф. Система этих равенств определяет функцию F<p такую, что она отображает множество V„ в {0, 1}, т.е. Vm->{0, 1}. Для представления эквивалентных формул (реализующих одну и ту же функцию) строится ИЭФ-Л,, которое является модификацией ИЭФ двузначной логики с J-атомами, законом противоречия (/ур&/цР)<-Я) (v^n, v, цеУт) и законом исключенного (ш+1)-го. Ответом на вопрос «Какова оценка v корня вопроса Ру ?» для элементов р, (j = 1, п) каркаса Р, как и выше, является высказывание Jvpy, однако в этом случае VEVm.
Понимание í'-m респондентом темы Т* отображается в его ответе С,- = представляющем /-максимальную конъюнкцию логики Jm.
Эта конъюнкция определяется по аналогии с максимальной конъюнкцией двузначной логики, т.е. для каждой р* в С, входит без повторений У „,рА (к=\,
..., и), а У,„р* и J,„pfo где v/'^ v/°, одновременно в Q не входят.
Соответственно, множество всех возможных ответов по теме Т с каркасом Р К= (ф,-1 (ф, - Jí(1p1&...&J,„p„)&(vjeVm), vw[py] = v¡°, ,j = 1,.... n, i = 1,...,
mn). Число элементов этого множества \К\=тп, поскольку каждой J-максимальной конъюнкции взаимно однозначно соответствует m-значный (и-мерный) вектор а"' = (viW,..., v„w).
Специфической особенностью предлагаемой технологии анализа мнений является возможность конструктивного порождения насыщенной выборки -одной из основных идей обоснованной теории - стратегии качественного анализа социологических данных. Пусть при опросе респондентов получено
" Finn V.K., Mikheyenkova M.A. Plausible Reasoning for the Problems of Cognitive Sociology II Logic and Logical Philosophy, Vol. 20 (2011), pp. 113 -139.
множество ответов КсК, которое не изменяется при расширении множества опрашиваемых. В этом случае мы имеем дело со стабилизированным множеством ответов, причем стабилизация эта достигается экспериментальным путем. Пусть стабилизированному множеству ответов К соответствует множество респондентов Я = {Ь\, ..., 6,}, II = {X | ЗфВуУ(У>0)(Х=^1[ф])&(ф€/^)&(у€Ут)}. Тогда множество респондентов Я можно считать качественным аналогом репрезентативной выборки статистического анализа.
Итак, простой эмпирический т-значный социологический опрос (т>2) От по теме Т со шкалой оценок Ут = {0, 1} реализуется
средствами дедуктивной яг-значной логики и может быть представлен в виде От = (Л,, Р, 1С, Я, Х=>,У), причем К1 задается исследователем-социологом в результате эмпирического получения стабилизированного множества ответов. Расширенно определяется двухуровневый опрос От / = (Л,, У/, Р, 1С, II, Х=>1У>, когда для элементов Р (яг-значный «внутренний» опрос) используется логика Зт ..., у„еУт), для темы Т* («внешний» I-значный опрос) - логика У; (у€V/). Анализ результатов такого опроса производится средствами ДСМ-метода автоматического порождения гипотез.
Средства логики 1т и ИЭФ-УМ позволяют дополнить это описание. Рассмотрим множество £ = {*)/ь ..., формул ..., логик выражающих логические зависимости между элементами каркаса Р -корнями вопросов ?рь ..., ?рл. Указанные зависимости задаются исследователем и, таким образом, представляют имплицитное экспертное знание относительно темы Т . Множество «постулатов значения» 2 должно быть непротиворечивым, при этом формула у = не должна быть
тавтологией логики Зт. Заметим, что контроль непротиворечивости и содержательности системы вопросов является одним из основных требований опросной методологии. Введение множества I позволяет определить простой расширенный эмпирический опрос 0'т = (,/т, Р, £, К', К, Х=>,У>.
Цель всякого опроса - получение эмпирического материала, могущего служить базисом для построения социологических концепций. Оптимальным для достижения этой цели является такой опрос, где реализуется рациональное восприятие респондентом темы опроса. Анализ рационального поведения - классическое направление теоретической и прикладной социологии, возведённое «понимающей социологией» М. Вебера в ранг одного из центральных. Традиционное понимание рациональности опирается на представление о действии как акте, направленном на некоторую цель. В этом случае рациональность действия определяется как устанавливаемое с помощью рассудка соотношение между интенцией и имеющимися у субъекта знаниями, объективными возможностями и избранными средствами. С появлением когнитивной социологии исследования
рациональности получили возможность развиваться и в другом измерении, в частности при анализе мнений респондентов в социологических опросах.
Описанная семантика ДСМ-метода АПГ для анализа мнений включает возможность описания и анализа такой рациональности, рассматриваемой вне зависимости от целеполагания субъекта. В центре внимания оказывается вопрос об аргументированном принятии решений (высказываемых мнений), не сводимом к дедуктивному рассуждению. Предложенное представление опроса по теме Т* с описанием каркаса темы Р - {pj, ..., р„} есть приближение к аргументированному и, соответственно, рациональному восприятию темы. При этом в базовом варианте формирование оценок отношения к элементам каркаса Р осуществляется в результате непосредственных ответов респондента на вопросы анкеты. Возможность формирования рационального мнения может быть усилена, если предложить респонденту множество аргументов А относительно принятия или непринятия утверждений рь ..., ря. Это означает реализацию принципа рационализации знаний о субъекте в ИАСД: при выборе решений субъектом в явном виде учитывается его аргументация.
Для реализации аргументационной схемы оценивания элементов Р рассмотрим семантику логику аргументации А420. Пусть А - множество доводов (аргументов и контраргументов), Р - множество всех пропозициональных переменных (например, для каркасаР = {рь ..., р„} темы Т*). Определим на Р две функции. g+: Р->2Л, g+(py)o4, g": Р ->2Л, g'(pj)cA,j = 1, ..., п. Пару функций g+, g~ будем называть нормальной, если для всех р е Pg+(p)ng-(p) = 0.
Атомарная оценка для множества истинностных значений {1, -1, 0, т} определяется следующим образом (/ = 1,..., п):
v[py] = 1 g+(p,) * 0, g~(p,) = 0 (т.е. имеются аргументы за принятие р, и нет контраргументов - аргументов против);
v[py] = -1 <-> g+(p,) = 0, g~(py) * 0;
v[P/] = 0 g+(p,) * 0, g-(pу) * 0;
v[R/] = t <-> g+(p,) = g-(p/) = 0;
Таким образом, для i- го респондента определяются его аргументационные функции G,=(gí+(Pi), g,+(p„), gf(ÍPi). ёГ(р„)>, где
<5r=(g¡a(Pi)» Л)), -}, ё(°(рА) QÁ,h= 1.....п, /= 1, ..., í, где s -
число участвующих в опросе респондентов. Обязательным условием рационального выбора является g,+(pA)ngf(p,,) = 0.
Опрос, в котором формирование оценок осуществляется на основании аргументационного выбора, называется аргументационным: 0° = (Jm, Р, 1С, R, Х=>,У, А, {G,} ifls|R(). Расширенный аргументационный опрос О" = (Jm, Р, 1,К\ R, X=>i Y, А, {G;} i£,<;|R|).
20 Финн В.К. Об одном варианте логики аргументации Н В сб.: Многозначные логики и их применения, т. 2: Логики в системах искусственного интеллекта. Под ред. проф. В.К. Финна. М.: Издательство ЛКИ 2008 с 13-58.
Для формализации явного влияния аргументации субъекта на оценку элементов Р для темы Т* и оценку его отношения к ней рассмотрим расширенное представление знаний об ¿-том субъекте Sbtr(Q, (gi+(pO. -,
gi+(P«), gf(Pi), &(р„)»- Пусть <5,={&+(Р1), gi+(pn), gi~Cpi)..... giin))'
Расширим ДСМ-язык включением термов, образованных кортежами (С,-, G,),
где С/ - описание субъекта множества характеристик в соответствии с постулатом поведения.
Исходными элементами базы данных теперь будут формулы вида ■W(Q, <5|) =>1 [ф/]) (v е{1, -1, 0}), которые включаются в экзистенциальные условия предикатов сходства для правил индуктивного вывода. Соответственно, порождаются гипотезы вида 4»)(Мз<=(С', G» или J(x, и)([у] 3<= (С', G)), где v е{1, -1, 0}, и>0, С' - пересечение множеств характеристик С,- сходных субъектов, G - покомпонентное пересечение кортежей Gn входящих в представления субъектов. Порождённые гипотезы представляют явным образом аргументационную составляющую формирования мнения, т.е. обнаруживают влияние когнитивных процессов на социальное доведение. Отметим, что аргументационная база А рассматривается как общая для всех респондентов - это может быть, к примеру, объединение всех аргументационных баз. В случае необходимости индивидуальная база может быть добавлена к описанию респондента, что потребует дополнительного расширения ДСМ-языка.
Одной из важнейших характеристик рациональности мнения является его непротиворечивость. Пусть солш(2и{ф}) - метапредикат непротиворечивости множества формул (2и{ф}). Тогда множество всех ф (ответов респондентов) - J-максимальных конъюнкций логики J„, - не
противоречащих 2, обозначим К* = {ф|содаи(2и{ф})&(феЯ}}; множество ответов ф, противоречащих 2, обозначим Д = {ф|-.сотй(2и{ф})&(феА)} (здесь возможна замена К на 1С - для реальных опросов). Определим следующие функции: j](JC, Г) = и А) =
характеризующие, соответственно, степень непротиворечивости и степень противоречивости закрытого m-значного опроса по теме Т. Степень непротиворечивости результатов опроса может также задаваться функцией
5(iC, Д) = 1 - Д). Здесь \К\, \K*nlC\ и |/ГпД| - числа элементов множеств К, ICrJt и ïCr>A, соответственно. Легко показать, что Т)(/С, + ЩС, Д) = 1, т.к. К = tfuA, JtnA = 0 и ICçK. Выбор той или иной функции для вычисления степени непротиворечивости определяется характером эмпирической выборки и следует целям минимизации вычислительной сложности.
Для вычисления функции 8(1С, Д) используется метод аналитических таблиц для логик JA2, JA3, /А4 и JA5 (2-х, 3-х, 4-х и 5-значных логик с аргументационной семантикой, соответственно). JA4 - специальный вариант
/„-логики для опроса с минимальным для ДСМ-метода набором истинностных значений ve{l, -1, 0, т}. Функция оценки атомарных формул логики JAi определяются следующим образом: v[/p] = t (истинностное значение двузначной логики «истина»), если v[p] = v, где v[p] - функция оценки, a ve{l, -1, 0, -с}. Таким образом, v[/ip] = t тогда и только тогда, когда g+(p)*0 и g"(p)=0 (для -1,0, т аналогично).
Поскольку /А4 является специальным вариантом m-значных логик /т, достаточно рассмотреть метод аналитических таблиц в общем виде. Если <р -формула Jm, то icp и /ф - помеченные формулы, где t («истинно») и / («ложно») - пометки. Для классификации помеченных формул логик Jm и основанных на ней правил используются эквивалентности: ?<р эквивалентно ф (ф - формула Jm), fJvр эквивалентно у / , р, где v=——, 0< к < т-1.
0£i<m-l т -1
Соответственно, к обычным а- и (З-правилам метода аналитических таблиц для двузначной логики добавляется ещё одно а-правило (конъюнктивного
типа) где v eVm. Дополнительным типом правил являются е-правила: JyV
fJ* Р _ Др
^pl-l^pl^p'' ^»pI^PI-I^P'
m-l л-1 m-1 m-1
Пусть S - множество «постулатов значения», соответствующих теме Т, а ф - максимальная конъюнкция формул J^ р,. Тогда, если аналитическая
таблица 3 для множества 2и{ф} замкнута, то Еи{ф} - противоречиво и феД, где Д - множество «запрещенных» максимальных конъюнкций. Отсюда возникает простая процедура вычисления степени непротиворечивости опроса 5(fC, Д): для каждого мнения проверяется, входит ли оно в Д, и в соответствии с долей противоречивых мнений в общем числе мнений и вычисляется функция 5(К, Д).
Точно так же, с помощью метода аналитических таблиц для логик Jm, могут быть вычислены функции Jt) и ЩС, Д). Для вычисления первой
строится завершенная аналитическая таблица Зх с корнем Е, дизъюнкция открытых ветвей этой таблицы в ИЭФ-/т приводится к совершенному виду. Указанное представление возможно, т.к. каждая формула, тождественно не равная 0, представима посредством /„-совершенной дизъюнктивной нормальной формы (дизъюнкции максимальных конъюнкций Jvp формул). Множество, состоящее из всех /-максимальных конъюнкций построенной совершенной формы и есть множество К+ - множество ответов, не противоречащих Е. Для вычисления второй функции - степени противоречивости результатов опроса - строится множество Д - К - К*. Однако это множество может быть также независимо построено с помощью метода аналитических таблиц. Для этого строится завершенная таблица с корнемXv|/i&...&\j/j), где \|/,еЕ, i- 1, s. Дальнейшая процедура совпадает
с описанной: дизъюнкция открытых ветвей преобразуется в совершенную нормальную форму, состав этой формы образует Д.
Для рассматриваемой социальной общности (респондентов опроса) может быть сформировано «описание состояния рациональности» - с помощью специально определенных предикатов Р(h = 1,2,3; в е {0, х, 1}). Предикат ?\£К) для в = О, х, 1, соответственно, определяется следующим образом: ЦК, А) = 0, 3x(S(iT, Д) = х&0<х<1), 5(1С, Д) = 1 (JC -переменная, Д фиксировано, поскольку фиксировано множество I). Этот предикат представляет собой 1-й критерий рациональности результатов опроса - степень его непротиворечивости.
Предикат Р2б(/0 характеризует степень близости мнения респондентов к некоторому «идеальному мнению», представленному «правильным» ответом по теме Т. Наиболее естественно этот предикат определяется для электоральной общности - в этом случае «идеальное мнение» сторонника некоей партии представлено принятием программных положений партии.
Критерий «близость к идеальному мнению» определяется следующим образом. Пусть «идеальное партийное мнение» для i-й партии (г = 1, ..., s) описывается конъюнкцией <р, = ^ а('\ - число респондентов,
ответы которых совпадают с идеальным мнением фг в (л - к) пунктах программы, а(/)о - число респондентов с «идеальным партийным мнением» ф/, PW~ число сторонников i-й партии при опросе, К = К,.
Степень близости к идеальному мнению задается функцией р® = ,
где//0 = а%п + а!\(п -1) +... + а °\-(п-к) +... + a('Vrl.
Наконец, Рз^ДС) представляет согласованность (однородность) ответов респондентов изучаемой социальной общности (в частности, и электората /той партии). Будем рассматривать согласованность ответов как характеристику их сходства, тогда вычисление степени согласованности X может осуществляться следующим образом. Рассмотрим множество респондентов, имеющих мнение фу.: Rj = {Х| J<i,0)(X =>, [фу]},у = 1 ..., г, число таких респондентов = ос,-, j = 1, ..., г, |/Г| = cti® + ... + а®. Определим сходство мнений [ф*]п[ф, ] = [ф^], |[ф^]| = такое сходство имеют akj = min(ocfo ay)
респондентов. Определим совпадение первого мнения с остальными: у, = ai2m,2 + ai3m,3 + ... + a1;my + ... + аит(„ 2< j < г. Совпадение второго (без учета уже вошедшего в первую сумму совпадения второго с первым) у2 = a23m23 + а24т24 + ... + а2/% + ... + 3< j < г; и т.д. Соответственно, у* = акмткш + акк+2ткк+2 + ... + + ... + а^т^ к+1 ...; Уг-i = ам rmr.i г. Определим величину у как сумму у,- (f = 1, ...,г-1):
г-1 Г
y = ain, еслиг= 1;у= X Т. a,Amа,, еслиг>\.
Величина у характеризует реальные сходства существующих ответов респондентов, которое отличается от максимально возможных сходств, имеющих место в случае полной согласованности мнений (когда X = 1).
Определим величину у для идеального случая, для чего нам понадобится определение соответствующих у1 (/ = 1, г-1). Рассмотрим упорядочение
а.1 < ... < аг. Пусть о^ соответствует некий ответ по теме фь Минимально возможное отличие от ф) для остальных ответов (ф2, ..., фг) - одна позиция (расхождение в ответе на один вопрос). Стало быть, максимально возможные значения ту (/ = 2, ..., г) - (и-1), и таких элементов-(^-1). Итак, 71 = о^ (и-1) (г-1). Соответственно, идеальное ф2 отличается от остальных ответов (ф3,
фг) также не менее чем в одной позиции, m2j (/ = 3, ..., г) - (и-1), и таких элементов (г~2), т.е. у2 = а2 (и-1) (г-2), и т.д. Тогда в идеале yJ - а, (и-1) (г-
~ г-1 _
У) и у = (и-1) £а,(г-./). у* = ахп, если г = 1; у* = у, если г>1. Тогда степень
У-1
согласованности результатов опроса социальной общности есть X = у/у*.
Эмпирическое исследование второго типа задач ИАСД - анализ и прогнозирование мнений респондентов, а также анализ рациональности мнений - было осуществлено на массиве данных об электоральных предпочтениях студентов старших курсов РГТУ на выборах в Государственную Думу 2003 и 2007 гг. В работе принимали участие сотрудники, студенты и аспиранты Социологического факультета РГГУ, а также студенты и аспиранты Отделения интеллектуальных систем в гуманитарной сфере Института лингвистики РГГУ.
Описание респондента было осуществлено в соответствии с постулатом поведения. В анкете, разработанной для эксперимента, среди биографических данных рассматривались такие, как семейное и материальное положение, образование членов семьи и т.п. Социальные характеристики включали в себя вопросы относительно общественно-политической активности студентов, знакомства их с партийными положениями и, соответственно, отношения к ним, выбора базовых ценностей. Психологические тесты были направлены на анализ таких сторон личности, как кооперация, связанная с вниманием человека к интересам других людей, доминантность, для которой характерен акцент на защите собственных интересов, социабельность, самодостаточность.
Д ля формализации качественного анализа данных о мнениях был выбран обратный ДСМ-метод. Решались следующие задачи.
(1) порождение детерминант электорального поведения, представленного парой (мнение, выбор действия), где «мнение» есть выбор программных установок (без указания в исходных данных их принадлежности конкретной партии), а «действие» - выбор одной из шести заданных партий или другой, или выбор «против всех» (в 2003 г.) или отказ от участия в выборах. Иными словами, изучались расширенные высказывания Уд (С;=>1<[ф,], Т(», где Т/ - одна из выбираемых партий, Д, = Щ, и) или = (т, и) - истинностное значение, полученное применением
ДСМ-метода АПГ, где /$е{±1, 0}, а и - число применений ДСМ-правил правдоподобного вывода.
(2) предсказание электорального выбора 10% (из 231) (в 2003 Г.) опрошенных студентов (у которых был зафиксирован только выбор установок, но не электоральный выбор) посредством порожденных детерминант с последующей валидацией предсказаний посредством повторного опроса после голосования;
(3) выяснение некоммутативности двух технологий опросов: а), сначала - мнение, затем - электоральный выбор, б), сначала - электоральный выбор, затем - мнение. С этой целью массив опрашиваемых разбивается на две равновеликие части;
(4) анализ рациональности выбора программных установок и электорального действия (выбора политической партии в том числе).
Каркасом тем опроса являлись программные установки различных партий (по соответствующим проблемам - «земля», «приватизация», «СМИ», «внешняя политика», «экономика», «свобода личности», «социальная политика» и.т.п.). Например (в исследовании 2003 г.), р57: «Земля всецело должна быть в государственной собственности» (КПРФ); р61: «Социальная рыночная экономика наиболее эффективна в условиях России» (Яблоко), р68: «Необходимо узаконить итоги приватизации» (СПС), р85: «Основная угроза России исходит от США» (ЛДПР).
В результате применения обратного ДСМ-метода были порождены, например, следующие зависимости (эксперимент 2007 г.):
где С — {Ж, низкий уровень авторитарного подчинения, материальная помощь родителей, совмещение работы с учебой, бесплатное отделение, не замужем, средний уровень политической активности}, [ф] = {Лр,, /,р2, р3, J.,p4, J0р5}, Т, - Единая Россия. Здесь р,: «государственная собственность должна преобладать над частной», р2: «естественные монополии должны принадлежать государству», р3: «армия должна быть не только контрактной, но и по призыву», р4: «в формировании пенсии должно участвовать не только государство, но и работодатель», р5: «внешняя политика России должна быть ориентирована на Запад» (здесь номера элементов каркаса не совпадают с номерами вопросов в анкете) «[Ф], Т2>3с=С),
где С — {4 курс, низкий уровень авторитарного подчинения, материальная помощь родителей, не женат/не замужем, средний уровень политической активности}, [ф] = {/,рь У_,р2; 7_1Рз, J,p6l /,р7) •/оРв}. Т2 - СПС или Яблоко. Здесь р6: «СМИ должны быть независимы и от государства, и от каких-либо организаций», р7: «необходимо упрочение федерализма», pg: «одобрение Болонского процесса».
Для анализа рациональности в качестве элементов Е -непротиворечивого множества {\|/ь формул vj/b ..., у, логик Jm - были выбраны формулы вида (х~>ф), которые характеризовали логические связи между относящимися к одним и тем же темам пунктами программ различных партий. Например, для отношения к частной собственности на землю были
сформулированы следующие зависимости: {.Лр57-^£-1р88> •ЛР57->^-1Р84> /]рб7->/_1р88} и т.п. Здесь р37: «Земля всецело должна быть в государственной собственности», рб7'- «Продажа земли в частные руки должна быть строго ограниченной», р84: «Земля должна постепенно приватизироваться, но при условии строгого соблюдения законности», р^: «Необходима свободная без ограничений продажа сельскохозяйственных угодий». Для отношения к средствам массовой информации задана зависимость *ЛР77-К^-1Р59&Л-1Р69)> где р59: «СМИ должны быть независимы как от монополий, так и от государства», Рб9'- «Необходимо создать благоприятные условия для развития частных СМИ и их разнообразия», Р77: «Основные каналы телевидения должны находиться в государственной собственности».
Подчеркнём, что формирование множества Г - творческая задача, решение которой относится к компетенции эксперта и зависит как от собственного восприятия социологом изучаемого явления, так и от конкретных задач исследования. Поэтому в общем случае приходится считаться с неполнотой представленных связей. Соответственно, полученные значения непротиворечивости не носят абсолютного характера, а лишь позволяют упорядочить различные общности по степени непротиворечивости мнений входящих в эти общности респондентов.
Для охарактеризованного выше эмпирического материала были получены следующие значения критерия г\(К!, К*): все респонденты (231) -0,1991, ответившие «буду участвовать в выборах» (147) - 0,163, «не буду участвовать в выборах» (26) - 0,269, «не знаю» (58) - 0,258.
Для сторонников различных партий получены следующие результаты: СПС (27 сторонников), т^Я", К*) = 0,222; «против всех» (57), ц(Ю, К+) = 0,2105; ЛДПР (5), т^, = 0,2; Яблоко (27), ц(й7, К*) = 0,1851; «Другие партии» (11), Я*) = 0,1818; Единая Россия (21), т^, К*) = 0,0952; КПРФ (5), К*) = 0; Народная партия (6), т](Я\ ^) = 0.
Невысокий общий уровень непротиворечивости мнений свидетельствует как о невнимательном отношении студентов к программным положениям партий, сторонниками которых они являются, так и об общей неоформленности отношения к существенным для общественно-политической жизни вопросам.
. Схема изучения социума в эксперименте была уточнена с учетом очевидной некоммутативности опросов по теме и по содержанию темы. Если первичным опросом является опрос относительно самой темы Т*, а вторичным - относительно ее содержания (т.е. Р), то весьма правдоподобно, что к ответам на вопросы из Р респондент отнесется с учетом ответа на вопрос относительно Т*. Следовательно, опрос по теме, предваряющий опрос по содержанию темы, обеспечивает аргументированное (рациональное) мнение. Полученные результаты подтвердили первичные теоретические предположения: а), сначала - мнение, затем - электоральный выбор, г\(1С, К^ = 0,169; 6). сначала - электоральный выбор, затем - мнение, т](Х\ I?) = 0,285.
В обоих экспериментальных исследованиях для сторонников различных партий были вычислены значения описанных выше критериев рациональности - непротиворечивости 5, близости к «идеальному мнению»
р, согласованности мнений К, - определено отношение частичного порядка ц для полученных значений критериев и построена диаграмма этого отношения.
Нельзя не сказать о содержательном различии описанных характеристик рациональности результатов опроса. Степень непротиворечивости есть скорее комплексная характеристика когнитивных способностей респондентов различать заложенные исследователем связи между вопросами, описывающими заданную тему, и, разумеется, одинаковым образом вычисляется для различных по тематике опросов. Степень согласованности характеризует близость взглядов респондентов друг другу относительно некоторой темы, и может касаться как электорального выбора, так и любых других тем, объединяющих респондентов в некоторую общность. Наконец, близость к «идеальному мнению» - наиболее соответствующая электоральным опросам характеристика, поскольку говорит не просто о сходстве ответов, но о сходстве их с «единственно правильным» множеством ответов.
Введение нестатистических количественных величин, характеризующих социальную общность и опрос мнений, расширяет возможности интерпретации результатов качественного анализа, частично объективизируя их. Более того, интеллектуальный анализ социологических данных средствами ДСМ-рассуждений порождает нетривиальную схему связи качественных и количественных данных: отношения =>!*, =>2* и *3«= отображаются в количественные характеристики (р, X, т]), которые затем представляются отношениями между кортежами числовых данных (р, X, т]) (в виде диаграмм состояний рациональности).
Нетривиальной особенностью описанного формализованного качественного анализа социологических данных является пополнение базы знаний доопределенными посредством вывода по аналогии примерами отношения =>,*, а также возможность расширения базы фактов БФ на основе абдуктивного принятия (непринятия) гипотез. Множество респондентов, участвующих в опросе, Я = {X | ЭфЗуУ(у>0>(Х=>,[ф])&(фб.Л:)}, [<р] = {У Рь
Л.Р«}> -1. 0}, пополняется гипотезами о наличии у заранее не
определившихся со своими мнениями респондентов тех или иных вариантов ответов, полученными средствами ДСМ-метода. Это означает реализацию предсказательного опроса.
Пусть Я* - множество респондентов, мнение которых не представлено в исходной БФ: УХУф((ХбЕ*)->(У(т1О)(Хг>1[ф])&(фе/0))- В процессе реализации ФКАСД происходит предсказание возможной оценки отношения для некоторых респондентов, образующих множество 11*' = {X | ЗфЗу(/(у>Я)(Х=>1 [ф])&(у е {1, -1, 0}))&(«>0)&(фе£)}. Предсказанные мнения
(на п-м шаге ДСМ-рассуждений) представлены множеством Кп* = К1п*и А^/иКо/^Л где Кч* = {ф|ЗХ/^„)(Х=>,[ф])&(Хб^)&(^1)} -множество предсказанных мнений с оценкой V, Уе{±1, 0}, -
{<р|ЗХ/(т, „)(Х=>1[ф])&(ХбК*)&(п>1)}.
В предсказательном опросе такой параметр, как стабилизированное множество ответов К, с порождением предсказаний может меняться. Соответственно, меняются значения вычисленных характеристик рациональности - (р*, А,*, ц*). Таким образом, мы имеем дело с предсказанием возможной рациональности социальных сообществ, и сравнение исходных и новых характеристик представляет несомненный интерес.
Предсказательные опросы могут быть представлены следующими структурами.
Простой эмпирический предсказательный опрос = <7М, Jm Р, К', Л, Х=>)У, V з<='№), где У1П(оо)- множество «внутренних» (эмпирических) истинностных значений бесконечнозначной ДСМ-логики. У,„(ю) = {(у, и)| (уе {1,-1, 0})&(иеЛО}и{(т, и)| пеЩ, И- множество натуральных чисел.
Орт" = (7„, Р, 2, К', Л, Х=>,У, V з<=\У) - расширенный эмпирический предсказательный опрос.
= <Л,, Л» Л 2, К', Я, Х=>,У, V 3<=^ А, {<5,}15ед> - расширенный аргументационный предсказательный опрос.
Отметим, что анализ мнений и реализация предсказательного опроса средствами ДСМ-рассуждений является основанием для конкретизации т-значного опроса как четырёхзначного - с четырьмя типами истинностных значений уе{+1, -1, 0, г}, используемых в ДСМ-логике. Соответственно, анализ непротиворечивости проводится с использованием метода аналитических таблиц для логики УА4.
Напомним, что процедура абдуктивного принятия гипотез в ДСМ-методе, предусматривающая возможность интерактивного расширения исходных данных в случае недостаточной объясненности имеющихся фактов полученными гипотезами, также приводит к изменению Л и, соответственно, К'. А это естественным образом влечет вычисление значений критериев рациональности для новых данных с их возможным изменением. Кроме того, расширение БФ на основании требования абдуктивного принятия гипотез позволяет ввести еще одну численную характеристику - уровень каузальной полноты, определяемый как отношение числа объясненных с помощью порожденных ДСМ-гипотез исходных фактов к общему числу фактов в БФ. Если в процессе пополнения БФ этот уровень растет, можно говорить об абдуктивной сходимости ДСМ-рассуждения.
В Четвёртой главе предлагается рассмотрение двух подходов к реализации познавательной схемы «анализ данных - предсказание -объяснение». Первый, конкретизирующий уточнение этой схемы синтезом познавательных процедур «индукция - аналогия - абдукция» и
представляющий класс когнитивных рассуждений, реализован в ДСМ-методе автоматического порождения гипотез. Второй восходит к Качественному сравнительному анализу (ОСА) американского социолога Ч. Рейджина и использует для поиска сходства социологических объектов аппарат булевой алгебры. Дополнение логико-алгебраических процедур поиска сходства (^СА адекватными процедурами вывода по аналогии и абдуктивного объяснения позволило говорить о реализации общей эвристической схемы «сходство -аналогия - абдукция» (А1АпАЪ).
Для /„-логик, являющихся средством формализации т-значного опроса, верна теорема о представимости всякой не эквивалентной 0 формулы ср логики высказываний /т посредством совершенной дизъюнктивной нормальной формы Л.-СДНФ (Л,-С3ф) и притом единственным образом. Формулируется обобщение алгоритма Куайна для перевода Л-СДНФ в сокращенные 7т-ДНФ. Применяя последовательно, пока это возможно, «обобщенное склеивание» и поглощение к формуле ср логики Л, (в нашем случае - к дизъюнкции мнений ср, = 7(,,р1&...&/,чрл, у(0[ру] = уД у/°еУи,у
= 1, ..., п, / = 1, т" из начального состояния БФ), получим 5ф-сокращенную ДНФ формулы ф. Полученные импликанты используются для определения отношения причинности.
Рассмотрим опрос для логики когда отношение к теме
характеризуются оценками Уе{+1, -1, 0, т}. Опрос относительно элементов каркаса (внутренний) может быть от-значным с соответствующим использованием /„-логик для порождения импликант и отношения каузальности. Сходство мнений в ДСМ-методе при этом есть теоретико-множественное сходство составов мнений и не зависит от значности опроса. Без ограничения общности можно считать, что и внутренний опрос представлен вариантами ответов +1 («да»), -1 («нет»), 0 («и да, и нет»), т (не определено). Ответом /-го респондента по теме опроса Т* будет максимальная конъюнкция <р, « 7;„р,&...&У,„р„, где уЯ е{±1, 0, т}, х = 1, ...,п;] = 1, ...,4я.
Пусть в БФ представлено множество респондентов Ыо = Но(+1)иКоИЪ Яо(0)и К«« где Ко(у> = {Х|ЗфУ<у,0)(Х=>,[ф])&(фуе{+1, -1, 0}, К,« = {Х|ЗфУ(т,0)(Хг>1[ф])&(фб^')}, КоМпН<,(м)=0 для у*ц. Аналогично, соответствующие мнения представлены множествами К0М {ф|ЭХ/(у,о)(Х=>1 [ф])&(фе!С)}, уе{+1, -1, 0}, К0(г) = {ф| ЗХ/(1,0)(Х=>1[ф])& (феГ)}.
В случае, если выбор отношения к теме (и/или элементам каркаса) осуществляется на основе аргументов «за» и «против» (с использованием логики аргументации), множества мнений задаются непротиворечиво: VvVц(v9i^l=, V, це{+1, -1, 0, т). Однако в общем случае это не
обязательно. Для {а*у возможны также варианты: а). ЭуЭц(КЬ(у) = Ко^У б) ЗчЗ^К^пКо^ = ЯЬМ); в). ЗуЗц^пЯ^ * 0)&-,((КомпКо^ = Я^У (Ко^пКо^ = Яо00))). Для всех этих случаев в процессе ДСМ-рассуждения
/
могут быть порождены противоречивые гипотезы (разумеется, если сходства соответствующих респондентов также совпадут), поскольку (+)- и (-)-гипотезы являются в ДСМ-методе взаимно фальсифицирующими. Однако и схема А1АпАЪ может быть дополнена соответствующими процедурами.
Рассмотрим определенные выше множества мнений = {фь..., ^ },
К0Н) = {ф1,..., }, Ко-0) = {фь..., } и соответствующие множества
респондентов = {Х„ ..., Х„„ }, КоН> = {X!.....Х„,}, ^ = {Х„ ..., Х„,}.
Для каждой СДНФ ф^ ... Vг = 1, 2, 3, с помощью обобщенного
алгоритма Куайна строятся совращенные ДНФ 3(ф1у ... \/<р,{) = ... V% с
соответствующим множеством импликант [Эф](у) = {хь Хг, }> У6 {+1, -1,
0). Каждой импликанте X/ из [Эф]м поставим в соответствие такое множество
мнений ф, что ф покрывается импликантой ={ф|^С ф},у = 1,
..., г/, I = 1, 2, 3. Соответственно, множество субъектов, мнение которых есть элемент К0{\ обозначим ^ = {Х| /а,о)(Х^,[ф,])&ф?бК0му}, = {хд, .... Хл}. Сходство элементов Ко(у;-всех X таких, что их мнение
покрывается импликантой ^-обозначим У''";, Vм; = р)ХЛ. Тогда
ы
отношение каузальности С^У'^у, %,) будет представлено парами {Vм,-, ъ)
(У/*0, у = 1.....г„ 1 = 1, 2, 3). Итак, Vм/ - детерминанта мнения ф,еК0 у,
У<у); сХ, /(у.о)(Х=>1 [ф^]). Множеству импликант [Эф]м соответствует множество детерминант {Умь ...,
Абдуктивное объяснение исходных примеров из БФ в этом случае имеет место всегда, если только сходство У'(уу респондентов, мнение которых покрывается импликантой не пусто. Предикат объяснения примеров из БФ - о)(Х=>)У), уе{+1, -1, 0} - импликантами может быть записан в виде
£<у)(Х)¥)^ЭУмЗх((У'(у)сХ)&(У(^0)&(МсУ)&С<у)(У'м, %)&/<* о>(Х=»,¥)), гДе М~множество атомов, входящих в импликанту %, [%] = {/„ ...,
Предикат для вывода по аналогии-для доопределения отношения к теме субъектов, описание которых представлено в БФ - может быть уточнен (по сравнению с простым булевским - двузначным - опросом). Вследствие того, что респонденты с разным отношением к теме могут иметь одинаковые мнения, возможны импликанты %, входящие одновременно в разные множества [Эф]*"5 и [Зф](ц) (ргу, V, це{-И, -1, 0}), и мнения, покрываемые импликантами для разных V и ц одновременно. Следовательно, для порождения, например, гипотезы ./^(Х^У) необходимо проверить,
выполняется ли предикат П"(Х, У) ^ ЗУс+)Зх((У'(+)сХ)&(У'(+>*0) & ([х]сУ) & С<+)(У'(+), х) & V\|/((MaY) -ХЗУ^С^У'Ч у) & У'нсХ) V 3у.(о)(С<о)(у,(0)1 ¥)&у'<°)сХ))). ГГ(Х, У) определяется аналогично.
Поскольку возможно существование одних и тех же мнений у респондентов с различным отношением к теме, может быть определен также
предикат П°(Х, У) ~ ЗУ'(+)Зх((У'(+)сХ)&(У'(+^0)&(МсУ)&С(+)(У'(+). %)& ВУгНЗн/((У"нсХ)&(У"(^0)&([^]сУ)& \у)№У"{ЩЭ№1тоХ)&
(У"<°^0)&([ф]сУ)&С<О)(У"(О), ф))).
ГГ(Х, У) ~ У)уГГ(Х, \>П°(Х, У)).
Порождение импликант предполагает замкнутость мира -представленные в БФ примеры рассматриваются как полное описание возможного проявления эффектов поведения (мнения). Вследствие этого, даже при наличии итеративной процедуры доопределения с помощью предложенных предикатов корректное доопределение возможно только для мнений из множества 1С, которые уже встречались в БФ.
Использование логических средств для интеллектуального анализа эмпирических социологических данных предоставляет исследователю возможности не только для выявления каузальных зависимостей, но и для предсказания неизвестных ранее вариантов поведения (мнений) и, что особенно нетривиально, для оправдания принятых гипотез, и тем самым может рассматриваться как когнитивный инструмент анализа социологических данных. При этом каждый из представленных вариантов формализованных когнитивных эвристик «сходство - аналогия - абдукция» обладает своими возможностями. Гипотезы о причинах, порождаемые в алгебраическом подходе, являются максимальными по числу использовавшихся при их порождении примеров (что, соответственно, повышает степень их правдоподобия), однако число таких гипотез меньше числа ДСМ-гипотез. При этом по самой процедуре построения множества гипотез о каузальных зависимостях в этом подходе степень каузальной полноты, как правило, превышает аналогичный показатель для ДСМ-метода. Причиной этого является более емкий характер абдуктивного объяснения в ДСМ-методе - здесь требуется объяснить все свойства объектов, алгебраический же подход довольствуется покрытием имеющихся свойств соответствующими импликантами. В алгебраическом подходе, в отличие от ДСМ-метода, не реализуется формальное доопределение примеров с ранее не встречавшимися свойствами (мнениями). Отсюда - отсутствие последовательного и повторяющегося использования процедур поровдения причинных зависимостей и доопределения неизвестных свойств объектов, которое столь существенно для формирования стратегии ДСМ-рассуждения.
Эти различия обусловлены, в первую очередь, исходными онтологическими предпосылками, характеризующими области применимости обоих подходов. ДСМ-метод изначально ориентирован на открытые предметные области, где эмпирические данные и знания неполны, процедуры извлечения знаний из фактов включают правдоподобные рассуждения, а данные и знания могут пополняться не только за счет порожденных гипотез, но и внешним образом, на основании признания недостаточности полученных результатов. ДСМ-метод есть инструмент
машинного (индуктивного) обучения. Алгебраический же подход создавался для анализа имеющихся данных в предположении, что ничем иным исследователь не располагает (к примеру, когда число примеров заведомо ограничено или провести новый эксперимент, опрос не представляется возможным). Это лишний раз напоминает о необходимости выбора средств анализа, адекватных природе исследуемой области.
В Главе 5 описываются формальные средства ситуационного расширения ДСМ-метода автоматического порождения гипотез - прямого («от причины - к следствию», сходство субъектов поведения влечёт сходство их поведения) и обратного («от следствия - к причине», сходство мнений означает сходство индивидуумов, выражающих эти мнения) типов рассуждения. Учёт параметров ситуации, в которой реализуется поведение, составляет один из принципов ИАСД.
При осуществлении социальных взаимодействий несомненное влияние на поведение субъекта оказывают внеличностные, ситуационные факторы, способствующие или препятствующие поведению. По мнению К.Р. Поппера21 введение знаний о ситуации сообщает социологическим рассуждениям объективный характер и устраняет психологизм как средство анализа социального поведения. Необходимость учета ситуации подтверждается современными исследованиями в области социальной психологии. К такому же заключению привёл опыт анализа коллективного поведения рабочих, описанный выше.
Указанные соображения послужили основой перехода от изучения отношения «субъект=>поведение» к отношению «(субъект, ситуация) => поведение», которому соответствует исходный предикат Р(Х,У,$), интерпретируемый как «субъект X обладает (не обладает) множеством свойств У в ситуации Б». В результате индуктивного анализа порождается предикат причинности Д(«У,8'),\Ю - «пара (подмножество характеристик V и фрагмент ситуации Б') есть причина наличия (отсутствия) множества свойств Я, (¿=1, 2, 3, 4) характеризует структуру мира - насколько в ней существенны сам объект и ситуация проявления свойств. Пусть Д=2?1уЯ2уЛ3; Д1<->Д&(У*0&8=0); Д2<->Д&(У*0&Д3<->Д&(У=0&8*0); К4=Я.
Изучение влияния ситуаций на поведение потребовало расширения ДСМ-языка включением переменных Б, Бь..., Бп ... и констант 8,8,,...,8„ ...3-го сорта для ситуаций, а также задания булевой алгебры
ситуаций % = (2и<ч ,0, и(3), —, п, и), где и(3) = ..., .?,} - множество ситуационных параметров.
Решающий предикат тернарного положительного сходства-2 1 М*а,п (УЛУ^оЛ), непараметрический вариант которого используется в индуктивных п.п.в.-1, имеет структуру, сходную со структурой предиката простого сходства. Индекс «2» указывает на реализацию причинной
" Поппер К. Логика социальных наук // Эволюционная эпистемология и логика социальных наук. М.: Эдигориал УРСС, 2000. С. 298 - 313.
зависимости Я2, где существенными детерминирующими факторами являются как особенности личности, так и внешние обстоятельства (УфШЪф®). Подформула УХУУУв((./(,, я)Р(Х, У, в) & УЩ^п)Р{Х, и, в)
к
исУ) & (УсХ) & (восв)) -> С^сУ & Ш0 & (V (Х=Х/)))) описывает
эмпирическую зависимость (ЭЗ), прогнозируемую как искомое причинно-следственное отношение («пара (подобъект V и фрагмент ситуации 80> есть причина наличия свойств W»). Эта зависимость есть результат сходства V рассматриваемых субъектов поведения и ситуаций 80 поведения
(У*0&8О*0). Подформула &(/(1,пда,У(,8()&Уи(/(1,й)Р(Хг,и,8,НидУ())
описывает экзистенциальное условие (ЭУ), характеризующее рассматриваемое множество примеров. Предикат тернарного отрицательного сходства формулируется аналогично.
Конструктивное порождение оценки «фактическое противоречие» посредством правил правдоподобного вывода позволяет в рамках ДСМ-метода осуществлять логический анализ модели конфликта. К числу онтологических особенностей социальной реальности следует отнести наличие в исходных данных утверждений с оценкой 0 - «эмпирическое противоречие», т.е. фактов вида ./(о,„)Р(С,А,8). Для анализа таких фактов формулируется предикат тернарного конфликтного сходства-2 гМКУ^о Я
Правила правдоподобного вывода 1-го рода п.п.в.-1 для порождения гипотез о причинах могут быть записаны в виде (при наличии противоречий в исходной БФ):
¿мЩУМЩ гКп5о)¿-гК^^А)) (0+2 -—-- .
Соответственно, записываются правила (1)н2 и (1)(,)2 - по аналогии с правилами простого ДСМ-метода. В соответствии с условием М-полноты (0)-правило принимает вид
(1)°2 -—-:- .
Разумеется, множество М-предикатов для ситуационного варианта ДСМ-метода может быть расширено с помощью усиливающих добавок, как это сделано выше.
Для переноса найденных закономерностей на случай неопределённости в БФ формулируются решающие предикаты для п.п.в.-2. Эти предикаты, как и описанные в Главе 2, включают подформулы, описывающие вхождение в доопределяемый пример полученных ранее гипотез о причинах
¿сВХ^УаМК^Ш & Х,-сУ & Б,^) & (уУ^. В предикат также
/.I
входит запрет на включение в рассматриваемый объект V отрицательных или противоречивых причин (г,Б') для любых подмножеств и свойств из Ж: VU((UcW&Ш0)^-,ЗZЗS'((J(-1,„)^?2«Z,S'>JU)vJ(o,„>Л2((Z>S')1U))&(ZcV)& (^сБ))).
Аксиомы каузальной полноты для ситуационного варианта ДСМ-метода формулируются по аналогии с приведёнными в Главе 2.
2АКП(+): УХУУУБЗЙУ,.. .3 У*3 .. .3\Vi3S',.. .ЗЗ'^оДХ.У^)-*
& (У,<гХ) & (Б'еБ) & (У,*0) & (8',*0) & 0^0)) &
/-г
Глава 6 представляет результат исследований как создание инструмента для решения задач нового направления когнитивной социологии - изучения и имитации собственно познавательной деятельности в исследовании социальных явлений, а также влияния познавательной активности индивидуумов на поведение. Предложенные средства предполагают совместное использование стандартных эвристик формирования массива данных (т.е. предварительной содержательной работы социолога) и формализованных эвристик анализа данных для решения социологических проблем на основе эмпирического материала. Эвристики формализуются средствами ДСМ-метода автоматического порождения гипотез в Интеллектуальных системах типа ДСМ.
Особенностью реализации предложенной технологии анализа социологических данных в ИС-ДСМ является имитация ряда познавательных способностей естественного интеллекта - как в автоматическом, так и в интерактивном режиме. Это и автоматическое порождение аргументации на основе аргументационных функций респондента, и абдуктивное объяснение имеющихся фактов (имитирующее рефлексию и объяснение как ответ на вопрос «Почему?»), и, что особенно важно, реализация познавательного процесса - синтеза познавательных процедур. Этот ряд дополняется собственными когнитивными инструментами ДСМ-метода: структурированным описанием субъекта, представляющим источник мотивации его поведения (действий, установок, мнений), представлением мнения как аргументированного отношения к теме, стабилизацией опроса, измерением рациональности на основе качественного анализа социологических данных, анализом противоречивости мнений с учетом объективного (внешнего) знания (предложенных исследователем зависимостей между элементами опроса).
Рассмотренная технология опроса позволяет также зафиксировать явным образом влияние когнитивных эффектов на формирование мнений. Это отображается в некоммутативности различных вариантов проведения опроса относительно рационального восприятия элементов опроса, что было отмечено в реальном эксперименте.
Архитектура интеллектуальной системы (ИС), предназначенной для приближенного отображения познавательной деятельности «анализ данных-предсказание - объяснение» представляется следующим образом22: ИС = Решатель задач + Информационная среда (БФ+БЗ) + Интеллектуальный интерфейс. Решатель реализует познавательные процедуры и включает Рассуждатель, Вычислитель и Синтезатор. В ИС-ДСМ Рассуждатель реализует процедуры ДСМ-метода автоматического порождения гипотез, формализующие соответствующую эвристику анализа данных. Вычислитель обеспечивает потребности количественного анализа (который может оказаться востребованным для некоторых видов социологических данных), сюда же можно отнести вычисление предложенных в работе критериев' рациональности мнений. Синтезатор регулирует взаимодействие Рассуждателя и Вычислителя. В результате работы соответствующих ИС из данных не только извлекаются «образцы» в смысле data mining, но и порождаются гипотезы о закономерностях, которые обнаруживаются в расширяемых (вследствие потребностей абдуктивного объяснения имеющихся фактов) последовательностях БФ.
Составная часть Решателя ДСМ-системы - Рассуждатель - реализует процедуры ДСМ-метода автоматического порождения гипотез, формализующие соответствующую эвристику анализа данных! Интеллектуальная система для анализа эмпирических социологических данных должна обеспечивать выбор стратегий исследования в зависимости от структуры предикатов и правил - прямой или обратный методы, ситуационный вариант ДСМ-метода, рассмотрение противоречивых примеров из исходной БФ («анализ конфликта»), В рамках выбранной стратегии необходимо иметь возможность реализации усиливающих добавок к решающим предикатам и формирования правил правдоподобного вывода первого рода из различных по силе методов разного знака. Важной составляющей такой системы является подсистема обнаружения законов и тенденций на основе выявления взаимной непротиворечивости стратегий,
Интеллектуальная система способна полноценно реализовать познавательный процесс при наличии развитых инструментов накопления знаний (Информационная среда), а также восприятия и отображения (Интеллектуальный интерфейс). ИС эффективно решает задачи ФКАСД, если при наличии описанной структуры превращается в автоматизированное рабочее место социолога, обеспечивающее проведение качественного исследования. Сюда входит хранение, структурирование и управление данными (препроцессинг) в едином информационном пространстве, применение различных стратегий анализа данных, реализуемых Решателем (ДСМ-метод или QCA), использование полученных результатов для последующих форм анализа (например, анализа рациональности мнений). Отметим, что препроцессинг - подготовка данных и уточнение модели
23 Арский Ю.М., Финн В.К. Принципы конструирования интеллектуальных систем // Информационные технологии и вычислительные системы, 2008, № 4, с. 4 - 36.
предметной области - может осуществляться как автоматически (с помощью специальных диагностических процедур, позволяющих выбрать наиболее адекватные стратегии Решателя), так и в интерактивном режиме с привлечением инженерии знаний.
В технологическом смысле можно рассматривать Информационную среду не просто как совокупность БФ и БЗ, но как активную оболочку ИС, обеспечивающую функционирование всех компонентов системы как единого целого. Здесь не только осуществляется надежное и безопасное хранение и управление данными, но и организуются и упорядочиваются процессы взаимодействия пользователей с Решателем в целях максимально эффективного использования возможностей предлагаемых технологий качественного анализа данных. Интеллектуальный интерфейс обеспечивает возможность внесения изменений в Информационную среду, предоставляет различные инструменты препроцессинга и предлагает средства интеграции с другими прикладными системами. Последнее обстоятельство особенно важно учитывать при решении задачи анализа социологических данных, где огромную роль играют укоренившиеся традиции статистической обработки результатов эмпирических исследований. Одним из наиболее широко распространенных инструментов такого анализа является пакет SPSS (Statistical Package for the Social Sciences), интеграция с которым позволяет комбинировать в одном исследовании инструменты не только качественного, но и количественного анализа. В таком варианте ИС может характеризоваться как специфическая интегрированная: наряду с Рассуждателем Решатель включает также внешний Вычислитель и, соответственно, Синтезатор, регулирующий взаимодействие Рассуждателя и Вычислителя.
Примерами реализации Интеллектуальных систем для анализа социологических данных на основе изложенных принципов являются созданные под руководством автора диссертации Обучающая ДСМ-система для анализа социологических данных (дипломная работа студентки Отделения интеллектуальных систем РГГУ Феофановой T.JI.) и Интеллектуальная система Socio Magic для формализованного качественного анализа социологических данных (кандидатская диссертация аспирантки ВИНИТИ РАН Бурковской Ж.И.).
В Заключении сформулированы основные результаты работы и обсуждаются открытые проблемы.
Заключение
В результате работы созданы основания и разработан инструмент для применения методов современного интеллектуального анализа данных для решения задач когнитивной социологии - формализации самого процесса порождения нового знания из качественных эмпирических социологических данных и анализа влияния когнитивной активности индивидуумов на социальное поведение. Предложены средства представления сложно структурированных данных и плохо формализованных знаний о субъекте и
его поведении. Развит аппарат интеллектуального анализа социологических данных с синтезом познавательных процедур для извлечения закономерностей из эмпирических данных. Таким образом, разработаны принципы и созданы средства формализованного качественного анализа социологических данных. Это означает, что созданы научные основы современных технологий формализованного качественного анализа эмпирических данных и обнаружения и извлечения из них новых знаний, что актуально для наук о жизни и социальном поведении. Созданный когнитивный инструмент реализуется в современных интеллектуальных системах (ИС типа ДСМ).
Разработанные теоретические принципы и логический аппарат формального представления закрытых и предсказательных опросов предоставляют возможности для решения задач анализа и предсказания результатов реальных опросов. Развитие средств формальной аргументации объективизирует субъективные социологические данные, в результате чего они оказываются основой дальнейшего анализа средствами правдоподобных рассуждений. Аргументационная семантика для формирования оценок результатов опросов включается в общую структуру логического аппарата распознавания и предсказания рациональности мнений. Использование числовых характеристик рациональности является реализацией идеи содержательного отображения отношений в измеряемые параметры.
Предлагаемые средства интеллектуального анализа социологических данных не могут заменить содержательной работы исследователя-социолога, а представляют собой лишь формализованную оболочку для решения некоторых социологических задач. Необходим диалог профессионального (сциентистского) применения исследовательских процедур и глубокого (гуманистического) понимания сущности изучаемых социальных проблем. Подобное содружество представляет собой ответ на вызов потребностей формализации качественного анализа социологических данных и расширяет возможности обработки эмпирических социологических данных. Стандартные эвристики формирования массива данных должны предшествовать формализованным эвристикам анализа данных. Подготовка данных в соответствии с требованиями условий применимости формальных средств - ДСМ-метода автоматического порождения гипотез и соответствующих интеллектуальных систем - позволяет надеяться на получение полезных результатов, что и было продемонстрировано на примере решения конкретных задач анализа поведения рабочих на конфликтных предприятиях (совместно с Институтом социологии РАН) и изучения рациональности электоральных предпочтений студентов (совместно с РГГУ).
Использование интеллектуального анализа социологических данных способствует объективизации эмпирических социологических исследований, развитию логики и методологии социальных наук. С другой стороны] потребности такого анализа являются стимулом для развития компьютерной поддержки таких исследований, и, как следствие, оказываются центром
кристаллизации новых идей интеллектуального анализа данных как такового, способствуя развитию новых информационных технологий. Взаимодействие идей классической социологии и методов интеллектуального анализа социологических данных позволяет говорить о соответствующем возникающем разделе современной когнитивной социологии.
Основные публикации по теме диссертации
Работы, опубликованные в рецензируемых журналах, входящих в Перечень ВАК:
1. Данилова Е. Н., Михеенкова М. А., Климова С. Г. Возможности применения логико-комбинаторных методов для анализа социальной информации // Социология: методология, методы, математическое моделирование, 1999, № 11, с. 142 - 160.
2. Климова С.Г., Михеенкова М.А., Панкратов Д.В. ДСМ-метод как метод выявления детерминант социального поведения II НТИ, сер.2, 1999, № 12, с.20-26.
3. Финн В.К., Михеенкова М.А. О ситуационном расширении ДСМ-метода автоматического порождения гипотез // НТИ, сер.2, 2000, № 11, с. 20-30.
4. Гусакова С.М., Михеенкова М.А., Финн В.К. О логических средствах автоматизированного анализа мнений // НТИ, сер.2,2001, № 5, с. 4 - 24.
5. Финн В.К., Михеенкова М.А. О логических средствах концептуализации анализа мнений // НТИ, сер.2,2002, № 6, с. 4 - 24.
6. Финн В.К., Михеенкова М.А., Бурковская Ж.И. О логических принципах анализа электорального поведения // НТИ, сер. 2, 2004, № 8, с. 18-22.
7. Михеенкова М.А., Феофанова Т.Л. Обучающая ДСМ-система для анализа социологических данных // Вестник Российского государственного гуманитарного университета. Серия «Информатика. Информационная безопасность. Математика», 2009 г., вып. 10, с. 152 — 169.
8. Михеенкова М.А. О принципах формализованного качественного анализа социологических данных // Информационные технологии и вычислительные системы, 2009, № 4, с. 40 - 56.
9. Михеенкова М.А. О логических средствах интеллектуального анализа социологических данных // Искусственный интеллект и принятие решений, 2010, № 1, с. 20 - 32.
10. Михеенкова М.А. О формализованных эвристиках качественного анализа социологических данных // Вестник Российского государственного гуманитарного университета. Серия «Информатика. Информационная безопасность. Математика», 2010, вып. 12 (55), с. 193 -213.
11. Михеенкова М.А., Финн В.К. Об одном подходе к распознаванию рациональности в коллективах агентов // Искусственный интеллект и принятие решений, 2010, № 3, с. 20 - 32.
12. Михеенкова М.А. Возможности компьютерной поддержки качественных исследований в социологии // НТИ, сер. 2,2011, № 8, с. 1 -21.
13. Михеенкова М.А. Интеллектуальный анализ социологических данных и некоторые задачи когнитивной социологии // НТИ, сер.2,2011, № 10, с 1 -17.
Работы, опубликованные в других изданиях:
14. Михеенкова М.А., Финн В.К. Интеллектуальные системы для анализа социологических данных: задачи, логика, архитектура // «Математическое моделирование социальных процессов», 2004, вып. 6.
15. Михеенкова М.А., Финн В.К. Логические средства формализации закрытых опросов и проблемы распознавания рациональности мнений // Математическое моделирование социальных процессов, 2005, вып. 7 с 127-135.
16. Финн В.К., Михеенкова М.А. Логические средства анализа рациональности мнений // Математическое моделирование социальных процессов, 2006, вып. 8, с. 37-40.
17. Финн В.К., Михеенкова М.А. Формализованный качественный анализ социологических данных и проблемы когнитивной социологии // Математическое моделирование социальных процессов, 2007, вып. 9 с 120-125.
18. Finn V.K., and Mikheyenkova М.А. "Quantofrenia" by P.A. Sorokin and Formalized Qualitative Analysis // European Society or European Societies: a View from Russia. Ed. V.A. Mansurov. Moscow - Lisbon, 2009, pp 189 -192.
19. Finn V.K., Mikheyenkova M.A. Plausible Reasoning for the Problems of Cognitive Sociology // Logic and Logical Philosophy, Vol. 20 (2011), pp. 113
20. Михеенкова M.A., Финн B.K. Интеллектуальный анализ данных и проблемы когнитивной социологии // Математическое моделирование социальных процессов, 2011 (в печати)
21. Михеенкова М.А. Принципы когнитивной социологии и реализация познавательной активности «анализ данных - предсказание -объяснение» И Труды Российско-Британской конференции «Идеи Д.С. Милля об индукции и логике наук о человеке и обществе в когнитивных исследованиях и системах искусственного интеллекта», Москва, 15-17 июня 2011 г. (в печати).
Работы, опубликованные в сборниках Трудов конференций:
22. Михеенкова М.А. О контекстном варианте причинно-следственного отношения в ДСМ-методе автоматического порождения гипотез // 4-я международная конференция «Интеграция. Информационные технологии. Телекоммуникации. НТИ-99», Москва, Март 17-19, 1999, Труды конференции, с. 275 - 280.
23. Михеенкова М.А., Финн В.К. Правдоподобные рассуждения с информацией о ситуации // VII Национальная конференция с международным участием «Искусственный интеллект-2000», Переславль-Залесский, Октябрь 24-26, 2000, Труды конференции, с. 50 -58.
24. Михеенкова М.А., Панкратов Д.В. Об интеллектуальной системе анализа социального поведения // VII Национальная конференция с международным участием «Искусственный интеллект-2000», Переславль-Залесский, Октябрь 24-26,2000, Труды конференции, с. 76 -82.
25. Финн В.К., Михеенкова М.А. Проблемы и логические средства интеллектуального анализа социологических данных // VIII Национальная конференция с международным участием «Искусственный интеллект-2002", Коломна, Октябрь 8-11, 2002, Труды конференции в 2 томах, т. 1, с. 15 - 30.
26. Финн В.К., Михеенкова М.А. Анализ социологических данных средствами интеллектуальных систем // 6-я Международная конференция «НТИ-2002»: «Информационное общество. Интеллектуальная обработка информации. Информационные технологии», 16-18 октября, 2002, Материалы конференции, с. 434 -436.
27. Финн В.К., Михеенкова М.А. Логические средства анализа мнений // Сорокинские чтения-2002, «Актуальные проблемы социологической науки и социальной практики», Москва, Декабрь 17-18, 2002, Сборник научных докладов в 3 томах, т.З, с.93-106.
28. Михеенкова М.А., Финн В.К. Интеллектуальные системы для анализа социологических данных: задачи, логика, архитектура // II Всероссийский социологический конгресс «Российское общество и социология в XXI веке: социальные вызовы и альтернативы», Москва, 30 сентября - 2 октября, 2003, Тезисы докладов и выступлений в 3 томах, т. 1, с. 544-545.
29. V.K. Finn, М.А. Mikheyenkova "Non-statistic method for sociological data analysis and the problem of rational opinion choice», Международная конференция «Математическое моделирование социальной и экономической динамики (MMSED-2004)», Москва, 23 - 25 июня, 2004,
30. Бурковская Ж.И., Михеенкова М.А., Финн В.К. Об интеллектуальной системе для анализа электорального поведения // IX Национальная конференция с международным участием «Искусственный интеллект-2004», Тверь, Сентябрь 8-11, 2004, Труды конференции в 2 томах, т.1, с.120-128.
31. Михеенкова М.А., Финн В.К. Проблемы создания интеллектуальных систем для анализа социального поведения И «Философия искусственного интеллекта», Материалы Всероссийской междисциплинарной конференции, Москва, 17-19 января, 2005, с. 366368.
32. Михеенкова M.А., Финн B.K. Логика интеллектуальных систем как средство системного анализа в социологии // Первая международная конференция «Системный анализ и информационные технологии» САИТ-2005, Труды конференции, Переславль-Залесский, 12-16 сентября 2005 г., с. 31-35.
33. Михеенкова М.А., Финн В.К. Об одном варианте формализованного качественного анализа социологических данных // X Национальная конференция с международным участием «Искусственный интеллекг-2006», Обнинск, Сентябрь 26-28, 2006, Труды конференции в 3 томах, т.1, с. 284-292.
34. Михеенкова М.А., Финн В.К. Анализ мнений и многоагентные системы // X Национальная конференция с международным участием «Искусственный интеллект-2006», Обнинск, Сентябрь 26-28, 2006, Труды конференции в 3 томах, т. 3, с. 902 -907.
35. Михеенкова М.А., Финн В.К. Формализованный качественный анализ социологических данных и проблемы когнитивной социологии // III Всероссийский социологический конгресс «Глобализация и социальные изменения в современной России», Москва, 3 - 5 октября, 2006, Тезисы докладов и выступлений, т. 11, с. 151 -155.
36. Михеенкова М.А., Финн В.К. Правдоподобные рассуждения и булева алгебра для анализа социологических данных (проблемы когнитивной социологии) // Вторая международная конференция «Системный анализ и информационные технологии» САИТ-2007, Труды конференции, Обнинск, 10-14 сентября 2007 г., т. 1., с. 153 - 155.
37. Финн В.К., Михеенкова М.А. К формальному определению закрытого социологического опроса // Тезисы докладов III Всероссийской научной конференции Сорокинские чтения: «Социальные процессы в современной России: традиции и инновации» в 5 томах, Москва, 4-5 декабря 2007, М.: Университет. Книжный дом, 2007, Т. 1, с. 214 - 217.
38. Михеенкова М.А., Финн В.К. Интеллектуальный анализ данных для проблем когнитивной социологии // XI Национальная конференция с международным участием «Искусственный интеллект-2008», Дубна, Сентябрь 29 - Октябрь 2, 2008, Труды конференции в 3 томах, т. 2, с. 61 - 69.
39. Финн В.К., Михеенкова М.А., Сидорова A.B. О когнитивных эвристиках анализа социологических данных // III Всероссийский социологический конгресс «Социология и общество: проблемы и пути взаимодействия», Москва, 21 - 24 октября 2008 г., Тезисы докладов и выступлений, http://www.isras.ru/abstract bank/1214905899.pdf
40. Михеенкова М.А., Финн В.К. «Квантофрения» по П.А. Сорокину и формализованный качественный анализ // Международная научная конференция -Первые Санкт-Петербургские социологические чтения «Питирим Александрович Сорокин и современные проблемы социологии», С.-Пб., 16 - 17 апреля 2009 г., Материалы конференции в 2-х томах, т. 2, с. 496 - 499.
41. Михеенкова М.А., Финн В.К. О количественных характеристиках в качественном анализе социологических данных // Третья международная конференция «Системный анализ и информационные технологии» САИТ-2009, Звенигород, 14-18 сентября 2009 г., Труды конференции, с. 191 - 196.
42. Михеенкова М.А. Логические средства когнитивной социологии // Четвертая международная конференция по когнитивной науке, Томск, 22 - 26 июня 2010 г., Тезисы докладов в двух томах, т. 2, с. 420 - 421.
43. Михеенкова М.А., Финн В.К. Интеллектуальный анализ данных в когнитивной социологии // XII Национальная конференция с международным участием «Искусственный интеллект-2010», Тверь, Сентябрь 20 - 24, 2010, Труды конференции в 4 томах, т. 1, с. 142 -152.
Подписано в печать 10.02.2012 Тираж 100 экз. Объем 2,0 уч.-изд. л.
Отпечатано в ВИНИТИ РАН 125190, Москва, ул. Усиевича, д. 20
Оглавление автор диссертации — доктора технических наук Михеенкова, Мария Анатольевна
Введение
Глава 1. Качественный анализ социологических данных: от компьютерной поддержки к формализации
1.1. Методологические проблемы в социологических исследованиях
1.2. Компьютерная поддержка качественных исследований
1.3. О качественном сравнительном анализе (С)СА)
1.4. От обработки к анализу данных
1.5. О методах Д.С. Милля в социологии
1.6. Индукция и абдукция в искусственном интеллекте
1.7. Познавательный цикл анализ данных - предсказание - объяснение»
Глава 2. ДСМ метод автоматического порождения гипотез как средство формализованного качественного анализа социологических данных
2.1. Особенности формализации качественного анализа социологических данных
2.2. Основные характеристики ДСМ-метода
2.3. Логические средства ДСМ-метода
2.4. Прямой ДСМ-метод автоматического порождения гипотез
2.5. Применение прямого ДСМ-метода для решения задач интеллектуального анализа социологических данных
2.6. Обратный ДСМ-метод и задача анализа мнений
Глава 3. Логические средства формализации закрытых опросов и проблемы распознавания рациональности мнений
3.1. Формальное определение опроса
3.2. Семантика логики аргументации для анализа мнений
3.3. Анализ рациональности мнений
3.4. Эмпирическое исследование - анализ мнений
3.5. Характеристика предсказательных опросов
Глава 4. Анализ мнений с использованием булевой алгебры и ДСМ-метода
4.1. Гипотезы о причинных зависимостях
4.2. Вывод по аналогии и абдуктивное принятие гипотез
Глава 5. Ситуационное расширение ДСМ-метода
5.1. Прямой ДСМ-метод с параметром ситуации
5.2. Обратный ДСМ-метод с параметром ситуации
Глава 6. Интеллектуальный анализ данных в когнитивной социологии
6.1. Интеллектуальные системы для анализа социологических данных
6.2. Задачи когнитивной социологии 196 Заключение 202 Список литературы
Введение 2011 год, диссертация по информатике, вычислительной технике и управлению, Михеенкова, Мария Анатольевна
Интеллектуальный анализ данных является одним из приоритетных направлений исследований в области искусственного интеллекта. Его возможности в области представления данных и знаний, создания методов обнаружения новых знаний и извлечения закономерностей особенно востребованы в областях с обширными массивами исходных фактов, нуждающихся в структурировании, упорядочении и систематизации. Широкое распространение качественных методов анализа социологических данных в сочетании с отсутствием развитых инструментов преобразования плохо структурированных данных в знания свидетельствуют о назревшей потребности интеллектуализации исследовательских эвристик, принятых в этой области, с последующей реализацией в современных компьютерных системах. Этим и определяется актуальность работы.
Развитие социологии как эмпирической науки неотделимо от перманентных дискуссий о соотношении теоретического, концептуального подхода к изучению социальных явлений и феноменологической составляющей этого процесса. Стремление придать социальным исследованиям по возможности объективный характер и распространявшееся долгое время представление об общности естественнонаучного и социально-исторического познания отразилось в намерении ряда исследователей использовать методы, обладающие достаточно развитым формальным аппаратом и принятые в естественных науках. Массовый характер многих социальных явлений и очевидные трудности учёта множества влияющих на них факторов привели к тотальному доминированию количественных и, прежде всего, статистических методов изучения социальной действительности.
Однако представление о единстве теоретико-методологических моделей естествознания социальных наук и соответствующее ему отношение к субъекту поведения как обезличенной типической модели трудно совместимо с интересом к изучению взаимодействия мотивированных, целенаправленно действующих, учитывающих важные для них факторы индивидуумов. Отсюда естественно возникает восприятие социологии как науки, «.стремящейся, истолковывая, понять социальное действие и тем самым каузально объяснить его процесс и воздействие»1, а социального действия - как осмысленного, соотносящегося с действием других людей и ориентирующегося на него.
Стремление к развитию «понимающей» социологии (не просто воспринимающей и описывающей непосредственно эмпирические явления, но и объясняющей смысловые связи в этих явлениях), анализу форм человеческих взаимодействий, не являющихся простым проявлением воздействия социальной структуры, привело к развитию качественных - в противоположность количественным - методов, концентрирующихся на
1 М Вебер. Избранное: протестантская этика и дух капитализма. М.: РОССПЭН, 2006, с. 453. социальных взаимодействиях, личностном повседневном опыте действующего субъекта. Фундаментальной слабостью качественного анализа, рассматриваемого широко как исследование, не использующее формальных средств, оказалась прямая зависимость от способностей, здравого смысла и воображения исследователя, а порождаемые эмпирические теории заслужили статус уникальных и невоспроизводимых. С развитием компьютерной техники объективизация качественных исследований первоначально пошла по пути усовершенствования обработки, структурирования и управления данными, и здесь возможности современной генерации пакетов CAQDAS2 (Computer-Assisted Qualitative Data Analysis Software) выглядят достаточно впечатляющими.
Вызванный этим сдвиг стандартов в качественном анализе в сторону строгости заставил социологов обратиться к специалистам в области искусственного интеллекта (ИИ) с призывом к развитию средств, формализующих аналитические индуктивные стратегии создания теорий и связанные с этим когнитивные процессы абдукции. С точки зрения эпистемологического содержания качественный анализ видится как «восходящая» стратегия «доказательного и последовательного» построения теории на основе эмпирических фактов. Таким образом, речь идёт о получении нового знания из эмпирического материала. Формализация этой стратегии - формализованный качественный анализ социологических данных (ФКАСД) - предполагает создание инструмента для анализа нечисловых отношений и установление причин эффектов на основе этого анализа. Использование методов искусственного интеллекта (ИИ) в этом процессе позволяет говорить об интеллектуальном анализе социологических данных (ИАСД, knowledge discovery в социологии).
Целью диссертационной работы является создание логических средств для формализованного качественного анализа социологических данных с использованием методов искусственного интеллекта, а также разработка понятийного и логического аппарата для поддержки социологических исследований. Это означает, в частности, формализацию эвристик качественного анализа социологических данных для решения задач когнитивной социологии - направления в современной социологии, использующего когнитивные средства анализа данных, - и их реализацию средствами современных компьютерных интеллектуальных систем.
Вдохновляющим основанием для такой постановки является фундаментальный тезис об основной задаче интеллектуальных систем (ИС) как задаче конструктивной имитации и усиления (возможно, лишь до некоторой степени) познавательных способностей человека3. Реализация таких способностей в ИС предполагает наличие средств извлечения знаний
2 Lewins A., Silver С. Using Software in Qualitative Research: A Step by Step Guide. London: Sage Publications, 2007.
3 См. Финн В.К. К структурной когнитологии: феноменология сознания с точки зрения искусственного интеллекта // Вопросы философии, 2009, № 1, с. 4 - 20. из баз фактов (БФ), автоматического порождения гипотез и объяснения имеющихся фактов на основании порожденных гипотез, а также способность осуществлять дедуктивный вывод из исходных и полученных знаний (баз знаний, БЗ).
Таким образом, интеллектуальный анализ социологических данных (ИАСД) - автоматическое извлечение интерпретируемых зависимостей, неявно содержащихся в массивах эмпирических данных, между различными факторами - позволяет говорить о возможности построения теории на основе эмпирических фактов средствами формализованных познавательных процедур в компьютерных системах высокого уровня. Такой анализ требует более высокого, чем это принято в качественном анализе, уровня формализации изучаемых психосоциальных явлений и нуждается в первичном структурировании данных и знаний и формировании системы отношений для них. Следующим шагом оказывается выбор адекватных предложенному представлению формальных средств анализа. В совокупности это означает создание формального языка с дескриптивной и аргументативной функциями - для представления данных и знаний (с возможностью определения их сходства) и формализации рассуждений (и выдвижения гипотез), соответственно.
Для реализации этих целей в диссертации решены следующие задачи: первичная структуризация данных и знаний о социальном субъекте и его поведении (действиях, поведенческих установках, мнениях); разработка логических и понятийных средств для формализации правдоподобных рассуждений в базах эмпирических социологических фактов с нечисловыми параметрами; логическая формализация принципа влияния ситуации на поведение, позволяющая включать контекст поведения в структуру анализа; задание формальной структуры закрытых опросов - теоретической основы для представления предсказательных опросов; формулирование логических принципов анализа рациональности мнений; создание архитектуры интеллектуальной системы типа ДСМ для формализованного качественного анализа социологических данных, включающей средства распознавания рациональности мнений.
Научная новизна работы состоит в формализации исследовательских эвристик социолога современными логическими средствами, позволяющими осуществлять каузальный анализ социального действия, решая, тем самым, задачи классической «понимающей социологии». Основным инструментом такого анализа является ДСМ-метод автоматического порождения гипотез, являющийся синтезом познавательных процедур4 - эмпирической индукции (формальных расширений и уточнений индуктивных методов Д.С. Милля),
4 Финн В.К. Синтез познавательных процедур и проблема индукции // НТИ, Сер.2, 1999, № 1-2, с. 8-45. структурной аналогии и абдукции (принятия гипотез на основе объяснения исходных данных) Ч.С. Пирса. Источником детерминаций поведения при этом является сходство субъектов поведения. Формализация и уточнение указанных процедур для использования их при анализе эмпирических социологических данных является пионерской и не имеет прецедентов в современной практике - как социологической, так и в области исследований Искусственный интеллект. Заметим, что в качественном анализе социологических данных встречается неформальное использование методов Д.С. Милля. При этом очевидной подразумевается невозможность их формализации, а даже минимальное использование логических средств (булевой алгебры) в таком анализе воспринимается как «революция»5.
Расширение класса социологических задач - рассмотрение такой специфической формы поведения как мнение - потребовало адекватного расширения языка представления данных о мнениях индивидуумов и создания процедур для рассуждения «от причины - к следствию» (от сходства мнений - к сходству индивидуумов) - обратного ДСМ-метода. Включение ситуационных параметров реализации поведения также потребовало создания новых формальных средств их адекватного представления и учёта - ситуационной версии ДСМ-метода.
Существенным расширением имеющихся логических средств является реализация познавательной активности «анализ данных - предсказание -объяснение» в форме эвристики «алгебра логики - аналогия - абдукция» с использованием булевой алгебры для порождения гипотез о причинных зависимостях. При этом предлагаемые средства значительно превосходят по своим познавательным возможностям известный в мировой социологический практике инструмент качественного анализа данных - Качественный Сравнительный Анализ (Qualitative Comparative Analysis6, QCA) американского социолога Ч. Рейджина, где используется лишь одна составляющая предлагаемой схемы: анализ сходства примеров социальных явлений средствами алгебры логики.
Другим новым направлением является точное определение закрытых опросов посредством задания формальной структуры. Предлагаемая теоретическая концепция предусматривает использование средств многозначных логик аргументации, формализующих шкалы оценок результатов опросов. В рамках этой структуры создаются логические и процедурные средства распознавания и предсказания рациональности результатов опроса, понимаемой как выбор вариантов ответов на основе аргументационной схемы. Использование средств формальной аргументации для автоматического формирования мнений меняет традиционную опросную схему и позволяет объективизировать социологические данные, являющиеся
5 Vaisey S. QCA 3.0: The "Ragin Revolution" Continues // Contemporary Sociology: A Journal of Reviews, 2009, vol.38, No 4, p. 308-312.
6 Rihoux B., Ragin C.C. (eds). Configurational Comparative Methods. Qualitative Comparative Analysis (QCA) and related techniques (Applied Social Research Methods). Thousand Oaks. CA and London: SAGE Publications, Inc. 2009. исходными для формализованных процедур рассуждений. Интеллектуальный анализ данных осуществляется, таким образом, для целого класса закрытых опросов со стабилизированным множеством ответов (при расширении множества респондентов новые варианты ответов не появляются) и формализацией когнитивных рассуждений.
Развитые теоретические принципы и логический аппарат формализации закрытых опросов позволяют охарактеризовать идеальный тип опроса, выражающий концептуализацию технологии анализа и прогнозирования мнений. Идеальный тип составляет каркас новой технологии социологического опроса - с использованием аргументационной семантики и логической структуры опроса, - допускающий реальные технологические приближения.
Наконец, формализация качественного анализа средствами ИИ, т. е. интеллектуальный анализ социологических данных, может рассматриваться как новый когнитивный инструмент - формализованная оболочка для решения проблем когнитивной социологии, - который реализуется в современных интеллектуальных системах (ИС типа ДСМ).
Теоретическая и практическая значимость работы
Теоретическая значимость работы состоит в разработке средств представления и объективизации фактов (результатов эмпирических наблюдений) и знаний (результатов применения когнитивных процедур) о социальном поведении и мнении, создании концептуального и логического аппарата формализованного качественного анализа социологических данных, использующего правдоподобные (нестатистические) рассуждения - ДСМ-метод автоматического порождения гипотез. Формальный аппарат может служить не только логическим средством анализа эмпирических социологических данных о поведении социальных субъектов (как индивидов, так и социальных общностей), но и даёт возможность приближения к логической реконструкции идей классической «понимающей» социологии, в частности построения формальной теории каузального объяснения социального поведения. Разработка теоретических принципов и логического аппарата для формализации закрытых опросов, анализа мнений и логических средств распознавания рациональности мнений, включающих средства формальной аргументации, также имеет несомненную ценность для развития объективных подходов в субъективной области социальных исследований.
Практическая ценность работы заключается в разработке научных основ технологии интеллектуального анализа социологических данных, в частности технологии социологического опроса и нестатистического изучения мнений. Для реализации технологий такого рода предусмотрена специальная архитектура Интеллектуальной системы типа ДСМ, включающей как средства предварительной обработки эмпирических социологических данных, так и специфические процедуры для их анализа. Система дополняется инструментами анализа рациональности мнений на основе аргументационной семантики и ДСМ-рассуждений. Предложенные подходы могут быть использованы для анализа и предсказания результатов реальных опросов.
Достоверность и обоснованность результатов определяется использованием комплекса методов математической логики и интеллектуального анализа данных - ДСМ-метода автоматического порождения гипотез, прежде всего. Подтверждением этого являются практические исследования - изучение поведения рабочих на конфликтных предприятиях (совместно с Институтом социологии РАН), а также анализ электоральных предпочтений и рациональности электорального выбора студентов (совместно с РГГУ).
Структура диссертации и краткая характеристика ее содержания.
В Первой главе рассматривается процесс развития подходов к качественному анализу социологических данных - от качественного анализа как такового до использования компьютерных инструментов. Эволюция последних означает переход от простой компьютерной обработки данных к современному интеллектуальному анализу данных.
В главе представлен обзор современных средств компьютерной поддержки качественных исследований - САСЮАЭ. Если суммировать возможности последней генерации пакетов САСЮАБ, можно утверждать, что главные достижения этих инструментов лежат в области обработки, структурирования и управления данными (текстами, графическими объектами, аудио-, видео-), но никак не в области анализа - извлечения нового знания из имеющихся данных.
Использование компьютера способствует реабилитации качественного анализа в глазах «жёстких» позитивистов и более широкому его распространению, в особенности там, где слабости количественного подхода очевидны. Но САС£ОА8 не заменяет аналитика, а лишь усиливает возможности исследователя по кодированию текстов и упорядочиванию данных. К сожалению, часто при работе с САСЮАЭ эксплуатируется лишь возможность управления данными, а более продвинутые опции остаются невостребованными.
Разумеется, эффективное усиление познавательной деятельности возможно лишь там, где выбор инструмента соотносится, прежде всего, с природой задачи и потребностями исследования. Это составляет первый принцип.
С момента появления «Системы логики» английского философа и логика п
Д. С. Ми л ля теоретическую социологическую мысль прельщала возможность использования индуктивных правил для анализа социологических данных, хотя и сам Д.С. Милль, и Э. Дюркгейм, и др. отмечали ограниченность их возможностей в этой области. Современные исследователи готовы числить методы Милля инструментальным
7 Последнее издание на русском языке: Милль Д.С. Система логики силлогистической и индуктивной. М.: ЛЕН АНД, 2011. воплощением приёмов экспериментальной социологии, но в неформальном виде - ввиду отсутствия в их распоряжении формализаций этих методов.
Для реализации этих устремлений, для решения проблем качественной социологии в качестве инструмента современного интеллектуального анализа социологических данных предлагается ДСМ-метод автоматического порождения гипотез, реализующий формализованный качественный анализ социологических данных - формальный анализ нечисловых отношений.
Глава 2 посвящена построению формальных оснований для поиска закономерностей социального поведения. Предлагаются подходы к решению проблемы логической систематизации социологических знаний, т.е. выделения исходных отношений и установления зависимостей между ними, разрабатывается логический язык для представления данных и знаний о субъекте и поведении, а также формализации рассуждений о фактах социальной действительности. Описываются формальные средства ДСМ-метода автоматического порождения гипотез (ДСМ-метода АПГ), предназначенные для автоматического извлечения интерпретируемых зависимостей из имеющегося эмпирического материала. ДСМ-метод представляет собой специальный класс рассуждений (ДСМ-рассуждения), реализующий синтез познавательных процедур - эмпирической индукции (формальных расширений и уточнений индуктивных методов Д.С. Милля, в честь которого и назван метод), структурной аналогии (переносе гипотез о причинах на случаи с неопределенным исходом) и абдуктивного рассуждения Ч.С. Пирса как средства принятия гипотез на основе объяснения начальных данных. Будучи методом интеллектуального анализа данных, в приложении к анализу нечисловых социологических данных ДСМ-метод оказывается современным инструментом формализованного качественного анализа социологических данных (ФКАСД).
Рассматривается два класса задач: анализ социального поведения, реализующий рассуждение типа «от причины - к следствию» - прямой ДСМ-метод, - и анализ мнений, где реализуется тип рассуждений «от следствия - к причине», обратный ДСМ-метод. Соответственно, описываются предикаты и правила правдоподобного вывода (п.п.в.) для прямого и обратного методов.
Фундаментальным принципом качественного анализа данных является принцип «сходство фактов влечет наличие (отсутствие) изучаемого эффекта и его повторяемость». Конкретизируя его для реализации идеи причинности, можно сказать, что в рамках качественного анализа исследуется тип каузальности «структура - эффект» (а не «явление - явление»). Гипотетические причины представляются в виде сходств фактов, имеющих определенную структуру, т.е. «сходство» в этой схеме является нестатистическим и может анализироваться посредством логико-алгебраического подхода (С>СА) и средств интеллектуального анализа данных, включающих формализацию индуктивных процедура (ДСМ-метод АПГ). Подчеркнем, что порождение причинно-следственных зависимостей на основе структурного сходства позволяет анализировать небольшие массивы данных (например, малые группы), что является несомненным преимуществом качественного анализа по сравнению с количественным при решении ряда проблем.
Этим проблемам соответствует круг задач формализованного качественного анализа. Соответственно, интеллектуальный анализ социологических данных (ИАСД) и реализующая его интеллектуальная система предполагают возможность
- исследования индивидуального поведения, порождения детерминант поведения и типологизации социума на их основе;
- анализа и прогнозирования мнений респондентов как варианта поведения;
- выяснения влияния ситуации на поведение индивидуума;
- анализа рациональности мнений (в т.ч. степени рациональности мнений данной социальной общности).
Основой структурированного представления знаний о субъекте поведения является так называемый «постулат поведения» - один из основных принципов формирования БЗ в ИАСД. Пусть имеются три множества характеристик, входящих в описание субъекта поведения: признаки, представляющие социальный характер субъекта (^С); индивидуальные черты личности (1Р); биографические данные (ВП). Поведение В субъекта С определяется подмножеством характеристик таким, что Эег = Г^и/)^^^, где (£>е*3с(Ш))), причем хотя бы одно Ие^ * 0, / = 1, 2, 3. Таким образом, индивидуальные характеристики социального субъекта являются информативным основанием для порождения детерминант социального поведения и, соответственно, материалом для построения возможных моделей социальной структуры с использованием установленных детерминант поведения.
Важнейшим принципом ИАСД является принцип адекватности методов анализа природе задачи, в соответствии с тремя типами предметных областей: (а) факты, образующие систему случайных событий, должны изучаться статистическими средствами; (Ь) причинно-обусловленным явлениям отвечают детерминистские методы анализа; (с) области, где детерминациям сопутствуют случайные возмущения, требуют смешанных инструментов. «Понимающая» социология относит социальные взаимодействия к каузально обусловленным явлениям, следовательно, здесь востребованы средства формализации правдоподобных рассуждений.
Для успешного применения ДСМ-метода необходимо выполнение ряда условий: формализуемость отношения сходства между позитивными (+)- и негативными (-)-фактами (далее иногда - (±)-фактами) мира (социума), наличие в БФ позитивных и негативных примеров изучаемого эффекта поведения и предполагаемая (±)-квазисимметрия причин (существенных влияний) проявления этих эффектов. Эти условия описывают класс задач, для решения которых создаются различные ИС, реализующие один тип формализованных эвристик: «индукция - аналогия - абдукция».
Абдуктивное принятие порождаемых гипотез реализует принцип объяснения результатов правдоподобного рассуждения в ИАСД.
ДСМ-метод состоит из: описанных условий применимости; правдоподобных ДСМ-рассуждений (синтеза трех познавательных процедур), представленных в формальном языке с дескриптивной и аргументативной функциями; квазиаксиоматических теорий КАТ для представления и систематизации открытого множества знаний о предметной области; дедуктивной имитации правдоподобных рассуждений в КАТ (гарантирующей корректность их результатов); интеллектуальных систем с Рассуждателем, реализующим ДСМ-рассуждения (ИС-ДСМ), и базой знаний БЗ, представленной соответствующей КАТ. Это означает реализацию в ИС-ДСМ главного принципа ИАСД - имитации познавательной деятельности «анализ данных - предсказание - объяснение» средствами формального языка с дескриптивной и аргументативной функцией.
В Главе 2 представлены формальные средства ДСМ-метода автоматического порождения гипотез - прямого («от причины - к следствию», сходство субъектов поведения влечёт сходство их поведения) и обратного («от следствия - к причине», сходство мнений означает сходство индивидуумов, выражающих эти мнения) типов рассуждения.
Для формализации ДСМ-рассуждений формулируется язык представления знаний (ДСМ-язык), включающий переменные и константы для объектов (субъектов поведения) и их свойств (эффектов поведения). Предикатные символы языка =>ь =>2, з<= соответствуют отношениям в БФ и БЗ; помимо связок двузначной логики —&, v, —язык включает унарные логические связки - J-операторы Россера-Тюркетта J-, где V— (v, п) или v = т, п), v е {1, -1, 0}, п = 0, 1,2, .; 1, -1, 0, т - типы истинностных значений «фактическая истина», «фактическая ложь», «фактическое противоречие» и «неопределенность», соответственно. Термы и формулы языка определяются стандартным образом, но с добавлением формул переменной длины для отображения сходства конечного, но заранее не определённого числа примеров.
Структуризация фактов и знаний о социуме состоит в задании двух булевых алгебр - (2и<>, 0, U(1), —, n, u) (U(1) - множество характеристик социальных субъектов) и = (2U<),0, U(2), —, n, u) (U(2) - множество эффектов их поведения, т.е. действий, установок, мнений) и предикатов =>]:
2 х 2 Vw, =>2: 2 х 2 Уш, 2 х 2 где Vin множество «внутренних» (эмпирических) истинностных значений. V(„ = {(v, п) | (ve{l, -1, 0})&(леАО}и{(т, п) | neN}, N - множество натуральных чисел. 1, -1, 0, т - типы истинностных значений; (v, п) - истинностные значения (п -их степень правдоподобия, выражающая число применений правил правдоподобного вывода); (т,и) = {(1, п+1>,(-1, «+1>,(0, и+1)}и(т, п+1), ср
Внешние» истинностные значения Уех= {£,/}, где / и/- истинностные значения двузначной логики «истина» и «ложь», соответственно. Внутренние истинностные значения используются для представления фактов и гипотез, внешние - для представления высказываний о фактах (фактов с оценками) и п.п.в. /уф = если у[ф] = V, = / если у[ф] Ф V, где у[ф] - функция п оценки. У(у> „)ф = V ¿(у, «>ф.
I = 1
Массив начальных данных содержит высказывания типа "высказывание «субъект С обладает эффектом поведения имеет истинностное значение (у, п)" (или (х, п)), что представляется формулой ;„)(С =>1 С£) (или „)(С :=>! С))) в ДСМ-языке. Здесь -1, 0, т} - типы фактических истинностных значений, и-номер шага вычислений, отражающий степень правдоподобия истинностного значения. Высказывания вида ,о>(С =>1 СО суть факты, /(у, „>(С =>у О) (/ = 1, 2) и /(У; п)(С' 3<= СП, п>О, - гипотезы.
В результате применения правил индуктивного вывода п.п.в.-1 (правил правдоподобного вывода 1-го рода) порождаются гипотезы вида У(у, П)(С' =>2 С>) или „)(С' 3<= С*') (в зависимости от используемой стратегии анализа данных), п>0. „)(С' =>2 означает, что «высказывание "подмножество характеристик субъекта С' есть причина эффекта поведения имеет истинностное значение (V, «>"». Соответственно, „>(С' 3<= Q') означает, что «высказывание "эффект поведения С)' предполагает наличие характеристик субъекта С"' имеет истинностное значение (у, п)г>. Иными словами, предикаты V =>2 и з<= V представляют порожденное из предиката Х=>,У отношение причинности. Таким образом, в этом процессе в автоматическом режиме формируются фрагменты базы знаний (БЗ) интеллектуальной системы типа ДСМ, поскольку гипотезы о причинах, представляющие сходство фактов, являются обобщением знания. ДСМ-рассуждение формализуется средствами бесконечнозначной логики предикатов (1-го порядка для конечных моделей и слабой логики предикатов 2-го порядка для бесконечных моделей).
Для формализации индукции определяются предикаты простого прямого сходства М£„(У, ае{+, -}, где п - параметр, отображающий число применений правил правдоподобного вывода к БФ. Возможна и иная стратегия индуктивного анализа, определяющая обратный метод сходства, когда реализуется принцип «сходство эффектов поведения определяет сходство самих субъектов поведения». Для этого варианта с некоторыми модификациями определяются предикаты простого обратного сходства (сте{+, -}), которые содержат подформулы, описывающие условия, подобные условиям М°п{У,\У). Собственно гипотезы о причинах есть результат применения правил правдоподобного вывода 1-го рода (1)ст и (Т)а (сте{+, -, 0, т}), включающих предикаты Маап(У,Щ и Маа„(У, \¥) (сте{+, -}), соответственно, в качестве посылок. Таким образом, отношение, представленное в БФ предикатом Х^У, посредством (1)° и (1)а (ае{+, О, т}) порождает отношения =>2* и *3<=, соответственно. Эти отношения представлены множеством гипотез Нь являющимся фрагментом БЗ - части КАТ.
Предикаты сходства - как прямого, так и обратного - могут быть дополнены условиями, повышающими правдоподобие порождаемых гипотез и носящими название «усиливающих добавок». Построение множества индуктивных предикатов позволяет формировать различные стратегии порождения гипотез о причинах включением различающихся по силе предикатов в посылки правил правдоподобного рода п.п. в. -1 для обратного и п.п.в.-1 для прямого методов.
Следующий шаг ДСМ-рассуждения - вывод по аналогии для уточнения неопределённостей 7(т5и)(У=>^) из БФ - выполняется посредством правил правдоподобного вывода 2-го рода (п.п.в.-2 (П)а для прямого и п.п. в.-2 (II )а для обратного, (сте{+, 0, т}). Для посылок этих правил для прямого ДСМ-метода АПГ формулируются предикаты И°п (V, \У) с использованием гипотез о причинах о/(У„)(Х=>2^), ve{l, -1, 0, т}. Для обратного метода формулируются предикаты П^ (V, W) с использованием гипотез
7(у „)(Уз<=Х). Гипотезы, порожденные посредством (11)° и (II )а, образуют множество Н2, составляющее часть БЗ.
ДСМ-рассуждение состоит из последовательного применения правил правдоподобного вывода 1-го и 2-го рода до стабилизации множества порождаемых гипотез. Этот этап ДСМ-рассуждения образует цикл применения двух познавательных процедур - индукции и аналогии. Вторым этапом ДСМ-рассуждения является абдуктивное объяснение начального состояния БФ, т.е. принятие порожденных гипотез первого и второго рода посредством рассуждения, формализующего абдукцию Ч.С. Пирса.
Реализация отношения объяснения БФ порожденными гипотезами о причинах Н1 формализуется посредством аксиом каузальной полноты (АКП(±) для прямого метода и А К П(±) для обратного) предметной области (социума) \¥(±): «всякий эффект социального поведения У субъекта X имеет причины VI, ., Ук, его вызывающие».
А К П(±) и АКП(±) являются критерием достаточного основания для принятия гипотез. Если эти аксиомы выполняются для БФ, то порожденные гипотезы принимаются на достаточном основании. В противном случае БФ расширяется для всех тех фактов, которые не объясняются - АКП(±) или АКП(±) (в зависимости от принятой стратегии рассуждений - прямой или обратной) ложны относительно соответствующих пар (С, С>), где С - объект, ар- множество его свойств. После расширения БФ ДСМ-рассуждение продолжается до достижения некоторого заранее заданного порогового значения степени каузальной полноты - отношения числа объяснённых фактов из БФ к общему числу фактов в БФ.
Формализованный качественный анализ социологических данных средствами ДСМ-метода автоматического порождения гипотез позволяет решать задачи социологии и социальной психологии. Первый тип задач предполагает исследование индивидуального поведения, порождение детерминант поведения и типологизацию социума на их основе. Проблемы как собственно социологии, так и социальной психологии решаются в рамках анализа и предсказания мнений (также с выявлением детерминаций и возможного определения структуры социума на их основе), дополняемого определением рациональности этих мнений специально созданными средствами.
Задача первого типа решалась на примере изучения солидарного поведения рабочих на конфликтных предприятиях (в частности, участия или неучастия в забастовке). Поскольку информативность представления субъекта в этом случае превосходит информативность описания его действий, в качестве стратегии анализа был выбран прямой ДСМ-метод АПГ.
Эмпирической базой эксперимента были данные, полученные сотрудниками лаборатории проф. В.А. Ядова Института социологии РАН при изучении рабочих двух предприятий: завода «Арсенал» в Санкт-Петербурге и Завода тракторных гидроагрегатов в г. Ельце.
В результате анализа имеющихся данных средствами ДСМ-метода автоматического порождения гипотез были выявлены детерминанты различных видов поведения и на основе этих детерминант социологами определены различные поведенческие типы, т.е. сформированы эмпирические социологические понятия.
Для решения второго типа задач ФКАСД - анализа и прогнозирования мнений - была выбрана стратегия обратного ДСМ-метода АПГ, поскольку информативность представления мнений значительно превосходит представление характеристик индивидуума. Реализация этой стратегии возможна лишь при наличии адекватной структуризации мнений и представлении их в виде, отвечающем условиям применимости ДСМ-метода (подобно тому, как было структурировано описание индивидуумов на основании постулата поведения). Это составляет один из разделов Главы 3. Здесь же представлены формализации т-значных закрытых социологических опросов средствами специально созданных многозначных Уш-логик. Описываются критерии рациональности результатов опроса - степень непротиворечивости, степень близости к «идеальному мнению», степень согласованности. Предложенные характеристики уточняются для предсказательных опросов, когда средствами выбранной формальной эвристики порождаются возможные ответы респондентов. Принцип классификации различных структур опросов в ИАСД является теоретической и практической основой подхода к формированию баз социологических фактов.
Семантика ДСМ-метода для анализа и прогнозирования мнений описывается следующим образом. Пусть задана некоторая тема опроса Т , характеризующаяся утверждениями из множества Р = {рь ., р„}. Задана функция оценки у[р;] с областью значений {1,-1, 0, т}. Каждому элементу р7 = 1, ., п) каркаса Р соответствует вопрос ?р7 - «Какова оценка V корня вопроса pJ ?», у е {1, -1, 0, т}, ответом на который является высказывание Ля,-ЛР/ = если у[р,] = у; ^^ =/ если у[р,] Ф у.
Ответом у'-го респондента по теме Т будем назвать максимальную КОНЪЮНКЦИЮ фу = -/о>Р1&.&•/<,> ри (вид мнения), где ф7 - метасимвол, "=" предикат графического равенства формул, у^[р;] = у,^, у^ е{±1, 0, т}, г = 1, ., п; у = 1, ., 4". Такой ответ представляет собой понимание у-м респондентом темы Т . Множество членов этой конъюнкции обозначим [ф,]={ J и) рь .,</ ыр„} и будем назвать составом мнения.
Предлагаемая семантика позволяет формализовать анализ мнений средствами ДСМ-метода АПГ в соответствии со следующей стратегией. Формулируется тема мнения, пригодная для построения модели социальной структуры. Затем задается система вопросов, раскрывающих содержание темы - каркас темы. Оценка эмпирического отношения С =>1 0 («субъект -мнение») есть оценка отношения к теме в целом, - состав мнения субъекта С ((2 = [ф]). Задача изучения мнений сводится к изучению высказываний из БФ /д (С,=>х[ф7]) - «субъект С, имеет мнение фу». В результате применения правил индуктивного вывода обратного ДСМ-метода (п.п.в.-1) порождаются гипотезы вида Уд ([ф^] 3<= С - «мнение ф7 определяет наличие характеристик субъекта С'у». Порожденные детерминанты мнений в дальнейшем используются для прогнозирования мнений с помощью правил вывода по аналогии (п.п.в.-2), а также служат основанием для построения модели структуры изучаемого социума. Здесь Су, С'7, [ф7], [\|/у] - константы, Су,
С) е 2и(', [ф,], [\\fjl е 2и° , = {¡ир Г) - истинностное значение, полученное применением ДСМ-метода АПГ, где //7е{±1, 0}, или Т1] = (т, Г), I - число применений ДСМ-правил правдоподобного вывода.
Социологический опрос не случайно представляется на уровне обыденного сознания «визитной карточкой» социологии. Формальное представление структуры опроса обеспечивает унификацию процедур проведения опроса и позволяет упорядочить некоторые результаты опроса на основании численных критериев рациональности для различных социальных общностей.
Рассмотрим общий случай т-значного (т> 2) закрытого социологического опроса: респонденту предлагается выбрать один из т предложенных ответов. Логическими средствами формализации т-значного опроса являются т-значные логики Зт и исчисление эквивалентных формул ИЭФ-ЛД Ответом на вопрос «Какова оценка у корня вопроса ру ?» для элементов ру (/ — 1, ., п) каркаса Р, как и выше, является высказывание Лр7, однако в этом случае УбУт. Понимание /-м респондентом темы Т
8 Finn V.K., Mikheyenkova M.A. Plausible Reasoning for the Problems of Cognitive Sociology // Logic and Logical Philosophy, Vol. 20 (2011), pp. 113 - 139. отображается в его ответе С, = Jví,1p]&.&Jvlnpn, представляющем 3максимальную конъюнкцию логики Зт.
Пусть при опросе респондентов получено стабилизированное множество ответов К'сК, которое не изменяется при расширении множества опрашиваемых. Стабилизированному множеству ответов К соответствует множество респондентов Я = {Ъ\, ., Ъг}, Я = {X | ЗфЗу^У;0>(Х=>1[ф])&(фе/Г)&(уеУот)}. Тогда множество респондентов Я можно считать качественным аналогом репрезентативной выборки статистического анализа.
Итак, простой эмпирический т-значный социологический опрос (т>2) От по теме Т со шкалой оценок Ут = {0, 1} реализуется средствами дедуктивной га-значной логики и может быть представлен в виде От = (Ут, Р, К', Я, Х=^>]У>, причем К' задается исследователем-социологом в результате эмпирического получения стабилизированного множества ответов. Анализ результатов такого опроса производится средствами ДСМ-метода автоматического порождения гипотез.
Средства логики и ИЭФ-Л, позволяют дополнить это описание. Рассмотрим непротиворечивое множество Х={\|/ь .,ц/у} формул \|/ь ., логик выражающих логические зависимости между элементами каркаса Р - корнями вопросов ?рь ., ?р„. Указанные зависимости задаются исследователем и, таким образом, представляют имплицитное экспертное знание относительно темы Т . Введение множества И позволяет определить простой расширенный эмпирический опрос Оет = {Зт, Р, И, К', Я, Х=>1У).
Описанная семантика ДСМ-метода АПГ для анализа мнений включает возможность описания и анализа аргументированных мнений, представляющих вариант рациональных мнений. Предположим, что у респондентов имеется некоторое множество А аргументов и контраргументов, которое используется для определения функций выбора аргументов §,+(р7) и контраргументов §Г(Р/) ¿-го субъекта. Здесь Р = {рь ., ри} - каркас (содержание) темы опроса Т, р7 - атомарные высказывания, характеризующие Т, а ?ЛР/ - вопросительный терм: «верно ли, что у[р;] = V?», где V е{1, -1, 0, т}, V - функция оценки (например, у[ру] = 1 если и только если gí+(p/) ^ 0 и вГ(Р/) = 0 для г-го респондента; аналогично определяются оценки -1, 0, т).
Опрос, в котором формирование оценок осуществляется на основании аргументационного выбора, называется аргументационным: 0° = </т, Р, К', Я, Х=>]У, А, {<5,} 1<г<|к|Х Расширенный аргументационный опрос Оате = (Л?, Р, Е,К', Я, Х=>1 У, А, {С,} 1<,<|я|>.
Одной из важнейших характеристик рациональности мнения является его непротиворечивость. Степень непротиворечивости результатов опроса может задаваться функцией 5(К, А) = 1 -|/ГпЛ| I \К\. Здесь \К\ и \КгА\ -числа элементов множеств 1С и 1СглА, соответственно, А - множество всех возможных мнений такое, что для любого ере А £и{ф} противоречиво. Для вычисления функции Ь(1С, А) используется метод аналитических таблиц для логик /А2, ./А3, /А4 и Ж5 (2-х, 3-х, 4-х и 5-значных логик с аргументационной семантикой, соответственно).
Для рассматриваемой социальной общности (респондентов опроса) может быть сформировано «описание состояния рациональности» - с помощью специально определенных предикатов Р^К) (Ь= 1,2,3; в е {0, х, 1}). Предикат Р^А7) для в = 0, х, 1, соответственно, определяется следующим образом: 5(1С, А) = 0, 3х(Ь(К', А) = х&0<х<1), Ь(К', А) = 1 (1С -переменная, А фиксировано, поскольку фиксировано множество £). Этот предикат представляет собой 1-й критерий рациональности результатов опроса - степень его непротиворечивости.
Можно определить также предикаты Р2^1С) и Р30(/Г) (0 е {0, х, 1}, 0<х<1), представляющие специфические для электорального поведения критерии рациональности. Р2^(Ф') характеризует степень близости мнения респондентов из электората /-той партии к «идеальному мнению» сторонника этой партии, представленному принятием программных положений партии. Рз ¿1С) представляет согласованность (однородность) мнений электората /той партии.
Эмпирическое исследование второго типа задач ИАСД - анализ и прогнозирование мнений респондентов, а также анализ рациональности мнений - было осуществлено на массиве данных об электоральных предпочтениях студентов старших курсов РГГУ на выборах в Государственную Думу 2003 и 2007 гг. В работе принимали участие сотрудники, студенты и аспиранты Социологического факультета РГГУ, а также студенты и аспиранты Отделения интеллектуальных систем в гуманитарной сфере Института лингвистики РГГУ.
В результате применения обратного ДСМ-метода были порождены гипотезы о комплексах характеристик, соответствующих тому или иному отношению к программным положениям партий (среди представителей электоральных общностей).
Для анализа рациональности в качестве элементов И были выбраны формулы вида (х->Ф)> которые характеризовали логические связи между относящимися к одним и тем же темам пунктами программ различных партий. В обоих экспериментальных исследованиях для сторонников различных партий были вычислены значения описанных выше критериев рациональности, определено отношение частичного порядка =< для полученных значений критериев и построена диаграмма этого отношения.
Нетривиальной особенностью описанного формализованного качественного анализа социологических данных является пополнение базы знаний доопределенными посредством вывода по аналогии примерами отношения =>]*, а также возможность расширения базы фактов БФ на основе абдуктивного принятия (непринятия) гипотез. Множество респондентов, участвующих в опросе пополняется гипотезами о наличии у заранее не определившихся со своими мнениями респондентов тех или иных вариантов ответов, полученными средствами ДСМ-метода. Это означает реализацию предсказательного опроса. Предсказательные опросы могут быть представлены следующими структурами.
Простой эмпирический предсказательный опрос Opmrx = (Jm, J^ Р, К', R,
X=>iY, V 3<=W), где Уш(оо)- множество «внутренних» (эмпирических) истинностных значений бесконечнозначной ДСМ-логики. Уш(со) = «v, п)\ (ve{1, -1, 0})&(«eiV)}u{(x, ri)| neN}, N-множество натуральных чисел.
ОО,™ = (Jm, Jco, Р, £, К', R, X=>jY, V 3<=W> - расширенный эмпирический предсказательный опрос. о:г;:; = (Jm, J^ Р, I, К', R, X=>,Y, V 3<^W, A, {G,}^,) - расширенный аргументационный предсказательный опрос.
В Четвёртой главе предлагается рассмотрение двух подходов к реализации познавательной схемы «анализ данных - предсказание -объяснение». Первый, конкретизирующий уточнение этой схемы синтезом познавательных процедур «индукция - аналогия - абдукция» и представляющий класс когнитивных рассуждений, реализован в ДСМ-методе автоматического порождения гипотез. Второй восходит к Качественному сравнительному анализу (QCA) американского социолога Ч. Рейджина и использует для поиска сходства социологических объектов аппарат булевой алгебры. Дополнение логико-алгебраических процедур поиска сходства QCA адекватными процедурами вывода по аналогии и абдуктивного объяснения позволило говорить о реализации общей эвристической схемы «сходство-аналогия - абдукция» (AlAnAb).
Для ./„¡-логик, являющихся средством формализации m-значного опроса, верна теорема о представимости всякой не эквивалентной 0 формулы ф логики высказываний Jm посредством совершенной дизъюнктивной нормальной формы Лг-СДНФ (Jm-СЗф) и притом единственным образом. Формулируется обобщение алгоритма Куайна для перевода Ут-СДНФ в сокращенные ^-ДНФ. Применяя последовательно, пока это возможно, «обобщенное склеивание» и поглощение к формуле ф логики Jm (в нашем случае-к дизъюнкции мнений ф, = J <„ pi&.& J ,„ р„, v^fpj = vj-l\ у/г)еУт,у' 1, ., п, i = 1, ., тп из начального состояния БФ), получим Эф-сокращенную ДНФ формулы ф. Полученные импликанты используются для определения отношения причинности.
Каждый из представленных вариантов формализованных когнитивных эвристик «сходство - аналогия - абдукция» обладает своими возможностями. Гипотезы о причинах, порождаемые в алгебраическом подходе, являются максимальными по числу использовавшихся при их порождении примеров (что, соответственно, повышает степень их правдоподобия), однако число таких гипотез меньше числа ДСМ-гипотез. При этом по самой процедуре построения множества гипотез о каузальных зависимостях в этом подходе степень каузальной полноты, как правило, превышает аналогичный показатель для ДСМ-метода.
Эти различия обусловлены, в первую очередь, исходными онтологическими предпосылками, характеризующими области применимости обоих подходов. ДСМ-метод изначально ориентирован на открытые предметные области, где эмпирические данные и знания неполны, процедуры извлечения знаний из фактов включают правдоподобные рассуждения, а данные и знания могут пополняться не только за счет порожденных гипотез, но и внешним образом, на основании признания недостаточности полученных результатов. ДСМ-метод есть инструмент машинного (индуктивного) обучения. Алгебраический же подход создавался для анализа имеющихся данных в предположении, что ничем иным исследователь не располагает (к примеру, когда число примеров заведомо ограничено или провести новый эксперимент, опрос не представляется возможным). Это лишний раз напоминает о необходимости выбора средств анализа, адекватных природе исследуемой области.
В Главе 5 описываются формальные средства ситуационного расширения ДСМ-метода автоматического порождения гипотез - прямого и обратного типов рассуждения. Учёт параметров ситуации, в которой реализуется поведение, составляет один из принципов ИАСД.
Необходимость включения контекста поведения в систему анализа означает переход от изучения отношения «субъект=>поведение» к отношению «(субъект, ситуация) => поведение», которому соответствует исходный предикат Р(Х,У,8), интерпретируемый как «субъект X обладает (не обладает) множеством свойств У в ситуации Б». В результате индуктивного анализа порождается предикат причинности /?,((У,8'),\У) - «пара (подмножество характеристик V и фрагмент ситуации 8') есть причина наличия (отсутствия) множества свойств Я, (/=1, 2, 3, 4) характеризует структуру мира - насколько в ней существенны сам объект и ситуация проявления свойств. Пусть соответствует условию
У*0&8'=0), Я2 - условию (У*0&8'*0), Д3 - условию (У=0&8'*0), Я4=Я.
Изучение влияния ситуаций на поведение потребовало расширения ДСМ-языка включением переменных 8, 8Ь., 8„ . и констант
8,81,.,8/? .3-го сорта для ситуаций, а также задания булевой алгебры ситуаций ^ = (2и(> ,0, и(3), —, п, и), где и(3) - множество ситуационных параметров.
Решающий предикат тернарного положительного сходства-2
2М*п(У,\У,8оЛ)> непараметрический вариант которого используется в индуктивных п.п.в.-1, имеет структуру, сходную со структурой предиката простого сходства. Индекс «2» указывает на реализацию причинной зависимости Я2, где существенными детерминирующими факторами являются как особенности личности, так и внешние обстоятельства (У^0&8^0). Предикат тернарного отрицательного сходства формулируется аналогично. Для анализа исходных фактов вида У(0> пуР(С,А, 8), представляющих примеры противоречивых фактов, формулируется предикат тернарного конфликтного сходства-2 2М°ап (У,\¥,80,/:). Это приводит к изменению правил правдоподобного вывода 1-го рода п.п.в.-1 (1)°2, предназначенных для конструктивного порождения оценки «фактическое противоречие» и позволяющих осуществлять логический анализ модели конфликта. Соответственно, формулируются правила правдоподобного вывода по аналогии п.п.в.-2 для прямого ситуационного метода и п.п. в.-2 для обратного, а также аксиомы каузальной полноты АКП(±) и А К П(±), соответственно.
Глава 6 представляет результат исследований как создание инструмента для решения задач нового направления когнитивной социологии - изучения как собственно познавательной деятельности в исследовании социальных явлений, так и влияния познавательной активности индивидуумов на поведение. Предложенные средства предполагают совместное использование стандартных эвристик формирования массива данных (т.е. предварительной содержательной работы социолога) и формализованных эвристик анализа данных для решения социологических проблем на основе эмпирического материала. Эвристики формализуются средствами ДСМ-метода автоматического порождения гипотез в Интеллектуальных системах типа ДСМ.
Архитектура интеллектуальной системы (ИС), предназначенной для приближенного отображения познавательной деятельности «анализ данных -предсказание - объяснение» представляется следующим образом9: ИС = Решатель задач + Информационная среда (БФ+БЗ) + Интеллектуальный интерфейс. Решатель реализует познавательные процедуры и включает Рассуждатель, Вычислитель и Синтезатор. В ИС-ДСМ Рассуждатель реализует процедуры ДСМ-метода автоматического порождения гипотез, формализующие соответствующую эвристику анализа данных. Вычислитель обеспечивает потребности количественного анализа (который может оказаться востребованным для некоторых видов социологических данных), сюда же можно отнести вычисление предложенных в работе критериев рациональности мнений. Синтезатор регулирует взаимодействие Рассуждателя и Вычислителя. В результате работы соответствующих ИС из данных порождаются гипотезы о закономерностях, которые обнаруживаются в расширяемых (вследствие потребностей абдуктивного объяснения имеющихся фактов) последовательностях БФ.
Особенностью реализации предложенной технологии анализа социологических данных в ИС-ДСМ является имитация ряда познавательных способностей естественного интеллекта - как в автоматическом, так и в интерактивном режиме. Рассмотренная технология опроса позволяет также
9 Арский Ю.М., Финн В.К. Принципы конструирования интеллектуальных систем // Информационные технологии и вычислительные системы, 2008, № 4, с. 4 - 36. зафиксировать явным образом влияние когнитивных эффектов на формирование мнений. Это отображается в некоммутативности различных вариантов проведения опроса относительно рационального восприятия элементов опроса, что было отмечено в реальном эксперименте.
Основная часть Решателя ДСМ-системы - Рассуждатель - реализует процедуры ДСМ-метода автоматического порождения гипотез, формализующие соответствующую эвристику анализа данных. Интеллектуальная система для анализа эмпирических социологических данных должна обеспечивать выбор стратегий исследования в зависимости от структуры предикатов и правил - прямой или обратный методы, ситуационный вариант ДСМ-метода, рассмотрение противоречивых примеров из исходной БФ («анализ конфликта»). В рамках выбранной стратегии необходимо иметь возможность реализации усиливающих добавок к решающим предикатам и формирования правил правдоподобного вывода первого рода из различных по силе методов разного знака. Важной составляющей такой системы является подсистема обнаружения эмпирических законов и тенденций на основе выявления взаимной непротиворечивости стратегий.
Интеллектуальная система способна полноценно реализовать познавательный процесс при наличии развитых инструментов накопления знаний (Информационная среда), а также восприятия и отображения (Интеллектуальный интерфейс). ИС эффективно решает задачи ФКАСД, если при наличии описанной структуры превращается в автоматизированное рабочее место социолога, обеспечивающее проведение качественного исследования.
Примерами реализации Интеллектуальных систем для анализа социологических данных на основе изложенных принципов являются созданные под руководством автора диссертации Обучающая ДСМ-система для анализа социологических данных (дипломная работа студентки Отделения интеллектуальных систем РГГУ Феофановой Т.Л.) и Интеллектуальная система Socio Magic для формализованного качественного анализа социологических данных (кандидатская диссертация аспирантки ВИНИТИ РАН Бурковской Ж.И.).
В Заключении сформулированы основные результаты работы и обсуждаются открытые проблемы.
Заключение диссертация на тему "Принципы и логические средства интеллектуального анализа социологических данных"
Заключение
Разработанные средства формализованного анализа качественных (неколичественных) данных могут быть использованы в предметных областях со сложно структурированными данными и плохо формализованными знаниями, к которым относятся науки о жизни и социальном поведении. Методы искусственного интеллекта позволяют формализовать соответствующие исследовательские эвристики, решая задачу усиления и имитации познавательной деятельности типа «анализ данных -предсказание - объяснение».
Создание в рамках диссертационного исследования логического и концептуального аппарата интеллектуального анализа социологических данных составляет научную основу современных информационных технологий для такого анализа и определяет теоретическую значимость работы, в процессе которой получены следующие основные результаты: разработаны средства представления и объективизации фактов и знаний о социальном поведении и мнении в ИС для решения задач социологии и социальной психологии; развит концептуальный и логический аппарат формализованного качественного анализа мнений; предложено формальное представление синтеза познавательных процедур, использующих алгебру логики для порождения гипотез о причинных зависимостях; развиты новые логические средства для порождения гипотез о причинно-следственных зависимостях с учётом контекста социального поведения - ситуационного ДСМ-метода; представлена формальная структура закрытых га-значных (т>2) опросов и предсказательных опросов; созданы логические и процедурные средства распознавания рациональности результатов опроса; предложена новая технология опроса (с учётом некоммутативности различных видов опросов) с использованием средств многозначных логик аргументации, формализующих шкалы оценок результатов опросов; описана архитектура ИС с новыми когнитивными инструментами - ИС-ДСМ для формализованного качественного анализа социологических данных, формализованной оболочки для решения проблем когнитивной социологии (с предварительной содержательной работой социолога); под руководством автора диссертации создана интеллектуальная система, обучающая социолога анализу данных средствами ДСМ-метода автоматического порождения гипотез.
Реализация предложенных технологий в интеллектуальных системах типа ДСМ специально разработанной архитектуры обеспечивает практическую значимость работы. Плодотворность предложенного подхода для анализа эмпирических социологических данных подтверждена экспериментальными исследованиями. Совместно с Институтом социологии РАН с использованием ИС-ДСМ был проведён анализ солидарного поведения рабочих на конфликтных предприятиях, в ходе которого были выявлены детерминанты различных видов поведения и на основании полученных детерминант построена типологизация социума. Совместно с факультетом Социологии РГГУ и Отделением интеллектуальных систем Института лингвистики РГГУ был проведён анализ электоральных предпочтений студентов старших курсов. В результате были не только выделены общие характеристики сторонников различных партий, но и вычислены значения критериев рациональности электорального выбора.
Разработка логических средств интеллектуального анализа социологических данных осуществлялась на основании следующих принципов.
I. Средства анализа эмпирических данных должны быть адекватны исследуемой предметной области. Анализ случайных событий (например, массовое поведение) должен осуществляться статистическими средствами, для выявления причинных связей (анализ индивидуального поведения) необходимо применение детерминистских методов. Для смешанных предметных областей, когда причинно-обусловленные явления подвержены случайным влияниям, требуется использование ИС с Рассуждателем и Вычислителем, способными, соответственно, выявлять причины и строить статистические модели.
II. Представление данных и знаний о субъекте и его поведении основывается на «постулате поведения» Р1: поведение детерминировано системой дифференциальных признаков, включающих описание социального характера, индивидуальных особенностей и детали биографии субъекта.
III. Для анализа рационального поведения (в частности, мнений) и отклонений от него должны быть в явном виде использованы знания об аргументации субъекта. Логическое представление мнений обеспечивает возможность использования логик с аргументационной семантикой для анализа рациональности мнений.
IV. Анализ детерминаций поведения предполагает включение ситуационных параметров, позволяющих учесть контекст реализации поведения.
V. Представление структуры объектов, системы отношений и рассуждений о них возможно лишь на основе специально созданного формального языка представления данных и знаний с дескриптивной и аргументативной функциями. В социологических исследованиях не только не используются языки такого рода, но даже не осознаётся потребность в их создании (см. Главу 1). Понимание важности развития формальных языков в гуманитарных областях пришло с проникновением в них методов искусственного интеллекта и развитием когнитивных наук.
VI. Интеллектуальный анализ данных предполагает извлечение интерпретируемых зависимостей между различными факторами, неявно содержащимися в массивах данных. Это означает обнаружение в базах эмпирических фактов нового знания и извлечение его средствами интеллектуальных систем. Таким образом, речь идёт о формализации исследовательских эвристик «анализ данных - предсказание -объяснение». Это соответствует решению одной из задач когнитивной социологии - имитации познавательной деятельности в социальных исследованиях.
VII. Основой предлагаемой формализации таких эвристик является принцип «сходство фактов влечет наличие (отсутствие) изучаемого эффекта и его повторяемость», позволяющий анализировать тип каузальности «структура - эффект».
VIII. Особенностью использования идеи причинности в предлагаемом варианте формализованного качественного анализа является применение принципа аргументации: аргументами при принятии тех или иных гипотез о ранее неопределённых фактах предметной области (предсказании поведения, мнений) являются порождённые на основе анализа имеющихся фактов (±)-гипотезы о причинах (поведения, мнений).
IX. Достаточным основанием для принятия индуктивных гипотез и гипотез, полученных в результате вывода по аналогии, является абдуктивное объяснение БФ на основе проверки выполнимости аксиом каузальной полноты. Усилением критерия достаточного основания принятия гипотез является обнаружение абдуктивной сходимости процесса ДСМ-рассуждений при расширении БФ.
X. Практической и теоретической основой подхода к формированию баз социологических фактов является классификация различных структур опросов, в том числе - формальное представление предсказательного опроса.
В результате работы созданы основания для применения методов современного интеллектуального анализа данных для решения задач когнитивной социологии - формализации самого процесса порождения нового знания из качественных эмпирических социологических данных и анализа влияния когнитивных особенностей индивидуумов на социальное поведение. Формализация исследовательских эвристик качественного анализа социологических данных может служить не только целям анализа эмпирических социологических данных о поведении социальных субъектов (как индивидов, так и социальных общностей), но и приближения к логической реконструкции идей классической «понимающей» социологии, в частности построения формальной теории каузального объяснения социального поведения.
Разработанные теоретические принципы и логический аппарат формального представления закрытых и предсказательных опросов предоставляют возможности для решения задач анализа и предсказания результатов реальных опросов. Развитие средств формальной аргументации объективизирует субъективные социологические данные, в результате чего они оказываются основой дальнейшего анализа средствами правдоподобных рассуждений. Аргументационная семантика для формирования оценок результатов опросов включается в общую структуру логического аппарата распознавания и предсказания рациональности мнений. Использование числовых характеристик рациональности является реализацией идеи содержательного отображения отношений в измеряемые параметры.
Предлагаемые средства интеллектуального анализа социологических данных не могут заменить содержательной работы исследователя-социолога, а представляют собой лишь формализованную оболочку для решения некоторых социологических задач. Необходим диалог профессионального (сциентистского) применения исследовательских процедур и глубокого (гуманистического) понимания сущности изучаемых социальных проблем. Подобное содружество представляет собой ответ на вызов потребностей формализации качественного анализа социологических данных и расширяет возможности обработки эмпирических социологических данных. Стандартные эвристики формирования массива данных должны предшествовать формализованным эвристикам анализа данных. Разумеется, полезные результаты могут быть получены лишь при условии подготовки данных, соответствующих условиям применимости формальных средств (в нашем случае - ДСМ-метода автоматического порождения гипотез и соответствующих интеллектуальных систем).
Широкое распространение качественных методов анализа социологических данных, превосходящих количественные методы относительно возможности отображения и исследования индивидуальных особенностей социальных процессов и явлений, в сочетании с преимущественно субъективными методами исследования, свидетельствует о назревшей потребности интеллектуализации такого анализа средствами современных компьютерных интеллектуальных систем. Использование интеллектуального анализа социологических данных расширяет возможности обработки эмпирических социологических данных, способствует объективизации социологических исследований, развитию логики и методологии социальных наук. С другой стороны, потребности формализации качественного анализа данных в социологии стимулируют развитие компьютерной их поддержки и, как следствие, оказываются центром кристаллизации новых идей интеллектуального анализа данных как такового, способствуя развитию новых информационных технологий. Взаимодействие идей классической социологии и методов интеллектуального анализа социологических данных позволяет говорить о возникающем соответствующем разделе современной когнитивной социологии.
Библиография Михеенкова, Мария Анатольевна, диссертация по теме Теоретические основы информатики
1. Ядов В.А. Стратегия социологического исследования. М.: Добросвет, 2003.
2. Милль Д.С. Система логики силлогистической и индуктивной. М.: ЛЕНАНД, 2011.
3. Дюркгейм Э. Социология. Её предмет, метод, предназначение. М.: Канон. 1995.
4. Татарова Г.Г. Методология анализа данных в социологии. М.: Стратегия, 1998.
5. Батыгин Г.С. Лекции по методологии социологических исследований. М.: РУДН, 2008.
6. Крыштановский А.О. Анализ социологических данных. М.: Издательский дом ГУ ВШЭ, 2006.
7. Девятко И.Ф. Методы социологического исследования. М.: КДУ, 2003.
8. Вебер М. Избранное: протестантская этика и дух капитализма. М.: РОССПЭН, 2006.
9. Shils Е.А. Foreword to: Weber M. The Methodology of the Social Sciences. The Free Press of Glencoe, Illinois, 1949.
10. Сорокин П. Квантофрения // В кн.: Социология. Хрестоматия для вузов. Составитель А.И. Кравченко. М.: Академический проект, 2002. С. 63-74.
11. Гуц А.К., Фролова Ю.В. Математические методы в социологии. М.: Издательство ЛКИ, 2007.
12. Толстова Ю.Н., Масленников Е.В. Качественная и количественная стратегии. Эмпирическое исследование как измерение в широком смысле // Социологические исследования, 2000, № 9, с. 101 109.
13. Самыловский А.И. О математике поведенческих исследований // Математическое моделирование социальных процессов, вып. 10, М.: КД Университет, 2009, с. 316 332.
14. Готлиб А.С. Введение в социологическое исследование (качественный и количественный подходы). М.: Флинта, 2005.
15. Gobo G. The Renaissance of Qualitative Methods // FQS Forum: Qualitative Social Research, 2005, Vol. 6, No. 3, Art. 42.
16. Поппер К. Логика социальных наук // Эволюционная эпистемология и логика социальных наук. М.: Эдиториал УРСС, 2000. С. 298 313.18. фон Вригт Г.Х. Объяснение и понимание // Логико-философские исследования, М.: Прогресс, 1986. С. 35 241.
17. Парсонс Т. О структуре социального действия. М.: Академический Проект, 2000.
18. Glaser В., Strauss A. The Discovery of Grounded Theory: Strategies for Qualitative Research. Chicago, New York: Aldine de Gruyter. 1967.
19. Страусс А., Корбин Дж. Основы качественного исследования. Обоснованная теория. Процедуры и техники. М.: КомКнига. 2007.
20. Каныгин Г.В. Контекстно-ориентированная концептуализация исследовательских понятий // Социологический журнал, 2007, № 3, с. 60 -80.
21. Kelle U. "Emergence" vs. "Forcing" of Empirical Data? A Crucial Problem of "Grounded Theory" Reconsidered // FQS Forum: Qualitative Social Research, 2005, Vol. 6, No. 2, Art. 27.
22. Glaser B. Emergence vs. Forcing: Basics of Grounded Theory Analysis. Mill Valley, Ca.: Sociology Press, 1992.
23. Кэмпбелл Д. Качественное знание в исследованиях действия // Модели экспериментов в социальной психологии и прикладных исследованиях. М.: Прогресс, 1980. С. 240 277.
24. Штейнберг И., Шанин Т., Ковалев Е., Левинсон А. Качественные методы. Полевые социологические исследования. СПб.: Алетейя, 2009.
25. Hesse-Biber S.N. Mixed Method Research: Merging Theory with Practice. NY: The Guilford Press, 2010.
26. Kelle U. Sociological Explanations between Micro and Macro and the Integration of Qualitative and Quantitative Methods // FQS Forum: Qualitative Social Research, 2001, Vol. 2, No 1, Art.5.
27. Bazeley P. Issues in Mixing Qualitative and Quantitative Approaches to Research //In: R. Buber, J. Gadner, & L. Richards (eds) (2004) Applying qualitative methods to marketing management research. UK: Palgrave Macmillan, pp. 141-156.
28. Смелзер H. Дж. О компаративном анализе, междисциплинарности и интернационализации в социологии // Социологические исследования, 2004, № 11, с. 3- 12.
29. Давыдов А.А. Фатальная ошибка социологии // Электронный ресурс. Опубликовано 12.04.2010. URL: http://ecsocman.edu.ru/rubezh/msg/28973359.html.
30. Батыгин Г.С., Девятко И.Ф., Миф о качественной социологии // Социологический журнал, 1994, № 2, с. 28 42.
31. Frost N., Nolas S.-M., Brooks-Gordon В. et al. Pluralism in qualitative research: the impact of different researchers and qualitative approaches on the analysis of qualitative data // Qualitative Research, 2010, vol. 10 (4), pp. 1-20.
32. Kelle U. An Overview of Computer-Aided Methods in Qualitative Research // In: U. Kelle (ed.). Computer-Aided Qualitative Data Analysis: Theory, Methods and Practice. London. Thousand Oaks. New Delhi: SAGE Publication. 1998. pp. 1-18.
33. Fielding N. G. Automating the ineffable: Qualitative software and the meaning of qualitative research // In: Tim May (ed.). Qualitative research in action. Sage Publication Inc. London. 2003 (403 p.). pp. 161 178.
34. Kelle U., Laurie H. Computer Use in Qualitative Research and Issues of Validity // In: U. Kelle (ed.). Computer-Aided Qualitative Data Analysis: Theory, Methods and Practice. London. Thousand Oaks. New Delhi: SAGE Publication. 1998. pp. 19-28.
35. Lewins A., Silver C. Using Software in Qualitative Research: A Step by Step Guide. London: Sage Publications, 2007.
36. Berger R. Review: "Using Software in Qualitative Research: A Step-by-Step Guide" (Lewins & Silver 2007) // Forum: Qualitative Social Research, 2009, Vol. 10, No 1, Art. 23.
37. Shelly A., Sibert E. Using Logic Programming to Facilitate Qualitative Data Analysis // Qualitative Sociology, Summer 1986, 9(2), pp. 145 161.
38. Sibert E., Shelly A. Logic Programming for Hypothesis Generation and Refinement // In: U. Kelle (ed.): Computer-Aided Qualitative Data Analysis: Theory, Methods and Practice. London. Thousand Oaks. New Delhi: SAGE Publication. 1998. Pp. 113 128.
39. Huber G. L., García C. M. Computer Assistance for Testing Hypotheses about Qualitative Data: The Software Package AQUAD // Qualitative Sociology, 1991, Vol. 14, No 4, pp. 325 347.
40. Huber G. L. Qualitative Hypothesis Examination and Theory Building // in: U. Kelle (ed.): Computer-Aided Qualitative Data Analysis: Theory, Methods and Practice. London. Thousand Oaks. New Delhi: SAGE Publication. 1998. Pp. 136- 150.
41. Fielding N.G., Cisneros-Puebla C. A. CAQDAS-GIS Convergence Toward a New Integrated Mixed Method Research Practice? // Journal of Mixed Methods Research, 2009, Volume 3, No 4, pp. 349-370.
42. De Gregorio E., Arcidiacono F. Computer-assisted analysis in the social sciences: A unique strategy for mixed research? // International Journal of Multiple Research Approaches, 2008, Vol. 2, Issue 1, pp. 31 35.
43. García-Alvarez E., López-Sintas J. Contingency Table: A Two-Way Bridge between Qualitative and Quantitative Methods // Field Methods, 2002, Vol. 14, No. 3, pp. 270-287.
44. Kuckartz U. Realizing Mixed-Methods Approaches with MAXQDA // Online. URL: www.methoden-evaluation.de
45. Kuckartz U. Case-Oriented Quantification // In: U. Kelle (ed.): Computer-Aided Qualitative Data Analysis: Theory, Methods and Practice. London. Thousand Oaks. New Delhi: SAGE Publication. 1998. Pp. 158 166.
46. Humble A. M. Technique Triangulation for Validation in Directed Content Analysis // International Journal of Qualitative Methods, 2009, 8(3), pp. 34 -51.
47. Brent E., Slusarz P. "Feeling the Beat": Intelligent Coding Advice from Metaknowledge in Qualitative Research // Social Science Computer Review, 2003, Vol. 21, No. 3, pp. 281 303.
48. Cisneros-Puebla C.A. Qualitative computing // On-line. URL: www.paginasprodigv.com/cesarcisne/compartidos/QualitativeComputing.pdf
49. Bringer J. D., Johnston L. H., Brackenridge С. H. Using Computer-Assisted Qualitative Data Analysis Software to Develop a Grounded Theory Project // Field Methods, 2006, Vol. 18, No. 3, pp. 245-266.
50. Lu Chi-Jung, Shulman S. W. Rigor and Flexibility in Computer-based Qualitative Research: Introducing the Coding Analysis Toolkit // Int. Journal of Multiple Research Approaches, 2008, vol. 2, № 1, pp. 105 117.
51. Ganter В., Wille R. Formal Concept Analysis: Mathematical Foundations. Springer, 1999.
52. Freeman L.C. Cliques, Galois Lattices, and the Structure of Human Social Groups // Social Networks, 1996, No 18, pp. 173 187.
53. Ragin C.C. The Comparative Method: Moving beyond Qualitative and Quantitative Strategies. Berkley, Los Angeles and London: University of California Press, 1987.
54. Heise D. Event Structure Analysis: a qualitative model of quantitative research // In: Fielding N., Lee R. (eds.): Using computers in qualitative research, Sage, 1993. Pp. 136 163.
55. Гриффин JT. Историческая социология, нарратив и событийно-структурный анализ пятнадцать лет спустя // Социологические исследования, 2010, № 2, с. 131 140.
56. Lewins A., Silver С. Choosing a CAQDAS Package // A working paper, 2009. On-line. URL:http://caqdas.soc.surrey.ac.uk/PDF/2009ChoosingaCAODASPackage.pdf
57. Каныгин Г.В. Инструментальные средства и методологические принципы анализа социологических данных // Социология: 4М, 2007, № 25, с. 70-98.
58. Baugh J. В., Hallcom A. S., Harris М. Е. Computer Assisted Qualitative Data Analysis Software: a Practical Perspective for Applied Research // Revista del Instituto Internacional de Costos, enero/junio 2010, No 6, pp. 69 81.
59. Romme A., Georges L. Boolean comparative analysis of qualitative data // Quality and Quantity, 1995, 29, pp. 317 329.
60. Rihoux B. Qualitative Comparative Analysis (QCA) and related techniques: recent advances and challenges // In: Pickel S., Pickel G., Lauth H.-J., Jahn D.66
-
Похожие работы
- Логические и программные средства качественного анализа социологических данных
- Развитие ДСМ-метода автоматического порождения гипотез для его применения при анализе социологических данных типа "Субъект-поведение"
- Создание информационной среды для интеллектуальной системы анализа социологических данных
- Интегрированная информационно-аналитическая система для социологических исследований
- Алгоритмические и программные средства анализа данных о биотрансформациях и результирующем эффекте от введения в организм двух химических соединений
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность