автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Создание информационной среды для интеллектуальной системы анализа социологических данных
Автореферат диссертации по теме "Создание информационной среды для интеллектуальной системы анализа социологических данных"
На правах рукописи
БУРКОВСКАЯ Жанна Ивановна
СОЗДАНИЕ ИНФОРМАЦИОННОЙ СРЕДЫ ДЛЯ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ АНАЛИЗА СОЦИОЛОГИЧЕСКИХ ДАННЫХ
Специальность 05.25.05 ИНФОРМАЦИОННЫЕ СИСТЕМЫ И ПРОЦЕССЫ, ПРАВОВЫЕ АСПЕКТЫ ИНФОРМАТИКИ
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Москва 2006
Работа выполнена
во Всероссийском институте научной и технической информации РАН
Научный руководитель:
Кандидат технических наук Михеенкова Мария Анатольевна Официальные оппоненты:
доктор технических наук Лахути Делир Гасемовнч
кандидат технических наук, доцент Тарасов Валерий Борисович
Ведущая организация:
Институт системного анализа РАН
Защита состоится «/•$ » декабря 2006 г. в 14.00 часов на заседании диссертационного совета Д 002.026.01 при Всероссийском институте научной и технической информации РАН по адресу: 125190, Москва, ул. Усиевича, д. 20.
С диссертацией можно ознакомиться в библиотеке Всероссийского института научной и технической информации РАН.
Автореферат разослан » ноября_2006 г.
Ученый секретарь диссертационного совета ВИНИТИ
доктор биологических наук, профессор
У^* Каменская Марина Александровна
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Работа посвящена созданию Информационной среды интеллектуальной системы типа ДСМ анализа социологических данных.
ДСМ-метод автоматического порождения гипотез (ДСМ-метод АПГ) [1-6] - синтез индукции, аналогии и абдукции, - осуществляет порождение гипотез и их принятие на достаточном основании, а также способствует кластеризации эмпирических данных, формированию понятий и эмпирических теорий, учитывающих и обобщающих экспериментальный материал. Неформально метод может быть представлен в виде последовательной схемы рассуждений «сходство-причина-аналогия»: на основе анализа сходства явлений ищется их причина, которая в дальнейшем может использоваться при прогнозирования новых явлений на основе структурной аналогии. Абдукция используется для объяснения начального состояния исходных данных (базы фактов). Средством формализации ДСМ-рассуждения является специальный аппарат многозначных логик, а само рассуждение опирается на частично формализованные знания (как объективные, так и субъективные) о предметной области, ДСМ-метод АПГ используется для решения задач формализованного качественного анализа данных в предметных областях, удовлетворяющих сформулированным условиям применимости (см., например [б]).
Ряд особенностей ДСМ-метода позволяет считать его адекватным средством качественного анализа социологических данных [7], что подтверждается проводившимися практическими экспериментами [8-11]. ДСМ-метод АПГ может применяться для решения следующих социологических задач:
1. выявление детерминант и прогнозирование социального поведения;
2. выявление детерминант и прогнозирование мнений;
3. анализ рациональности мнений.
Для извлечения знаний из обширного эмпирического материала с использованием логических и вычислительных процедур значительной алгоритмической сложности требуется применение интеллектуальных систем, реализующих процедуры машинного обучения. К таким системам относится интеллектуальная система типа ДСМ, представляющая собой интерактивную систему, в которой на базе развитого логико-математического обеспечения, реализующего ДСМ-метод АПГ, осуществляется интеллектуальный анализ данных из исходных баз фактов. Интеллектуальные системы имеют следующую архитектуру; Решатель + Информационная среда + Интеллектуальный интерфейс [12]. В Решателе осуществляется формализованная эвристика — извлечение закономерностей из базы данных посредством ДСМ-рассуждення, которое есть синтез трех познавательных процедур: индукции, аналогии и абдукции. Информационная среда представляет собой базу фактов (БФ) и базу знаний (БЗ), а Интеллектуальный интерфейс отвечает за диалог между пользователем и
машиной, представление результатов исследования и научение пользователя работе с системой.
В настоящей работе мы понимаем термин «Информационная среда» несколько шире, нежели просто база фактов и база знаний. Информационная среда есть некая активная оболочка, которая обеспечивает функционирование всех компонентов интеллектуальной системы как единого целого, в том числе организует и упорядочивает процессы взаимодействия пользователей с ДСМ-Решателем, базой данных И остальными подсистемами; осуществляет надежное и безопасное хранение данных и управление этими данными; предоставляет дополнительные возможности пользователям для того, чтобы они могли построить работу с системой максимально эффективно и в соответствии с существующими технологиями качественного анализа данных.
ДСМ-Решатель, как компонент интеллектуальной системы, был реализован и описан ранее A.B. Путриным и Д.В. Панкратовым [13]. Достоинством созданного Решателя является то, что он не зависит от конкретной предметной области, поскольку все алгоритмы реализуются в общем виде, а настройка на предметную область должна происходить в другом модуле системы (в настоящий момент один и тот же Решатель используется для анализа химических и социологических данных). Для тестирования ДСМ-Решателя на массиве социологических данных было создано программное приложение JSM Explorer, осуществляющее настройку абстрактного Решателя на предметную область социологических исследований, управление процессом загрузки эмпирических данных из файла данных, настройки параметров Решателя и отображением порожденных гипотез и прогнозов посредством визуального интерфейса. Подготовка «сырых» анкетных данных к ДСМ-анализу осуществлялась средствами отдельного программного ■ модуля, использование которого, однако, было весьма трудоемко и предполагало знания специального языка для определения правил построения агрегированных характеристик субъекта поведения из исходных характеристик («правил сворачивания») [9,13].
Эти программные средства позволяют проводить ДСМ-анализ социологических данных в экспериментальном режиме. Однако неорганизованное и ненадежное хранение информации в несвязанных файлах данных разного формата, невозможность многопользовательской работы с одними и теми же данными, отсутствие удобных средств разработки инструментария и подготовки данных, а также средств распознавания и изучения рациональности мнений и пр. - все это делает существующие программные средства недостаточными для формализованного качественного анализа социологических данных в реальных условиях.
Целью диссертационного исследования являлось создание интеллектуальной системы типа ДСМ для качественного анализа социологических данных (в том числе для анализа рациональности мнений)
как полноценного самостоятельного автоматизированного рабочего места эксперта-социолога, которое позволит проводить качественные социологические исследования (выявление детерминант и прогнозирование поведения или мнений) с использованием различных стратегий ДСМ-метода АПГ и осуществлять анализ рациональности поведения респондентов. Информационная среда интеллектуальной системы должна обеспечить совместную работу всех компонент системы, объединить данные, полученные в ходе качественных социологических исследований, обеспечить их надежное и структурированное хранение; повысить эффективность работы социолога на всех этапах проведения исследования. Создание развитого Интеллектуального интерфейса системы позволит осуществлять комфортную навигацию пользователя по Информационной среде и интерактивное взаимодействие пользователя с системой.
Актуальность работы обусловлена необходимостью внедрения в практику профессиональных социологов формализованных методов качественного анализа социологических данных [14] и новых технологий распознавания и изучения рациональности мнений, что возможно только с применением развитой интеллектуальной системы типа ДСМ, позволяющей проводить социологические исследования на реальных объемах данных и в реальных условиях.
В процессе работы над диссертацией автором получены следующие научные результаты:
1. Определены требования к интеллектуальной системе анализа социологических данных (включая функциональные возможности) и в соответствии с этими требованиями спроектирована и реализована многоуровневая клиент-серверная архитектура системы,
2. Создана Информационная среда, которая:
1) обеспечивает храпение данных, получаемых в ходе проведения качественных социологических исследований, в единой базе данных под управлением современной серверной системы управления базами данных;
2) предоставляет различные инструменты формирования исходной базы фактов;
3) позволяет использовать различные стратегии анализа социологических данных;
3. Разработаны алгоритмические и программные средства изучения рациональности мнений; модуль изучения рациональности включен в общую архитектуру системы.
4. Создан Интеллектуальный интерфейс системы, позволяющий осуществлять комфортную навигацию по Информационной среде и управлять социологическим исследованием.
5. Проведены эксперименты, подтверждающие адекватность созданных алгоритмических и программных средств задачам
качественного анализа социологических данных о рациональном поведении.
Следующие особенности работы определяют ее научную новизну:
1. Разработана интеллектуальная система типа ДСМ для формализованного качественного анализа социологических данных.
2. Предложены и программно реализованы различные инструменты формирования исходной базы фактов.
3. Программно реализован новый подход к проведению закрытых опросов общественного мнения: формирование мнений с помощью артументационного оценивания.
4. Разработаны алгоритмические и программные средства анализа рациональности мнений, модуль изучения рациональности включен в архитектуру интеллектуальной системы анализа социологических данных.
Практическая значимость работы состоит в создании интеллектуальной системы типа ДСМ для анализа социологических данных, которая представляет собой полноценное самостоятельное автоматизированное рабочее место эксперта-социолога. Система автоматизирует значительную часть работы социолога на всех этапах проведения качественного социологического исследования, обеспечивает структурированное, надежное и безопасное хранение и управление данными в едином информационном пространстве, применение различных стратегий ДСМ анализа; предоставляет средства изучения рациональности мнений. Созданный программный продукт является отчуждаемым, а значит, может быть внедрен в научной или учебной организации для проведения качественных социологических исследований и демонстрации возможностей применения ДСМ метода автоматического порождения гипотез.
По теме диссертации в настоящее время опубликовано 4 работы и одна принята в печать.
Апробация работы.
1. 6-ая Международная конференция НТИ-2002 «Информационное общество. Информационные ресурсы и технологии -телекоммуникации», Москва, ВИНИТИ, 16-18 октября 2002 г.
2. 8-ая национальная конференция по искусственному интеллекту с международным участием КИИ-2002, г. Коломна, 8-11 октября 2002 г.
3. 9-ая национальная конференция по искусственному интеллекту ( международным участием КИИ-2004, г. Тверь, 28 сентября - 1 октября 2004 г.
Структура работы. Диссертация состоит из введения, трех глав, заключения и приложений.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во Введении обоснована актуальность темы диссертации, определены цели и задачи исследования, сформулированы основные результаты работы и их практическая значимость, описана структура диссертации.
Глава 1 посвящена проблеме изучения рациональности мнений. Рассматриваются теоретические вопросы анализа рациональности мнений респондентов (как одного из видов поведения) на основании развитых логических средств концептуализации анализа мнений [15]. Описаны критерии, характеризующие различные аспекты рациональности мнений, и предложены основные алгоритмы, реализующие эти критерии.
Теоретическая социология обладает обширным спектром подходов к анализу рационального поведения [16], однако все они опираются на представление о действии как акте, направленном на некоторую цель. В этом случае рациональность действия определяется как устанавливаемое с помощью рассудка соотношение между интенцией и имеющимися у субъекта знаниями, объективными возможностями и избранными средствами. Мы же рассматриваем рациональность мнений (как одного из видов поведения) в широком смысле, вне зависимости от целеполагания субъекта (если таковое и имеется), - как аргументированное принятие решений (высказываемых мнений), не сводимое к дедуктивному рассуждению [17]. Такое представление позволяет нам использовать аргументацию как средство распознавания рациональности мнений в ситуации опроса мнений, что превращает предпосылку рационального действия респондентов из теоретической в практическую в позволяет считать результаты исследования адекватным отображением социальной действительности.
В [18] предложен вариант семантики ДСМ-метода для анализа и прогнозирования мнении, относящихся к набору тем ТД .,Т5*. Стимулом к развитию этого варианта послужила концепция Н. Лумана [19], согласно которой опросы общественного мнения должны быть представлены как ответы на вопросы о соответствующей теме. Уточнение идеи «темы» (или множества «тем») как некоторой организации знаний, предполагающей их аргументированное принятие, в [15] названо концептуализацией анализа мнений. Смысл этой концептуализации состоит в том, что средствами ДСМ-метода АПГ возможно распознавание рациональных мнений — в отличие от нерациональных.
Схема анализа и прогнозирования мнений. Рассмотрим частный случай 3=1. Пусть задана некоторая тема опроса Т* (например, «отношение к частной собственности», «отношение к свободе слова», «отношение к демократии» и т.п.) такая, что она характеризуется утверждениями рь ..., р„. Пусть, далее, символ «7» обозначает оператор вопроса такой, что ?Лр/ - терм,
в котором V - переменная со значениями из {1, —1, 0, т) («фактическая истина», «фактическая ложь», «фактическое противоречие», «недоопределенность», соответственно). Терм ?Лр. понимается как вопрос «верно ли, что у[р(] = v?». Множество {рь ..., р„} будем называть каркасом р темы Т*. Пусть фу - метасимвол, "г"- предикат графического равенства формул. Положим ф; 2 где е{±1, 0, т}, I - 1.....щ) ш
I, .... 4". Будем называть % - максимальную конъюнкцию атомов У, <„р„ -мнением индивида, при этом множество членов этой конъюнкции обозначим [ФуМ^'Рь Пусть Ц^ = (у/€{1,-1, О, т}), ) =1,
п). Задача изучения мнений сводится к изучению высказываний Уд (Ср>|[ф>]) - «субъект Су имеет мнение фу» - и У^Дуу] Су) - «мнение ц/у есть следствие характеристик субъекта Су», — Су, Су, [фу], [14/у] — константы, Су, Су е 2и'", [фу], ВД , = (р,, т) — истинностное значение (оценка),
полученная применением ДСМ-метода АПГ, где Цуе{±1, 0, т}, а т — число применений ДСМ-правил правдоподобного вывода. Оценка эмпирического отношения С»| О («субъект — мнение») есть оценка отношения к теме в целом, О - мнение субъекта С (О = [ф]). Применяя ДСМ-метод (прямой или обратный), мы порождаем детерминанты мнений, которые в дальнейшем используются для прогнозирования мнений, а также служат основанием для построения модели структуры изучаемого социума.
Аргументация. Идея новой технологии опроса состоит в том, что вместо вопросов, раскрывающих некоторую тему Т, респонденту предлагается множество утверждений Р = {р1,...,рп} относительно этой темы и аргумент ационная база А — множество аргументов и контраргументов относительно принятия или непринятия утверждений из Р. Задаются две функции выбора: Р 2Л и в": Р -> 1Л. Для оценивания каждого утверждения из Р респондент выбирает из А аргументы «за» или аргументы «против» данного утверждения. Предполагается, что при таком оценивании утверждений, респондент вынужден действовать более или менее обдуманно, т.е. проявлять то, что В.С. Швырев в [20] называет «специальными усилиями сознания». Используя аргументационные функции у-го респондента и атомарную функцию оценки логики аргументации А4 [17] или А« [21],- можно автоматически получить оценку для каждого высказывания из Р. Максимальная конъюнкция таких оценок р^**^*^!г^»» и будет мнениему-
го респондента фу. Описанная функция выбора представляет собой аппарат Принятия решений.
В работе рассматривается проблема, связанная с реализацией такой технологии опроса в реальных условиях. Мы видим решение этой проблемы в применении современных компьютерных технологий. Очевидно, что программная реализация формирования мнений с помощью функций выбора и функции атомарной оценки логики аргументации должна быть
интегрирована в интеллектуальную систему, информационная среда которой позволит:
■ провести опрос мнений и сохранить описание респондента и его артументационные функции в базе данных;
■ сформировать мнения респондентов с помощью функций атомарной оценки логики аргументации;
■ использовать полученное представление знаний о респондентах для изучения рациональных мнений средствами ДСМ-процедур. Разработанные программные средства распознавания рациональности
мнений описаны в Главе 2 настоящей работы.
Далее в Главе 1 рассматривается трехкритериальный подход к изучению рациональности мнений, характеризующий различные аспекты рациональности мнений, и алгоритмическая реализация этих критериев.
Первый критерий рациональности — непротиворечивость мнений. Этот критерий подходит как для определения рациональности мнения одного социального субъекта, так и для определения степени рациональности мнений в выделенной социальной общности. Для формализованного представления первого критерия в работе кратко описывается логика [15]. Суть критерия заключается в следующем. На множестве высказываний
Р = {р],...,р„}, характеризующих тему опроса Т , можно задать множество
/
логических зависимостей £ вида Хт^Чи (где Хт и — атомы вида "> р,-, а «—>» - импликация двузначной логики). Логические зависимости могут быть и более сложные, но в настоящей работе мы рассматриваем только импликации атомарных формул. Предполагается, что 2 непротиворечиво. Тогда существует процедура Ь такая, что по множеству Е порождается множество Д максимальных конъюнкции («мнений») ф; таких, что является противоречивым. Обозначим множество всех максимальных конъюнкций ф; посредством Ф, тогда ДсФ, а Д будем называть множеством «запрещенных максимальных конъюнкций». Пусть, далее, Ф' * множество мнений к респондентов, полученных для стабилизированного к (в ходе дальнейшего опроса новые мнения не возникают), Ф'^Ф Тогда
функция 5(Ф', Д) = I - ^^' есть степень рациональности мнений
соответствующего множества респондентов, где |Ф'| - число стабилизированных мнений, а [Ф'пД| - число противоречащих X мнений.
В работе предложен алгоритм распознавания непротиворечивости мнения <р[, основанный на методе аналитических таблиц ¿А^. Этот алгоритм порождает дерево, корнем которого является помеченная формула логики 1А4. выражающая 2и{ф[}. Каждая ветвь порожденного дерева проверяется на закрытость. Если все ветви построенного дерева замкнуты, то 2и{ф(} -противоречиво и мнение ф) е Д. Если алгоритм находит хотя бы одну открытую ветвь в порождаемом дереве, работа завершается с результатом: <р* — непротиворечиво. Алгоритм порождения дерева работает за
экспоненциальное время, поскольку в наихудшем случае требуется породить все ветви дерева и проверить их закрытость. Ввиду высокой сложности этого алгоритма автором был предложен другой алгоритм проверки непротиворечивости мнения, названный «алгоритмом последовательного сравнения» (АПС), АПС берет последовательно каждую зависимость из Е и проверяет, выполняется ли эта зависимость для мнения <р(. Это означает, что если оценка У[р>)] ■= уу в левой часта зависимости ру совпадает с оценкой
этого же утверждения ру в мнении фь то оценка У[р*] = у^ в'правой части зависимости р4 должна совпадать с оценкой р* в мнении ф|. Если для мнения выполняются все зависимости, то оно непротиворечиво. Сложность АПС линейная (имеется всего один цикл). Именно поэтому АПС был использован для программной реализации первого критерия в модуле изучения рациональности мнений (Глава 2).
Следующий критерий рациональности - сходство с «идеальным мнением» — непосредственно связан с исследованием электорального поведения респондентов. Мы предположили, что респонденты, выбирающие один и тот же вариант электорального поведения, должны обладать мнением, сходным с мнением «идеального» сторонника партии — такого, что все ответы на вопросы о положениях программы его партии должны соответствовать эти положениям. Назовем мнение «идеального» сторонника партии «идеальным мнением». Пусть есть некоторая /-я партия и «идеальное мнение» этой партии ф(|)« •Гу[,,р1&...&111,|1р|1. Пусть в результате опроса было
выявлено множество сторонников 1-й партии Б = {sj.--.jS,}, р№ = |8| - число сторонников *-й партии. Положим - число респондентов из Б, чьи мнения имеют (и - А) пересечений с «идеальным» мнением <рм. Тогда можно вычислить = + а(0г(и - 1) + ... + а\(п - к) + ... + а(Чп(л - 1)1-Степень сходства мнений сторонников 1-й партии с «идеальным мнением»: р« = р^/мр{0 Основной алгоритм, необходимый для реализации этого критерия, заключается в поиске пересечения мнения каждого респондента из 8 с «идеальным мнением». Алгоритм имеет два цикла; внешний — по респондентам, проявившим намерение голосовать за /-ую партию, и внутренний — по элементам каркаса темы. Сложность алгоритма квадратичная, и он также вошел в программную реализацию критерия в модуле изучения рациональности мнений интеллектуальной системы. В отличие от первого критерия, критерий «сходство с «идеальным мнением» явным образом зависит от принадлежности респондента той или иной социальной общности, объединенной сходным мнением. При этом мы задаем некую «точку отсчета» («идеальное мнение»), относительно которого распределяются мнения в социальной общности.
Третий критерий рациональности описывает степень согласованности мнений в выделенной социальной общности. Здесь «точка отсчета», вокруг которой группируются мнения социальной общности, определяется самим содержанием этих мнений, и она (эта точка) может не совпадать с
«идеальным мнением». Пусть для изучаемой социальной общности в результате опроса мы получили s различных мнений, s = |Ф'|, где Ф' = {ф;( ...,<pj}, [фу] = п. Пусть a j число респондентов, имеющих мнение ф;.
Пересечем попарно все s мнений и найдем у = ¿^а^пу*, где шд-мощность
пересечения j-ого и А-ого мнений, а а,* = min(aj, а*), у характеризует
„ „ , [а,п,есля5 = 1
реальные сходства существующих мнений. Затем строим у* — ,
[у,если®>1
i-i
где у = (и - тхарактеризует идеальные сходства специально
у
построенных мнений. Тогда степень согласованности мнений: X = В
работе описан алгоритм квадратичной сложности, на вход которого подается множество всех мнений Ф, полученных для некоторой социальной общности, а на выходе получается список уникальных мнений Ф'.
Кроме описанных выше трех критериев предлагаются еще два дополнительных критерия рациональности;
• близость мнений социальной общности; ■ однородность мнений социальной общности.
Критерий, характеризующий однородность мнений, основан на представлении о том, что любая социальная общность в той или иной степени неоднородна, т.е. распадается на более мелкие сообщества, объединенные общим мнением по некоторым вопросам. Таким образом, на основе предложенного критерия однородности осуществляется кластеризация социальной общности и вычисляется численная характеристика «однородности» этих кластеров. Алгоритм, реализующий критерий однородности работает за экспоненциальное время.
Все критерии рациональности мнений, описанные в Главе 1, программно реализованы, включены в архитектуру модуля изучения рациональности интеллектуальной системы и протестированы на реальных социологических данных.
В Главе 2 подробно рассмотрена программная реализация интеллектуальной системы анализа социологических данных SocioMagic 1.0. В начале главы определяется назначение и функциональность системы, затем рассматривается архитектура и принципы ее построения; в параграфах 2.3.1 .2.3.7. представлена разработанная Информационная среда, параграф 2.3.8. посвящен описанию Интеллектуального интерфейса.
Назначение интеллектуальной системы анализа социологических данных определяется необходимостью использования программных средств поддержки на всех этапах социологического исследования (не только на зтапе применения ДСМ процедур). Выделим основные этапы:
1. разработка концепции и подготовка программы исследования;
2. разработка инструментария;
3. проведение опроса и сбор эмпирических данных;
4. подготовка исходных данных к применению ДСМ-процедур;
5. ДСМ-анализ (порождение гипотез, доопределение объектов, объяснение исходной базы фактов);
6. анализ рациональности мнений (для качественного анализа мнений);
При этом интеллектуальная система должна удовлетворять следующим основным требованиям:
1. Система должна решать задачи качественного анализа социологических данных (в том числе о рациональности мнений) с применением различных технологий проведения опроса общественного мнения, способов подготовки эмпирических данных к применению ДСМ-процедур, методов и стратегий анализа данных.
2. Работа системы должна строиться на эффективно организованном хранении и использовании информации по всем социологическим исследованиям в едином информационном пространстве.
3. Система должна удовлетворять концепции однократного ввода данных.
4. Устойчивое функционирование системы должно обеспечиваться возможностью внесения изменений в массивы информации без изменения текстов программ.
5. Система должна обладать достаточно высокой степенью масштабируемости во всех измерениях, в частности по количеству пользователей, объему хранимых данных, интенсивности обмена данными, скорости обработки данных, набору предоставляемых функций и пр.
6. Система должна обладать развитыми технологическими средствами интеграции с другими прикладными системами.
7. Система должна обеспечивать защиту и безопасность данных.
8. Система должна обладать комфортным интеллектуальным интерфейсом на русском языке.
С учетом сформулированных требований определено назначения системы: Поддержка и автоматизация проведения качественных исследований социологических с применением различных стратегий анализа данных, методов сбора эмпирического материала и подготовки данных к ДСМ-анализу; повышение эффективности работы социологов за счет развитой Информационной среды, которая обеспечит:
• организованное хранение информации в единой базе данных;
■ многопользовательский режим работы с базой данных;
• наличие средств защиты и безопасности данных;
■ планирование и ведение исследовательских проектов; 9 наличие удобного интеллектуального интерфейса;
■ предоставление дополнительных средств поддержки исследования на различных этапах его проведения.
Исследовательские проекты, поддерживаемые интеллектуальной системой, могут быть классифицированы в зависимости от:
1. цели исследования: анализ поведения / анализ мнений.
2. включение в исследование ситуационной составляющей [22,23]. При этом для анализа мнений можно выделить два подтипа
исследований на два по способу формирования мнений:
1) формирование мнения из ответов респондента, полученных на вопросы анкеты;
2) формирование мнения с использованием множества аргументов и контраргументов и функции атомарной оценки логики аргументации.
Последовательно рассматриваются фазы развития социологического исследования, для каждой фазы определяется функциональность интеллектуальной системы. Перечислим основные задачи, которые решает система:
1. регистрация пользователей и определение их роли в системе;
2. создание исследовательского проекта с определенными параметрами как то; название, исследовательская программа, сроки проведения, руководитель проекта, организация и пр.;
3. разработка анкеты в интерактивном режиме, вывод анкеты на печать;
4. подготовка аргументационной базы (для технологии формирования мнений с аргументацией);
5. создание на основе анкеты электронной формы для ввода результатов опроса в базу данных;
6. проведение интерактивного (дистанционного) опроса, при котором пользователи отвечают на вопросы анкеты, находясь за удаленными компьютерами; при этом в интерактивном опросе мнений может применяться технология формирования мнений с аргументацией;
7. предоставление различных инструментов подготовки эмпирических данных к применению ДСМ-процедур;
8. проведение ДСМ-рассуждения (прямой или обратный ДСМ-метод) на подготовленных данных, порождение гипотез, доопределение объектов и абдуктивное объяснение начального состояния исходных данных;
9. анализ рациональности мнений с использованием критериев рациональности (описанных в Главе 1).
Отметим, что функции 3-7 отвечают за формирование базы фактов, функции 8-9 отвечают за формирование базы знаний, функция 6 суть часть Интеллектуального интерфейса, функции 1 и 2 обеспечивают безопасность данных и их структурирование хранение, соответственно.
5 параграфе 2,2. детально описывается архитектура системы, основные компоненты и классы реализации этих компонент. Интеллектуальная система построена в современной многоуровневой архитектуре клиент-сервер, которая позволяет распределить модули обработки данных на одном на одном или нескольких отдельных серверах.
Эти программные модули выполняют функции сервера для интерфейсов с пользователями и клиента — для серверов баз данных.
На рисунке I представлены основные компоненты интеллектуальной системы:
Рис. 1
Общим принципом построения архитектуры является разделение функциональности системы по компонентам. Взаимодействие между такими компонентами основано на технологии COM (Component Object Model) [24]. Технология воплощает в себе идеи полиморфизма и инкапсуляции объектно-ориентированного программирования. СОМ-компонент представляет собой исполняемый двоичный ресурс, взаимодействующий с другими программами через СОМ-интерфейсы — наборы абстрактных функций и свойств. Преимуществом компонентной архитектуры является то, что СОМ-компоненты не зависят друг от друга, соответственно, модификация или изменение одного СОМ-компонента не приводит к модификации других модулей системы.
В параграфе 23. обоснован выбор средств разработки (среда разработки и язык программирования) интеллектуальной системы. При выборе были учтены следующие моменты:
■ Средства разработки должны быть предназначены и удобны для использования СОМ-технологии.
■ Средства разработки должны Предоставлять классы доступа к локальным или удаленным хранилищам данных.
■ Средства разработки должны обеспечивать возможности быстрого построения современного, удобного и функционального визуального интерфейса.
Выбор был сделан в пользу среды разработки Microsoft Visual Studio .NET 2003 и языка программирования Сё [25], которые являются современными средствами для быстрой разработки приложений и удовлетворяют сформулированным требованиям.
Далее в работе подробно рассматриваются основные компоненты интеллектуальной системы.
Параграф 2.3.1 посвящен проектированию базы данных интеллектуальной системы. Из возможных способов организации баз данных был выбран реляционный подход [26,27], считающийся в настоящее время одним из наиболее эффективных. В работе кратко изложена концепция реляционного моделирования, даны определения основных понятий: домен, отношение, ключ. Рассмотрены преимущества и недостатки реляционных СУБД (систем управления базами данных). Одним из недостатков реляционных СУБД является невозможность адекватного отражения семантики предметной области. В виду этого ограничения для проектирования реляционных баз данных часто применяются семантические модели данных. Одной из наиболее известных семантических моделей данных является модель «Сущность-Связь» (Entity/Relationship model), предложенная Чеком (Chen) в 1976 г. [28]. Основными понятиями ER-модели являются сущность, связь и атрибут. На рисунке 2 представлена ER-модель базы данных интеллектуальной системы анализа социологических данных:
Проест. Предоставляется доступ Пользователь
Ю проекта :j; I . , Наимен£1Взнмел(>0ектэ А50 IDлоль}оваге/эт 1.. ID проекта 1 ФИО А50
4
Содержатся е
X
^Анкета
(DsjwoTW I iD проекта i;
Проводится на вено»« . 1
"Опрос:'
ID опроса Г Юанкета "Г "•
7
Создается на основе Создается на основе
. Вариэкггюдгаговлбншх данных .
ID вариэкта.гюдгтоввемнйх да(*ь1Х: I ID опроса: ■ 1
t
Провидится на основ«
: ДСМ-рассужоение
ЮДСМ-рэссумдения 'д.;;..; Г
10вз^"анп1подготЬ&пенныжданн"ых Г
Вариант анализа рациональности 'О варианта анализа I ID опроса I 10 критерия_I_,_
Рис. 2
В качестве основной сущности мы рассматриваем Исследовательский проект. Это наиболее высокий уровень в логической структуре системы. Исследовательский проект объединяет большинство остальных сущностей предметной области, таких как Анкета, Опрос, ДСМ-рассуждение и др. С исследовательским проектом отношением «многне-ко-многим» связана сущность Пользователь. Более низкой по иерархии сущностью по отношению к Исследовательскому проекту является Анкета. В одном исследовательском проекте может быть создано несколько анкет (причем может не быть и ни одной, если проект находится в начальной стадии развития). Анкета может принадлежать только одному исследовательскому проекту и не может существовать вне какого-либо исследовательского проекта. На основе одной Анкеты пользователь может создать один или несколько Опросов, характеризующихся различными выборками, способами н условиями проведения. Каждый опрос содержит в себе ответы всех респондентов на все вопросы анкеты. После того, как мы получили эмпирические данные путем проведения опроса, мы можем уточнить и структурировать пространство признаков, избавившись от ненужных или получив более содержательные комплексные признаки. Способы подготовки одного и того же массива эмпирических данных могут быть разными, соответственно для одного Опроса может быть создано несколько Вариантов подготовленных данных. Структурированные данные варианта подготовленных данных могут быть использованы далее для проведения ДСМ-рассуждения. Результаты опроса мнений могут быть также использованы для анализа рациональности полученных мнений. Как было описано в Главе 1, можно предложить различные критерии рациональности мнений. Применение одного критерия к некоторой социальной общности (выделенной по одному или нескольким одинаковым признакам) будем называть Вариантом анализа. Помимо описанных базовых сущностей существуют вспомогательные сущности, входящие в структуру базовых. Например, сущность Вопрос входит в состав сущности Анкета, а в свою очередь сущность Вопрос включает сущность Вариант ответа.
Для проектирования ER-модели предметной, области был выбран продукт компании Sybase - PowerDesigner версии 11.0, который удобен с точки зрения функциональности и интерфейса. В процессе проектирования ER-модель уточнялась и постепенно приводилась к нормальным формам декомпозицией отношений, находящихся в предыдущих нормальных формах, в два или более отношения, удовлетворяющих требованиям следующей нормальной формы. На следующем шаге также посредством PowerDesigner ER-модель была преобразована в реляционную модель, представляющую собой набор таблиц и ключей.
В результате проектирования в базе данных системы Socio Magic 1.0 было создано 38 таблиц, представленных в Приложении 1. Можно выделить несколько групп таблиц no типам содержащихся данных: * справочники; ■ базовые таблицы сущностей;
• вспомогательные таблицы-
Справочники содержат в себе данные, необходимые для описания данных второй группы - базовых таблиц сущностей. Справочники делятся в свою очередь на 2 группы:
■ классификаторы - неизменяемые или мало изменяемые справочники; » пополняемые справочники - те справочники, которые постоянно
пополняются в процессе работы системы.
В качестве сервера была выбрана MS SQL Server 2000 - реляционная СУБД, использующая язык Transact SQL для обмена данными с компьютером клиента [29], Данная СУБД отличается высокой производительностью при небольших системных требованиях, надежностью хранения данных и развитыми возможностями для разработчика.
На последнем этапе проектирования базы данных средствами Power Designer были сгенерированы файлы команд для создания физических объектов базы данных в MS SQL Server 2000: таблиц, внешних ключей, представлений, триггеров, хранимых процедур и функций.
Центральным компонентом системы Socio Magic 1.0 является Ядро, названное так потому, что отвечает за взаимодействие остальных компонент системы друг с другом. Описанию этого компонента посвящен параграф 23.2, В Ядре можно выделить четыре основные группы классов:
1. Классы для работы с ДСМ-Решателем;
2. Классы для работы с базой данных на MS SQL Server 2000;
3. Классы для взаимодействия с визуальным интерфейсом;
4. Классы для взаимодействия с внешними источниками.
На рисунке 3 представлена схема взаимодействия Ядра с другими компонентами системы:
Визуальный интерфейс
........ Т
CCommon
SPSS
дсм-
Решатель
CNNNTablg CNNNRecord
í
СУБД (MS SQL Server) :
Рис.3
Ядро является инициатором взаимодействия с ДСМ-Решателем, СУБД и SPSS (представлено на схеме односторонней стрелкой). Между визуальным интерфейсом и Ядром организовано двустороннее взаимодействие.
По принципу взаимодействия с внешними компонентами классы Ядра можно разделить на:
■ Классы для работы с СОМ-объектами (ДСМ-Решатель, SPSS); Для обеспечения взаимодействия с СОМ-объектами необходимо знать интерфейсы классов, которые СОМ-объект предоставляет для взаимодействия;
■ Классы для взаимодействия с MS SQL Server 2000.
В параграфе 23.2. описана организация взаимодействия абстрактного (т.е. не зависящего от конкретной предметной области) ДСМ-Решателя и остальных компонент интеллектуальной системы анализа социологических данных. ДСМ-Решатель — это единственный компонент предыдущих версий интеллектуальной системы для социологии, вошедший в интеллектуальную систему. Методы, отвечающие за реализацию правдоподобных рассуждений, реализованы в ДСМ-Решателе в общем виде, т.е. не зависят от предметной области. Такую независимость обеспечивает класс ДСМ-Решателя — JSMFragment, предоставляющий абстрактные методы настройки на предметную область. Эти методы настройки только объявлены в интерфейсе ДСМ-Решателя, а их реализация осуществляется в унаследованном от JSMFragment классе Ядра CVotelmple. Отметим, что благодаря СОМ-технологии приложение SocioMagic 1.0. может использовать другой Решатель для проведения ДСМ-анализа. Главное и практически единственное требование — любой ДСМ-Решатель должен обеспечивать одинаковый программный интерфейс классов, используемых другими компонентами системы.
В параграфе 2.3.3. описывается Модуль Дистанционного Опроса (МДО), предложенный и разработанный в настоящей работе для проведения интерактивных (дистанционных) социологических опросов с использованием Интернет-технологий. Интерактивный опрос означает, что респонденты отвечают на вопросы анкеты, находясь за удаленными компьютерами. Обязательными условиями участия в дистанционном опросе для респондента являются: наличие компьютера с http-доступом к Web-cepBepy, установленный на этом компьютере Интернет-браузер и приглашение от социолога-исследователя, содержащее http-адрес и, возможно, логин и пароль для авторизации респондента. МДО представляет собой набор классов, написанных на языке программирования ASP (Active Server Pages) и размещенных в структуре каталогов Web-cepeepa. Классы МДО делятся на классы Web-интерфейса и классы для доступа к базе данных на SQL-сервере. Для обеспечения функционирования МДО на \УеЬ-сервере необходимо наличие Internet Information Services (IIS) версии не ниже 5.0 — набора сервисов для нескольких служб Интернета от компании Майкрософт. IIS предоставляет клиентам доступ к сайтам Всемирной паутины по протоколам HTTP и (если настроено) HTTPS.
С дистанционным опросом мнений тесно связана технология формирования мнений респондентов на основе функций выбора и функции атомарной оценки логики аргументации, описанная в главе 1. Аргументационная база формируется социологом на стадии разработки анкеты. При этом аргументационную базу можно задать для каждого вопроса, характеризующего тему отдельно. При проведении интерактивного опроса, система будет предлагать респонденту либо ответить на вопрос, выбрав один из вариантов ответа, либо подобрать аргументы и контраргументы для некоторого высказывания.
В параграфе 23.4. представлен модуль для работы с программой статистической обработки данных SPSS (Statistic Programs for Social Sciences). Необходимость интеграции с интеллектуальной системы с SPSS определяется следующими соображениями:
1. В зависимости от задач социологического исследования социологу могут понадобиться инструменты как качественного, так и количественного анализа данных [30].
2. Создавать в рамках интеллектуальной системы типа ДСМ модуль количественного анализа данных нет необходимости, поскольку существуют специальные программные комплексы, специально предназначенные для статистической обработки информации. Особенно широкое распространение и популярность среди социологов прибрела программа SPPS [31].
3. Богатый эмпирический материал, уже накопленный социологами и сохраненный в SPSS-формате, может быть использован и для проведения качественных исследований при поддержке ДСМ-системы.
Для организации взаимодействия двух систем была использована ActiveX библиотека spsswin, входящая в состав SPSS и содержащая классы, необходимые для прямого доступа к любым данным в формате SPSS.
Для выполнения экспорта данных SPSS-файла в базу данных Socio Magic 1.0. были использованы следующие классы библиотеки spsswin:
1. ApplicationClass — класс для запуска приложения SPSS и открытия документа по имени файла.
2. IspssDocuments — класс для получения списка открытых документов в приложении SPSS.
3. IspssDataDoc - класс, который предоставляет доступ к выбранному документу из списка открытых документов и позволяет получить значения переменных, т.е. ответы респондентов на вопросы анкеты.
4. Ispsslnfo — класс для получения описания переменных.
Со стороны интеллектуальной системы за работу за работу с SPSS отвечает класс CExchange (Текст кода некоторых методов класса CExchange приведен в Приложении №2).
Правильная подготовка эмпирических данных (препроцессинг) к применению ДСМ-процедур позволит избежать возможного «комбинаторного взрыва», т.е. огромного числа порожденных гипотез в результате применения правил правдоподобного вывода 1-ого рода. На этапе
препроцессинга социологу предстоит решить, какие признаки из всего массива исходных .данных являются существенными для детерминации поведения. Также необходимо определить, нужно ли агрегировать первичные признаки в комплексные и, если нужно, то задать правила сворачивания для этих признаков. При этом все равно возможно проведение повторной подготовки данных и нового исследования до тех пор, пока социолог не добьется достаточного уровня формализации знаний для получения интерпретируемых результатов ДСМ-анализа.
Модуль подготовки данных интеллектуальной системы, описанный в параграфе 2.3.5., позволяет социологу создавать и сохранять различные варианты подготовленных данных для одного массива эмпирических данных и затем использовать каждый из вариантов подготовленных данных для проведения ДСМ-анализа.
Создание нового варианта подготовленных данных происходит путем операции копирования либо результатов опроса, либо результатов другого варианта подготовки данных, созданного ранее. Необходимо отметить, что даже в случае, когда социолог не предполагает каким-либо образом реструктурировать данные, необходимо создать новый вариант подготовки данных для проведения ДСМ-анализа. Это правило введено для того, чтобы сохранять эмпирические данные (результаты опроса) в исходном виде вне зависимости от возможных вариантов их подготовки к анализу. После того, как новый вариант подготовленных данных создан, мы можем произвести следующие процедур подготовки данных:
■ убрать «ненужные» (не детерминирующие поведение) признаки из числа рассматриваемых (операция «ограничение»);
■ свернуть первичные признаки в комплексные либо путем создания и применения правил сворачивания, либо с помощью атомарной функции оценки логики аргументации.
Копирование Сворачивание Ограничение
Рис.4
Благодаря тому, что подсистема позволяет создавать новый вариант подготовленных данных на основе созданного ранее варианта, можно повышать уровень формализации необходимое число раз. Во всех случаях сохраняется история изменений подготовленных данных. Это значит, что для любого варианта подготовленных данных можно извлечь всю информацию о том, на основе каких данных они были получены, какие операции были произведены и какие правила были заданы для каждой из операций.
В работе подообно описана организация хранения подготовленных данных в базе данных, классы .Ядра, обеспечивающие запись и чтение
подготовленных данных из базы данных, классы визуального интерфейса, обеспечивающие интерактивное взаимодействие с пользователем.
В параграфе 2.3.6 рассматривается модуль интеллектуальной системы, предназначенный для анализа рациональности мнений. -Модуль анализа рациональности представляет собой набор классов Ядра и Визуального интерфейса, который обеспечивает проведение анализа мнений по пяти критериям рациональности, представленным в Главе 1:
■ непротиворечивость мнений;
■ сходство с «идеальным мнением»;
■ согласованность мнений;
■ близость мнений;
■ однородность мнений.
На основе исходных данных (результаты опроса мнений) можно провести различные варианты анализа рациональности, отличающиеся критерием рациональности и выборкой (социальной общностью, к которой применяется критерий рациональности). На рисунке 5 представлена схема проведения анализа рациональности:
Рис. 5
Для каждого варианта анализа рациональности результаты проверки критерия рациональности для выделенной социальной общности сохраняются в базе данных. Это дает возможность сравнивать результаты проверки различных критериев рациональности для одной социальной общности.
В работе рассматриваются вопросы физической организации данных для модуля рациональности в базе данных, описываются классы Ядра и визуального интерфейса, отвечающие за работу модуля рациональности.
В параграфе 23,1. описывается визуальный интерфейс интеллектуальной системы анализа социологических данных, разработанный с учетом иерархии понятий предметной области. Это помогает без труда осуществлять навигацию по информационному пространству системы и
делает работу с системой интуитивно понятной даже начинающему пользователю. Визуальный интерфейс реализован в режиме однооконного документа (SDÏ), в котором на каждом этапе работы с проектом представлены только те операции, которые доступны в данный момент пользователю. Для разработки интерфейса использовались стандартные компоненты среды разработки Microsoft Visual Studio .NET 2003 и дополнительно набор визуальных компонент ComponentOne Studio 2.0, а именно TrueDBGrid, CIComboBox и др., которые в отличие от стандартных средств, идущих в поставке с Visual Studio, обладают более широкими и сложными функциональными возможностями, а также позволяют быстро интегрировать их в приложения.
В конце Главы 2 определены требования к аппаратному и программному обеспечению и описана процедура инсталляции разработанной интеллектуальной системы на компьютер пользователя.
Глава 3 целиком посвящена социологическому эксперименту, который был проведен автором с целью апробации методов качественного анализа социологических данных о рациональном поведении и тестирования некоторых компонент интеллектуальной системы. Исследование было проведено накануне выборов депутатов в Государственную Думу Российской Федерации четвертого созыва, состоявшихся 7 декабря 2003 г. Исследовались электоральные предпочтения студентов старших курсов Российского государственного гуманитарного университета. В подготовке социологической анкеты и проведении опроса принимали участие аспиранты и студенты старших курсов Факультета социологии РГГУ.
Структурирование данных в исходном массиве было реализовано по следующей схеме: описание респондента => мнение + выбор электорального поведения, т.е. С; =>i ([ф,], Т; ) . Описание респондента было осуществлено в соответствии с постулатом поведения (см., например [7]), который является основным принципом представления знаний в интеллектуальных системах типа ДСМ и формулируется следующим образом:
Пусть (SC) — множество характеристик, выражающих социальных характер, (IP) — множество характеристик, выражающих индивидуальные черты личности, a (BD) - характеристики, представляющие биографические данные о субъекте (отметим, что формулировка (SC) и (BD) зависит от выбранной темы Т*). Тогда будем утверждать, что поведение индивида детерминируется посредством С' = СУ и С3', где (C/sfSQJ&fCj'çiIP^&C C3'e(BD)) и найдется С,' sä0, i = 1,2,3.
Среди биографических данных рассматривались такие вопросы как образование, семья, материальное положение и т.п. Социальные характеристики включали в себя вопросы относительно общественно-политической активности студентов. Например, выяснялось, как часто респонденты читают политические статьи, смотрят политические передачи по телевидению, участвуют в общественно-политических мероприятиях и
т.д. С помощью психологических тестов выявлялись индивидуальные черты личности, такие как кооперация, связанная с вниманием человека к интересам других людей; вовлеченных в конфликт, доминантность, для которой характерен акцент на защите собственных интересов, социабельность, самодостаточность, степень самоконтроля.
Утверждения pi, ..., р„, характеризующие тему, представляли собой программные установки политических партий по таким вопросам, как «земля», «приватизация», «СМИ», «внешняя политика» и др. Приведем примеры:
P57: «Земля всецело должна быть в государственной собственности» (КПРФ) Pti: «Социальная рыночная экономика наиболее эффективна в условиях России» (Яблоко)
p6S: «Необходимо узаконить итоги приватизации» (СПС) pes: «Основная угроза России исходит от США» (ЛДПР) Мнение респондента формировалось из его ответов на предложенные вопросы, соответствующие утверждениям pi,..., р„, Ответы соответствовали оценкам из множества {1,—1,0, т}. Например:
?<Др57: «Согласны ли Вы с утверждением, что Земля всецело должна быть в государственной собственности?» (КПРФ)
1) Согласен (v = 1)
2) Пятьдесят на пятьдесят (v « 0)
3) Не согласен (v - -1)
4) Не знаю (v = т)
Выбор электорального поведения предполагал выбор одного из следующих ответов на вопрос «За какую партию Вы будете голосовать на выборах в Государственную Думу РФ?»: 1) за КПРФ», 2) за «Едииую Россию», 3) за ЛДПР, 4) за «Яблоко», 5) за «СПС», 6) за «Народную партию», 7) за другую партию, 8) против всех.
Формализованный качественный анализ электорального поведения в рассматриваемой модели состоял из следующих этапов:
1) порождение детерминант электорального поведения, представленного парой <мнение, действием, где мнение есть выбор программных установок (без указания в исходных данных их принадлежности к конкретной партии), а действие — выбор одной их шести заданных партий, или выбор какой-либо другой партии, или выбор намерения голосовать против всех, или отказ от участия в выборах;
2) предсказание электорального выбора 10% (из 231) опрошенных посредством порожденных детерминант (у этих 10% не был зафиксирован электоральный выбор) с последующей валидацней предсказаний посредством повторного опроса после голосования;
3) выяснение некоммутативности двух технологий опроса: 1) сначала респондент делал электоральный выбор, затем отвечал на вопросы по теме, 2) сначала - ответы на вопросы по теме, затем — электоральный
выбор. С этой целью массив опрашиваемых разбивался на две равновеликих части. 4) анализ рациональности выбора программных установок и электорального действия.
Анализ рациональности осуществлялся путем применения к полученным в результате опроса мнениям следующих критериев:
1. непротиворечивость мнений (в отдельности для /-ого респондента оценивалось, принадлежит ли его мнение ф,- множеству запрещенных максимальных конъюнкций Д; для сторонников партий (представляющих социальную общность, объединенную совпадающими электоральными установками) вычислялась функция &(Ф\ Д));
2. сходство с «идеальным мнением»;
3. согласованность мнений.
4. близость мнений;
5. однородность мнений.
В качестве элементов непротиворечивого множества логических зависимостей £ вида рассматривались логические связи между
относящимися к одним и тем же темам пунктами программ различных партий. Приведем пример:
р57 — земля всецело должна быть в государственной собственности; рл — продажа земли в частные руки должна быть строго ограниченной; р$1 — вопрос о формах хозяйствования на селе должен решаться самгоь крестьянами в зависимости от специфики региона;
ртз — земля может находиться как в государственной, так и в части* собственности;
Рм — земля должна постепенно приватизироваться, но при условии строго соблюдения законности;
ра® — необходима свободная без ограничений продажа земли.
На множестве вопросов {р$7( р$7, ра!, p^s, ри, рм} социологами были установлены следующие логические зависимости: Л]рэт —> ¿1р»а, Л]р37 —► Л|рм, Лрз? Лрв», -Лфл Л1Р5Т ^.¡Р75, А-фП-* ¿фм и т.Д.
Вычисление второго критерия потребовало задать для каждой представленной в опросе партии «идеальное мнение» идеального сторонника этой партии. В рассматриваемом нами эксперименте «идеальное мнение» политической партии отражало, фактически, ее основные программные положения. Так, исходя из программных установок КПРФ, идеальный сторонник этой партии должен обладать следующим мнением [ф] « {Уф^, «Лр7& Лр«. Л Рот, <ЛР37. Лрзд}» где:
р!7—земля всецело должна быть в государственной собственности;
р74— необходимо национализировать предприятия, приватизированные вопре
интересам общества;
рм — общественные формы собственности наилучшим образом подходят для России;
peo — необходимо ввести государственную монополию на товары стратегического назначения;
рв7 — нынешняя Конституция РФ отражает интересы узких групп населения; р$о — на сегодняшний день в нашей стране царит президентское самовластие.
Некоторые результаты анализа рациональности представлены в таблице:
Электоральный выбор Кол-во человек Степень непротиворсчивости мнений Степень сходства с «идеальным мнением» Степень согласованности мнений
ЛДПР S 0,2 0,371 0,4871
СПС 27 0,185 0.S93 0,4522
«Яблоко» 27 0,222 0.537 0.4224
КПРФ 5 0 0.7 0,4131
«Единая Россия» 21 0,095 0,68 0,393
«Народная партия» 6 0 0,278 0,249
Число респондентов, сделавших тот или иной электоральный выбор составило - 159 человек (из 231). Из них 91 респондент выбрал одну из предложенных партий, 1! человек отдали предпочтение другой партии (не представленной в списке), 57 человек ответили, что проголосуют на выборах против всех. Остальные респонденты либо отказались от ответа, либо принадлежат группе, для которой не фиксировался электоральный выбор с целью его последующего доопределения средствами ДСМ.
В Заключении сформулированы основные результаты диссертационной работы, а также определены перспективы дальнейшего развития интеллектуальной системы типа ДСМ для анализа социологических данных.
Диссертация сопровождается списком цитируемой литературы, включающим основные публикации автора по теме исследования. В Приложении 1 содержится полная физическая модель разработанной базы данных интеллектуальной системы; Приложение 2 содержит тексты кода некоторых классов интеллектуальной системы, написанные на языке С#.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
1. Созданная информационная среда интеллектуальной системы обеспечивает структурированное, надежное и безопасное хранение данных, полученных в ходе качественных социологических исследований, в единой базе данных, функционирующей под управлением серверной СУБД
2. Интеллектуальный интерфейс системы разработан с учетом иерархии понятий предметной области, что помогает пользователю без труда осуществлять навигацию по информационному пространству системы, и
2Í
делает работу с системой интуитивно понятной даже начинающему пользователю.
3. Встроенный в интеллектуальную систему модуль анализа рациональности мнений (как одного из видов поведения) позволяет применить трехкритериальных подход к изучению степени рациональности некоторой социальной группы:
a. Проверить мнения на непротиворечивость;
b. Оценить степень согласованности мнений;
c. Определить степень сходства мнений данной социальной группы с мнением «идеального» представителя этой группы.
4. Предложенная и реализованная в системе технология проведения дистанционного опроса позволяет не только использовать преимущества Интернет при проведении опроса, но и применять технологию опроса с аргументацией, которая есть средство выявления сознательного реагирования респондентов на опрос мнений, что является условием распознавания рационального поведения.
Подсистема интерактивного конструирования анкет позволяет разработать полноценную анкету, удовлетворяющую всем требованиям, предъявляемым ДСМ-методом к представлению данных. Анкета может быть использована для проведения как традиционного полевого, так и дистанционного опроса.
6. Создание подсистемы, предназначенной для подготовки первичных данных к применению ДСМ-процедур актуально и необходимо, поскольку данные, полученные непосредственно как ответы на предложенные вопросы анкеты, не всегда являются достаточно хорошо структурированными и интерпретируемыми, чтобы их можно было сразу использовать для информативного описания субъекта и его поведения. Поэтому эмпирические данные требуют специальной подготовки, в том числе применения правил сворачивания, с помощью которых возможно формирование из комбинаций некоторых частных признаков комплексных признаков, имеющих осмысленные интерпретации. Разработанная подсистема подготовки данных к эксперименту позволяет социологу задавать правила сворачивания в интерактивном режиме, не требуя при этом от социолога специальных знаний или навыков, и автоматически получать комплексные характеристики субъектов по заданным правилам.
7. Разработанный инструмент эффективного обмена данными между интеллектуальной системой и программой статистического анализа SPSS позволяет использовать эмпирический материал, сохраненный в SPSS-формате, для проведения качественного анализа данных
3, Архитектура, в которой выполнена интеллектуальная система, делают её легко расширяемой в смысле используемых методов анализа и легко масштабируемой в смысле применимости для решения практических задач разного объёма данных.
РЕЗУЛЬТАТЫ ИЗЛОЖЕНЫ В СЛЕДУЮЩИХ ПУБЛИКАЦИЯХ:
1. Бурковская Ж.И. Программная реализация аргументации в интеллектуальной системе типа ДСМ // VI Международная конференция «Информационное общество, Информационные ресурсы и технологии телекоммуникации», Москва, 16-18 октября 2002 г., Материалы конф. -М., 2002. - С.447-450.
2. Финн В .К., Михеенкова М.А., Бурковская Ж.И. О логических принципах анализа электорального поведения // НТИ, Сер. 2, - 2004. - № 8. - С. 1822.
3. Бурковская Ж.И. О развитии интеллектуальных систем для анализа социологических данных И 9-ая национальная конференция по искусственному интеллекту с международным участием КИИ - 2004 (28 сентября - 2 октября 2004 г„ Тверь): Труды конф. В 3-х т. - М.: Физмат, 2004. - Т. 1, -С.112-119,
4. Бурковская Ж.И., Михеенхова М.А., Финн В.К. Об интеллектуальной системе анализа электорального поведения // 9-ая национальная конференция по искусственному интеллекту с международным участием КИИ - 2004 (28 сентября - 2 октября 2004 г., Тверь): Труды конф. В 3-х т. -М.: Физмат, 2004.-Т. 1.-С.120-128.
5. Бурковская Ж.И. Архитектура интеллектуальной системы типа ДСМ для формализованного качественного анализа социологических данных ft НТИ, Сер, 2. - 2007. - № 1. /в печати/
ЛИТЕРАТУРА
1. Блинова В .Г., Ивашко В.Г., Скитер П.В., Финн В.К., Хазановский К.П. Об интеллектуальных системах типа ДСМ. // Семиотика и информатика. -1990. -Вып 31.-С. 41-69.
2. Finn V.K., Mikheenkova М.А. On the application of JSM-method of automatic hypothesis generation in sociological investigations // Artificial Intelligence News.- 1993.-P 91-98.
3. Финн B.K, Правдоподобные выводы и правдоподобные рассуждения It Итоги науки и техники. Сер. «Теория вероятностей. Математическая статистика. Теоретическая кибернетика» - 1988. - Т. 28. - С. 3-84.
4. Финн В.К. Правдоподобные рассуждения в интеллектуальных системах типа ДСМ//Итоги науки и техники. Сер. «Информатика». - 1991. - Т. 15. -С. 54-101.
5. Финн В.К. Синтез познавательных процедур и проблема индукции // НТИ. Сер. 2. - 1999.Я-С. 8-45.
6. Финн В.К. Об особенностях ДСМ-метода как средства интеллектуального анализа данных//НТИ. Сер. 2.-2001,-№5.-с. 1-4.
7. Финн В.К., Михеенкова М.А. О логических средствах концептуализации анализа мнений // НШ. Сер. 2. - 2002. - № б. - С. 4-22.
8. Данилова E.H., Михеенкова М.Л., Климова С.Г. Возможности применения логико-комбинаторных методов для анализа социальной информации // Социология: 4M.- 1999.-Ха 11.-С. 142-160.
9- Климова С.Г., Михеенкова М.А., Панкратов Д.В. ДСМ-метод как метод выявления детерминант социального поведения // НТО. Сер. 2. - 1999. -№12.-С. 3-14.
10. Финн В.К., Михеенкова М.А., Бурковская Ж.И. О логических принципах анализа электорального поведения // НТИ, Сер. 2. - 2004. - №> 8. - С. 1822.
И.Михеенкова М.А., Финн В.К. Логические средства формализации закрытых опросов и проблемы распознавания рациональности мнений // Материалы Всероссийской научной конф. «Сороютские чтения — 2004: Российское общество и вызовы глобализации» (7-8 декабря 2004 г., Москва) - М: МАКС Пресс. - 2005. -Вып.7. - С. 127 - 135.
12. Финн В.К. Об интеллектуальном анализе данных // Новости искусственного интеллекта. - 2004, — №3. — С. 2—18.
13. Панкратов Д.В. Логические и программные средства качественного анализа социологических данных // Автореферат диссертации на соискание ученой степени кандидата технических наук. М: ВИНИТИ. -2001.
14. Ядов В.А. Стратегия социологического исследования. Описание, объяснение, понимание социальной реальности. - б-е изд. - М.: ИКЦ «Академкнига»; «Добросвег». — 2003.
15. Финн В.К., Михеенкова М.А. О логических средствах концептуализации анализа мнений // НТИ. Сер. 2. - 2002. -J& 6. - С. 4-22.
16.Девятко И,Ф. Социологические теории деятельности и практической рациональности. М.: Аванти-плтос - 2003.
17. Финн В.К. Об одном варианте логики аргументации// НТИ. Сер. 2. - 1996. -iß 5-6. - С, 3-19,
18.Гусакова С.М., МихеенковаМ.А,, ФиннВ.К. О логических средствах анализа мнений // НТИ. Сер. 2. - 2001. - № 5. - С. 4-22.
ig.LuhmannN. öffentliche Meinung. Politishe Planung, Aufsätd zur Soziologie von Politik und Vervaltung. — Opladen. — 1971.
20. Швырев B.C. Рациональность в современной культуре // Общественные науки и современность. — 1997. — Jfe 1.
21. Панкратов Д.В. О некоторых модификациях логики аргументации. - НТИ. Сер. 2. —1998. — №4.
22. Поппер К. Логика социальных наук // Эволюционная эпистемология и логика социальных наук. — М.: Эдиториал УРСС, 2000,
23. Финн В.К., Михеенкова MjV. О ситуационном расширении ДСМ-метода автоматического порождения гипотез // НТИ. Сер. 2, — 2000. — № 11. — с. 20-30.
24. Роджерсон Д. Основы СОМ. М.: «Русская редакция». - 2000.
25. Троелсен Э, С# и платформа .Net. Библиотека программиста — СПб.: Питер, 2002,
26. Codd E.F. Normalized Data Base Structure: A Brief Tutorial // Proc. of 1971 ACM-SIGFIDET Workshop on Data Description, Access and Control. - N.-Y,: ACM.-1971.-P.l-17.
27. Дейт К. Введение в системы баз данных. - М.: Наука, 1980.
28. Chen P. P.-S. The entity-Relationship Model - Toward a Unified View of Data // ACM TODS. - 1976. - № 1.
29. Проектирование и реализация баз данных Microsoft SQL Server 2000, Учебный курс MCSE/Пер. с англ. - М.: Издательско-торговый дом «Русская редакция». - 2001.
30. Толстова Ю.Н. «Дух» математики как основа научного социологического исследования // Математическое моделирование социальных процессов. -Вып. 7.-М.: МАКС Пресс. - 2005. - С. 6 - 27.
31.Крыштановский А.О. Анализ социологических данных // М.: Изд. Дом ГУ-ВШЭ. - 2006.
Оглавление автор диссертации — кандидата технических наук Бурковская, Жанна Ивановна
Введение.
Глава 1. Логические и алгоритмические средства изучения рациональности мнений.
§1.1.0 логических принципах распознавания рациональности мнений.
§1.2. Алгоритмическая реализация критериев анализа рациональности мнений.
Глава 2. Разработка интеллектуальной системы типа ДСМ для анализа социологических данных.
§2.1. Определение назначения и функциональности системы.
§2.2. Проектирование архитектуры системы.
§2.3. Выбор средств разработки.
§2.4. Создание базы данных.
§2.5. Разработка Ядра.
§2.6. Организация взаимодействия с ДСМ-Решателем.
§2.7. Разработка модуля дистанционного опроса.
§2.8. Организация взаимодействия с пакетом программ статистической обработки данных SPSS.
§2.9. Разработка модуля подготовки данных.
§2.10. Разработка модуля анализа рациональности мнений.
§2.11. Проектирование и реализация Интеллектуального интерфейса.
§2.12. Требования к аппаратному и программному обеспечению.
§2.13. Описание средств установки и деинсталляции системы.
Глава 3. Проведение эксперимента для апробации логических и программных средств качественного анализа мнений.
§3.1. Эмпирическая база и процедуры эксперимента.
§3.2. Результаты эксперимента.
Введение 2006 год, диссертация по документальной информации, Бурковская, Жанна Ивановна
В 2005 г. исследовательская группа ЦИРКОН, Всероссийский центр изучения общественного мнения (ВЦИОМ) и Ассоциация региональных социологических центров Группа «7/89» представили результаты проекта «Социологическая деятельность в России: осведомленность и отношение населения» [18]. Исследование показало, что в последние годы население России очень активно участвует в опросах общественного мнения и, что интересно, выражает к ним свой интерес и доверие, считая опросы необходимыми и отражающими мнение народа.
Действительно, на российском рынке исследований в настоящее время действует около пятисот организаций, проводящих порядка пяти-семи тысяч исследований ежегодно. Самым востребованным и наиболее распространенным видом исследований в России остаются социально-политические исследования. Их количество особенно возрастает в предвыборный период, когда на основе массовых опросов делаются всевозможные электоральные прогнозы и составляются рейтинги политических партий. Традиционно для анализа мнений используются статистические методы, которые, безусловно, с учетом определенной степени погрешности позволяют говорить об определенных тенденциях в обществе и давать числовую оценку изучаемым явлениям. Именно такие исследования обычно широко публикуются и обсуждаются в средствах массовой информации.
Опытный социолог всегда осознает ограничения количественных методов. Во-первых, адекватность ответов испытуемых зависит от многих факторов, как например: логическая и содержательная непротиворечивость концептуальной схемы развернутой в вопросах анкеты; совпадение тезауруса анкеты и испытуемого; адекватность предложенных исследователем ответов представлениям респондента; актуальность проблематики для испытуемого; эмоциональное состояние испытуемого в момент опроса.
Во-вторых, количественные методы опираются на представление об обществе как системной целостности, в которой роль основополагающих структур играют большие социальные группы. Такое макросоциологическое познание не дает исчерпывающего понимания поведения конкретных людей, их малых групп, коллективов, локальных сообществ и иных микросоциумов. Поведение микросоциумов в некоторой степени рассматривается как система случайных событий, а социальные группы формируются на основе неформальных характеристик. В-третьих, количественные методы выявляют скорее корреляционные связи, а не причинно-следственные зависимости. В-четвертых, выделение совокупности признаков, формирующих пространство детерминации поведенческих готовностей, соответствующих тому или иному социальному типу, как правило, осуществляется лишь на основе интуиции социолога. И, наконец, в-пятых, обычно статистические методы не учитывают явным образом влияние ситуации на результаты опроса, хотя еще К.Р. Поппер в [15] характеризовал логику социальных наук как ситуационную.
Возможность преодолеть указанные ограничения предоставляет ДСМ-метод автоматического порождения гипотез (ДСМ-метод АПГ) [23-26, 30, 40]. Этот метод - синтез индукции, аналогии и абдукции [37], - осуществляет порождение гипотез и их принятие на достаточном основании, а также способствует кластеризации эмпирических данных, формированию понятий и эмпирических теорий, учитывающих и обобщающих экспериментальный материал. Неформально метод может быть представлен в виде последовательной схемы рассуждений: на основе анализа сходства явлений ищется причина этих явлений (индукция), которая в дальнейшем может использоваться при прогнозировании новых явлений на основе структурной аналогии; на третьем шаге рассуждения применяется абдукция для объяснения начального состояния исходных данных. 4
Применение ДСМ-метода АПГ предъявляет определенные требования к изучаемой предметной области:
1. Знания о предметной области должны быть слабо формализованы, а данные хорошо структурированы, что означает: a) неполноту описания предметной области и возможность лишь частичной ее аксиоматизации; b) определимость сходства объектов как алгебраической операции.
2. Предметная область, описание которой представлено в начальном состоянии базы данных (базе фактов), должна содержать позитивные примеры исследуемого явления («+»-примеры), негативные примеры («-»-примеры) и примеры неопределенности («т»-примеры). Фактоподобным высказыванием является утверждение вида «объект X обладает множеством свойств У». Факт есть фактоподобное высказывание с оценкой, состоящей из типа истинностного значения («фактически истинно», «фактически ложно», «фактически противоречиво», «неопределенно») и номера шага применения правил правдоподобного вывода, который для факта равен нулю.
3. В базе фактов в неявном виде содержатся зависимости причинно-следственного типа: «+»-причины, вызывающие наличие свойств, и «-»-причины, вызывающие отсутствие множества свойств.
Правила правдоподобного вывода первого рода, порождающие гипотезы о причинах, формулируются с помощью специальных предикатов М+ и МГ, где М+ суть условия обнаружения сходства для «+»~примеров, a ]VT - условия обнаружения сходства для «-»-примеров. Правила правдоподобного вывода первого рода на основе отношения «обладать», представленного в базе данных предикатом «объект X обладает множеством свойств Г», порождают новое отношение «причина», представленное в базе знаний посредством предиката «подобъект X есть причина множества свойств Г». Порождаемые гипотезы о причинах образуют фрагмент базы знаний. Этот фрагмент затем используется для применения правил правдоподобного вывода второго рода, результатом применения которых являются гипотезы вида «объект С имеет множество свойств А» с одним из четырех типов истинностных значений «фактически истинно», «фактически ложно», «фактически противоречиво», «неопределенно» и соответствующим номером шага применения правил. Номер шага выражает степень правдоподобия гипотезы (чем больше номер шага, тем меньше правдоподобие гипотезы). Правила правдоподобного вывода второго рода суть выводы по аналогии. На третьем этапе ДСМ-рассуждения применяется критерий достаточного основания принятия гипотез, в результате которого гипотезы либо принимаются на достаточном основании, либо (в случае невыполнения критерия) требуется расширить исходную базу фактов и снова провести ДСМ-рассуждение.
Возможность применения ДСМ-метода в социологии опирается на представление о социальных системах (включая социального субъекта) как системах с детерминированными многофакторными (+,-)-влияниями (когда факты являются сильно зависимыми и не образуют системы случайных событий)1, в которых, однако, возможны случайные возмущения. Наиболее существенные и устойчивые влияния воспринимаются как причины тех или иных социальных явлений. В социальной психологии и социологии одним из подходов, позволяющим изучать социальную действительность именно с таких позиций, является диспозиционная теория регуляции социального поведения личности [19]. Согласно этой теории социальное поведение субъекта детерминировано иерархической системой его предрасположенностей (диспозиций) к определенному восприятию условий деятельности и реагированию на социальную ситуацию в протяженном и кратком временном континууме. Эту функцию выполняют система ценностей и обобщенные и ситуативные установки личности.
1 (+)-влияния - это те, которые способствуют возникновению или развитию события, (-)-влияния которые препятствуют возникновению или развитию события.
- это те,
Есть еще ряд особенностей ДСМ-метода АПГ, который позволяет считать его адекватным формальным аппаратом для качественного анализа данных в социологии (см., например, [32]).
ДСМ-метод АПГ может применяться для решения следующих социологических задач:
1. выявление детерминант и прогнозирование социального поведения;
2. выявление детерминант и прогнозирование мнений;
3. распознавание рациональности мнений.
В первом случае используется так называемый «прямой ДСМ-метод», устанавливающий причинно-следственную зависимость типа «сходство субъектов поведения влечет сходство поведений (готовности к действиям)». Применение прямого ДСМ-метода основано на предположении о том, что информативность характеризации субъекта поведения превосходит информативность данных о его поведении. В этой модели для представления исходных фактов используется бинарный предикат X=>]Y, означающий «субъект X обладает множеством свойств (поведенческих готовностей Y». Отношение формируется на основе экспертного анализа ответов респондентов на вопросы анкеты. Структурное описание респондента осуществляется в соответствии с «постулатом поведения» (см., например, [32]). Это означает, что в описании субъекта поведения должны быть представлены социальные характеристики личности, индивидуальные черты личности и биографические данные. При этом это должны быть социально значимые, взаимоисключающие, независимые друг от друга признаки, в отношении которых предполагается, что они будут влиять на поведение людей в определенной ситуации. В работах [4, 5, 8, 11] систематически представлены логические и программные средства интеллектуальных систем типа ДСМ для порождения детерминант социального поведения, а также рассмотрены кластеризация данных посредством этих детерминант и социологическая интерпретация полученных результатов.
Для качественного исследования мнений и прогнозирования электорального поведения в [3] был предложен другой вариант ДСМ-метода, названный «обратным», посредством которого устанавливается зависимость между характеризациями мнений и представлением знаний о субъекте типа «сходство мнений есть следствие сходства субъектов». Обратный ДСМ-метод использует другое предположение, состоящее в том, что информативность характеризации мнений превосходит информативность представления знаний о субъекте. Здесь для представления исходных данных используется предикат X=>iY, выражающий, что «субъект X имеет мнение 7». Описание субъекта также должно быть сформировано на основе постулата поведения, а мнение представляется как ответы на вопросы по соответствующей теме опроса. Содержание темы (т.е. ответы на вопросы) является концептуализацией выяснения мнения и предполагает наличие аргументации у респондента, обладающего соответствующей точкой зрения. Однако при обычной технологии проведения опроса, когда респонденту на каждый из вопросов предлагается уже готовый список ответов, результаты опроса будут зависеть от множества факторов и совсем не обязательно полученные ответы будут аргументированными. Для выявления рациональных (аргументированных мнений) была предложена новая технология формирования мнений на основе функции выбора и атомарной функции оценки логики аргументации.
Кратко, идея новой технологии опроса состоит в том, что вместо вопросов, раскрывающих некоторую тему Т* (например, «отношение к частной собственности», «отношение к свободе слова» и т.п.), респонденту предлагается множество утверждений Р относительно этой темы и аргументационная база А - множество аргументов и контраргументов относительно принятия или непринятия утверждений из Р. Задаются две функции выбора: g+: Р -> 2Л и g": Р —» 2А. Для оценивания каждого утверждения из Р респондент выбирает из А аргументы «за» или аргументы против» данного утверждения. Предполагается, что при таком оценивании 8 утверждений, респондент вынужден действовать более или менее обдуманно, т.е. проявлять то, что B.C. Швырев в [35] называет «специальными усилиями сознания». Используя атомарную функцию оценки логики аргументации А4 [27] или Аб [13], можно автоматически получить оценку для каждого высказывания из Р. Максимальная конъюнкция таких оценок и будет мнением у'-го респондента фу. Описанная функция выбора представляет собой аппарат принятия решений.
Для изучения рационального мнения мы можем включить в описание у'-го респондента Sbty наряду с его дифференциальными признаками (характеристиками) Су также его аргументационные функции, т.е. Sbt, = <C,,<g/,g/». Будем рассматривать отношение «описание субъекта - мнение субъекта». Применяя ДСМ-метод (прямой или обратный), мы порождаем детерминанты мнений, которые в дальнейшем используются для прогнозирования мнений, а также служат основанием для построения модели структуры изучаемого социума. Рациональное мнение имеет место, если g+ Г) gf = 0. Аргументационная база может задаваться исследователем и рассматриваться как общая для всех респондентов, а может быть своей для каждого респондента. Во втором случае аргументационная база должна включаться в описание субъекта <C7,<A/,g/,gjT». В еще более сложном случае субъекту может быть предоставлена возможность пополнять каркас утверждений Р, если, по его мнению, он раскрывает тему недостаточно. Если система аргументов А полна, каркас темы раскрывает ее содержание и мнение субъекта рационально, оно определяется его аргументационными функциями g/, g/, g/ = {g/(p,),., g/(pn)}, a = {+, -}. Подчеркнем, что абсолютно рациональное поведение реализуется лишь как идеальный тип поведения в смысле М. Вебера [2]. В реальности, индивид демонстрирует те или иные отклонения от идеального типа поведения.
Существенным усилением логических средств анализа поведения и мнений является введение представления данных о ситуациях [29]. То есть вместо отношений «субъект => поведение» и «субъект => мнение» 9 рассматриваются отношения («субъект, ситуация> => поведение» и отношения «<субъект, ситуация> мнение», соответственно. Введение параметра ситуации влечет изменение постулата поведения: условием детерминации поведения, помимо социальных характеристик субъекта, индивидуальных черт личности и биографических данных, также является характеристики ситуации. Для представления ситуаций в [31] предложено использовать булевскую структуру данных, хотя возможно применение, например, кортежной или реляционной структуры. Естественным образом должны переформулироваться решающие предикаты для правил правдоподобного вывода.
Третьим важным видом исследований, проведению которых также способствует ДСМ-метод АПГ, является анализ рациональности полученных в результате опроса мнений (как одного из видов поведения) [12]. Выявление респондентов, не распознающих противоречия, определение степени «понимания» темы респондентами, а также степени «близости» мнений в электоральной группе, например, среди сторонников одной партии - все это поможет социологу правильно проинтерпретировать результаты качественного исследования.
Для извлечения знаний из обширного эмпирического материала средствами ДСМ-метода АПГ требуется применение вычислительных процедур значительной алгоритмической сложности, а значит необходимо применение интеллектуальных систем, реализующих процедуры машинного обучения. Интеллектуальная система типа ДСМ представляет собой интерактивную систему, в которой на базе развитого логико-математического обеспечения, реализующего ДСМ-метод АПГ, осуществляется интеллектуальный анализ данных из БД с неполной информацией. Архитектура и принципы построения интеллектуальной системы типа ДСМ описаны во многих работах, например в [28, 29]. Напомним, лишь основные моменты. Интеллектуальные системы имеют следующую архитектуру: Решатель + Информационная среда + Интеллектуальный интерфейс. В Решателе осуществляется формализованная эвристика - извлечение закономерностей из базы данных посредством ДСМ-рассуждения, которое есть синтез трех познавательных процедур: индукции, аналогии и абдукции. Информационная среда представляет собой базу фактов (БФ) и базу знаний (БЗ), а Интеллектуальный интерфейс отвечает за диалог между пользователем и машиной, представление результатов исследования и научение пользователя работе с системой.
В настоящей работе мы будем понимать термин «Информационная среда» шире, нежели просто база фактов и база знаний. Информационная среда есть активная оболочка интеллектуальной системы, которая обеспечивает функционирование всех компонентов системы как единого целого, в том числе организует и упорядочивает процессы взаимодействия пользователей с ДСМ-Решателем, базой данных и остальными подсистемами; осуществляет надежное и безопасное хранение данных и управление этими данными; предоставляет дополнительные возможности пользователям на всех этапах проведения исследования для того, чтобы они могли построить работу с системой максимально эффективно и в соответствии с существующими технологиями качественного анализа данных.
Решатель, как компонент интеллектуальной системы, уже был реализован и описан ранее А.В. Путриным и Д.В. Панкратовым [14]. Следуя идее, что интеллектуальная система типа ДСМ должна быть способна к самообучению, в Решателе было выделено две основных части:
Learner реализует все пересечения (глобальные сходства) объектов и применяет правила первого рода;
Solver на основе порожденной Leaner базы знаний применяет правила второго рода и доопределяет объекты, порождая тем самым новое состояние, на котором может вновь работать Learner.
Достоинством созданного Решателя является то, что он не зависит от конкретной предметной области, поскольку все алгоритмы реализуются в общем виде, а настройка на предметную область происходит в другом модуле системы (в настоящий момент один и тот же Решатель используется для анализа химических и социологических данных). Также в Решателе реализованы алгоритмы для двух расширений ДСМ-метода: обратного и ситуационного.
Правильность работы Решателя была проверена экспериментально на реальных социологических данных, а именно:
1. На результатах опроса рабочих завода «Арсенал» в Санкт-Петербурге и завода трактортных гидроагрегатов в Ельце (ЕЗТА). Для анализа был рассмотрен частный случай социального поведения - коллективное поведение рабочих в ситуации забастовки (см., например, [4]).
2. На результатах опроса студентов старших курсов Российского государственного гуманитарного университета на тему электоральных предпочтений накануне выборов в Государственную Думу РФ 04 декабря 2004 г. [33].
Для тестирования Решателя на массиве социологических данных было создано программное приложение, осуществляющее настройку абстрактного
ДСМ-Решателя на предметную область социологических исследования, а также отвечающее за управление процессом загрузки эмпирических данных из файла данных, настройку параметров Решателя и отображение порожденных гипотез и прогнозов посредством визуального интерфейса.
Подготовка «сырых» анкетных данных к ДСМ-анализу осуществлялась средствами отдельного программного модуля, использование которого, однако, было весьма трудоемко и предполагало знание специального языка для определения правил построения агрегированных характеристик субъекта поведения из исходных характеристик («правил сворачивания») [14]. Все это позволяло проводить ДСМ-анализ социологических данных в экспериментальном режиме, однако было недостаточно для практического
12 применения ДСМ-метода в социологии. Разработанные программные средства скорее представлялись как инструмент, призванный выполнять сложные вычислительные процедуры, нежели предоставляющий комплексную автоматизированную поддержку при проведении качественного социологического исследования. Эти программные средства позволяют проводить ДСМ-анализ социологических данных в экспериментальном режиме. Однако неорганизованное и ненадежное хранение информации в несвязанных файлах данных разного формата, невозможность многопользовательской работы с одними и теми же данными, отсутствие удобных средств разработки инструментария и подготовки данных, а также средств распознавания и изучения рациональности мнений -все это делает существующие программные средства недостаточными для формализованного качественного анализа социологических данных в реальных условиях.
Необходимость внедрения средств формализованного качественного анализа данных в практику профессиональных социологов потребовало создания интеллектуальной системы типа ДСМ как единства трех составляющих: Решателя, Информационной среды и Интеллектуального интерфейса.
Целью диссертационного исследования являлось создание интеллектуальной системы типа ДСМ для формализованного качественного анализа социологических данных (в том числе для анализа рациональности мнений) как полноценного самостоятельного автоматизированного рабочего места эксперта-социолога, которое позволит проводить качественные социологические исследования (выявление детерминант и прогнозирование поведения или мнений) с использованием различных стратегий ДСМ-метода АПГ и осуществлять анализ рациональности мнений респондентов. Информационная среда интеллектуальной системы должна обеспечить совместную работу всех компонент системы, объединить данные, полученные в ходе качественных социологических исследований, обеспечить их надежное и структурированное хранение; повысить эффективность работы социолога на всех этапах проведения исследования. Создание развитого Интеллектуального интерфейса системы позволит осуществлять комфортную навигацию пользователя по Информационной среде и интерактивное взаимодействие пользователя с системой.
Для достижения указанной цели были поставлены и решены следующие основные задачи:
1. Определение назначения интеллектуальной системы анализа социологических и предъявляемых к ней требований, в том числе функциональных возможностей.
2. Проектирование и реализация многоуровневой клиент-серверной архитектуры интеллектуальной системы, которая позволит обеспечить такие требования как надежность, безопасность работы с данными, масштабируемость и гибкость.
3. Выбор средств программной разработки интеллектуальной системы.
4. Проектирование логической модели базы данных для хранения информации о проведении качественных социологических исследований.
5. Выбор системы управления базами данных (СУБД) и реализация спроектированной базы данных на физическом уровне.
6. Проектирование и реализация Интеллектуального интерфейса системы.
7. Создание подсистемы, отвечающей за интерактивную разработку анкеты как инструмента проведения опроса.
8. Программная реализация поддержки двух различных технологий проведения опроса мнений: традиционной технологии, когда пользователь отвечает на вопросы по некоторой теме Т*, выбирая один из предложенных вариантов ответа; технологии с использованием функции выбора аргументов и контраргументов и атомарной функции оценки логики аргументации.
9. Разработка программного модуля дистанционного проведения опроса посредством Интернет-технологий.
10.Разработка алгоритмических и программных средств анализа рациональности мнений и включение программного модуля в архитектуру интеллектуальной системы.
11.Организация взаимодействия интеллектуальной системы с программой статистической обработки данных SPSS (Statistic Programs for Social Sciences - популярная программа статистического анализа). 12.Создание подсистемы, предназначенной для подготовки исходных данных к применению ДСМ-процедур. 13.Организация взаимодействия ДСМ-Решателя и остальных компонент интеллектуальной системы. 14.Создание программы-инсталлятора для быстрой и удобной установки и деинсталляции системы.
Актуальность работы обусловлена необходимостью внедрения в практику профессиональных социологов формализованных методов качественного анализа социологических данных [36] и новых технологий распознавания и изучения рациональности мнений, что возможно только с применением развитой интеллектуальной системы типа ДСМ, позволяющей проводить социологические исследования на реальных объемах данных и в реальных условиях.
Следующие особенности работы определяют ее научную новизну:
1. Разработана интеллектуальная система типа ДСМ для формализованного качественного анализа социологических данных.
2. Предложены и программно реализованы различные инструменты формирования исходной базы фактов.
15
3. Программно реализован новый подход к проведению закрытых опросов общественного мнения: формирование мнений с помощью аргументационного оценивания.
4. Разработаны алгоритмические и программные средства анализа рациональности мнений, модуль изучения рациональности включен в архитектуру интеллектуальной системы анализа социологических данных.
Практическая значимость работы заключается в следующем:
1. Система обеспечивает надежное и безопасное хранение и обработку социологической информации в едином информационном пространстве.
2. Система автоматизирует значительную часть работы социологов на различных этапах проведения качественного исследования социологических данных о рациональном поведении.
3. Система обеспечивает планирование и управления исследовательскими проектами.
4. Разработанный инструмент эффективного обмена данными между интеллектуальной системой и программой статистического анализа SPSS позволяет использовать эмпирический материал, сохраненный в SPSS-формате, для проведения качественного анализа данных.
5. Реализованный в интеллектуальной системе трехкритериальный подход к анализу рациональности мнений (как одного из видов поведения) представляет собой новый инструмент изучения поведения и образования социальных групп.
6. Предложенная и реализованная технология проведения дистанционного опроса позволяет не только использовать преимущества Интернета при проведении опроса, но и применять технологию опроса с аргументацией, которая есть средство выявления сознательного реагирования респондентов на опрос мнений, что является условием распознавания рациональных мнений.
7. Созданный программный продукт является отчуждаемым, а значит, может быть внедрен в научной или учебной организации для проведения качественных социологических исследований и демонстрации возможностей применения ДСМ метода АПГ.
Адекватность работы разработанной системы была проверена экспериментально на реальных социологических данных.
Кратко изложим содержание глав диссертационной работы.
Заключение диссертация на тему "Создание информационной среды для интеллектуальной системы анализа социологических данных"
Основные результаты работы
1. Созданная информационная среда интеллектуальной системы обеспечивает структурированное, надежное и безопасное хранение данных, полученных в ходе качественных социологических исследований, в единой базе данных, функционирующей под управлением серверной СУБД.
2. Интеллектуальный интерфейс системы разработан с учетом иерархии понятий предметной области, что помогает пользователю без труда осуществлять навигацию по информационному пространству системы, и делает работу с системой интуитивно понятной даже начинающему пользователю.
3. Встроенный в интеллектуальную систему модуль анализа рациональности мнений (как одного из видов поведения) позволяет применить различные критерии рациональности к изучению мнений некоторой социальной общности, а именно: a. проверить мнения на непротиворечивость; b. определить степень согласованности мнений; c. определить степень сходства мнений данной социальной группы с мнением «идеального» представителя этой группы; d. определить степень близости мнений; e. определить степень согласованности мнений.
4. Предложенная и реализованная в системе технология проведения дистанционного опроса позволяет не только использовать преимущества Интернета при проведении опроса, но и применять технологию опроса с аргументацией, которая есть средство выявления сознательного реагирования респондентов на опрос мнений, что является условием распознавания рациональных мнений.
5. Подсистема интерактивного конструирования анкет позволяет разработать полноценную анкету, удовлетворяющую всем требованиям, предъявляемым ДСМ-методом к представлению данных. Анкета может быть использована для проведения как традиционного полевого, так и дистанционного опроса.
6. Создание подсистемы, предназначенной для подготовки первичных данных к применению ДСМ-процедур актуально и необходимо, поскольку данные, полученные непосредственно как ответы на предложенные вопросы анкеты, не всегда являются достаточно хорошо структурированными и интерпретируемыми, чтобы их можно было сразу использовать для информативного описания субъекта и его поведения. Поэтому эмпирические данные требуют специальной подготовки, в том числе применения правил сворачивания, с помощью которых возможно формирование из комбинаций некоторых частных признаков комплексных признаков, имеющих осмысленные интерпретации. Разработанная подсистема подготовки данных к эксперименту позволяет социологу задавать правила сворачивания в интерактивном режиме, не требуя при этом от социолога специальных знаний или навыков, и автоматически получать комплексные характеристики субъектов по заданным правилам.
7. Разработанный инструмент эффективного обмена данными между интеллектуальной системой и программой статистического анализа SPSS позволяет использовать эмпирический материал, сохраненный в SPSS-формате, для проведения качественного анализа данных
8. Архитектура, в которой выполнена интеллектуальная система, делает её легко расширяемой в смысле используемых методов анализа и легко масштабируемой в смысле применимости для решения практических задач разного объёма данных.
9. Проведены эксперименты, подтверждающие адекватность созданных алгоритмических и программных средств задачам качественного анализа социологических данных о рациональности мнений.
10. Предложены основные направления развития интеллектуальной системы для анализа социологических данных.
1. Блинова В.Г., Ивашко В.Г., Скитер П.В., Финн В.К., Хазановский К.П. Об интеллектуальных системах типа ДСМ. // Семиотика и информатика. -1990. -Вып 31. -С. 41-69.
2. ВеберМ. Основные понятия социологии // ВеберМ. Избранные произведения. -М: Прогресс, 1990.
3. Гусакова С.М., Михеенкова М.А., ФиннВ.К. О логических средствах автоматизированного анализа мнений // НТИ. Сер. 2. - 2001. - №5. -с. 4-24.
4. Данилова Е.Н., Михеенкова М.А., Климова С.Г. Возможности применения логико-комбинаторных методов для анализа социальной информации // Социология: 4М. - 1999.-№ 11.-с. 142-160.
5. Данилова Е.Н., Михеенкова М.А., Московский С.С., Финн В.К. Об одной модели детерминации социального поведения. // VI Национальная конференция с международным участием «Искусственный интеллект-98», Пущино, Октябрь 5-11, 1998, Труды конференции в 3 томах, т. 2, с.617-625.
6. Девятко И.Ф. Социологические теории деятельности и практической рациональности. М.: Аванти-плюс, 2003.
7. Дейт К. Введение в системы баз данных. - М.: Наука, 1980.
8. Климова С.Г., Михеенкова М.А., Панкратов Д.В. ДСМ-метод как метод выявления детерминант социального поведения // НТИ. Сер. 2. - 1999. -№ 12.-с. 3-14.
9. Крыштановский А.О. Анализ социологических данных // М.: Изд. Дом ГУ-ВШЭ. - 2006.
10. Михеенкова М.А. «Об экспертных системах типа ДСМ», НТИ, сер.2, 1987, №9, с.23-31.
11. Михеенкова М.А. Развитие ДСМ-метода автоматического порождения гипотез для его применения при анализе социологических данных типа субъект => поведение» // Автореферат диссертации на соискание ученой степени кандидата технических наук. М.: ВИНИТИ. - 1998.
12. Михеенкова М.А., Финн В.К. Логические средства формализации закрытых опросов и проблемы распознавания рациональности мнений // Материалы Всероссийской научной конф. «Сорокинские чтения - 2004: Российское общество и вызовы глобализации» (7-8 декабря 2004 г., Москва) - М: МАКС Пресс. - 2005. - Вып.7. - С. 127 - 135.
13. Панкратов Д.В. О некоторых модификациях логики аргументации. - НТИ. Сер. 2.- 1998.-№4.
14. Панкратов Д.В. Логические и программные средства качественного анализа социологических данных // Автореферат диссертации на соискание ученой степени кандидата технических наук. М.: ВИНИТИ. -2001.
15.Поппер К. Логика социальных наук // Эволюционная эпистемология и логика социальных наук. - М.: Эдиториал УРСС, 2000.
16. Проектирование и реализация баз данных Microsoft SQL Server 2000. Учебный курс MCSE/Пер. с англ. - М.: Издательско-торговый дом «Русская редакция», 2001.
17. Роджерсон Д. Основы СОМ. М.: «Русская редакция». - 2000.
18. Социологические исследования в России: осведомленность и отношение населения: Аналитическая записка по материалам исследования / ЦИРКОН, ВЦИОМ, Ассоц. регион, соц. центров «Группа 7/89» - М., 2005.
19. Саморегуляция и прогнозирование социального поведения личности. Под ред. В.А. Ядова. - Л.: Наука - 1979.
20. Толстова Ю.Н. «Дух» математики как основа научного социологического исследования // Математическое моделирование социальных процессов, вып. 7, М.: МАКС Пресс, 2005, с. 6 - 27.
21. Толстова Ю.Н. Математическое моделирование и теоретическая социология // Математическое моделирование социальных процессов, вып. 4, М.: МАКС Пресс, 2002, с. 4 - 19.
139
22. Троелсен Э. С# и платформа .Net. Библиотека программиста - СПб.: Питер, 2002.
23. Финн В.К. Правдоподобные выводы и правдоподобные рассуждения // Итоги науки и техники. Сер. «Теория вероятностей. Математическая статистика. Теоретическая кибернетика» - 1988. - Т. 28. - С. 3-84.
24. Финн В.К. Правдоподобные рассуждения в интеллектуальных системах типа ДСМ // Итоги науки и техники. Сер. «Информатика». - 1991. - Т. 15. -С. 54-101.
25. Финн В.К. Синтез познавательных процедур и проблема индукции // НТИ. Сер. 2.- 1999.-№>i/2.-С. 8-45.
26. Финн В.К. Об особенностях ДСМ-метода как средства интеллектуального анализа данных // НТИ. Сер. 2. - 2001. - № 5. - с. 1-4.
27. Финн В.К. Об одном варианте логики аргументации// НТИ. Сер. 2. - 1996. -№5-6.-С. 3-19.
28. Финн В.К. О методологических принципах построения интеллектуальных систем для наук о социальном поведении // V Международная конференция «Информационное общество. Информационные ресурсы и технологии телекоммуникации», Москва, 22-24 окятрбря 2000 г., Материалы конф. - М., 2000. - С.5-8.
29. Финн В.К. Об интеллектуальных системах типа ДСМ для наук о жизни и социальном поведении // НТИ. Сер. 2. - 2002. - № 6.
30. Финн В.К. Об интеллектуальном анализе данных // Новости искусственного интеллекта. - 2004. - №3. - С. 2 - 18.
31. Финн В.К., Михеенкова М.А. О ситуационном расширении ДСМ-метода автоматического порождения гипотез // НТИ. Сер. 2. - 2000. - № 11. -с. 20-30.
32. Финн В.К., Михеенкова М.А. О логических средствах концептуализации анализа мнений // НТИ. Сер. 2. - 2002. - № 6. - С. 4-22.
33. Финн В.К., Михеенкова М.А., Бурковская Ж.И. О логических принципах анализа электорального поведения // НТИ, Сер. 2. - 2004. - № 8. - С. 1822.
34. А.В. Чугунов. Опыт проведения массовых онлайновых опросов (на примере США) // Интернет-конференция «Социология и Интернет». [http://www.ecsocman.edu.ru/db/msg/184670.html].
35. Швырев B.C. Рациональность в современной культуре // Общественные науки и современность. - 1997. - № 1.
36. Ядов В.А. Стратегия социологического исследования. Описание, объяснение, понимание социальной реальности. - 6-е изд. - М.: ИКЦ «Академкнига»; «Добросвет». - 2003.
37. Abductive Inference: Computation, Philosophy, Technology / Ed. J. R. Josephson, S. G. Josephson. -N.Y.: Cambridge University Press. - 1994.
38. Chen P. P.-S. The entity-Relationship Model - Toward a Unified View of Data //ACM TODS. - 1976,-№ l.
39. Codd E.F. Normalized Data Base Structure: A Brief Tutorial // Proc. of 1971 ACM-SIGFIDET Workshop on Data Description, Access and Control. - N.-Y.: ACM. - 1971.-P.l-17.
40. Fayyad U.M., Piatetsky-Shapirob., Smyth P., and Uthurusamy R. Advances in Knowledge Discovery and Data Mining, The AAAI Press, 1996.
41. Finn V.K., Mikheenkova M.A. On the application of JSM-method of automatic hypothesis generation in sociological investigations // Artificial Intelligence News. - 1993,-P 91-98.
42. Luhmann N. Offentliche Meinung. Politishe Planung, Aufsatzl zur Soziologie von Politik und Vervaltung. - Opladen. - 1971.
Библиография Бурковская, Жанна Ивановна, диссертация по теме Информационные системы и процессы, правовые аспекты информатики
1. Блинова В.Г., Ивашко В.Г., Скитер П.В., Финн В.К., Хазановский К.П. Об интеллектуальных системах типа ДСМ. Семиотика и информатика. 1990.-Вып 31.-С. 41-69.
2. ВеберМ. Основные понятия социологии ВеберМ. Избранные произведения. М Прогресс, 1990.
3. Русакова СМ., Михеенкова М.А., ФиннВ.К. О логических средствах автоматизированного анализа мнений НТИ. Сер. 2. 2001. 5 с. 4-24.
4. Данилова Е.Н., Михеенкова М.А., Климова Г. Возможности применения логико-комбинаторных методов для анализа социальной информации Социология: 4М. 1999. 11. с. 142-160.
5. Данилова Е.Н., Михеенкова М.А., Московский С, Финн В.К. Об одной модели детерминации социального поведения. VI Национальная конференция с международным участием «Искусственный интеллект-98», Пущино, Октябрь 5-11, 1998, Труды конференции в 3 томах, т. 2, с.617625.
6. Девятко И.Ф. Социологические теории деятельности и практической рациональности. М.: Аванти-плюс, 2003.
8. Климова Г., Михеенкова М.А., Панкратов Д.В. ДСМ-метод как метод выявления детерминант социального поведения НТИ. Сер. 2. 1999. 1 2 с 3-14.
9. Крыштановский А.О. Анализ социологических данных М.: Изд. Дом ГУ-ВШЭ. 2006.
10. Михеенкова М.А. «Об экспертных системах типа ДСМ», НТИ, сер.2, 1987, №9,с.23-31.
11. Михеенкова М.А. Развитие ДСМ-метода автоматического порождения гипотез для его применения при анализе социологических данных типа 138
12. Михеенкова М.А., Финн В.К. Логические средства формализации закрытых опросов и проблемы распознавания рациональности мнений Материалы Всероссийской научной конф. «Сорокинские чтения 2004: Российское общество и вызовы глобализации» (7-8 декабря 2004 г., Москва) М: МАКС Пресс. 2005. Вып.7. 127 135.
13. Панкратов Д.В. О некоторых модификациях логики аргументации. ПТИ. Сер. 2 1 9 9 8 4
14. Панкратов Д.В. Логические анализа социологических и программные данных средства качественного на Автореферат диссертации соискание ученой степени кандидата технических наук. М.: ВИНИТИ. 2001.
15. Поппер К. Логика социальных наук Эволюционная эпистемология и логика социальных наук. М.: Эдиториал УРСС, 2000.
16. Проектирование и реализация баз данных Microsoft SQL Server 2
17. Учебный курс MCSE/Пер. с англ. М.: Издательско-торговый дом «Русская редакция», 2001.
18. Роджерсон Д. Основы СОМ. М.: «Русская редакция». 2000.
19. Социологические исследования в России: осведомленность и отношение населения: Аналитическая записка по материалам исследования ЦИРКОП, ВЦИОМ, Ассоц. регион, соц. центров «Группа 7/89» М., 2005.
20. Саморегуляция и прогнозирование социального поведения личности. Под ред. В.А. Ядова. Л.: Паука- 1979.
21. Толстова Ю.П. «Дух» математики как основа научного социологического исследования Математическое моделирование социальных процессов, вып. 7, М.: МАКС Пресс, 2005, с. 6 27.
22. Толстова Ю.Н. Математическое моделирование и теоретическая социология Математическое моделирование социальных процессов, вып. 4, М.: МАКС Пресс, 2002, с. 4 19. 139
23. Финн В.К. Правдоподобные выводы и правдоподобные рассуждения Итоги науки и техники. Сер. «Теория вероятностей. Математическая статистика. Теоретическая кибернетика» 1988. Т. 28. 3-84.
24. Финн В.К. Правдоподобные рассуждения в интеллектуальных системах типа ДСМ Итоги науки и техники. Сер. «Информатика». 1991. Т. 15. С 54-101.
25. Финн В.К. Синтез познавательных процедур и проблема индукции ПТИ. Сер. 2. 1999. у, с. 8-45.
26. Финн В.К. Об особенностях ДСМ-метода как средства интеллектуального анализа данных ПТИ. Сер. 2. 2001. 5. с. 1-4.
27. Финн В.К. Об одном варианте логики аргументации// ПТИ. Сер. 2. 1996. 5 6 С 3-19.
28. Финн В.К. О методологических принципах построения интеллектуальных систем для наук о социальном поведении V Международная конференция «Информационное общество. Информационные ресурсы и технологии телекоммуникации», Материалы конф. М., 2000. 5-8.
29. Финн В.К. Об интеллектуальных системах типа ДСМ для наук о жизни и социальном поведении ПТИ. Сер. 2. 2002. 6.
30. Финн В.К. Об интеллектуальном анализе данных Повости Москва, 22-24 окятрбря 2000 г.. искусственного интеллекта. 2004. №3. 2 18.
31. Финн В.К., Михеенкова М.А. О ситуационном расширении ДСМ-метода автоматического порождения гипотез ПТИ. Сер. 2. 2000. 11. с. 20-30.
32. Финн В.К., Михеенкова М.А. О логических средствах концептуализации анализа мнений ПТИ. Сер. 2. 2002. 6. 4-22. 140
33. Швырев B.C. Рациональность в современной культуре Общественные науки и современность. 1997. 2 1. Г
34. Ядов В.А. Стратегия социологического исследования. Описание, объяснение, понимание социальной реальности. 6-е изд. М.: ИКЦ «Академкнига»; «Добросвет». 2003.
35. Abductive Inference: Computation, Philosophy, Technology Ed. J. R. Josephson, S. G. Josephson. -N.Y.: Cambridge University Press. 1994.
36. Chen P. P.-S. The entity-Relationship Model Toward a Unified View of Data //ACM TODS. 1 9 7 6 1
37. Codd E.F. Normalized Data Base Structure: A Brief Tutorial Proc. of 1971 ACM-SIGFIDET Workshop on Data Description, Access and Control. N.-Y.: ACM.-1971.-P.1-17.
38. Fayyad U.M., Piatetsky-Shapirob., Smyth P., and Uthurusamy R. Advances in Knowledge Discovery and Data Mining, The AAAI Press, 1996.
39. Finn V.K., Mikheenkova M.A. On the application of JSM-method of automatic hypothesis generation in sociological investigations Artificial Intelligence News.-1993.-P 91-98.
40. Luhmann N. Offentliche Meinung. Politishe Planung, Aufsatzl zur Soziologie von Politik und Vervaltung. Opladen. 1971. 141
-
Похожие работы
- Логические и программные средства качественного анализа социологических данных
- Интегрированная информационно-аналитическая система для социологических исследований
- Принципы и логические средства интеллектуального анализа социологических данных
- Интеллектуальное сопровождение производственных процессов на железнодорожном транспорте
- Разработка алгоритмических и программных средств для реализации стратегий ДСМ-метода автоматического порождения гипотез