автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Модели построения информационных массивов для решения задачи классификации сведений в условиях неопределенности

кандидата технических наук
Данилкин, Сергей Владимирович
город
Тамбов
год
2010
специальность ВАК РФ
05.25.05
цена
450 рублей
Диссертация по документальной информации на тему «Модели построения информационных массивов для решения задачи классификации сведений в условиях неопределенности»

Автореферат диссертации по теме "Модели построения информационных массивов для решения задачи классификации сведений в условиях неопределенности"

На правах рукописи

УДК 681.518(043.3) ББК 3-973,233я031 Д182

ДАНИЛКИН Сергей Владимирович

МОДЕЛИ ПОСТРОЕНИЯ ИНФОРМАЦИОННЫХ МАССИВОВ ДЛЯ РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ СВЕДЕНИЙ В УСЛОВИЯХ НЕОПРЕДЕЛЕННОСТИ

Специальность 05.25.05 - «Информационные системы и процессы»

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Тамбов2010

004605489

Работа выполнена на кафедре «Информационные системы и защита информации» Государственного образовательного учреждения высшего профессионального образования «Тамбовский государственный технический университет» (ГОУ ВПО ТГТУ).

Научный руководитель

Официальные оппоненты:

доктор технических наук, профессор Громов Юрий Юрьевич

доктор технических наук, профессор Алексеев Владимир Витальевич

кандидат физико-математических наук, доцент

Хакимуллин Евгений Робертович

Ведущая организация

Государственное образовательное учреждение высшего профессионального образования «Воронежская государственная технологическая академия»

Защита диссертации состоится 09 июня 2010 г. в 11 часов на заседании диссертационного совета Д 212.260.05 ГОУ ВПО ТГТУ по адресу: 392000, г. Тамбов, ул. Советская, 106, Большой актовый зал.

Отзыв на автореферат в двух экземплярах, заверенных гербовой печатью, просим направлять по адресу: 392000, г. Тамбов, ул. Советская, 106, ГОУ ВПО ТГТУ, ученому секретарю диссертационного совета Д 212.260.05 З.М. Селивановой.

С диссертацией можно ознакомиться в библиотеке ГОУ ВПО ТГТУ.

Автореферат диссертации размещен на официальном сайте ГОУ ВПО ТГТУ: www.tstu.ru.

Автореферат разослан « ь/Ху&Л? 2010 г.

Ученый секретарь диссертационного совета доктор технических наук, профессор I З.М. Селиванова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. На современном этапе развития общества, характеризующемся интенсивным внедрением информационных технологий, которые в большинстве своем основываются на использовании компьютерных сетей, особое значение приобретают задачи классификации сведений, получаемых из различных источников, одним из которых являются результаты работы информационно-поисковых машин (ИПМ). Использование информационно-поисковых машин в настоящее время приобретает особую значимость при нахождении сведений, необходимых для решения задач анализа, оптимизации, управления и принятия решений в различных сферах деятельности. Необходимость решения задач классификации сведений обусловлена неудовлетворительным качеством работы информационно-поисковых машин, результаты работы которых в большинстве своем не отран-жированы по критерию релевантности, и даже в тех случаях, когда этот критерий используется, отсутствует какая-либо группировка сведений, способствующая упрощению процесса их последующей обработки. Одной из основных особенностей задачи классификации сведений является наличие как качественных, являющихся источником неопределенности, так и количественных признаков в описании объектов исходного множества. При выделении однородных групп сведений, относящихся к объектам выбранной предметной области, различают такие виды группировки исходных данных, как структурная и типологическая. Структурная группировка представляет собой способ выделения количественно однородных групп объектов, а типологическая - способ выделения качественно однородных групп.

Методы выделения однородных групп сведений используют следующие основные подходы:

- вероятностный, основанный на предположении о том, что объекты, принадлежащие одному из выделяемых классов, описываются одинаково распределенными случайными векторами, а для различных классов характерны различные распределения вероятностей;

- вариативный, состоящий в разбиении множества объектов по выбранному исследователем признаку на интервалы группирования, в результате чего исходное множество объектов разбивается на группы таким образом, что объекты одной группы находятся на относительно небольшом расстоянии друг от друга;

- структурный, базирующийся на представлении об объектах как точках в многомерном пространстве, которое получило развитие в работах В.В. Солодовникова, Ю.А. Дубова, В.И. Якимца, В.Б. Кузьмина, И.М. Макарова, Т.М. Виноградской, A.A. Рубчинского, В.Ф. Бирюкова, В.И. Тумар-кина и др.

Однако при этом не рассматривался процесс получения сведений, подлежащих классификации, основанный не только на результатах работы информационно-поисковых машин, но и на формировании соответствующих информационных массивов, используемых в дальнейшем для реше-

ния задач классификации сведений. Процессы построения информационных массивов при решении широкого класса задач рассматривались в работах H.A. Кузнецова, В.В. Кульбы, И.П. Норенкова, С.С. Ковалевского, С.А. Косяченко, А.Д. Цвиркуна, В.Б. Павлова и др., однако они не использовались для решения задачи классификации сведений в условиях неопределенности, методам и подходам раскрытия которых посвящены работы российских и зарубежных ученых: Д.А. Поспелова, А.Н. Аверкина, И.З. Батыршина, А.Ф. Блишуна, В.Б. Кузьмина, А.Н. Борисова, A.B. Алексеева, а также Л.А. Заде, А. Кофмана и др.

Таким образом, решение задачи классификации сведений, основанной на использовании сформированных специальным образом информационных массивов и выборе соответствующих методов их обработки в условиях неопределенности, является актуальным.

Цель работы: повысить эффективность процесса классификации сведений в условиях неопределенности путем формирования информационных массивов заданной сложности.

Задачи исследования:

- ввести в рассмотрение целевое пространство информационных массивов (ЦПИМ) для последующего построения процедур его декомпозиции;

- ввести в рассмотрение критерий сложности построения информационных массивов (ИМ);

- провести классификацию неопределенностей, имеющих место при решении задачи классификации, и обосновать выбор математического аппарата для их формализации;

- предложить и обосновать структуру информационного массива, удовлетворяющую предложенному критерию оценки сложности, учитывающую влияние факторов неопределенности при решении задачи классификации.

Объект исследования. Методы построения информационных массивов для решения задач классификации сведений.

Предмет исследования. Модели построения информационных массивов по критерию сложности для решения задачи классификации сведений в условиях неопределенности.

Методы исследования. Для решения поставленных задач в работе использованы методы системного анализа, теории нечетких множеств и математического программирования.

Научная новизна работы заключается в следующем:

- предложена формализация целевого пространства информационных массивов в виде кортежа из трех элементов, которыми являются множество информационных массивов, отвечающих общей цели, и определенные на нем отношения эквивалентности и частичной упорядоченности, что дало возможность построить процедуры декомпозиции;

- построены аналитические и процедурные модели декомпозиции информационных массивов, основанные на использовании предложенных

типов взаимосвязи, определяемых отношениями эквивалентности, частичной упорядоченности и введенных в рассмотрение прототипах;

- предложен критерий оценки сложности информационного массива, построенный на основе использования характеристических функций, разбивающих целевое пространство информационных массивов (ЦПИМ) на уровни декомпозиции;

- построена аналитическая модель выбора типа «много входов -один выход» (MISO), основанная на применении выбранных Т-норм, методов решения задачи классификации сведений из построенных информационных массивов в условиях неопределенности.

Практическая значимость полученных результатов заключается в использовании разработанного программного обеспечения, реализующего построенные процедурные модели решения задач классификации сведений, что позволяет существенно сократить время получения и поиска сведений в локальных и сетевых информационных системах.

Работа выполнена при поддержке Государственного контракта № П292 в рамках ФЦП «Научные и научно-педагогические кадры инновационной России на 2009 - 2013 годы».

Реализация результатов работы осуществлена в ОАО «Пигмент», г. Тамбов; ООО «Совтех», г. Воронеж; Государственном образовательном учреждении высшего профессионального образования «Тамбовский государственный технический университет».

Положения, выносимые на защиту:

- формализация целевого пространства информационных массивов в виде кортежа из трех элементов, которыми являются множество информационных массивов, отвечающих общей цели, и определенные на нем отношения эквивалентности и частичной упорядоченности, позволяет построить процедуры его декомпозиции и повысить эффективность решения задачи классификации сведений;

- аналитические и процедурные модели декомпозиции целевого пространства информационных массивов, основанные на использовании предложенных типов взаимосвязи, определяемых отношениями эквивалентности, частичной упорядоченности и введенных в рассмотрение прототипах, дают возможность сформировать информационные массивы для решения задачи классификации;

- критерий оценки сложности информационного массива, построенный на основе использования характеристических функций, разбивающих целевое пространство информационных массивов на уровни декомпозиции, который позволяет осуществить построение информационного массива с заданными свойствами;

- аналитическая модель выбора типа MISO, основанная на применении Т-норм, методов решения задачи классификации сведений из построенных информационных массивов в условиях неопределенности, позволила автоматизировать процесс и сократить временные затраты.

Апробация работы. Основные результаты работы представлены и обсуждены на всероссийских и международных научных конференциях «Наука на рубеже тысячелетий» (международная конференция, г. Тамбов, 2004), «Динамка наукових дослщжень - 2005» (IV м1ждународна науково-прак-тична конференщя, Дшпропетровськ, 2005), «Теория конфликта и ее приложения» (IV Всероссийская научно-техническая конференция, Воронеж, 2006), на семинарах кафедры «Информационные системы и защита информации» ГОУ ВПО ТГТУ и кафедры «Прикладная информатика» Тамбовского филиала Московского государственного университета культуры и искусств.

Объем и структура работы. Диссертация, общий объем которой составляет 204 страницы (основной текст - 153 страницы), состоит из введения, трех глав, заключения, списка используемых источников, включающего 249 наименований научных трудов на русском и иностранном языках, и 10 приложений. Диссертация содержит 25 рисунков и 12 таблиц.

Публикации. По теме диссертации опубликовано 8 работ, из них 5 статей, в том числе 4 статьи в изданиях, рекомендованных ВАК РФ, и 3 тезиса докладов на всероссийских и международных научных конференциях.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность выбранной темы, сформулирована цель работы, поставлены задачи, решения которых позволяют достичь цели исследования.

В главе 1 «Анализ методов решения задачи классификации и проблемы неопределенности» выявлено, что виды и формы нечеткости исследованы в работах Д.А. Поспелова, А.Н. Аверкина, И.З. Батыршина, А.Ф. Блишуна, В.Б. Кузьмина, А.Н. Борисова.

Постановка задачи классификации на предметно-содержательном уровне включает формулировку целей исследования, определяющих тип задачи, выявление характера исходной информации и определение характера результатов исследования. Сделан вывод, что неопределенность в той или иной степени характеризует каждую из этих составляющих, что может быть представлено структурной схемой, изображенной на рис. I.

Рис. 1. Виды неопределенностей в задачах классификации

1. Подходы к обработке неопределенностей в задачах классификации

Неопределенность задачи классификации Методология обработки неопределенности

Вид неопределенности Форма проявления неопределенности

Неопределенность исходных сведений Неоднозначность числа объектов исходной совокупности Нечеткие числа (Ь-Я)-типа

Неоднозначность значений переменных в матрице Заполнение средними; заполнение с помощью регрессии

Неточность значений переменных в матрице исходных сведений Инструментарий с высокой точностью измерения или вычисления

Неполнота исходных сведений Методы исключения некомплектных объектов; методы с заполнением; методы взвешивания; методы, основанные на моделировании

Неопределенность результатов исследования Неопределенность формы и взаимного расположения кластеров Разведочный анализ сведений

Размытость природы искомой классификации Нечеткие методы классификации

Неоднозначность числа кластеров Оптимизационные алгоритмы с функционалом качества при неизвестном числе кластеров

Для раскрытия неопределенностей, присущих задачам классификации сведений, как правило, используются подходы, достаточно хорошо разработанные и представленные в большом количестве статей и монографий, основные идеи которых обобщены в табл. 1.

Подходы раскрытия неопределенностей (табл. 1) не являются единственно возможными и не претендуют на статус универсальных; более того, при решении задач классификации имеют место ситуации, которые характеризуются наличием типов (видов) неопределенности. В этом случае положительный эффект достигается за счет незначительного раскрытия и последующего устранения неопределенности. Наличие неопределенности существенно снижает эффективность решения задачи классификации. Рациональным представляется подход, основанный на предварительной обработке используемых сведений. Для проведения такой обработки необходимо ввести в рассмотрение пространство, элементами которого являются сведения. В настоящее время, характеризуемое интенсивным применением сетевых технологий для решения задачи классификации сведений, особое значение приобретает задача классификации сведений, полученных при помощи различных ИПМ из сети Internet. В результате исследований, проведенных в данном разделе, доказана целесообразность рассмотрения пространства ИМ, основываясь на

понятии ИМ, введенном и обоснованном в работах P.C. Гиляревского, H.A. Кузнецова, В.В. Кульбы, С.С. Ковалевского, С.А. Косяченко, В.О. Сиро-тюка, при этом ИМ содержит сведения, полученные в результате работы одной ИПМ. Использование пространства ИМ позволит осуществить предварительную обработку сведений, что в свою очередь обеспечит повышение эффективности решения задачи классификации.

В главе 2 «Аналитические и процедурные модели декомпозиции целевого пространства информационных массивов и построение оценки сложности информационных массивов» вводится в рассмотрение множество ИМ, объединенных общностью цели построения, вместе с множеством отношений на нем. Из этого множества отбираются те ИМ, которые отвечают одной и той же (главной) цели построения или одному и тому же множеству (главных) целей, для последующего использования при решении задачи классификации.

Целевое пространство информационных массивов формализуется аналитической моделью, которая представлена кортежем из трех элементов:

ЦПИМ = (Х,Я,/>), Я = {Л}, Р = (2.1)

где X - исходное множество ИМ, R - множество отношений эквивалентности, Р- множество отношений частичного порядка.

Рассмотрим множество R - {/?} всех эквивалентностей, определенных на ЦПИМ; оно по определению не пусто. Если R\,R2 то примем, что

д

Rl<R2= (из xRxy вытекает xR2y, х,у е X), х,у-элементы множестваX и из R е R, R < R' следует, что R'eR. (2.2)

Это отношение логического следования запишем в виде:

д

Я, <R2 -xR\y -> xR2y, х, у е X . (2.2')

Определенное таким образом на R отношение < рефлексивно, антисимметрично, транзитивно, т.е. устанавливает на R частичный порядок.

Рассмотрим возможность декомпозиции ЦПИМ на основе понятий смежного класса и факторизации. Любая эквивалентность R е R в принципе позволяет осуществить декомпозицию ЦПИМ на смежные классы из X / R или их объединения:

и {*}*=*, (2.3)

хеХ

где {x}R - смежный класс элемента х е А", X / R = {{*},;} - фактормножество. Будем рассматривать только такие декомпозиции, которые позволяют построить систему содержательных оценок ИМ, входящих в ЦПИМ.

Введем в рассмотрение следующие типы взаимосвязи отношений эквивалентности и частичной упорядоченности на ЦПИМ, предполагая, что эквивалентность R € R отличается от тривиальной (равенства), т.е. х у, а час-

тичный порядок Р е Р обладает свойствами хРх, хРу —> уРх - невозможно, в этом случае справедлива аналитическая модель вида (хРу, yPz) -> xPz :

SP 1 - союзная пара (Л,Р): если xRy , то хРу, уРх невозможно;

SP1 - сопоставимая пара (Р,Р)' если хРу ,х'Рх, у'Ру, то у'Рх' невозможно;

SP3 - связанная пара (/?, Р}: если хРу, х'Рх, у'Ру, то х'Ру';

SPA - сопряженная пара (Л, Р): а) (R, Р) есть SPI, или SP2, или SP5; б) пусть заданы х,уеХ [xRy); тогда в X существуют х'Рх, у'Ру такие, что либо х'Ру', либо y'Rx';

SPS — согласованная пара (Я, Р): каковы бы ни были два различных элемента х, у е X, либо хРу (в этом случае хРу, уРх невозможно), либо хРу, либо уРх.

Декомпозиция ЦПИМ проводится на основе одной из процедурных моделей, разработанных в диссертации и имеющей следующей вид:

Шаг 1. В каждом из блоков факторизации ЦПИМ X / R отмечаем по элементу х е {х'}. Множество отмеченных элементов Z = {х, х е ,

{дс'}я е X / /г} вполне упорядочено отношением хПу = х е , у е , R, т.е. каждый отмеченный элемент образует «склейку» всех /{-эквивалентных ему элементов, и, таким образом, множество отмеченных элементов Z изоморфно фактор-множеству X/И = {м^, где ß е В,

ß - индекс, В - индексное множество.

Шаг 2. Вполне упорядоченное множество (Z, П), согласно теореме

д

Шпильрайна, имеет наименьший элемент х0еМ0, где Л/0 = М'0 е e(X/R, Щ).

Множество М0 - элемент факторизации ЦПИМ - будем называть минимальным множеством декомпозиции ЦПИМ. Ввиду того, что М0 по определению есть смежный класс М0 е X / R, то хе М0 -> хЛх0 .

Шаг 3. Предположим, что Z/{x0} не пусто; тогда оно содержит наименьший элемент х,. Пусть х, е М[. Строим объединение множеств М, = М0 U М{. Тогда х е М, -> xRx0 v xRxl , причем по построению xQ <х, , азначит, (yRx0,zRx})-> у <z.

Шаг и. Предположим, что Z/ и х» не пусто; тогда оно содержит

р<и

наименьший элемент х„ е М'п , п - индекс. Строим объединение множеств

Мп = М'„/ и Л/р = М'„ и Мп_х. Тогда х е Мп -» хЯх0 V хЯх] V... V хИхп , Р <л

причем очевидно, что < х„, р < п, а значит, ^ < г.

Процесс построения продолжается до исчерпания множества X/Я, т.е. до исчерпания ЦПИМ, поскольку {л/р} является разбиением ЦПИМ. Следовательно, Мп образуют декомпозицию X.

Таким образом, в результате моделирования построены:

- декомпозиция в виде покрывающего ЦПИМ семейства множеств М, = {Мп}, причем I]М„ = X ;

п

Л , 1

- множество отмеченных элементов 2-2х =\хп), таких, что х0 е М0, хп+1 е М„+1 / Л/„, {хр < } (р < п), является вполне упорядоченным.

Сложность декомпозиции, таким образом, соответствует расстоянию Гливенко от минимального множества до Мп е Мд .

Поэтому рассмотрим множество признаков г] информационных массивов (МПИМ), входящих в пространство: У = (г)}. К числу признаков г) относятся запросы, типы, размеры, как фактические, так и желаемые.

Для формализации процесса будем предполагать, что все признаки могут быть выражены единым алфавитом, образованным символами -простыми словами, из которых формируются сложные слова и совокупности слов, т.е. тексты (или списки) на языке алгебры высказываний. Длина слова несущественна, и в дальнейшем не будем различать единичные слова и тексты, т.е. текст будет считаться «длинным» словом.

Пусть X = {*} - ЦПИМ; рассмотрим соответствующее МПИМ универсальное множество слов 2 = {!;}, выражающих все свойства систем х и ЦПИМ: 2 = {^ь ..., ...} * 0. На множестве 2 определим операцию Ф сшивания слов: , ^,...,^Е )© , 4е2 >• • •. 40р )= ¡5*, • • ■ ^ • ■■ • Ц ) ■■■,

где 2, р - конечная комбинация слов из 2, причем по смыслу символов будем считать, что здесь операция сшивания обладает следующими свойствами:

1) каждое слово определяется сшиванием символов алфавита:

®--Ф )' где конечно и является номером символа в _ ^ _

алфавите а , - каждый символ алфавита а ;

2) любые два символа или слова перестановочны: = = (44') = , поскольку порядок указания в списке или слове свойств систем не имеет значения для их облика;

3) любой из символов и любое из слов идемпотентны: (^)ф = = поскольку повторение в списке или слове одного и того же свойства систем ничего не изменяет в их облике;

4)символ =£,а ~ аш х играет роль единицы: =

Таким образом, доказана применимость результатов моделирования, позволяющая построить декомпозицию ЦПИМ.

Процедурная модель декомпозиции ЦПИМ имеет вид:

Шаг 1. Минимальное множество (множество элементов минимальной

л

сложности) М0 = Х0 ; это прообраз слова, означающего, что ИМ отвечает минимальному количеству условий.

с

Шаг 2. Л/, = М0 и Х1, где X, - элемент фактор-множества X, непосредственно следующий за Х0 .

Шаг п + I. Мп = Л/п_, и Хп , где Хп - элемент фактор-множества

с

X / ~ , непосредственно следующий за Хп_,.

В результате построено семейство множеств Л/с = {Л/„}, являющееся покрытием ЦПИМ и представляющее собой его декомпозицию. Одновременно с указанным процессом декомпозиции ЦПИМ из представителей смежных классов хп е Х„ может быть построено множество Zc = {хп} отмеченных элементов, являющееся шкалой сложности.

В главе получен ряд практически важных применений понятия нечеткости при оценке сложности ИМ: нечеткость ЦПИМ, нечеткость декомпозиций ЦПИМ, что является основой для проведения дальнейших исследований в области классификации сведений в различных областях деятельности.

В главе 3 «Формирование информационных массивов для решения задачи классификации» рассмотрено применение полученных в предыдущей главе результатов для решения задачи классификации сведений.

В качестве иллюстрации разработанных процедурных и аналитических моделей рассмотрим процесс формирования ИМ для решения задачи классификации сведений об известных математиках. Для формирования ИМ используются ИПМ, применение которых осложняется следующими факторами:

1) существует достаточно большое количество сайтов, посвященных данной тематике, однако отсутствуют общие подходы к их построению;

2) при поиске информации, касающейся области профессиональной деятельности, достаточно трудно сформулировать запрос. Например, работы, относящиеся к смежным областям или находящиеся на стыке раз-

личных областей знаний: математики и биологии, вычислительной математики и теплообмена;

3) на различных сайтах представлена неструктурированная информация, полнота и точность которой многократно раскритикована в литературе. Это подчеркивает необходимость рассмотрения факторов неопределенности, классификация которых представлена в первой главе.

Предложена процедурная модель, отражающая этапы решения задачи классификации (рис. 2).

Проведен анализ методов решения задачи классификации, рассмотренных в данной главе, и вычислены оценки сложности известных алгоритмов для последующего использования в предложенной модели выбора. Для получения оценок сложности использованы подходы, развитые в предыдущей главе.

Сформулированы рекомендации по выбору групп методов в зависимости от информации, которой располагает исследователь:

1) если у исследователя существуют содержательные представления об условиях объединения объектов в классы, следует выбрать группу эвристических методов нечеткого подхода в кластерном анализе;

2) если целью классификации является получение нечеткого разбиения на заранее известное число классов исследуемой совокупности объектов, следует выбрать группу оптимизационных методов нечеткого подхода в кластерном анализе;

3) если целью классификации является получение наглядного представления о нечеткой структуре классифицируемой совокупности объектов сравнительно небольшого объема, следует выбрать иерархические методы нечеткого подхода в кластерном анализе.

Рассмотрим процесс формирования пространства ИМ, содержащих сведения об академике А.Н. Колмогорове, для последующего решения задачи классификации. Пространство ИМ строится по результатам работы ИПМ, при различных вариантах запросов, фрагментарно представленных в табл. 2.

Рис. 2. Процедурная модель выбора алгоритмов решения задачи классификации

2. Среднее количество гиперссылок по ключевым словам в ИПМ за 2009 г.

\ Ключевые \ слова ИПМ \ Колмогоров (тыс.) Колмогоров A.H. (тыс.) Акад. Колмогоров (тыс.) Акад. Колмогоров А.Н. (тыс.) Kolmogorov (тыс.) Kolmogorov A.N. (тыс.) Prof. Kolmogorov (тыс.) Prof. Kolmogorov A.N. (тыс.) Проф. Колмогоров (тас.) Проф. Колмогоров А.Н. (тыс.)

№ запроса 1 2 3 4 5 6 7 8 9 10

Rambler 368 28 41 15 48 44 0,765 0,604 11 5

Yandex 378 213 5,104 4,827 115 73 5,7 4,8 12 11

AltaVista 0,126 0,004 0,016 0,001 334 319 51,6 57,1 0,001 -

Google 158 67,1 10,53 9,08 354 337 52,1 52,1 2,67 2,47

Aport 73,085 73,994 30,376 29,891 1,285 0,723 1,274 0,473 9,056 3,146

Yahoo Щ 169 1,35 1,29 2210 1500 107 77,2 3,36 2,72

Ask 32,9 19,2 6,87 6,3 334 270 286 208 3,04 1,92

Lycos 7,696 5,13 0,173 0,163 98,059 11,689 6,939 0,939 0,301 0,262

Nigma 703,94 12,392 64,437 47,894 256,18 277,81 31,567 31,033 53,39 28,43

Для построения множества ИМ предварительно был проведен статистический анализ работа ИПМ за период 2007 - 2009 гг., этапы которого подробно рассмотрены в работе, а часть результатов представлена на рис. 3-8.

4000

3500 -

3000

? 2500 £

2000 I ¡500

СО

1000 500 0

I

• 2007

— * — мкй

- * - 2009

r—r

123456789 10 № запроса

Рис. 3. Среднее количество гиперссылок за период 2007-2009 гг. по запросам ИПМ Google

1 23456789 10 Jé запроса

Рис. 4. Среднее количество гиперссылок за период 2007 - 2009 гг. по запросам ИПМ Ask

u

Ii

4> О.

У С

120 100 80 60 40 20

1 1 : 1 ■

! i Hw _ • — 200»

! IT 1 * - 2QQ9

i (11 \

! II : . J ) Щ

' 1 \

i 1 , 1

t l

л

•iL ¥ * * •

С о

§ *

£ с

s «

г; ri

1000 900 800 700 6Р0 500 400 300 200 100 О

V л-

»V.

1

•»2007 -200«

If*

-IV-

т

т.. U

123456789 10 № запроса

Рис. 5. Среднее количество гиперссылок за период 2007 - 2009 гг. по запросам ИПМ Lycos

400 350 300 f 250

¥200

0

1 150 100

50 0

1 1-1 t — ■»■ —21Ю1 - А - 2Ü09

I "T 4. —

Г 1

г —1-

i ....

j 1 —\ 1 l L А

ВЯПВ8 Ц •

123456789 10 № запроса

Рис. 6. Среднее количество гиперссылок за период 2007 - 2009 гг. по запросам ИПМ Nigma

80 70 60 ? 50

I

fr 40

0

о* -

1 ° 20

10

* — •• — 2Ш «■ * - 2009

s

1

4 К %

1 2 3 4 5 6 7 8 9 10

№ Запроса

Рис. 8. Среднее количество гиперссылок за период 2007 - 2009 гг. по запросам ИПМ Aport

123456789 10 № запроса

Рис. 7. Среднее количество гиперссылок за период 2007 - 2009 гг. по запросам ИПМ АКаУЫа

По результатам проведенного анализа можно сделать Вывод об увеличении количества гиперссылок на запросы, обрабатываемое наиболее часто используемыми ИПМ. Для формирования пространства ИМ используем результаты, представленные в табл. 2.

Для выбора метода решения задачи классификации сведений в работе предложена логико-лингвистическая модель, позволяющая выбрать группу методов решения задачи и непосредственно метод из выбранной группы.

Результаты решения задачи классификации представлены на рис. 9, а. При этом было использовано исходное пространство ИМ.

Далее решалась задача декомпозиции в следующей постановке: задано исходное пространство ИМ (табл. 2), которое определяется парой где Zc - шкала сложности X (допустимое пространство проектирования ИМ определено в главе 2); декомпозиция по сложности Мс = {м}, построенная на основе использования процедурных моделей, предложенных в главе 2; множество Г неотрицательных действительных чисел, которые описывают набор параметров; критериальная функция /•"(■). Тогда задача построения

заключается в выборе элементов х е А" из ЦПИМ (Х'= для

которого выполняется условие вида

F(x) = extr, 8{х\гс)<а,

где а - фиксированный элемент; - порядковая сложность.

Результаты повторного решения задачи классификации представлены на рис. 9, б.

Анализ представленных результатов позволил сделать вывод о сокращении временных затрат. Таким образом, в результате решения задачи классификации сформировано три кластера (табл. 3, где цифра после точки соответствует номеру запроса ИПМ, а цифра перед точкой - номеру ссылки, ею найденной).

Полученный результат определяет иерархию поиска необходимых сведений, отвечающих рассмотренным запросам, который в данном случае может проводиться как по полученным кластерам, так и внутри них.

1

0,9

. 0,8

I 0,7 в

% 0,6 1

5 0,4

I °-3 ° 0,2

0,1

0

1

Л X г А

-X 'VI 1 :7

1 У V . // V / V \ / >

'V / - ■•ч д /

|7 / ^ ч / Л ■V

V ч V

4 ¥

4 5 6 7 № запроса

а)

0,4 0,35

В о,з

^ 0,25

0

1 0,2

5 0.15 о

£ о.»

0,05 0

!

1*. 'V4 к

/ А 'у' 'ж. •х- / 'у-' Д у

1 ✓ Л

Л V А

/ V

1 2 3 4 5 6 7 № запроса

б)

Рис. 9. Результаты решения задачи классификации эвристическими методами:

а - до проведения процедуры декомпозиции; б - после проведения процедуры декомпозиции ♦ - метод Тамуры-Хигути-Танаки; ■ - метод Гетмана-Левина; ▲ - метод Кугурье-Фьолео;х - метод Берштейна-Дзюбы

3. Результат решения задачи классификации

ипм Кластер 1 Кластер 2 Кластер 3

ЯашЫег 1.1,7.1-16.1,23.1, 5.2,7.2,8.2,10.2,37.2, 2.3,9.3,12.3,17.3,29.3, 3.4,9.4,27.4,49.4 1.5,2.5,4.5,7.5,11.5, 3.6,5.6-7.6,9.6,14.6, 2.7-5.7,8.7,12.7-14.7, 6.8,8.8,9.8,13.8 1.9-3.9,6.9-9.9, 2.10,6.10,8.10,10.10-12.10

Уалс1ех 1.1-5.1,8.1-10.1, 1.2-3.2,5.2-8.2, 1.3,3.3,6.3,9.3,10.3, 7.4,9.4,10.4 1.5-3.5,24.5,45.5, 1.6-6.6,9.6,10.6, 18.7,42.7,57.7,64.7, 2.8,4.8,6.8,9.8 2.9,23.9,36.9,41.9, 22.10,34.10,43.10,48.10

А1Ш 1.1-4.1,6.1-8.1, 3.2,4.2,7.2,11.2-14.2, 4.3-7.3,12.3,16.3, 6.4,9.4,12.4,24.4 1.5,2.5,6.5,7.5, 1.6-6.6,8.6,9.6, 1.7,4.7,7.7,9.7, 2.8,12.8,14.8,25.8 3.9-6.9,8.9,10.9-14.9, 5.10,8.10,10.10,16.10

Google 1.1-3.1,9.1,10.1, 1.2-7.2,10.2,11.2, 8.3,9.3,12.3-15.3, 1.4,3.4-6.4,10.4 1.5-2.5,4.5,5.5,6.5, 2.6-6.6,8.6,9.6,11.6, 1.7,2.7,5.7,18.7, 2.8,8.8,11.8,24.8 9.9,15.9,19.9,26.9, 4.10,19.10,21.10,27.10

АроП 1.1-4.1,6.1,8.1, 2.2-6.2,7.2-9.2, 3.3,7.3,9.3,14.3,25.3, 6.4-8.4,12.4,16.4 2.5,4.5,7.5,8.5,9.5, 1.6,3.6-10.6, 1.7,2.7,4.7,14.7, 1.8,16.8,28.8,37.8 3.9,5.9,7.9- 12.9, 2.10,7.10,11.10- 14.10

УаЬоо 1.1,4.1-10.1, 2.2-6.2,8.2,12.2,16.2, 1.3-9.3, 1.4,2.4,9.4 1.5-11.5, 2.6-3.6,6.6,8.6,10.6, 1.7,2.7,10.7, 2.8,5.8,6.8,7.8,8.8 1.9,9.9,14.9-17.9, 2.10,5.10-7.10,16.10

Азк 1.1-3.1,7.1,8.1, 1.2,5.2,7.2,14.2,18.2, 1.3,2.3,4.3,5.3,7.3,8.3, 6.4,7.4,8.4,9.4,10.4 1.5,2.5,6.5-9.5, 2.6,4.6-7.6,9.6, 4.7,5.7,6.7,8.7, 9.8,22.8,36.8,40.8 6.9,7.9,9.9, 15.10,18.10,27.10

Ьусоэ 1.1-8.1, 2.2-7.2,10.2, 2.3-6.3,11.3, 3.4,6.4,8.4,10.4-13.4 2.5-6.5,3.6-9.6, 2.7,4.7,6.7-12.7, 5.8,7.8,11.8,24.8 4.9,8.9,13.9,21.9, 8.10-10.10,16.10,19.10

3.1,4.1,7.1,12.1,13.1, 17.2-20.2, 1.3,16.3,17.3,20.3, 2.4,3.4,6.4,11.4,14.4 1.5-7.5,9.5,10.5,12.5, 2.6-4.6,7.6,9.6, 12.6-17.6, 1.7,10.7,12.7, 3.8,4.8,11.8,14.8,16.8 1.9-3.9,16.9,20.9, 14.10,16.10,20.10

Для достижения поставленной в работе цели необходимо оценить эффективность (Э) решения задачи классификации. Для этого предлагается использовать выражение вида:

э= у№))-У№)) 100%> тах{у№))-у№))} где - оценка качества результата, полученного с использованием

алгоритма решения задачи классификации на пространстве ИМ; .р(°) -алгоритм решения задачи классификации; Х- исходное пространство ИМ; X - декомпозированное пространство ИМ.

Результаты, графические интерпретации которых представлены на рис. 9, а, б, легли в основу расчета эффективности решения задачи классификации сведений, для решения которой использовались исходное и декомпозированное пространства ИМ. При этом в рассмотрение принимался метод Тамуры-Хигути-Танаки, относящийся к группе эвристических методов, характеризующийся наименьшими временными затратами.

Эффективность решения задачи классификации методом Тамуры-Хигути-Танаки после проведения декомпозиции, отранжированная по номерам запросов, представлена на рис. 10, анализ изменения которой позволил сделать вывод, что ее максимальная величина составила 32,5%.

зз

31

£

■ft

27 25 23

т

Ы-

ж.

3' 4 5 6 7 ранжированный № запроса

Рис. 10. Эффективность решения задачи классификации методом Тамуры-Хигути-Танаки

В заключении сформулированы основные результаты работы:

- предложена формализация целевого пространства информационных массивов в виде кортежа из трех элементов, которыми являются множество информационных массивов, отвечающих общей цели, и определенные на нем отношения эквивалентности и частичной упорядоченности, что дало возможность построить процедуры его декомпозиции с целью повышения эффективности решения задачи классификации сведений;

- построены аналитические и процедурные модели декомпозиции ИМ, основанные на использовании предложенных типов взаимосвязи, определяемых отношениями эквивалентности, частичной упорядоченности и введенных в рассмотрение прототипах, что позволило сформировать информационные массивы с заданными свойствами для решения задачи классификации;

- предложен критерий оценки сложности информационного массива, построенный на основе использования характеристических функций, разбивающих целевое пространство информационных массивов на уровни декомпозиции, использование которого дало возможность организовать информационный массив с заданными свойствами;

- разработана аналитическая модель выбора типа MISO, основанная на применении обоснованно выбранных Т-норм, методов решения задачи

классификации сведений построенных информационных массивов в условиях неопределенности;

- результаты проведенных экспериментальных исследований дали возможность сделать вывод о повышении эффективности решения задачи классификации сведений на 32,5% вследствие применения построенных в работе аналитических и процедурных моделей формирования информационных массивов и проведения декомпозиции ИМ.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

Публикации в изданиях, рекомендованных ВАК РФ

1. Данилкин, C.B. Определение целевого пространства информационных массивов / C.B. Данилкин // Вопросы современной науки и практики. Университет им. В.И. Вернадского. - 2009. - № 11 (25). - С. 210 - 215.

2. Данилкин, C.B. Информационные модели для организации имитационных исследований / C.B. Данилкин, A.B. Сыроид // Инженерная физика. - 2010. - № 3. -С. 11-16 (авт. объем - 0,2 печ. л.).

3. Математическая формализация процесса обучения / C.B. Данилкин, Ю.Ю. Громов, H.A. Земской, О.Г. Иванова и др. // Инженерная физика. - 2005. -№ 3. - С. 51 - 55 (авт. объем - 0,125 печ. л.).

4. Математическое моделирование информационных процессов в сети с заданной структурой / C.B. Данилкин, Ю.Ю. Громов, О.Г. Иванова и др. // Инженерная физика. - 2003. - № 2. - С. 44 - 47 (авт. объем - 0,06 печ. л.).

Статьи и материалы конференций

5. Данилкин, C.B. Гносеологические подходы к решению задач классификации с позиции теории нечетких множеств / C.B. Данилкин, С.А. Неезжалая, А.Ю. Громова // Информационные системы и процессы : сб. науч. тр. / под ред. проф. В.М. Тюпонника. - Тамбов ; М. ; Баку ; Вена : Изд-во «Нобелистика», 2006. -Вып. 4. - С. 41 - 49 (авт. объем - 0,4 печ. л.).

6. Данилкин, C.B. Проблема неопределенности в задачах автоматической классификации при построении информационных систем / C.B. Данилкин, А.Ю. Громова, О.Г. Иванова // Теория конфликта и ее приложения : материалы IV Всерос. науч.-техн. конф. Ч. II / сост. И.Я. Львович, Ю.С. Сербулов // АНОО ВИВТ; РосНОУ (ВФ). - Воронеж : Научная книга, 2006. - 363 с. - С. 170 - 181 (авт. объем - 0,4 печ. л.).

7. Актуальность использования отказоустойчивых кластерных систем в инфраструктуре / C.B. Данилкин, Ю.Ю. Громов, H.A. Земской, А.Н. Борисов // IV м!ждународна науково-практична конференщя «Динамка наукових дослщжепь -2005». - Т. 50. Соучаст ¡нформащйш технологи. - Дшпропетровськ : Наука i освгга, 2005. - 47 с. - С. 22-23 (авт. объем - 0,06 печ. л.).

8. К вопросу построения аналитических моделей информационных систем / C.B. Данилкин, Ю.Ю. Громов, Д.Е. Винокуров, A.B. Старущенко // междунар. конф. «Наука на рубеже тысячелетий» : сб. науч. ст. по материалам конф. 29-30 октября 2004 г. -Тамбов : Изд-во БМА, 2004. - С. 164-165 (авт. объем - 0,06 печ. л.).

Подписано в печать 05.05.2010 Формат 60 х 84/16. 0,93 усл. печ. л. Тираж 100 экз. Заказ № 257

Издательско-полиграфический центр ГОУ ВПО ТГТУ 392000, Тамбов, Советская, 106, к. 14

Оглавление автор диссертации — кандидата технических наук Данилкин, Сергей Владимирович

ОСНОВНЫЕ И УСЛОВНЫЕ СОКРАЩЕНИЯ И ОБОЗНАЧЕНИЯ.

ВВЕДЕНИЕ.

1 РЕШЕНИЕ ЗАДАЧ КЛАССИФИКАЦИИ И ПРОБЛЕМА НЕОПРЕДЕЛЕННОСТИ.

1.1 Общая постановка задачи классификации и основные направления ее решения.

1.2 Основные концепции неопределенности в задачах классификации.

1.2.1 Основы подхода к решению задач классификации с позиции теории нечетких множеств.

1.3 Постановка цели и задач исследования.

2 АНАЛИТИЧЕСКИЕ И ПРОЦЕДУРНЫЕ МОДЕЛИ ДЕКОМПОЗИЦИИ ЦЕЛЕВОГО ПРОСТРАНСТВА ИНФОРМАЦИОННЫХ МАССИВОВ И ПОСТРОЕНИЕ ОЦЕНКИ СЛОЖНОСТИ ИНФОРМАЦИОННЫХ МАССИВОВ.

2.1 Структура отношений на целевом пространстве информационных массивов.

2.2 Отображения целевого пространства информационных массивов.

2.3 Декомпозиция целевого пространства информационных массивов.

2.4 Функция оценки близости и метрики на декомпозиции целевого пространства информационных массивов.

2.5 Определение сложности.

2.6 Оценка сложности информационных массивов.

2.7 Декомпозиция целевого пространства информационных массивов по сложности.

2.8 Формулировка принципа сложности для информационного массива.

2.9 Оператор и функционал сложности информационного массива.

2.10 Критерий сложности построения информационного массива.

2.11 Критерий обобщенной эффективности.

2.12 Связь с теорией нечетких множеств.

Выводы по главе.

3 ФОРМИРОВАНИЕ ИНФОРМАЦИОННЫХ МАССИВОВ ДЛЯ

РЕШЕНИЯ ЗАДАЧИ КЛАССИФИКАЦИИ.

3.1 Методы оценки релевантности.

3.2 Формирование пространства информационных массивов.

3.3 Постановка задач выбора метода решения задачи классификации.

3.4 Результаты решения задачи классификации.

Выводы по главе.

Введение 2010 год, диссертация по документальной информации, Данилкин, Сергей Владимирович

Актуальность темы. На современном этапе развития общества, характеризующемся интенсивным внедрением информационных технологий, которые в большинстве своем основываются на использовании компьютерных сетей, особое значение приобретают задачи классификации сведений, получаемых из различных источников, одним из которых являются результаты работы информационно-поисковых машин (ИПМ). Использование информационно-поисковых машин в настоящее время приобретает особую значимость при нахождении сведений, необходимых для решения задач анализа, оптимизации, управления и принятия решений в различных сферах деятельности. Необходимость решения задач классификации сведений обусловлена неудовлетворительным качеством работы информационно-поисковых машин, результаты работы которых, в большинстве своем, не отранжированы по критерию релевантности и даже в тех случаях, когда этот критерий используется, отсутствует какая-либо группировка сведений, способствующая упрощению процесса их последующей обработки. Одной из основных особенностей задачи классификации сведений является наличие как качественных, являющихся источником неопределенности, так и количественных признаков в описании объектов исходного множества. При выделении однородных групп сведений, относящихся к объектам выбранной предметной области, различают такие виды группировки исходных данных, как структурная и типологическая. Структурная группировка представляет собой способ выделения количественно однородных групп объектов, а типологическая — способ выделения качественно однородных групп.

Методы выделения однородных групп сведений используют следующие основные подходы:

- вероятностный подход, основанный на предположении о том, что объекты, принадлежащие одному из выделяемых классов, описываются одинаково распределенными случайными векторами, а для различных классов характерны различные распределения вероятностей;

- вариативный подход, состоящий в разбиении множества объектов по выбранному исследователем признаку на интервалы группирования, в результате чего исходное множество объектов разбивается на группы таким образом, что объекты одной группы находятся на относительно небольшом расстоянии друг от друга;

- структурный подход, базирующийся на представлении об объектах как точках в многомерном пространстве, которое получило развитие в работах Солодовникова В.В., Дубова Ю.А., Якимца В.И., Кузьмина В.Б., Макарова И.М., Виноградской Т.М., Рубчинского A.A., Бирюкова В.Ф., Тумаркина В.И. и др.

Однако при этом не рассматривался процесс получения сведений, подлежащих классификации, основанный не только на результатах работы информационно-поисковых машин, но и на формировании соответствующих информационных массивов, используемых в дальнейшем для решения задач классификации сведений. Процессы построения информационных массивов при решении широкого класса задач рассматривались в работах Кузнецова H.A., Кульбы В.В., Норенкова И.П., Ковалевского С.С., Косяченко С.А., Цвиркуна А.Д., Павлова В.Б. и др., однако они не использовались для решения задачи классификации сведений в условиях неопределенности, методам и подходам раскрытия которых посвящены работы российских и зарубежных ученых Поспелова Д.А., Аверкина А.Н., Батыршина И.З., Блишуна А.Ф., Кузьмина В.Б., Борисова А.Н., Алексеева.А.В., а также Заде JI.A., Кофмана А. и др.

Таким образом, решение задачи классификации сведений, основанной на использовании сформированных специальным образом информационных массивов и выборе соответствующих методов их обработки в условиях неопределенности, является актуальным.

Цель работы: повысить эффективность процесса классификации сведений в условиях неопределенности путем формирования информационных массивов заданной сложности.

Задачи исследования:

• ввести в рассмотрение целевое пространство информационных массивов (ЦПИМ) для последующего построения процедур его декомпозиции;

• ввести в рассмотрение критерий сложности построения информационных массивов (ИМ);

• провести классификацию неопределенностей, имеющих место при решении задачи классификации, и обосновать выбор математического аппарата для их формализации;

• предложить и обосновать структуру информационного массива, удовлетворяющую предложенному критерию оценки сложности, учитывающую влияние факторов неопределенности при решении задачи классификации.

Объект исследования. Методы построения информационных массивов для решения задач классификации сведений.

Предмет исследования. Модели построения информационных массивов по критерию сложности для решения задачи классификации сведений в условиях неопределенности.

Методы исследования. Для решения поставленных задач в работе использованы методы системного анализа, теории нечетких множеств и математического программирования.

Научная новизна работы заключается в следующем:

- предложена формализация целевого пространства информационных массивов в виде кортежа из трех элементов, которыми являются множество информационных массивов, отвечающих общей цели, и определенные на нем отношения эквивалентности и частичной упорядоченности, что дало возможность построить процедуры декомпозиции; построены аналитические и процедурные модели декомпозиции информационных массивов, основанные на использовании предложенных типов взаимосвязи, определяемых отношениями эквивалентности, частичной упорядоченности и введенных в рассмотрение прототипах;

- предложен критерий оценки сложности информационного массива, построенный на основе использования характеристических функций, разбивающих целевое пространство информационных массивов на уровни декомпозиции;

- построена аналитическая модель выбора типа «много входов - один выход» (MISO), основанная на применении выбранных Т-норм, методов решения задачи классификации сведений из построенных информационных массивов в условиях неопределенности.

Практическая значимость полученных результатов заключается в использовании разработанного программного обеспечения, реализующего построенные процедурные модели решения задач классификации сведений, что позволяет существенно сократить время получения и поиска сведений в локальных и сетевых информационных системах.

Работа выполнена при поддержке Государственного контракта № П292 в рамках ФЦП «Научные и научно-педагогические кадры инновационной России на 2009-2013годы».

Реализация результатов работы осуществлена в ОАО «Пигмент», г.Тамбов; ООО «Совтех», г.Воронеж; Государственном образовательном учреждении высшего профессионального образования «Тамбовский государственный технический университет».

Положения, выносимые на защиту:

• формализация целевого пространства информационных массивов в виде кортежа из трех элементов, которыми являются множество информационных массивов, отвечающих общей цели, и определенные на нем отношения эквивалентности и частичной упорядоченности, позволяет построить процедуры его декомпозиции и повысить эффективность решения задачи классификации сведений;

• аналитические и процедурные модели декомпозиции целевого пространства информационных массивов, основанные на использовании предложенных типов взаимосвязи, определяемых отношениями эквивалентности, частичной упорядоченности и введенных в рассмотрение прототипах, дают возможность сформировать информационные массивы для решения задачи классификации;

• критерий оценки сложности информационного массива, построенный на основе использования характеристических функций, разбивающих целевое пространство информационных массивов на уровни декомпозиции, который позволяет осуществить построение информационного массива с заданными свойствами;

• аналитическая модель выбора типа MISO, основанная на применении Т-норм, методов решения задачи классификации сведений из построенных информационных массивов в условиях неопределенности, позволила автоматизировать процесс и сократить временные затраты.

Апробация работы. Основные результаты работы представлены и обсуждены на Всероссийских и международных научных конференциях "Наука на рубеже тысячелетий" (международная конференция, Тамбов, 2004), "Динамжа наукових дослщжень '2005" (IV м1ждународна науково-практична конференщя, Дншропетровськ, 2005), "Теория конфликта и ее приложения" (IV Всероссийская научно-техническая конференция, Воронеж, 2006), на семинарах кафедры "Информационные системы и защита информации" ГОУ ВПО ТГТУ и кафедры "Прикладная информатика" Тамбовского филиала Московского государственного университета культуры и искусств.

Объем и структура работы. Диссертация, общий объем которой составляет 204 страницы (основной текст - 153 страниц), состоит из введения, трех глав, заключения, списка используемых источников, включающего 249 наименований научных трудов на русском и иностранном языках, и 10 приложений. Диссертация содержит 25 рисунков и 12 таблиц.

Заключение диссертация на тему "Модели построения информационных массивов для решения задачи классификации сведений в условиях неопределенности"

Выводы по главе

- в данной главе представлены характеристики наиболее распространенных информационно-поисковых машин, которые в последующем используются для решения задачи классификации сведений;

- построена процедурная модель процесса поиска сведений, дающая возможность в кратчайшие временные рамки получить достаточно полную информацию по введенному запросу за счет построения ИМ и решения задачи классификации сведений;

- поставлена задача выбора метода кластеризации и предложена процедурная модель ее решения;

- поставлена и решена задача кластеризации сведений о русском математике Колмогорове и оценена эффективность реализации разработанных процедурных моделей на основе использования предложенного критерия.

ЗАКЛЮЧЕНИЕ

При решении задачи классификации сведений в условиях неопределенности были решены следующие задачи:

• предложена формализация целевого пространства информационных массивов в виде кортежа из трех элементов, которыми являются множество информационных массивов, отвечающих общей цели, и определенные на нем отношения эквивалентности и частичной упорядоченности, что дало возможность построить процедуры его декомпозиции с целью повышения эффективности решения задачи классификации сведений;

• построены аналитические и процедурные модели декомпозиции, основанные на использовании предложенных типов взаимосвязи, определяемых отношениями эквивалентности, частичной упорядоченности и введенных в рассмотрение прототипах, что позволило сформировать информационные массивы с заданными свойствами для решения задачи классификации; •

• предложен критерий оценки сложности информационного массива, построенный на основе использования характеристических функций, разбивающих целевое пространство информационных массивов на уровни декомпозиции, использование которого дало возможность организовать информационный массив с заданными свойствами;

• разработана аналитическая модель выбора типа MISO, основанная на применении обоснованно выбранных Т-норм, методов решения задачи классификации сведений построенных информационных массивов в условиях неопределенности;

• результаты проведенных экспериментальных исследований дали возможность сделать вывод о повышении эффективности решения задачи классификации сведений на 32,5% вследствие применения построенных в работе аналитических и процедурных моделей формирования информационных массивов и проведения декомпозиции.

Библиография Данилкин, Сергей Владимирович, диссертация по теме Информационные системы и процессы, правовые аспекты информатики

1. Ожегов С.И. Словарь русского языка: Ок. 57000 слов / Под ред. Н.Ю.Шведовой. — 17-е изд., стереотип. — М.: Русский язык. — 1985. —797с.

2. Кузьмин В.Б. Построение групповых решений в пространствах четких и нечетких бинарных отношений. — М: Наука, Гл. ред. физ.-мат. лит.— 1982. — 168 с.

3. Бурбаки Н. Теория множеств. — М.: Мир. — 1965. — 268 с.

4. Айгнер М. Комбинаторная теория. — М.: Мир. — 1982. — 190 с.

5. Алгебраическая теория автоматов, языков и полугрупп / Под ред. М. Арбиба; Пер. с англ. — М.: Статистика. — 1975. — 347 с.

6. Иванов H.H., Михайлов Г.И., Руднев В.В., Таль A.A. Конечные автоматы: эквивалентность и поведение. — М.: Наука. — 1984. — 292 с.

7. Елисеева И.И., Рукавишников В.О. Группировка, корреляция, распознавание образов (Статистические методы классификации и измерения связей) — М.: Статистика. — 1977.— 144 с. .

8. Мандель ИД. Кластерный анализ.— М.: Финансы и статистика. — 1988. —176 с.

9. Кузьмин В.Б. Построение групповых решений в пространствах четких и нечетких бинарных отношений. — М.: Наука. — 1982. —174 с.

10. Ляпин Е.С. Полугруппы. — М.: Физматгиз. — 1960. — 272 с.

11. Куратовский К., Мостовский А. Теория множеств. — М.: Мир. — 1970. — 190 с.

12. Биркгоф Г., Барти Т. Современная прикладная алгебра. — М.: Мир.— 1976, —310с.

13. Hartigan J.A. Clustering Algorithms. New York: John Wiley & Sons. — 1975.

14. Фукунага К. Введение в статистическую теорию распознавания образов / Пер. с англ. — М.: Наука. — 1979 — 368 с.

15. Wong М.А. A Hybrid Clustering Method for Identifying High-Density Clusters // Journal of American Statistical Association.— 1982.— Vol. 77.— pp.841-847.

16. Owsinski J.W. On a New Naturally Indexed Quick Clustering Method with a.

17. Global Objective Function // Applied Stochastic Models and Data Analysis.— 1990.--.1. Vol. 6.—pp. 157-171.

18. Owsinski J.W., Zadrozny S. Ecological Site Classification: An Application oiff Clustering. Reply to a Problem Proposed by H. El-Shishiny at the Fourth Internationa^. Symposium on Applied Stochastic Models and Data Analysis, Nancy, France^

19. December 7-9, 1988 // Applied Stochastic Models and Data Analysis.— 1991-1. Vol.7.—pp.273-279.

20. Owsinski J.W. Clustering — Modelling, Capacities, Limits, Applications // Control and Cybernetics.-1995.— Vol. 24.— pp.391-397.

21. Шлезингер М.И. О самопроизвольном различении образов // Читающрз;е автоматы. —Киев: Навукова думка. — 1965. — С. 38-65.

22. Миленький А. В. Классификация сигналов в условиях неопределенности — М.: Сов. Радио. — 1975.— 328 с.

23. Жук Е.Е., Харин Ю.С. Устойчивость в кластер-анализе многомернь.:сх наблюдений. — Мн.: Белгосуниверситет. — 1998.— 240 с.

24. С.А. Айвазян, В.М. Бухштабер, И.С. Енюков, Л.Д. Мешалкин. Прикладцая статистика: Классификация и снижение размерности: Справ, изд./ Под ред. С.^ Айвазяна.— М.: Финансы и статистика. — 1989.— 607 с.

25. Батыршин И.З. Кластеризация на основе размытых отношений сходства // Управление при наличии расплывчатых категорий: Тезисы докладов 3-го научно-технического семинара. — Пермь. — 1980. — С.25-27.

26. Батыршин И.З., Вагин В.Н. Алгоритмы кластеризации, основывающиеся на понятии неразличимости объектов // Управление при наличии расплывчатыхкатегорий: Тезисы докладов 4-го научно-технического семинара. — Фрунзе.1981.—С. 79.

27. Батыршин И.З. Иерархические алгоритмы выделения классов толерантности в задачах классификации // Применение вероятностно-статистических методов в бурении и нефтедобыче: Тезисы докладов IV Всесоюзной конференции. — Баку. — 1984.— С. 16-17.

28. Батыршин И.З., Халитов Р.Г. Иерархическая классификация на базе классов толерантности // Исследование операций и аналитическое проектирование в технике. —Казань: КАИ. — 1987.— С. 105-110.

29. Батыршин И.З. О декомпозиции нечетких отношений эквивалентности // Математические и экспериментальные методы синтеза технических систем. — Казань: КАИ. — 1989,— С.21-27.

30. Батыршин И.З., Морозов В.А., Халитов Р.Г. КЛАСТИЕР — программная система иерархической классификации // Статистический и дискретный анализ данных и экспертное оценивание: Материалы IV Всесоюзной школы-семинара. — Одесса. — 1991.—С. 319-321.

31. Берштейн Л.С., Дзюба Т.А. Решение задач классификации на нечетких графах // Новости искусственного интеллекта.— 2000.— № 3.— С. 113-121.

32. Заде Л.А. Размытые множества и их применение в распознавании образов и кластер-анализе // Классификация и кластер / Под ред. Дж. Вэн Райзина; пер с англ.; под ред. Ю.И.Журавлева. — М: Мир. — 1980,— С. 208-247.

33. Нгуен М.Х. Применение нечетких отношений в классификации // Нечеткие системы поддержки принятия решений: Сборник научных трудов.— Калинин: Калининский государственный университет. — 1989. — С. 99-107.

34. Руспини Э.Г. Последние достижения в нечетком кластер-анализе // Нечеткие множества и теория возможностей: Последние достижения / Под ред. Рональда Р. Ягера; Пер. с англ. В.Б. Кузьмина; Под ред. СИ. Травкина.— М: Радио и связь. — 1986 —С. 114-132.

35. Вятченин Д.А. Основные концепции неопределенности в задачах автоматической классификации // Полигнозис. — 2002. — № 3. — С. 160-167.

36. Вятченин Д.А. Формы проявления нечеткости // Гуманитарно-экономический вестник. —1998. — № 1. — С.66-69.

37. Аверкин АН. Нечеткое отношение моделирования и его использование для классификации и аппроксимации в нечетких лингвистических пространствах // Известия АН СССР. Техническая кибернетика. — 1982.— № 2 — С.215-217.

38. Вятченин Д.А. Содержательная интерпретация нечетких отношений сходства. // Полигнозис. — 2001. —№ 1. — С. 20-25.

39. Каркищенко А.Н., Бутенков С.А., Кривша В.В. Нечеткие геометрические признаки в задачах классификации и кластеризации // Новости искусственного интеллекта.— 2000.— №3.— С. 129-133.

40. А.Н.Аверкин, И.З.Батыршин, А.Ф.Блишун и др. Нечеткие множества в моделях управления и искусственного интеллекта / под ред. Д.А.Поспелова. — М.: Наука, гл. ред. физ.-мат. лит. — 1986. —312с.

41. Тарасов В.Б., Желтов С.Ю., Степанов А.А. Нечеткие модели в обработке изображений: обзор зарубежных достижений // Новости искусственного интеллекта.— 1993.—№ 3.— С.40-64.

42. Данлоп С. Азбука звездного неба / Пер. с англ. — М.: Мир. — 1990.— 240с.

43. Литтл Р.Дж.А., Рубин Д.Б. Статистический анализ данных с пропусками / Пер. с англ. — М.: Финансы и статистика. — 1990.— 336 с.

44. Кофман А. Введение в теорию нечетких множеств / Пер. с фр.; Под ред. СИ. Травкина.— М.: Радио и связь. — 1982. —432 с.

45. Bortolan G., Degani R. Ranking of Fuzzy Alternatives in Electrocardiography // Fuzzy Information, Knowledge Representation and Decision Analysis / Ed. by E. Sanchez and M.M. Gupta. — Oxford: Pergamon Press. — 1983.— pp. 397-402.

46. Dunn J.C. A Graph Theoretic Analysis of Pattern Classification via Tamura's Fuzzy Relation // IEEE Transactions on Systems, Man, and Cybernetics. — 1974. — Vol. SMC-4. —pp.310-313.

47. Dunn J.C. A Fuzzy Relative of the ISODATA Process and Its Use in Detecting Compact Well-Separated Clusters // Journal of Cybernetics. —■ 1974. —- Vol.3. — pp.32-57.

48. Dunn J.C. Well-separated Clusters and the Optimal Fuzzy Partitions // Journal of Cybernetics. — 1974. — Vol.4, — pp.95-104.

49. Dunn J.C. Some Recent Investigations of a New Fuzzy Partitioning Algorithm and Its Application to Pattern Classification Problems // Journal of Cybernetics. — 1974. —Vol.4. —pp.1-15.

50. Koczy L.T., Hajnal M. A New Fuzzy Calculus and Its Applications as a Pattern Recognition Technique // Modern Trends in Cybernetics and Systems / Ed. by J. Rose, C. Bilciu. — Berlin: Springer-Verlag. — 1977.—pp. 103-118.

51. Kumar A. A Real-Time System for Pattern Recognition of Human Sleep Stages by Fuzzy Systems Analysis // Pattern Recognition. — 1977.— Vol.9.— pp.43-46.

52. Michalski R.S. Pattern Recognition as Rule-Guided Inductive Inference // IIIEE Transactions of Pattern Analysis Machines Intelligent.— 1980.— Vol. PAMI-2.— pp.349-361.

53. Pienkowski A.E. Artificial Color Perception Using Fuzzy Techniques in Digital Image Processing. Koln: Verlag TUV Rheinland; 1989.

54. Roubens M. Pattern Classification Problems and Fuzzy Sets // Fuzzy Sets and Systems.— 1978.— Vol. 1.— pp.239-253.

55. Shimura M. Applications of Fuzzy Set Theory to Pattern Recognition // Journal of AACE.— 1975.— Vol. 19.— pp.243-248.

56. Chang R.L.P., Pavlidis T. Fuzzy Decision-Tree Algorithms // IEEE Transactions on Systems, Man, and Cybernetics. — 1977. —Vol. SMC-7. —pp.28-35.

57. Hoppner F., Klawonn F., Kruse R. Fuzzy-Clusteranalyse. Verfahren fur die Bilderkennung, Klassifikation und Datenanalyse. Wiesbaden, Braunschweig: Vieweg Verlag. —1997.

58. Lee E.T. Proximity Measures For the Classification of Geometric Figures // Journal of Cybernetics.— 1972.— Vol.2.— pp.43-59.

59. Lee E.T. Application of Fuzzy Languages to Pattern Recognition // Kybernetes.— 1977 — Vol.6.— pp. 167-173.

60. Lee E.T. Fuzzy Tree Automata and Syntactic Pattern Recognition // IEEE Transactions of Pattern Analysis Machines Intelligent.— 1982.— Vol. PAMI-4.— pp.445-449.

61. Nath A.K., Lee T.T. On the Design of a Classifier With Linguistic Variables As Inputs //Fuzzy Sets and Systems.— 1983.— Vol.11.— pp. 265-286.

62. Nath A.K., Liu S.W., Lee T.T. On Some Properties of a Linguistic Classifier // Fuzzy Sets and Systems.—1985.— Vol.17.— pp. 297-311.

63. Siy P., Chen C.S. Fuzzy Logic For Handwritten Numerical Character

64. Recognition // IEEE Transactions on Systems, Man, and Cybernetics.— 1974.1. Vol.SMC-4.— pp.570-575.

65. Sanchez E. Resolution of Composite Fuzzy Relation Equations // Information and Control.— 1976.— Vol.30.— pp.38-48.

66. Tamburrini G., Termini S. Some Foundational Problems in the Formalization of Vagueness // Fuzzy Information and Decision Processes / Ed. by M.M.Gupta, E.Sanchez. — Amsterdam: North-Holland Publishing Company, 1982.— pp. 161-166.

67. Ruspini E.H. A New Approach to Clustering // Information and Control.1969.— Vol.15.—pp.22-32.

68. Duin R.P.W. The Use of Continuous Variables for Labeling Objects // Pattern Recognition Letters. — 1982. — Vol.1. — pp. 15-20.

69. Dumitrescu D. Hierarchical Pattern Classification // Fuzzy Sets and Systems.1988 — Vol.28. — pp.145-162.

70. Gesu D.V., Maccarone M.C. Feature Selection and Possibility Theory // Pattern Recognition. — 1986. — Vol. 19. — pp.63-72.

71. Huntsberger T.L., Rangarajan Ch., Jayaramurthy S.N. Representation of Uncertainty in Computer Vision Using Fuzzy Sets // IEEE Transactions on Computers.— 1986.— Vol.C-3 5.— pp. 145-156.

72. Jajuga K. Li-norm Based Fuzzy Clustering // Fuzzy Sets and Systems. —- 1993, — Vol.39. — pp.43-50.

73. Jajuga K. Optimization in Fuzzy Clustering // Control and Cybernetics.1995.—Vol. 24.—pp.409-419.

74. Kandel A. Fuzzy Techniques in Pattern Recognition. New York: John Wiley & Sons. — 1982.

75. Kaufman L., Rousseeuw PJ. Finding Groups in Data: An Introduction to Cluster Analysis. New York: John Wiley & Sons. — 1990.

76. Kharin Yu.S. Robustness in Statistical Pattern Recognition. Dordrecht: Kluwer Academic Publishers. — 1996.

77. Libert G., Roubens M. Non-metric Fuzzy Clustering Algorithms And Their Cluster Validity // Approximate Reasoning in Decision Analysis / Ed. by M.M.Gupta, E.Sanchez. — Amsterdam: North-Holland Publishing Company. — 1982.— pp.417425.

78. Libert G. Compactness and Number of Clusters // Control and Cybernetics.— 1986.—Vol. 15.—pp.205-212.

79. Lim Y.W., Lee S.U. On the Color Image Segmentation Algorithm Based on the Thresholding and the Fuzzy c-Means Techniques // Pattern Recognition.— 1990.— Vol.23.— pp.935-952.

80. Lopez de Mantaras R., Aguilar Martin J. Classification and Linguistic Characterization of Nondeterministic Data // Pattern Recognition Letters.— 1983.— Vol. 2.— pp.33-41.

81. Lou S.-P., Cheng W.-C, Chao L.-M. Two New Methods m Fuzzy Cluster // Approximate Reasoning in Decision Analysis / Ed. by M.M.Gupta, E.Sanchez. — Amsterdam: North-Holland Publishing Company. — 1982. —pp.427-430.

82. Majumder D.K.D., Pal S.K. Fuzzy Mathematical Approach to Pattern Recognition. Delhi: Wiley Eastern Ltd. — 1985.

83. Miyakoshi M., Shimbo M. Solutions of Composite Fuzzy Relational Equations with Triangular Norms // Fuzzy Sets and Systems. — 1985.— Vol.16.— pp.53-63.

84. Miyamoto S. Fuzzy Sets in Information and Retrieval and Cluster Analysis. Dordrecht: Kluwer Academic Publishers. — 1990.

85. Miyamoto S., Agusta Y. An Efficient Algorithm for Li Fuzzy c-Means and Its Termination // Control and Cybernetics.-1995.— Vol. 24.— pp.421-436.

86. Radecki T. Level fuzzy sets // Journal of Cybernetics.-1977.— Vol.7.— pp.189-198.

87. Saitta L., Torasso P. Fuzzy Characteristics of Coronary Disease // Fuzzy Setsand Systems.— 1981.— Vol.5.— pp.245-258.

88. Seif A., Aguilar-Martin J. Multi-Group Classification Using Fuzzy Correlation

89. Fuzzy Sets and Systems.-1980 — Vol.3.— pp. 109-122.

90. Tamura S., Higuchi S., Tanaka K. Pattern Classification Based on Fuzzy Relations // IiiEE Transactions on Systems. Man, and Cybernetics.— 1971.—1. Vol.SMC-1.—pp.61-66.

91. Termini S. Aspects of Vagueness and Some Epistemological Problems Related to Their Formalization // Aspects of Vagueness/Ed, by H.J. Skala, S. Termini, E. Trillas — Dordrecht: D.Reidel Publishing Company, 1984.—pp.205-230.

92. Tou J.T. An Approach to Understanding Geometrical Configurations by Computer // International Journal of Computer and Information Sciences.— 1980.—1. Vol.9., N2.— pp.1-13.

93. Trauwaert E. On the Meaning of Dunn's Partition Coefficient for Fuzzy Clusters

94. Fuzzy Sets and Systems.— 1988.— Vol.25.— pp.217-242.

95. Trauwaert E., Kaufman L., Rousseeuw P. Fuzzy Clustering Algorithms Based on the Maximum Likelihood Principle// Fuzzy Sets and Systems.— 1991.— Vol.42.— pp.213-227.

96. Trivedi M.M., Bezdek J.C. Low-level Segmentation of Aerial Images with Fuzzy Clustering // IIIEE Transactions on Systems, Man, and Cybernetics, 1986, vol. SMC-16, pp.589-596.

97. Trivedi M.M. Analysis of Aerial Image Using Fuzzy Clustering // Analysis of Fuzzy Information / Ed. by J.C. Bezdek. — CDC Press, 1987, Vol.3.—pp. 133-151.

98. Vatlin S.I. Selfguessing Fuzzy Classifiers // Informatica.— 1993.— Vol.4.—pp.406-414.

99. Vatlin S.I. The Covariant Monotonic Improvement of Fuzzy Classifiers is Impossible // Neural Network World.—1996.— Vol.6.— pp.401-406.

100. Vatlin S.I. The Structure of the Improvement of Consistently Fuzzy Classifiers // Pattern Recognition and Information Processing: Proceedings of Fourth International Conference (20-22 May 1997 Minsk, Republic of Belarus). Vol. 2. /Ed. by V.

101. Krasnoproshin et al. — Szczecin: Wydawnictwo Uczelniane Politechniki Szczecinskiej, 1997.—pp.87-90.

102. Viattchenirt D.A. Fuzziness As A Theoretical Concept // Proceedings of the European Symposium on Intelligent Techniques, March 20-21, 1997, Ban, Italy.— Aachen: ERUDIT Service Center, 1997.—pp.258-260.

103. Viattchenin D.A. Theoretical Notes on Fuzzy Intolerances. // Pattern Recognition and Information Processing: Proceedings of Sixth International Conference15.17 May 2001, Minsk, Republic of Belarus). Vol. 2/Ed. by S. Ablameyko et al.

104. Minsk, Institute of Engineering Cybernetics of the National Academy of Sciences of Belarus, 2001. — pp. 142-146.

105. Vila M.A., Delgado M. Problems of Classification in a Fuzzy Environment // Fuzzy Sets and Systems.— 1983.— Vol.3.— pp. 229-239.

106. Walesiak M. Ugolniona Miara Odleglosci w Statystycznej Analizie Wielowymiarowej. Wroclaw: Wydawnictwo AE; 2002.

107. Wang X., Chen В., Qian G., Ye F. On the Optimization of Fuzzy Decision Trees // Fuzzy Sets and Systems.— 2000.— Vol. 112.— pp.117-125.

108. Watada J., Tanaka H., Asai K. A Heuristic Meihod of Hierarchical Clustering for Fuzzy Intransitive Relations // Fuzzy Set and Possibility Theory / Ed. by R.R.Yager.— New York: Pergamon Press, 1982.— pp. 148-166.

109. Watanabe S. Pattern Recognition: Human and Mechanical. New York: Jonh Wiley & Sons; 1985.

110. Windham M.P. Cluster Validity for Fuzzy Clustering Algorithms // Fuzzy Sets and Systems— 1981.—Vol.2.—pp. 177-186.

111. Windham M.P. Geometric Fuzzy Clustering Algorithms // Fuzzy Sets and Systems.—1983.—Vol.3.—pp. 271-280.

112. Windham M.R. Numerical Classification of Proximity Data with Assignment Measures // Journal of Classification.— 1985.— Vol.2.— pp.l 57-172.

113. Woodbury M.A., Clive J. Clinical Pure Types as a Fuzzy Partition // Journal of Cybernetics.— 1974—Vol. 3. —pp. 111-121.

114. Wright W. A Formalization of Cluster Analysis // Pattern Recognition Letters. — 1975.—Vol. 5.—pp.273-282.

115. Yeh R.T., Bang S.Y. Fuzzy Relations, Fuzzy Graphs and Their Applications to Clustering Analysis // Fuzzy Sets and Their Applications to Cognitive and Decision Processes / Ed. by L.A. Zadeh and al. — New York: Academic Press. — 1975 — pp.125-149.

116. Yuan Y., Shaw M.J. Induction of Fuzzy Decision Trees // Fuzzy Sets and Systems.—1995.—Vol.69.— pp.125-139.

117. Zadeh L.A. Fuzzy Sets // Information and Control.— 1965.— Vol.8.— pp.338356.

118. Zadeh L.A. Similarity Relations and Fuzzy Ordermgs // Information Sciences. —1971.— Vol.3.— pp. 177-200.

119. Anderson E. The Irises of the Gaspe Peninsula // Bulletin of the American Iris Society. — 1935. — Vol. 59. — pp.2-5.

120. Логашев В.Г. Технологические основы гибких автоматических производств. — JL: Машиностроение. — 1985. —124 с.

121. Шрейдер Ю.А. Равенство, сходство, порядок. — М.: Наука. — 1971. —-350 с.

122. Автоматизация проектирования сложных систем / Сборник ЛИТМО.— Л1986. — 187 с.

123. Мамиконов А.Г., Авен О.И., Кульба В.В., Косяченко С. А. Формализованное представление результатов анализа и проектирование автоматизированных систем управления. — М.: ИЛУ РАН. — 1970. — 40 с.

124. Обработка нечеткой информации в системах принятия решений / A.ti. Борисов, А.В. Алексеев. Г.В. Меркурьева и др. — М.: Радио и связь, 1989. —304с.

125. К.Асаи, Д.Ватада, С.Иваи и др. Прикладные нечеткие системы. / Под ред. Т.Тэрано, К.Асаи, М.Сугэно; Пер. с япон. — М.: Мир. — 1993. —368с.

126. Кофман А. Введение в теорию нечетких множеств. — М.: Радио и связь.1982,—146 с.

127. Аверкин А.Н., Тарасов В.Б. Нечеткое отношение моделирования и его применение в психологии и искусственном интеллекте. — М: Вычислительный центр АН СССР. — 1986.—36 с.

128. Лейбкинд А.Р., Рудник Б.Л., Тихомиров А.А. Математические методы имодели формирования организационных структур управления. — М: МГУ.-1982. —232 с.

129. Bellman R., Kalaba R., Zadeh L.A. Abstraction and Pattern Classification // Journal of Mathematical Analysis and Applications. — 1966. — Vol. 13. — pp. 1-7.

130. Behr D., Kocher R., Strackeljan J. Fuzzy Pattern Recognition for Automatic Detection of Different Teeth Substances // Fuzzy Sets and Systems. — 1997. — Vol.85.pp.275-286.

131. Bezdek J.C, Harris J.D. Fuzzy Partitions and Relations: An Axiomatic Basis for Clustering // Fuzzy Sets and Systems. —1978. —Vol.1. —pp.111-127.

132. Dave R.N., Sen S. Robust Fuzzy Clustering of Relational Data // IEEE Transactions on Fuzzy Systems. — 2002. — Vol. 10. — pp.713-727.

133. Заде JI.А. Понятие лингвистической переменной и его применение к принятию приближенных решений / Пер. с англ.; под ред. Н.Н.Моисеева и С.А.Орловского.—-М: Мир. — 1976.—165 с.

134. Вятченин Д.А. О пересечении нечетких кластеров // Интегрированные модели и мягкие вычисления в искусственном интеллекте: Сборник трудов Международного научно-практического семинара, Коломна, 17-18 мая 2001. — М.: Наука, Физматлит. — 2001.—С. 122-126.

135. Bellacicco A. Fuzzy Classification// Synthese — 1976.— Vol. 33.— pp.273281.

136. Блишун А.Ф. Отношение сходства нечетких понятий-классов // Управление при наличии расплывчатых категорий // Тезисы докладов 4-го научно-технического семинара.— Фрунзе. — 1981.— С. 79.

137. Bezdek J.C, Hathaway R.J., Howard R.E., Wilson С.A. Coordinate Descent and Clustering // Control and Cybernetics. — 1986. — Vol. 15. — pp. 195-204.

138. Chakrabarty M.K., Das M. On Fuzzy Equivalence. Part 1 // Fuzzy Sets and Systems. — 1983.—Vol.11.—pp. 185-194.

139. Chakrabarty M.K., Das M. On Fuzzy Equivalence. Part 2 // Fuzzy Sets and Systems. — 1983. — Vol.11. — pp.299-308.

140. Degani R., Bortolan G. Fuzzy Numbers in Computerized Electrocardiography // Fuzzy Sets and Systems.— 1987.— Vol. 24.— pp.345-362.

141. Dubes R.C., Jain A.K. Clustering Techniques: The User's Dilemma // Pattern Recognition. — 1976.— Vol. 8, —pp.247-260.

142. Dubois, D.; Jaulent, M.C. Some Techniques for Extracting Fuzzy Regions // Proceedings of First IFSA Congress (July 1-6, 1985, Mallorca, Spain). Vol. П / Mallorca. — 1985, — pp.112-128.

143. Gitman J. An Algorithm for Nonsupervised Pattern Classification // IEEE Transactions on Systems, Man, and Cybernetics. — 1973.— Vol. SMC-3. — pp.66-74.

144. Gitman J., Levine M.D. An Algorithm for Detecting Unimodal Fuzzy Sets and Its Application as a Clustering Technique // IEEE Transactions on Computers.-- 1970.1. Vol. C-19. — pp.583-593.

145. Hirota K. Concepts of Probabilistic Sets // Fuzzy Sets and Systems. — 19811. Vol.1.—pp.31-46.

146. Hirota K., Pedrycz W. Characterization of Fuzzy Clustering Algorithms in Terms of Entropy of Probabilistic Sets // Pattern Recognition Letters.— 1984.--Vol 2pp. 213-216.

147. Jain R. Applications of Fuzzy Sets for the Analysis of Complex Scenes // Advances of Fuzzy Set Theory and Applications / Ed. by M.M. Gupta. — Amsterdam: North-Holland Publishing Company. — 1979. —pp. 577-587.

148. Kaymak U., Semes M. Fuzzy Clustering With Volume Prototypes and Adaptive Cluster Merging // IEEE Transactions on Fuzzy Systems.— 2002.— Vol. 10 —- pp.705712.

149. Ruspini E.H. Numerical Methods for Fuzzy Clustering // Information Sciences.— 1970.— Vol.2.— pp.319-350.

150. Ruspini E.H. Optimization in Sample Descriptions — Data Reduction and Pattern Recognition Using Fuzzy Clustering // IEEE Transactions on Systems, Man, and Cybernetics.— 1972.— Vol.SMC-2.— pp.541.

151. Ruspini E.H. New Experimental Results in Fuzzy Clustering // Information Sciences.— 1973.—Vol.6.—pp.273-284.

152. Gitman J. An Algorithm for Nonsupervised Pattern Classification // IEEE Transactions on Systems, Man, and Cybernetics. — 1973.— Vol. SMC-3. —pp.66-74.

153. Bezdek J.C. Cluster Validity with Fuzzy Sets // Journal of Cybernetics — 1974.1. Vol.3. —pp.58-73.

154. Bezdek J.C. Numerical Taxonomy With Fuzzy Sets // Journal of Mathematical Biology. — 1974. — Vol.1. — pp.57-71.

155. Bezdek J.C, Dunn J.C. Optimal Fuzzy Partitions: A Heuristic for Estimating the Parameters in a Mixture of Normal Distributions // ШЕЕ Transactions on Computers.1975. —Vol. C-24. — pp.835-838.

156. Bezdek J.C. A Physical Interpretation of Fuzzy ISODATA // IEEE Transactions on Systems, Man, and Cybernetics. — 1976. — Vol. SMC-6. — pp.387-389.

157. Bezdek J.C, Castelaz P.F. Prototype Classification and Feature Selection with Fuzzy Sets // IEEE Transactions on Systems, Man, and Cybernetics. — 1977.— Vol. SMC-7.— pp.87-92.

158. Bezdek J.C, Windham M.P., Ehrlich R. Statistical Parameters of Cluster Validity Functionals // International Journal of Computer Information Sciences. — 1980. — Vol. 9. —pp.323-336.

159. Bezdek J.C, Tsao E.C.-K., Pal N.R. Fuzzy Kohonen Clustering Networks // Proceedings of the IEEE International Conference on Fuzzy Systems.— San Diego. — 1992.—pp. 1035-1043.

160. Bortolan G., Degani R., Hirota K., Pedrycz W. Classification of ECG Signals

161. Utilization of Fuzzy Pattern Matching // Proceedings of International Workshop on Fuzzy Systems Application. — Iizuka. — 1988. — p.88.

162. Couturier A., Fioieau B. Recognising Stable Corporate Groups: A Fuzzy Classification Method // Fuzzy Economic Review. — 1997. — Vol. II. — pp.35-45.

163. Di Mori R., Laface P. Use of Fuzzy Algorithms for Phonetic and Phonenic Labeling of Continuous Speech // IEEE Transactions of Pattern Analysis Machines Intelligent. — 1980.— Vol. PAMI-2. — pp. 136-148.

164. Gustafson D.E., Kessel W.C. Fuzzy Clustering With a Fuzzy Covariance Matrix // Advances in Fuzzy Set Theory and Applications / Ed. by M.M. Gupta, R.K. Ragade, R.R. Yager. — Amsterdam: North-Holland Publishing Company. — 1979. — pp.605620.

165. Hirota K., Iwami K., Pedrycz W. FCM-AD (Fuzzy Cluster Means with Additional Data) and Its Application to Aerial Images // Proceedings of n JJFSA Congress. Vol. n.—Tokyo. — 1987.—pp.729-732.

166. Huntsberger T.L., Jacobs C.L., Cannon R.L. Iterative Fuzzy Image Segmentation//Pattern Recognition.— 1985.— Vol. 18.— pp. 131 -138.

167. Кузнецов H.A., Кульба B.B., Ковалевский С.С., Косяченко С.А. Методы анализа и синтеза модульных информационно-управляющих систем. — М.: Физматлит. —2002. — 800 с.

168. Кульба В.В., Ковалевский С.С., Косяченко С.А., Сиротюк В.О. Теоретические основы проектирования оптимальных структур распределенных баз данных. — М.: Синтег. —1999. — 660 с.

169. Kotoh К., Hiramatsu К. A Representation of Pattern Classes Using the Fuzzy Sets // Systems Computers Controls. — 1973.— Vol.1-8.— pp.275-282.

170. Александрян P.А., Мирзаханян Э.А. Общая топология. M.: Высшая школа. — 1979. — 224 с.

171. Биркгоф Г. Теория структур. — М.: ИЛ. — 1952. — 385 с.

172. Биркгоф Г. Теория решеток. — М.: Наука. — 1984. — 397 с.

173. Ван дер Варден Б.Л. Алгебра. — М.: Наука. — 1979. — 270 с.

174. Келли Дж.Л. Общая топология. — М.: Наука. — 1981. — 387 с.

175. Hirota К. The Bounded Variation Quality and Its Application to Feature Extraction // Pattern Recognition.— 1982.— Vol.2.— pp.93-101.

176. Hirota K. Ambiguity Based on the Concept of Subjective Entropy // Fuzzy Information and Decision Processes / Ed. by M.M. Gupta, E. Sanchez. — Amsterdam: North-Holland Publishing Company. — 1982.— pp. 29-40.

177. Hirota K., Pedrycz W. Subjective Entropy of Probabilistic Sets and Fuzzy Cluster Analysis // ШЕЕ Transactions on Systems, Man, and Cybernetics.— 1986. — Vol. SMC-16.—pp. 173-179.

178. Калман P., Фалб П., Арбиб M. Очерки по математической теории систем. — М.: Мир. — 1971. — 254 с.

179. Klir G.J., Folger T. Fuzzy Sets, Uncertainty and Information. NJ: Prentice Hall.1988.

180. Курош А.Г. Лекции по общей алгебре. —M.: Физматгиз. — 1973. — 175 с.

181. Скорняков Л.А. Элементы алгебры. —М.: Наука. — 1980. — 187 с.

182. Скорняков Л.А. Элементы теории структур. —М.: Наука. — 1982. — 212с.

183. Солодовников В.В., Бирюков В.Ф., Тумаркин В.И. Принцип сложности в теории управления. — М.: Наука. — 1977. — 189 с.

184. Солодовников В.В., Тумаркин В.И. Принципы синтеза функционально резервированных ИС //Изв. вузов. Приборостроение. — 1984. — Вып. 27, №9. —-С. 21-30.

185. Солодовников В.В. Об автоматизации проектирования систем управления технологическими процессами // Изв. вузов. Приборостроение. — 1977. — T. XX, № 10.— С. 24-34.

186. Солодовников В.В. Статистическая динамика линейных систем автоматического управления. —М.: Физматгиз. — 1960. — 175 с.

187. Солодовников В.В., Ленский В.Л. Принцип минимальной сложности и регуляризации задач синтеза систем управления // Современные методы проектирования систем автоматического управления. — М.: Машиностроение. — 1967. —С. 79-90.

188. Солодовников В.В., Тумаркин В.И. Принцип синтеза динамически резервированных ИС // ДАН. — 1981. — Т. 258, № 2. — С. 308-310.

189. Солодовников В.В., Тумаркин В.И. Критерий относительной сложности систем управления и его применение к синтезу линейных нестационарных ИС с учетом надежности подсистем обработки информации // Техническая кибернетика. — 1975. — № 6. — С. 158-167.

190. Солодовников В.В., Тумаркин В.И. Системный синтез и теория сложности // Информатика, управление, вычислительная техника. — М.: Машиностроение.1987.—Вып. 1. —С. 57-68.

191. Балакришнан . А. Введение в теорию оптимизации в гильбертовом пространстве. —М.: Мир. — 1974. — 276 с.

192. Макаров И.М., Виноградская Т.М., Рубчинский А.А., Соколов В.Б. Теория выбора и принятия решений. — М.: Наука. — 1982. — 218 с.

193. Дубов Ю.А., Травкин С.И., Якимец В.И. Многокритериальные модели формирования и выбора вариантов систем. — М.: Наука. — 1986. — 423 с.

194. Касти Дж. Большие системы: связность, сложность и катастрофы: Пер. с англ. — М.: Мир. — 1982. — 375 с.

195. Пападимитриу X., Стайглиц К. Комбинаторная оптимизация. Алгоритмы и сложность. — М.: Мир. — 1985. — 289 с.

196. Марков А.А. Введение в теорию кодирования. — М.: Наука. — 1982. — 165 с.

197. Рихтер К. Динамические задачи дискретной оптимизации. — М.: Радио и связь. — 1985. — 234 с.

198. Сачков В.Н. Введение в комбинаторные методы дискретной математики. — М.: Наука. — 1982. — 165 с.

199. Рыбников К.А. (ред.) Комбинаторный анализ. —М.: Наука— 1982. — 180с.

200. Sugeno М. Theory of Fuzzy Integrals and Its Applications. Ph.D. Thesis. Tokyo: Institute of Technology; 1971.

201. Sugeno M. Constructing Fuzzy Measure and Grading Similarity of Patterns by Fuzzy Integrals // Transactions of SICE.—1973.— Vol.9.—pp.359-367.

202. Михалевич B.C., Волкович В.JI. Вычислительные методы исследования и проектирования сложных систем. . —М.: Наука. — 1982. —238 с.

203. Горбатов В.А. Основы дискретной математики. — М.: Высшая школа. — .1986. —364 с.

204. Соболь И.М., Статников Р.Б. Выбор оптимальных параметров в задачах со многими критериями. — М.: Наука. — 1981. — 174 с.

205. Щербаков Н.С., Подкопаев Б.П. Структурная теория автоматного контроля цифровых автоматов. —М.: Машиностроение. — 1982. — 178 с.

206. Юдин Д.Б. Математические методы оптимизации устройств и алгоритмов АСУ. — М.: Радио и связь. — 1982. — 156 с.

207. Pal S.K., Majumder D.D. Fuzzy Sets and Decision-Making Approaches in Vowel and Speaker Recognition // IEEE Transactions on Systems, Man, and Cybernetics.— 1977.—Vol. SMC-7.—pp.625-629.

208. Pal S.K., King R.A. On Edge Detection of X-ray Images Using Fuzzy Sets // ШЕЕ Transactions of Pattern Analysis Machines Intelligent.— 1983.— Vol. PAMI-1—pp.67-77.

209. Pal S.K., King R.A., Hashim A.H. Image Description and Primitive Extraction

210. Using Fuzzy Sets // ШЕЕ Transactions on Systems, Man. and Cybernetics.— 1983.1. Vol.SMC-13.—pp.94-100.

211. Pal S.K., Rosenfeld A. Image Enhancement and Thresholding by Optimization of Fuzzy Compactness // Pattern Recognition Letters.— 1990.— Vol. 11.— pp.831-841 Pattern Recognition Letters.— 1985.— Vol. 3.—pp.303-308.

212. Pedrycz W. Classification' in a Fuzzy Environment // Pattern Recognition Letters,— 1985.—Vol. 3.—pp.303-308.

213. Pedrycz W. Algorithms of Fuzzy Clustering with Partial Supervision // Pattern Recognition Letters.— 1985.— Vol. 3.— pp.13-20.

214. Pedrycz W. ECG Signal Classification with the Aid of Linguistic Classifier // Proceedings of the XIV International Conference on Medical and Biomedical Engineering, Espoo 11-16 August 1985.— Espoo, 1985.

215. Pedrycz W. Techniques of Supervised and Unsupervised Pattern Recognition with the Aid of Fuzzy Set Theory // Pattern Recognition in Practice / Ed by E.S. Gelsema, L.N. Kanal. — Amsterdam: North-Holland Publishing Company, 1986.— pp. 439-448.

216. Pedrycz W., Gacek A. Feature Selection for ECG Signal Classification with the Aid of Qualitative and Quantitative Criteria // Proceedings of the 7th Hungarian Conference on Biomedical Engineering, 16-18 September 1987.— Hungary: Eszter-gom, 1987.

217. Pedrycz W. Fuzzy Sets in Pattern Recognition: Methodology and Methods // Pattern Recognition.— 1990.—Vol.23.—pp. 121-146.

218. Pedrycz W. Formation of Prototypes and Their Confidence Regions in Classification and Concept Formation Problems // Pattern Recognition Letters.— 1991.Vol. 12.—pp.739-746.

219. Shimura M. Applications of Fuzzy Set Theory to Pattern Recognition // Journal of AACE.—1975.—Vol.19.—pp.243-248.

220. Данилкин, C.B. Информационные модели для организации имитационных исследований / C.B. Данилкин, A.B. Сыроид // Инженерная физика. — 2010. — №3. — С.11-16.

221. Абчук В.А. (ред.) Автоматизация управления. — М.: Радио и связь.— 1984. —243 с.

222. Мамиконов А.Г., Кульба В.В., Косяченко С.А. Типизация разработки модульных систем обработки данных. — М.: Наука. — 1989. — 287 с.

223. Мамиконов А.Г., Кульба В.В. Синтез оптимальных модульных СОД.— М.: Наука. — 1986. — 276 с.

224. Смоляк С.А., Титаренко Б.Н. Устойчивые методы оценивания. — М.: Статистика. — 1982 —208 с.

225. Мамиконов А.Г., Кульба В.В., Миронов A.C., Товмасян A.B. Предпроектный анализ структуры информационных потоков и технологии обработки данных при разработке модульных СОД. — М.: ИГГУ РАН. — 1980. — 43 с.

226. Цихош Э. Сверхзвуковые самолеты: Справочное руководство / Пер. с польск.; под ред. В.Г. Микеладзе и Е.В. Зябрева. —М.: Мир. — 1983. — 432 с.

227. Мамиконов А.Г., Цвиркун А.Д., Кульба В.В. Автоматизация проектирования АСУ. — М.: Энергоиздат. —1981. — 328 с.

228. Сиротюк В.О. Модели и методы синтеза оптимальных логических: структур и базы метаданных репозитариев распределенных баз данных в АСУ // Автоматика и телемеханика. — 1999. —№3. — С. 166-179.

229. Кульба В.В., Сиротюк В.О., Косяченко С.А. и др. Промышленная технология и CASE-средства автоматизированного проектирования баз данных:.

230. М.: ИПУ РАН. — 1999. — 120 с.

231. Норенков И.П. Основы автоматизированного проектирования: учеб дл^ вузов. — 4-е изд., перераб. и доп. — М.: Изд-во МГТУ им. Н.Э. Баумана. — 2009.430 с.

232. Норенков И.П., Трудоношин В.А. Телекоммуникационные технологии ц сети. — М.: Изд-во МГТУ им. Н.Э. Баумана. — 2000. — 390 с.

233. Саати T.J1. Элементы теория массового обслуживания и ее приложения. —-М.: Сов. Радио. — 1965. — 423 с.

234. Поспелов Д.А. Моделирование рассуждений. Опыт анализа мыслительных актов. — М.: Радио и связь. — 1989. —

235. Гиляревский P.C. Основы информатики. — М.: Экзамен. — 2003. — 320 с.

236. Данилкин, C.B. Математическое моделирование информационных процессов в сети с заданной структурой / C.B. Данилкин, Ю.Ю. Громов, О.Г, Иванова, A.B. Лагутин, H.A. Земской, И.И. Пасечников // Инженерная физика. — 2003. —№2. —С.44-47.

237. Данилкин, C.B. Математическая формализация процесса обучения / C.B. Данилкин, Ю.Ю. Громов, H.A. Земской, О.Г. Иванова, A.B. Лагутин, Т. Лутхон, И.И. Пасечников, В.М. Тютюнник, Т.Г. Самхарадзе // Инженерная физика. — 2005. —№3, —С.51-55.