автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.12, диссертация на тему:Генетический алгоритм для поиска логических закономерностей в данных

кандидата технических наук
Доронин, Вадим Александрович
город
Москва
год
2006
специальность ВАК РФ
05.13.12
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Генетический алгоритм для поиска логических закономерностей в данных»

Автореферат диссертации по теме "Генетический алгоритм для поиска логических закономерностей в данных"

На правах рукописи

Доронин Вадим Александрович

ГЕНЕТИЧЕСКИЙ АЛГОРИТМ ДЛЯ ПОИСКА ЛОГИЧЕСКИХ ЗАКОНОМЕРНОСТЕЙ В ДАННЫХ

Специальность 05.13.12 - Системы автоматизации проектирования

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва - 2006

Работа выполнена в Московском государственном институте электроники и математики (техническом университете).

Научный руководитель д.т.н., профессор

Солодовников И.В.

Официальные оппоненты: доктор технических наук, профессор кандидат технических наук, доцент

Вишнеков А.В. Рогозин О.В.

Ведущая организация:

Государственный Космический Научно Производственный Центр им М.В. Хруничева КБ "Салют".

Защита состоится «¿9» 2006 г. в /У часов на заседании

диссертационного Совета Д. 212.133.03 в Московском государственном институте

электроники и математики (техническом университете) по адресу: 109028 Москва, Б. Трехсвятительский пер., д. 3/12.

С диссертацией можно ознакомиться в библиотеке МГИЭМ.

Автореферат разослан «До» сеЮи^и 2006 года.

Ученый секретарь диссертационного Совета

К.Т.Н., доцент Леохин ЮЛ.

Общая характеристика работы

Актуальность работы. При конструкторской и технологической подготовке производства новых изделий, создании технических, программных и информационных систем объемы проектирования постоянно увеличиваются, что требует больших затрат и времени в проектно-конструкторских и технологических разработках. Повышение эффективности связано с использованием систем автоматизированного проектирования (САПР). Проектировщик пользуется средствами САПР для выполнения конкретной проектной процедуры или получения сведений, необходимых для принятия обоснованных решений. Эти функции не могут быть выполнены без специального программного (ПО) и информационного (ИО) обеспечения. При этом перея проектировщиком встает задача выбора подходов и методов, которые целесообразно использовать, сокращения области получения приемлемых решений, выявления факторов, влияющих на их качество. Однако очень часто эта проблема решается на уровне здравого смысла, что связано с неполнотой и нечеткостью, имеющихся на момент начала проектных работ, знаний. Поэтому актуальной становится задача автоматизированной выработки правил, позволяющих повысить эффективность процесса принятия решений на всех этапах проектирования. Именно решению этой задачи с использованием методов интеллектуального анализа данных и посвящена данная диссертационная работа.

Интеллектуальный анализ данных (Data Mining) представляет собой процесс обнаружения в данных ранее неизвестных, нетривиальных, практически полезных, доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Одной из задач, решаемых с помощью методов интеллектуального анализа данных, является поиск логических закономерностей в той или иной форме (деревья решений, конъюнкция элементарных событий, система продукций и т.д.).

Существует целый ряд алгоритмов и систем, позволяющих строить логические правила. Однако, они не лишены определенных недостатков, к которым можно отнести:

- не решается вопрос о точности и полноте правил;

- ограниченный размер правил (в среднем не более 4 элементарных событий); проблема определения элементарных событий;

специальную подготовку пользователя для предобработки и кодирования данных.

В связи с этим становится актуальной задача разработки механизма построения правил, лишенного этих недостатков.

В качестве такого механизма в работе предлагается использование генетического алгоритма (ГА), который выявляет правила произвольной длины (количество элементарных событий, входящих в правило) с заданной точностью и полнотой (для класса решений), и который определяет автоматически элементарные события в ходе своего выполнения.

Объект исследования. Объектом исследования данной работы являются эффективные механизмы поиска логических закономерностей в наборах данных, в частности, основанные на применении генетических алгоритмов, и их использование в САПР.

Предмет исследования. Предметом исследования являются вид операторов, структура и характеристики ГА для выявления логических правил в наборах данных.

Цель работы. Целью настоящей работы является разработка и реализация алгоритма для повышения эффективности поиска логических закономерностей в наборах данных на всех этапах проектирования, основанного на генетическом алгоритме и включающего в себя механизм предобработки данных, направленной на сегментацию найденных закономерностей, с целью выявления элементарных событий. Разработанный алгоритм поиска должен производить вывод логических закономерностей в терминах элементарных событий с определением их точности и полноты.

Научная новизна полученных в диссертации результатов теоретических и экспериментальных исследований заключается в следующем :

1. На основе анализа методов для поиска логических закономерностей, предложено использование подхода, основанного на применении ГА, позволяющего выделять элементарные логические события, получаемые в результате предобработки данных, и в отличие от большинства других подходов позволяет формировать системы логических правил с определением их точности и полноты.

2. Разработан ГА, его структура и вид операций для построения системы правил с заданной точностью и полнотой.

3. Разработана система классов и информационная модель для представления ГА.

Практическая ценность. Практическая ценность полученных результатов заключается в следующем:

1. Исследованы структура и основные характеристики ГА для выявления логических закономерностей.

2. На основе разработанных информационной и объектно-ориентированной моделей, определена структура базы данных приложения для хранения описаний ГА, а также найденных логических правил, полученных с их помощью.

3. Реализовано приложение, осуществляющее автоматизированный поиск закономерностей в наборах данных в зависимости от информации, хранящейся в базе данных, и требований, предъявляемых пользователем.

Основные практические результаты работы использованы в ООО «Северные ветры дисгрибьюшн» для создания рекомендованного плана отгрузок товара с заводов на дистрибьюторские склады и разработано приложение для использования в учебном процессе кафедры ИТАС МИЭМ.

На основе разработанного ГА для поиска логических закономерностей в компании ООО «Северные ветры дисгрибьюшн» был разработан программный продукт, предназначенный для создания оптимального плана отгрузок товара с заводов на дистрибьюторские склады и последующей оптимизации складских остатков. Применение данного продукта, на основе разработанного ГА, позволило выявить Профицит и Дефицит товара на складе, что привело к значительной оптимизации складских остатков, сведя складские объёмы к нормативным величинам с запасом продаж на одну неделю вперёд.

Технический эффект от внедрения результатов диссертационной работы оценивается нормализацией остатков на складе, равномерным распределением мощностей заводов на отгрузку товара дистрибьюторам, достоверностью планов отгрузок и своевременностью, доставки товара на склады дистрибьюторов.

Выполненные сравнительные испытания предложенного продукта, на основе ГА и традиционных вычислений формул на листах среды MS Excel показали, что применение предложенного продукта обеспечивает:

1. Значительное снижение трудоемкости вычисления плана отгрузок в 1.5-2 раза.

2. Уменьшения затрачиваемого времени на разработку такого плана в 2-3 раза и исключения ошибок, связанных с человеческим фактором.

Для использования в учебном процессе кафедры ИТАС МИЭМ разработано приложение, осуществляющее поиск логических закономерностей в наборах данных в зависимости от требований предъявляемых пользователем и имеющихся исходных данных. Результаты работы использованы при изучении дисциплин «Методы принятия решений», «Распознавание образов» и «Искусственный интеллект и экспертные системы».

На защиту выносятся следующие основные положения:

1. Использование генетических алгоритмов как средства интеллектуального анализа данных при построении логических правил, используемых в задачах проектирования.

2. Разработанный ГА, проводящий предобработку данных, заключающуюся в их сегментации и выделении наиболее значимых значений признаков и их сочетаний для выявления логических закономерностей.

3. Разработанная информационная модель ГА для хранения признаков классов и логических закономерностей в базе данных и объектно-ориентированная модель, применимая для описания широкого класса генетических алгоритмов

4. Разработанное программное и информационное обеспечение приложения для создания и использования ГА для выбора логических закономерностей в задачах проектирования.

Апробация работы. Результаты работы докладывались на научно-технических конференциях студентов, аспирантов и молодых специалистов МИЭМ (Москва, 2003-2006 гп); научно-практических семинарах «Новые информационные технологии» (Москва, 2006 гг.). Результаты работы публиковались в журналах "Информационные технологии" №7 (Москва, 2005 гг.), "Качество и ИЛИ (С4£3)-тгаснологии" №1 (Москва, 2006 гг), "Технологии ЭМС Электромагнитной совместимости" №1 (Москва, 2006 гг.) и сборнике научных трудов "Проектирование телекоммуникационных и информационных систем" (Москва, 2006 гг).

Публикации. Материалы, отражающие основное содержание диссертации, изложены в трех статьях и пяти тезисах докладов.

Объем работы. Общий объем диссертации 130 стр. машинописного текста, включая список цитируемой литературы, и содержит 29 иллюстраций и 7 таблиц. Работа состоит из введения, четырех глав, заключения и списка литературы, включающего 104 работы отечественных и зарубежных авторов.

Основное содержание работы

ГЛАВА 1. Методы определения логических закономерностей в системах обработки данных

В первой главе рассматриваются вопросы современного состояния и тенденции развития систем и методов обработки информации, хранящейся в базах данных (БД) или информационных хранилищах. Обосновывается актуальность задачи разработки средства автоматизированной выработки логических правил для последующего принятия решений на всех этапах проектирования САПР.

В связи с совершенствованием технологий записи и хранения данных в настоящее время наблюдается стремительное развитие хранилищ информации и рост объемов данных в этих хранилищах. Развитие хранилищ происходит в самых различных областях человеческой деятельности (производственной, коммерческой, медицинской, научной и т.д.). На сегодняшний день все большую актуальность приобретают системы обработки информации, которые позволяют не просто складировать данные, но и позволяют осуществлять их анализ и предобработку данных, находить скрытые закономерности, производить прогнозирование рядов данных и выдавать результаты в доступном для человека виде.

Наиболее глубокий анализ данных можно произвести с помощью технологии Data Mining (DM). Средства DM на основе имеющихся данных производят модели, позволяющие количественно оценить степень влияния исследуемых факторов. Кроме того, средства DM позволяют производить новые гипотезы о характере неизвестных, но реально существующих отношений в данных. Нахождение скрытых закономерностей в наборах данных, взаимосвязей между различными переменными, а так же моделирование и изучение сложных систем на основе истории их поведения - вот предмет и задачи DM. Сама технология DM позволяет трансформировать исходные данные в полезную для принятия решений информацию, что приводит к нахождению новых решений.

Одна из основных задач, для решения которой применяются методы ВМ -Классификация. Классификация - выявление признаков, наборов правил, характеризующих группу, путем анализа уже классифицированных объектов и формулирования некоторого набора правил. Классификация осуществляется с применением логических закономерностей.

В задачах анализа многомерных данных предложено достаточно много подходов к поиску логических закономерностей. В основном используются методы, которые условно можно назвать методами здравого смысла. Они порождают правила, для которых остается открытым вопрос о точности и полноте. Примером таких средств может служить средства, основанные на деревьях решений, алгоритме С1Л или Кора, нейронных сетях и алгоритмы ограниченного перебора.

Однако перечисленные подходы обладают рядом недостатков. Так при классификации средствами на основе нейросетей необходимо изначально необходимо построить очень большой объем обучающей выборки, методом тренировки. Основная трудность при работе -даже натренированная нейронная сеть представляет собой черный ящик. Знания, зафиксированные как веса нескольких сотен межнейронных связей, совершенно не поддаются анализу и интерпретации человеком. При работе с системами на основе деревьев решений, становится очевидным, что деревья решений принципиально не способны находить "лучшие" (наиболее полные и точные) правила в данных. Они реализуют принцип последовательного просмотра признаков и создают лишь иллюзию логического вывода. Также при больших объемах многомерных данных алгоритмы построения деревьев решений могут выдавать очень сложную структуру деревьев, которые имеют много узлов и ветвей и проблема определение возможных событий остается нерешенной. Для алгоритма ограниченного перебора его главным недостатком является то обстоятельство, что данный алгоритм способен за приемлемое время выдать решение только для сравнительно небольшой размерности данных.

В связи с выше изложенными недостатками становится актуальной задача разработки механизма построения правил, лишенного этих недостатков. В качестве такого механизма в, работе предлагается использование генетического алгоритма (ГА). Предлагаемый ГА должен производить выявление логических правил с заданной точностью и полнотой в наборах данных и автоматически определять элементарные события в ходе своего выполнения.

ГЛАВА 2. Автоматизированный поиск элементарных событии и логических закономерностей Генетическим Алгоритмом

Во второй главе рассматривается алгоритм поиска скрытых логических закономерностей. В основе подход лежит выделение простых логических событий, получаемых в результате предобработки данных с помощью ГА.

В качестве алгоритма для определения элементарных событий используем генетический алгоритм, имеющий следующие характеристики:

Количество популяций и их начальное формирование. Рассматривается задача, в которой логические закономерности используются для отнесения объекта к одному из N классов А -= {А,,...,Ак}. Количество популяций равно количеству классов и обозначается N. Выбор такого количества популяций обусловлен тем, что оценку показателей точности и полноты правил при выделении логических закономерностей целесообразно производить для каждого класса. При единственной популяции происходит усреднение данной оценки. Пусть определена обучающая последовательность из п объектов, заданная в виде пар: < Xi-.fi >,1 = 1 -5-и где X: - т — мерный вектор параметров X* — (хк,.. ■, х„), для объекта , 1,еА - принадлежность к классу. Будем задавать генотип особи как множество пар <и,1*,и'^>,1 = 1-5-7И,У = 1-5-Л/', к - \ + К,х^гтп ^ £ и»,^ 2X,.™, где К - количество особей в популяции, (х,,тт, X!.™*) - область определения /- го параметра. Таким образом, каждая особь в популяции представляет собой т - мерный гиперкуб в пространстве признаков со сторонами < , ч^ >, который соответствует некоторому правилу. Начальные популяции формируется с помощью датчика случайных чисел.

Целевая функция. Наилучшей считается популяция, в которой находятся особи, наилучшим образом удовлетворяющие логическим закономерностям для данного класса. Тогда целевую функцию можно определить как:

О)

2>и

м

Где гч - количество объектов, удовлетворяющих критерию, заданному в генотипе особи к (попавших в гиперкуб, соответствующий данной особи) и принадлежащих классу Д г для популяции у" (расстояние по Хэммингу). Фактически целевая функция определяет точность правила. Тогда целью генетического алгоритма является нахождение такой популяции, в которой содержится подмножество особей Кк £ К1 - К' - общее количество

особей для популяции, моделирующей принадлежность к классу у, для которого X Ръ -> 1

чк1,

и число объектов, принадлежащих данному классу в обучающей выборке максимально, то есть и х* — ЗЯО1 . Здесь Хц - множество объектов, удовлетворяющих критерию и

принадлежащих классу А1, сформулированному для особи к,. ЯЯО/ - множество объектов, принадлежащих к классу А1 среди множества исходных объектов.

Оператор скрещивания. В качестве оператора скрещивания используется обычный одноточечный оператор. Работает он следующим образом: случайным образом выбирается одна из точек разрыва (точка разрыва — участок между соседними битами в строке). Обе родительские строки разрываются на два сегмента по этой точке. Затем соответствующие сегменты различных родителей склеиваются и получаются два генотипа потомков.

Оператор мутации. Оператор мутации предполагает случайное изменение какого-либо элемента пары < и^» >, которая также выбирается случайным образом. Данные изменения должны удовлетворять требованиям: сохранение упорядоченности пары и попадание в диапазон области значений для заданной переменной.

Оператор редукции. Данный оператор удаляет из популяции кодовые последовательности (особи) с наименьшими значениями .

Оператор миграции. Оператора миграции, позволяет переносить кодовую последовательность (КП) из одной популяции в другую. Он выполняется с некоторой вероятностью, если в популяции / встречается особь к, для которой Рц < Ркр^ Р ■ Перенос осуществляется в популяцию р. Смысл этого оператора заключается в том, что правила, имеющие низкую точность для одного класса, могут иметь более высокую точность для другого класса. Такая ситуация наиболее часто возникает в начальных поколениях.

Работу самого модернизированного ГА для автоматического поиска событий и логических правил можно представить в виде следующей последовательности шагов:

Шаг 1. Для каждого класса создать популяцию К + Я особей, где К - наименьший допустимый размер популяции. Этот размер выбирается таким, чтобы с его помощью можно было бы выбрать такое количество различных родительских пар, которое позволило бы восстановить популяцию до размера К+Л. Я выбирается так, чтобы ЛГ*(Х+ЛУ) удовлетворяло требованиям, приведенным в пункте «Количество популяций и их начальное формирование».

Шаг 2. Выполнить операцию миграции из каждой популяции / Эта операция выполняется следующим образом. Отбирается К КП, у которых минимально значение

целевой функции для заданной последовательности. Среди них отбираются КП, для которых

max {Ftp) > Fv,k~l + R,p = l + N,p?t j. Происходит обмен между популяциями КП, для t.r

которых справедливо это условие.

Шаг 3. В каждой популяции сократить число особей до К' S К (оператор редукции). Удалению подлежат КП с наименьшими значениями целевой функции, и в то же время, для которых целевая функция меньше некоторого порогового значения в близкого к 1, либо такие, которые не увеличивают полноту правил. Это позволяет сохранить особи, которые задают правила, имеющие достаточно высокую точность и полноту.

Шаг 4. Если выполнятся условие останова (точность и полнота правил, задаваемых КП не увеличивается) перейти к шагу 8, иначе выполнить следующий шаг.

Шаг 5. Если размеры популяции меньше чем К + Л, выбрать родительские пары для оператора скрещивания, иначе перейти к шагу 7.

Шаг б. Выполнить оператор скрещивания. Перейти к шагу 5. Шаг 7. Выполнить оператор мутации для случайной КП. Перейти к шагу 2. Шаг 8. Формируется множество КП, удовлетворяющее цели ГА, приведенной выше. Следовательно, количество КП, сохраняемое из каждой популяции может быть переменно.

Шаг 9. Осуществляется преобразование сохраненных кодовых последовательностей к конъюнкции элементарных логических событий.

ГЛАВА 3. Алгоритм представления логических закономерностей и информационная реализация Генетического Алгоритма для поиска логических закономерностей

Третья глава посвящена вопросам информационной реализации модели ГА, для хранения признаков классов и логических закономерностей в базе данных. Для программной реализации разработана объектно-ориентированная модель, применимая для описания широкого класса ГА.

С точки зрения объектно-ориентированного подхода популяции в ГА представляет собой иерархию классов: популяция, особь.

Использование объектно-ориентированного программирования требует определения иерархии классов объектов. На рис. 1 показа иерархия, используемая для реализации алгоритмов поиска логических закономерностей в структуре данных. В особых случаях объекты объединяются в коллекции, позволяющие эффективно организовывать программный код.

Рис. 1. Иерархия классов для описания Генетического Алгоритма

Ниже приводится описание приведенной иерархии:

1. ClassesOfObject - базовый класс, который содержит основные характеристики алгоритма, такие как количество классов, количество признаков, по которым проходит классификация, начальный и минимальный размер популяции, вероятность мутации и т.д.

2. ClassesObjects, ClassObject — коллекция и класс. Содержат описания классов объектов, для которых формируются правила.

3. ObjectsInClass, ObjectlnClass — коллекция и класс. Содержит описание объектов, входящих в класс объектов.

4. Genoms, Genom — коллекция и класс. Содержит описание особей, входящих в популяцию.

5. gParents, gParent — коллекция и класс. Содержит описание родительских особей.

Для хранения исходных, промежуточных данных, используемых в работе программы, был разработан фрагмент базы данных. В последствии алгоритм может осуществлять перевод кодовых последовательностей к конъюнкции элементарных событий из указанных таблиц Базы Данных.

Структура Базы Данных состоит из таблиц: МС/аззезОРО^ес!, ЛЮАС1авЮЬ)еси МОЬ], трОЦ и гЫЬс^Ши. Три таблицы находятся в реляционных отношениях между собой, другие две предназначены для сохранения начальных и итоговых данных в работе программы ГА.

По завершению работы алгоритма происходит сохранение наилучших особей (с показателями точности и полноты, близких к единице) в таблицу /М£о£Йм/е. Информационного содержания таблицы гЫ1л>%Яи1е приведено ниже.

Таблица 1. Таблица МЬо^Ы1е для особей классов

Имя поля Тип данных Свойства поля

N01835 Числовой Номер одного из раннее определенных № классов.

КЯЫе Числовой Номер правила для каждого из раннее определенных ^-классов.

Сопах Текстовый Числовой диапазон области особи по оси X

СопйУ Текстовый Числовой диапазон области особи по оси У

ТосЬп Числовой Числовое .значение точности данного правила (особи), рассматривается как целевая функция особи

Ро1п Числовой Числовое значение полноты данного правила (особи), рассматривается отношение всех признаков данного класса в области правила но всем признакам класса

ГлэЮЬ Текстовый Числовой перечень всех номеров признаков, вошедших в область данного правила

На основании данных таблицы tЫLogRule возможно формирование правил в виде продукций «если... то...». Поля таблицы объединяются логическим оператором «И», а наименование класса - "вывод" помещается в правую часть выражения, имеющего вид: Если (условие 1) л (условие 2) л ... л (условие Ы) то ( "вывод")

ГЛАВА 4 Разработка программного и информационного обеспечении Генетического Алгоритма.

Четвертая глава посвящена вопросам реализации приложения, позволяющего осуществлять автоматизированный поиск логических закономерностей с помощью ГА, с учетом имеющихся исходных данных и требований, предъявляемых пользователем.

На основе информационной и объектно-ориентированной моделей ГА был разработан алгоритм функционирования приложения и выполнена его программная реализация. Данная реализация представлена демонстрационной версией, с помощью которой происходила отладка алгоритма и его предварительный анализ.

На первом шаге работы - на этапах загрузки программы производится инициализация начальных условий работы алгоритма, такие как размер популяций, вероятность оператора мутации и скрещивания и т.д.

Второй шаг - это инициализация классов и их признаков. Пользователю предлагается проставить исходные признаки каждого класса самостоятельно или воспользоваться набором сформированных признаков по умолчанию, которые сохранены в БД. Для наглядного представления внутренних процессов работы ГА с признаками классов и над особями популяций реализован графический интерфейс. Программа предусматривает управление цветом для признаков классов, что облегчает восприятие внутренних процессов. Особи, произвольным образом генерируемые во время выполнения ГА, для каждого класса будут наследовать выбранные на данном этапе цветовые представления по признакам классов.

Стоит отметить, что программа позволяет сохранять наборы признаков для классов под уникальными именами в БД Данный пример может быть в последствии загружен из БД на шагах инициализации характеристик алгоритма, что избавляет пользователя от рутинного указания признаков классов каждый раз перед созданием популяций особей.

На третьем шаге над случайно сгенерированными особями популяций производятся основные операторы ГА, при этом все внутренние процессы алгоритма графически отображаются на элементе управления. Для отображения показателей точности и полноты для каждою класса реализован табличный интерфейс. На каждом шаге работы ГА происходит его обновление. Обновлению подлежит и табличный интерфейс для представления особей популяций.

По завершению работы алгоритма происходит сохранение наилучших особей в БД, а также показателей их точности и полноты для каждого правила и список признаков, которые входят в область полученных правил.

Рис. 2. Диалоговое окно программы Генетического Алгоритма

Полученные логические закономерности в терминах элементарных событий выводятся в виде отчёта.

№ ципт Услмю я» X Усла жхгс но Т ТочмостъПолирп Смм« »Ьши

1 :Е»лн( 831-1037

2 :Еслн ( .04- £41

3 :Есяи( М-8.41

)И< 5,61-1233 )И< 7.25 )И<5£1- 1233

1 1

й8Э

0,21 2514 0.14 411 0£5 34 7811

Рис. 3. Отчёт представления полученных логических закономерностей

Общие выводы

1. На основе исследования современных систем интеллектуального анализа данных (Data Mining) показана эффективность использования ГА с точки зрения точности и полноты при решении задачи выделения логических закономерностей на всех этапах проектирования.

2. Разработан ГА, позволяющий формировать логические правила в виде конъюнкции элементарных событий с заданной точностью и полнотой.

3. Предложена объектно-ориентированная модель ГА, позволяющая создавать в интерактивном режиме шаблоны алгоритмов (структуру хромосомы, популяции, описание операций и т.д.).

4. Разработана информационная модель для хранения шаблонов ГА и получаемых с их помощью проектных решений.

5. На основе полученных объектно-ориентированной и информационной модели реализовано программное приложение, в рамках которого было проведено исследование предложенного в работе ГА для поиска логических закономерностей.

6. Основные практические результаты работы использованы в ООО «Северные ветры дистрибьюшн» для создания рекомендованного плана отгрузок товара с заводов на дистрибьюторские склады, где на основе разработанного ГА, осуществляется формирование оптимального плана отгрузок товара с заводов на дистрибьюторские склады с последующей оптимизацией складских остатков. Как показала практика применения, созданное приложение позволяет выявить Профицит и Дефицит товара на складе, что приводит к оптимизации складских остатков, сведя складские объёмы к нормативным величинам с запасом продаж на одну неделю вперёд.

7. Для использования в учебном процессе кафедры ИТАС МИЭМ разработано приложение, осуществляющее поиск логических закономерностей в наборах данных в зависимости от требований предъявляемых пользователем и имеющихся исходных данных. Результаты работы использованы при изучении дисциплин: «Методы принятия решений», «Распознавание образов» и «Искусственный интеллект и экспертные системы».

Публикации по теме диссертации

1. Солодовников И.В., Доронин В. А. Генетический алгоритм для поиска логических закономерностей в данных // Информационные технологии №7. М.: 2005 г С. 11 - 18

2. Доронин В.А., Солодовников И.В. "CALS-тсхнология: применение генетического алгоритма для распознавания отказов техники". "Качество и ИЛИ (CA/,5}-технологии" №1, М. 2006, С. 43-46

3. Доронин В.А., Солодовников И.В. Применение генетического алгоритма в поиске стандартов для сертификации однородной продукции. // Технологии ЭМС (Электромагнитной Совместимости) №1. М:200б г. С. 37 - 43

4. Доронин В. А. "Реализация генетического алгоритма для задач классификации". Материалы девятого научно-технического семинара. М. ~ МИЭМ, 2006 С. 111-116

5. Доронин В.А. "Применение генетического алгоритма для оптимизации складских запасов". Материалы девятого научно-технического семинара. М. -МИЭМ, 2006 С. 117-122

6. Доронин В.А. "Генетический алгоритм для поиска логических закономерностей". Научно-техническая конференция студентов, аспирантов и молодых специалистов МИЭМ, Тезисы докладов - М. ~ МИЭМ, 2005, С. 97-98

7. Доронин В.А. "Применение генетического алгоритма для поиска стандартов ЭМС на основе логических закономерностей". Сборник научных трудов "Проектирование телекоммуникационных и информационных систем". - М. ~ МИЭМ, 2006, С. 175-178

8. Доронин В.А. "Применение генетического алгоритма в задачах классификации". Научно-техническая конференция студентов, аспирантов и молодых специалистов МИЭМ, Тезисы докладов — М. ~ МИЭМ, 2006, С. 139-140

Подписано к печати "Ш ' 2006 г.

Отпечатано в типографии МИЭМ. Москва, ул. М. Пионерская, 12 Заказ № Объем 0 п л. Тираж £ГО экз.

Оглавление автор диссертации — кандидата технических наук Доронин, Вадим Александрович

Общая характеристика работы.

ГЛАВА 1. Методы и средства интеллектуального анализа данных.

1.1. Обоснование применения автоматизированной выработки правил для увеличения эффективности процесса принятия решений.

1.2. Типы возможных закономерностей в методологии обработки данных

1.3. Методы поиска логических закономерностей.

1.4. Средства интеллектуального анализа данных.

1.5. Генетический алгоритм как средство интеллектуального анализа данных.

1.5.1. Обоснование выбора генетического алгоритма как средства Data Mining для автоматического выявления логических правил.

1.5.2. Основные понятия и принципы генетических алгоритмов.

1.6. Выводы.

ГЛАВА 2. Автоматизированный поиск элементарных событий и логических закономерностей генетическим алгоритмом.

2.1. Анализ способов классификации в задачах САПР.

2.1.1. Процедура предъявления правил для классификации.

2.1.2. Правила классификации.

2.1.3. Варианты описания объектов.

2.1.4. Байессовская процедура классификации.

2.2. Методы поиска логических закономерностей для решения задач САПР

2.2.1. Деревья решений.

2.2.2. Алгоритм CLS.

2.2.3. Алгоритм Кора.

2.2.4. Случайный поиск с адаптацией.

2.3. Основные характеристики генетических алгоритмов.

2.4. Различные варианты генетического алгоритма в качестве инструментариев интеллектуального анализа данных.

2.4.1. Комбинированный генетический алгоритм.

2.4.2. Поколенческий генетический алгоритм.

2.4.3. Адаптивный генетический алгоритм.

2.4.4. Многоуровневый генетический алгоритм.

2.5. Генетический алгоритм для определения элементарных событий и поиска логических закономерностей.

2.6. Выводы.

ГЛАВА 3. Алгоритм представления логических закономерностей и информационная реализация генетического алгоритма для поиска логических закономерностей.

3.1. Информационная и объектно-ориентированная модели.

3.1.1. Разработка объектно-ориентированной модели для описания генетического алгоритма.

3.1.2. Алгоритм формирования логических закономерностей в рамках объектно-ориентированной модели.

3.1.3. Разработка структуры Базы Данных для хранения промежуточных данных и результатов работы генетического алгоритма.

3.2. Осуществление вывода и формирование логических закономерностей в терминах конъюнкции элементарных событий.

3.3. Выводы.

ГЛАВА 4. Разработка программного и информационного обеспечения генетического алгоритма.

4.1. Программные средства и СУБД для реализации генетического алгоритма.

4.2, Конструирование генетического алгоритма для поиска логических закономерностей с помощью разработанной системы классов.

4.3, Программная реализация генетического алгоритма для поиска логических закономерностей.

4.3.1. Создание соединения с Базой Данных проекта.

4.3.2. Инициализация характеристик генетического алгоритма.

4.3.3. Формирование признаков классов и предобработка данных.

4.3.4. Поиск логических закономерностей с помощью генетического алгоритма.

4.3.5. Программное формирование логических правил.

4.4. Выводы.

Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Доронин, Вадим Александрович

Актуальность работы. При конструкторской и технологической подготовке производства новых изделий, создании технических, программных и информационных систем объемы проектирования постоянно увеличиваются, что требует больших затрат и времени в проектно-конструкторских и технологических разработках. Повышение эффективности связано с использованием систем автоматизированного проектирования (САПР). Проектировщик пользуется средствами САПР для выполнения конкретной проектной процедуры или получения сведений, необходимых для принятия обоснованных решений. Эти функции не могут быть выполнены без специального программного (ПО) и информационного (ИО) обеспечения. При этом перед проектировщиком встает задача выбора подходов и методов, которые целесообразно использовать, сокращения области получения приемлемых решений, выявления факторов, влияющих на их качество. Однако очень часто эта проблема решается на уровне здравого смысла, что связано с неполнотой и нечеткостью, имеющихся на момент начала проектных работ, знаний. Поэтому актуальной становится задача автоматизированной выработки правил, позволяющих повысить эффективность процесса принятия решений на всех этапах проектирования. Именно решению этой задачи с использованием методов интеллектуального анализа данных и посвящена данная диссертационная работа.

Интеллектуальный анализ данных (Data Mining) представляет собой процесс обнаружения в данных ранее неизвестных, нетривиальных, практически полезных, доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Одной из задач, решаемых с помощью методов интеллектуального анализа данных, является поиск логических закономерностей в той или иной форме (деревья решений, конъюнкция элементарных событий, система продукций и т.д.).

Существует целый ряд алгоритмов и систем, позволяющих строить логические правила. Однако, они не лишены определенных недостатков, к которым можно отнести:

1. не решается вопрос о точности и полноте правил;

2. ограниченный размер правил (в среднем не более 4 элементарных событий);

3. проблема определения элементарных событий;

4. специальную подготовку пользователя для предобработки и кодирования данных.

В связи с этим становится актуальной задача разработки механизма построения правил, лишенного этих недостатков.

В качестве такого механизма в работе предлагается использование генетического алгоритма (ГА), который выявляет правила произвольной длины (количество элементарных событий, входящих в правило) с заданной точностью и полнотой (для класса решений), и который определяет автоматически элементарные события в ходе своего выполнения.

Цель работы. Целью настоящей работы является разработка и реализация алгоритма для повышения эффективности поиска логических закономерностей в наборах данных на всех этапах проектирования, основанного на генетическом алгоритме и включающего в себя механизм предобработки данных, направленной на сегментацию найденных закономерностей, с целью выявления элементарных событий. Разработанный алгоритм поиска должен производить вывод логических закономерностей в терминах элементарных событий с определением их точности и полноты.

Научная новизна полученных в диссертации результатов теоретических и экспериментальных исследований заключается в следующем:

1. На основе анализа методов для поиска логических закономерностей, предложено использование подхода, основанного на применении ГА, позволяющего выделять элементарные логические события, получаемые в результате предобработки данных с последующим формированием системы логических правил с определением их точности и полноты.

2. Разработан ГА, его структура и вид операций для построения системы правил с заданной точностью и полнотой.

3. Разработана система классов и информационная модель для представления генетических алгоритмов.

Практическая ценность. Практическая ценность полученных результатов заключается в следующем:

1. Исследованы структура и основные характеристики ГА для выявления логических закономерностей.

2. На основе разработанных информационной и объектно-ориентированной моделей, определена структура базы данных приложения для хранения описаний ГА, а также найденных логических правил, полученных с их помощью.

3. Реализовано приложение, осуществляющее автоматизированный поиск закономерностей в наборах данных в зависимости от информации, хранящейся в базе данных, и требований, предъявляемых пользователем.

Основные практические результаты работы использованы в ООО «Северные ветры дистрибьюшн» при разработке рекомендованного плана отгрузок товара с заводов на дистрибьюторские склады.

На основе разработанного ГА для поиска логических закономерностей был разработан программный продукт, предназначенный для создания оптимального плана отгрузок товара с заводов на дистрибьюторские склады и последующей оптимизации складских остатков. Применение данного продукта, на основе Генетического Алгоритма, позволило выявить Профицит и Дефицит товара на складе, что привело к значительной оптимизации складских остатков, сведя складские объёмы к нормативным величинам с запасом продаж на одну неделю вперёд.

Технический эффект от внедрения результатов диссертационной работы оценивается нормализацией остатков на складе, равномерным распределением мощностей заводов на отгрузку товара дистрибьюторам, достоверностью планов отгрузок и своевременностью доставки товара на склады дистрибьюторов.

Выполненные сравнительные испытания предложенного продукта, на основе Генетического Алгоритма и традиционных вычислений формул на листах среды MS Excel показали, что применение предложенного продукта обеспечивает:

1. Значительное снижение трудоемкости вычисления плана отгрузок в 1.5-2 раза.

2. Уменьшения затрачиваемого времени на разработку такого плана в 2-3 раза и исключения ошибок, связанных с человеческим фактором.

На защиту выносятся следующие основные положения:

1. Использование генетических алгоритмов как средства интеллектуального анализа данных при построении логических правил, используемых в задачах проектирования.

2. Разработанный ГА, проводящий предобработку данных, заключающуюся в их сегментации и выделении наиболее значимых значений признаков и их сочетаний для выявления логических закономерностей.

3. Разработанная информационная модель ГА для хранения признаков классов и логических закономерностей в базе данных и объектно-ориентированная модель, применимая для описания широкого класса генетических алгоритмов

4. Разработанное программное и информационное обеспечение приложения для создания и использования ГА для выбора логических закономерностей в задачах проектирования.

Апробация работы. Результаты работы докладывались на научно-технических конференциях студентов, аспирантов и молодых специалистов МИЭМ (Москва, 2003-2006 гг.); научно-практических семинарах «Новые информационные технологии» (Москва, 2006 гг.). Результаты работы публиковались в журналах "Информационные технологии" №7 (Москва, 2005 гг.), "Качество и ИПИ (САЬ8)-технологии" №1 (Москва, 2006 гг.), "Технологии ЭМС (Электромагнитной совместимости)" №1 (Москва, 2006 гг.) и сборнике научных трудов "Проектирование телекоммуникационных и информационных систем" (Москва, 2006 гг.).

Публикации. Материалы, отражающие основное содержание диссертации, изложены в трех статьях и пяти тезисах докладов

Объем работы. Общий объем диссертации 130 стр. машинописного текста, включая список цитируемой литературы, и содержит 29 иллюстраций и 7 таблиц. Работа состоит из введения, четырех глав, заключения и списка литературы, включающего 104 работы отечественных и зарубежных авторов.

Заключение диссертация на тему "Генетический алгоритм для поиска логических закономерностей в данных"

4.4. Выводы

Разработанное приложение, позволяет осуществлять автоматизированный поиск логических закономерностей с помощью генетического алгоритма, с учетом имеющихся исходных данных - классов и их признаков (событий), задающихся пользователем. Это потребовало разработки и программной реализации алгоритмов-блоков формирования основных операторов генетического алгоритма, а так же принципов поэтапного построения предлагаемого подхода с точки зрения иерархии классов и объектно-ориентированного подхода. Таким образом, показано, что ГА позволяет осуществлять отбор логических закономерностей при анализе многомерных данных с достаточно высокой точностью и полнотой. Однако, его возможности его использования требуют дальнейших исследований. Это прежде всего связано с применением других правил отбора родительских пар (например, элитный отбор), с введением целенаправленных мутаций и т.д.

Представлены интерфейсы пользователя для ввода признаков классов для последующей предобработки данных и проектирования классов. Рассмотрены варианты представления отчетов о результатах вывода логических правил в тестовом (режим отладки) и в удобочитаемом виде.

Таким образом, использование указанных программных средств позволило осуществить отладку алгоритмов и внедрение в учебный процесс. Результаты диссертационной работы также используются ООО "Северные ветры дистрибьюшн".

Заключение.

1. На основе исследования современных систем интеллектуального анализа данных (Data Mining) показана эффективность использования ГА с точки зрения точности и полноты при решении задачи выделения логических закономерностей на всех этапах проектирования.

2. Разработан ГА, позволяющий формировать логические правила в виде конъюнкции элементарных событий с заданной точностью и полнотой.

3. Предложена объектно-ориентированная модель ГА, позволяющая создавать в интерактивном режиме шаблоны алгоритмов (структуру хромосомы, популяции и т.д.).

4. Разработана информационная модель для хранения шаблонов ГА и получаемых с их помощью проектных решений.

5. На основе полученных объектно-ориентированной и информационной модели реализовано программное приложение, в рамках которого было проведено исследование предложенного в работе ГА для поиска логических закономерностей.

6. Основные практические результаты работы использованы в ООО «Северные ветры дистрибьюшн», где на основе разработанного ГА, осуществляется формирование оптимального плана отгрузок товара с заводов на дистрибьюторские склады с последующей оптимизацией складских остатков. Как показала практика применения, созданное приложение позволяет выявить Профицит и Дефицит товара на складе, что приводит к оптимизации складских остатков, сведя складские объёмы к нормативным величинам с запасом продаж на одну неделю вперёд.

7. Для использования в учебном процессе кафедры ИТАС МИЭМ разработано приложение, осуществляющее поиск логических закономерностей в наборах данных в зависимости от требований предъявляемых пользователем и имеющихся исходных данных. Результаты работы использованы при изучении дисциплин: «Методы принятия решений», «Распознавание образов» и «Искусственный интеллект и экспертные системы».

Библиография Доронин, Вадим Александрович, диссертация по теме Системы автоматизации проектирования (по отраслям)

1. Айвазян С. А., Бухштабер В. М., Юнюков И. С., Мешалкин JL Д. Прикладная статистика: Классификация и снижение размерности.- М.: Финансы и статистика, 1989. 267 с.

2. Барсегян А. Методы и модели анализа данных: OLAP и Data Mining.- СПб.: БХВ, 2004.-331 с.

3. Батищев Д.И. Генетические алгоритмы решения экстремальных задач. -Воронеж: Чайка, 1995. 69 с.

4. Боровиков В. П., STATISTICA: искусство анализа данных на компьютере. Для профессионалов. СПб.: Питер, 2001. -798 с. Боровиков В.П. Популярное введение в программу STATISTICA.- М.: Компьютер Пресс, 1998. 267 с.

5. Васильев В.И. Распознающие системы. Справочник. Киев: Наукова думка, 1983. - 422 с.

6. Васильев В.И., Ильясов Б.Г. Интеллектуальные системы управления с использованием генетических алгоритмов. // Информационные технологии. 2000.-№12. - С 31-37.

7. Винкоп С. Использование SQL Server 7.0. СПб.: Вильяме, 1997. -816 с.

8. Вороновский Г. К., Махотило К. В., Петрашев С. Н. Сергеев С. А. Генетические алгоритмы, искусственные нейронные сети и проблемы виртуальной реальности. М.: ОСНОВА, 1997. -153 с.

9. Гаврилова Т. А. Базы знаний интеллектуальных систем. СПб.: Питер, 2001.-90 с.

10. Галушкин А. И. Теория нейронных сетей. М.: Радиотехника, 2000. -415 с.

11. Гарнаев A. Visual Basic 6.0: разработка приложений (практическое руководство). СПб .: БХВ, 2001. - 448 с.

12. Гарнаев А.Ю. Microsoft Office 2000: разработка приложений. -СПб.: БХВ, 2000.- 821 с.

13. Городецкий В.И., Самойлов В.В., Малов А.О. Современное состояние технологии извлечения знаний из баз и хранилищ данных. // AI News. Новости искусственного интеллекта. -2002. № 4. - С. 25-29

14. Гудман Э.Д., Коваленко А.П. Эволюционные вычисления и генетические алгоритмы. Обозрение прикладной и промышленной математики, том 3, вып. 5. М.: ТВП, 1996.-451 с.

15. Демиденко Е.З. Линейная и нелинейная регрессия. М.: Финансы и статистика, 1981. - 109 с.

16. Дж. Ван Гик. Прикладная общая теория систем. М.: Мир, 1981. -138 с.

17. Джеймс Р. Грофф, Пол Н.Вайнберг. Полное руководство SQL. Второе издание. Киев: Ирина, 2001.-816 с.

18. Дженнингс Роджер. Руководство разработчика баз данных на Visual Basic 6. СПб.: Вильяме, 2000. - 976 с.

19. Джеффри П. Мак Манус. Обработка баз данных на Visual Basic 6.- Спб.: Вильяме, 1999. 672 с.

20. Джонс Дж. К. Методы проектирования. М.: Мир, 1986. -103 с.

21. Дональд Е. Кнут, Искусство программирования. Основные алгоритмы. 3-е издание. М.: Вильяме, 2000. - 400 с.

22. Доронин В.А. "Применение генетического алгоритма в задачах классификации". Научно-техническая конференция студентов, аспирантов и молодых специалистов МИЭМ, Тезисы докладов.- М.: МИЭМ, 2006. С. 139-140

23. Доронин В.А. "Применение генетического алгоритма для оптимизации складских запасов". Материалы научно-технического семинара. М.: МИЭМ, 2006. -№9. - С. 117-122

24. Доронин В.А. "Реализация генетического алгоритма для задач классификации". // Материалы научно-технического семинара.- М.: МИЭМ, 2006. №9. - С. 111-116

25. Доронин В.А. Солодовников И.В. CALS-технология: Применение генетического алгоритма для распознавания отказов техники. // Качество и ИПИ (CALS) - технологии. - 2006. - №1. - С. 43 - 46.

26. Доронин В.А. Солодовников И.В. Применение генетического алгоритма в поиске стандартов для сертификации однородной продукции. // Технологии ЭМС (Электромагнитной Совместимости). - 2006. - №1. - С. 37 - 43

27. Дыбская В.В. Логистика для практиков: Эффективные решения в складировании и грузопереработке. М.: ВИНИТИ РАН, 2002.- 624 с.

28. Дюк В., Самойленко A.Data Mining: учебный курс. СПб.: Питер, 2001.-368 с.

29. Дюк В.А. Обработка данных на ПК в примерах. СПб.: Питер, 1997. -231с.

30. Енюков И.С., Мешалкин Л.Д. Прикладная статистика. Статистическое оценивание зависимостей. М.: Финансы и статистика, 1985. - 484 с.

31. Закусило С.А., Иванов Д.Е., Скобцов В.Ю. Эволюционный подход к генерации проверяющих тестов цифровых схем. // Труды конференций "Интеллектуальные САПР". М.: Физматлит, 2003. -С. 76 - 78

32. Зиновьев А.Ю. Визуализация многомерных данных. Красноярск: ИПЦКГТУ, 2000.- 168 с.

33. Змитрович А.И. Интеллектуальные информационные системы. -Минск: Тетра Системе, 1997. -365 с.

34. Интернет ресурс компании StatSoft, Inc., 1984-2001. // http://www.statsoft.ru

35. Капустин Н.М., Васильев Г.Н. Системы автоматизированного проектирования. Автоматизация конструкторского и технологического проектирования: Учебное пособие для втузов; Под ред. И.П. Норенкова. М.: Высшая школа, 1986. - 191 с.

36. Киселев М., Соломатин Е. Средства добычи знаний в бизнесе и финансах // Открытые системы. 1997. - №4. - С. 41-44.

37. Конелли Т., Бегг К. Базы данных. Проектирование, реализация и сопровождение. Теория и практика. М.: Вильяме, 2000. - 1120 с.

38. Корнеев В.В., Гареев А.Ф., Васютин С.В., Райх В.В. Базы данных. Интеллектуальная обработка информации. М.: Нолидж, 2000. -311 с.

39. Корчак С.Н., Кошин А.А, Ракович Ф.Г., Синицын Б.И. Системы автоматизированного проектирования технологических процессов,ф приспособлений и режущих инструментов. Учебник для вузов;- М.: Машиностроение, 1988. -352 с.

40. Кречетов Н.В. Продукты для интеллектуального анализа данных. // Рынок программных средств. 1997. - № 14. - С. 32-39.

41. Кулаичев А.П. Средства и программные системы анализа данных // Мир ПК. 1994. - № 10. - С. 11-15.

42. Курейчик В.М. Генетические алгоритмы и их применение в САПР // Интеллектуальные САПР. Таганрог, 1995. - С. 7-11.

43. Лебедев Б.К. Канальная трассировка на основе генетических процедур // Известия ТРТУ. 1997. - №3. - С. 53-60

44. Майкл Р. Линдере, Харольд Е. Фирон. Управление снабжением и запасами. М.: Виктория - плюс, 2002 г. - 768 с.

45. Митрофанов В.Г., Калачев О.Н., Схиртладзе А.Г. САПР в технологии машиностроения. Учеб. пособие. Ярославль, 1995.w -458 с.

46. Мостеллер Ф., Тьюки Дж. Анализ данных и регрессия. М.: Финансы и статистика, 1982. - 239 с.

47. Нагавкин В.Ф., Мельников В.Н. Диалоговая система анализа отказов // Надежность и контроль качества. 1994. - №3. - С. 87-93

48. Новалис Сыозанн. Access 2000 руководство по VBA. М.: Лори, 2001. - 530 с.

49. Оглинцев А.А. Математические методы оптимизации: Учебно-методическое пособие. Москва: МИФИ, 1998. - 53 с.

50. Осуга С. Обработка знаний. М.: Мир, 1989. -351 с.

51. Петровский В.И., Седельников Ю.Е. Электромагнитная совместимость радиоэлектронных средств. М.: Радио и Связь, 1986.-216 с.1. Щ>

52. Пожидаев Е.Д., Течиев JI.H. Защита электронных средств от воздействия статистического электричества. М.: Технологии, 2000. -352 с.

53. Поляк Б.Т. Введение в оптимизацию. М.: Наука, 1983. -385 с.

54. Рутковская Д., Рутковский JL, Пилиньский М. Нейронные сети, генетические алгоритмы и нечеткие системы. М.: Горячая Линия -Телеком, 2004. - 96 с.

55. Сайлер Б., Споттс Д. Использование Visual Basic 6.0. СПб.: Вильяме, 2000. - 832 с.

56. Сайт компании BaseGroup Labs© 2002, // http://www.basegrouplabs.ru.

57. Сайт компании BI Partner. // http://www.bipartner.ru/services/dm.html.

58. Солодовников И.В., Доронин В. А. Генетический алгоритм для поиска логических закономерностей в данных // Информационные технологии. 2005. -№7. - С. 11 - 18.

59. Сотник С.Л. Конспект лекций по курсу "Основы проектирования систем искусственного интеллекта": (1997-1998), //http://neuroschool.narod.ru/books/sotnik.html.

60. Струнков Т.С. Что такое генетические алгоритмы // PC Week RE. -1999. № 19.-С. 4-10

61. Таунсенд К., Фохт Д. Проектирование и программная реализация экспертных систем на персональных ЭВМ. М.: Финансы и статистика, 1990. - 388 с.

62. Томас К., Бегг К., Страчан А. Базы данных: проектирование, реализация и сопровождение. М.: Вильяме, 2000. - 873 с.

63. Тьюки Дж. Анализ результатов наблюдений. Разведочный анализ. -М.: Мир, 1981.- 693 с.

64. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. М.: ИНФРА-М, 1997.-384 с.

65. Уильяме Т. ЭМС для разработчиков продукции. М.: Технологии, 2003.-540 с.

66. Уэно X., Кояма Т., Окамото Т. Представление и использование знаний. М.: Мир, 1989. - 113 с.

67. Федоров А. Г. Базы данных. М.: КомпьютерПресс, 2001. - 255с.

68. Фигурнов В.Э IBM PC для пользователя. Изд. 6 переработанное. -М.:ИНФА, 1995.-448 с.

69. Францкевич Г.И., Костюк В.П. Разработка экспертной системы для анализа и прогноза финансовой деятельности предприятий. // Математическое и программное обеспечение вычислительных систем. Межвузовский сборник научных трудов. -1998. -№2. -С. 111-115.

70. Хальворсон М., Microsoft Visual Basic 6.0 для профессионалов. Шаг за шагом. М.: Эком, 1999. -720с.

71. Хант Э. Искусственный интеллект. М.: Мир, 1978 - 558 с.

72. Химмельблау. Д. Прикладное нелинейное программирование. М.: Мир, 1975.- 534 с.

73. Хювенен Э., Сеппянен И. Методы и системы программирования. -М.: Мир, 1990.-447 с.

74. Чалый С.Ф. Эволюционный алгоритм поиска знаний в базах данных при создании информационных систем // Проблемы бионики.-2001.-№5. С. 20-22.

75. Шапот М., Рощупкина В. Интеллектуальный анализ данных и управление процессами. // Открытые системы. 1998. - № 5. -С. 14-19

76. Эделстейн Г. Интеллектуальные средства анализа, интерпретации и представления данных в информационных хранилищах // ComputerWeek-Москва. 1996. - № 16. - С. 32-33.

77. Bradley P., Fayyad U., Mangasarian O. Data Mining: Overview and Optimization Opportunity //http://www.research.microsofl.com/datamine/.

78. Brand E., Gerritsen R. Decision Trees // DBMS. 1998. - № 7. -P. 15-23

79. Cabena P., Hadjinian P., Stadler R. Discovering Data Mining from Conceptto Implementation, 2000. 789 p.

80. Clement R.P., Wren A. Genetic Algorithms and Bus-Driver Scheduling,1993.-187 p.

81. Codd E. F., Codd S. В., Salley С. T. Providing OLAP (On-Line Analytical Processing) to User-Analysts: An IT Mandate, 1993. 375 p.

82. Codd E. Codd S., Salley C. Providing OLAP (On-line Analytical Processig) to User-Analysts, 1993. 578 p.

83. Cohoon J.P., Paris W.D. Genetic placement // Comput.-Aided Des. Integrated Circuits & Syst. 1987. - №6. - pp. 956-964.

84. Davis L (Ed). Handbook of Genetic Algorithms, 1991. 404 p.

85. Eiben A. E., Raue P. E., Ruttkay Zs. Genetic Algorithms with multiparent recombination. Parallel Problem Solving from Nature, 1994. -987 p.

86. Goldberg D.E. Genetic Algorithm in Search, Optimization & Machine Learning, 1989.-453 p.

87. Han J., Kamber M. Data Mining. Concept and Techniques, 2000. 550 p.

88. Holland J.H. Adaptation in natural and artificial systems. An introductory analysis with application to biology. Control, and artificial intelligence,1994.-812 c.

89. Knowledge Discovery Through Data Mining: What Is Knowledge Discovery? Tandem Computers Inc., 1996. 435 p.

90. Kureichik V.M. Some new features in Genetic Solution of the Traveling Salesman Problem // Adaptive Computing in Engineering, Design and Control. 1996. - №2. - pp. 294 - 296.

91. Melanie M. An Introduction to Genetic Algorithms. Massachusetts Institute of Technology, 1998. 458 p.

92. Michalewicz Z. Genetic Algorithms + Data Structures = Evolution Programs, 1992. 253 p.

93. Microsoft Press, Наиболее полное руководство для профессиональной работы в среде Visual Basic 6.0. СПб.: БХВ, 1999. - 825 с.

94. Мохоп В. Defining Data Mining. // DBMS Data Warehouse Supplement. 1996.-№3.-pp. 350-356.

95. Muhlenbein H. Parallel genetic algorithm, population dynamics and combinatorial optimization, 1989. -421 p.

96. Rahmani A.T., Ono N. A Genetic Algorithm for Channel Routing Problem Intl. Conf. on Gas. 1993. - №5. - pp. 494-498.

97. Richard J. Bauer. Genetic Algorithms and Investment Strategies, 1994. -650 p.

98. Whitley D., Mathias K. Parallel Problem Solving from Nature-PPSN 2, 1992.- 158 p.m1. УТВЕРЖДАЮ

99. Вице-президент по дисфнбьнжин it продажам |1.<ЮО^Сс^ерные ветры дистрибыошн" Чибрикун Д.Л.1. АКТоб использовании диссертационных исследований Доронина Вадима Александровича в ООО "Северные ветры дистрибыошн"

100. Начальника отдела Аналитики и Статистики1. Крюков li.l L1. Члены КОМИССИИ1. Секретаря I П С1. АКТоб использовании диссертационных исследований Доронина Вадима Александровича в учебном процессе кафедры ИТАС МИЭМ

101. Начальник УМУ, к.т.и. Ершов B.C.д.т.н., проф. Солодовников И.В.