автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Управление субъектами агропромышленного комплекса с помощью нейронных сетей и технологий извлечения знаний из массивов статистических данных

кандидата технических наук
Захаров, Дмитрий Никанорович
город
Москва
год
2013
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Управление субъектами агропромышленного комплекса с помощью нейронных сетей и технологий извлечения знаний из массивов статистических данных»

Автореферат диссертации по теме "Управление субъектами агропромышленного комплекса с помощью нейронных сетей и технологий извлечения знаний из массивов статистических данных"

На правах рукописи

Захаров Дмитрий Никанорович

УПРАВЛЕНИЕ СУБЪЕКТАМИ АГРОПРОМЫШЛЕННОГО КОМПЛЕКСА С ПОМОЩЬЮ НЕЙРОННЫХ СЕТЕЙ И ТЕХНОЛОГИЙ ИЗВЛЕЧЕНИЯ ЗНАНИЙ ИЗ МАССИВОВ СТАТИСТИЧЕСКИХ ДАННЫХ

Специальность 05.13.01 - Системный анализ, управление и обработка

информации (по отраслям АПК)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва - 2013

21 НОЯ 2013

005539438

Работа выполнена в Федеральном государственном бюджетном образовательном учреждении высшего профессионального образования «Московский государственный агроинженерный университет имени В. П. Горячкина»

Научный руководитель Воронин Евгений Алексеевич

доктор технических наук, профессор, заведующий кафедры «Вычислительная техника и прикладная математика»

Федерального государственного образовательного учреждения высшего профессионального образования «Московский государственный агроинженерный университет имени В.П. Горячкина»

Официальные оппоненты Дивеев Асхат Ибрагимович

доктор технических наук, профессор кафедры «Кибернетика и мехатроника» ФГБОУВПО

«Российский университет дружбы народов имени П. Лумумбы (РУДН)»

Шипилов Валерий Валерьевич

доктор технических наук, ведущий научный сотрудник ФГБУН ВЦ РАН имени А. А. Дородницына

Ведущая организация Всероссийский научно-исследовательский институт

экономики сельского хозяйства Российской академии сельскохозяйственных наук Защита состоится «12» декабря 2013 года в 15:00 на заседании диссертационного совета Д220.044.02 при ФГБОУ ВПО «Московский государственный агроинженерный университет имени В. П. Горячкина» по адресу: 127550, Москва, ул. Лиственничная аллея, д. 16а, корпус 3, конференц-зал.

С диссертацией можно ознакомиться в библиотеке ФГБОУ ВПО «Московский государственный агроинженерный университет имени В. П. Горячкина».

Автореферат разослан « » ноября 2013 г.

Ученый секретарь диссертационного совета

кандидат технических наук, доцент ( С. А. Андреев

Лгу-

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Реформирование и совершенствование агропромышленного комплекса (АПК) страны невозможно без анализа состояния его субъектов, прогнозирования их поведения и обоснования управленческих решений или целевого управления по достижению заданных результатов функционирования.

К рассматриваемым субъектам относятся: отдельные предприятия, хозяйства, объединения (концерны и холдинги), территориальные структуры, аграрные кластеры, районы, области, регионы, подотрасли и отрасли сельского хозяйства.

С точки зрения теории принятия решений и управления они представляются как сложные системы с большим набором фазовых координат и неоднозначной реакцией на управляющие и возмущающие воздействия.

Большую роль в идентификации и управлении такими объектами сыграли работы А. В. Петрикова, С. О. Сиптица, И. Г. Ушачева, А. М. Гатаулина, А. П. Зинченко, П. Д. Шимко, Р. Томаса, В. В. Розена, JI. А. Афанасьева, Ю. В. Василенко, А. Г. Аганбегяна, А. Г. Ивахненко и др.

Однако в условиях массовой информатизации и широкого развития информационных технологий значительное развитие получили методы Data Mining, искусственного интеллекта и нейронных сетей. Реализованы и актуализируются хранилища данных частного, производственного, отраслевого и государственного уровней. В этих условиях назрела необходимость переноса задач идентификации, прогнозирования, обоснования решений и управления субъектами АПК с помощью новых методов и технологий, ориентированных на специализированные центры обработки данных. Такой центр создан при Министерстве сельского хозяйства РФ, но он столкнулся с серьезной проблемой отсутствия соответствующих методов и программных средств.

Исходя из сложившихся условий и вышеизложенных особенностей, задача управления субъектами АПК с помощью технологий извлечения знаний из массивов статистических данных и нейронных сетей представляется актуальной.

Цель исследования. Целью диссертационной работы является применение методов Data Mining и нейронных сетей к обоснованию решений и управлению субъектами АПК с разработкой необходимого программного обеспечения.

Для достижения поставленной цели в диссертации решаются следующие задачи:

• выбор и обоснование интегрального показателя, дающего качественную оценку характера и динамики процессов функционирования субъектов АПК, определяющего их управляемость, прогнозируемость и визуализацию соответствующими математическими методами;

• выбор информационной технологии автоматической классификации субъектов АПК по заданным показателям сходства;

• разработка метода декомпозиции сложных систем субъектов АПК на подсистемы, с целью выявления факторов, определяющих их поведение;

• разработка алгоритма и технологии обоснования управляющих воздействий на субъект АПК, с целью достижения ожидаемого эффекта;

• разработка автоматизированного метода идентификации математической модели субъекта АПК;

• разработка программного комплекса нейродинамического представления субъекта АПК;

• разработка алгоритма и программного комплекса решающего задачу оптимального управления путем распределения управляющих ресурсов на заданный временной интервал, с целью получения максимального эффекта от их применения.

О&ьект исследования: субъекты хозяйственной деятельности агропромышленного комплекса.

Предмет исследования: управление субъектами агропромышленного комплекса с использованием существующих или специально созданных массивов данных по результатам наблюдений за этими субъектами или их прототипами.

Методы исследования. В диссертационной работе использованы методы Data Mining, математического программирования, математической статистики, нейросетевого моделирования, технологии параллельного программирования OpenMP, MS Visual Studio 2010 и Intel Parallel Studio.

Научная новизна работы. Научную новизну составляют следующие результаты работы:

• рекомендации по использованию интегрального показателя качественной оценки характера динамики процессов в субъектах АПК;

• рекомендации по использованию информационной технологии и программ автоматической классификации субъектов АПК;

• метод декомпозиции сложных систем субъектов АПК на подсистемы с целью выявления факторов, определяющих их поведение;

• рекомендации по использованию алгоритма обоснования управляющих воздействий на субъекты АПК с целью достижения ожидаемого эффекта;

• автоматизированный метод идентификации математических моделей субъектов АПК;

• программный комплекс нейродинамического представления субъекта АПК и оптимального распределения управляющих ресурсов на заданном временном интервале.

Практическая ценность работы. Предложенные в работе алгоритмы, методы и программные продукты позволяют создавать центры обработки данных любого уровня для идентификации и управления субъектами АПК, а также повысить обоснованность принимаемых решений.

Основные положения, выносимые на защиту:

• рекомендации по использованию технологий Data Mining в автоматической классификации, декомпозиции на подсистемы субъектов АПК и выбора оптимальных управляющих воздействий на них;

• достаточность показателя Хёрста для качественной оценки характера динамических процессов в субъектах АПК;

• автоматизированный метод идентификации математических моделей субъектов АПК;

• программный комплекс нейродинамического представления субъектов АПК и оптимального управления путем распределения управляющих ресурсов на заданный промежуток времени.

Достоверность и обоснованность результатов, полученных в диссертации, основывается на применении методов системного анализа в сочетании с технологиями Data Mining и нейронных сетей. Эксперименты, проведенные в рамках данной работы, основаны на реальных статистических данных.

Апробация работы. Основные результаты диссертации докладывались на следующих конференциях:

• Международной научно-практической конференции «Инновации в образовании и науке» (29-30 января 2009 года, Москва);

• Международной научно-практической конференция (МНПК) энергетического

факультета (совместно с ГНУ ВИЭСХ) «Энергосбережение в системах электроснабжения и электротехнологиях» (8 октября 2010 года, Москва);

• Международной научно-практической конференции, посвященной 80-летию ФГОУ ВПО МГАУ «Интеграция науки, образования и производства в области агроинженерии» (7-8 октября 2010 года, Москва);

• Международной научной сессии «Инновационные проекты в области агроинженерии» (6-7 октября 2011 года, Москва);

• Международной научно-практической конференции «Инновационные энергоресурсо-сберегающие технологии в АПК» (27-28 марта 2012 года, Москва).

Публикации. Основные результаты исследований опубликованы в 7 печатных работах, в изданиях, включенных в перечень ВАК.

Структура диссертации и ее объем. Диссертация состоит из введения, четырех глав, основных выводов по каждой главе, заключения, списка литературы и приложений. Общий объем диссертации составляет 174 страницы, включая 41 рисунок. Библиография включает 111 наименований на 11 страницах.

СОДЕРЖАНИЕ РАБОТЫ Во введении приведена общая характеристика работы, включающая основные направления исследования, формулировку цели и задач исследований, раскрытие научной новизны и практической значимости работы, сведения об апробации и внедрении.

В первой главе исследованы вопросы, посвященные общей характеристике предметной области исследований, анализу состояния вопроса, а также постановке задач диссертационного исследования.

Процесс управления требует предварительного анализа принимаемого решения. Для того чтобы провести качественный и глубокий анализ исследуемой предметной области, необходимо большое количество информации. В настоящий момент технология сбора статистических данных хорошо отлажена. Например, Министерство регионального развития осуществляет постоянный сбор большого количества показателей. Федеральная служба государственной статистики ведет работу по сбору большого количества разнообразных данных. При этом используются современные клиент-серверные технологии для облегчения процесса предоставления отчетности.

Проблема состоит в том, что за годы работы, стремясь к постоянному повышению

эффективности сбора разного рода отчетности, накоплен огромный массив данных.

Исследование задач, которые решаются с помощью накопленных данных, показало, что проводится только поверхностный анализ, направленный на построение графиков по различному виду показателей, однако, более глубокий анализ не проводится.

Решением проблемы является использование новых научных методов, которые позволяют находить скрытые зависимости в данных. Это технология Data Mining. Суть этой технологии заключается в поиске закономерностей в больших объемах данных.

Использование технологии извлечения знаний подразумевает наличие определенных навыков у пользователя. Данная технология имеет ряд особенностей:

• для извлечения полезных данных необходимо понимание их сути;

• требуется большое количество данных, которые необходимо подготовить перед использованием;

• генерация большого количества результатов, требующих проверки на тестовых данных;

• высокая стоимость программных пакетов.

Технология извлечения знаний из данных Data Mining располагает широким набором методов для исследования. Методы делятся на две группы: направленные на сохранение данных и направленные на выявление закономерностей. Исходя из текущей ситуации, необходимо отобрать методы для работы с данными. Имея в своем распоряжении большой массив данных, необходимо использовать метод, ориентированный на сохранение оригинальных данных для их последующей обработки. Это кластерный анализ, используемый для автоматической классификации данных. Затем требуется выявить факторы, определяющие взаимодействие между подсистемами субъекта АПК. Для этого пригодны методы статистического анализа, направленные на выявление связей и закономерностей. Для определения характера и динамики процессов, протекающих в субъектах АПК, требуется выявить интегральный показатель, позволяющий качественно оценить эту динамику. Для этого хорошо подходят методы, ориентированные на использование теории искусственного интеллекта, в частности, дерево решений.

Проведенный обзор исследований по тематике регионального экономического моделирования выявил, что первыми трудами были работы М. Блауга, А. Леша, А.

Ткаченко. Они стремились к представлению территории в виде некоторой географической карты. В дальнейшем ряд авторов, продолжая работать в данном направлении, развили два подхода к проведению эколого-экономического моделирования. Это были работы Дж. Форрестера, Д. Медоуза и В. Леонтьева.

Первый подход основан на анализе себестоимости, который был впервые применен В. Леонтьевым. Этот подход наиболее перспективен, потому что основан на эколого-экономической модели.

Второй подход использует метод системной динамики Дж. Форрестера. Здесь широкое использование нашли экспертные оценки, что позволило снизить требования к объему информации. Недостатком этого подхода является большая вероятность получить модель, не отражающую реальную ситуацию.

Зарубежный опыт разработки таких моделей представлен математической моделью для анализа энергетической политики, экологии и макроэкономики. Модель МАЯКАЬ, разработанная для Швеции и Швейцарии. Впоследствии модель была применена в Канаде.

Сформулированы задачи исследования.

Во второй главе рассмотрены вопросы исследования динамических и структурных свойств систем АПК.

Первая часть этой главы решает задачу исследования динамики экономических и производственных процессов в АПК регионов с использованием показателей Херста.

Для расчётов использована формула, предложенная Хёрстом,

где Я - размер накопленных отклонений от среднего; Б - стандартное отклонение; N -число наблюдений; а = 0,5 - параметр, предложенный Хёрстом.

В качестве примера был изучен процесс производства валовой продукции во всех категориях хозяйств Воронежской области. Необходимая информация получена из информационных хранилищ Росстата.

По полученной числовой последовательности объема валового продукта по годам был вычислен показатель Хёрста: Н = 0,882.

Такое значение показателя означает, что процесс производства валовой продукции

(1)

1о8(аЛГ) '

персистентен, прогнозируем, управляем и представим нейросетевой моделью.

Во второй части предложен метод автоматической классификации субъектов АПК с помощью технологии кластеризации на основе алгоритма самоорганизующихся карт Кохонена. В качестве исходных данных использованы результаты Всероссийской сельскохозяйственной переписи. Проведено три эксперимента: кластеризация регионов РФ по поголовью крупного рогатого скота, размеру посевных площадей и по количеству хозяйств.

Проведенная классификация сформировала кластеры регионов, идентичных по хозяйственной деятельности, структуре животноводства и организации землепользования, что позволило выявить основные типы регионов по видам и результатам хозяйственной деятельности.

В третьей части этой главы предложен и обоснован метод декомпозиции сложных систем в сельском хозяйстве. За меру уровня взаимодействия подсистем принят канонический коэффициент корреляции. На примере данных сельскохозяйственной переписи рассмотрено взаимодействие подсистем животноводства, растениеводства и видов хозяйствующих субъектов. Выявлены основные механизмы взаимодействия этих компонентов, которые представлены на рисунке 1.

Явм = О, 93

Рисунок 1 - Граф взаимодействия подсистем: 0 - подсистема хозяйствующих субъектов Ч,,с]2,Чз,<?4,Ч5 , в - подсистема распределения посевных площадей хозяйствующих субъектов , М - подсистема распределения поголовья скота в

хозяйствующих субъектах т1,ш2,т3,т4,т5

В третьей главе предложен и апробирован метод выявления оптимальных управляющих воздействий на субъекты АПК, который основан на построении дерева решений с помощью программного пакета Rapid Miner.

На основании этого дерева строятся алгоритмы выбора оптимального управляющего воздействия. Пример логического правила выбора инвестиционно-привлекательного региона по данным результатов сельскохозяйственной переписи представлен в формуле:

Good = ((Н > 0.05) л (F > 1131.155)) V ((Я >0.05) Л (f< 1131.155) А (У > 4007.125))

где F - посевные площади региона; Н - капитальные вложения за счет федерального бюджета; J - бюджетные субсидии на результаты деятельности Министерства сельского хозяйства.

Полученная формула позволяет построить экспертную систему логического вывода на языке PROLOG и автоматизировать процесс принятия решений.

Рисунок 2 - Нейронная сеть, как представление графа Вторая часть этой главы посвящена построению и разработке математических моделей динамических систем АПК регионов.

Показана топологическая эквивалентность графа системы и двухслойной

нейронной сети, а следовательно, и возможность автоматизировать процесс поиска и построения этих графов для линейных систем.

Граф, приведенный на рисунке 2, представляет из себя нейронную сеть. Для него можно записать выражение связи входа нейронной сети с выходом:

Х(п + \)=АХ(п), (3)

где: А - матрица инцидентности графа; X (и) - вектор состояния системы в п момент времени; Х(п+1) - вектор состояния системы в п+1 момент времени.

Следовательно, обучив эту нейронную сеть, мы получим искомый граф из матрицы А.

Предложенный метод позволяет построить и представить в динамике как линейные, так и нелинейные графы состояний сложных систем.

В четвертой главе разработаны алгоритмы и программный комплекс, использующий технологию параллельного программирования, для суперкомпьютеров. Общий вид изображен на рисунке 3.

^ =101*1

Рисунок 3 - Общий вид программного комплекса

Комплекс позволяет проводить нейродинамическое моделирование поведения субъектов АПК и решить задачу оптимального распределения ресурсов, направленных на получение максимальной эффективности от их использования.

Реализована схема прогнозирования с помощью нейронной сети, которая представлена на рисунке 4.

В качестве метода подбора оптимального решения принят упрощенный алгоритм нейродинамического программирования, т. е. с помощью метода Монте-Карло генерируется управляющая последовательность^,/ = 1 ...пк), удовлетворяющая условию, ^ К = й, где Я - заданный объем распределенного ресурса.

Подавая на вход нейронной сети, в соответствии с рисунком 4, эту управляющую последовательность, мы наблюдаем или вычисляем прогнозируемое значение критерия оптимизации.

Входные Выходные

параметры параметры

Рисунок 4 - Схема алгоритма прогнозирования: 5(0) - вектор состояния системы в начальный момент времени, У(п +1) - вектор возмущений в п+1 момент времени, {70 + 1) _ вектор управляющих воздействий в п+1 момент времени, 5(п + 1) - вектор состояния системы в п+1 момент времени

Такая генерация управляющих последовательностей и прогонка ее через схему прогноза продолжается до тех пор, пока изменения отобранного критерия оптимизации не будут превышать заданной погрешности. В результате получаются данные об оптимальном распределении транша (рисунок 5).

Гее

Рисунок 5 - Оптимальное распределение транша и изменение показателя «Производство валовой сельскохозяйственной продукции во всех категориях хозяйств, в фактических ценах, млн. руб.» на развитие АПК региона

Применение результата исследований. Результаты данной работы могут быть использованы при решении различного типа задач. Созданный программный продукт может применяться в качестве средства поддержки принятия решения о распределении инвестиций с последующим анализом результатов. Другой областью применения может быть прогнозирование динамики развития параметров системы с учетом изменения входных данных.

ОСНОВНЫЕ ВЫВОДЫ ПО РАБОТЕ

В результате проведенных исследований:

• Выбран и обоснован интегральный показатель Хёрста, дающий качественную оценку характера динамики процессов в субъекте АПК, определяющий их управляемость, прогнозируемость и визуализацию математических моделей в виде нейронных сетей.

• Предложено и обосновано применение технологии самоорганизующихся карт

Кохонена для автоматизации классификации субъектов АПК по заданным параметрам сходства.

• Предложен, обоснован и апробирован метод и технология декомпозиции сложных систем на подсистемы с выявлением характера взаимодействия их компонентов.

• Предложен, обоснован и апробирован алгоритм выбора оптимальных управляющих воздействий на субъект АПК с целью достижения ожидаемого эффекта, использующий технологию построения дерева решений по результатам наблюдений за ним или его прототипами.

• Доказана топологическая эквивалентность графа, представляющего модель поведения линейной системы и двухслойной нейронной сети, что позволяет решить задачу построения самообучающихся графов.

• Разработан алгоритм и программный комплекс для суперкомпьютеров и центров обработки данных, позволяющий реализовать нейродинамическое моделирование субъектов АПК и решить задачу оптимального управления распределением управляющих ресурсов на заданном интервале с максимальной эффективностью.

Основные результаты диссертационной работы изложены в следующих публикациях

1. Д. Н. Захаров. Кластерный анализ результатов сельскохозяйственной переписи / Е. А. Воронин, Д. Н. Захаров // Вестник МГАУ. - 2010. - № 2. - С. 90-92.

2. Д. Н. Захаров. Построение самообучающихся графов динамических систем с сосредоточенными параметрами / Е. А. Воронин, Д. Н. Захаров // Международный научный журнал. - 2013. - № 1. — С. 67-69.

3. Д. Н. Захаров. Поиск и обоснование эффективных правил стимулирования АПК регионов РФ по статистическим данным о результатах их деятельности / Е. А. Воронин, Д. Н. Захаров // Международный научный журнал. -2013,-№2.-С. 57-61.

4. Д. Н. Захаров. Разработка информационно-аналитической системы идентификации и прогнозирования состояния субъектов экономической деятельности в АПК // Международный научный журнал. - 2013. - № 2. - С. 62-66.

5. Д. Н. Захаров. Анализ результатов сельскохозяйственной переписи агропромышленного комплекса / Е. А. Воронин, Д. Н. Захаров // Международный научный журнал. - 2010. - № 3. - С. 31-36.

6. Д. Н. Захаров. Информационно аналитическая система моделирования и прогнозирования развития АПК // Международный научный журнал. -2012.-№1,-С. 70-73.

7. Д. Н. Захаров. Анализ статистических показателей и построение модели АПК региона с использованием технологии нейросетевого моделирования / Е. А. Воронин, С. О. Сиптиц, Д. Н. Захаров // Международный научный журнал. - 2013. -№ 4. - С. 72-77.

Подписано к печати 11.11.2013 г.

Формат 68x84/16

Бумага: писчая

Печать: трафаретная

Уч.-изд.л.0,87

Тираж 100 экз.

Заказ № 336

Отпечатано ООО «УМЦ Триада»

127550, Москва, ул. Лиственничная аллея, д.7 корп.2.

Текст работы Захаров, Дмитрий Никанорович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

Федеральное государственное бюджетное образовательное учреждение Московский государственный агроинженерный университет им. В.П.Горячкина

На правах рукописи

04201364921 Захаров Дмитрий Никанорович

Управление субъектами агропромышленного комплекса с помощью нейронных сетей и технологий извлечения знаний из массивов статистических данных

05.13.01 - Системный анализ, управление и обработка информации (по

отраслям)

ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук

Научный руководитель д.т.н., проф.

Воронин Евгений Алексеевич

Москва-2013

Содержание

Введение...................................... 4

Глава 1. Анализ состояния вопроса..................... 9

1.1. Управление субъектами АПК. Проблемы, цели и решения..... 9

1.2. Выводы ................................. 15

Глава 2. Исследование динамических и структурных свойств субъектов АПК.................................... 17

2.1. Исследование динамики процессов, отражающих поведение субъектов ЛПК и выбор интегрального показателя ........... 17

2.2. Выбор информационной технологии автоматической классификации субъектов АПК по заданным наборам параметров, характеризующих их состояние и поведение................22

2.3. Выбор метода декомпозиции сложных систем субъектов АПК на основные подсистемы, с целью выявления факторов, определяющих их поведение............................32

2.4. Выводы.................................42

Глава 3. Разработка эффективных алгоритмов моделирования и представления динамических систем субъектов АПК............44

3.1. Обоснование выбора эффективных стимулирующих правил управления субъектами АПК.........................44

3.2. Разработка автоматизированного метода идентификации математической модели субъекта АПК....................51

3.3. Выводы .................................54

Глава 4. Разработка программного комплекса моделирования и выбора оптимальной стратегии управления субъектами АПК.......56

4.1. Разработка программного комплекса нейродинамического представления субъекта АПК........................56

4.2. Разработка алгоритма и программного комплекса решающего задачу оптимального управления путем распределения управляющих ресурсов на заданный временной интервал, с целью получения максимального эффекта от их применения..........68

4.3. Выводы.................................82

Заключение....................................84

Литература ....................................85

Приложение А. Выборка показателей....................95

Приложение Б. Листинг программного кода................131

Б.1. Обучение нейронной сети.......................131

Б.2. Дополнение выборки случайными числами.............136

Б.З. Прогнозирование............................139

Б.4. Алгоритм поиска оптимального распределения параметра.....141

Б.5. Процедура подбора количества нейронов в скрытом слое и опций

обучения.................................147

Б.6. Вспомогательные функции.......................157

Б.7. Процедура просмотра структуры нейронной сети..........170

Приложение В. Акт о внедрении

175

Введение

Актуальность темы исследования. Реформирование и совершенствование агропромышленного комплекса (АПК) страны невозможно без анализа состояния его субъектов, прогнозирования их поведения и обоснования управленческих решений или целевого управления по достижению заданных результатов функционирования.

К рассматриваемым субъектам относятся: отдельные предприятия, хозяйства, объединения (концерны и холдинги), территориальные структуры, аграрные кластеры, районы, области, регионы, подотрасли и отрасли сельского хозяйства.

С точки зрения теории принятия решений и управления они представляются как сложные системы с большим набором фазовых координат и неоднозначной реакцией на управляющие и возмущающие воздействия.

Большую роль в идентификации и управлении такими объектами сыграли работы Петрикова A.B., Сиптица С.О., Ушачева И.Г., Гатаулина A.M., Зинчешсо А.П., Шимко П.Д., Томаса Р., Розена В.В., Афанасьева JT.A., Василенко Ю.В., Аганбегяна А.Г., Ивахненко А.Г. и др.

Однако, в условиях массовой информатизации и широкого развития информационных технологий, значительное развитие получили методы Data Mining, искусственного интеллекта и нейронных сетей. Реализованы и актуализируются хранилища данных частного, производственного, отраслевого и государственного уровней. В этих условиях назрела необходимость переноса задач идентификации, прогнозирования, обоснования решений и управление субъектами АПК с помощью новых методов, технологий, ориентированных на специализированные центры обработки данных. Такой центр создан при министерстве сельского хозяйства РФ, но он столкнулся с серьезной проблемой отсутствия соотвегсгву-ющих методов и программных средств.

Исходя из сложившихся условий и вышеизложенных особенностей задача

управления субъектами АПК с помощью технологий извлечения знаний из массивов статистических данных и нейронных сетей представляется актуальной.

Проблема исследований - идентификация, управление и моделирование поведения сложных систем в сельском хозяйстве.

Объект исследований - субъекты хозяйственной деятельности агропромышленного комплекса.

Предмет исследований управление субъектами агропромышленного комплекса с использованием существующих или специально созданных массивов данных по результатам наблюдений за этими субъектами или их прототипами.

Цели и задачи диссертационной работы: Цель диссертационной работы является применение методов Data Mining и нейронных сетей к обоснованию решений и управлению субъектами АПК с разработкой необходимого программного обеспечения.

Для достижения поставленной цели в диссертации решаются следующие задачи:

• Выбор и обоснование интегрального показателя, дающего качественную оценку характера и динамики процессов функционирования субъектов АПК, определяющею их управляемость, прогнозируемость и представляемость соответствующими математическими методами.

• Выбор информационной технологии автоматической классификации субъектов АПК по заданным показателям сходства.

• Выбор метода декомпозиции сложных систем субъектов АПК на подсистемы, с целью выявления факторов, определяющих их поведение.

• Выбор алгоритма и технологии обоснования управляющих воздействий на субъект АПК, с целью достижения ожидаемого эффекта.

• Разработка автоматизированного метода идентификации математической модели субъекта АПК.

• Разработка программного комплекса нейродинамического представления субъекта АПК.

• Разработка алгоритма и программного комплекса решающего задачу оптимальною управления путем распределения управляющих ресурсов на заданный временной интервал, с целью получения максимального эффекта от их применения.

Научная новизна Научную новизну составляют следующие результаты работы:

1. Рекомендации по использованию интегрального показателя качественной оценки характера динамики процессов в субъектах АПК.

2. Рекомендации по использованию информационной технологии и программ автоматической классификации субъектов АПК.

3. Метод декомпозиции сложных систем субъектов АПК на подсистемы, с целью выявления факторов, определяющих их поведение.

4. Рекомендации по использованию алгоритма обоснования управляющих воздействий на субъекты АПК, с целью достижения ожидаемого эффекта.

5. Автоматизированный метод идентификации математических моделей субъектов АПК.

6. Программный комплекс нейродинамического представления субъекта АПК и оптимального распределения управляющих ресурсов на заданном временном интервале.

Теоретическая и практическая значимость. Предложенные в работе алгоритмы, методы и программные продукты позволяют создавать центры обработки данных любош уровня для идентификации и управления субъектами АПК, принимая обоснованные решения.

Положения, выносимые на защиту:

1. Рекомендации по использованию технологий Data Mining в автоматической классификации, декомпозиции на подсистемы субъектов АПК и выбора оптимальных управляющих воздействий на них.

2. Достаточность показателя Хёрста для качественной оценки харакгера динамических процессов в субъектах АПК.

3. Автоматизированных метод идентификации математических моделей субъ-екгов АПК.

4. Программный комплекс нейродинамического представления субъектов АПК и оптимального управления путем распределения управляющих ресурсов на заданный промежуток времени.

Степень достоверности и апробация результатов. Достоверность и обоснованность результатов, полученных в диссертации, основывается на применении методов системного анализа в сочетании с технологиями Data Mining, нейронных сетей. Эксперименты, проведенные в рамках данной работы основаны на реальных статистических данных.

Основные результаты диссертации докладывались на следующих конференциях:

1. Международной научно-практической конференции "Инновации в образовании и науке"29-30 января 2009 г.

2. Международная научно-пракгическая конференция (МНПК) энергетического факультета (совместно с ГНУ ВИЭСХ) "Энергосбережение в системах электроснабжения и электротехнологиях"8 октября 2010 г.

3. Международная научно-практическая конференция, посвященная 80-летию ФГОУ ВПО МГАУ "Интеграция науки, образования и производства в области а1роинженерии"7-8 октября 2010

4. Международная научная сессия "Инновационные проекты в области агро-инженерии"6-7 октября 2011 г.

5. Международная научно-практическая конференция "Инновационные энер-горесурсо-сберегающие технологии в АПК"27-28 марта 2012 г.

Публикации. Основные результаты исследований опубликованы в 7 печатных работах в изданиях включенных в перечень ВАК, как ведущие рецензируемые научные журналы и издания, в которых должны быть опубликованы основные научные результаты диссертации на соискание ученой степени кандидата наук.

Личный вклад автора. Содержание диссертации и основные положения, выносимые на защиту, отражают персональный вклад автора в опубликованные работы. Подготовка к публикации полученных результатов проводилась совместно с соавторами, причем вклад диссертанта был определяющим. Все представленные в диссертации результаты получены лично автором.

Структура и объем диссертации. Диссертация состоит из введения, обзора литературы, 4-х глав, заключения и библиографии. Общий объем диссертации 176 страниц, включая 41 рисунок. Библиография включает 98 наименований на 11 страницах.

9

Глава 1

Анализ состояния вопроса

1.1. Управление субъектами АПК. Проблемы, цели и решения

Для целенаправленного развития сельского хозяйства необходимо эффективное планирование и прогнозирование его состояния. В частности, при адаптации сельскохозяйственного производства к изменениям климата и другим факторам неравномерного (по годам) производства товарной продукции необходимо изучить реальную ситуацию, включая научную опенку имеющихся тенденций на кратко, средне и долгосрочную перспективу, учитывая разнообразные, по территориям, негативные воздействия, давая адекватную оценку соответствующим рискам (погодным, технологическим, организационным, кадровым и др.). Только после этого разрабатывать и принимать, соответствующие управляющие мероприятия. В настоящее время такого системного подхода в российских регионах практически не наблюдается.

Это осуществимо когда известен характер процессов с.х. производства, их устойчивость, управляемость и прогнозируемость с необходимой точностью.

В настоящее время, благодаря интенсивному развитию и применению информационных технологий, собраны и используются большие объёмы данных о сельском хозяйстве в виде экономических и физических показателей по регионам Российской федерации. Это способствует анализу состояния этой отрасли народного хозяйства, принятию обоснованных управленческих решений и стимулированию её эффективного развития. Однако, методически, задачи исследования устойчивости, управляемости и прогнозируемости по статистическим данным требуют соответствующих постановок, решений и доведения до практической реализации.

Любой субъект сельского хозяйства в процессе существования во времени

представляет собой динамическую систему. Следовательно, к анализу их поведения применимы методы теории идентификации и анализа поведения динамических систем.

Процесс управления немыслим без предварительного анализа принимаемого решения. Для того чтобы провести качественный и глубокий анализ исследуемой предметной области необходимо большое количество информации. В настоящий момент технология сбора статистических данных хорошо отлажена. Например, Министерство регионального развития [68] осуществляет постоянный сбор большого количества показателей. Федеральная служба государственной статистики ведет работу по сбору большого количества разнообразных данных [30]. При этом используются современные клиент-серверные технологии для облегчения процесса предоставления отчетности [91].

Проблема состоит в том, что за годы работы, стремясь к постоянному повышению эффективности сбора разного рода отчетности, накоплен огромный массив данных.

Исследование задач, которые решаются данными организациями с помощью накопленных данных показало, что проводится только поверхностный анализ, направленный на построение графиков по различному виду показателей. Какого-либо более глубокого анализа не проводится.

Решением проблемы является использование новых научных методов, которые позволяют находить скрьггые зависимости в данных. Это технология Data Mining. Суть этой технологии заключается в поиске закономерностей в больших объемах данных.

В 1996 году агентством Gartner Group, занимающимся анализом рынков информационных технологий введен термин "Business Intelligence". Это программные средства, функционирующие в рамках предприятия и обеспечивающие функции доступа и анализа информации, находящейся в хранилище данных, а также обеспечивающие принятие правильных и обоснованных управленческих решений.

Использование технологии извлечение знаний подразумевает наличие определенных навыков у пользователя. У данной технологии существует ряд особенностей:

• для извлечения полезных данных необходимо понимание их сути;

• требуется большое количество данных, которые необходимо подготовить перед использованием;

• генерация большого количества результатов, требующих проверки на тестовых данных;

• высокая стоимость про1раммных пакетов.

Технология извлечения знаний из данных Data Mining располагает широким наборов методов для исследования. Методы делятся на две группы: направленные на сохранение данных и направленные на выявление закономерностей. Исходя из текущей ситуации необходимо отобрать методы для работы с данными. Имея в своем распоряжении большой массив данных необходимо использовать метод, ориентированный на сохранение оригинальных данных для их последующей обработки. Это кластерный анализ, используемый для автоматической классификации данных. Затем требуется выявить факторы, определяющие взаимодействие между подсист емами субъекта АПК. Для этого пригодны методы статистического анализа, направленные на выявление связей и закономерностей. Для определения характера и динамики процессов, протекающих в субъектах АПК требуется выявить интегральный показатель, позволяющий качественно оценить эту динамику. Для этого хорошо подходят методы ориентированные на использование теории искусственного интеллекта, в частности -дерево решений.

Большую роль в идентификации и управлении такими объектами сыграли работы Петрикова A.B. [77], Сиптица С.О. [89], Ушачева И.Г., Гатаулина A.M.,

Зинченко А.П. [52], Шимко П.Д., Томаса Р., Розена В.В., Афанасьева Л.А., Василенко Ю.В., Аганбегяна А.Г. [10], Ивахненко А.Г. и др.

Альтернативой современного подхода являются методы регионального экономического анализа. Началом данного направления были труды М.Блауга [18], А.Леша [63] и А.Ткаченко [94] они стремились к представлению территории в виде некоторой географической карты. Впоследствии в экономическом анализе стали применять дискретные описания пространства в виде совокупности регионов-точек, упор в которых делался в основном на межрегиональное взаимодействие [92].

В дальнейшем ряд авторов, продолжая работать в данном направлении, развили два подхода к проведению эколого-экономического моделирования. Это были работы Форресгера [96], Медоуза [6] и Леонтьева [62].

Первый подход основан на анализе себестоимости, который был впервые применен В.Леонтьевым. Этот подход наиболее перспективен, потому что основан на эколого-экономической модели [25].

Второй подход использует метод системной динамики Дж. Форрестера. Здесь широкое использование нашли экспертные оценки. Это позволило снизить требования к объему информации. Недостатком этого подхода является большая вероятность получить модель весьма отдаленную от реального положения дел.

В конце 20 века подход Леонтьева эволюционировал и это привело к всплеску работ но �