автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Нейросетевое моделирование и оптимизация многоэтапных процессов в условиях зашумленности исходных данных
Автореферат диссертации по теме "Нейросетевое моделирование и оптимизация многоэтапных процессов в условиях зашумленности исходных данных"
005051461 На правах рукописи
Короткое Евгений Алексеевич
НЕЙРОСЕТЕВОЕ МОДЕЛИРОВАНИЕ И ОПТИМИЗАЦИЯ МНОГОЭТАПНЫХ ПРОЦЕССОВ В УСЛОВИЯХ ЗАШУМЛЕННОСТИ ИСХОДНЫХ ДАННЫХ
Специальность: 05.13.18- «Математическое моделирование^
численные методы и комплексы программ»
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
Воронеж-2013
4 АПР 2013
005051461
Работа выполнена в компьютерных технологий».
НОУ ВПО «Международный институт
Научный руководитель
Официальные оппоненты:
Качановский Юрий Петрович, кандидат технических наук, доцент, Липецкий государственный технический университет, заведующий кафедрой автоматизированных систем управления
Демидова Лилия Анатольевна, доктор технических наук, профессор, Рязанский государственный радиотехничеасий университет, профессор кафедры вычислительной и прикладной математики
Ведущая организация
Сараев Павел Викторович, кандидат технических наук, доцент, Липецкий государственный технический университет, доцент кафедры прикладной математики
Старооскольский технологический институт-филиал Национального исследовательского технологического университета «Московский институт стали и сплавов»
Защита состоится 25 апреля 2013 г. в 13:00 часов в конференц-зале на заседании диссертационного совета Д212.037.01 ФГБОУ ВПО «Воронежский государственный технический университет» по адресу: 394026, г. Воронеж, Московский просп., 14.
С диссертацией можно ознакомиться в научно-технической библиотеке ФГБОУ ВПО «Воронежский государственный технический университет».
Автореферат разослан «25» марта 2013 г.
Ученый секретарь диссертационного совета
Барабанов Владимир Федорович
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность работы. Сложные многоэтапные процессы характеризуются большим количеством факторов, влияющих как на отдельные стадии этих процессов, так и на протекание нескольких процессов одновременно.
Зависимости между факторами и выходными параметрами могут быть построены аналитически на основании теоретического анализа процессов, однако при этом полученные математические модели имеют нелинейный вид, очень сложны и их практическое использование весьма затруднительно.
Другой подход к моделированию предполагает использование методов идентификации, основанных на наблюдении за реальным процессом и измерении соответствующих значений факторов и выходных параметров. Однако значения некоторых факторов могут быть измерены с существенной погрешностью, для других - известны только усредненные значения, а в отдельных случаях экспериментальные значения факторов включают в себя субъективные ошибки процесса измерения. Полученные в результате идентификации математические модели обычно имеют более простой вид, однако использование таких моделей для оптимизации процессов не обеспечивает требуемого уровня качества.
Таким образом, разработка эффективных методов идентификации сложных многоэтапных процессов в условиях зашумленности исходных данных является актуальной задачей.
Работа выполнена в рамках целевой программы технологических мероприятий по повышению качества продукции и эффективности производства ОАО «Новолипецкий металлургический комбинат» на 2010-2011 годы.
Целью работы являются создание и исследование эффективных методов и средств для решения задачи моделирования и оптимизации многоэтапных процессов на основе нейронных сетей в условиях зашумленности исходных данных.
Основные задачи. Для достижения поставленной цели сформулированы следующие задачи:
- исследовать возможность применения нейронных сетей в задачах моделирования и оптимизации сложных многоэтапных процессов;
- построить нейросетевую модель многоэтапных процессов в условиях зашумленности исходных данных;
- разработать метод оптимизации сложных многоэтапных процессов, использующий инверсию нейронной сети;
- разработать комплекс программ, реализующих построенную математическую модель и алгоритм оптимизации;
- экспериментально проверить разработанные средства на реальных производственных данных и провести сравнительный анализ с другими моделями.
Методы исследования. В работе использованы методы теории искусственных нейронных сетей, оптимизации, математической статистики, теории вероятности, векторной алгебры, аналитической геометрии, кластерного анализа, объектно-ориентированного программирования, проектирования реляционных
баз данных. Программная реализация выполнена на языке С++ в среде программирования Borland С++ Builder 6.0, хранение данных организовано на базе СУБД FireBird 2.1.
Тематика работы соответствует п. 3 «Разработка, обоснование и тестирование эффективных вычислительных методов с применением современных компьютерных технологий», п. 4 «Реализация эффективных численных методов и алгоритмов в виде комплексов проблемно-ориентированных программ для проведения вычислительного эксперимента» и п. 8 «Разработка систем компьютерного и имитационного моделирования» паспорта специальности 05.13.18 - «Математическое моделирование, численные методы и комплексы программ».
Научная новизна. В диссертационной работе получены следующие результаты, характеризующиеся научной новизной:
- численный метод решения задачи оптимизации параметров многоэтапных процессов на основе инверсии нейронной сети, обеспечивающий равномерную аппроксимацию поверхности решения и отличающийся использованием градиентного метода уточнения дополнительных точек решения;
- алгоритм поиска смежных точек, обеспечивающий равномерное покрытие поверхности решения, отличающийся заполнением наименее представленных областей поверхности решения;
- метод подготовки зашумленных данных, основанный на понятии профиля компактности и комбинаторном анализе, отличающийся проведением процедуры кластерного анализа над выходными параметрами и обеспечивающий подготовку данных с непрерывной выходной величиной;
- структура программного комплекса моделирования и оптимизации, позволяющего проводить построение нейросетевой модели и инверсию нейронной сети, отличающегося реализацией разработанных методов оптимизации и предобработки данных.
Практическая значимость. Предложенные методы моделирования и алгоритм оптимизации сложных многоэтапных процессов могут быть использованы для получения качественной продукции при реализации сложных технологических режимов производства, а также позволяют разрабатывать технологические режимы новых видов продукции с заданными показателями качества.
Реализация и внедрение результатов работы. Теоретические и практические результаты работы прошли апробацию в Дирекции по информационным технологиям ОАО «Новолипецкий металлургический комбинат». Разработанное программное обеспечение планируется использовать при построении информационных систем производственного уровня для данного предприятия.
Результаты диссертационной работы используются в учебном процессе Липецкого филиала Международного института компьютерных технологий при подготовке инженеров по специальности 230101 «Вычислительные машины, комплексы, системы и сети».
Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на V Всероссийской школе-семинаре молодых ученых «Управление большими системами» (Липецк, 2008), X Международной
научно-технической конференции «Информационно-вычислительные технологии и их приложения» (Пенза, 2009), IX Всероссийской научно-практической конференции «Информационные технологии» (Йошкар-Ола, 2009), VIII Всероссийской научно-практической конференции с международным участием «Информационные технологии и математическое моделирование» (Анжеро-Судженск, 2009), X Международной научно-методической конференции «Информатика: проблемы, методология, технологии» (Воронеж, 2010), научно-образовательном семинаре «Математическое моделирование, информационные технологии и проблемы управления» (Липецк, 2010, 2011, 2012), Международной научно-технической конференции «Искусственный интеллект. Интеллектуальные системы ИИ-2010» (Донецк, 2010), Межвузовской научно-практической конференции «Актуальные проблемы современного научного знания» (Липецк, 2011), Областном профильном семинаре «Школа молодых ученых по проблемам технических наук» (Липецк, 2012).
Публикации. По материалам диссертации опубликовано 13 научных работ, в том числе 3 - в изданиях, рекомендованных ВАК РФ. В работах, опубликованных в соавторстве, лично соискателем выполнено: [1] - разработан метод подготовки данных в моделировании, основанный на понятии профиля компактности и комбинаторных формулах для эффективного вычисления функционала скользящего контроля; [2] - разработан алгоритм поиска смежных точек в пространстве, позволяющий находить наименее представленные области поверхности в пространстве, и предложен метод получения равномерного распределения точек на поверхности решения инверсии нейронной сети; [3] -предложена структура взаимодействия программных модулей; [4] - выполнен анализ возможности применения нейронных сетей в моделировании многоэтапных процессов; [5] - проведен выбор архитектуры нейронной сети для решения задачи моделирования и оптимизации; [6, 7] - разработана структура нейросетевой модели многоэтапной технологии производства холоднокатаного проката; [8] - разработана модель данных для задачи моделирования и оптимизации сложных многоэтапных процессов; [9] - оценено влияние вида функции активации и отрезка генерации начальных значений весов на качество обучения нейронной сети; [10] — построена классовая диаграмма на языке ЦМЬ разработанного программного обеспечения реализации многослойных нейронных сетей; [11] - проведено сравнение обучения нескольких связанных нейронных сетей и одной укрупненной сети.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 96 наименований, 3 приложений. Основная часть работы изложена на 132 страницах, содержит 38 рисунков и 7 таблиц.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность темы диссертационного исследования, формулируются цель и задачи, определяются новизна и практическая значимость.
В первой главе диссертации проанализированы существующие методы и средства моделирования и оптимизации параметров сложных многоэтапных процессов, определена возможность применения нейронных сетей.
Эффективным способом идентификации являются нейронные сети, позволяющие воспроизводить сложные зависимости. Для решения задачи моделирования и оптимизации используют многослойные нейронные сети.
В. данных для обучения нейронной сети могут находиться данные с большой погрешностью, что может привести к противоречивости экспериментальных значений — близкие векторы независимых признаков и разные векторы зависимых признаков. Известен метод предобработки данных, основанный на понятии профиля компактности и комбинаторных формулах для эффективного вычисления функционала скользящего контроля (профиль компактности - доля объектов выборки, для которых _/'-й сосед лежит в другом классе). Метод применяется для задач классификации, где выходной величиной является принадлежность к какому-либо классу объектов. По методу происходит разделение обучающих объектов на 3 категории: шумовые выбросы (противоречивые примеры), неинформативные периферийные объекты (на границе классов - нетипичные примеры) и опорные объекты.
Пусть имеется множество объектов Xи множество имен классов Y. Задана обучающая выборка пар «объект-ответ» Xя = {(х,,_>■,),..., (хп,ут)} в XxY.
Для произвольного объекта и расположим объекты обучающей выборки xt в порядке возрастания расстояний до и:
p(u,xJ<p(u,x2J<...<p(u,xmil), (1)
где хы - элемент обучающей выборки, который является /-м соседом объекта и. Аналогичное обозначение для ответа на г-м соседе —>>,■„.
Профиль компактности R(j) - доля объектов выборки, для которых j-й сосед лежит в другом классе:
1 Л ¡1, если, у, Ф v,r;
Яи,Х-) = -^с9,где с,.= ' /JV (2)
/Им [0 :ecnuyt=yJXi.
Формула вычисления функционала полного скользящего контроля (complete cross-validation, CCV) через профиль компактности:
т С"'1
ccv(xL) = )W) где Г(Л = (3)
Здесь L — объем выборки; т — объем обучающей подвыборки; к — объем контрольной подвыборки; L = т + к (в работе первоначально берется т = к). Комбинаторный множитель F(j) быстро убывает с ростом j.
Метод опирается на гипотезу компактности: схожие объекты гораздо чаще лежат в одном классе, чем в разных. В этом случае граница между классами имеет достаточно простую форму, а ютссы образуют компактно локализованные области в пространстве объектов.
Данный метод, начиная с полной выборки, последовательно исключает объекты. На каждом шаге выбирается тот объект, исключение которого мини-
мизирует функционал. Сначала исключаются шумовые выбросы (противоречивые примеры), затем исключаются неинформативные периферийные объекты (на границе классов - нетипичные примеры). Процесс останавливается, когда остаются объекты, исключение которых заметно увеличивает функционал, тогда в массиве данных остаются "столпы", или опорные объекты.
Для исключения зашумленных данных, которые могут исказить параметры модели, требуется разработать метод подготовки данных нейросетевой модели, базирующийся на понятии профиля компактности и позволяющий исключить шумовые и нетипичные объекты из обучающей выборки.
Для решения обратной задачи (задачи оптимизации) используют инверсию нейронной сети, которая состоит в нахождении входного вектора х для получения желаемого выхода у при установленном наборе синаптических весов IV. Работа обученной нейронной сети может быть описана выражением
? = /(*,■№), (4)
где у — выход нейронной сети, соответствующий входному вектору X ; V/ -вектор весовых коэффициентов; /(х,и>) - функция преобразования входного вектора при прохождении его через сеть от входа до выхода. Критерий оптимальности инверсии тот же, что и при обучении сети - минимум суммы квадратов отклонений выходов сети. Тогда инверсию нейронной сети можно записать как задачу безусловной оптимизации:
£[/;(**>)-.у,0]2 ->тт, (5)
/
где х' - неизвестный вектор значений входного пространства; у ° - г'-й элемент заданного вектора значений выходного пространства; г - номер выходного параметра.
Инверсия нейронной сети состоит из двух этапов:
1) обучение нейронной сети для получения весовых коэффициентов й;
2) непосредственно инверсия нейронной сети.
Для второго этапа веса нейронной сети принимаются фиксированными, и теперь функция /(?, н1) будет зависимостью только от входного вектора х. Как проиллюстрировано на рис. 1, для двух входов х\ и х2 и одного выхода у многочисленные различные входы могут генерировать тот же самый выход. Каждый контур графика соответствует/(5) = с для различных постоянных с. Инверсия для данного с состоит в нахождении одного или более элементов входного множества Л на контуре (или множестве непересекающихся контуров), где
Л={х:Дх) = с}. (6)
Среди методов инверсии нейронных сетей выделяются методы поиска единственного элемента и методы определения набора точек решения.
Последние (эволюционный метод, метод оптимизации кучи частиц) помимо оптимизации до приемлемого уровня расхождения, позволяют распределить точки равномерно по всей поверхности, однако они менее чувствительны к локальному минимуму и начальным условиям, но требуют больше вычисле-
ний и, как следствие, более медленные, чем методы поиска одного элемента, в которых можно использовать эффективные градиентные методы оптимизации
Градиентные методы справляются с задачей оптимизации гораздо быстрее, но решение зависит от начальной точки. При использовании градиентных методов над множеством точек не гарантируется получение равномерного распределения, что является необходимым условием точного приближения.
Для уменьшения времени получения решения с требуемой точностью необходимо разработать метод решения задачи оптимизации с помощью инверсии нейронной сети, использующий быстросходящиеся градиентные алгоритмы при равномерном распределении точек на поверхности решения.
Для проведения исследования на конкретном объекте необходимо разработать структуру функциональных связей технологических параметров и показателей качества многоэтапного технологического процесса и комплекс программ, реализующий разработанные модели и алгоритмы. В качестве примера сложного многоэтапного процесса рассматривается производство холоднокатаного проката для автомобильной промышленности.
Основные задачи исследования представлены на рис. 2 (серым фоном помечены задачи, отличающиеся научной новизной).
Таким образом, разработка эффективных методов и средств моделирования и оптимизации сложных многоэтапных процессов на основе нейронных сетей является актуальной задачей.
Во второй главе производятся разработка метода подготовки данных, основанного на понятии профиля компактности и комбинаторных формулах, для использования в предобработке данных моделирования с непрерывной за-шумленной выходной величиной и разработка метода решения задачи оптимизации параметров сложных многоэтапных процессов на основе быстросходя-щихся алгоритмов и с равномерным распределением точек решения.
Известный метод подготовки данных ориентирован на применение в задачах классификации, когда выходной величиной является принЕцщежность к какому-либо классу. Для использования данного метода с непрерывными за-шумленными данными в нейросетевом моделировании многоэтапных процессов предлагается осуществить разделение значений выходов сети на группы на основе кластерного анализа, тем самым сведя задачу предобработки данных при моделировании к задаче предобработки данных при классификации.
функций нескольких переменных.
с множеством решений
Моделирование
;Адаптация метода | ^предобработки данных Построение модели Анализ результатов
Оптимизация
разработка метода Ц оптйй'йза^Ш11 Поиск оптимальных решений Анализ результатов
Программный комплекс Г Реализация разработанных методов;:и~моделей в виде программного^ комплекса ■ _____
Рис. 2. Место собственных результатов исследования в общей схеме функционирования модели Процедура кластерного анализа выполняется над строками анализируемого массива данных по выходным параметрам. Каждая строка получает номер группы ее выходных значений, который представляет собой класс множества Г в методе предобработки данных. В качестве характеристики близости выходных значений взято евклидово расстояние между точками. Евклидово расстояние является самой популярной метрикой в кластерном анализе, оно отвечает интуитивным представлениям о близости. В работе число кластеров берется равным л/й, где п - объем выборки. Последовательность предобработки данных модифицированным методом представлена на рис. 3.
Рис. 3. Этапы предобработки данных модифицированным методом
Для выполнения необходимого условия получения точного приближения градиентным методом предложен алгоритм оптимизации, позволяющий получить равномерную аппроксимацию поверхности решения. Предлагается находить пары смежных точек решения, наиболее удаленные друг от друга, и между найденными точками генерировать новые, которые следует уточнить эффективными градиентными методами оптимизации функции нескольких переменных.
Важную роль при этом играет корректность определения смежных точек. Предлагается следующий алгоритм оценки смежности точек. Для точки А смежной является точка С, если не существует такой точки В, что АВ < АС и АС > к-ВС (рис. 4), где к - коэффициент, определяющий минимально допустимый угол между АВ и АС, при котором точка С может считаться смежной (при к = 1 угол равен 60°).
а
б
Рис. 4. Смежность точек А и С: а - несмежные; б - смежные
Чтобы считаться смежной, следующая рассматриваемая точка С должна быть ближе к базовой точке А, относительно которой выполняется проверка на смежность, чем к какой-либо точке, уже включенной в число смежных (при к = 1). Точки рассматриваются в порядке удаления относительно базовой точки.
Следуя этому правилу, вторая смежная точка для точки А (первая точка -В) может находиться только в области 5, включая дугу, и на прямой МЫ вне окружности при к = 1 (рис. 5).
Если смежная точка будет расположена на прямой МИ, то она будет равноудалена от точек А и В. По каждой точке определяются наиболее близкие точки в порядке возрастания расстояния. Далее процедура поиска смежных точек выполняется отдельно для каждой точки.
Первой смежной точкой будет самая близкая точка. Вторая наиболее близкая точка считается смежной, если она блшке к базовой точке, чем к смежной точке, включенной первой. Третья ближайшая точка будет рассматриваться относительно уже найденных на тот момент смежных точек. Таким образом, следующая анализируемая точка является смежной, если она ближе к базовой точке, чем к любой из смежных точек, рассмотренных до текущей.
Блок-схема предложенного алгоритма поиска смежных точек - на рис. 6.
После поиска всех смежных точек необходимо выполнить равномерную аппроксимацию поверхности решения. Для этого определяются расстояния между всеми смежными точками, и первая дополнительная точка генерируется между наиболее удаленными смежными точками. Процедура повторяется до тех пор, пока СКО расстояний между точками меньше некоторого значения, которое предлагается задавать в интервале от 0,001 до 0,01.
Рис. 5. Область расположения смежной точки
Рис. 6. Блок-схема алгоритма поиска смежных точек Последовательность действий для получения равномерной аппроксимации поверхности решения можно сформулировать следующим образом: Шаг 1. Поиск смежных точек. Шаг 2. Выбор наиболее удаленных смежных точек. Шаг 3. Добавление новой точки между наиболее удаленными смежными.
Шаг 4. Оптимизация параметров добавленной точки до минимального отклонения по значениям выходных параметров.
Шаг 5. Проверка условия останова: СКО расстояний между смежными точками меньше заданного, иначе Шаг 1.
Пример инверсии нейронной сети, моделирующей функцию параболоида г = х2+у2 на отрезке [-10;10] по обеим независимым переменным во всех целочисленных точках, представлен на рис. 7.
41
2 1
> О -1 -2
• с У С О ГО —1 СЭ —- С.) С ,_> » * «* • 1- * О • » !
® / » ! ♦ 1
1 ♦ :/ • 1 * 1
У « »1 к
( ¥ • 4 ♦ *
1 • 1 « •;
• 1 * • '
1 1 1 1 -т- -1-ГТ- -ГТЧ- 4 1-1-Г1 Ч-Р1- • * ;
-3 -2 -1
2 3
Рис. 7. Результаты инверсии нейронной сети с равномерным распределением
Для инверсии выбрано значение 16, т.е. необходимо определить множество пар значений, которые при подстановке в функцию дают значение 16. Это множество будет представлять собой окружность с центром в начале координат и радиусом 4. На рис. 7, а показано введение первых дополнительных точек, а на рис. 1,6 - окончательная аппроксимация, когда СКО меньше 0,001.
Таким образом, разработан алгоритм предобработки зашумленных данных, основанный на профиле компактности и комбинаторных формулах, обеспечивающий исключение шумовых и нетипичных данных при нейросетевом моделировании сложных многоэтапных процессов. Предложен численный алгоритм оптимизации, обеспечивающий равномерную аппроксимацию поверхности решения и использующий предложенный метод поиска смежных точек.
В третьей главе представлена программная реализация разработанного математического обеспечения моделирования и оптимизации параметров сложных многоэтапных процессов в виде программного комплекса.
Реализованы базовые модули моделирования и настройки параметров нейронной сети. Разработанные модули осуществляют обучение двухслойной нейронной сети на основе градиентного алгоритма оптимизации функции нескольких переменных ВРОЭ и алгоритма обратного распространения ошибки (одномерная оптимизация выполняется методом Брента). Благодаря модульно-
му принципу построения системы, использованию объектно-ориентированного подхода к программированию, разделению модулей интерфейса пользователя системы и реализации алгоритмов, процессов функционирования сети и оптимизации функции, разработанные библиотеки могут легко расширяться и переноситься в другие системы. Разработана структура хранения данных в виде специальных реляционных отношений (таблиц) базы данных. Структура программного обеспечения и направления информационных потоков при взаимодействии модулей представлены на рис. 8, а для обеспечения автоматизированной системы данными разработана база данных, концептуальная модель которой представлена на рис. 9.
ПОДСИСТЕМА ПОДСИСТЕМА ВЫБОРА
ОБРАБОТКИ ДАННЫХ ДАННЫХ
Рис. 8. Общая структура программного комплекса Предложенные алгоритмы реализованы в следующих модулях системы:
- алгоритм подготовки - в модуле предобработки данных;
- алгоритм оптимизации - в модуле оптимизации (инверсии сети);
- алгоритм поиска смежных точек - в модуле оптимизации (инверсии сети). Основные классы:
- СС^ег - класс, реализующий работу с кластером;
- СМиШОрйгшгайоп - класс, реализующий оптимизацию функции нескольких переменных;
- СРгерагеБа1а - класс, реализующий предобработку данных;
- СРоргйайоп - класс, реализующий работ}' с множеством решений задачи оптимизации;
- СБресшеп - класс, реализующий работу с решением (точкой) задачи оптимизации.
Диаграмма классов на языке ЦМЬ представлена на рис. 10.
: Решение оптимизации | ид решения |дата речения I комментарии
W ф
Ї-
______J_
-ь
3=
Значение параметра
Набор весов
ид. набора весов дата расчета комментарии
Сеть
ид. сети дата создания комментарии
Единица измерения
ид. ед. ИЗМЄР. обозначение
X
у
'X
I
: Параметр передела в сети
Вес
номер 2-х сл. перц. номер слоя номер нейрона номер входя значение
| номер передела j номер параметра I признак вх. параметра
"Ж
Параметр
ид. параметра название аббревиатура приэн. ненул. парам.
Передел
ид. передела
название
аббревиатура
„X
Единица металла
Sä
£
Рис. 9. Концептуальная модель данных
Таким образом, разработана структура специального программного обеспечения моделирования и оптимизации на основе оригинальных методов, позволяющих проводить подготовку данных, построение нейросетевой модели и инверсию нейронной сети, в состав которой включены модули, реализующие разработанные методы.
В четвертой главе проведена проверка разработанных моделей и алгоритмов на массиве данных производства горячего и холодного проката ОАО «Новолипецкий металлургический комбинат».
Детали кузова автомобиля получают штамповкой листового проката. Чтобы на листе при этом не появлялись разрывы, металл должен быть пластичным. Способность металла к вытяжке определяется такими показателями качества листа, как относительное удлинение, твердость, предел текучести, отношение предела текучести к пределу прочности. Данные показатели качества изменяются после отдельных этапов горячекатаного и холоднокатаного производства, однако измеряются обычно только для готовой продукции.
В работе выделены три основных этапа (рис. 11): горячая прокатка (на схеме - «стан 2000»), холодная непрерывная прокатка (на схеме - «стан 2030»), непрерывный отжиг и дрессировка (на схеме - «AHO»).
Рис. 11. Схема моделируемого производства Определены технологические факторы отдельных этапов, влияющие на
показатели качества листа:
1)при горячей прокатке: химический состав (содержание С, Мп, Б!, Р, 8, Сг,
Си, А1, Аэ, 14), температура конца прокатки, температура смотки, степень
обжатия в клети № 12, скорость прокатки в клети № 12, заданная толщина полосы за клетью №5, толщина полосы за клетями № 6 - № 12;
2) при холодной прокатке: суммарная степень обжатия, скорость прокатки клети № 5, толщина подката, разнотолщинность подката, химический состав, толщина полосы за клетями № 1 - № 5;
3)при непрерывном отжиге и дрессировке: температура нагрева, температура выдержки, температура охлаждения, температура повторного нагрева, температура перестаривания, химический состав, степень обжатия.
В качестве выходных переменных нейросетевой модели первых этапов обработки используются важные параметры, характеризующие состояние технологического процесса на данном этапе и позволяющие оценить точность модели, а также характеризующие некоторые промежуточные показатели качества. Выходными параметрами последнего этапа являются показатели качества
готовой продукции - параметры механических свойств металла, определяемые по испытаниям. Перечень выходных параметров модели:
1) горячая прокатка: усилия прокатки чистовой группы клетей (клети № б -№ 12), среднеквадратичное отклонение толщины за клетью № 12, оценка неплоскостности полосы за клетью № 12, разнотолщинность;
2) холодная прокатка: усилия прокатки клети № 1 - № 5, оценка планшет-ности полосы за клетью № 5;
3) непрерывный отжиг и дрессировка: предел текучести, предел прочности, относительное удлинение, глубина сферической лунки по Эриксену, твердость.
Моделирование каждого этапа обработки выполняется на основе двухслойной нейронной сети, некоторые входы первого слоя и выходы второго слоя нейросетевой модели первого этапа подаются на входы сети, моделирующей следующий этап обработки. В частности, параметры, характеризующие химический состав металла, передаются на входы всех этапов. Структур£1 нейронной сети определяется взаимосвязью технологических параметров и показателей качества многоэтапного процесса производства холоднокатаного проката.
Выполним предобработку зашумленных данных предложенной модификацией метода подготовки данных, основанного на понятии профиля компактности и комбинаторных формулах вычисления функционала скользящего контроля. С предобработкой сеть моделирует лучше (рис. 12): математическое ожидание отклонения и СКО отклонения уменьшаются, вследствие этого увеличивается процент попадания в 5% область отклонения (95,56% и 98,52%).
Результат обучения Регольтн обучения
факт факт
а б
Рис. 12. Результат обучения нейронной сети: а - без предобработки данных (математическое ожидание отклонения 1,881%); б - с предобработкой данных (математическое ожидание отклонения 1,228%) Сравнение результатов прогнозирования с помощью нейросетевых моделей и регрессионного анализа в математическом пакете ЗТайзйса 6.0 показывает, что в большинстве случаев нейронные сети точнее. По относительному удлинению точность одинаковая, только по одному параметру (глубина сфериче-
ской лунки по Эриксену) регрессионный анализ показал более точные результаты, при этом и по нейронной сети точность достаточно высокая.
Результаты поиска оптимальной технологии производства проката толщиной 1,5 мм высшей категории вытяжки ВОСВ из стали марки 08Ю представлены в таблице. В первом столбце приведены требуемые значения показателей качества по ГОСТ 9045-93 и обеспечивающие их параметры технологических режимов в соответствии с технологическими инструкциями, во втором столбце - численные значения требуемых параметров качества, а в третьем и четвертом столбцах - рассчитанные по модели параметры режимов.
Таблица. Решение задачи оптимизации на основе инверсии нейронной сети
Параметр 1 2 3 4
Химсостав. С <0,07 0,036 0,04
Химсостав. Мп < 0,35 0,21 0,2
Химсостав. S < 0,025 0,012 0,015
Химсостав. AI 0,02-0,07 0,031 0,04
мЭ е- Химсостав. N 0,002-0,007 0,004 0,004
Стан 2000. Температура конца прокатки 860-900 866 861
§ сх Стан 2000. Температура смотки 640-700 669 680
S Стан 2000. Степень обжатия на клети 12 <0,17 0,17 0,16
Стан 2000. Скорость прокатки клети 12 >500 644 522
§ X в Стан 2030. Скорость прокатки клети 5 >10 10,87 10,10
Стан 2030. Суммарная степень обжатия 0,60-0,70 0,68 0,62
AHO. Температура нагрева 780-800 787,3 788,6
AHO. Температура выдержки 750-800 794,9 795,1
AHO. Температура повторного нагрева 400-450 404,8 409,3
AHO. Температура охлаждения 300-340 301 303,4
о з Предел текучести <185 185 185 185
£ fr Предел прочности 250-350 305 305 305
g s й 2. И с Относительное удлинение >40 43 43 43
Твердость по Роквеллу <51 30' ' 30 30
Глубина сферической лунки по Эриксену > 12,0 12,6 12,6 12,6
Сравнение используемых технологических режимов и рассчитанных по модели показывает их высокую степень соответствия. Это позволяет проверить существующие режимы и разработать режимы новых видов продукции с заданными показателями качества без длительного периода проб и ошибок.
В заключении приведены основные результаты диссертационной работы, указаны направления для применения разработанных средств.
В приложении приведены акты внедрения результатов исследования.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ 1. Разработан метод подготовки зашумленных данных, представляющий собой модификацию известного метода, основанного на понятии профиля компактности и комбинаторных формулах вычисления функционала скользящего. Метод отличается возможностью предобработки данных моделирования с непрерывной выходной величиной. Проведенные эксперименты показывают эффективность предложенного метода.
2. Для решения задачи оптимизации параметров многоэтапных процессов на основе инверсии нейронной сети разработан численный метод. Метод сочетает в себе высокую скорость и точность поиска решений и обеспечивает равномерную аппроксимацию поверхности решения за счет уточнения новых точек, добавленных в наименее представленные области решения.
3. Создан алгоритм поиска смежных точек, на основании которого происходит добавление новых точек решения задачи оптимизации. Добавление новых точек выполняется между наиболее удаленными смежными.
4. Реализован программный комплекс нейросетевого моделирования и оптимизации многоэтапных процессов. Программный комплекс представляет собой инструмент для анализа многоэтапных процессов. Разработанные модули мо1уг расширяться и переноситься в другие системы.
5. Разработана структура функциональных связей технологических параметров и показателей качества в многоэтапной технологии производства холоднокатаного проката для автомобильной промышленности.
6. Выполнены нейросетевое моделирование многоэтапной технологии и поиск оптимальной технологии при заданных параметрах качества на технологических данных производства горячего и холодного проката ОАО «Новолипецкий металлургический комбинат». Полученные результаты характеризуются высокой степенью точности и позволяют сделать вывод об адекватности модели, работоспособности программного комплекса и целесообразности их применения для анализа и проектирования технологии.
7. Результаты диссертационной работы прошли апробацию и будут применяться в отделе систем учета производства и качества продукции Дирекции по информационным технологиям ОАО «Новолипецкий металлургический комбинат» и используются в учебном процессе Липецкого филиала МИКТ при подготовке инженеров специальности 230101 «Вычислительные машины, комплексы, системы и сети».
Основные результаты диссертации опубликованы в следующих работах Публикации в изданиях, рекомендованных ВАК РФ
1. Качановский, Ю.П. Предобработка данных для обучения нейронной сети / Ю.П. Качановский, Е.А. Короткое // Фундаментальные исследования. — 2011. -№ 12.-С. 117-120.
2. Качановский, Ю.П. Об инверсии нейронной сети / Ю.П. Качановский, Е.А. Короткое, С.Г. Шалахов // Вести высших учебных заведений Черноземья. -2011,-№2.-С. 85-90.
3. Качановский, Ю.П. Структура информационно-программного обеспечения системы моделирования и управления с помощью нейронной сети / Ю.П. Качановский, Е.А. Короткое // Информационные системы и технологии. - 2011. -№4-С. 109-115.
Статьи и материалы конференций
4. Короткое, Е.А. Анализ возможности применения нейросетевого моделирования в задачах управления качеством металлургического производства / Е.А. Короткое // V Всероссийская школа-семинар молодых ученых «Управление большими системами»: сб. тр. - Т. 1. - Липецк: ЛГТУ, 2008. - С. 313-320.
5. Качановский, Ю.П. Выбор архитектуры нейронной сети для моделирования и управления технологическими процессами металлургического производства / Ю.П. Качановский, Е.А. Коротков // Информационно-вычислительные технологии и их приложения: сб. ст. Х-й Международной научно-технической конференции. - Пенза: РИО ПГСХА, 2009. - С. 116-119.
6. Качановский, Ю.П. Основные принципы построения нейросетевой модели формирования свойств автолистовой стали / Ю.П. Качановский, Е.А. Коротков // Вести высших учебных заведений Черноземья. - 2009. - № 4. - С. 70-74.
7. Качановский, Ю.П. Параметры нейронной сети для моделирования свойств автолистовой стали / Ю.П. Качановский, Е.А. Коротков // Информационные технологии и математическое моделирование: мат. УШ-й Всероссийской научно-практической конференции с международным участием. - Ч. 2. - Томск: Изд-во Том. ун-та, 2009. - С. 103-110.
8. Качановский, Ю.П. Разработка модели данных в задаче моделирования и управления технологическими процессами металлургического производства / Ю.П. Качановский, Е.А. Коротков // Информационные технологии в профессиональной деятельности и научной работе: сб. мат. Всероссийской научно-практической конференции с международным участием. - Йошкар-Ола: Мар-ГТУ, 2009.-С. 114-118.
9. Качановский, Ю.П. Влияние вида функции активации и отрезка генерации начальных значений весов на качество обучения нейронной сети / Ю.П. Качановский, Е.А. Коротков // Искусственный интеллект. Интеллектуальные системы ИИ-2010: мат. Международной научно-технической конференции. - Т. 2. -Донецк: Наука \ осв1та, 2010. - С. 333-336.
10. Качановский, Ю.П. Объектно-ориентированное программирование в реализации нейронных сетей / Ю.П. Качановский, Е.А. Коротков // Информатика: проблемы, методология, технологии: мат. Х-й Международной научно-методической конференции. - Т. 1. - Воронеж: Издательско-полиграфический центр ВГУ, 2010. - С. 229-233.
11. Качановский, Ю.П. Уменьшение размерности задачи обучения нейронной сети [Эл. ресурс] / Ю.П. Качановский, Е.А. Коротков, С.Г. Шалахов // Научный электронный архив академии естествознания. - Режим доступа: http://econf.rae.ru/article/5859. - 25.02.2010.
Регистрация программы
12. Качановский, Ю.П. Система моделирования и управления технологическими процессами металлургического производства с помощью систем искусственного интеллекта: свидетельство о регистрации программы для ЭВМ / Ю.П. Качановский, Е.А. Коротков. - Зарег. в Отраслевом фонде алгоритмов и программ Федерального агентства по образованию 10.04.10, № 50201000682.
13. Качановский, Ю.П. Система моделирования и управления технологическими процессами металлургического производства на основе нейронных сетей: свидетельство о государственной регистрации программы для ЭВМ / Ю.П. Качановский, Е.А. Коротков. — Зарег. в Федеральной службе по интеллектуальной собственности (Роспатент) 07.03.12, № 2012612516.
17
Нсо
г
Подписано в печать 22.03.2013. Формат 60x84 1/16. Бумага офсетная. Усл. печ. л. 1,0. Тираж 100 экз. Заказ № Издательство Липецкого государственного технического университета. Полиграфическое подразделение Издательства ЛГТУ. 398600 Липецк, ул. Московская, 30.
Текст работы Коротков, Евгений Алексеевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ
НЕГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «МЕЖДУНАРОДНЫЙ ИНСТИТУТ КОМПЬЮТЕРНЫХ ТЕХНОЛОГИЙ»
На правах рукописи 04201357548 ¿.^Ьо^ьоп^Соё
Короткое Евгений Алексеевич
НЕЙРОСЕТЕВОЕ МОДЕЛИРОВАНИЕ И ОПТИМИЗАЦИЯ МНОГОЭТАПНЫХ ПРОЦЕССОВ В УСЛОВИЯХ ЗАШУМЛЕННОСТИ ИСХОДНЫХ ДАННЫХ
Специальность 05.13 Л 8 «Математическое моделирование, численные методы и комплексы программ»
ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук
Научный руководитель кандидат технических наук, доцент Качановский Юрий Петрович
Воронеж - 2013
ОГЛАВЛЕНИЕ
ВВЕДЕНИЕ..............................................................................................................4
1. ОБЗОР И АНАЛИЗ СРЕДСТВ И МЕТОДОВ МОДЕЛИРОВАНИЯ И ОПТИМИЗАЦИИ МНОГОЭТАПНЫХ ПРОЦЕССОВ....................................10
1.1. Ограничения использования регрессионного анализа.........................10
1.2. Прикладные возможности нейронных сетей.........................................12
1.3. Элементы теории нейронных сетей........................................................14
1.4. Архитектура нейронной сети..................................................................16
1.4.1. Классификация нейронных сетей и их применение...........................................16
1.4.2. Многослойные нейронные сети...........................................................................19
1.4.3. Радиальные нейронные сети.................................................................................21
1.5. Теоретические основы аппроксимационных свойств многослойных нейронных сетей..................................................................24
1.6. Понятие профиля компактности и предобработка данных в задаче классификации...............................................................................................25
1.7. Масштабирование данных.......................................................................29
1.8. Определение необходимого числа нейронов в сети.............................29
1.9. Обучение нейронной сети........................................................................32
1.9.1. Алгоритмы обучения нейронных сетей...............................................................32
1.9.2. Понятие о задаче оптимизации.............................................................................35
1.9.3. Обучение нейронной сети как задача оптимизации...........................................37
1.9.4. Алгоритмы оптимизации функции ошибки выхода сети..................................38
1.10. Критерий окончания обучения нейронной сети....................................45
1.11. Показатели значимости входных параметров.......................................45
1.12. Инверсия нейронной сети........................................................................47
1.13. Выводы.......................................................................................................49
2. РАЗРАБОТКА МАТЕМАТИЧЕСКОЙ МОДЕЛИ......................................51
2.1. Применение понятия профиля компактности для предобработки
данных в задаче моделирования..................................................................51
2.2. Алгоритм получения равномерного распределения точек на поверхности решения задачи оптимизации с помощью инверсии нейронной сети...............................................................................................54
2.3. Алгоритм поиска смежных точек в пространстве.................................58
2.4. Начальные значения весовых коэффициентов......................................61
2.5. Функция активации нейронов.................................................................64
2.6. Выводы.......................................................................................................67
3. РАЗРАБОТКА АВТОМАТИЗИРОВАННОЙ СИСТЕМЫ.........................68
3.1. Программное обеспечение.......................................................................69
3.2. Информационное обеспечение................................................................75
3.3. Выводы.......................................................................................................84
4. АНАЛИЗ РЕЗУЛЬТАТОВ МОДЕЛИРОВАНИЯ И ОПТИМИЗАЦИИ НА ОСНОВЕ РАЗРАБОТАННОЙ МОДЕЛИ...........................................................85
4.1. Применение разработанного обеспечения.............................................85
4.2. Параметры модели....................................................................................86
4.2.1. Горячая прокатка...................................................................................................87
4.2.2. Холодная прокатка.................................................................................................89
4.2.3. Непрерывный отжиг..............................................................................................91
4.2.4. Дрессировка............................................................................................................92
4.3. Описание производства проката в ОАО «Новолипецкий металлургический комбинат»......................................................................92
4.4. Нейросетевая модель................................................................................96
4.5. Апробация системы на производственных данных............................102
4.6. Выводы.....................................................................................................119
ЗАКЛЮЧЕНИЕ...................................................................................................121
ЛИТЕРАТУРА.....................................................................................................123
ПРИЛОЖЕНИЯ...................................................................................................133
ВВЕДЕНИЕ
Актуальность работы. Сложные многоэтапные процессы характеризуются наличием большого количества факторов, влияющих как на отдельные стадии этих процессов, так и на протекание нескольких процессов одновременно.
Большинство факторов оказывают существенное влияние на выходные параметры процессов, причем закономерности этого влияния имеют сложный характер. Кроме того, значения некоторых факторов можно определить только приближенно (например, они могут иметь усредненный характер, как химический состав сырья, или измерены с некоторой погрешностью [49], как геометрические параметры), а значения других вообще могут быть неизвестны (например, коэффициенты трения, параметры упрочнения [24]).
В качестве примера многоэтапных процессов можно привести металлургическое, целлюлозно-бумажное, нефтехимическое производство. В частности в металлургическом производстве холоднокатаного листа для автомобильной промышленности можно выделить следующие этапы: выплавка чугуна (более 50 параметров), конвертерное производство стали (более 100 параметров), горячая прокатка (более 100 параметров), травление (около 10 параметров), холодная прокатка (более 30 параметров), отжиг (более 20 параметров) и дрессировка (около 10 параметров).
Зависимости между факторами и выходными параметрами (математические модели) могут быть построены аналитически на основании анализа процессов, однако при этом полученные модели имеют нелинейный вид, очень сложны и их практическое использование весьма затруднительно [16].
Другой подход к моделированию предполагает использование методов идентификации, основанных на наблюдении за реальным процессом и измерении соответствующих значений факторов и выходных параметров. Полученные в результате идентификации математические модели обычно имеют
более простой вид, однако использование таких моделей для оптимизации процессов не обеспечивает требуемого уровня качества.
Таким образом, разработка эффективных методов идентификации сложных многоэтапных процессов в условиях зашумленности исходных данных является актуальной задачей.
Работа выполнена в рамках целевой программы технологических мероприятий по повышению качества продукции и эффективности производства ОАО «Новолипецкий металлургический комбинат» на 2010-2011 годы.
Целью работы являются создание и исследование эффективных методов и средств для решения задачи моделирования и оптимизации сложных многоэтапных процессов на основе нейронных сетей в условиях зашумленности исходных данных.
Основные задачи. В соответствии с поставленной целью в работе решались следующие задачи:
- исследовать возможность применения нейронных сетей в задачах моделирования и оптимизации сложных многоэтапных процессов;
- разработать на основе нейронных сетей модель для построения зависимостей между параметрами процессов;
- создать метод оптимизации сложных многоэтапных процессов, использующий инверсию нейронной сети;
- разработать комплекс программ, реализующих построенную математическую модель и алгоритм оптимизации;
- экспериментально проверить разработанные средства на реальных производственных данных и провести сравнительный анализ с другими моделями.
Методы исследования. В работе использованы методы теории искусственных нейронных сетей, оптимизации, математической статистики, теории вероятности, векторной алгебры, аналитической геометрии, кластерного анализа, объектно-ориентированного программирования, проектирования реляционных баз данных. Программная реализация выполнена на языке С++ в
среде программирования Borland С++ Builder 6.0, хранение данных организовано на базе СУБД FireBird 2.1.
Научная новизна. В диссертационной исследовании были получены результаты, которые характеризуются научной новизной:
- численный метод решения задачи оптимизации параметров многоэтапных процессов на основе инверсии нейронной сети, обеспечивающий равномерную аппроксимацию поверхности решения и отличающийся использованием градиентного метода уточнения дополнительных точек решения;
- алгоритм поиска смежных точек, обеспечивающий равномерное покрытие поверхности решения, отличающийся заполнением наименее представленных областей поверхности решения;
- метод подготовки зашумленных данных, основанный на понятии профиля компактности и комбинаторном анализе, отличающийся проведением процедуры кластерного анализа над выходными параметрами и обеспечивающий подготовку данных с непрерывной выходной величиной;
- структура программного комплекса моделирования и оптимизации, позволяющего проводить построение нейросетевой модели и инверсию нейронной сети, отличающегося реализацией разработанных методов оптимизации и предобработки данных.
Практическая значимость. Предложенные методы моделирования и алгоритм оптимизации сложных многоэтапных процессов могут быть использованы для получения качественной продукции при реализации сложных технологических режимов производства, а также позволяют разрабатывать технологические режимы новых видов продукции с заданными показателями качества.
Реализация и внедрение результатов работы. Теоретические и практические результаты работы прошли апробацию в ОАО «Новолипецкий металлургический комбинат» (Дирекция по информационным технологиям).
Разработанное программное обеспечение планируется использовать при построении информационных систем производственного уровня для данного предприятия.
Результаты диссертационного исследования применяются в учебном процессе Липецкого филиала Международного института компьютерных технологий при подготовке инженеров по специальности «Вычислительные машины, комплексы, системы и сети».
Апробация работы. Основные положения и результаты работы докладывались и обсуждались на следующих конференция, семинарах: V Всероссийская ш кола-семинар мол одых ученых «Управление большими системами» (Липецк, 2008), X Международная научно-техническая конференция «Информационно-вычислительные технологии и их приложения» (Пенза, 2009), IX Всероссийская научно-практическая конференция «Информационные технологии» (Йошкар-Ола, 2009), VIII Всероссийская научно-практическая конференция с международным участием «Информационные технологии и математическое моделирование» (Анжеро-Судженск, 2009), X Международная научно-методическая конференция «Информатика: проблемы, методология, технологии» (Воронеж, 2010), научно-образовательный семинар «Математическое моделирование, информационные технологии и проблемы управления» (Липецк, 2010, 2011, 2012), Международная научно-техническая конференция «Искусственный интеллект. Интеллектуальные системы ИИ-2010» (Донецк, 2010), Межвузовская научно-практическая конференция «Актуальные проблемы современного научного знания» (г. Липецк, 2011), Областной профильный семинар «Школа молодых ученых по проблемам технических наук» (Липецк, 2012).
Программная реализация подтверждена свидетельством об отраслевой регистрации разработок [45] и свидетельством о государственной регистрации программ для ЭВМ, выданным Роспатентом [46].
Публикации. По материалам диссертационного исследования опубликовано 13 научных работ, среди которых 3 - в изданиях, рекомендованных
ВАК РФ. В опубликованных в соавторстве работах лично соискателем выполнено: в [52] - проведен анализ возможности применения нейронных сетей в управления качеством продукции металлургического производства; [38] -проведен анализ имеющихся архитектур нейронных сетей для решения задачи моделирования и оптимизации; [43] - предложено применять для подготовки данных в моделировании метод, основанный на профиле компактности и комбинаторных формулах эффективного вычисления функционала скользящего контроля; [39] - разработан алгоритм поиска смежных точек в пространстве, позволяющий находить наименее представленные области поверхности в пространстве, и предложен метод получения равномерного распределения точек на поверхности решения инверсии нейронной сети; [37] -оценено влияние вида функции активации и отрезка генерации начальных значений весов на качество обучения нейронной сети; [48] - проведено сравнение обучения нескольких связанных нейронных сетей и одной укрупненной сети; [41, 42] - разработана структура функциональных связей технологических параметров и показателей качества в многоэтапной технологии производства холоднокатаного проката; [47] - предложена структура взаимодействия программных модулей; [40] - построена классовая диаграмма на языке ЦМЬ разработанного программного обеспечения реализации многослойных нейронных сетей; [44] - разработана модель данных для задачи моделирования и оптимизации сложных многоэтапных процессов.
Структура и объем работы. Диссертация состоит из введения, четырех глав, заключения, библиографического списка литературы из 96 наименований, 3 приложений и содержит 132 страницы, 7 таблиц и 38 рисунков.
Во введении обосновывается актуальность темы диссертационной работы, формулируются задачи исследования, цель, практическая значимость и научная новизна полученных результатов, приводится краткое содержание диссертации по главам.
В первой главе проанализированы существующие методы и средства моделирования и оптимизации параметров сложных многоэтапных процессов, определена возможность применения нейронных сетей.
Во второй главе разработан метод предобработки зашумленных данных, основанный на профиле компактности и комбинаторных формулах, обеспечивающий исключение шумовых и нетипичных данных при нейросетевом моделировании сложных многоэтапных процессов. Предложен численный метод оптимизации, обеспечивающий равномерную аппроксимацию поверхности решения и использующий предложенный метод поиска смежных точек. Определен диапазон генерации начальных значений весовых коэффициентов, выбрана функция активации нейронов, обеспечивающая получение более точных результатов обучения нейронной сети и последующего моделирования.
В третьей главе разработана структура специального программного обеспечения моделирования и оптимизации на основе оригинальных методов, позволяющих проводить подготовку данных, построение нейросетевой модели и инверсию нейронной сети, в состав которой включены модули, реализующие разработанные методы.
В четвертой главе представлены правила использования разработанного комплекса программ, проведена проверка на данных производства горячего и холодного проката ОАО «Новолипецкий металлургический комбинат».
Разработана структура функциональных связей технологических параметров и показателей качества в многоэтапной технологии производства холоднокатаного проката (для горячей прокатки, холодной прокатки, отжига и дрессировки).
В заключении приведены основные результаты диссертационной работы.
1. ОБЗОР И АНАЛИЗ СРЕДСТВ И МЕТОДОВ МОДЕЛИРОВАНИЯ И ОПТИМИЗАЦИИ МНОГОЭТАПНЫХ
ПРОЦЕССОВ
1.1. Ограничения использования регрессионного анализа
Классическим методом решения задачи линейной идентификации является регрессионный анализ. Регрессионный анализ - метод статистического анализа зависимости переменной у от независимых переменных ^ (у = 1, и), которые рассматриваются в данном анализе в качестве неслучайных величин, в независимости от настоящего закона распределения переменных х,.
Как правило считается, что случайная величина у описывается нормальным законом распределения и имеет математическое ожидание у, являющееся функцией от переменных х, и постоянной, не зависящей от этих переменных дисперсии СГ2 .
В общем случае модель регрессионного анализа имеет вид:
где /?, - коэффициенты модели; ср] - некоторые функции переменных
х,,д;2,...,л:п, которые выбираются эмпирически на основе анализа данных; е —
случайная величина с нулевым математическим ожиданием и дисперсией а2.
Уравнение регрессии (неизвестные коэффициенты /?,) находится с помощью метода наименьших квадратов, т.е. минимизируется сумма квадратов отклонений реально наблюдаемых значений у, от их оценок у„ рассчитанных по уравнению регрессии:
п
(1)
т
^ку, -У,)2 -> тт,
(2)
1=1
где т - объем выборки [2, 29].
Регрессионный анализ наиболее целесообразно использовать для раскрытия причинно-следственных связей, например при оценке вход-выходных зависимостей объекта. Однак�
-
Похожие работы
- Разработка и исследование нейросетевых инструментов моделирования и управления сложными технологическими процессами
- Применение искусственных нейронных сетей для решения задач управления динамическими объектами
- Нейросетевое управление рентабельностью предприятия
- Робастная стабилизация динамических систем с использованием нейросетевых моделей и модулярных регуляторов
- Топология поиска нейросетевой модели с помощью генетических алгоритмов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность