автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.06, диссертация на тему:Модели и алгоритмы выбора эффективных робастных методов при синтезе функциональных задач АСУ
Автореферат диссертации по теме "Модели и алгоритмы выбора эффективных робастных методов при синтезе функциональных задач АСУ"
' Л ^
. 3 »• ч
Ангонов Влиінсляи Олександрович
УДК 6315.01:65&£
МОДЕЛІ ТА АЛГОРИТМИ ВИЗНАЧЕННЯ ІФЕКТИВНИХ РОБАСТКИХ МЕТОДІВ ПРИ СИНТЕЗІ ФУНКЦК АЛЬНИХ ЗАДАЧ АСУ
05.! ЛОб - автолізі гшовяні сінгі .-нравлінна та
прогрссіївіїї ІпфорМЙЦІЙиі ЮЛОІ (ї
Автореферат дисертації на здобуття наукового ступеня кандидата технічних наук
Харків 2000
Дисертацією є рукопис
Робота виконана у Харківському державному технічному університеті радіоелектроніки, Міністерства освіти і науки України.
Офіційні опоненти:
- доктор технічних наук, професор Годлевський Михайло Дмитрович, Харківський державний політехнічний університет, завідувач кафедри автоматизованих систем управління;
- кандидат технічних наук, професор Євсєєв Віктор Володимирович, Харківський державний технічний університет радіоелектроніки, професор кафедри системотехніки
Провідна установа:
- Національний авіаційний університет, кафедра комп'ютерно-
інтегрованих комплексів, Міністерство освіти і науки України, м. Київ.
Захист відбудеться “ /4” ГРІ/Дя£ 2000 р. о -О.&рі отп] на засіданні спеціалізованої вченої ради Д 64.052.01 у Харківському державному технічному університеті радіоелектроніки за адресою: 61166, м. Харків, пр. Леніна, 14, тел: (0572) 40-94-51.
З дисертацією можна ознайомитись у бібліотеці Харківського державного технічного університету радіоелектроніки за адресою: 61166, м. Харків, пр. Леніна, 14.
Науковий керівник - кандидат технічних наук, доцент
Шамша Борис Володимирович,
Харківський державний технічний університет радіоелектроніки, професор кафедри інформаційних управляючих систем
Вчений секретар спеціалізованої вченої ради
Автореферат розісланий
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність геми. С'учасис виробництво характеризується наявністю зеликої кількості інформації, що спричиняє збільшення кількості службовців, зайнятих її обробкою. У цих умовах застосування сучасних автоматизованих-лістс'.і управління (АСУ) стає важливим чинником \ підвищенні ефективності суспільного виробництва усіх видів продукції та послуг для поліпшення :оиіадьно-економічних умов життя населення.
Ефективність функціонування АСУ значною мірою залежить від досконалості розробки математичного забезпечення (M3), а саме від досконалості резпоссредньо методів розв’язання функціональних задач та досконалості засобів вибору тих із них. що забезпечать одержання максимально ефективного результату.
Теорія та практика розробки математичного і програмного забезпечення АСУ юказує, що найбільш перспективний шлях розвитку - це автоматизація троеісіування прикладного M3. Питанням розробки елементів M3 приділяється г'вага у роботах таких відомих вчених як В.М. Глушков, Б.Я. Совєтов, \.А. Павлов, В.М. Левнкін, Е.Г. Петров, В.Л. Волкович, B.C. Михалевич.
В організаційно-економічних АСУ під час розв’язання задач техніко-;кономічного і календарного планування, оперативного керування, прогнозування гоню досить широко застосовуються моделі оптимізаційних задач. В умова:-, гестабільної ринкової економіки процес функціонування підприємств маг ггохастичний характер, обумовлений впливом різних - як постійних, так і рдиничних, як правило, взаємозалежних випадкових зовнішніх чинників. Тому зиникає необхідність у побудові статистичних моделей оптимізаційних задач, то івляють собою сукупність регресійннх рівнянь і ряду обмежень. Регрссіііні моделі будуються на підставі реалізацій випадкових процесів, накопичених за юпередні періоди функціонування підприємств, із використанням методів математичної статистики, зокрема регресійного аналізу (РА). Як відомо, результати, отримані методами РА, вважають достовірними, якщо дотримуються /сі припущення його використання, одне з яких - задішші моделі регресії повию-і лати нормальний закон розподілу. При його порушенні оцінки параметрів моделі регресії залишаються становшцними і незміщеними, але втрачають в ;фектнвності. Основною прігчиною порушення вимоги нормальності є наявність ' забруднення” у вихідних даних і обмеженість вибірки.
Як правило, реалізації випадкових процесів, на підставі яких будуються рсгресійні моделі, є багатомірними, мають обмежену- довжину та містять різні за розміром викиди (10-35% від середнього значення), обумовлені впливем ущничних малоймовірних чинників. При аналізі та обробці таких вибірок ніхідних даних методом РА одержувана модель може втратити до 20%
ефективності, що спричішить зниження ефективності всієї АСУ. Тому ДЛ побудови статистичних математичних моделей при порушенні припущень пр нормальність залишків використовують робастні методи. Завдяки цьому розробі; методів оцінювання в регресійних задачах, що призводять до підвищени ефективності оцінок в умовах порушення припущень про нормальність залишки є досить актуальною задачею.
У зв'язку з великим розмаїттям робастних методів та їх модифікацій, ш мають специфічні властивості, вибір того чи іншого методу в залежності ві статистичних властивостей вихідної інформації являє собою досить складну т мало вивчену науково-дослідну задачу. Так, вибір неефективного методу мо» звести на нівець всю перевагу, обумовлену переходом від РА до класу робастни методів. Тому необхідно оцінити ефективність і припустимі області використанії відомих робастних методів.
У зв'язку з цім формалізація підходу до автоматизованого визначення г інженерному рівні ефективного робастного методу7 безумовно є дуже актуальної задачею, що розв'язується в рамках М3 АСУ, як задача вибору оптимальної методу або алгоритму розв’язання функціональних задач АСУ.
Зв'язок роботи з науковими програмами, планами, темами. Робот виконувалась згідно з планом науково-дослідних робіт Харківського державної технічного університету радіоелектроніки в рамках держбюджетних тем: Мі 01 “Розробка методології, методів і засобів проектування розподілених систе керування з необхідними параметрами” (№ДР 0197Ш12133) і №108 “Розробі методології, методів і засобів проектування основних компонент інформаційні технологій типової розподіленої логістичної інформаційно-керуючої системі (діє з 2000р.), на яких автор працював як виконавець.
Мста і задачі дослідження. Метою дисертаційної роботи є розробі елементів математичного забезпечення АСУ, що реалізують вибір і інженерному рівні ефективного робастного методу для синтезу найбіль адекватних математичних моделей процесів та об'єктів, на які впливаю різноманітні випадкові зовнішні чинники, та базуються на математичних модеж залежностей ефективності робастних методів від статистичних властивоск вихідної інформації.
Для досягнення поставленої мети необхідно вирішити такі задачі дослідженії
- обгрунтувати необхідність застосування робастних методів у М3 АСУ п] побудові статистичних моделей оптимізаційшіх задач в умовах “забрудненосі вихідних даних, як методів, що дозволяють одержувати більш адекватні модс процесу керування і, отже, підвищити ефективність АСУ;
- розробити систему імітаційного моделювання для статистичних іспит робастних методів і провести з її допомогою серію експериментів;
- розробити алгоритм визначення кількісних характеристик "забрудненн
з
(кбірки вихідних даних;
- розробити математичні моделі визначення характеристик ефективності
юбастних методів у ’залежності від статистичних властивостей вихідних даних;
- удосконалити однокроковий робастний метод, що дозволить будувати ідекватні моделі процесів, реалі зації яких місіть велику кількість викидів різної труктурк і розмірів;
- розробити алгоритм визначення на інженерному рівні найбільш :фекгиенога методу побудови статистичних математичних моделей процесів чи іб'єктів. на які впливають різноманітні за величиною випадкові зовнішні
ЦІННИКИ.
Об'єктом дослідження с стохастичиі процеси, які описуються лінііишдш за іарамстрами математичними моделями та на які впливають різноманітні за !Єличиною випадкові зовнішні чинники.
Предметом дослідження є математичні моделі залежностей показників :фектизносгі робастних методів від властивостей вихідної інформації з об'єкта чи іроцесу. на який впливають різноманітні за величиною випадкові зовнішні цінники.
Методи дослідження. Для оцінки якісних показників робастних методів іастосовувалнся методи імітаційного моделювання. Для апроксимації нелінійних !алежностей якісних показників робастних методів від статистичних зластивостеіі вихідних даних використовувався апарат штучних нейронних ііереж прямого розповсюдження.
Наукова моштіа одержаних результатів. У ході вирішення поставлених задач були отримані наступні резу льтати:
- вперше формалізовано підхід до автоматизованого визначення найбільш ефективного робастного методу в залежності від статистичних характеристик шхідних даних, який дозволяє з використанням обраного методу побудувати найбільш адекватну модель процесу керування, що, в свою чергу, дозволяє тідвиотити ефективність АСУ;
- вперше отримані математичні моделі залежностей ефективності робастних методів від статистичних характеристик вихідних даних, що дозволяють кількісно юрівняти адекватність моделей процесу керування, які можна отримати з використанням досліджуваних робастних методів для конкретної реалізації зихідних даних, і. тим самим, дозволяють вибрати найбільш ефективний зобаслний метод, що в підсумку підвищить ефективність АСУ:
- удосконалено однокроковий робастний метод максимальної правдоподібності, заснований на залишках Пірсон.і. у частині схеми зважування що дозволяє будувати адекватні моделі процесів, реалізації яких містять велику кількість викидів різної структури і розмірів.
Практичне значення одержаних результатів. Запропоновані в дисертаційній
роботі моделі та алгоритми визначення на інженерному рівні ефективні робастних методів, реалізовані у вигляді програмного комплексу, знайшли доси широке застосування в М3 АСУ при побудові найбільш адекватних статистичні математичних моделей для розв’язання функціональних задач короткостроково техніко-скономічного планування підприємством. Удосконалений однокрокові робастний метод забезпечив побудову адекватних математичних моделей умовах високої "забрудненості" вихідних даних за рахунок зменшення диспері оцінок параметрів моделей. Розроблена система імітаційного моделюван; дозволяє генерувати вибірки даних, ступінь і структуру “забруднення” які можна змінювати у досить широких межах, що дозволяє моделювати прогнозувати поведінку- широкого класу стохастичних процесів.
Наукові результати, отримані в ході виконання даної дисертаційної робот знайшли своє практичне застосування в науково-дослідному7 інституті НДПІАС ТРАНСГАЗ при розробці та впровадженні автоматизованих систем керувані транспортуванням газу на території України, а також на ДП “Завод імс Малшпева” при розвитку та впровадженні автоматизованих комплекс розв’язання функціональних задач техніко-економічного планування АСУП, г засвідчено відповідними актами про впровадження №12 від 15.04.2000 та №48 в 5.05.2000.
Особистий внесок кандидата. У роботі [1] автором запропоноваї концепцію інтелектуальної системи обробки даних, що входить складове частиною в М3 АСУ і дозволяє на інженерному рівні вибрати найефективніші метод побудови математичних моделей. У роботі [2] наводяться результа оцінки ефективності ряду робастних методів, на підставі чого пропонуєте формальна процедура вибору найбільш ефективного методу. У роботах [З, запропоновано використовувати апарат штучних нейронних мереж д апроксимації нелінійних залежностей. У роботі [4] запропонована методи розробки модифікованих робастних методів і запропонована модифікація мето; що забезпечила повну його ефективність і стійкість до викидів у незалежні змінних. У роботі [5] автором запропоновано модификацію онлайново алгоритму побудови моделей для випадку слабкої "забрудненості" даних. > результати, що вішосяться на захист, отримані автором особисто.
Апробація результатів дисертації. Основні результати дисертаї доповідалися та обговорювалися на 6-й міжнародній науково-технічн конференції ’’Інформаційні технології: наука, техніка, технологія, утворенг здоров'я” (Харків, 1998); 3-му та 4-му Міжнародних молодіжних форум, “Радіоелектроніка та молодь у XXI столітті” (Харків, 1999 та 2000); 5 міжнародній конференції “Теорія і техніка передачі, прийому й оброб: інформації” (Туапсе, 1999); 6-й Українській конференції автоматично керування “Автоматика - 99” (Харків, 1999).
Публікації. Матеріали дисертації опубліковано в 8 наукових працях (6 статтях, 4 із них надруковано у виданнях, перелік яких затверджено ВАК України, і 2 тезах доповідей на наукових конференціях).
Структура дисертації. Дисертація складається зі вступ}, п'ятьох розділі», висновків і додатків. Повний обсяг дисертації становить 205 сторінок, у тому числі X додатків на 55 сторінках. 2 рисунки, 5 таблиць, список використаних літературних джерел з 123 наймеїгувапь на 9 сторінках.
ОСНОВНИЙ ЗМІСТ РОБОТИ
У першому розділі дисертаційної роботи проведено аналіз функціональних задач, що розв'язуються у підсистемах АСУ. який виявив необхідність застосування статистичних метолів обробки інформації, зокрема методу регресійного аналізу (РА). Було виявлено причини, що призводять до порушення вимог нормальності залишків регресії, і показано, що на практиці, в умовах нестабільної економіки, це явище зустрічається доволі часто. В результаті було обтрушувано умови переходу до робастних методів оцінювання та проведено їх аналіз. Аналіз показав розмаїття їх специфічних особливостей, які спричиняють труднощі, пов'язані з вибором найбільш ефективного методу' для побудови статистичних матема тичних моделей в АСУ, і дозволив виділити перелік методів, що досліджувались. Показано, що застосування неефективного робастмого методу може звести нанівець усю потенційну перевагу, що виникає при переході від РА до цього класу- методів. Завдяки нелінійному характеру робастних методів досить важко дослідити їх аналітично. Тому було запропоновано використати д.ія цього метод імітаційного моделювання. Додаткові труднощі при дослідженні робастних методів викликає відсутність формальної процедури визначення ступеня і структури "забрудненості" вибірки вихідних даних.
У роботі розглядається клас квазістаціонаршіх об'єктів і процесів, що підлягають впливу різноманітних випадкових зовнішніх чинників та описуються лінійними за параметрами математичними моделями із симетричним законом розподілу помилок. Виділено перелік досліджуваних робастних методів: метод найменших модулів (LAD); метод найменших квадратів медіан (LMS); метод найменших усічених квадратів (LTS); метод зважених найменших квадратів (RI.S); метод функціональних найменших квадратів (FLS): S-оцінка; ММ-оцінкл: одьокрокова GM-оцінка (S1S).
На підставі проведеного аналізу, виявлених труднощів і відповідно до мети даної дисертаційної роботи були поставлені вищезазначені задачі дослідження.
У другому розділі дисертаційної роботи була розроблена система імітаційного моделювання для проведення статистичних іспитів методів робастного оцінювіння, що дозволяє досліджувати їх якісні показники в
залежності від статистичних властивостей вибірки вихідних даних. Мето імітаційного моделювання є побудова статистичних залежностей сукупнос показників якості {Ьт} від множини К параметрів вихідних даних для кожної з досліджуваних робастних методів. Для одержання вказаних залежносте необхідно провести серію машинних експериментів, у яких незалежним змінними є к) еК, а залежними - кожний із .
Як критерії оцінки якісних показників робастних методів буї запропоновано відносні критерії у вигляді
де р' - оцінки параметрів моделі регресії, отримані з використанням МНК;
Р - оцінки параметрів моделі регресії, отримані за допомогою робастної методу;
Р - дійсні значення параметрів регресійної моделі;
р - кількість незалежних змінних у вибірці вихідних даних.
Було показано, що критерій (2) краще використовувати у випадку велик "забрудненості" вибірок вихідних даних, а критерій (1) - у випадку малої "забрудненості".
Було визначено основні параметри вибірки вихідних даних кі, що впливаю: на ефективність робастних методів,: к1=п - довжина вибірки вихідних дани кг~ р - кількість незалежних змінних у вихідних даних; к, = у - ступії "забруднення" незалежних змінних точками негативного високого впливу; к4 =.
- ступінь "забрудненості" змішаного закону розподілу помилок моделі регрес к5 = а - співвідношення масштабів "забруднюючого" та основного розподіл змішаного розподілу помилок моделі. Ці параметри визначають розмірніс-вибірки вихідних даних (£, , к2) та характеристики її "забрудненості", а саме "вагу" і довжину "хвостів" симетричного розподілу помилок регресійної моде ( к4 , к5) та кількість викидів у незалежних змінних ( к3).
Відповідно до наведених параметрів, як модель розподілу помилок регресії "важкими" хвостами було обрано модель змішаного нормального розподілу наступному вигляді:
с
(
де /V(0,1) - стандартний нормальний закон розподілу;
ст - (<т;/сг(,) > 1 -відношення масштабів “забруднюючого” та основного розподілів;
Я - ступінь "забруднення" розподілу.
Також запропоновано модель для генерації викидів у незалежних змінних.
Для дослідження якісних показників робастних методів було використано методи оптимального планування активного експерименту, а саме - повний факторний експеримент.
На підставі викладеного раніше було розроблено систему імітаційного моделювання, що дозволяє моделювати вибірки вихідних дапнх із задаитіїх ступенем і структурою "забрудненості", законами розподілу га структурою об'єкту, що модулюється. Крім цього, було визначено кількість і значення рівнів домінуючих чинників імітаційного експерименту, що дозволило одержати найбільш інформативні залежності Ьт(к^ для досліджуваних методів.
Для можливості практичного використання результатів модельного експерименту необхідно мати можливість обчислювати значення параметрів, що
впливають, множини К для конкретної вибірки даних. Як було відзначено раніше, на даний момент не існує формальних процедур оцінки ступеня та структури "забрудненості" вибірок даних.
У третьому розділі дисертаційної роботи було розроблено алгоритм кількісної оцінки "забрудненості" вихідних даних, що дозволяє визначати параметри к для реальної вибірки вихідних даних.
Значення параметрів к], к2 визначаються безпосередньо з вихідних даних.
Для виявлення викидів у незалежних змінних, якщо вони мають випадковий характер, було запропоновано використовувати міру у вигляді
Я£>(*,) = ^-Т(Х))(С(лТ)ЛхГ-ПХ)У , ЯОг = (4)
де Т(Х) - робастна оцінка положення;
С(Х) - матриця розкиду, шо є рсбастною оцінкою коваріаційної матриці;
ЯОг ~ граничне значення міри;
р - кількість незалежних змінних, що відповідає ступеням свободи
2 ♦
X -розподілу.
Ця міра - робастна відстань - є робастним аналогом відстані Махалонобіса,
квадрат якої має х2 -розподіл, що визначає її граничне значеній. Тому викиді будемо вважати точку, для якої значення /Ш,- буде більше граничного Ш)г.
Для обчислення робастних оцінок положення і коваріаційної матрк найчастіше використовують метод мінімального об'єму еліпсоїда (МУЕ) а метод мінімального визначника коваріаційної матриці (МСО), що мають 5С порогову точку. Якщо виконується умова п* р< 600, то доціль використовувати перший, а якщо ні - другий. Для підвищення ефективності ц методів було запропоновано використовувати зважені оцінки положення коваріаційної матриці у такому вигляді:
Вирази (5), (6) використовуються при обчисленні робастної відстані (4).
Для визначення параметра у необхідно мати вибірку стандартизован залишків регресійної моделі, що дозволить виявити викиди у вибірці залежі змінної вихідних даних. Для цього необхідно обчислити початкове наближен
параметрів регресії /? і масштабу її залишків ? робастнпми методами максимальною пороговою точкою, наприклад ЬТБ і Оп, відповідно, властивостей нормального закону розподілу як граничне значен стандартизованих залишків регресії /? , що визначає викид, приймемо 2.5. Ді визначаємо значення параметра у, що являє собою відсоток точок негативне високого впливу у вихідній вибірці, з виразу
За умови адекватності моделі, вибірка залишків регресії, обчислених без то1 негативного високого впливу, відображає властивості вибірки помилок регре е. Обчислювати її доцільно за допомогою М-оцінок. У випадку детерміноване характеру незалежних змігших для визначення властивостей вибірки помил
П
п
Тю(Х) = <£а>Іх,)ИХ,Щ\
СШ(Х) = (£оф, - Та{Х))'\х, - Т^ХМ&а,)-1),
1, 1Ю (X, ) < ^Xр,0.975
0, !Ю (Х1 ) > -\1хр,0.975
регресії е можна використати стандартизовані значення вихідної змінної.
Для оцінки належності вибірки вихідних даних до класу об'єктів, що розглядяється, було запропоновано статистичний критерій перевірки симетричності розподілу вибірки залишків регресії, що не залежить від виду її закону розподілу. ~
Маючи вибірку залишків регресії, що відображає властивості вибірки її помилок, можна визначити параметри Я та а . Використовуючи розроблену імітаційну модель, було проведено імітаційний експеримент, у якому моделювалися вибірки з законом розподілу (3) та обчислювався ряд їх статистичних характеристик. Використовуючи значення відповідних коефіцієнтів кореляції, було визначено найбільш інформативні з них
= Р(І е, |> 2.5а), Jг = Р{І е, |> 2.5л), ^ - 5/.? , = тах(І-е. \и ф /)/Г , [8)
де д, 5 - оцінка середиьоквадратичного відхилення вибірки {е,} та її
робастного масштабу, відповідно.
За допомогою апарата штучних нейронних мереж прямого розповсюдження (ШНМІТР), що використовувався в режимі навчання, було побудовано
математичні моделі залежностей параметрів 2 і а від вищевказаних статистичних характеристик вибірки в наступному вигляді
І = 0.04-----\-------, /7, ------------}-------:---, І - 1,6 , (9)
] + е ,=1
О- = 29------1-------т і, р, =------------)-------=---, і = 172, (10)
■йт*')) ] + е-Уг»ь+ '■>»?, *-*4*3, >»4і)
1 + є
де , V, - числові коефіцієнти, що відповідають синапсичним вагам ШНМПР;
.7,= (■/,-шт(Уу))Дшах(^)-тт(77)) - нормовані значення
характеристик закону розподілу.
Для коректного використання одержаних моделей необхідно, щоб обчислені значення характеристик (8) закону розподілу належали відповідним діапазонам ./, є[0.01;0.063], є[0.07;0.313] ,./3 є[0.893^9.5951],./, є [5.2534;91.6667].
Таким чином, відповідно до вище вказаного, було запропоновано алгоритм визначення у кількісному вигляді ступеня і структури "забрудненості" вибірки вихідних даних.
У четвертому розділі за допомогою розробленої системи імітаційної моделювання було проведено експеримент, що дозволив визначити приблиз області використання досліджуваних робастних методів. Експеримент вияві недостатню ефективність досліджуваних методів у присутності точок негативно високого впливу. Тому було запропоновано удосконалити метод робастно оцінювання, заснований на залишках Пірсона - &(х)-/\х)/т*(х)-\, , /‘(х)=| А(х;ґ, /г)с/ґ(0, т' {х)-\к{х\1,И)сШ{1) - відповідно, оцінка щільності згладжена щільність моделі з ядром &(.х;ґ,/і) та параметром, що згладжує, И.
Оцінки параметрів регресії визначаються як розв’язання рівняння
£«^)М*/,у,;Д,) = о, (і
де м(х.,_у;;Р) - Ар 1п[»г(х(,>’,;/?)] - похідна по р логарифму моделі щільно< помилок регресії;
Р0 - початкова оцінка параметрів регресії;
а>Т(<5(г;)) - вагова функція, заснована на залишках Пірсона.
Ітераційна залежність для обчислення оцінок параметрів має вигляд
/? = А-
1 ))0У^, у,; Р) \р=І!о)
П
" і X'
-'її=М8(гі))и(х„у,\рй)
п
де Ари{.хі,уі;Р)\^-й = ~и(хі,уі\Р) - похідна в точці Д;
Г/ = (у, - х,Д)/?0 - залишки регресії при початкових оцінках параметрів та масштабу ї0.
Для обчислення початкових оцінок параметрів і масштабу залиш застосовується ЬТБ і С>п-алгоритм, відповідно. Метод було вдосконалено частині схеми зважування, що прийняла вигляд
ат(<5гЛ) = аШО^хШОЛСх,)), (
де 8г{Гі) - залишки Пірсона для розподілу залишків регресії;
8х(хі) - залишки Пірсона для розподілу незалежних змінних регресії;
= 1 - 8г{гі)!(8(гі)+2)2 - функція ваги, що визначає вплив залиші
а>х(8г,8х) = со{дх(хІ))+д(\~а{ох{хі)))ср(8г(гі)), - функція ваги, що визначає іплтїв викидів у незалежних змінних, де <р(<5г(/:)) - безупинна функція, така що ікіло <р{8г)~> 1, то <5Г —»0 та якщо <р(8.)— > 0, то 8Г -» со ; с/ - коефіцієнт, шо шзйочас ступінь впливу викидів у незалежних змінних, д є [0;1]. Дана функція юзволяс враховувати та регулювати ступінь виливу викидів у незалежних мінних. Тзк, вага точок позитивного високого впливу максимально збільшується, і нага точок негативного високого впливу - максимально знижується.
На практиці закон розподілу залишків регресії, як правило, близький до юрмального. У цьому випадку уг,/3) ~ х/, ■ Ефективність методу залежить іід вибору параметра , що згладжує, п, що у випадку нормального розподілу позначається як }ґ — !£%. Для обчислення к необхідно розв’язати систему
де Я - ступінь "забруднення" змішаного нормального закону розподілу помилок регресії;
с - значення, що показує, на скільки стандартних відхилень відстоїть розглянуте спостереження від середнього вибірки;
р- порядок багатомірної щільності розподілу вибірки, для якої формуються залишки Пірсона;
го1 - досить мала вага, що призначається спостереженню с .
Використовуючи результати роботи розглянутого раніше алгоритму, можна запропонувати формальні правила вибору значень параметрів з рівнянь (14) та,
як наслідок, параметрів А , що згладжують, для залишків регресії та незалежна змінних, відповідно, у наступному виді:
Ці правила дозволяють забезпечити максимальну ефективність даного методу. Якість функціонування удосконаленого методу було перевірено експериментально, що підтвердило його максимальну пороюву точку, високу ефективність і стійкість до точок високого негативного впливу. Метод дозволяє
нвнянь
(14)
р = 1, с = 2.5, Я = Р(| г |> 2.5?, сое = тіп{0.2; Р(\ г, |> 2.5?); (15)
с = КОп, Л = Р(Щ > Р.ПГ/), со, = тіл (0.2; РОЮ, > КИ,)). (16)
будувати найбільш адекватні математичні моделі процесів та об’єктів, на . одночасно впливають різноманітні за величиною та структурою випадкі чинники, що забезпечить ефективне розв’язання функціональних задач АСУ.
За результатами імітаційного експерименту з використанням апарата ШНМ було побудовано комішекс математичних моделей залежностей критеріїв оції якісних показників робастних методів від параметрів закону розподілу помшї моделі регресії для різних довжин вибірки та наявності в ній точок негативне високого впливу в наступному виді:
4 1
Т п,у = У у ____________________________________ . — —
МІ “1 "У l+e-<.lм'm^j+Wm2J/m+wmЗj)+vms) ’ ‘ = ^ Ш=1,2, (
де ,у, - числові коефіцієнти, що відповідають синапсичним ваг ІІІНМПР;
Я, су - параметри змішаного закону розподілу' помилок регресії.
Для коректного використання моделей (17) необхідно, щоб кількість незалежк змінних і відсоток точок негативного високого впливу у вибірці вихідних дав належали відповідним діапазонам /> є[1;10], у є [0;0.1], а також моделі (9), ( були адекватними, що обумовлює корректність визначення парамет “забруднення” Я, а .
Далі для реалізації алгоритму вибору найбільш ефективного мете робастного оцінювання було запропоновано узагальнений критерій оцінки якісних показників у вигляді
6 6 —
Ь - (1 - є)£ а,Іу + £■£ + а7Із, -» шш, і-1,9, (
і=і і=і '
6 -------------------------------------
де а, = Sigm(XV + и^) + у^), / = 1,6 - вагові коефіцієнти;
д7 є [0;0.5] - ваговий коефіцієнт;
і3є[0.1;4] - критерій якості робастного методу, що відображає й( обчислювальну складність;
є = у + 0А*Л*сг - узагальнений параметр, що відображає ступ "забрудненості" вихідної вибірки даних;
Sig}?l(x) = і/(1+ех) - сигмоїдальна функція.
Його необхідність викликана тим, що при великому рівні "забрудненое вибірки вихідних даних доцільніше використовувати критерій (2), а при малому
1). Узагальнений же критерій об'єднує значення цих критеріїв із відповідними іагами, обумовленими ступенем забруднення даних. Також із використанням іпарата ШНМПР були отримані залежності для вагових коефіцієнтів, що шзначають співвідношення критеріїв І, та і, при різній довжині вибірки іихідпих даних і різній кількості точок негативного високого впливу. Також шважено було введено критерій, що відображає обчислювальну складність їідповідних методів.
Слід зазначити, що при побудозі за допомогою ШНМПР усіх моделей, шо задувались раніше, помилка апроксимації не перевищувала п’яти відсотків.
На підставі узагальненого критерію (18) та моделей (7), (9). (10), (17) було юзроблено алгоритм визначення найбільш ефективного робастного методу. Він іозколяє на інженерному рівні визначити оптимальний метол обробки даних в /мовах порушення вимоги нормальності помилок моделі регресії, то і було іизначено в меті та задачах дослідження.
Таким чином, моделі та алгоритми, запропоновані в роботі, дозволили формалізувати підхід до автоматизованого визначення ефективних робастних лето дів у залежності від статистичних характеристик вихідних даних.
У п'ятому розділі дисертаційної роботи розглядалися особливості ірактичного застосування розробленого комплексу моделей та алгоритмів, що інайшли відображення у програмному комплексі, при реалізації елементів М3 \СУ виробничим підприємством та АСУ компресорного станцією. Зокрема, було тобудовано адекватну статистичну математичну модель функціональної задачі тобудоші виробничої програми підприємства, то функціонує в умовах «стабільної ринкової економіки. При цьому розроблений проірамшпі комплекс їуло викопне гано для побудови критерію оптнмізації. Також було побудовано адекватну статичну модель, яка дозволяє розв’язати задачу непрямих вимірів )б'єму газу, що транспортується, у рамках функціональної задачі визначення основних техніко-економічних показників компресорної станції (КС).
З використанням розробленого комплексу кращим робастним методом у тершому випадку було визначено ГЬХ, а у другому - ІІЬ8. В обох випадках не здалося побудувати адекватні моделі за допомогою МНК. Для оцінки адекватності при цьому використовувались робастні модифікації F-критерію, (-критерію та множинного коефіцієнту детермінації. Цей результат свідчить про ефективність використання запропонованого комплексу моделей та алгоритмів, до забезпечує визначення методу побудови найбільш адекватних статистичних моделей у випадку порушення вимог нормальності залишків моделі регресії.
У додатках наведено результати імітаційних експериментів, що проводились тід час досліджень; значення числових параметрів розроблених математичних моделей; приклади впровадження результатів дисертаційної роботи з відповідними актами.
ВИСНОВКИ
У дисертації наведене теоретичне узагальнення і нове вирішеї наукової задачі, що виявляється у формалізації підходу до автоматизовані визначення ефективних робастних методів побудови лінійних статистичі моделей, необхідних при синтезі функціональних задач АСУ, в залежності властивостей вихідних даних, що дозволить будувати найбільш адекватні мод і, як результат, забезпечить підвищення ефективності АСУ. Для її вирішення б) побудовані математичні моделі оцінки ефективності робастних мето; алгоритми вибору кращого з них для конкретного випадку та було удоскональ робастний метод, який дозволяє будувати адекватні моделі в умовах велик< рівня “забрудненості” вихідних даних. Ці результати мають важливе наукове практичне значення для автоматизації вибору в рамках МЗ АСУ методів алгоритмів розв'язання функціональних задач організаційних систем, забезпечить підвищення їх ефективності.
1. У дисертаційній роботі обгрунтовано причину використання статистичі моделей оптимізаційних задач під час розв’язання функціональних задач АС Виявлено особливості функціонування підприємств, що обумовлюють наявнії викидів різної структури та розмірів у реалізаціях процесів їх функціонування, визначає некоректність використання найбільш поширеного методу оброС статистичних даних і побудови моделей у МЗ АСУ - регресійного аналі пов'язану з порушенням вимоги нормальності залишків моделі. У результ обгрунтовано перехід до робастних методів, що мінімізують дисперсію оціно: цьому випадку. Показано неспроможність асимптотичних властивою робастних методів у випадку кінцевих вибірок і відсутність систематизова* результатів дослідження їх якісних характеристик у залежності від статистичі властивостей реальних вибірок даних. Це дозволило визначити напря\ досліджень, сформулювати мету та задачі дисертаційної роботи.
2. Запропоновано відносні критерії (1), (2) оцінки якісних показни робастних методів і обгрунтовано їх застосування для розв’язання зад визначення найбільш ефективного робастного методу для вибірок вихіді даних, статистичні властивості яких змінюються в досить широких межах.
3. Розроблено систему імітаційного моделювання, що дозволяє оціні якісні показники робастних методів у залежності від статистичних властивос вихідних даних. У рамках цієї системи було запропоновано модель імітг симетричної вибірки з різною "вагою" і "довжиною хвостів" її закону розподі модель імітації викидів у вигляді "довгого хвоста" з довільною довжино* "вагою", а також у вигляді залишкових викидів.
4. Розроблено алгоритм, що дозволяє визначати в кількісному виді ступії структуру "забруднення" вибірки вихідних даних. При цьому як модель зако
>зподілу з "довгими хвостами" була обрана модель змішаного нормального >зподілу (3) та були визначені в аналітичному вигляді (9), (10) залежності
іраметріа цієї моделі від статистичних характеристик вибірки.
5. Удосконалено однокроковий робастний метод максимальної хшдоподібності, заснований на залишках Пірсона, у частині схеми зважування 3) та запропоновано правила (15). (16), які забезпечують максимальну |)ективність методу, що було доведено експериментально. Це дозволяє з його іпомогоіо будувати адекватні моделі процесів, реалізації яких містять велику лькїсть викидів різної структури та розмірів.
6. Розроблено математичні моделі (17) якісних показників досліджуваних >бастних методів в залежності від параметрів моделі змішаного нормального .кону розподілу' помилок пеіресійної моделі для різної довжини вибірки гхїдних даних і наявності викидів у незалежних змінних. Воїш дозволяють у лькісному виді порівняти адекватність моделей, що можуть бути отримані з ікористанням досліджуваних робастних методів для конкретної реалізації іхідних даних, і, тим самим, дозволяють вибрати найбільш ефективний )бастний метод, що в підсумку підвищить ефективність АСУ.
7. Розроблено алгоритм визначення найбільш ефективного методу або груші етодів робастного оцінювання в залежності від конкретних статистичних тастивостей вибірки вихідних лаиих. який базується на узагальненому критерії тінки якісних показників ефективності методів (18) та алгоритмі кількісного ізначення структури та ступеня "забрудненості" даних. Даний алгоритм лзволяс на інженерному рівні вибрати групу кращих робастгтх методів, ізначнвши припустимий рівень втрати ефективності побудованої з їх допомогок> оделі та їх обчислювальної складності, шо дозволяє забезпечити необхідний івень ефективності АСУ. Вказаний алгоритм дозволив формалізувати підхід до зтоматизованого визначення найбільш ефективного робастного методу в шежності від статистичних характеристик вихідних даних.
8. Розроблено програмний комплекс, що дозволяє визначити найбільш |)ективннй метод або групу методів робастного оцінювання для побудові; иекватних лінійних статистичних математичних моделей процесів, реалізації ких містять різні за розміром і структурою викиди. Даний програмний комплекс оцільно використовувати в підсистемі МЗ АСУ для розв’язання задачі вибору лгоритміп і методів, шо забезпечують ефективне втфішення функціональних ідач АСУ. Ефективність програмного комплексу була доведена ксперттмептально в процесі побудови статистичної моделі задачі розрахунку птимальної виробничої програми підприємства та задачі непрямих вимірів 6‘єму газу, що транспортується, розв’язуваної в рамках МЗ АСУ КС.
СПИСОК ОПУБЛІКОВАНИХ АВТОРОМ ПРАЦЬ ЗА ТЕМОЮ
ДИСЕРТАЦІЇ
1. Антонов В.А., Шамша Т.Б., Репка В.Б. Концептуальная модель сист идентификации в современных системах управления технологическ объектами. // АСУ и приборы автоматики. - Харьков: ХТУРЭ.-1998.-№1 С.214-223.
2. Шамша Б.В., Антонов В.А., Васин И.С. Сравнение эффсктив» методов робастного оценивания на основе исходной статистической информа. // Інформаційно керуючі системи на залізничному транспорті.-1999.-№5.-С.68-
3. Антонов В.А. Об одном подходе к идентификации квазистационар объектов. // Вестник ХГПУ.-Харьков: ХГПУ. - 1999,-№72,- С. 105-1 Юс.
4. Шамша Б.В., Антонов В.А. Об одном подходе к разраб модифицированных алгоритмов робастного оценивания.//Вестник ХГГ Харьков: ХГПУ. - 2000,- № 80,- С. 24- 26.
5. Антонов В.А., Шамша Б.В. Оценка качественных показателей алгорш идентификации в условиях зашумленности объектов управления и разраб модифицированного алгоритма онлайновой идентификации. // Информации технологии: наука, техника, технология, образование, здоровье. - Харь ХГПУ.- 1998,- №6 - С.178-182с.
6. Антонов В.А., Шамша Б.В., Хмара С.И. Оптимизация искусствен нейронных сетей с помощью генетического алгоритма. // Труды Междунар.ю “Теория и техника передачи информации”,- Харьков: ХТУРЭ.- 1999,- С.416-4
7. Антонов В.А. Применение искусственных нейронных сетей идентификации квазистационарных объектов. // Тез. докл. к< ’’Радиоэлектроника и молодежь в 21 веке”. - Харьков:ХТУРЭ. - 1999,- С.290-2
8. Антонов В.А. Оценка эффективности алгоритмов робастного оценива // Тез. докл. конф. ” Радиоэлектроника и молодежь в 21 веке ”. - Харьков: ХІУ -2000.-133-134С.
АНОТАЦІЯ
Антонов В.О. Моделі та алгоритми визначення ефективних робастних мет при синтезі функціональних задач АСУ. - Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних науі спеціальністю 05.13.06 - автоматизовані системи управління та прогрес інформаційні технології. - Харківський державний технічний універс радіоелектроніки, Харків, 2000.
Дисертація присвячена питанням автоматизації визначення ефектні робастних методів для побудови найбільш адекватних статистичних моде
5'єктів, що функціонують під впливом різноманітних за величиною випадкових инттків. У роботі пропонується комплекс алгоритмів визначення ефективних эбастннх методів, що базується на моделях залежностей якісних показників зсліджуваних методів від статистичних характеристик вихідних даних, обудова вказаних моделей слала можлива завдяки розробці системи іітаційнсш моделювання, що дозволила накопичити статистичні дані ілежностей критеріїв оцінки якісних показників досліджуваних методів від гатистнчпих характеристик вихідних даних. У роботі також удосконалено знокроковий робастний метод максимальної правдоподібності, що дозволяє удувати адекватні моделі в умовах великої "забрудненості" вихідних даних, апропонований комплекс алгоритмів реалізовано програмно у вигляді елементів атематігпіого забезпечення АСУ по визначенню методів та алгоритмів, що їбезпечать найбільш ефективне розв'язання функціональних задач АСУ. Основні езультати роботи знайшли практичне застосування при вирішенні планово-кономічних задач підприємств.
Ключові слова: функціональні задачі АСУ, статистичні моделі, робастний етод, регресійна модель, імітаційне моделювання.
АННОТАЦИЯ
Антонов В.Л Модели и алгоритмы выбора эффективных робастных методов ри синтезе функциональных задач АСУ. - Рукопись.
Диссертация на соискание ученой степени кандидата технических наук по пециалыюсти 05.13.06 - автоматизированные системы управления и
регрессивные информационные технологии. - Харьковский государственный схничеекий университет радиоэлектроники., Харьков. 2000.
Диссертационная работа посвящена вопросам автоматизации определения ффективных методов для синтеза наиболее адекватных статистических моделей роцессов и объектов, подверженных влиянию различных по величине случайных кпеторов. что. в конечном счете, повысит эффективность решения іункциональньїх задач АСУ. Анализ проблемы показал, что в условиях естабильной рыночной экономики реализации процессов функционирования редприятнй содержат различные выбросы. Это, в свою очередь, исключает рнмснснис метода регрессионного анализа для построения статистичестатс юделей и обусловливает переход к классу робастных методов, отличающихся юльшим разнообразием свойств. Это определяет актуальность разработки редств выбора на инженерном уровне эффективных робастных методов в ависимости от статистических свойств исходной информации.
В работе был формализован подход к определению эффективных робастных іетодов в зависимости от статистических свойств исходных данных. Указанный
подход был реализован в виде комплекса алгоритмов, основанных на моде1 зависимости качественных показателей эффективности исследуемых робастн методов от статистических сеойств исходной информации.
Для исследования свойств робастных методов использовался ме] статистических испытаний. Была разработана система имитациошн моделирования, позволяющая генерировать выборки данных с различны статистическими свойствами. В качестве критериев оценки качественн показателей исследуемых методов использовались относительные критер] основанные на среднеквадратической ошибке и медиане абсолютных отклонени
В работе был предложен алгоритм определения в количественном вт структуры и степени “загрязненности” выборки исходных данных, основанный математических моделях зависимостей параметров смешанного нормальш закона распределения остатков регрессионной модели от ряда количестве™ характеристик выборки и робастном критерии выявления точек высокого влият факторного пространства.
С использованием системы имитационного моделирования были получе статистические данные зависимостей качественных показателей исследуем робастных методов от количественных характеристик “загрязненности” исходи данных, определяемых с использованием вышеуказанного алгоритма, основании этих статистических зависимостей были построены математичесг модели зависимости показателей эффективности исследуемых робастных метод от статистических свойств исходных данных.
В работе был усовершенствован одношаговый робастный мет максимального правдоподобия в части схемы взвешивания. Предложенная схе взвешивания обеспечивает практически полную эффективность метода п сильной “загрязненности” исходных данных, что позволяет строить адекватн статистические модели в указанных условиях и, тем самым, иовыа эффективность решения функциональных задач АСУ.
В работе был предложен обобщенный критерий оценки качественн показателей робастных методов, основанный на взвешенной сумме указанн ранее относительных критериев и критерия, отражающего вычислительн сложность исследуемых методов. На базе обобщенного критерия, использующ< полученные модели зависимостей качественных показателей исследуем методов, был разработан алгоритм определения на инженерном урот эффективных робастных методов в зависимости от статистических свойс исходной информации.
Предложенный в работе комплекс алгоритмов был реализован программне виде элементов математического обеспечения АСУ по выбору методов алгоритмов, которые обеспечат наиболее эффективное решение функциональн задач АСУ. Основные результаты диссертационной работы нашли практическое
эименение при решении функциональных задач технико-экономического танирования и управлении предприятиями. Это обеспечило повышение
[>фективности получаемых решений соответствующих чадам.
Ключевые слова: функциональные :адачн АСУ, статистические модели, 'басткын метод, регрессионная модель, имитационное моделирование.
ABSTRACT
Antonov V.A. Models and algorithms of choice of effectiveness robust estimator m hiding of functional problems ASC. - Manuscript.
Thesis for a candidate's degree by speciality 05.13.06 - automated control systems id progressive information technologies. - Kharkov state technical university of dioelectrouics, Kharkov. 2000.
The thesis is devoted to problems of automation of definition of effective robust ;timators for build-up of the most adequate statistical models of processes, which one Derate under effect manifold on magnitude of random factors. In thesis the complex of gorithms of definition of effective robust estimators is offered, which one are founded l models of associations of the qualitative indexes of researched methods from atistical properties of input data. The build-up of the indicated models became )ssible due to development system of a simulation modeling, which one has allowed ' accumulate the statistical data of associations of criteria of estimate of the qualitative idexes of researched methods from statistical properties of input data. In thesis a one-ep robust estimator of maximum likelihood is updated, which one allows creating lequate models in conditions big contaminated of input data. The offered сошр'с.ч of gorithms is implemented by the way of program complex, as paits of mathematics arc of ACS at the choice of methods and algorithms, which one will provide the most Teeth e solution of functional tasks of ACS. The main outcomes of diesis were used at ilution of the economical tasks of firms.
Keywords: functional tasks of ACS. statistical models, robust estimator, regression iodcl. simulation modeling.
-
Похожие работы
- Автоматизация технологического процесса обжига цементного клинкера на основе робастного управления
- Исследование и разработка робастно-адаптивных алгоритмов управления нелинейными объектами одного класса с использованием нечетких технологий
- Синтез и исследование регуляторов параметрически неопределённой широтно-импульсной системы
- Адаптивные и робастные системы управления в условиях возмущений и запаздывания
- Модели и алгоритмы робастного управления нелинейными объектами в системах с быстродействующим эталоном
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность