автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.10, диссертация на тему:Разработка метода идентификации форм моделей социально-экономических процессов в задачах управления

кандидата технических наук
Аминеддин Фади Рамез
город
Курск
год
1999
специальность ВАК РФ
05.13.10
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка метода идентификации форм моделей социально-экономических процессов в задачах управления»

Оглавление автор диссертации — кандидата технических наук Аминеддин Фади Рамез

ВВЕДЕНИЕ

ГЛАВА 1. ПРЕДМЕТНАЯ ОБЛАСТЬ ИССЛЕДОВАНИЯ.

ПОСТАНОВКА ЗАДАЧИ.

1.1. Социально- экономические системы как объект исследования. и управления.

1.2. Основные классы задач управления социально-экономическими процессами.

1.3. Идентификация, как основной способ построения моделей слабоформализуемых систем (процессов).

1.4. Цель и задачи исследования.

ГЛАВА 2. МЕТОДИЧЕСКИЕ ОСНОВЫ ИДЕНТИФИКАЦИИ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИХ ПРОЦЕССОВ. СПОСОБЫ РЕШЕНИЯ

ПОСТАВЛЕННЫХ ЗАДАЧ.

2.1. Концептуальная модель представления пар распределений.

2.1.1. Основные свойства концептуальной модели представления пар распределений.

2.1.2. Методы построения концептуальных моделей представления пар дискретных распределений.

2.2. Приведенные распределения.

2.3. Методы формирования законов распределения с заданными свойствами.

2.4 Формирование эталонов вероятностных объектов по статистическим данным.

2.4.1. Исследование возможностей различных пар распределений ^ (х) и

1^(х) по формированию индикаторов (т0,10к).

2.4.2. Метод нахождения индикаторов 12г из множества {^(х)} для формирования ^ (х) с заданными индикаторами 10Г при выбранном базовом законе ^(х) с известными индикаторами 1]г.

2.5. Последовательная процедура формирования статистических индикаторов.

2.5.1. Методы восстановления (идентификации) закона распределения вероятностей по выборочным данным.

2.5.2. Восстановление законов распределения методом приведенных распределений.

2.5.3. Последовательная процедура принятия решений в задаче восстановления закона распределений.

ГЛАВА 3. МЕРЫ РАССОГЛАСОВАНИЯ КВАНТИЛЬНЫХ ФУНКЦИЙ. ИХ СВОЙСТВА.

3.1. Концептуальные модели мер рассогласования функций распределения вероятностей.

3.2. Концептуальные модели мер рассогласования плотностей распределения.

3.3. Концептуальные модели мер рассогласования квантильных функций

ГЛАВА 4. ИДЕНТИФИКАЦИЯ ЗАКОНОВ РАСПРЕДЕЛЕНИЯ ДОЖДЕВЫХ ОСАДКОВ.ИЗ

4.1. Постановка задачи исследования дождевых осадков.ИЗ

4.2. Метод восстановления форм законов распределения дождевых осадков.

Введение 1999 год, диссертация по информатике, вычислительной технике и управлению, Аминеддин Фади Рамез

Высокие темпы развития производительных сил, расширение путей реализации различных экономических задач, постоянное увеличение разнообразия потребительных* стоимостей являются характерной чертой XX века для про-мыщленно развитых государств. Это привело во всем мире к возрастанию роли организации и управления (менеджмента) социально- экономическими процессами, что особенно характерно для российской экономики, переживающей переход от нормативных методов управления к рыночным. Такой переход сопровождается экономическими, социальными и политическими потрясениями. Для российской экономики свойственна высокая динамичность социально-экономических процессов с постоянными изменениями их показателей, которые носят случайный характер. В этой ситуации становится актуальным обеспечение высокой эффективности организации и управления в социально-экономических и политических сферах как на горизонтальных уровнях, так и по вертикали. В подобной обстановке успешное управление возможно лишь при наличии моделей, адекватных управляемым объектам, целям и решаемым задачам, информационной обеспеченности и использовании современных информационных технологий. Социально - экономические процессы являются открытыми, относятся к слабоформализуемым системам и подчинены статистическим закономерностям. Поэтому модели управляемых объектов могут быть созданы лишь на основе входных и выходных статистических данных. Обеспечение необходимой адекватности модели, своевременная корректировка в условиях ограниченного объема данных и высокой динамичности сла-боконтролируемой политической, социальной и экономической обстановки возможны только при наличии достаточно надежных методов идентификации социально-экономических систем и их обеспеченности надежной информацией.

В условиях конкуренции получение информации о характеристиках управляемого объекта часто происходит при наличии внешних и внутренних помех, а также применении активных методов защиты информации. Внешние помехи, как правило, определяются условиями добывания информации, внутренние - методами обработки информации. Кроме того, между истинными значениями и результатами измерений характеристик изучаемых процессов существует лишь стохастическая связь, поэтому данные (наблюдения, измерения), являющиеся носителями информации об идентифицируемом объекте, носят вероятностный характер.

Большинство задач управления приходится решать при ограниченных объемах данных и высокой априорной неопределенности о состояниях экономических объектов и закономерностях их изменений. В этих условиях для процессов идентификации характерными являются:

- недостаточность сведений о параметрах и свойствах наблюдаемого объекта;

- - изменчивость вероятностных характеристик измеряемых данных и условий их получения;

- непостоянство количества измерений в различные моменты наблюдений;

- ограниченность объема наблюдений.

К методам идентификации в задачах управления социально-экономическими системами предъявляются жесткие требования, к основным из которых относятся:

- высокие качественные характеристики методов идентификации стохастических объектов (СО);

- устойчивость методов в условиях изменения статистических характеристик наблюдений и помех;

- практическая реализуемость методов с использованием современной вычислительной техники.

Приведенные выше факторы значительно усложняют решение задач идентификации стохастических объектов из- за проблематичности применения известных классических методов математической статистики.

Качество идентификации СО прежде всего определяется вероятностными свойствами объектов управления, адекватностью эталонных описаний объектов, мерами различия и критериями принятия решений.

Если вероятностные характеристики СО не зависят от методов сбора информации, то адекватность эталонных описаний объектов, эффективность мер различения и критериев принятия решений обеспечиваются в процессе моделирования, классификации, обучения. Кроме того, моделирование, классификация, обучение органично включают процесс идентификации.

Из изложенного следует, что современные методы идентификации должны, во-первых, обеспечивать системный подход к решению разнообразных задач статистического анализа; во-вторых, должны быть универсальны, независимы от распределений, устойчивы к изменениям статистических свойств наблюдений, эффективны при относительно малом объеме выборок, просты в реализации.

В настоящее время активно ведутся исследования в области теории идентификации (A.M. Дейч, Н.С. Райбман, В.Я. Катовник, П. Эйкхофф, P.M. Юсупов, А.К. Дмитриев). Основные направления исследований базируются на применении порядковых статистик (Г. Дейвид), ранговых критериев (Я. Гаек), ранговых корреляций (М. Кендел), робастных методов (П. Хьюбер), графических методов анализа (Дж. Тьюки), нетрадиционных методов (Б. Эфрон).

Несмотря на имеющиеся успехи в этих направлениях, разработанные методы не всегда удовлетворяют требованиям практики, особенно при решений задач идентификации форм моделей. В существующих методах идентификации формы моделей выбираются по внешним признакам из ограниченного класса параметрических распределений (аналитических функций) и базируются на узком круге аналитических моделей, носящих в основном теоретический характер. Реальные процессы не всегда укладываются в известные классы моделей. Решение задач идентификации усложняется в условиях ограниченного объема данных, в связи с чем необходимость разработки методов идентификации форм моделей определяется не только требованиями практики, но и недостаточностью их теоретических разработок. Поэтому разработка метода идентификации форм моделей адекватных реальным объектам является актуальной задачей, имеющей важное прикладное и теоретическое значение в социально-экономической сфере.

В качестве объекта исследования в предлагаемой работе определены социально- экономические процессы. Предметом исследования являются методы идентификации слабоформализуемых систем в условиях ограниченного объема данных и высокой априорной неопределенности.

Целью диссертационной работы является разработка метода идентификации форм моделей социально-экономических процессов в задачах управления.

Для достижения поставленной цели решаются следующие основные задачи:

- обоснование метода исследования;

- создание алгоритмов формирования библиотеки приведенных к интервалу [0,1] распределений;

- построение последовательной процедуры формирования статистических индикаторов стохастических объектов (СО);

- разработка алгоритма формирования закона распределения случайных величин с заданными индикаторами;

- исследование квантильных мер рассогласования законов распределения и проведение их сопоставительного анализа с известными мерами;

- разработка способа восстановления формы моделей социально-экономических процессов по статистическим данным;

- разработка алгоритмов и программ, реализующих способ идентификации форм моделей.

Методы исследования базируются на основных положениях теории идентификации, теории мер, теории моделирования, теории вероятностей и математической статистики, теории оценивания и принятия решений.

Научная новизна определяется предложенными способами восстановления форм (структур) моделей по статистическим данным и разработанными мерами рассогласования квантильных функций, основанными на свойствах концептуальной модели представления пар распределений.

К основным теоретическим результатам относятся:

- способы идентификации форм (структур) законов распределения генеральной совокупности по экспериментальным данным в условиях высокой априорной неопределенности, основанные на свойствах приведенных распределений. Предложенные способы не ограничиваются узким классом теоретических распределений, существенно проще и эффективнее известных методов, легко реализуются на ПЭВМ;

- методы идентификации структур моделей экономических процессов, основанные на предложенных способах идентификации форм законов распределения случайных величин;

- меры рассогласования квантильных функций и результаты их сопоставительного анализа с известными мерами;

- последовательная процедура формирования статистических индикаторов при решении задач идентификации форм моделей и результаты исследования качественных характеристик предложенной процедуры.

Основными результатами прикладного характера являются:

- расчетные формулы предложенных способов идентификации форм моделей изучаемых процессов;

- алгоритмическое и программное обеспечение решения сформулированных задач;

- результаты решения прикладной задачи идентификации.

Полученные результаты вносят определенный вклад в математическую статистику, особенно в область непараметрического анализа.

Научная и практическая ценность диссертационной работы заключается в получении новых результатов в задачах идентификации форм (структур) моделей экономических процессов. Разработанные способы формирования аналитических моделей исследуемых объектов не зависят от их физической природы и назначения, что характеризует их универсальность и применимость в различных областях науки и техники. Результаты исследований могут быть использованы в задачах анализа и синтеза систем обнаружения, распознавания.

На защиту выносятся следующие положения:

- методы формирования аналитических моделей законов распределения случайных величин по выборочным данным;

- способы формирования законов распределения случайных величин с заданными индикаторами;

- меры рассогласования квантильных функций и результаты исследования их свойств;

- способы формирования аналитических моделей экономических процессов.

Апробация работы. Результаты работы докладывались и обсуждались на международном симпозиуме «Россия на пороге третьего тысячелетия: единство в многообразии» (г. Курск, 1995), на научно-практической конференции «Современные проблемы естественных наук» (г. Курск, 1998), на 4-ой российской университетско- академической научно-практической конференции (г. Ижевск, 1999), на кафедре информационных систем в экономике КГТУ.

Реализация. Разработанные способы, математические модели, алгоритмы, программное обеспечение апробированы при решении практических задач идентификации восстановления формы и структуры распределения осадков по материалам, полученным из научно- исследовательского центра г. Бейрута Республики Ливан.

Публикации. По материалам диссертации опубликованы 8 работ, в том числе 3 статьи и 5 тезисов докладов.

Структура и объем работы. Диссертационная работа состоит из введения, четырех глав, заключения и приложений, изложена на 141 страницах ос-' новного текста, содержит 40 рисунок, 35 таблиц, библиографический список из 69 наименований.

Заключение диссертация на тему "Разработка метода идентификации форм моделей социально-экономических процессов в задачах управления"

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

В результате исследований разработан метод идентификации форм моделей социально-экономических объектов в задачах управления.

1. Проведен сопоставительный анализ основных задач управления: автоматическими системами, технологическими процессами производства, социально-экономическими процессами. Показано, что при моделировании социально-экономических процессов основополагающими являются методы идентификации.

2. На основе анализа методов идентификации сделан вывод о слабой разработанности методической основы идентификации структур законов распределения вероятностей и форм моделей в задачах регрессионного анализа. В работе предложено в качестве методической основы решения задач идентификации форм модели использовать свойства концептуальной модели представления пар распределений.

3. Разработаны алгоритмы формирования из элементарных функций библиотеки законов распределения вероятностей, приведенных к интервалу [О, 1]. Предложенные процедуры позволяют создать библиотеку параметрических законов распределения (функций), имеющих достаточно простой аналитический вид и широкие возможности по идентификации законов распределений и моделей в задачах регрессионного анализа. Применение приведенных распределений позволяет с достаточно высокой точностью описать различные классы распределений (функций) совокупностью "собственных индикаторов".

4. Исследованы свойства распределений, получаемых в виде композиции двух законов распределения. Применение композиции двух законов распределения позволяет существенно упростить формирование библиотеки классов распределений по заданным "собственным индикаторам", аппроксимирующих выборочные распределения.

5. Метод поиска "собственных индикаторов"одной из аппроксимирующих функций при заданных "собственных индикаторах" - другой. При реше

135 нии задач идентификации статистических наблюдений, заданных совокупностью статистических индикаторов.

6. Предложена последовательная процедура формирования статистических индикаторов, позволяющая в среднем сократить количество экспериментов в задачах идентификации социально-экономических процессов.

7. Разработан метод идентификации форм моделей законов распределения. Он основан на применении "собственных индикаторов" (моментов) приведенных к интервалу [0, 1] распределений. Предложенный подход по сравнению с известными позволяет существенно увеличить адекватность моделей реальным объектам в условиях ограниченного объема данных и высокой априорной неопределенности о форме модели.

8. Применение процедуры линейного преобразования аргумента и функции модели позволило предложить алгоритм идентификации форм моделей в задачах регрессионного анализа: Алгоритм основан на использовании свойств приведенных к интервалу [0,1] распределений.

9. Проведен сопоставительный анализ мер рассогласования в группе функций и плотностей распределения. В каждой группе исследована взаимосвязь мер и выработаны рекомендации по их применению. Предложены новые меры, основанные на квантильных функциях. Показана их предпочтительность при объемах выборок п < 15 по сравнению с мерами рассогласования функции и плотностей распределения.

ЗАКЛЮЧЕНИЕ

Эффективное управление социально-экономическими системами может быть обеспечено только при наличии моделей, достаточно адекватных объектам, целям и задачам управления. Одной из проблем в задачах управления является отсутствие надежных методов идентификации форм моделей социально-экономических процессов в условиях ограниченного объема статистических данных и высокой априорной неопределенности. Исходя из проблемы в качестве цели работы определена разработка методов идентификации форм моделей социально- экономических процессов. Цель достигается путем решения следующих задач:

- обоснование метода исследования;

- создание алгоритмов формирования библиотеки приведенных к интервалу [0,1] распределений;

- построение последовательной процедуры формирования статистических индикаторов стохастических объектов (СО);

- разработка алгоритма формирования закона распределения случайных величин с заданными индикаторами;

- исследование квантильных мер рассогласования законов распределения и проведение их сопоставительного анализа с известными мерами;

- разработка способа восстановления формы моделей социально-экономических процессов по статистическим данным;

- разработка алгоритмов и программ, реализующих способ идентификации форм моделей.

В качестве объектов исследования и управления определены социально-экономические системы (явления, процессы). Рассмотрены проблемы и особенности управления социально-экономическими процессами в переходный период от нормативных методов к рыночным, характерные для России.

Показано, что социально- экономические системы в зависимости от задач и целей управления могут быть представлены в виде следующих подсистем: социальные; экономические; технико-технологические; социо- технологические; технико-экономические; социально-экономические. Сложность социально-экономических процессов требует системного подхода к построению систем управления. В основе системного подхода находится концепция устойчивого развития социально-экономических объектов, которая базируется на принципах: максимальной производительности (социо- технологическая подсистема); оптимальности (технико-экономическая подсистема); стабильности (социально-экономическая подсистема).

Произведен анализ особенностей систем автоматического управления, автоматизированных систем управления и систем управления социально-экономическими процессами. Из анализа следует, что для социально- экономических процессов свойственны, в основном, статистические закономерности, поэтому при моделировании социально- экономических объектов и процессов основополагающими являются методы идентификации.

Проблемы идентификации всесторонне и глубоко изучены в работах A.M. Дейча, Н.С. Райбмана, В.Е. Катовника, Д. Заде, П. Эйкхоффа, P.M. Юсупова, А.К. Дмитриева, И.Г. Уразбахтина, и т.д. Общая схема содержания идентификации представлена на рис. 1.

Входные характеристики модели cp(X0,A) = Y0

Форма модели

Выходные характеристики модели

Вектор параметров модели

Идентификация

Рис 1. Общая схема содержания идентификации. Идентификация сводится к нахождению функции ф и параметров А по входным X и выходным У статистическим характеристикам объекта управления, которые должны обеспечивать минимизацию некоторой функции А срм). Смысл входных и выходных характеристик определяется характером объекта, целями и задачами управления. Функция Д {%, <рм)определяется чаще всего как мера рассогласования функций модели - (рм и реального объекта - %. В связи с тем, что входные - X и выходные - У характеристики носят случайный характер, то и функции (рм, А также будут случайными. Откуда минимизацию случайной величины А можно заменить на максимизацию вероятности

-► Уровень значимости

--> Порог принятия решений

--> Принятое решение

Состояние объекта

Меры рассогласования

Приведенное соотношение характеризует меру адекватности модели реальному объекту и широко используется в практике.

Основной проблемой при решении задач идентификации является определение формы модели и ее параметров. При этом наименее разработанной в теории моделирования является идентификация форм моделей, что и обусловило тему и цель диссертационной работы.

Решение поставленных в работе задач достигается:

• созданием алгоритмов формирования библиотеки, приведенных к интервалу [0,1], распределений с различными "собственными индикаторами";

• построением последовательной процедуры формирования статистических индикаторов, изучаемых вероятностных процессов;

• разработкой способа формирования законов распределения случайных величин с заданными индикаторами;

• разработкой алгоритмов и программ, реализующих способ идентификации форм моделей в задачах регрессионного анализа.

Перечисленные вопросы рассмотрены во второй главе.

В качестве методической основы решения сформулированных задач взята концептуальная модель представления пар распределений, определяемая в виде проекции одной функции распределения (^(х)) на другую (Е^ (х)). Концептуальная модель имеет вид рх,(х) = гх =рг,(гхХ хе [х~,х+]; х2 (х)= ^х2 (^я,1 (гх))= (гх )> е [0,1].

Рассматриваемая модель исследовалась в работах Тарасенко Ф.П., Пету-хова Г.Б., Иган Дж., Уразбахтина И.Г., Уколовой Л.Н. Применение этой модели при решении различных статистических задач анализа и синтеза систем обнаружения, распознавания, идентификации, классификации показало ее высокую эффективность по сравнению с классическими методами, особенно в условиях малого объема выборочных данных и высокой априорной неопределенности о вероятностных характеристиках изучаемых явлений.

В разделах 2.1 и 2.2 приведена аналитическая форма концептуальной модели, методы графического ее представления и основные свойства, к которым относятся: 1) функции Р- (г) и Ц2(г) располагаются в единичной квадратной координатной системе; 2) функция Ц2 (г), спроецированная сама на себя, совпадает с диагональной линией; 3) касательная в любой точке функции (г) равна отношению правдоподобия Щ2(г)/дг= 4Дхг)/%(хг); 4) приведенные к интервалу [0,1] распределения могут быть представлены "собственными индикаторами

- п^Д^ " в пространстве 0' л/м-кбС11^) , к = 1,2,.где шх, соответственно начальный и центральный к-го порядка моменты приведенных распределений, что следует из теорем (Уразбахтин И.Г.).

Теорема 1. В схеме Бернулли, определяемой как эксперимент с двумя случайными исходами г = 1 (успех) с вероятностью р(г = 1) = р, иг = 0 (неудача) с вероятностью р(г) = 1- р,, центральные моменты |!к определяются соотношениями

Икб = р(1-р) [(1-рУ +(-1)кРк"'Ъ к =1,2,. или, учитывая, что для среднего значения тг в схеме Бернулли справедливо равенство т = 1-р+0-(1-р) =р, выражения для И-кб можно представить в виде

Теорема 2. Центральные моменты Ц.кб в схеме Бернулли образуют верхнюю границу для центральных моментов - Щ всевозможных приведенных к интервалу [0,1] распределений, при этом выполняются следующие соотношения:

0<р;<тг(1-шг)[(1-тг)и+(-1) "тГ^НйЮ, к= 1,2,.

В разделе 2.3 предложены процедуры построения приведенных к интервалу [0,1] законов распределения с заданными "собственными индикаторами" , определяемые как совокупность их начального шх и корней к - го порядка от центральных моментов к - го порядка. Процедуры сводятся к формированию законов распределения из элементарных функций следующими методами:

- метод симметрий реализуется путем замены переменных х на у =1 - х, хе [0, 1] в законе распределения 4(х), тогда закон распределения случайной величины у = (1 -х) будет иметь вид: . (у) = ^ (1 - у), у е [0,1 ];

- метод обратных функций основан на том, что ^(х) е [0, 1] и хе [О, 1], тогда ху =Б^(ух)= (у) будет обладать всеми свойствами законов распределения вероятностей;

- метод линейного преобразования функции и аргумента путем следующих преобразований г=а-х+Ь, у^с-ед+а, ге[0,1], что позволяет привести любую функцию к виду, удовлетворяющему свойствам закона распределения вероятностей в интервале 2е[0,1];

- метод композиции приведенных к интервалу [0,1] распределений п п х(у) = Ер^(х)> хе [0, 1], 0<р. <1, ]►>, =1.

1 ¡=1

Предложенные процедуры позволяют создать библиотеку параметрических законов распределений, имеющих достаточно простой аналитический вид и широкие возможности для идентификации распределений.

В разделе 2.4.1 исследованы возможности идентификации статистических распределений с использованием метода композиции двух приведенных распределений по их индикаторам. Индикаторы распределения определяются по заданным индикаторам распределений ^ (х) и (х) соотношениями: щ=aíil=pall+qa2l,

10к = ? £н)ктоСк(Рах,к +яаХ2к)

V Ь»=о где а0К, ос1к,сх2к -начальные моменты распределений 4,(х)> 42(х),

Ц,к~ центральный момент к- го порядка распределения ^(х).

Из приведенных формул получены соотношения для определения возможных индикаторов распределений 4,(х) при заданных индикаторах 4,(х)> позволяющие получать статистические индикаторы аппроксимируемого распределения ^(х). Эти соотношения имеют вид:

Ш2 =(шо-рш1)/я>0)

1 ( « . . Юк = (Иок-Е(-1)!Сир(т0 +ч(т0-ш2)'ц2(кЧ) -pщ2)/q

V ¡=1

В связи с тем, что при идентификации форм моделей часто приходится сталкиваться с трудностями получения статистических данных в силу ограниченности финансовых средств и времени, возникает проблема необходимости сокращения объема экспериментов. Для решения этой проблемы в работе (в раздел 2.5.3) предложена последовательная процедура проведения экспериментов. Формирование статистических индикаторов в последовательной процедуре производится согласно полученным в работе формулам: п.ш, + хп+1 п.апк + х(п+1)к п+1~ п + 1 ' п + 1 мм«)* = о п+1 где Щ п+1 - среднее значение выборочного распределения после (п+1) опыта, х к+! - значение измеряемой величины на (к + 1) эксперименте.

Эксперимент производится до момента выполнения условий 8.

А(п + 1)к т(п + 1)-тп т »

М-)(п + 1)к "" 1(п + 1)к ^ пк | - £цк» где ш п и ш п+1 - значения начального момента соответственно после п-го и (п+1)-го эксперимента,

1ПК и 1(п+1)к - индикаторы центральных моментов к-го порядка соответственно после п-го и (п+1)-го эксперимента.

Предложенная процедура позволяет (в среднем) сократить объем экспериментов при обеспечении заданного качества идентификации, определяемого величинами ега, еик. На рис. 2.20-2.21 представлены примеры последовательной процедуры формирования индикаторов для степенного распределения с параметром с = 0,2 и уровнем качества е цк равен 0,001 и 0,0005

Решение задачи формирования (восстановления) законов распределения случайных величин основано на применении свойств, приведенных к интервалу [0,1] распределений, определяемых теоремами 1 и 2.

Исходя из этих свойств, задача восстановления закона распределения по выборочным данным сводится к следующему:

1. строится вариационный ряд для экспериментальных данных;

2. производится приведение экспериментальных данных к интервалу [О, 1] по формуле х(0= [(1-28) (y(i)-y(I))]/(y(n)-у(1))+ 8, 8= 1/п, где п - объем выборки, i - порядковой номер вариационного ряда;

3. вычисляются начальный - шх и центральные моменты - Цхк;

4. из библиотеки законов распределений выбирается распределение со значениями "собственных индикаторов", геометрически наиболее близких к

РхЛх к=к^х статистическим индикаторам к=1,2,.

Предложенная процедура идентификации законов распределений свободна от недостатков известных методов, в которых выдвижение гипотез осуществляется, во-первых, по внешним признакам выборочных распределений или гистограмм и, во-вторых, из узкого класса теоретических распределений. В предложенном подходе выдвижение гипотезы производится на основе научно обоснованной метрической меры. Качество идентификации (адекватность) возрастает по мере увеличения числа учитываемых индикаторов.

Одним из этапов идентификации является проверка адекватности принимаемой модели реальному объекту, на которой осуществляется обоснование выбираемой меры рассогласования модели и реального объекта. В связи с этим третья глава посвящена исследованию наиболее широко используемые в практике меры рассогласования законов распределения вероятностей. К ним относятся меры рассогласования функций и плотностей распределения, математических ожиданий, параметров распределений, структурных свойств (медианы, моды, симметричности, квантилей и т.д.).

При идентификации форм моделей в практических задачах наибольшее распространение получили:

1. Меры рассогласования функций распределения, которые можно разделить на две группы:

- меры рассогласования, находящиеся в основе статистик, применяемые в критериях Колмогорова- Смирнова и Реньи;

- меры рассогласования, основанные на интегральных «расстояниях». Эти меры находятся в основе статистик, применяемых в критериях Мозеса, Уилкоксона, Манна- Уитни, Пирсона, Крамера - Фон Мизеса- Смирнова, Андерсона - Дарлинга, Кифера - Вольфица.

2. Меры рассогласования плотностей распределения, статистики которых используются в критериях Кульбака, Кейна, Пирсона (Хи - квадрат), Пит-мена, Джефриса - Матуситы, Бхаттачерия.

В работе (раздел 3.2) проведен сопоставительный анализ различных мер в группах мер рассогласования функции и плотностей распределения, показаны взаимосвязи мер в этих группах, дана их интерпретация в концептуальной модели.

Предложены и исследованы меры рассогласования квантильных функций. В концептуальной модели они могут быть представлены в виде мер, аналогичных мерам рассогласования функции и плотностей распределений. В работе показано, что меры различия, основанные на квантильных функциях, зависят от взаимного расположения элементов выборок, в то время как классические методы не чувствительны к этому. Статистическая проверка квантильных мер рассогласования на различных классах распределений показала, что их применение в задачах идентификации форм моделей предпочтительнее при объемах выборки n < 15 .

Четвертая глава посвящена:

• разработке алгоритма идентификации форм моделей применительно к задачам регрессионного анализа;

• экспериментальной проверке методов и алгоритмов идентификации на примере данных ежедневных наблюдений за количеством осадков дождей в течении 15 лет. Данные получены из научно- наблюдательного центра международного аэропорта г. Бейрут (Airport International de Beirut (A.I.B.)).

Алгоритм идентификации форм моделей применительно к задачам регрессионного анализа основан на методах идентификации форм законов распределений вероятностей. Он базируется на использовании линейного преобразования аргумента и элементарных функций. Это позволяет любую модель привести к виду, удовлетворяющему свойствам закона распределения вероятностей в интервале [0, 1], и представить ее с любой точностью "собственными индикаторами". Точность определяется числом учитываемых индикаторов. Алгоритм идентификации сводится к следующему:

- значения х! (входные характеристики) приводятся к интервалу [0, 1] путем линейного преобразования х; =щ +Ь, х; е[0,1];

- значения у; (выходные характеристики), соответствующие аргументам

X; преобразуются по формуле У\ У| + У; }'>

- интервал [0, 1] по оси х разбивается на к участков и подсчитываются средние значения - У ^ величин Упопавших в каждый участок] = 1(1 )к; к

- определяются относительные величины Уj = Уj ^ ; j=l

- строится гистограмма по относительным значениям у -. Полученная гистограмма обладает всеми свойствами плотности распределения вероятностей;

- находятся "статистические индикаторы" для гистограммы;

- из библиотеки классов распределений находится распределение (функция) с наиболее "близкими" значениями "собственных индикаторов" к статистическим индикаторам, вычисленным для гистограммы.

Используя эту методику, в разделе (4.2) была решена задача идентификации распределений количества осадков дождей по декадам декабря месяца за 15 лет.

Предложенный алгоритм показал его более высокую эффективность по сравнению с известными подходами.

Библиография Аминеддин Фади Рамез, диссертация по теме Управление в социальных и экономических системах

1. Айвазян С.А., Мхнтарян B.C. Прикладная статистика и основы эконометрики. М., ЮНИТИ, 1998,1022 с.

2. Большев JI.H., Смирнов И.В. Таблицы математической статистики. М., Наука, 1983, 416 с.

3. Боровков A.A. Математическая статистика. М., Наука, 1984,471 с.

4. Браверман Э.М., Мучник И.Б. Структурные методы обработки эмпирических данных. М., Наука, 1983, 464 с.

5. Брага В.В., Вдовенко JLA. и др. Автоматизированные системы управления предприятиями. Учеб. пособие. М., Финансы и статистика, 1983,263 с.

6. Браунли К.А. Статистическая теория и методология в науке и технике. М., Наука, 1977.

7. Гаек Я., Шидак 3. Теория ранговых критериев. М., Наука, 1971, 375 с.

8. Гринберг A.C., Колосков В.П. и др. Автоматизированные системы управления предприятиями (методы создания). Справочное пособие. М., Энергия, 1978, 224 с.

9. Дейч A.M. Методы идентификации динамических объектов. М., Энергия, 1979.

10. Дейвид Г. Порядковые статистики. М., Наука, 1979, 336 с.

11. Де Гроот М. Оптимальные статистические решения. М., Мир, 1974,491 с.

12. Иган Дж. Теория обнаружения сигналов и анализ рабочих характеристик. М., Наука, 1983,216 с.

13. Катовник В.Я. Непараметрическая идентификация и сглаживание данных: метод локальных аппроксимаций. М., Наука, 1985, 336 с.

14. Кендалл М., Стьюарт А. Теория распределений, М., Наука, 1966.

15. Кендалл М., Стьюарт А. Статистические выводы и связи. М., Наука, 1973,900 с.

16. Кендалл М. Ранговые корреляции. Статистика, М., 1975, 216 с.

17. Кокс Д., Хинкли Д. Теоретическая статистика, М., Мир, 1978,516 с.

18. Косенко Г.Г. Критерии информативности при различении сигналов. М., Радио и связь, 1982, 216 с.

19. Кульбак С. Теория информации и статистика. М.,Наука,1967, 408 с.

20. Леман Э. Проверка статистических гипотез. М., Наука, 1979, 408 с.

21. Мартыщенко Л.А., Панов В.В. Методы военно-научных исследований в задачах разработки и испытания вооружения. Часть 1, МО СССР, 1981, 279 с.

22. Мартыщенко Л.А., Злотников К.А., Кивалов А.Н. Идентификация закона распределения по малой выборке. МО СССР, 1991, 32 с.

23. Мартыщенко Л.А. и др. Проверка гипотез о виде закона распределения по малой выборке. МО СССР, 1989, 34 с.

24. Мексон М., Альберт М., Хедоури Ф. Основы менеджмента. М., Дело, 1998,800с.

25. Научно- прикладной справочник по климату СССР. Серия 3 многолетние данные, выпуск 28, Ленинград Гидрометеоиздат, 1990.

26. Петухов Г.Б., Белоконь Н.К. Методы теории стохастической индикации в исследовании операций и прикладной кибернетике. Л., ВИКИ им. А.Ф. Можайского, 1987, 191 с.

27. Петухов Г.Б. Основы теории эффективности целенаправленных процессов. Часть 1., Л., МО СССР, 1989, 660 с.

28. Питмен Э. Основы теории статистических выводов. М., 1986, 105 с.

29. Райбман Н.С. Что такое идентификация. М., Наука, 1970,с. 121.

30. Репин В.Г.,Тартаковский Г.П. Статистический синтез при априорной неопределенности и адаптация информационных систем. М., Сов.радио, 1977, 432 с.

31. Сейдж Э., Меис Дж. Теория оценивания и ее применение в связи и управлении. М., Свяь, 1976, 496 с.

32. Сейдж Э., Меле Дж. Идентификация систем управления. М., Наука,1974.

33. Смирнов H.B. Теория вероятностей и математической статистики. М., Наука,1970,290 с.

34. Современные методы идентификации систем. Под ред. П. Эйкхоффа. М.,Мир, 1970, 290 с.

35. Соломатин H.A., Дударин А.И. и др. Автоматизированные системы управления предприятиями. М., Экономика, 1985, 248 с.

36. Статистические методы обработки результатов наблюдений. Под ред. Юсупова P.M. Л., МО СССР, 1984, 563 с.

37. Стогний A.A., Каширин Ю.П. и др. Автоматизация информационного обеспе- чения научных исследований. Киев, Наук.думка,1990,296 с.

38. Сыздыков Д.Ж., Юсупов P.M. Идентификация технических объектов. Ротапринт АО НТИЦ "Легпром", Алма-ата, 1994,227 с.

39. Тарасенко Ф.П. Непараметрическая статистика. Томск, ТГУ, 1976, 294 с.

40. Ту. Ю. Современная теория управления. Пер. с англ. Я. Н. Гибадули-на, под ред. Солодовникова B.B. М., Машиностроение, 1971, 472 с.

41. Тьюки Дж. Анализ результатов измерений. М., Мир, 1981, 693 с.

42. Уколова Л.Н. Кандидатская диссертация. Курск, КГТУ, 1996,186 с.

43. Уразбахтин И.Г., Нежметдинов Т.К., Полищук Г.М. Структура построения и исследования моделей сложных систем. //В сб.: Прием и обработка информации в сложных информационных системах. Вып. 16. Казань, КГУ, 1987.

44. Уколова Л.Н. Идентификация слабоформализуемых систем в условиях высокой априорной неопределенности и ограниченного объема данных. Сбр. трудов "Информационная безопасность автоматизированных систем", г. Воронеж, 1998, 81-89 с.

45. Уразбахтин И.Г. Применение рабочих характеристик в задачах классификации ограниченного объема наблюдений. //В сб.: Прием и обработка информации в сложных информационных системах. Вып. 16. Казань, КГУ, 1987.

46. Уразбахтин И.Г. Структурные методы оценивания близости законов распределения на основе анализа рабочих характеристик. //В сб.: Прием и обработка информации в сложных информационных системах. Вып. 16. Казань, КГУД987.

47. Уразбахтин И.Г. Характеристики связности линейных непараметрических статистик. //В сб.: Прием и обработка информации в сложных информационных системах. Вып. 18. Казань, КГУ,1990.

48. Уразбахтин И.Г., Основные принципы моделирования сложных систем. Ближайшие Марковские модели.//В сб.: Прием и обработка информации в сложных информационных системах. Вып. 14. Казань, КГУ, 1984.

49. Уразбахтин И.Г. Концептуальные основы современного менеджмента. //Материалы международной школы семинара БИКАМАП-99, Санкт- Петербург, 1999.

50. Уразбахтин И.Г., Уколова JT.H. Основы идентификации в социально-экономических процессах. Курск, КГТИ, 1998, 180 с.

51. Уразбахтин И.Г., Уколова J1.H. Статистики мер рассогласования плотностей распределения в задачах обработки экологических данных,//Сб. материалов науч.- практ. конференции по экологии, Курск, 1998.

52. Уразбахтин И.Г., Уколова Л.Н., Аминеддин Ф.Р. Формирование событий для расчета распределений статистик, //Труды Международного симпозиума, часть 2, Курск: КТГУД995. с.64-67.

53. Уразбахтин И.Г., Уколова, Л.Н., Аминеддин Ф.Р. Меры рассогласования квантильных функций, // Современные проблемы естественных наук. сб. науч. тр. Курск : КГТИ, Курский объединенный центр РАМ, РАЕН, МАИ, КГТУ, КГМУ, 1998.- с. 230-233.

54. Urazbakhtin I. G., Ukolova L.N., Amineeddin F.R. Identification of the distribution by the method of reduced law// The Egyptian statistical journal Institute of statistical, № 2, 1999.

55. Уразбахтин И.Г., Уколова, Л.Н., Аминеддин Ф.Р. Меры рассогласования законов распределения вероятностей и их концептуальные модели// Известия, науч. изд., № 2, КГТУ, 1998. с. 46-55.

56. Уразбахтин И.Г., Уколова, Л.Н., Аминеддин Ф.Р. Критерий оценки адекватности моделей на основе кодирования// Тез. докл. 4-ой российской уни-верситетско-академической научно-практической конф. Ижевск: УГУ, 1999.

57. Уразбахтин И.Г., Уколова, Л.Н., Аминеддин Ф.Р. Синтез приведенных законов распределений вероятностей с заданными свойствами // Известия, науч. изд., № 3, КГТУ, 1999.

58. Фомин Я.А., Тарловский Г.Р. Статистическая теория распознавания образов. М., Радио и связь, 1986. 264 с.

59. Хастингс И., Пикок Дж. Справочник по статистическим распределениям. М., Статистика, 1980, 95 с.

60. Хеттманспергер X. Статистические выводы, основанные на рангах. М., Финансы и статистика, 1987, 334 с.

61. Химмельблау Д. Анализ процессов статистическими методами. М.,Мир,1973, 957 с.

62. Цыпкин Я.З. Информационная теория идентификация. М., Наука, Физмат, 1985, 336 с.

63. Цыпкин Я.З. Основы теории автоматических систем. М., Наука, 1977,560 с.

64. Эйкхофф П. Основы идентификации систем управления. Под ред. Райбмана Н.С.М., Мир, 1975. 690 с.

65. Четвериков В.Н., Воробьев Г.Н. и др. Автоматизированные системы управления предприятиями. Учеб. для вузов. М., Высш. школа, 1979, 303 с.141

66. Аминеддин Ф.Р. Методы формирования законов распределения с заданными свойствами// Тез. докл. 4-ой российской университетско- академической научно-практической конф. Ижевск: УГУ, 1999.

67. Юсупов P.M., Дмитриев А.К. Идентификация техническая диагностика. МО СССР, 1987, 521 с.

68. Новицкий П.В., Зогроф И.А. Оценка погрешностей результатов измерений. JL, Энергоатомиздат, ленинградское отделение, 1985, 248 с.