автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.10, диссертация на тему:Методы повышения качества первичной обработки экспериментальных данных в задачах управления социально-экономическими системами

кандидата технических наук
Уразбахтин, Альберт Ильдусович
город
Курск
год
2007
специальность ВАК РФ
05.13.10
Диссертация по информатике, вычислительной технике и управлению на тему «Методы повышения качества первичной обработки экспериментальных данных в задачах управления социально-экономическими системами»

Автореферат диссертации по теме "Методы повышения качества первичной обработки экспериментальных данных в задачах управления социально-экономическими системами"



На правах рукописи

Уразбахтин Альберт Ильдусович

МЕТОДЫ ПОВЫШЕНИЯ КАЧЕСТВА ПЕРВИЧНОЙ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ В ЗАДАЧАХ УПРАВЛЕНИЯ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИМИ СИСТЕМАМИ

Специальность 05.13.10 - управление в социальных и экономических

системах

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

003064893

КУРСК-2007

003064893

Работа выполнена в ФГУП «Курский НИИ МО РФ», Курском государственном техническом университете

Научный руководитель доктор технических наук,

профессор Мирталибов Т А

Официальные оппоненты доктор технических наук,

профессор Довгаль В М

кандидат технических наук, Леонов Е И

Ведущая организация. Орловский государственный технический

университет

Защита состоится « 29 » мая 2007 г в 16.00 на заседании диссертационного совета

Д 212.105 02 в Курском государственном техническом университете по адресу 305040, г Курск, 50 лет Октября 94, конференц-зал.

■ .-Заверенные отзывы на автореферат просьба направлять в двух экземплярах по адресу305040, г Курск, 50 лет Октября 94, ученому секретарю диссертационного совета Д 212 105 02

С диссертацией можно ознакомиться в библиотеке Курск ГТУ

Автореферат разослан «28» апреля 2007 г

Ученый секретарь, кандидат технических наук

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. Как и во многих областях науки и техники в системах социально-экономической природы, принятие управленческих решений основано, как правило, на статистических данных Наиболее характерными являются следующие задачи

• идентификация - разработка моделей исследуемых объектов (процессов, явлений) по статистическим данным,

• классификация - разделение изучаемой совокупности объектов (процессов, явлений) на однородные, в некотором смысле, взаимоисключающие физически или статистически различимые группы;

• выявление и исследование зависимостей между факторами, описывающими исследуемый объект,

• понижение объема факторов, описывающих объекты;

• распознавание (обнаружение) - отнесение каждого из заданного множества объектов, представленных в виде совокупности наблюдений, к одному из заранее известных классов

Решению перечисленных задач посвящено большое количество как фундаментальных, так и прикладных научно технических работ по эконометрике и социометрике в проекции на прикладную статистику

При этом качество идентификации, классификации, распознавания (обнаружения), во многом определяется качеством и объемом исходной информации, а также методами, приемами и критериями принятия решения

Выполнение названных задач часто происходит при наличии внешних и внутренних помех Внешние помехи, как правило, определяются условиями получения информации, внутренние - методами обработки информации Наличие помех и неучтенных воздействий ведет к несовпадению между истинными значениями и результатами измерения характеристик изучаемых процессов, поэтому данные (наблюдения, измерения) носят, преимущественно, вероятностный характер

Большинство статистических задач в системах управления решаются при ограниченных объемах данных (обусловленных либо сложностью получения данных, либо высокой динамичностью изучаемых явлений) и высокой априорной неопределённости о состояниях исследуемых объектов (явлений, процессов) В этих условиях при решении статистических задач характерными являются-

а) недостаточность сведений о параметрах и свойствах наблюдаемого объекта, что ограничивается независимостью и одинаковой распределенностью измерений,

б) необоснованные предположения о характере выборочных данных

- исследуемая генеральная совокупность принимается однородной,

- выборка считается репрезентативной,

в) изменчивость условий получения данных,

г) непостоянство количества измерений в различные моменты времени,

д) ограниченность объёма наблюдений

Перечисленные факторы существенно усложняют решение статистических задач из-за проблематичности применения известных классических методов математической статистики, фундаментальные результаты которых относятся, в основном, к асимптотическим свойствам распределений и моделям

экспоненциального типа (или распределений, порожденных нормальным распределением) и основанным на них критериям

К важнейшим требованиям, предъявляемым к методам статистического анализа, относятся

• высокие качественные характеристики,

• устойчивость применяемых методов в условиях изменения статистических характеристик, исследуемых объектов и помех,

• практическая реализуемость методов

Качество решения статистических задач, прежде всего, определяется

• вероятностными свойствами изучаемых явлений (объектов),

• адекватностью эталонных описаний объектам, задачам и целям их решения,

• мерами различия между объектами и критериями их различения

Особое место в обеспечении качества решения статистических задач занимает качество используемой информации Это, прежде всего, однородность и репрезентативность исследуемых данных К сожалению, как в теории, так и на практике, однородность и репрезентативность экспериментальных данных принимается как само собой разумеющимися

Даже в тех случаях, когда осуществляется проверка однородности, она сводится к проверке соответствия выборочных данных нормальному или априорно заданному закону, лишь бы совпадали некоторые числовые характеристики или параметры, что, в общем, сводится к решению задачи оценивания репрезентативности выборки

Из изложенного следует, что современные методы решения статистических задач должны обеспечивать системный подход к решению разнообразных задач статистического анализа (начиная с постановки эксперимента, первичной обработки данных и завершая принятием решений) и быть

• универсальными, независимыми от форм (классов) распределений,

• устойчивыми к изменениям статистических свойств наблюдений,

• чувствительными к структурным изменениям вероятностных характеристик наблюдаемых характеристик,

• эффективными при относительно малом объеме выборки, просты в реализации

В настоящее время известны фундаментальные исследования в области теории и

практики идентификации (АМ Дейч, НС. Райбман, В Я Катовник, П Эйкхофф, Р М Юсупов, А.К Дмитриев и др), прикладной статистики (С А Айвазян Т Химмельблау), методов статистического анализа, отличных от классических (Г Дейвид - порядковые статистики, Я Гаек, 3 Шидак - ранговые критерии, М Кендел - ранговые корреляции, П Хьюбер - робастные методы, Дж Тьюки -графические методы анализа, Б Эфрон - нетрадиционные методы, Дж Иган, Ф П , Тарасенко, Г.Б Петухов- методы теории стохастической индикации и т д).

Несмотря на имеющиеся успехи в этих направлениях, разработанные методы не всегда удовлетворяют требованиям практики Объективная реальность часто выдвигает условия, когда о свойствах наблюдений априорно известны минимальные сведения, которые ограничиваются

• однородностью,

• репрезентативностью,

• случайностью,

• независимостью

При этом первые два условия требуют научного обоснования Это обусловливает противоречия между требованием качественного решения задач прикладной статистики и качеством используемой информации

Основная решаемая задача данной диссертации заключается в модификации известных и создании новых инструментальных средств первичной обработки экспериментальных данных в контурах управления социально экономических систем

Таким образом, разработка методов оценивания однородной репрезентативности выборки, позволяющих обосновать однородности исследуемых генеральных совокупностей, является актуальной как в теоретическом, так и в практическом аспектах

Диссертационная программа выполнялась в рамках научно-технической программы «Притирка-2-И-К » Курского государственного технического университета, утвержденной Министерством образования и науки РФ

Объектом исследования являются экспериментальные данные для решения задач идентификации, классификации, распознавания (обучения), использующиеся в контурах управления социально-экономическими объектами

К предмету исследования диссертационной работы относятся методы, алгоритмы и программные средства оценивания однородной репрезентативности выборки из генеральной совокупности и их приложения в практических задачах управления в рассматриваемой сфере

Цель настоящей работы сводится к повышению качества первичной обработки данных для решения задач прикладной статистики путем создания методов, алгоритмов и программных средств, объединенных в автоматизированную подсистему первичной обработки данных, являющуюся неотъемлемой частью систем управления социально-экономическими системами

Задачи диссертационной работы

• разработка концептуальной модели распределений случайных величин, определённых в ограниченном интервале, и исследование ее свойств,

• определение однородной генеральной совокупности и разработка методов, алгоритмов оценивания однородности и репрезентативности выборочных данных и параметров исследуемой однородной генеральной совокупности,

• разработка метода снижения погрешности определения параметров однородной генеральной совокупности по выборочным данным из нее,

• разработка метода цензурирования выборочных данных и метода обнаружения изменения свойств случайных процессов по выборочным данным (задача о «разладке»),

• разработка автоматизированной подсистемы первичной обработки выборочных данных в задачах прикладной статистики

Методы исследования базируются на основных положениях теории вероятностей, математической статистики, прикладной статистики, системного анализа, теоретического и прикладного программирования, теории алгоритмов и теории управления

Научная новизна определяется разработкой теоретических положений и методов повышения качества предварительной обработки выборочных данных в прикладных задачах статистического анализа Разработанные методы опираются на свойства концептуальных моделей вероятностных распределений, определенных в

ограниченном интервале, а также на свойства однородных распределений (генеральных совокупностей)

К основным теоретическим результатам, полученным в диссертационной работе, относятся

• модель представления вероятностных распределений, заданных в ограниченном интервале, и ее свойства, в виде совокупности собственных индикаторов, что позволяет создать основу для разработки средств первичной обработки данных;

• определение однородной генеральной совокупности в виде одномодального распределения случайных величин, у которого модули отклонений от среднего значения распределений не существенно отличаются по заданной мере близости от распределения Бернулли,

• модифицированный метод и алгоритм оценивания однородной репрезентативности выборочных данных из генеральной совокупности;

• обобщенный метод и алгоритм определения характеристик генеральной совокупности, при условии, что она однородна,

• метод снижения погрешностей оценок параметра однородной генеральной совокупности с использованием «дополнительных данных»

К основным результатам прикладного характера, базирующимся на разработанных в диссертации теоретических положений, относятся

• модель взаимосвязи и взаимообусловленности основных задач прикладной статистики,

• методы

- цензурирования выборочных данных,

- определения момента изменения структурных характеристик однородной генеральной совокупности (в задачах о «разладке»),

• рекомендации по применению коэффициента вариации в статистически?: исследованиях,

•структура и функция автоматизированной подсистемы предварительного анализа статистических данных

На защиту выносятся:

1) модель взаимосвязи и взаимообусловленности задач математической статистики, а также модели вероятностных распределений, определённых в ограниченном интервале и их свойства, позволяющие существенно расширить круг решаемых задач прикладной статистики,

2) модифицированный метод и алгоритм оценки однородной репрезентативной ограниченной выборки из однородной генеральной совокупности, что позволило сформулировать корректные рекомендации по использованию коэффициента вариации в задачах прикладной статистики,

3) методика, позволяющая исключить существующие ограничения на объем выборок, и разработанный на ее основе логически и практически состоятельный, обобщенный алгоритм определения параметров однородной генеральной совокупности;

4) метод формирования условно-дополнительных данных для снижения погрешности определений характеристик однородной генеральной совокупности по выборочным наблюдениям, а также методы решения прикладных задач

• цензурирования данных,

• обнаружения момента изменения структурных характеристик однородных совокупностей (задача о «разладке»), 5) структура и функции автоматизированной подсистемы предварительного статистического анализа выборочных данных системы управления и результаты решения практически важных задач

Апробация работы. Результаты работы докладывались и обсуждались на заседании кафедры ИСЭ КГТУ и международной конференции молодых ученых г Сочи, 2.004, 2006 гг, Международном симпозиуме России, г Курск, 1995 г

Реализация. Разработанные теоретические положения, методы и алгоритмы апробированы при решении конкретных задач и внедрены в учебный процесс в Курском государственном техническом университете, Гуманитарно-техническом институте (г Курск) и реализованы в виде пакета прикладных программ

Публикации По материалам диссертации опубликовано 15 работ в том числе 11 статей (из них 9 в журналах, рекомендованных ВАК) и 4 тезиса докладов на международных конференциях

Личный вклад автора Лично автору принадлежит 90% научных и практических результатов диссертации

Структура и объем работы Диссертационная работа состоит из введения, четырех глав, заключения и приложений, изложена на 140 страницах основного текста, содержит 43 рисунка, 22 таблицы, библиографический список состоит из 99 наименований

Содержание диссертации Во введении обоснована актуальность темы; сформулированы цель и основные задачи исследования, изложена научная новизна и практическая ценность полученных результатов, приведены основные положения, выносимые на защиту

В первой главе проведен анализ проблем управления социально экономическими системами, происходящими в условиях еще не сложившейся рыночной экономики, которая подвержена разного рода внешним и внутренним, как правило, негативным, слабо контролируемым и высоко динамичным влияниям Эти влияния зависят от разных факторов внешне- и внутриполитических, социальных, межэтнических отношений, географических, уровня отчислений на развитие и воспроизводство в различных отраслях экономики, политической активности различных слоев населения, демографических условий, существующих монополий в экономике и т д Успешное управление социально-экономическими системами (СЭС) в названых условиях возможно лишь на основе ограниченного объема данных, получаемых при высокой неопределенности Последнее обусловливает необходимость применения в управлении СЭС высокоэффективных методов решения статистических задач в рамках прикладной статистики, являющейся связующим звеном между теоретическими положениями теории вероятностей и математической статистики и реализуемыми на современных информационных системах, а также в прикладных задачах управления СЭС

В диссертации была разработана модель взаимосвязи и взаимообусловленности основных задач прикладной статистики планирование эксперимента, первичная обработка данных; идентификация; определение связи между различными факторами исследуемых систем; снижение размерности измеряемых факторов, классификация объектов, разработка мер и критериев различения классов объектов (рис 1) Анализ

состояния методов решения перечисленных задач прикладной статистики показал, что не достаточно разработанными, как теоретически, так и практически, являются методы первичной обработки данных, в то время как качество решения всех остальных задач прикладной статистики полностью определяется качеством решения задач предварительной обработки экспериментальных данных Исходя из этого, были сформулированы тема, цель и задачи исследования

Экспериментальные данные

Латентаые-/Л{у,°'У//)|г J=\(\)m Пассивные — \уу ^ J = 1(1 )т Активные - (О^ 3

"Объект-факторы"

Объекты- feí},„ 1 = \(\)т Факторы- {ьуСД, • ~\(\)п1

Варианты

2 3 4

т 1 1 >1 >1 1 — сот г

nJ >1 1 >1 ( Ф сот г

Помехи

Планирование эксперимента

Идентификация объектов

"Го1

Управление Мониторинг

мониторингом

Первичный анализ

данных {у™?*)^

Случайность

Независимость

Репрезентативность

Однородность

Классификация объектов (методы)

Комбинационная группировка

Дискриминационный анализ (с учителем)

Расщепление смесей (без учителя)

Кластер - анализ (без учителя)

Снижение размерности объема признаков

Метод главных компонент

Факторный анализ

Эвристические методы

Разработка мер и критериев различения объектов

Анализ зависимости

признаков

Регрессионный

Дисперсионный

Корреляционный

Ковариационный

Латентный

Распознавание объектов (входные данные)

Экспериментальные данные

Классы объектов

Меры различия

Критерии

Рис. 1 Модель взаимосвязи и взаимообусловленности основных задач прикладной

статистики

Таким образом, решена первая задача диссертационного исследования и соответственно раскрыта сущность первого защищаемого положения

Во второй главе разработана теоретическая основа анализа структурных свойств выборочных статистических совокупностей на базе структурных свойств распределений Бернулли, определенных в ограниченном интервале [у,У] Необходимость рассмотрения распределений в ограниченных интервалах объясняется одним из важнейших требований проведения любого сравнительного анализа различных объектов (что является доминирующим в прикладной статистике) - это обеспечение одинаковых методов и условий их исследований Так как линейное преобразование х = ау + Ь не меняет класса распределений у, то путем использования этого преобразования любые сравниваемые статистические совокупности могут быть приведены в один и тот же интервал [х ~,х ] без изменения своих структурных свойств При этом как с теоретической, так и с практической точки зрения наиболее целесообразным является интервал [0,1] Выбор этого интервала также связан с классическим распределением Бернулли, которое формулируется как Р^х=х'У=0, Ре(х=х г)=\, его центральные моменты имеют вид

Мкб = РО -РЖ 1 - Р)к~х + (-1)кРк~1],к = 2,3

Центральные моменты обобщенного распределения Бернулли

^о(у=У)=0,Рда(у=/)=1

определяются соотношением

Мкбо = ИКБ - У'У , ¿=2,3, .,

где ркв- центральные моменты классического распределения Бернулли

Доказана важная как для теории, так и для практики прикладной статистки теорема о соотношении центральных моментов распределений и статистических совокупностей, определенных в ограниченном интервале (что является основой структурного анализа их свойств) с соответствующими моментами распределений Бернулли Моменты всевозможных распределений вероятностей и статистических совокупностей, заданных в интервале \у, у4], ограничены снизу «0», а сверху - центральными моментами распределения Бернулли

0<Мку < Р(1 - Р )[( 1 - Р )к~1 + (-1)" Р"-1 ]( у+ - у~ ),-к = 2,3 ,

где Р=а1х (параметр Р совпадает со средним значением распределения вероятностей и статистических совокупностей)

Исследованы функции чувств игеяьностсй

дню / дР = (I- Р )к~1(1- Р(\+ к)) + (-\)к [к ~(\ + к)Р ], ¿ = 1,2, ,

которые показали, *гго статистические критерии для ассиметричных распределений в задачах идентификации, классификации, распознавания (обнаружения) должны строиться на старших центральных моментах.

Вышеназванные свойства позволяют по-новому решать задачи прикладной статистики

- идентификации законов распределений по выборочным данным;

- формировать законы распределений с заданными моментами из элементарных функций,

- проводить сопоставительный, структурный анализ различных классов распределений,

- оценивать взаимную неопределённость различных мер рассогласования распределений вероятностей и статистических совокупностей.

Исследованы возможности коэффициента вариации, широко используемого при анализе структурных свойств статистических совокупностей Доказано, что информативность коэффициента вариации при исследовании структурных свойств распределений вероятностей (следовательно, и статистических выборок) определяется только при анализе распределений в одном и том же интервале [уу +]. Установлено, что коэффициенты вариации распределений, приведенных к интервалу [0,1], ограничены снизу «0», а сверху - значением коэффициента вариации распределения Бернулли с параметром, равным первому начальному моменту исследуемого распределения

О < Ух <, Р/Р'Р = € f0.lj.xe [ОДУ .

Фундаментальными в прикладной статистике являются свойства репрезентативности и однородности выборок Обеспечение репрезентативности и однородности выборок из генеральной совокупности в статистических исследованиях является неукоснительным требованием Однако в практических задачах однородность и репрезентативность считаются само собой разумеющимися Если содержательно репрезентативность исследователями понимается одинаково, то единого мнения по определению однородности не существует В работе развиваются идеи «однородности», принадлежащие В Швыркову, А. Лексису, С .Айвазяну, Н. Фишеру, и сформулировано определение однородной генеральной совокупности (ОГС)

Определение Распределение вероятностей (Генеральная совокупность) называется однородной, если оно является одномодалнным, а модули отклонений случайных величин которого от среднего значения исследуемого распределения (ГС) не существенно (не значимо) отличаются от распределения Бернулли.

п-к

Несущественность означает выполнение условий 0,5 (выборка

репрезентативна) и Схш — 0,5 (выборка однородна), где С^ж ~~ коэффициент сходства экспериментальных и теоретических значений (ЭЗР и ТЗР соответственно) выборки {у,}„ из генеральной совокупности

(-¿Ргу) Рг. !=1

{И}п - экспериментальные значения репрезентативности выборки (ЭЗР)

о, = / = 1 (\)п. если х < 0,5,

(\-х)-тт\х1 -хЦ

Ч = <

х — рс — X

и = ——-Ц-^¡т, / = 1(1 )п, если х > 0,5,

х-тт\х1-х\)

X, =

у, ~ mm {у, }„ max (у, }„ - mm

ш.

се, =

{се,}п — теоретические значения репрезентативности выборки (ТЗР)

[О, при 0 < V, 20,5, [1, при 0,5<у, <1.

Приведенные формулы для вычисления V, являются модификацией метода, предложенного В. Швырковым

' -к \

j —pi 5 дляасимметритых распределений,

ы

j -pi ¡¡ля симметричных распределений

Анализ рассматриваемого подхода показывает, что он основан на сопоставлении структурных свойств распределений ЭЗР и Бернулли, который раскрывает сущность оценивания репрезентативности и однородности исследуемой выборки, что достаточно просто визуализируется на мониторе компьютера

Исходя из определения ОГС и идей вычисления параметров ОГС по характеристикам ЭЗР и ТЗР исследуемой выборки (при выполнении условий репрезентативной однородности) разработана общая формула и алгоритм, не зависящего от объема выборки п = 4 j расчета возможных значений параметров ОГС

-Pre J

Р„в - 2gi7+ <l-± 1 -7>CJ2--Kixn-c),

™ 2(v( A + В ) + (\ — v)C

где A+B+0=n, (A+B)/n < 0,5, (A+B) - число значений се,=0; С - число значений ге,=1,

V « X v/ 7« /-1

Из множества Pre (В) в в качестве параметра ГС выбирается тот, который будет отвечать условию Р*гс = mirt{[kcY - ксвФ')]}, где ксг , %сб(В) - коэффициент асимметрии исследуемой выборки и распределения Бернулли с параметром Рге(В). На рисунках 2 и 3 представлены соответственно алгоритм проверки однородной репрезентативности выборки {у,}» и алгоритм вычисления параметра однородной генеральной совокупности рК.

Полученные результаты во второй главе образуют теоретическую основу повышения качества решения задач прикладной статистики, в особенности, в повышении надежности экспериментальных данных на начальных стадиях её обработки (обоснование репрезентативности и однородности выборки).

Таким образом, во второй главе решены вторая и третья задачи диссертации и отражено содержание второго защищаемого положения.

В третьей главе разработана обобщенная схема идентификации ОГС по ограниченной выборке Здесь предполагается, что известен параметр априори По полученным экспериментальным данным либо подтверждается однородность исследуемой ОГС, либо получают информацию о наличии «мешающих» факторов, влияющих на полученные данные Такими факторами могут быть внешние -неконтролируемые или внутренние, когда нарушены условия проведения эксперимента Разработаны две схемы (алгоритма) анализа экспериментальных данных - для статистических и динамических ОГС.(рис. 4,5).

а) при условии статистической ОГС, если ее однородность не подтверждается или вычисленный параметр - Ргс не будет отвечать заданному уровню значимости по отношению априорно известного параметра, производится коррекция условий экспериментирования,

б) для динамической ОГС, если данные, полученные в интервале \t,,t,+A\, не будут отвечать требованиям однородности ОГС, то делается вывод о возможной "разладке" исследуемого процесса

Методика оценки ОГС предполагает, что объем анализируемой выборки и должен быть кратным 4, то есть n=4j, j=l,2 Однако в реальности это условие не всегда выполняется, тогда могут возникнуть «дополнительные» данные, число которых может меняться от 1 до 3 В этом случае появляется возможность использования их для повышения качества оценивания (уменьшение погрешности) параметра ОГС путем расширения пространства возможных оценок

N = СУ~к) = (4 j + к) ' /((4j) 'к'), к= 1,2,3 Далее оценивается репрезентативная однородность каждой из этих выборок Если все выборки окажутся репрезентативно однородными, то определяются для каждой выборки значения параметров {Ргд}ы,, и для них вычисляется среднее значение, либо применяется проверка однородности множества {Pxj}m с последующим оцениванием его обобщенного параметра В случае, если не все N выборок будут отвечать условиям репрезентативности необходимо перейти к решению задач цензурирования или расщепления ГС на однородные группы Экспериментальная проверка метода показала, что погрешность оценки Pre с использованием методики формирования «дополнительных» данных из ГС, увеличивающее число анализируемых комбинаций данных этой ГС, уменьшается более чем в два раза

Разработан метод оптимального обнаружения и исключения (цензурирования) аномальных данных из совокупности экспериментальных измерений Процедура цензурирования основана на исключении элементов из выборки, нарушающих ее однородность Рассмотрим два принципа цензурирования

1) принцип обеспечения максимального сходства однородности (max Сх) ГС. При наличии нескольких альтернативных вариантов цензурированных выборок с одинаковыми значениями максимального сходства однородности, выбирается комбинация с наименьшей дисперсией- ц1ГС ;

Г Ввод {у,}„

Выборка {у/} однородна репрезента тивиа

Рис. 2 Алгоритм проверки однородной репрезентативности выборки {у1}п

Рис 3 Алгоритм вычисления параметра однородной генеральной совокупности Ргс

Рис 4 Обобщенная схема алгоритма анализа статической, однородной генеральной совокупности

Рис 5 Обобщенная схема алгоритма анализа динамической, однородной генеральной совокупности

2) принцип обеспечения минимума расхождения параметра Р/с .вычисленного по ыборке{у,}„ с ее средним значением у = /п. При существовании нескольких

онкурирующих вариантов с динамическими расхождениями Ргс - у выбирается ензурированная выборка с минимальной дисперсией рггс

Из рассмотренных двух принципов цензурирования второй является более редпочтительным, обеспечивающим наибольшее сходство исследуемой выборки с ее оделью в однородном процессе Ошибки цензурирования, базирующееся на принципе инимума расхождения параметра Ргс, ниже не менее чем в 15 раз по отношению к ринципу максимального сходства однородности ГС

Сформулированные процедуры цензурирования являются конструктивными и в тличие от известных подходов, опирающихся на интуицию и субъективные выводы сследователя, базируются на научных положениях Разработанный метод реализован в иде алгоритма и программного продукта В третьей главе решены третья и четвертая задачи диссертации и раскрыта сущность ретьего и четвертого защищаемых положений

В четвертой главе приводятся структура и функции автоматизированной подсистемы ервичной обработки выборочных данных, краткие характеристики современных ехнологий программирования и обоснован выбор технологии NET и языка рограммирования Выбор технологии основан- на одном из самых важных отличий сборок NET от двоичных файлов серверов СОМ и любых других исполняемых файлов Win32, заключающемся в том, что сборки NET содержат не платформенно-зависимые инструкции, а код на так называемом промежуточном языке Microsoft (Microsoft Intermediate Language, MSIL или просто IL) Этот язык не зависит ни от платформы, ни от типа центрального процессора Код IL компилируется в платформенно-зависимые инструкции только во время выполнения Промежуточный код, находящийся в исполняемом файле CLR, называют управляемым одом (managed code, под управлением), а непосредственно машинный код, находящийся в секции кода обычного исполняемого файла, называют неуправляемым кодом (unmanaged code),

- на том, что в настоящее время различные государственные организации и страны используют платформы, отличные от Windows, к примеру платформу Linux, а приложения NET потенциально выполняются на различных платформах и на компьютерах с самыми разными центральными процессорами

Язык программирования С# специально был разработан Microsoft для платформы NET Синтаксические конструкции С# унаследованы не только от С++, но и от Visual Basic Например, в С#, как и в Visual Basic, используются свойства классов Как С++, С# позволяет производить перегрузку операторов для созданных программистом типов (Java не поддерживает ни ту, ни другую возможность) С# — это фактически гибрид разных языков. При этом С# синтаксически не менее (если не более) чист, чем Java, так же прост, как Visual Basic, и обладает практически той же мощью и гибкостью, что и С++ Самой важной особенностью языка С#, является то, что он генерирует код,

предназначенный для выполнения только в среде выполнения NET, но в то же время он практичнее и вбирает в себя самые лучшие возможности остальных языков

В' диссертационной работе разработана программное приложение, реализующее методы и алгоритмы первичной обработки выборочных данных из однородных генеральных совокупностей и их смесей

• вычисления центральных моментов распределения Бернулли,

• оценивания репрезентативности и однородности выборочных данных из исследуемой ГС,

• вычисления параметра однородной ГС по однородно-репрезентативной выборке из нее объема - п,

• идентификации априорно известной однородной ГС (статической и динамической) по ограниченному объему экспериментальных данных,

• снижения погрешности определения параметров однородных генеральных условий за счет применения «дополнительных» данных,

• оптимального обнаружения и исключения аномальных наблюдений из исследуемой совокупности экспериментальных данных

Программное приложение представляет собой совокупность модулей, позволяющих вводить, хранить и удалять данные, осуществлять расчеты, отображать их результаты с помощью аналитических графиков, таблиц результатов, и обеспечивает их хранение и вывод на печать

Интерфейс программного приложения позволяет пользователю с минимальным знанием практической работы на ПЭВМ в удобной и максимально информативной форме анализировать промежуточные и окончательные результаты расчетов, и при необходимости оперативно вводить изменения

В данной главе решена пятая задача диссертационной работы изложены особенности пятого защищаемого положения

Основные выводы и результаты работы:

1 Исходя из анализа современного состояния вероятностно-статистических методов и их использования в управлении в различных областях науки и техники, в том числе социально-экономических систем (СЭС), показаны роль, место и особенности задач прикладной статистики Разработана структурная модель взаимосвязи и взаимообусловленности основных задач прикладной статистики

- планирование эксперимента,

- первичный анализ экспериментальных данных, исследование связей между различными факторами исследуемых систем,

- идентификация, классификация, понижение размерности объема признаков описания объектов,

- разработка мер и критериев различения объектов

'Задачи первичной обработки экспериментальных данных, а именно обоснование однородности, репрезентативности, а также цензурирование данных являются недостаточно разработанными как теоретически, так и практически, хотя они в первую очередь определяют качество решения задач прикладной статистики при управлении 1 объектами (СЭС)

2 Исследованы структурные свойства (начальный и центральные моменты) и их связи для распределений Бернулли, определенных в пространствах [у'.у*] и [од]. Получены

отношения для вычисления центральных моментов распределений Полученные отношения и их связи образуют теоретическую базу решения задач повышения ачества первичной обработки экспериментальных данных социально-экономического арактера

3 Доказаны теоремы об ограниченности для любых распределений, приведенных к нтервалу [0,1] - значений начального момента интервалом [ОД], центральных моментов нтервалами основанные на следующих положениях

а) значения факторов реально существующих объектов определяются в ограниченных ространствах {у',у+ ],

б) если для значений у заданы интервалы принадлежности со<у<у\-ао<у<оо,у'<у<оо, то для этих значений существуют ограничения, пределяемые любым наперед заданным уровнем значимости а,

в) линейное преобразование случайных величин х=ау+Ь не меняет распределений юбого класса, при этом любой класс распределений может быть, как угодно точно редставлен собственным набором моментов цк или собственных индикаторов 1к = , то позволяет как угодно точно (в зависимости от объема выборки п) восстановить

асс распределения, описывающего генеральную совокупность

4 Разработаны метод и алгоритм оценивания репрезентативности и однородности ыборочных данных из исследуемой генеральной совокупности Выведена общая ормула и разработан алгоритм вычисления параметра однородной генеральной овокупности по однородно-репрезентативной выборке из нее объема п

5 Исследованы свойства коэффициента вариации используемых в решении нпшадных задач Получены соотношения, показывающие, что коэффициент вариации олее конструктивен и информативен при изучении распределений отклонений модулей лучайных величин от их среднего значения, приведенных к интервалу [од]

6 Разработан алгоритм идентификации априорно известной однородной генеральной овокупности (статической и динамической) по ограниченному объему кспериментальных данных, результаты реализации, которой при не подтверждении ее днородности используются для корректировки условий проведения эксперимента

7 Предложен прием и разработан алгоритм снижения погрешности определения араметров однородных, генеральных условий за счет применения «дополнительных» анных объема {п-4)), при 4<п<4()+1) или объема данных п-4 при и=4/ В этом методе ощность анализируемых совокупностей существенно увеличивается до N = С(„"~*]>

(первый случай) или N = с* (второй случай) Экспериментальные проверки показали, что ормирование «условно-дополнительных» данных из генеральной совокупности величивает число анализируемых комбинаций данных на ней и приводит к снижению огрешности до двух раз

8 Разработаны две процедуры оптимального обнаружения, а также исключения номальных наблюдений из исследуемой совокупности экспериментальных данных, снованных на принципах

а) максимальное сходство однородности выборки и ГС с минимальной дисперсией начения параметра Мкгс--

б) минимальное расхождение параметра Ргс и среднего значения исследуемой ыборки ту с минимальным значением дисперсии цкгс Разработанные процедуры ензурирования, по сравнению с известными, практически состоятельны, конструктивны

и надежны В основу процедур положен критерий эффективности статистик (минимальная дисперсия оценок), кроме того, оценка дисперсии является состоятельной и не смещенной Качество цензурирования, базирующееся на принципе минимума расхождения параметра Pre, повышается не менее чем в 15 раз по отношению s принципу максимального сходства однородности ГС

9 Разработаны структура и функции программной подсистемы первичной обработки выборочных данных и приводятся решения важных для практики задач социально-экономического характера, иллюстрирующих логическую и практическую состоятельность результатов диссертационного исследования

Результаты диссертационной работы были внедрены в учебный процесс КГТУ по дисциплинам математической статистика, статистика, основы индетефикации социально-экономических систем, в Курском филиале ОАО ФКБ «РОСБАНК» при оценивании рисков, в систему статистического анализа экономических показателей деятельности предприятия ООО «Стройтрансгаз-агро»

СПИСОК ОСНОВНЫХ ОПУБЛИКОВАННЫХ РАБОТ ПО ТЕМЕ ДИССЕРТАЦИИ

1 Винтаев, В H О возможности аналитической оценки информативности изображений в зависимости от его разрешающих способностей / В H Винтаев, H H Ушакова, А И Уразбахтин // Телекоммуникации, 2004 № 5 С 36-38

2 Винтаев, В H Моделирование бортовой подсистемы распознавания в классе вероятностных признаков / В H Винтаев, H H Ушакова, А И Уразбахтин // Телекоммуникации 2004 №6 С 26-28

3. Вннтаев, В H Обобщенный критерий эффективности в задачах оптимального планирования дистанционного зондирования Земли в системе изучения природных ресурсов / В H Винтаев, А И Уразбахтин, M Г Гаджиев // Телекоммуникации 2004 № 10 С 26-29

4. Винтаев,В H Моделирование верификации режимов работы радиотехнических систем / В.Н. Винтаев, M Г Гаджиев, H H Ушакова, А И Уразбахтин // Телекоммуникации 2004 № 12 С 33-36

5 Винтаев, В H Структура априорной вероятности ошибки распознавания первого рода / В H Винтаев, А И Уразбахтин, H H Ушакова // Телекоммуникации 2005 № 1

С 39-41

6 Lapina Т On lhformativeness of variation coefficiehts while solving applied problems / T.I Lapma, AI Urazbahtm // THE SOCIETY OF FOTOOPTICAL INSTRUMENTIUM ENGENEES (SERIE) Central Umv /City Branch, 9876 Light Ave, Philadelphia PA USA, 2006

-> 7 Lapma T. Generalized pattern of homogeneous general population identification / TI Lapma, AI Urazbahtm // THE SOCIETY OF FOTOOPTICAL INSTRUMENTIUM ENGENEES (SERIE) Central Umv /City Branch, 9876 Light Ave, Philadelphia PA USA, 2006

8 Сазонов, С Ю Модифицированный двухэтапный алгоритм идентификации вероятностных моделей социально-экономических объектов / С.Ю Сазонов, А И Уразбахтин // Материалы международной конференции и Российской научной школы M Сов Радио, M Сов Радио, Том 2 часть 7,2004 С 109-111

9 Уразбахтин, А И Алгоритм проверки однородности выборки и ее епрезентативность исследуемому случайному процессу / А И Уразбахтин ИГ

Уразбахтин // Инфокоммуникационные технологии том 4, № 3,2006,С 10-14

10 Уразбахтин, А И Алгоритма определения параметров однородных генеральных совокупностей по репрезентативному ограниченному объему выборки из нее / А И Уразбахтин, Р А Уразбахтин//Инфокоммуникационные технологии 2006. №4С 31-37

11 Уразбахтин, А И Свойства моментов приведенных распределений / АЙ Уразбахтин, И Г Урахбахтин//Телекоммуникации 2003 №10 С 7-11

12 Уразбахтин, А И Свойства распределений случайных величин, заданных в ограниченном интервале / А И Уразбахтин, Р А Уразбахтин // Телекоммуникационные технологии № 5, 2005 С. 5-9.

13 Уразбахтин, А И Об информативности коэффициентов вариации при решении прикладных статистических задач / А.И Уразбахтин // Матер конф и Российской науч шк М Сов Радио, 2006 т1 чЗ С 112-117

14 Уразбахтин, А И Программная реализация алгоритмов проверки однородности выборки и определения параметров однородных генеральных совокупностей / А И Уразбахтин, Р А Уразбахтин, В Б Журавлев // Матер междунар конф и Российской науч шк М Сов Радио, 2006 т 2 ч 3 С 84-93

15 Уразбахтин, А И Планирование последовательной процедуры по многим критериям / А.И Уразбахтин, Дегтярева Е // Россия на пороге ^третьего тысячелетия единство в многообразии матер к междунар симпозиуму Курск, 1995 ч 2 С 67-72

Подписано в печать 25.04.2007г Формат 60x84 1/16 Печл 10 Тираж 100 экз Заказ Гуманитарно-технический институт (г. Курск) Типография Гуманитарно-технического института (г Курск) 305040, г Курск, пр-т Дружбы, 19

Соискатель

А И Уразбахтин

Оглавление автор диссертации — кандидата технических наук Уразбахтин, Альберт Ильдусович

ВВЕДЕНИЕ

ГЛАВА 1. ПРЕДМЕТНАЯ ОБЛАСТЬ, ОБЪЕКТ ИССЛЕДОВАНИЯ. ПОСТАНОВКА ЗАДАЧИ

1.1. Управление сложными системами со стохастическими параметрами. Проблемы идентификации и классификации

1.2. Структура взаимосвязи и взаимообусловленности задач прикладной статистики

1.3. Постановка задачи. Объект, предмет и задачи исследования

ГЛАВА 2. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ АНАЛИЗА СТРУКТУРНЫХ СВОЙСТВ СТАТИСТИЧЕСКИХ ДАННЫХ. МЕТОД И АЛГОРИТМ ОЦЕНИВАНИЯ ОДНОРОДНОСТИ ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ

2.1. Свойства моментов распределений приведенных к интервалу [0,1]

2.2. Свойства распределений случайных величин, заданных в ограниченном интервале

2.3. Об информативности коэффициентов вариации при решении прикладных задач

2.4. Алгоритм проверки однородности выборки и её репрезентативности исследуемому случайному процессу

2.5. Метод и алгоритм определения параметра однородной генеральной совокупности по репрезентативному ограниченному объему выборки из нее

ГЛАВА 3. ПРИКЛАДНЫЕ ЗАДАЧИ СТАТИСТИЧЕСКОГО АНАЛИЗА ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ

3.1 .Обобщенная схема идентификации однородной генеральной совокупности

3.2. Снижение погрешности определения структурных свойств однородной генеральной совокупности по ограниченной выборке из нее

3.3. Метод обнаружения и исключения аномальных значений выборки, полученной из однородной генеральной совокупности

3.4. Обнаружение моментов изменения структурных свойств генеральной совокупности

ГЛАВА 4. ПРОГРАММНАЯ РЕАЛИЗАЦИЯ РАЗРАБОТАННЫХ МЕТОДОВ И АЛГОРИТМОВ ПЕРВИЧНОЙ ОБРАБОТКИ ОДНОРОДНЫХ ГЕНЕРАЛЬНЫХ СОВОКУПНОСТЕЙ И ИХ СМЕСЕЙ

4.1. Краткая характеристика технологий программирования

4.1.1. Win32/C

4.1.2. C++/MFC

4.1.3. Visual Basic

4.1.4. Java

4.1.5. COM

4.1.6. Windows DNA

4.1.7. NetFramework .NET

4.2. Основы технологии .NET и выбор языка программирования

4.2.1. Строительные блоки .NET (CLR, CTS и CLS)

4.2.2. Выбор языка программирования

4.2.3. Преимущества С#

4.3. Описание автоматизированной подсистемы первичной обработки выборочных данных из однородных генеральных совокупностей и их смесей

Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Уразбахтин, Альберт Ильдусович

Актуальность темы. Как и во многих областях науки и техники в системах социально-экономической природы, принятие управленческих решений основано, как правило, на статистических данных. Наиболее характерными являются следующие задачи:

• идентификация - разработка моделей исследуемых объектов (процессов, явлений) по статистическим данным;

• классификация - разделение изучаемой совокупности объектов (процессов, явлений) на однородные, в некотором смысле, взаимоисключающие физически или статистически различимые группы;

• выявление и исследование зависимостей между факторами, описывающими исследуемый объект;

• понижение объема факторов, описывающих объекты;

• распознавание (обнаружение) - отнесение каждого из заданного множества объектов, представленных в виде совокупности наблюдений, к одному из заранее известных классов.

Решению перечисленных задач посвящено большое количество как фундаментальных, так и прикладных научно технических работ по эконометрике и социомет-рике в проекции на прикладную статистику.

При этом качество идентификации, классификации, распознавания (обнаружения), во многом определяется качеством и объёмом исходной информации, а также методами, приёмами и критериями принятия решения.

Выполнение названных задач часто происходит при наличии внешних и внутренних помех. Внешние помехи, как правило, определяются условиями получения информации, внутренние - методами обработки информации. Наличие помех и неучтенных воздействий ведет к несовпадению между истинными значениями и результатами измерения характеристик изучаемых процессов, поэтому данные (наблюдения, измерения) носят, преимущественно, вероятностный характер.

Большинство статистических задач в системах управления решаются при ограниченных объёмах данных (обусловленных либо сложностью получения данных, либо высокой динамичностью изучаемых явлений) и высокой априорной неопределённости о состояниях исследуемых объектов (явлений, процессов). В этих условиях при решении статистических задач характерными являются: а) недостаточность сведений о параметрах и свойствах наблюдаемого объекта, что ограничивается независимостью и одинаковой распределённостью измерений; б) необоснованные предположения о характере выборочных данных:

- исследуемая генеральная совокупность принимается однородной;

- выборка считается репрезентативной; в) изменчивость условий получения данных; г) непостоянство количества измерений в различные моменты времени; д) ограниченность объёма наблюдений.

Перечисленные факторы существенно усложняют решение статистических задач из-за проблематичности применения известных классических методов математической статистики, фундаментальные результаты которых относятся, в основном, к асимптотическим свойствам распределений и моделям экспоненциального типа (или распределений, порождённых нормальным распределением) и основанным на них критериям.

К важнейшим требованиям, предъявляемым к методам статистического анализа, относятся:

• высокие качественные характеристики;

• устойчивость применяемых методов в условиях изменения статистических характеристик, исследуемых объектов и помех;

• практическая реализуемость методов.

Качество решения статистических задач, прежде всего, определяется:

• вероятностными свойствами изучаемых явлений (объектов);

• адекватностью эталонных описаний объектам, задачам и целям их решения;

• мерами различия между объектами и критериями их различения.

Особое место в обеспечении качества решения статистических задач занимает качество используемой информации. Это, прежде всего, однородность и репрезентативность исследуемых данных. К сожалению, как в теории, так и на практике, однородность и репрезентативность экспериментальных данных принимается как само собой разумеющимися.

Даже в тех случаях, когда осуществляется проверка однородности, она сводится к проверке соответствия выборочных данных нормальному или априорно заданному закону, лишь бы совпадали некоторые числовые характеристики или параметры, что, в общем, сводится к решению задачи оценивания репрезентативности выборки.

Из изложенного следует, что современные методы решения статистических задач должны обеспечивать системный подход к решению разнообразных задач статистического анализа (начиная с постановки эксперимента, первичной обработки данных и завершая принятием решений) и быть:

• универсальными, независимыми от форм (классов) распределений;

• устойчивыми к изменениям статистических свойств наблюдений;

• чувствительными к структурным изменениям вероятностных характеристик наблюдаемых характеристик;

• эффективными при относительно малом объёме выборки, просты в реализации.

В настоящее время известны фундаментальные исследования в области теории и практики идентификации (A.M. Дейч, Н.С. Райбман, В.Я. Катовник, П. Эйкхофф, P.M. Юсупов, А.К. Дмитриев и др.); прикладной статистики (С.А. Айвазян, Т.Химмельблау); методов статистического анализа, отличных от классических (Г.Дейвид - порядковые статистики, Я. Гаек, 3. Шидак - ранговые критерии, М. Кендел - ранговые корреляции, П. Хьюбер - робастные методы, Дж. Тьюки - графические методы анализа, Б. Эфрон - нетрадиционные методы, Дж. Иган, Ф.П., Тарасенко, Г.Б. Петухов - методы теории стохастической индикации и т.д.).

Несмотря на имеющиеся успехи в этих направлениях, разработанные методы не всегда удовлетворяют требованиям практики. Объективная реальность часто выдвигает условия, когда о свойствах наблюдений априорно известны минимальные сведения, которые ограничиваются:

• однородностью;

• репрезентативностью;

• случайностью;

• независимостью.

При этом первые два условия требуют научного обоснования. Это обусловливает противоречия между требованием качественного решения задач прикладной статистики и качеством используемой информации.

Основная решаемая задача данной диссертации заключается в модификации известных и создании новых инструментальных средств первичной обработки экспериментальных данных в контурах управления социально экономических систем.

Таким образом, разработка методов оценивания однородной репрезентативности выборки, позволяющих обосновать однородности исследуемых генеральных совокупностей, является актуальной как в теоретическом, так и в практическом аспектах.

Диссертационная программа выполнялась в рамках научно-технической программы «Притирка-2-И-К » Курского государственного технического университета, утвержденной Министерством образования и науки РФ.

Объектом исследования являются экспериментальные данные для решения задач идентификации, классификации, распознавания (обучения), использующиеся в контурах управления социально-экономическими объектами.

К предмету исследования диссертационной работы относятся методы, алгоритмы и программные средства оценивания однородной репрезентативности выборки из генеральной совокупности и их приложения в практических задачах управления в рассматриваемой сфере.

Цель настоящей работы сводится к повышению качества первичной обработки данных для решения задач прикладной статистики путем создания методов, алгоритмов и программных средств, объединенных в автоматизированную подсистему первичной обработки данных, являющуюся неотъемлемой частью систем управления социально-экономическими системами.

Задачи диссертационной работы:

• разработка концептуальной модели распределений случайных величин, определённых в ограниченном интервале, и исследование её свойств;

• определение однородной генеральной совокупности и разработка методов, алгоритмов оценивания однородности и репрезентативности выборочных данных и параметров исследуемой однородной генеральной совокупности;

• разработка метода снижения погрешности определения параметров однородной генеральной совокупности по выборочным данным из неё;

• разработка метода цензурирования выборочных данных и метода обнаружения изменения свойств случайных процессов по выборочным данным (задача о «разладке»);

• разработка автоматизированной подсистемы первичной обработки выборочных данных в задачах прикладной статистики.

Методы исследования базируются на основных положениях теории вероятностей, математической статистики, прикладной статистики, системного анализа, теоретического и прикладного программирования, теории алгоритмов и теории управления.

Научная новизна определяется разработкой теоретических положений и методов повышения качества предварительной обработки выборочных данных в прикладных задачах статистического анализа. Разработанные методы опираются на свойства концептуальных моделей вероятностных распределений, определённых в ограниченном интервале, а также на свойства однородных распределений (генеральных совокупностей).

К основным теоретическим результатам, полученным в диссертационной работе, относятся:

• модель представления вероятностных распределений, заданных в ограниченном интервале, и её свойства, задаётся в виде совокупности собственных индикаторов, что позволяет создать основу для разработки средств первичной обработки данных;

• определение однородной генеральной совокупности в виде одномодального распределения случайных величин, у которого модули отклонений от среднего значения распределений не существенно отличаются по заданной мере близости от распределения Бернулли;

• модифицированный метод и алгоритм оценивания однородной репрезентативности выборочных данных из генеральной совокупности;

• обобщённый метод и алгоритм определения характеристик генеральной совокупности, при условии, что она однородна;

• метод снижения погрешностей оценок параметра однородной генеральной совокупности с использованием «дополнительных данных».

К основным результатам прикладного характера, базирующимся на разработанных в диссертации теоретических положений, относятся:

• модель взаимосвязи и взаимообусловленности основных задач прикладной статистики;

• методы:

- цензурирования выборочных данных;

- определения момента изменения структурных характеристик однородной генеральной совокупности (в задачах о «разладке»);

• рекомендации по применению коэффициента вариации в статистических исследованиях;

•структура и функция автоматизированной подсистемы предварительного анализа статистических данных. На защиту выносятся:

1) модель взаимосвязи и взаимообусловленности задач математической статистики, а также модели вероятностных распределений, определённых в ограниченном интервале и их свойства, позволяющие существенно расширить круг решаемых задач прикладной статистики;

2) модифицированный метод и алгоритм оценки однородности репрезентативности ограниченной выборки из однородной генеральной совокупности, что позволило сформулировать корректные рекомендации по использованию коэффициента вариации в задачах прикладной статистики;

3) методика, позволяющая снять существующие ограничения на объем выборок, и разработанный на ее основе логически и практически состоятельный, обобщенный алгоритм определения параметров однородной генеральной совокупности;

4) метод формирования условно-дополнительных данных для снижения погрешности определений характеристик однородной генеральной совокупности по выборочным наблюдениям, а также методы решения прикладных задач:

• цензурирование данных;

• обнаружение момента изменения структурных характеристик однородных совокупностей (задача о «разладке»);

5) структура и функции автоматизированной подсистемы предварительного статистического анализа выборочных данных системы управления и результаты решения практически важных задач.

Апробация работы. Результаты работы докладывались и обсуждались на заседании кафедры ИСЭ КГТУ и международной конференции молодых ученых г. Сочи, 2004, 2006 гг., Международном симпозиуме России, г. Курск, 1995 г.

Реализация. Разработанные теоретические положения, методы и алгоритмы апробированы при решении конкретных задач и внедрены в учебный процесс в Курском государственном техническом университете, Гуманитарно-техническом институте (г.Курск) и реализованы в виде пакета прикладных программ.

Публикации. По материалам диссертации опубликовано 15 работ: в том числе 11 статей (из них 9 в журналах, рекомендованных ВАК) и 4 тезиса докладов на международных конференциях.

Личный вклад автора разработка: модель системы взаимосвязи и взаимообусловленности задач прикладной статистики (60 %); концептуальной модели вероятностных распределений заданных в ограниченных интервалах и изучения их свойств (50%); определение методов, алгоритмов и приемов оценивания однородной репрезентативности ограниченного объема выборок из вероятностного пространства (90%) и определения параметра однородной генеральной совокупности (90%); модифицированного метода и алгоритма оценивания параметра генеральной совокупности (80%); обобщенного метода и алгоритма идентификации характеристик генеральной совокупности, при условии, что она однородна (100%); метода понижения погрешностей оценок параметра однородной генеральной совокупности (90%); цензурирование выборочных данных (60%); рекомендаций по применению коэффициента вариации в статистический исследованиях (90%); автоматизированной подсистемы первичной обработки и визуализации экспериментальных данных (95%). Структура и объём работы. Диссертационная работа состоит из введения, четырёх глав, заключения, изложена на 140 страницах основного текста, содержит 43 рисунка, 22 таблицы, библиографический список состоит из 99 наименований.

Заключение диссертация на тему "Методы повышения качества первичной обработки экспериментальных данных в задачах управления социально-экономическими системами"

Выводы.

1. Метод определения параметров однородных генеральных совокупностей по репрезентативному ограниченному объёму выборки из неё - {yi \п основан на совместном анализе структурных свойств выборочных данных и распределений Бернулли.

2. Структурный сопоставительный анализ различных распределений возможен лишь в одном и том же (нормированном) вероятностном пространстве. Наиболее конструктивным как с теоретической, так и прикладной точки зрения целесообразно нормированное пространство рассматривать в интервале [0,1].

3. Получена обобщенная формула вычисления возможных значений параметров однородной генеральной совокупности и выбора оптимального из них.

ГЛАВА 3. ПРИКЛАДНЫЕ ЗАДАЧИ СТАТИСТИЧЕСКОГО АНАЛИЗА ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ

3.1. Обобщенная схема идентификации однородной генеральной совокупности

Из принятого определения «генеральная совокупность называется однородной, если она одномодальна и модули отклонений от среднего значения имеют распределение Бернулли с параметром РБ ». Откуда следует, что идентификация однородной генеральной совокупности сводится к идентификации среднего значения и определению параметра распределения модулей отклонений значений наблюдений от среднего значения генеральной совокупности [69,70]. В самом общем виде распределение Бернулли формально представляется в виде распределения двух состояний:

1. «Благоприятное» («успех», «1», у+) с вероятностью Р(«Б»)=/?Ь;

2. «Неблагоприятное» («неудача», «0», у") с вероятностью Р(«Н»)=(1- рБ ). Математически распределение Бернулли наиболее изучено для событий «Б» =

1 и «Н» = 0 (классический случай), тогда первый начальный (среднее значение) и второй центральный (дисперсия) моменты для классического случая будут иметь вид соответственно: б =1-Рб+°-(1-Рб) = Рб>' /%=П2 • Рб +°2 'П-РБ))~ Р2б= Рб(1~ Рб)-Наиболее распространенными структурными характеристиками распределений вероятностей являются коэффициенты асимметрии kQg и эксцесса (островершинности) кЭБ, которые определяются по формулам соответственно: з 2 ксб=мзб/(м2б)2 =>ь-рб)крб+(ъ-рб)3 <\-рб)\\рб(\-рб)]2 => кСБ=[(\-2Р11)/4рн(\-ри)\. к эб = м*б м2б)2 => рб)* 'рб + рб)* ' П " рб )\[рб(1 ~ рб /Р > где и ц - соответственно центральные моменты третьего и четвертого порядков.

Кроме рассмотренных коэффициентов, в практике статистического анализа широко используется коэффициент вариации, определяемый как [4, 5] кт =8Б/аХБ =*^(1-рБ)рБ/рБ =4С[~Рб)/Рб> гДе 8б = -Jfhl = 4(1~Рб)Рб)

На рисунке 3.2 приведена зависимость бБ (среднеквадратичного отклонения) от параметра РБ . Из рисунке 3.2 следует, что дБ симметрично относительно Рб = 0,5, при котором принимает максимальное значение, равное 8Б{Рб = 0,5) = 0,5, что следует из уравнения

ЩРм1Л(\-грв)/(рБ(\-рв))=п^ дрБ 2

Совместное рассмотрение коэффициента асимметрии кСБ (рБ) как функции от параметра рБ и производной д8Б{рБ)/ дрБ указывает на пропорциональную зависимость между ними

МБ(рБ) 1 f 1 дРв 2л1Рб(1~Рб) сб 2ss сб Последнее соотношение, в общем случае, характеризует чувствительность среднеквадратичного отклонения распределения Бернулли от его параметра Рб, значения которого существенно близки к границам интервала ]0<>рБ <l].

В таблице 3.1 представлены математические формулы основных характеристик распределения Бернулли.

ЗАКЛЮЧЕНИЕ

Обоснована актуальность темы; сформулированы цель и основные задачи исследования работы; изложена научная новизна и практическая ценность полученных результатов; приведены основные положения, выносимые на защиту.

Проведён анализ проблем управления социально экономическими процессами, происходящими в условиях ещё не сложившейся рыночной экономики, которая подвержена разного рода внешним и внутренним, как правило, негативным, слабо контролируемым и высоко динамичным влияниям. Эти влияния зависят от разных факторов: внешне- и внутриполитических, социальных, межэтнических отношений, географических, уровня отчислений на развитие и воспроизводство в различных отраслях экономики, политической активности различных пластов населения, демографических условий, существующих монополий в экономике и т.д. Успешное управление СЭС в названых условиях возможно лишь на основе ограниченного объема данных, получаемых при высокой неопределённости. Последнее обусловливает необходимость применения в управлении СЭС высокоэффективных методов решения статистических задач в рамках прикладной статистики, являющейся связующим звеном между теоретическими положениями теории вероятностей и математической статистики и реализуемыми на современных информационных системах, а также в прикладных задачах управления СЭС.

В свете изложенного в диссертации была разработана модель взаимосвязи и взаимообусловленности основных задач прикладной статистики: планирование и проведение эксперимента; первичная обработка данных; идентификация; определение связи между различными факторами исследуемых систем; снижение размерности измеряемых факторов; классификация объектов; разработка мер и критериев различения классов объектов. Анализ состояния методов решения перечисленных задач прикладной статистики показал, что наименее разработанными, как теоретически, так и практически, являются методы первичной обработки данных, в то время как качество решения всех остальных задач прикладной статистики полностью определяется качеством решения задач предварительной обработки экспериментальных данных. Исходя, из этого были сформулированы тема, цель и задачи исследования.

Разработана теоретическая основа анализа структурных свойств выборочных статистических совокупностей на базе структурных свойств распределений Бернулли, определенных в ограниченном интервале \у,у+]. Необходимость рассмотрения распределений в ограниченных интервалах объясняется одним из важнейших требований проведения любого сравнительного анализа различных объектов (что является доминирующим в прикладной статистике) - это обеспечение одинаковых методов и условий их исследований. Так как линейное преобразование х = ау + Ъ не меняет класса распределений у, то путем использования этого преобразования любые сравниваемые статистические совокупности могут быть приведены в один и тот же интервал [х ',х +] без изменения своих структурных свойств. При этом как с теоретической, так и с практической точки зрения целесообразным является интервал [0,1]. Выбор этого интервала также связан с классическим распределением Бернулли, которое формулируется как Рб(х=х')=0, Р^х=х+)= 1. Центральные моменты которые имеют вид: где jj-кБ ~ центральные моменты классического распределения Бернулли. Доказана важная как для теории, так и для практики прикладной статистики теорема о соотношении центральных моментов распределений и статистических совокупностей, определенных в ограниченном интервале (что является основой структурных свойств) с соответствующими моментами распределений Бернулли. Моменты всевозможных распределений вероятностей и статистических совокупностей, заданных в интервале {у, у\ ограничены снизу «0», а сверху - центральными моментами распределения Бернулли

0 < fify < Р(\ - Р)[(\-Р)к-' + (-1)кРк~1](у + - у~ ), к = 2,3. , где Р=а1х (параметр Р совпадает со средним значением распределения вероятностей и статистических совокупностей).

Исследованы функции чувствительностей дМкБ /дР = (\- P)k~Vl -Р(\ + к)) + (-\)kPk~x[k ~(\ + к)Р],к = 1,2,. которые показали, что статистические критерии для ассиметричных распределений в задачах идентификации, классификации, распознавания (обнаружения) должны строиться на старших центральных моментах.

Вышеназванные свойства позволяют по-новому решать задачи прикладной статистики:

- идентификации законов распределений по выборочным данным;

- формировать законы распределений с заданными моментами из элементарных функций;

- проводить сопоставительный, структурный анализ различных классов распределений;

- оценивать взаимную неопределённость различных мер рассогласования распределений вероятностей и статистических совокупностей.

Исследованы возможности коэффициента вариации, широко используемого при анализе структурных свойств статистических совокупностей. Доказано, что информативность коэффициента вариации при исследовании структурных свойств распределений вероятностей (следовательно, и статистических выборок) является лишь при анализе распределений в одном и том же интервале [у *, у +]. Коэффициенты вариации больше приспособлены к анализу распределений модулей отклонений случайных величин от их среднего значения. Коэффициенты вариации распределений, приведенных к интервалу [0,1], ограничены снизу «0», а сверху - значением коэффициента вариации распределения Бернулли с параметром, равным первому начальному моменту исследуемого распределения о < vx < др Р }/р >р = 6 Аод;, х 6 [o,ij

Фундаментальными в прикладной статистике являются свойства репрезентативности и однородности выборок. Обеспечение репрезентативности и однородности выборок из генеральной совокупности в статистических исследованиях является неукоснительным требованием. Однако в практических задачах однородность и репрезентативность считаются само собой разумеющимися. Если содержательно репрезентативность исследователями понимается одинаково, то единого мнения по определению однородности не существует. В работе развиваются идеи «однородности», принадлежащие В. Швыркову, А. Лексису, САйвазяну, Н. Фишеру.

Определение: Распределение вероятностей (Генеральная совокупность) называется однородной (ОГС), если оно одномодальное распределение, модули отклонений случайных величин которого от среднего значения исследуемого распределения (ГС) «незначимо» отличаются от распределения Бернулли. «Незначимо» означает выполнение условий эффициент сходства экспериментальных и теоретических значений (ЭЗР и ТЗР) выборки (у,}п из генеральной совокупности п-к i= 1

I се / / п > 0,5 (выборкарепрезентативна) и Стсе> 0,5 (выборка однородна), где СМ(е - ко V/^v / Мг* п v,}n - экспериментальные значения репрезентативности выборки (ЭЗР) и если х< 0,5, сед„ - теоретические значения репрезентативности выборки (ТЗР)

0, при 0<v;. <0,5,

СЕ[ = 1

1, при 0,5 < v < 1.

Приведенные формулы для вычисления v, являются модификацией метода, предложенного В. Швырковым.

Iк -к I

1 - -> 0,5 для асимметричных распределений; сае\

I к -к I

1 - -> 0,5 для симметричных распределений. г = xvae

Анализ рассматриваемого подхода показывает, что он основан на сопоставлении структурных свойств распределений ЭЗР и Бернулли, который раскрывает сущность оценивания репрезентативности и однородности исследуемой выборки, что достаточно просто визуализируется на экране монитора ПЭВМ.

Исходя из определения ОГС и идей определения параметров ОГС по характеристикам ЭЗР и ТЗР исследуемой выборки (при выполнении условий репрезентативной однородности) разработана общая формула и алгоритм, не зависящего от объема выборки n = 4'j расчета возможных значений параметров ОГС - Prcj ргсв = 2дг+ <l ~ vlc ± ^1 - v)cj2 - а д = 1(1)( я, с гсв 2 (v(A + B) + (l-v)C где А+В+С=п, СА+В)/п < 0,5, (А+В) - число значений се=0; С - число значений се,=\; п

V = X v, / Л.

Из множества {Ргс(В)} в качестве параметра ГС выбирается тот, который будет отвечать условию Р*гс~ min{[kCY - ксв(В)]}, где кСу, кСв(В) - коэффициент асимметрии исследуемой выборки и распределения Бернулли с параметром Ргс(В)- Соответственно, разработаны алгоритм проверки однородной репрезентативности выборки \у.}п и алгоритм вычисления параметра однородной генеральной совокупности ргг.

Полученные результаты во второй главе образуют теоретическую основу повышения качества решения задач прикладной статистики, в особенности, в повышении надежности экспериментальных данных на начальных стадиях её обработки (обоснование репрезентативности и однородности выборки).

Разработана обобщенная схема идентификации ОГС по ограниченной выборке. Здесь предполагается, что известен параметр априори. По полученным экспериментальным данным или подтверждается однородность исследуемой ОГС, или получают информацию о наличии «мешающих» факторов, влияющих на полученные данные. Такими факторами могут быть внешние - неконтролируемые или внутренние, когда нарушены условия проведения эксперимента. Разработаны две схемы (алгоритма) анализа экспериментальных данных - для статистических и динамических ОГС: а) при условии статистической ОГС, если её однородность не подтверждается или вычисленный параметр - Ргс не будет отвечать заданному уровню значимости по отношению априорно известного параметра, производится коррекция условий экспериментирования; б) для динамической ОГС, если данные, полученные в интервале [/,, ti+A ], не будут отвечать требованиям однородности ОГС, то делается вывод о возможной "разладке" исследуемого процесса.

Методика оценки ОГС предполагает, что объём анализируемой выборки п должен быть кратным 4, то есть n=4j,j=l,2. Однако в реальности это условие не всегда выполняется, тогда могут возникнуть «дополнительные» данные, число которых может меняться от 1 до 3. В этом случае появляется возможность использования их для повышения качества оценивания (уменьшение погрешности) параметра ОГС путем расширения пространства возможных оценок

N = C4Jj-k) = (4j + к)! /((4j)!-k!), /И,2,3.

Далее оценивается репрезентативная однородность каждой из этих выборок. Если все выборки окажутся репрезентативно однородными, то определяются для каждой выборки значения параметров {PXj}n,, и для них вычисляется среднее значение, или применяется проверка однородности множества {Pecj}N с последующим оцениванием его обобщенного параметра. В случае, если не все N выборок будут отвечать условиям репрезентативности необходимо перейти к решению задач: цензурирования или расщепления ГС на однородные группы. Экспериментальная проверка метода показала, что погрешность оценки Ргс с учетом дополнительных данных может быть уменьшена более чем в 2 раза.

Разработан метод оптимального обнаружения и исключения (цензурирования) аномальных данных из совокупности экспериментальных измерений. Процедура цензурирования основана на исключении элементов из выборки, нарушающих её однородность. Рассмотрены два принципа цензурирования :

1) принцип обеспечения максимального сходства однородности (max Сх) ГС. При наличии нескольких альтернативных вариантов цензурированных выборок с одинаковыми значениями максимального сходства однородности, выбирается комбинация с наименьшей дисперсией- р2ГС ;

2) принцип обеспечения минимума расхождения параметра РГс вычисленного по и выборке (у, }„ с её средним значением у = ^у,1п. При существовании нескольких i конкурирующих вариантов с динамическими расхождениями Ргс - у выбирается цензурированная выборка с минимальной дисперсией /л2ГС.

Из рассмотренных двух принципов цензурирования второй является более предпочтительным, обеспечивающим наибольшее сходство исследуемой выборки с её моделью в однородном процессе. Качество цензурирования по последнему принципу по сравнению с первым повышается не менее чем в 15 раз.

Сформулированные процедуры цензурирования являются конструктивными и в отличие от известных подходов, опирающихся на интуицию и субъективные выводы исследователя, базируются на научных положениях. Разработанный метод реализован в виде алгоритма и программного продукта.

Изучены краткие характеристики современных технологий программирования и осуществлен выбор технологии .NET как наиболее оптимальной, и языка программирования С#.

Выбор технологии основан:

- на одном из важных отличий сборок .NET от двоичных файлов серверов СОМ и любых других исполняемых файлов Win32, заключающемся в том, что сборки .NET содержат не платформенно-зависимые инструкции, а код на так называемом промежуточном языке Microsoft (Microsoft Intermediate Language, MSIL или просто IL). Этот язык не зависит ни от платформы, ни от типа центрального процессора. Код IL компилируется в платформенно-зависимые инструкции только во время выполнения. Промежуточный код, находящийся в исполняемом файле CLR, называют управляемым кодом (managed code, под управлением), а непосредственно машинный код, находящийся в секции кода обычного исполняемого файла, называют неуправляемым кодом (unmanaged code);

- на том, что в настоящее время различные государственные организации и страны используют платформы, отличные от Windows, к примеру платформу Linux, а приложения .NET потенциально выполняются на различных платформах и на компьютерах с самыми разными центральными процессорами.

Язык программирования С# специально был разработан Microsoft для платформы .NET. Синтаксические конструкции С# унаследованы не только от С++, но и от Visual Basic. Например, в С#, как и в Visual Basic, используются свойства классов. Как С++, С# позволяет производить перегрузку операторов для созданных программистом типов (Java не поддерживает ни ту, ни другую возможность). С# — это фактически гибрид разных языков. При этом С# синтаксически не менее (если не более) чист, чем Java, так же прост, как Visual Basic, и обладает практически той же мощью и гибкостью, что и С++. Самой важной особенностью языка С# является то, что он генерирует код, предназначенный для выполнения только в среде выполнения .NET, но в то же время он практичнее и вбирает в себя самые лучшие возможности остальных языков.

В диссертационной работе разработано программное приложение, реализующее методы и алгоритмы первичной обработки выборочных данных из однородных генеральных совокупностей и их смесей:

• вычисления центральных моментов распределения Бернулли;

• оценивания репрезентативности и однородности выборочных данных из исследуемой ГС;

• вычисления параметра ОГС по однородно-репрезентативной выборке из нее объема - п;

• идентификации априорно известной однородной ГС (статической и динамической) по ограниченному объему экспериментальных данных;

• снижения погрешности определения параметров однородных генеральных условий за счет применения «дополнительных» данных;

• оптимального обнаружения и исключения аномальных наблюдений из исследуемой совокупности экспериментальных данных.

Программное приложение представляет собой совокупность модулей, позволяющих вводить, хранить и удалять данные, осуществлять расчеты, отображать их результаты с помощью аналитических графиков, таблиц результатов, и обеспечивает их хранение и вывод на печать.

Интерфейс программного приложения позволяет пользователю с минимальным знанием практической работы на ПЭВМ в удобной и максимально информативной форме анализировать промежуточные и окончательные результаты расчетов, и при необходимости оперативно вводить изменения. Основные выводы и результаты работы:

1. Исходя из анализа современного состояния вероятностно-статистических методов и их использования в управлении в различных областях науки и техники, в том числе социально-экономических систем (СЭС), показаны роль и место прикладной статистики. Разработана модель взаимосвязи и взаимообусловленности основных задач прикладной статистики:

- планирование эксперимента;

- первичный анализ экспериментальных данных; исследование связей между различными факторами исследуемых систем;

- идентификация, классификация и понижение размерности объема признаков описания объектов;

- разработка мер и критериев различения объектов.

Задачи первичной обработки экспериментальных данных, а именно: обоснование однородности, репрезентативности, а также цензурирование данных считаются менее разработанными как теоретически, так и практически, хотя они являются определяющими качество решения задач прикладной статистики при управлении объектами (СЭС).

2. Исследованы структурные свойства (начальный и центральные моменты) и их связи для распределений Бернулли, определенных в пространствах [у~,у+] и [0,l]. Получены соотношения для вычисления центральных моментов распределений. Полученные соотношения и их связи образуют теоретическую базу для решения задач повышения качества первичной обработки экспериментальных данных социально экономического характера.

3. Доказаны теоремы об ограниченности для любых распределений, приведенных к интервалу [0,l] - значений начального момента интервалом [ОД], центральных моментов интервалами [v,/^], основанные на следующих положениях: а) значения факторов реально существующих объектов определяются в ограниченных пространствах [у~ ,у+]; б) если для значений у заданы интервалы принадлежности -со<у <у*, — со<у <ао'у~ <у <со, то для этих значений существуют ограничения, определяемые любым наперед заданным уровнем значимости а; в) линейное преобразование случайных величин х=ау+Ь не меняет распределений любого класса, при этом любой класс распределений может быть, как угодно точно представлен собственным набором моментов ^ или собственных индикаторов Ik = что позволяет как угодно точно (в зависимости от объема выборки п) восстановить класс распределения, описывающего генеральную совокупность.

4. Разработаны метод и алгоритм оценивания репрезентативности и однородности выборочных данных исследуемой ГС. Выведена общая формула и разработан алгоритм вычисления параметра ОГС по однородно-репрезентативной выборке из нее объема п.

5. Исследованы свойства коэффициента вариации используемых в решении прикладных задач. Получены соотношения, показывающие, что коэффициент вариации более конструктивен и информативен при изучении распределений отклонений модулей случайных величин от их среднего значения, приведенных к интервалу [од].

6. Разработан алгоритм идентификации априорно известной однородной ГС (статической и динамической) по ограниченному объему экспериментальных данных, результаты реализации, которой при не подтверждении однородности ГС используются для корректировки условий проведения эксперимента.

7. Предложен прием и разработан алгоритм понижения погрешности определения параметров однородных, генеральных условий за счет применения «дополнительных» данных объема (n-4j), при 4<n<4(j+l) или объема данных п-4 при n=4j. В этом методе мощность анализируемых совокупностей существенно увеличивается до N = c(n"~AJ> (первый случай) или N = C* (второй случай). Экспериментальные проверки показали, что снижение погрешности понизилось до двух раз.

8. Разработаны две процедуры оптимального обнаружения, а также исключения аномальных наблюдений из исследуемой совокупности экспериментальных данных, основанных на принципах: а) максимальное сходство однородности выборки и ГС с минимальной дисперсией значения параметра jumc; б) минимальное расхождение параметра Ргс и среднего значения исследуемой выборки rriy с минимальным значением дисперсии ркгс. Разработанные процедуры цензурирования, по сравнению с известными, практически состоятельны, конструктивны и надежны. В основу процедур положен критерий эффективности статистик (минимальная дисперсия оценок), кроме того, оценка дисперсии является состоятельной и не смещенной. Качество цензурирования повышается не менее чем в 15 раз.

9. Обоснован выбор технологии и языка программирования, на базе которых разработано программное приложение, реализующее методы и алгоритмы первичной обработки выборочных данных из однородных генеральных совокупностей и их смесей.

Библиография Уразбахтин, Альберт Ильдусович, диссертация по теме Управление в социальных и экономических системах

1. Автоматизированные системы управления предприятиями: учеб. пособие/

2. B.В. Брага, Л.А. Вдовенко и др.. М.: Финансы и статистика, 1983. 263 с

3. Автоматизированные системы управления предприятием (методы создания): справочное пособие / А.С.Гринберг, В.П.Колосков и др.. М.: Энергия, 1978. 224 с

4. Аграновский, А.В. Оценка точности текстонезависимых систем идентификации дикторов на основе экспериментальных АЧХ их полосовых трактов. /А.В.Аграновский , Д.А.Леднов, С.А. Репалов. // Телекоммуникации. 2000. №6.1. C. 16-17.

5. Айвазян, С.А. Прикладная статистика. Основы моделирования и первичная обработка данных / С.А. Айвазян, И.С.Емюков, А.Д.Мешокин. М.: Финансы и статистика, 1983. 471 с.

6. Айвазян, С.А. Прикладная статистика и основы эконометрики. / С.А. Айвазян, B.C. Мхитарян. М., ЮНИТИ, 1998, 1022 с.

7. Айвазян, С.А. Классификация многомерных наблюдений / С.А. Айвазян, З.И. Бенсаева, О.В. Староверов. М.: Статистика, 1974. 240 с.

8. Бельдман, Р., Принятие решения в расплывчатых условиях /Р. Бельдман, Л. Заде // Вопросы анализа процедуры принятия решений. М.: Мир, 1975. С. 172-215.

9. Большее, Л.Н. Таблицы математической статистики / А.Н. Большое, И.В. Смирнов. М.: Наука, С. 1983. 416 с.

10. Боровков, А.А. Математическая статистика / А.А. Боровков. М.: Наука, 1984. 471 с.

11. Бродский, Б.Е. О задаче скорейшего обнаружения момента изменения вероятностных характеристик случайной последовательности / Б.Е. Бродский, Б.С. Дар-хсовский. М.: //Автомеханика и телемеханика. 1982. С. 101-108.

12. Браверман, Э.М. Структурные методы обработки эмпирических данных. /Э.М. Браверманн, И.Б. Мучник. М.: Наука, 1989. 464 с.

13. Браунли, К.А. Статистическая теория и методология в науке и технике. М.: Наука, 1977. 233 с.

14. Винтаев, В.Н. О возможности аналитической оценки информативности изображений в зависимости от его разрешающих способностей / В.Н. Винтаев, Н.Н. Ушакова, А.И. Уразбахтин // Телекоммуникации, 2004. № 5. С. 36-38.

15. Винтаев, В.Н. Моделирование бортовой подсистемы распознавания в классе вероятностных признаков / В.Н. Винтаев, Н.Н. Ушакова, А.И. Уразбахтин // Телекоммуникации. 2004. № 6. С. 26-28

16. Винтаев, В.Н. Обобщенный критерий эффективности в задачах оптимального планирования дистанционного зондирования Земли в системе изучения природных ресурсов / В.Н. Винтаев, А.И. Уразбахтин, М.Г. Гаджиев // Телекоммуникации. 2004. № 10. С. 26-29.

17. Винтаев,В.Н. Моделирование верификации режимов работы радиотехнических систем / В.Н. Винтаев, М.Г. Гаджиев, Н.Н. Ушакова, А.И. Уразбахтин // Телекоммуникации. 2004. № 12. С. 33-36.

18. Винтаев, В.Н. Критерий допустимости необходимой деградации решающей способности изображений, синтезируемых некоторыми радиотехническими системами / В.Н. Винтаев, А.И. Уразбахтин, Н.Н. Ушакова // Телекоммуникации. 2005. №11. С. 39-41.

19. Гаек, Я. Теория ранговых критериев / Я. Гаек, 3. Шидак. М.: Наука, 1973. 375 с.

20. Грот, Д.М. Оптимальные статистические решения /Д.М. Грот. М.: Мир, 1974. 491 с.

21. Дейвид, Г. Порядковые статистики / Г. Дейвид. М.: Наука, 1979. 336 с.

22. Дейч, A.M. Методы идентификации динамических объектов / A.M. Дейч. М.: Энергия, 1979. 107 с.

23. Джонсон, Д. Статистика и планирование эксперимента в технике и науке. Методы планирования эксперимента / Д. Джонсон, М. Лион. М.: Мир, 1981. 580 с.

24. Дрейпер, Н. Прикладной регрессионный анализ 1 / Н. Дрейпер, Г. Смит. М.: Финансы и статистика 1986. 336 с.

25. Дрейпер, Н. Прикладной регрессионный анализ 2 / Н. Дрейпер, Г. Смит. М.: Финансы и статистика, 1987. 299 с.

26. Дениэл, Н. Применение статистики в промышленном эксперименте / Н. Дениэл. М.: Мир, 1979. 299.

27. Дружинин, Н.К. Основные математико-статистические методы в экономических исследованиях / Н.К. Дружинин. М.: Статистика, 1968. 248 с.

28. Дубров, A.M. Обработка статистических данных методом главных компонент/ A.M. Дубров. М.: Статистика, 1978. 335 с.

29. Журковский, В.М. Факторный анализ в социально-экономических исследованиях/В.М. Журковский, М.Б. Мучник. М.: Статистика, 1979. 152 с.

30. Закс, Л. Статистическое оценивание / J1. Закс. М.: Статистика, 1976. 598 с.

31. Захарян, И., Интернет как инструмент для финансовых инвестиций /И.Захарян, И.Филатов Санкт Петербург : BHV Санкт - Петербург, 2001. 256 с.

32. Иган, Дж. Телория обнаружения сигналов и анализ рабочих характеристик / Дж. Иган. М.: Наука, 1983. 216 с.

33. Катовник, В.Я. Непараметрическая идентификация и сглаживание данных: методы локальных аппроксимаций / В .Я. Катовник. М.: Наука. 1985. 336 с.

34. Кендалл, М. Теория распределений / М. Кендалл, А. Стьюарт. М.: Наука, 1973.900 с.

35. Кендалл, М. Статистические выводы и связи / М. Кендалл, А. Стьюарт. М.: Наука, 1979. 900 с.

36. Кендалл, М. Ранговые корреляции / М. Кендалл. М.: Статистика, 1975. 216 с.

37. Кокс, Д. Теоретическая статистика /Д. Кокс, Ф. Хинкли. М.: Мир, 1978. 516с.

38. Косенко Г.Г. Критерий информативности при различении сигналов /Г.Г. Ко-сенко. М.: Радио и Связь, 1982. 216 с.

39. Кличен, Н. Методы обнаружения моментов измерения свойств случайных чисел /Н. Кличен, J1. Телкснис. М.: // Автоматика и телемеханика. 1991. с. 5-57.

40. Lapina Т. On ihformativeness of variation coefficiehts while solving applied problems / T.I. Lapina, A.I. Urazbahtin // THE SOCIETY OF FOTOOPTICAL IN-STRUMENTIUM ENGENEES (SERIE) Central Univ /City Branch, 9876 Light Ave., Philadelphia PA USA, 2006.

41. Lapina Т. Generalized pattern of homogeneous general population identification / T.I. Lapina, A.I. Urazbahtin // THE SOCIETY OF FOTOOPTICAL INSTRUMEN-TIUM ENGENEES (SERIE) Central Univ /City Branch, 9876 Light Ave., Philadelphia PA USA, 2006.

42. Леман, Э. Проверка статистических гипотез /Э. Леман. М.: Наука, 1979. 408 с.

43. Мельникова, Н.Н. Обнаружение многократных «разладок» и классификация временных рядов с помощью статистических оценок межклассовых расстояний / Н.Н. Мельникова, Ю.С. Харин. М.: // Автоматика и телемеханика, 1991. с. 77-85.

44. Мартыщенко, Л.А. Методы военно-научных исследований в задачах разработки и испытания вооружения /Л.А. Мартыщенко, В.В. Панов. МО СССР. М., 1981. 279 с.

45. Мартыщенко, Л.А. Идентификация закона распределения по малой выборке /Л.А. Мартыщенко, К.А. Золотников, А.Н. Кивалов. МО СССР. М., 1991. 32 с.

46. Мартыщенко, Л.А. Проверка гипотез о виде закона распределения по малой выборке /Л.А. Мартыщенко и др. МО СССР. М., 1989, 34 с.

47. Моттль, В.В. Скрытые Марковские модели в структурном анализе сигналов / В.В. Моттль, И.Б. Мучник. М.: Физматлит, 1999. с. 352.

48. Налимов, В.В. Теория эксперимента / В.В. Налимов. М.: Наука, 1976.512 с.

49. Новицкий, П.В. Оценка погрешности результатов измерений / П.В. Новицкий, И.А. Загорф. Л.: Энергоатомиздат, ленинградское отделение, 1985.248 с.

50. Патрик, Э. Основы теории распознавания образов / Э. Патрик. М.: Сов. Радио. 1980. 408 с.

51. Петухов, Г.Б. Основы теории эффективности целенаправленных процессов 1 / Г.Б. Петухов. Л.: 1989. 660 с.

52. Петухов, Г.Б. Методы теории стохастической идентификации в исследовании операций и прикладной кибернетике / Г.Б. Петухов, Н.К. Белоконь. Л.: ВИКИ им А.Ф. Можайского, 1987. 191 с.

53. Питмен, Э. Основы теории статистических выводов / Э. Питмен. 1986. 105 с.

54. Пустыльник, Е.И. Статистические методы анализа и обработки наблюдений / Е.И. Пустыльник. М.: Наука, 1968. 288 с.

55. Райбман, Н.С. Что такое идентификация / Н.С. Райбман. М.: Сов. Радио, 1977. 432 с.

56. Репин, В.Г. Статистический синтез при априорной неопределенности и адаптация информационных систем / В.Г. Репин. М.: Сов. Радио, 1977. 432 с.

57. Себер, Дж. Линейный регрессионный анализ / Дж. Себер. М.: Мир, 1973. 957 с.

58. Сейдж, Э. Теория оценивания и ее применение в связи и управлении. / Э. Сейдж, Дж. Меле. М.: Связь, 1976, 496 с.

59. Сейдж, Э. Идентификация систем управления / Э. Сейдж, Дж. Меле. М.: Наука, 1974.

60. Смирнов, Н.В. Теория вероятностей и математической статистики / Н.В. Смирнов. М.: Наука, 1970. 209 с.

61. Сенин, А.Г. Распознавание случайных сигналов / А.Г. Сенин. Новосибирск: Наука СО, 1974. 76 с.

62. Современные методы идентификации систем / под ред. П. Эйкхоффа. М.: Мир, 1970. 290 с.

63. Соломатин, Н.А. Автоматизированные системы управления предприятиями / Н.А. Соломатин, А.И. Дударин и др. М.: Экономика, 1985. 248 с.

64. Статистические методы обработки результатов наблюдении / под ред. P.M. Юсупова. Л., 1984. 563 с.

65. Стогний, А.А. Автоматизация информационного обеспечения научных исследований / А.А. Стогний, Ю.П. Каширин и др. Киев:Наук.думка, 1990.296 с.

66. Тарасенко, Ф.П. Непараметрическая статистика /Ф.П.Тарасенко. Томск.: 1976. 294 с.

67. Ту, Дж. Принципы распонавания образов / Дж. Ту, Р. Гонсалес. М.: Мир, 1987. 406 с.

68. Тьюки, Дж. Анализ результатов измерений / Дж. Тьюки. М.: Мир, 1981. 697 с.

69. Уразбахтин, А.И. Алгоритм проверки однородности выборки и ее репрезентативность исследуемому случайному процессу / А.И. Уразбахтин, И.Г. Уразбахтин // Инфокоммуникационные технологии. 2006. № 3 С. 10-14.

70. Уразбахтин, А.И. Алгоритм определения параметров однородных генеральных совокупностей по репрезентативному ограниченному объему выборки из них / А.И. Уразбахтин, Р.А. Уразбахтин // Инфокоммуникационные технологии. 2006. №4 С. 31-37.

71. Уразбахтин, А.И. Свойства моментов приведенных распределений / А.И. Уразбахтин, И.Г. Уразбахтин // Телекоммуникации. 2003. № 10. С. 7-11.

72. Уразбахтин, А.И. Свойства распределений случайных величин, заданных в ограниченном интервале / А.И. Уразбахтин, Р.А. Уразбахтин // Телекоммуникационные технологии. 2006. № 4 С. 31-37.

73. Уразбахтин, А.И. Об информативности коэффициентов вариации при решении прикладных статистических задач / А.И. Уразбахтин // Матер, конф. и Российской науч. шк. М.: Сов. Радио, 2006. т.1. ч.З. С. 112-117.

74. Уразбахтин, И.Г. Планирование последовательной процедуры по многим критериям / И.Г. Уразбахтин, Дегтярева Е. // Россия на пороге третьего тысячелетия: единство в многообразии: матер, к междунар. симпозиуму. Курск, 1995. ч.2.1. С. 67-72.

75. Уразбахтин, И.Г. Структура построения и исследования моделей сложных систем / И.Г. Уразбахтин, Т.К. Нежметдинов, Г.М. Полишук // Прием и обработкаинформации в сложных информационных системах: Сб. Вып. 16. Казань: КГУ, 1987. с.

76. Уразбахтин, И.Г. Применение рабочих характеристик в задачах классификации ограниченного объема наблюдений / И.Г. Уразбахтин // Прием и обработка информации в сложных информационных системах: Сб. Вып. 16. Казань: КГУ, 1987. с.

77. Уразбахтин, И.Г. Структурные методы оценивания близости законов распределения на основе анализа рабочих характеристик / И.Г. Уразбахтин // Прием и обработка информации в сложных информационных системах: Сб. Вып. 16. Казань: КГУ, 1987. с.

78. Уразбахтин, И.Г. Применение рабочих характеристик в задачах классификации ограниченного объема наблюдений / И.Г. Уразбахтин // Прием и обработка информации в сложных информационных системах: Сб. Вып. 16. Казань: КГУ, 1987. с.

79. Уразбахтин, И.Г. Структурные методы оценивания близости законов распределения на основе анализа рабочих характеристик / И.Г. Уразбахтин // Прием и обработка информации в сложных информационных системах: Сб. Вып. 16. Казань: КГУ, 1987. с.

80. Уразбахтин, И.Г. Характеристики связности линейных непараметрических статистик /И.Г. Уразбахтин //Прием и обработка информации в сложных информационных системах: Сб. Вып. 18. Казань: КГУ, 1990. с.

81. Уразбахтин, И.Г. Основы идентификации в социально-экономических процессах / И.Г. Уразбахтин, J1.H. Уколова. Курск, 1998,180 с.

82. Уразбахтин, И.Г. Меры рассогласования квантильных функций / И.Г. Уразбахтин, JT.H. Уколова, Ф.Р. Аминеддин //Современные проблемы естественных наук: сб. науч. тр. ГТИ, Курский объединенный центр РАМ, РАЕН, МАИ, КГТУ, КГМУ. Курск, 1998. С. 230-233.

83. Urazbakhtin, I.G. Identification of the distribution by the method of reduced law / I.G. Urazbakhtin, L.N. Ukolova, F.R. Amineddin // The Egyptian statistical journal Institute of statistical, 1999. № 2, c.

84. Уразбахтин, И.Г. Меры рассогласования законов распределений вероятностей и их концептуальные модели / И.Г. Уразбахтин, J1.H. Уколова, Ф.Р. Аминед-дин // Известия, науч. изд. № 2. КГТУ, 1998. с. 46-55.

85. Фомин, В.Н. Математическая теория обучающих опознающих систем / В.Н. Фомин. JL: Изд. Ленингр. ун-та, 1976. 6-235 с.

86. Фомин, Я.А. Статистическая теория распознавания образов / Я.А. Фомин, Г.Р. Тарловский. М.: Радио и Связь, 1986. 264 с.

87. Фу, К.С. Структурные методы в распознавании образов / К.С. Фу. М.: Мир, 1977.319 с.

88. Хагстингс, И. Справочник по статистическим распределениям / И. Хагстинс, Дж. Пикок. М.: Статистика, 1980. 95 с.

89. Хачман, Г. Современный факторный анализ: пер. с англ. / Г. Хачман. М.: Статистика, 1972. 486 с.

90. Хеттманспергер, X. Статистические выводы, основанные на рангах / X Хеттманспергер. М.: Финансы и статистика, 1987. 334 с.

91. Химмельблау, Д. Анализ процессов статистическими методами / Д. Хим-мельблау. М.: Наука, 1977, 560 с.

92. Цеммель, Г.И. Опознавание речевых сигналов / Г.И. Циммель. М.: Наука, 1971. 148 с.

93. Цыпкин, Я.З. Информационная теория автоматических систем / Я.З. Цыт-кин. М.: Мир, 1977, 560 с.

94. Швырков, В.В. Тайна статистики Запада / В.В. Швырков. М.: Финансы и статистика. 1988.

95. Шеффе, Г. Финансовый анализ / Г. Шеффе. М.: Наука, 1980. 512 с.

96. Ширяев, А.Н. Статистическая последовательность анализа / А.Н. Ширяев. М.: Наука, 1979. 231 с.

97. Эйкхофф, П. Основы идентификации систем управления / П. Эйкхофф, под ред. Н.С. Райбмана. М.: Мир, 1975. 690 с.

98. Юсупов, P.M. Идентификация техническая диагностика /P.M. Юсупов, А.К. Дмитриев. М.: 1987. 521 с.р

99. Brown J.D. and Earle J.S/ Competition, Geography, and Firm Performance: Lesson from Russia.-CEPR/WDI Annual International Conference on Transition Economics, Moscow 2/5 July 2000.

100. Kawasaki S. and Zimmermann, K.F. Testing The Rationality of Price Expectations for Manufacturing Firms. Applied Economics 18,1335-47,1994.

101. Short-Term Economics Indicators. Transition Economies. -OECD, Paris, 1999.

102. Theil H.: Applied Economic Forecasting Amsterdam: North Holland, 1966.