автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Мера неопределенности информации в задаче выбора прогнозных решений

кандидата технических наук
Хрусталев, Виталий Игоревич
город
Абакан
год
2013
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Мера неопределенности информации в задаче выбора прогнозных решений»

Автореферат диссертации по теме "Мера неопределенности информации в задаче выбора прогнозных решений"

На правах рукописи

Хрусталев Виталий Игоревич

мера неопределенности информации

в задаче выбора прогнозных решений

Специальность 05.13.01 - Системный анализ, управление и обработка информации (космические и информационные технологии)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

гс дпр доз

005057901

Красноярск — 2013

005057901

Работа выполнена в Институте информационных технологий и инженерного образования ФГБОУ ВПО «Хакасский государственный университет им. Н. Ф. Катанова», г. Абакан

Научный руководитель: доктор технических наук, доцент

Дулесов Александр Сергеевич

Официальные оппоненты: Попов Алексей Михайлович,

доктор физико-математических наук, профессор, Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнёва, директор Института информатики и телекоммуникаций Пимонов Александр Григорьевич, доктор технических наук, профессор, Кузбасский государственный технический университет им. Т. Ф. Горбачева, профессор кафедры прикладных информационных технологий

Ведущая организация: ФГАОУ ВПО «Сибирский федеральный

университет», г. Красноярск

Защита состоится «17 » мая 2013 г. в 14 часов на заседании диссертационного совета Д 212.249.02, созданного на базе ФГБОУ ВПО «Сибирский государственный аэрокосмический университет имени академика М. Ф. Решетнёва» по адресу 660014, г. Красноярск, проспект имени газеты «Красноярский рабочий», 31.

С диссертацией можно ознакомиться в научной библиотеке Сибирского государственного аэрокосмического университета имени академика М. Ф. Решетнёва.

Автореферат разослан «I?-» апреля 2013 г.

Ученый секретарь диссертационного совета

Кузнецов

Александр Алексеевич

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. Современные задачи выработки прогнозных решений направлены на обеспечение эффективного управления сложной системой, сохранения её устойчивого состояния и обеспечения надлежащих связей с внешними объектами. Решение такого рода задач достигается в основном за счет внедрения новейших технологий, в том числе и информационных.

Влияние внешней среды на рассматриваемую систему трудно предсказать: налицо неопределенность информации. Поэтому требования к качеству выработки прогнозных решений не должны ограничиваться разработкой и использованием математических методов и информационных технологий. Востребованы новые подходы и способы решения вопросов, касающихся учета неопределенности информации в прогнозировании параметров как одного из элементов выработки проектных и плановых решений.

Прогнозирование решает вопросы, связанные с оценкой основных тенденций развития сложной системы, степени влияния факторов внутренней и внешней среды. Прогнозирование основывается на определении аналитических, формальных зависимостей между параметрами анализируемого объекта и реализуется с помощью методов и средств компьютерной технологии. Неопределенность информации здесь также накладывает свой отпечаток на получение конечного результата.

С развитием информационных технологий возрастает потребность в применении новых методов, основанных на теории информации, позволяющих оптимизировать различного рода отклонения при оценке перспективности прогнозных решений. Методы, положенные в основу выработки эффективной стратегии прогнозирования, должны быть ориентированы на получение благоприятного исхода с минимальным риском. Риск можно свести к минимуму, если из многообразия систем прогнозирования будет выбрана та, которая была бы адекватна реальным процессам. Технология выбора должна опираться на единую количественную меру оценки качества принимаемых прогнозных решений, то есть на меру неопределенности информации, или информационную энтропию.

Построенные модели, разработанные методы и алгоритмы посредством обработки данных и сопоставления прогнозных и фактических показателей позволят получить количественную меру, на основе которой можно принять решение о выборе качественной системы прогнозирования.

Степень разработанности проблемы. Совершенствованию систем прогнозирования посвящены многочисленные исследования, которые, прежде всего, направлены на получение точных прогнозных оценок. С другой стороны, повышение качества прогнозов и систем прогнозирования способствует развитию теории и практики научных прогнозов

и, в конечном итоге, развитию системного анализа. Поэтому в настоящей работе было выполнено исследование одной из важнейших проблем прогнозирования - выбор качественной системы прогнозирования, применение которой обеспечивало бы минимальный риск, обусловленный наличием неопределенности информации при подготовке прогноза.

Автор в своей работе опирался на исследования зарубежных и отечественных ученых. Работы Р. Хартли, К. Шеннона, У. Р. Эшби, М. А. Басина, Н. А. Кузнецова, В. А. Леуса, А. М. Хазена, И. В. Пранги-швили, Д. С. Чернавского, В. И. Корогодина, В. Гагина и многих других ученых позволили обобщить, систематизировать и логически структурировать исследования автора.

Объектом исследования является система прогнозирования и анализа прогнозных показателей.

Предмет исследования: информационные технологии анализа и обработки данных, методики и способы сопоставления и выбора эффективных прогнозных решений.

Цель диссертационной работы направлена на разработку модели, в основу которой положены инструменты определения меры неопределенности информации для выбора качественных прогнозных решений.

Для достижения поставленной цели предлагается решение задач:

- рассмотреть основные положения выработки прогнозных решений при составлении планов, подготовке проектов, относящихся к задачам с наличием неопределенности информации;

- оценить возможности применения методов анализа данных и прогнозирования, методик учета неопределенности информации в измерении показателей;

- обосновать роль теории информации в реализации проектных и плановых решений, возможности применения альтернативных методов определения информационной энтропии как меры неопределенности;

- принимая во внимание наличие неопределенности информации в технической системе, выделить свойства, особенности и способы определения энтропии для выбора её структурного содержания, удовлетворяющего выработке эффективных прогнозных решений;

- для определения информационной энтропии создать модель, разработать алгоритм и автоматизировать процесс поиска решений;

- выполнить эксперименты, подтверждающие адекватность модели и алгоритма выбора качественного метода прогнозирования.

Соответствие диссертационной работы избранной специальности. Согласно формуле специальности основным содержанием работы являются теоретические и прикладные исследования закономерностей развития объектов, ориентированные на повышение эффективности управления ими с использованием современных методов обработки информации.

Полученные результаты согласуются с областями исследований специальности 05.13.01 по пунктам 3 и 11, включая в себя: разработку моделей описания и решения задач обработки информации; методы и алгоритмы прогнозирования, оценки эффективности и качества сложных систем.

Методы исследования. Разработанные в диссертационной работе модели, методы и алгоритмы лежат в плоскости теории информации и прогнозирования. При решении поставленных задач применялись методы прогнозирования, анализа и обработки статистических данных, определения меры неопределенности информации, теории вероятностей и измерений, программной инженерии, а также теория геометрического обобщения данных.

Научная новизна работы состоит в следующем:

- выдвинуты теоретические предпосылки о необходимости определения меры неопределенности информации, которые послужили основополагающими материалами для разработки дополнительных инструментов в реализации задачи выбора эффективных прогнозных решений;

- рассмотрен и обоснован метод определения структурной сложности системы управления производством, который наделен дополнительными свойствами энтропии, позволяющими осуществлять выбор варианта структуры с минимальной неопределенностью;

- создана математическая модель определения энтропии состояния структуры технической системы производственного назначения, позволяющая в отличие от классической модели учитывать факторы выполнения и невыполнения планового задания;

- разработан метод определения б-энтропии, позволяющий в отличие от подхода Шеннона учитывать фактор неопределенности, обусловленный наличием рандомизированного расстояния между значениями исходных данных.

Основные защищаемые положения:

- распространение понятия «неопределенность», используемого в теории измерений, на задачу сопоставления прогнозных и фактических показателей;

- свойства, особенности и математическое описание способов определения энтропии для выбора эффективных прогнозных решений;

- модель, вычислительный алгоритм и программное обеспечение определения меры неопределенности информации;

- значения энтропии и погрешностей, их сопоставительная оценка, подтверждающие адекватность модели и алгоритма при выборе качественного метода прогнозирования.

Достоверность результатов. Обоснованность выдвинутых научных положений и представленных выводов подтверждается экспериментами, выполненными на основе строгого математического аппарата и компьютерного моделирования, результатами сопоставления прогнозных и фактических показателей.

Теоретическая значимость результатов диссертационного исследования состоит в создании модели, позволяющей оценивать структурное содержание технических систем через наличие в них неопределенности информации, а также в разработке метода для выбора эффективных технологий прогнозирования, где в качестве критерия принята информационная энтропия.

Практическая ценность. Распространение понятия «неопределенность», используемое в теории измерений, на задачу выбора прогнозных решений расширяет возможности выявления факторов, обеспечивающих достоверные прогнозируемые показатели.

По результатам (значениям энтропии), полученным на основе метода определения структурной сложности, можно осуществить выбор в пользу качественного варианта среди рассматриваемых структур управления.

Выделенные в модели свойства определения энтропии состояния структуры технической системы востребованы при разработке методов определения меры неопределенности в задаче выбора эффективных плановых решений.

Построенная и реализованная в виде программного обеспечения определения энтропии модель позволяет на основе сопоставления фактических значений со значениями, полученными различными инструментами прогнозирования, выбрать наиболее эффективный среди них.

Апробация работы. Основные результаты работы докладывались и обсуждались на 6-й международной научно-практической конференции «Глобальный научный потенциал» (г. Тамбов, 2010 г.), IX международной научно-практической конференции «Современные научные достижения - 2013» (г. Прага, 2013 г.), III Всероссийской научно-практической конференции «Научное творчество XXI века» с международным участием (г. Красноярск, 2010 г.), 2-й международной научно-практической конференции «Роль науки в устойчивом развитии общества» (г. Тамбов, 2010 г.), научно-практической конференции «Современные проблемы и пути их решения в науке, транспорте, производстве и образовании -2011» (Украина, 2011 г.), пятой международной научно-технической конференции «Инфокоммуникационные технологии в науке, производстве и образовании» (Инфоком-5) (Кисловодск, 2012), региональной научно-практической конференции «Катановские чтения» - секция «Новые информационные технологии» (г. Абакан, 2009-2013 гг.).

Публикации. По результатам исследований опубликовано 13 печатных работ, в том числе 5 в журналах, включенных в перечень ведущих рецензируемых научных журналов ВАК, зарегистрировано 3 программы для ЭВМ.

Гранты. Исследования выполнялись в рамках НИР: по заданию Федерального агентства по образованию - «Развитие синергетической теории

информации и моделирование поведения дискретных систем», 2010 г., «Развитие теории самоорганизации систем на принципах упорядоченности и двойственности их структур», 2011 г., «Совершенствование теории обработки и измерения информации применительно к управлению открытыми системами», 2012; грант РФФИ, проект 11-07-98021 рсибирьа, «Обобщенная энтропия как мера определения структурного содержания и надежности технических систем»; грант Хакасского государственного университета им. Н. Ф. Катанова, «Оценка реализации проектов на основе геометрического обобщения энтропии», 2010 г.

Структура и объем диссертации. Диссертация состоит из введения, четырех разделов, заключения, библиографического списка и приложений.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении содержится обоснование актуальности и описание текущего состояния проблемы. Имеется цель и задачи исследований. Представлены научная новизна и практическая значимость полученных результатов исследований. Приведены основные положения диссертационной работы, выносимые на защиту, сведения об апробации и внедрении результатов работы.

В первом разделе рассматриваются основные положения теории обработки данных и анализ методов прогнозирования, представлены положения выработки проектных и плановых решений, характер которых связан с понятием «неопределенность».

Показано, что неопределенность информации, порожденная воздействием труднопредсказуемых факторов, является основополагающим аспектом для построения моделей принятия решений, направленных на реализацию проектов и планов с минимальным риском, в которых система прогнозирования занимает ключевое место. Поскольку система прогнозирования должна быть эффективной, предлагается для выявления её качественного содержания использовать энтропию как меру неопределенности информации.

Дана формализованная постановка задачи, касающаяся необходимости создания моделей, методов и алгоритмов определения энтропии с целью сопоставления между собой методов прогнозирования для выбора наиболее качественного из них.

Для реализации данной задачи рассмотрен ряд существующих методов анализа данных и прогнозирования, применение которых позволяет получать удовлетворительные прогнозы. Среди методов обработки статистических данных были проанализированы: статистическое оценивание, дисперсионный анализ, корреляционно-регрессионный анализ, факторный анализ и др. Анализ показал, что для решения поставленной за-

дачи востребованы методы (например, факторный анализ), эффективность применения которых возрастает при совместном использовании с методами определения энтропии.

Из числа методов прогнозирования рассматривались только количественные методы, применяемые в случаях, когда есть основания полагать, что системные параметры имели определенную тенденцию (динамику), которая может продолжиться и в будущем. В числе дополнительных условий была принята достаточность информации для выявления таких тенденций. Проанализированы методы экстраполяции тренда, экономико-статистические и эконометрические методы, методы экспертных оценок, нормативные методы, нейросетевые модели прогнозирования, а также инструментальная среда их реализации. Анализ данных методов показал, что при прогнозировании параметров системы, особенно в условиях неопределенности, крайне желательно применение таких методов, которые позволяли бы с минимальным риском, то есть с наименьшей погрешностью, получать прогноз.

При сопоставлении результатов и выборе эффективного метода прогнозирования во внимание принята теория измерений, поскольку в ней понятие «погрешность измерений» соотносится с понятием «погрешность прогнозирования» в теории прогнозирования. Опираясь на данное соотношение понятий, в работе предусмотрено выполнение расчета отношения прогнозируемой величины к другой однородной величине, принятой за стандартную, или фактическую величину.

Поскольку в измерениях такие понятия, как «погрешность» и «неопределенность», совпадают (в части определения величины разности в сопоставляемых параметрах), понятие «неопределенность измерения» было заимствовано из теории измерений и распространено на задачу выбора качественной системы прогнозирования. В пользу введения в систему измерений прогнозируемых результатов понятия «неопределенность» представлены аргументы:

- при выборе наилучшего варианта прогноза требуется сопоставлять их с альтернативными данными (стандартные значения, нормативные показатели, фактические данные);

- определение дисперсии является косвенным показателем наличия неопределенности, так как позволяет иметь информацию лишь о том, насколько хорошо среднее значение результатов измерения воспроизводит истинное значение;

- понятие «неопределённость» позволяет наглядно решать вопрос о соответствии (несоответствии) прогнозных значений качеству установленных норм или фактическим результатам;

- если отойти от понятия «погрешность», то его можно заменить понятием «неопределенность», как это принято в зарубежной практике измерений. При этом можно использовать математические выражения

(например, формулы Р. Хартли, К. Шеннона, В. А. Леуса) для определения меры неопределенности информации.

Подход в применении понятия «неопределенность измерений» позволил на основе информации, полученной путем анализа погрешностей, перевести её на вероятностную основу и определить энтропию.

Во втором разделе рассматриваются возможности применения теории информации и энтропии как меры её неопределенности.

В начале раздела представлены обоснования необходимости исследований в области анализа и обработки информации:

- техническая система, её состояние и структурное содержание подлежат анализу на предмет содержания неопределенности информации, наличия порядка;

- анализ данных, факторов, приводящих систему к беспорядку, и их обработка позволяют определить энтропию как меру беспорядка в системе;

- выработка решений должна быть направлена на противостояние естественному росту энтропии, то есть на сохранение упорядоченности системы.

Показано, что с точки зрения управления информацией, планирование (включая и прогнозирование) не исключает наличие функции устранения неопределенности в системе.

В подтверждение выдвинутых теоретических обоснований рассматривался ряд примеров. С их помощью показано, что при статическом вероятностном анализе получение конкретного количества информации является результатом определенного выбора среди возможных состояний системы, включая и систему прогнозирования.

С целью получения наиболее точных оценок энтропии из теории информации выделены классические подходы, включающие в себя математические выражения, применение которых, в зависимости от объема и количества исходных данных системы, позволили бы судить о её состоянии. Среди существующих подходов в определении энтропии рассматривались методы Р. Хартли и К. Шеннона. При этом полагалось, что система должна быть представлена в виде структуры (или ансамбля) дискретных данных отделенной от содержательного наполнения системы. Ансамбли должны содержать числовые характеристики, отражающие плановые (прогнозные) значения и аналогичные показатели, зафиксированные в результате реализации плана.

В результате а нализа подходов в определении энтропии было выявлено следующее.

1. Мера информации (подход Р. Хартли) позволяет рассматривать дискретные состояния системы, когда исследуются влияния различных факторов, приводящих к изменению структуры системы. Учитывая воз-

можные состояния элементов системы как независимые события, можно определить степень неопределенности как сумму количества информации по каждому из элементов.

2. Стохастическая мера информации (подход К. Шеннона) позволяет получать результат определенного выбора среди вероятностной природы возможных состояний системы для дискретных систем:

т т

Я = 1о§/>, при условии, =1, (1)

1=1 /=1

где т - число признаков (значений ансамбля), которые может иметь (принять) каждый элемент ансамбля, р! — вероятность появления признака /.

3. Если подход Хартли справедлив для случая, когда сообщения дискретны и равновероятны, то формула (1) Шеннона позволяет определить среднее количество информации, которое содержится в одном сообщении из множества т неравновероятных сообщений.

4. Мера К. Шеннона для дискретных систем приемлема для определения энтропии в решении поставленной задачи.

Выбранный подход Шеннона стал основополагающим для разработки метода определения энтропии структурной простоты или сложности системы управления производством как совокупности системообразующих отношений на имеющемся субстрате (сложившейся основе). Суть метода заключается в следующем.

1. Рассматриваемая структура системы управления, состоящая из подразделений (или элементов), отображается в виде графа, в котором вершина отражает наличие в системе подразделения, а ребро — связь, которая определяет наличие отношения между двумя подразделениями.

2. Составляется список отношений г (например, прямое управление, непосредственное подчинение, косвенное управление, опосредованное подчинение и т. д.) из К наименований: ги ..., гк, ..., гК.

3. Каждому к-ыу отношению приписывается несколько дуг с единичной экстенсиональной длиной ///; где у - дуга графа.

4. Для каждой вершины графа формируется массив отношений, состоящий из экстенсиональных длин.

5. С использованием данного массива определяется величина вероятности пребывания элемента /' в А-м отношении по выражению: р.к =1/к//., где/, - суммарная длина, //А. - фактическая экстенсиональная длина отношения гк элемента /'.

6. На основе подхода К. Шеннона определяется энтропия, приходящаяся на одно отношение гк и один элемент: Н¡к =-Pik\ogpik . Энтропия по к отношениям, приходящаяся на элемент, определяется сумми-

к

рованием: Я, = p,k log pik . Общая энтропия системы управления для

*-=1

всех М массивов, имеющая отношение к структуре, вычисляется по формуле:

Я (2)

/=1 А=1

Величина Я по (2) рассматривалась как мера сложности. Обратное значение этой величины является мерой структурной простоты. В работе рассматривалось два варианта структуры управления: линейная и матричная. Расчеты Я по каждому из вариантов показали следующее. При прочих равных условиях вариант линейной организационной структуры управления более предпочтителен, поскольку не относится к сложным объектам и содержит меньшее количество неопределенности при управлении.

Третий раздел содержит свойства, математическую модель описания энтропии различных состояний технической системы и метод её нахождения с учетом геометрического обобщения статистических данных.

В начале раздела представлены предпосылки к созданию метода определения энтропии с учетом геометрического обобщения данных. На примере показано, что мера Шеннона не может претендовать на полный учет всех факторов, так как не позволяет учесть вариацию значений в ансамбле данных. Этот недостаток в работе устранен через реализацию нового подхода к понятию вероятностного пространства стохастических данных, которое должно быть снабжено геометрической структурой путем введения расстояния между элементарными событиями (исходами). Процедура построения вероятностного пространства «близости» данных предусматривает наличие и учет рандомизированного расстояния между значениями событий, и позволяет получить значения геометризованной энтропии, введенной в теорию информации В. А. Леусом.

Поскольку на основе структуры технической системы возможно определение меры её упорядоченности, потребовалась разработка модели. Она описывает свойства и выражения для определения энтропии как меры степени неопределенности, когда состояния элементов системы рассматриваются как независимые, совместные и возникающие при определенных условиях. В модели предприятие рассматривается как техническая система, обеспечивающая производство продукции с наличием структуры, состоящей из элементов. Особенностью модели (в отличие от уже существующих) является то, что каждый элемент может находиться в одном из двух состояний (исходов): первое - выполнение и перевыполнение планового задания (далее - выполнение); второе - невыполнение или недовыполнение планового задания (далее - невыполнение).

Значения вероятностей каждого из состояний предлагается получать расчетным путем исходя из опытной эксплуатации системы либо на основе статистических данных.

Краткое содержание модели. Рассматривая факт нахождения элемента в двух состояниях с вероятностью р выполнения задания и q невыполнения задания, можно получить энтропию:

Н = -(р log2 р + q log2 q) , при условии р + q = 1. (3)

Чтобы реализовать выражение (3) в общем виде, согласно теории определения меры информации выделены свойства, свидетельствующие о том, что энтропия:

1) является величиной вещественной и неотрицательной, так как всегда 0 < р < 1, log р< 0, и, следовательно, -р log р > 0 ;

2) ограничена из-за наличия условия: р + q = 1;

3) будет равна нулю, когда заранее известен исход опыта (/7 = 1 и q = 0, и наоборот: р = 0, q = 1);

4) максимальна, если оба состояния элемента равновероятны, то есть когдар = q = 0.5;

5) для бинарных (двоичных) сообщений может изменяться от нуля до единицы (см. п. 1);

6) достигает максимума, равного единице, при р - q = 0,5.

Опираясь на свойства и особенности применения, энтропия необходима для определения степени неопределенности сложных структур («составных опытов»), представляющих собой серии следующих друг за другом испытаний, отраженных в ансамблях данных. Для простейшей системы из двух элементов а и Р, когда элементы в системе функционируют независимо либо их состояния взаимообусловлены, модель предусматривает получение различного рода энтропий:

1. Энтропия элементов, функционирующих независимо. Условие о независимости функционирования элементов формально, так как в технической системе большинство из них связано между собой как структурно, так и функционально. Рассматривая выполнение и невыполнение заданий элементами системы в качестве опытов а и Р, для каждого из них фиксируется по два исхода с вероятностями р и q. Для такого обобщенного опыта выполняется правило сложения энтропий:

Я(а + р) = Я(сх) + Я(Р) (4)

В развернутом виде энтропия (4) для двух независимо функционирующих элементов записывается следующим образом:

т=2

н(а + Р) = -X! (Pi loSPi + Я/ logqt) при условии Pi+q,=l, (5) /=1

где р, - вероятность выполнения задания /-м элементом системы.

Для п независимо функционирующих элементов:

"(I ) = "!>/ 1о8 Л + ^ - Л >^С1 - Р>)) (б)

2. Совместная энтропия. Наличие связей между элементами технической системы указывает на то, что события (опыты) в ней являются совместными. Модель содержит математическое описание в получении энтропии совместного появления для двух статистически зависимых элементов (опытов) а и Р:

т п I" »

Я(аР) = -£Х /7(а(р}) 1о8 р(а,-ру), при £ £ р(а,Р;) = 1, (7)

1=1 ./=1 /=1 7 = 1

где символы / и у означают, соответственно, порядковые номера исходов.

Совместная энтропия по (7) является мерой неопределенности, или мерой разнообразия состояний системы. Выражения для определения совместной энтропии можно применить тогда, когда техническая система рассматривается с позиции неопределенности её разнообразных состояний с тем, чтобы иметь возможность сравнивать их между собой.

3. Условная энтропия. Востребована при анализе функционирования технической системы, когда результат события а может полностью определяться результатом второго события р.

Дано математическое описание получения условной энтропии сложного опыта из аир, которая в общем виде определяется как

Я(р /а) = Н(а) + Н{В / а), (8)

где И (В/ а) = р(а)Н® / а) + р(а)Н(а / Р).

Выражение (8) соотносится с правилом сложения энтропий. Средняя условная энтропия Н(р/а), выполнение которой не предполагает заранее известным исход а, глубоко отражает взаимосвязь между элементами аир.

Свойства и математические выражения энтропии (4)-(8), содержащиеся в модели, являются основой для разработки методов определения меры упорядоченности технической системы, когда её элементы могут находиться в различных вероятностных состояниях.

С опорой на предпосылки к созданию методов определения энтропии в работе рассмотрены возможности её определения с учетом геометризованного расстояния между значениями статистических данных.

Геометризованная энтропия. Как отмечалось выше, в основе энтропийного подхода вычисления информации лежит формула Шеннона (1) для дискретных систем, которая позволяет измерять информацию количественно только при наличии вероятностных свойств сообщений. Все

иные свойства, такие как величина параметров, полезность, принадлежность и пр., не принимаются в расчет. Устранение данного недостатка рассматривается в диссертационной работе посредством введения в формулу Шеннона расстояния между двумя значениями из ансамбля данных. Суть его в следующем. При определении энтропии случайного распределения показателей, кроме рандомизированной меры вероятности р, вводится симметричная неотрицательная вещественнозначная функция p(x,, х ■) от пар исходов х на основном множестве вероятностного ансамбля как «рандоминизированное» расстояние р. Оно подчиняется естественному условию р„ =0 и ограничено единицей: 0 < р(х/,х/) = р(/ < 1.

Значение определяется как расстояние между значениями событий i и /, то есть р, =—--1—.

V — V шах min

В качестве априорной меры неопределенности дискретного вероятностного ансамбля с расстоянием принята геометризованная энтропия, получившая название Б-энтропия, которая определяется в битах по формуле:

т т т

Вр(Р) = "X Pi 1о§2 ПРИ условии j>;- =1. (9)

(=1 7=1 7=1

Опираясь на условие о независимости состояний рассматриваемого элемента и системы в целом, выделены свойства, присущие Ä-энтропии:

1) является величиной вещественной и неотрицательной, так как всегда 0 < р < 1 и 0 < р(/ < 1;

2) ограничена в пределах 0 < Вр < 1;

3) будет равна нулю, если все р(/ = 0 (когда в ансамбле из /я данных для всех значений выполняется условие: xi = xt;

4) переходит в уравнение Шеннона при р,у = 1 и р,7 = 0 ;

5) максимальна (Вр =1), когда Vp„ = 0,рг = р2 =,..., р, =,...,= рм и множество {х,} разделено на два равных подмножества с постоянными значениями х, в каждом.

В работе представлены примеры вычисления по формуле Шеннона (1) и ß-энтропии (9), результаты сопоставлены между собой.

Наличие свойств, сопоставление и анализ расчетов показали присутствие существенной разницы в значениях энтропий. ß-энтропия обладает возможностями учета не только исходов, но и соотношений между значениями для пар исходов.

Для расчета неопределенности информации в прикладных задачах использование формулы 5-энтропии оправданно с точки зрения получения точных оценок. Я-энтропия, по сути, явилась критерием для отбора качественной системы прогнозирования. Её значение является мерой несовпадения фактических и запланированных параметров.

Четвертый раздел содержит модель, алгоритм, программу и результаты определения энтропии (с учетом геометрического обобщения данных) применительно к задаче сопоставления прогнозных и фактических показателей.

Модель определения энтропии. Отклонения прогнозных от фактических значений для фиксированных моментов времени несут в себе вероятностную природу флуктуации. Разности этих значений (исходы) представляют собой множество X = (х,,*?,...,;<:,■,...,*,„}, состоящее из т элементов. На данном множестве задается распределение вероятностей р(х), если каждому исходу х< поставлено в соответствие число р(х,) такое, что для всех 1= 1, 2, ..., т должно быть р(х1) > О, ]Г р(х,) = 1. Множество^

вместе с заданным на нём распределением вероятностей является дискретным вероятностным или дискретным ансамблем {X, р(х,)} с т возможными состояниями (разностями):

X =

> ''''5 > ■ * '-^т

,р,■ = р(х,) = 0,^Гр, =1. (10)

Поскольку вероятности р; не равны между собой, то естественным считается требование: мера неопределенности должна быть непрерывной функцией вероятностей р, (/ = 1, 2, ..., т) элементов дискретного ансамбля. Удовлетворяющая этому требованию мера является энтропией:

т

Я(^) = -]>>(*, )1оЕ/?(х,). (11)

/=1

В ансамбле (10) энтропия Н(Х) позволяет измерять информацию количественно и является априорной мерой неопределенности выбора.

Имея результаты Н(Х) для различных соотношений прогнозных и фактических значений, можно судить о мере неопределенности выбора вариантов прогноза или степени отклонения параметров от стандартных значений. В последнем случае значения х, множества X распределены по времени - х,(/), определяемые величины р(х,-) также связаны со временем— р(х,,/).

В случае больших по размерам ансамблей данных модель предусматривает процедуру построения гистограммы, на основе которой опре-

деляются вероятности состояний. При этом диапазон варьирования переменной х выбирается в зависимости от требований, предъявляемых к измеряемой величине.

Представленная формула (11) соответствует классической формуле Шеннона определения энтропии через вероятностные свойства отклонений параметров. Для расчета энтропии с учетом геометрического обобщения параметров востребована формула (9).

Алгоритм определения энтропии, реализованный на ЭВМ, является составной частью упомянутой выше модели, предусматривает реализацию задачи о выборе эффективного метода прогнозирования по (9)-{11).

Для автоматизации обработки данных выполнен анализ программных средств. В качестве базовой технологии реализации программы выбрана платформа Microsoft.NET и язык С# среды разработки - Microsoft Visual Studio 2010.

Разработано программное обеспечение (ПО), включающее в себя ряд блоков: аналитический; формирования и обработки данных; взаимодействия «клиент-сервер»; визуализации данных. ПО позволяет пользователю строить графики прогнозных и фактических показателей, графики их разностей; гистограммы распределения разностей; графики значений энтропии по Шеннону и ß-энтропии; выбирать шаги квантования; хранить и обращаться к данным как в компьютере, так и на сервере; распечатывать результаты и др.

Практическая реализация алгоритма и ПО определения энтропии касалась решения двух практических задач выбора наиболее качественного метода прогнозирования. В получении прогнозных значений рассматривались возможности использования таких систем, как нейросетевой метод, SPSS и Statistica. Предварительный анализ динамики статистических данных на основе модифицированного метода скользящей средней показал: для большинства вышеупомянутых систем прогнозирования камнем преткновения являются резкие колебания параметра на краткосрочных интервалах времени, малая выборка, недостаток данных.

1-я задача касалась вопросов выбора для предприятия «Энергосбыт» (г. Абакан) метода прогнозирования электропотребления объектами Хакасии на каждый час предстоящих суток («на сутки вперед»).

Применив каждую из систем, получены прогнозные значения электропотребления «на сутки вперед». При сопоставлении их с фактическими данными рассчитаны значения погрешностей - среднеквадратичной и относительной. Используя ПО, для каждой из рассматриваемых систем прогнозирования определены значения энтропии по Шеннону и В-энтропии. Значения энтропии и погрешностей явились основанием для сопоставления методов прогнозирования между собой (табл. 1).

2-я задача касалась выбора метода прогнозирования для прогноза отраслевых показателей субъектов Российской Федерации. Значения эн-тропий явились основанием для сопоставления методов (табл. 2).

Таблица I

Сопоставление методов прогнозирования

Методы и технологии Оценки

Средняя квадратичная погрешность, МВт-ч Средняя относительная погрешность, % Энтропия по Шеннону, бит В-энтропия, бит

Система прогнозирования предприятия «Энергосбыт» 0,12 3,10 2,66 0,04

Нейросетевой метод 0,23 5,69 3,50 0,14

SPSS экспертное построение моделей 0,07 1,48 1,95 0,01

SPSS экспоненциальное сглаживание 0,11 2,33 2,48 0,03

Statistica 0,17 4,17 2,99 0,06

Максимальная величина - 100 7,39 1.0

Таблица 2

Сопоставление методов прогнозирования

Показатели субъекта РФ Нейросеть SPSS Эксперт построения моделей SPSS Экспоненциальное сглаживание Statistica

Индекс промышленного производства 2,22/0,78 2,91/0,59 3,27/0,70 3,02/0,63

Добыча полезных ископаемых 3,12/0,58 3,27/0,62 3,27/0,70 2,55/0,63

Обрабатывающая промышленность 3,09/0,70 2,70/0,80 3,09/0,75 2,91/0,58

Производство и распределение электроэнергии 3,45/0,76 3,27/0,64 3,45/0,71 3,45/0,67

Примечание- в числителе указаны значения энтропии по Шеннону, в знаменателе — 5-энтропии. бит.

Как видно из табл. 1 и 2, сопоставляя значения энтропии, можно сделать выбор в пользу эффективного количественного метода прогнозирования.

Предложенный алгоритм определения энтропии может быть полезен не только для сопоставления прогнозных, но и плановых показателей с фактическими данными, что позволит судить о степени подготовленности того или иного плана.

ОСНОВНЫЕ ВЫВОДЫ ПО РАБОТЕ

Решение задачи определения меры неопределенности информации при выборе прогнозных решений дало следующие результаты:

1. Рассмотрены основополагающие аспекты выработки прогнозных решений в их увязке с понятием «неопределенность информации», которое является важнейшим фактором построения моделей принятия решений с минимальным риском.

2. Анализ классических методов прогнозирования и обработки данных показал необходимость их модернизации, создания и применения новых методов, алгоритмов и программ ЭВМ, результативность которых повысится за счет возможностей измерения неопределенности информации.

3. Рассмотрены теоретические положения об измерениях показателей, обоснованы перспективы и возможности использования понятия «неопределенность информации» в процессе сопоставления прогнозных параметров с нормативными (фактическими).

4. Показана необходимость применения энтропийного подхода, позволяющего определять (измерять) информацию, содержащуюся в исследуемом объекте относительно объектов, с которыми он взаимодействует. Выделены классические подходы Хартли и Шеннона в определении меры информации. Отмечена важность и выявлены возможности каждого из них в задаче определения энтропии результатов прогнозирования.

5. Разработан метод определения энтропийной меры структурной сложности (простоты) системы управления производственным процессом. Полученные величины энтропии позволяют судить о сложности каждого из рассматриваемых структурных вариантов системы управления.

6. Для определения меры упорядоченности технической системы выделены различные вероятностные состояния её элементов (к которым отнесены выполнение и невыполнение планового задания), рассмотрены свойства и построены математические выкладки определения энтропии. Полученные результаты могут послужить основой для разработки методов определения энтропии состояния технических систем, в которых элементная структура изменяется под воздействием вероятностных факторов.

7. Показано, что при создании информационных технологий обработки данных и определения энтропии необходим новый подход к понятию вероятностного пространства стохастических данных, которое должно быть снабжено геометрической структурой путем введения расстояния между элементарными событиями (исходами).

8. Рассмотрена математическая модель геометрического обобщения энтропии (б-энтропии). На основе данной модели выделены свойства В-энтропии и разработан алгоритм нахождения её величины, позволяющий (в отличие от подхода Шеннона) учитывать разность между значениями рассматриваемых статистических данных.

9. Разработано программное обеспечение определения информационной энтропии по Шеннону и б-энтропии, включающее в себя набор визуальных компонент, технологию привязки данных к элементам пользовательского интерфейса и гибкий механизм настройки отображения элементов интерфейса.

10. Применительно к деятельности предприятия «Энергосбыт» (г. Абакан) выполнена задача прогнозирования потребления электроэнергии различными методами. Сопоставительная оценка отклонений прогнозных показателей от фактических и определение значений информационной энтропии позволили выбрать наиболее качественный метод прогнозирования.

11. Результаты исследований используются в учебном процессе при подготовке студентов информационных специальностей/направлений в Хакасском государственном университете им. Н. Ф. Катанова, а также предприятием «Энергосбыт» (г. Абакан) для прогнозирования электропотребления «на сутки вперед».

СПИСОК ПУБЛИКАЦИЙ АВТОРА ПО ТЕМЕ ДИССЕРТАЦИИ

Статьи, опубликованные в журналах по перечню ВАК

1. Хрустапев, В. И. Свойства энтропии технической системы [Текст] /

B. И. Хрусталев, А. С. Дулесов, М. Ю. Семенова // Фундаментальные исследования. - 2011. - № 8. - С. 631-637.

2. Хрусталев, В. И. Применение формулы Шеннона и геометрического обобщения для определения энтропии [Текст] / В. И. Хрусталев,

A. С. Дулесов, С. В. Швец // Перспективы науки. - 2010. - № 3 (05). -

C. 94-98.

3. Хрусталев, В. И. Совершенствование системы управления производством: определение энтропийной меры ее субстрактно-структурной сложности [Текст] / В. И. Хрусталев, Н. В. Дулесова // Перспективы науки. - 2010. -№ 8(10). - С. 33-37.

4. Хрусталев, В. И. Определение энтропии как меры информации при сопоставлении прогнозных и фактических показателей предприятия [Электронный ресурс] / В. И. Хрустапев, А. С. Дулесов // Современные проблемы науки и образования. - 2012. - № 1. — URL: www.science-education.ru/101-5290 (дата обращения: 17.01.2012).

5. Хрусталев В. И. Анализ сезонных и суточных колебаний электропотребления на основе скользящей средней [Текст] / А. С. Дулесов,

B. И. Хрусталев, Р. И. Хрусталев // В мире научных открытий. -2013. - № 2 (38). - С. 52-66.

Монографии

6. Хрусталев, В. И. Неопределенность информации в задаче прогнозирования [Текст] / В. И. Хрусталев, А. С. Дулесов // Информационные технологии: приоритетные направления развития : монография / А. Б. Андросик и др. ; под ред. С. С. Чернова. - Новосибирск, 2012. -

C. 97-112.

Другие публикации

7. Хрусталев, В. И. Информационные взаимосвязи в технических системах и оценка количества информации [Текст] / В. И. Хрусталев, А. С. Дулесов, Т. В. Карпушева // В мире научных открытий : материалы III Всероссийской научно-практической конференции «Научное творчество XXI века» с международным участием. - Красноярск, 2010.-С. 56-60.

8. Хрусталев, В. И. Определение энтропии с учетом геометрического обобщения сложного ансамбля данных [Текст] / В. И. Хрустапев //

Глобальный научный потенциал: материалы 6-й международной научно-практической конференции. - Тамбов, 2010. - С. 56-58.

9. Хрусталев, В. И. В-энтропия сложного ансамбля данных инвестиционного проекта [Текст] / В. И. Хрусталев, Н. В. Дулесова // Роль науки в устойчивом развитии общества : материалы 2-й международной научно-практической конференции. - Тамбов, 2010. - С. 153-156

10. Хрусталев, В. И. Неопределенность в системе измерений прогнозируемых параметров [Текст] / В. И. Хрусталев, А. С, Дулесов // Сборник трудов БшогИ : материалы международной научно-практической конференции «Современные проблемы и пути их решения в науке, транспорте, производстве и образовании - 2011». - Выпуск 4. Том 5. - Одесса : Черноморье, 2011. - С. 38-41.

И. Хрусталев, В. И. Алгоритм выбора эффективного количественного метода прогнозирования [Текст] / В. И. Хрусталев, А. С. Дулесов // Вестник Хакасского государственного университета им. Н. Ф. Ката-нова. - Абакан, 2012. - С. 27-29.

12. Хрусталев, В. И. Алгоритм определения энтропии для выбора качественного метода прогнозирования [Текст] / В. И. Хрусталев, А. С. Дулесов // Инфоком-5 : материалы пятой международной научно-технической конференции «Инфокоммуникационные технологии в науке, производстве и образовании». - Кисловодск, 2012. - С. 184-187.

13. Хрусталев, В. И. Выбор структуры системы управления на основе меры неопределенности информации [Текст] / В. И. Хрусталев, Р. И. Хрусталев, А. С. Дулесов, Т. В. Гаврилова // Современные научные достижения -2013 : материалы IX Международной научно-практической конференции. - Прага, 2013. - С. 37-40.

Свидетельства о регистрации электронного ресурса

14. Вычисление энтропии ансамбля данных: свидетельство о регистрации № Р1Ш042 / В. И. Хрусталев, А. А. Коняев ; Фонд алгоритмов и программ СО РАН, дата регистрации 14.06.2011.

15. Определение меры неопределенности информации по Шеннону: свидетельство о государственной регистрации программы для ЭВМ № 2012610018 / В. И. Хрусталев ; ФГБУ «Федеральный институт промышленной собственности», дата регистрации 10.01.2012.

16. Вычисление энтропии с учетом геометрического обобщения данных: свидетельство о государственной регистрации программы для ЭВМ № 2012610848 / В. И. Хрусталев; ФГБУ «Федеральный институт промышленной собственности», дата регистрации 10.05.2012.

Подп. в печать 10.04 2013. Формат 60x84/16. Бумага «Снегурочка». Усл. печ. л. 1,32. Уч.-изд. л. 1,12. Тираж 100 экз. Заказ 2306

Отпечатано в полиграфической лаборатории ХТИ - филиала СФУ 655017, Абакан, ул. Щетинкина, 27

Текст работы Хрусталев, Виталий Игоревич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

МИНОБРНАУКИ РОССИИ ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «ХАКАССКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ ИМ. Н.Ф. КАТАНОВА»

МЕРА НЕОПРЕДЕЛЕННОСТИ ИНФОРМАЦИИ В ЗАДАЧЕ ВЫБОРА

ПРОГНОЗНЫХ РЕШЕНИЙ

05.13.01 - Системный анализ, управление и обработка информации (космические и информационные технологии)

Хрусталев Виталий Игоревич

04201358698

ДИССЕРТАЦИЯ на соискание ученой степени кандидата технических наук

Научный руководитель: доктор технических наук, доцент Дулесов Александр Сергеевич

Абакан - 2013

СОДЕРЖАНИЕ

ВВЕДЕНИЕ........................................................................... 4

1. ОСНОВНЫЕ ПОЛОЖЕНИЯ ТЕОРИИ И АНАЛИЗ МЕТОДОВ ПРОГНОЗИРОВАНИЯ......................................................................... 11

1.1 Основополагающие аспекты проектных и плановых

решений................................................................................. 11

1.2 Неопределенность информации как фактор воздействия на выработку решений.................................................................. 17

1.3. Постановка задачи исследований.................................... 21

1.4. Задачи и методы анализа данных и прогнозирования........... 24

1.5. Анализ возможностей системы измерений параметров с учетом наличия неопределенности информации.............................. 37

Выводы............................................................................. 45

2. ВОЗМОЖНОСТИ ПРИМЕНЕНИЯ ТЕОРИИ ИНФОРМАЦИИ И ЭНТРОПИИ КАК МЕРЫ НЕОПРЕДЕЛЕННОСТИ ИНФОРМАЦИИ... 47

2.1 Оценка возможностей энтропийного подхода к задаче определения меры неопределенности............................................ 48

2.2 Возможные пути и классические подходы к определению количества информации................................................................ 52

2.3 Определение энтропийной меры структурной сложности системы управления................................................................... 60

Выводы............................................................................. 78

3. МОДЕЛИ И МЕТОДЫ ОПРЕДЕЛЕНИЯ ЭНТРОПИИ С УЧЕТОМ ГЕОМЕТРИИ ДАННЫХ................................................................... 80

3.1 Предпосылки к созданию метода определения энтропии....... 82

3.2. Определение энтропии структурного содержания системы... 86

3.3 Определения энтропии с учетом геометрического обобщения

данных....................................................................................................................................................................98

Выводы..........................................................................................................................................................104

4. РЕАЛИЗАЦИЯ ЗАДАЧИ ОПРЕДЕЛЕНИЯ ЭНТРОПИИ ПРИ СОПОСТАВЛЕНИИ ПРОГНОЗНЫХ И ФАКТИЧЕСКИХ

ПОКАЗАТЕЛЕЙ..............................................................................................................................................105

4.1 Модель и алгоритм определения энтропии....................................................105

4.2 Анализ средств программной реализации......................................................111

4.3 Программная реализация задачи определения энтропии................123

4.4 Сопоставительная оценка результатов..............................................................126

4.5 Предварительный анализ статистических данных (на

примере почасового электропотребления)..............................................................................129

4.6. Практическая реализация алгоритма определения энтропии в задаче сопоставления прогнозных и фактических показателей........................140

4.7. Выбор метода для прогнозирования отраслевых показателей субъектов РФ..................................................................................................................................................146

Выводы..................................................................................................................................................148

ЗАКЛЮЧЕНИЕ................................................................................................................................................150

БИБЛИОГРАФИЧЕСКИЙ СПИСОК........................................................................................152

ПРИЛОЖЕНИЕ 1............................................................................................................................................161

ПРИЛОЖЕНИЕ 2............................................................................................................................................168

ПРИЛОЖЕНИЕ 3............................................................................................................................................187

ПРИЛОЖЕНИЕ 4............................................................................................................................................188

ВВЕДЕНИЕ

Актуальность работы. Современные задачи выработки прогнозных решений направлены на обеспечение эффективного управления сложной системой, сохранения её устойчивого состояния и обеспечения надлежащих связей с внешними объектами. Решение такого рода задач достигается в основном за счет внедрения новейших технологий, в том числе и информационных.

Влияние внешней среды на рассматриваемую систему трудно предсказать: налицо неопределенность информации. Поэтому требования к качеству выработки прогнозных решений не должны ограничиваться разработкой и использованием математических методов и информационных технологий. Востребованы новые подходы и способы решения вопросов, касающихся учета неопределенности информации в прогнозировании параметров как одного из элементов выработки проектных и плановых решений.

Прогнозирование решает вопросы, связанные с оценкой основных тенденций развития сложной системы, степени влияния факторов внутренней и внешней среды. Прогнозирование основывается на определении аналитических, формальных зависимостей между параметрами анализируемого объекта и реализуется с помощью методов и средств компьютерной технологии. Неопределенность информации здесь также накладывает свой отпечаток на получение конечного результата.

С развитием информационных технологий возрастает потребность в применении новых методов, основанных на теории информации, позволяющих оптимизировать различного рода отклонения при оценке перспективности прогнозных решений. Методы, положенные в основу выработки эффективной стратегии прогнозирования, должны быть ориентированы на получение благоприятного исхода с минимальным риском. Риск можно свести к минимуму, если из многообразия систем прогнозирования будет выбрана та, которая была бы адекватна реальным

процессам. Технология выбора должна опираться на единую количественную меру оценки качества принимаемых прогнозных решений, то есть на меру неопределенности информации, или информационную энтропию.

Построенные модели, разработанные методы и алгоритмы посредством обработки данных и сопоставления прогнозных и фактических показателей позволят получить количественную меру, на основе которой можно принять решение о выборе качественной системы прогнозирования.

Степень разработанности проблемы. Совершенствованию систем прогнозирования посвящены многочисленные исследования, которые, прежде всего, направлены на получение точных прогнозных оценок. С другой стороны, повышение качества прогнозов и систем прогнозирования способствует развитию теории и практики научных прогнозов и, в конечном итоге, развитию системного анализа. Поэтому в настоящей работе было выполнено исследование одной из важнейших проблем прогнозирования -выбор качественной системы прогнозирования, применение которой обеспечивало бы минимальный риск, обусловленный наличием неопределенности информации при подготовке прогноза.

Автор в своей работе опирался на исследования зарубежных и отечественных ученых. Работы Р. Хартли, К. Шеннона, У. Р. Эшби, М. А. Басина, Н. А. Кузнецова, В. А. Леуса, А. М. Хазена, И. В. Прангишвили, Д. С. Чернавского, В. И. Корогодина, В. Гагина и многих других ученых позволили обобщить, систематизировать и логически структурировать исследования автора.

Объектом исследования является система прогнозирования и анализа прогнозных показателей.

Предметом исследования являются информационные технологии анализа и обработки данных, методики и способы сопоставления и выбора эффективных прогнозных решений.

Цель диссертационной работы направлена на разработку модели, в основу которой положены инструменты определения меры

неопределенности информации для выбора качественных прогнозных решений.

Для достижения поставленной цели предлагается решение задач:

• рассмотреть основные положения выработки прогнозных решений при составлении планов, подготовке проектов относящихся к задачам с наличием неопределенности информации;

• оценить возможности применения методов анализа данных и прогнозирования, методик учета неопределенности информации в измерении показателей;

• обосновать роль теории информации в реализации проектных и плановых решений, возможности применения альтернативных методов определения информационной энтропии как меры неопределенности;

• принимая во внимание наличие неопределенности информации в технической системе, выделить свойства, особенности и способы определения энтропии для выбора её структурного содержания, удовлетворяющего выработке эффективных прогнозных решений;

• для определения информационной энтропии создать модель, разработать алгоритм и автоматизировать процесс поиска решений;

• выполнить эксперимент подтверждающий адекватность модели и алгоритма выбора качественного метода прогнозирования.

Соответствие диссертационной работы избранной специальности.

Согласно формуле специальности основным содержанием работы являются теоретические и прикладные исследования закономерностей развития объектов, ориентированные на повышение эффективности управления ими с использованием современных методов обработки информации.

Полученные результаты согласуются с областями исследований (специальности 05.13.01 по пунктам 3 и 11) включая в себя: разработку моделей описания и решения задач обработки информации; методы и

алгоритмы прогнозирования, оценки эффективности и качества сложных систем.

Методы исследования. Разработанные в диссертационной работе модели, методы и алгоритмы лежат в плоскости теории информации и прогнозирования. При решении поставленных задач применялись методы прогнозирования, анализа и обработки статистических данных, определения меры неопределенности информации, теории вероятностей и измерений, программной инженерии и теория геометрического обобщения данных.

Научная новизна работы состоит в следующем:

■ выдвинуты теоретические предпосылки о необходимости определения меры неопределенности информации, которые послужили основополагающими материалами для разработки дополнительных инструментов в реализации задачи выбора эффективных прогнозных решений;

■ рассмотрен и обоснован метод определения структурной сложности системы управления производством, который наделен дополнительными свойствами энтропии, позволяющими осуществлять выбор варианта структуры с минимальной неопределенностью;

■ создана математическая модель определения энтропии состояния структуры технической системы производственного назначения, позволяющая в отличие от классической модели учитывать факторы выполнения и невыполнения планового задания;

■ разработан метод определения Б-энтропии, позволяющий в отличие от подхода Шеннона учитывать фактор неопределенности, обусловленный наличием рандомизированного расстояния между значениями исходных данных.

Практическая ценность работы Распространение понятия «неопределенность», используемое в теории измерений, на задачу выбора прогнозных решений расширяет возможности выявления факторов, обеспечивающих достоверные прогнозируемые показатели.

По результатам (значениям энтропии), полученным на основе метода определения структурной сложности, можно осуществить выбор в пользу качественного варианта среди рассматриваемых структур управления.

Выделенные в модели свойства определения энтропии состояния структуры технической системы востребованы при разработке методов определения меры неопределенности в задаче выбора эффективных плановых решений.

Построенная и реализованная в виде программного обеспечения определения энтропии модель позволяет на основе сопоставления фактических значений со значениями, полученными различными

инструментами прогнозирования, выбрать наиболее эффективный среди них.

Основные положения, выносимые на защиту:

• гипотеза о применимости понятия «неопределенность» в системе измерений к задаче сопоставления прогнозных и фактических показателей;

• свойства, особенности и математическое описание способов определения энтропии для выбора эффективных прогнозных решений;

• модель, вычислительный алгоритм и программное средство определения энтропии для выбора качественных прогнозных решений;

• результаты, полученные на основе расчета меры неопределенности информации и погрешностей, подтверждающие адекватность модели и алгоритма выбора качественного метода прогнозирования

Достоверность результатов. Обоснованность выдвинутых научных положений и представленных выводов подтверждается экспериментами, выполненными на основе строгого математического аппарата и компьютерного моделирования, результатами сопоставления прогнозных и фактических показателей.

Использование результатов. Результаты работы внедрены в образовательный процесс подготовки студентов информационных

специальностей/направлений в Хакасском государственном университете им. Н. Ф. Катанова.

Апробация работы. Основные результаты работы докладывались и обсуждались на 6-й международной научно-практической конференции «Глобальный научный потенциал» (г. Тамбов, 2010 г.), IX международной научно-практической конференции «Современные научные достижения -2013» (г. Прага, 2013 г.), III Всероссийской научно-практической конференции «Научное творчество XXI века» с международным участием (г. Красноярск, 2010 г.), 2-й международной научно-практической конференции «Роль науки в устойчивом развитии общества» (г. Тамбов, 2010 г.), научно-практической конференции «Современные проблемы и пути их решения в науке, транспорте, производстве и образовании - 2011» (Украина, 2011 г.), пятой международной научно-технической конференции

«Инфокоммуникационные технологии в науке, производстве и образовании» (Инфоком-5) (Кисловодск, 2012), региональной научно-практической конференции «Катановские чтения» - секция «Новые информационные технологии» (г. Абакан, 2009-2013 гг.).

Публикации. По результатам исследований опубликовано 13 печатных работ, в том числе 5 в журналах, включенных в перечень ведущих рецензируемых научных журналов ВАК, зарегистрировано 3 программы для ЭВМ.

Гранты. Исследования выполнялись в рамках НИР: по заданию Федерального агентства по образованию - «Развитие синергетической теории информации и моделирование поведения дискретных систем», 2010 г. - «Развитие теории самоорганизации систем на принципах упорядоченности и двойственности их структур», 2011 г.; «Совершенствование теории обработки и измерения информации применительно к управлению открытыми системами», 2012; грант РФФИ, проект 11-07-98021 р_сибирь_а, «Обобщенная энтропия как мера определения структурного содержания и надежности технических систем»; грант Хакасского государственного

университета им. Н. Ф. Катанова, «Оценка реализации проектов на основе геометрического обобщения энтропии», 2010 г.

В первом разделе рассматриваются основные положения теории обработки данных и анализ методов прогнозирования, представлены положения выработки проектных и плановых решений, характер которых связан с понятием «неопределенность».

.Во втором разделе рассматриваются возможности применения теории информации и энтропии как меры её неопределенности.

Третий раздел содержит описание свойств, математическую модель описания энтропии различных состояний производственной системы и метод её нахождения с учетом геометрического обобщения статистических данных.

Четвертый раздел содержит модель, алгоритм, программу и результаты определения энтропии (с учетом геометрического обобщения данных) применительно к задаче сопоставлении прогнозных и фактических показателей.

Структура и объем диссертации. Диссертация состоит из введения, 4 разделов с выводами к ним, заключения, библиографического списка и приложений. Материал изложен на 140 страницах, содержит 3 таблицы, 12 рисунков и 4 приложения. Список цитируемой литературы содержит 94 наименования.

1. ОСНОВНЫЕ ПОЛОЖЕНИЯ ТЕОРИИ И АНАЛИЗ МЕТОДОВ

ПРОГНОЗИРОВАНИЯ

Содержательная часть настоящего раздела включает в себя:

• рассмотрение сущности выработки проектных и плановых решений при информационной поддержке для жизнеобеспечения технических систем;

• вопросы, касающиеся наличия неопределенности в процессе выработки решений, её роли при получении искомых решений;

• формализованную постановку задачи сопоставления способов и методов прогнозирования с целью выбора из них наиболее приемлемого, с меньшим риском варианта;

• анализ методов обработки данных и прогнозирования с целью оценки их возможностей в получении конечного результата, который свидетельствовал бы об эффективности метода исходя из значения меры неопределенности информации;

• анализ возможностей системы измерений прогнозируемых параметров с учетом включения в неё содержательного значения и возможностей