автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Применение нейросетевых алгоритмов в системах поддержки принятия решений при решении бизнес-задач

кандидата физико-математических наук
Болдырев, Михаил Николаевич
город
Москва
год
1998
специальность ВАК РФ
05.13.11
Автореферат по информатике, вычислительной технике и управлению на тему «Применение нейросетевых алгоритмов в системах поддержки принятия решений при решении бизнес-задач»

Автореферат диссертации по теме "Применение нейросетевых алгоритмов в системах поддержки принятия решений при решении бизнес-задач"

> .. I - ? с ■ ■* ' у

сч 1

л?

533.6 На правах рукописи

\

ЭЛДЫРЕВ Михаил Николаевич

1РИМЕНЕНИЕ НЕЙРОСЕТЕВЫХ АЛГОРИТМОВ В :ИСТЕМАХ ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ ПРИ РЕШЕНИИ БИЗНЕС-ЗАДАЧ

юциальность 05.13.11

атематическое и программное обеспечение вычислительных 1шин, комплексов, систем и сетей"

Автореферат

на соискание ученой степени кандидата физико-математических наук

Москва 1998

Работа выполнена в Московском государственном авиационном инсти (техническом университете), а также на базе компании «ТОРА-Центр»

Научный руководитель:

Кандидат физико-математических наук, доцент, Ю.А. Шебеко Официальные оппоненты:

Доктор физико-математических наук, профессор В.А. Серебряков Кандидат физико-математических наук А.И. Масалович Ведущая организация:

Институт Системного программирования РАН

Защита диссертации состоится «_»_1998 г. на заседг

научного совета К 053.18.09 в Московском государственном авиацион институте (техническом университете) по адресу:

125871, Москва, Волоколамское шоссе, д. 4 С диссертацией можно ознакомиться в библиотеке МАИ. Автореферат разослан «_»_1998 г.

Ученый секретарь научного совета к.ф.-м.н., доцент

М.В. Ротан

российская государственная ! библиотека

уальность работы

зременный уровень решения деловых задач и масштаб проблем, никающих при их решении, требуют особого, систематического подхода I проектировании и реализации средств автоматизации бизнес-|цессов. Проблема поддержки принятия управленческих решений 1яется одной из центральных и привлекает внимание специалистов юго разного профиля. Острота проблемы объясняется следующими сгорами:

избыточность деловой информации, подлежащей обработке для [готовки вариантов решения. Современные информационные службы доставляют исчерпывающую информацию, которая, тем не менее, бует проведения проверки на полноту и непротиворечивость при ее >аботке и использовании;

юобходимость принятия деловых решений в реальном времени -|более типичная ситуация, когда внешние условия и характер ¡рационной среды непрерывно видоизменяются и требуют адекватности 1нимаемых решений внешней обстановке, что требует введения щедур дополнительных оценок и моделирования развития ситуаций;

высокая стоимость решений, при которой относительная |близительность оценок легко приводит к значительным потерям в :олютном значении, а изначально неверные предпосылки в дальнейшем 1водят к необратимому развитию ситуации.

вменение технологий поддержки принятия решений возникает на этапе рмирования корпоративных информационных систем различного класса ребуют применения современных технологий обработки информации, нный класс задач является по сути комплексным, так как требует также юделенных административных, кадровых, управленческих и других 1лий. В рамках данной работы рассматриваются технологические аспекты ути решения данного класса задач на примере применения нейросетей одной из компонент таких систем.

пь работы

пь данной работы - изучение принципов и основных подходов в рмировании корпоративных информационных систем (КИС) и :ледование вопросов применения нейросетевых алгоритмов - одного из ¡ременных методов обработки информации - в рамках построения :тем такого класса.

Основные задачи

Для достижения данной цели необходимо решение следующих основ* задач:

- изучение существующих решений в области КИС, их классификаци формулирование основных подходов и приемов при их построении;

- изучение теоретической основы и практических решений в нейросете! алгоритмах и определение их функциональной роли с точки зре применения в проектируемых КИС;

- выработка методов постановки задач при проектировании нейросете! решений, а также критериев оценки их функционирования;

- изучение вопросов пользовательских интерфейсов КИС и вопро интеграции нейросетевых решений в смысле корректной интерпрета получаемых результатов.

Научная новизна

В процессе выполнения работы получены следующие научные результат

- на основании изучения большого числа программных продуктов сдел попытка сформулировать набор требований к средствам обрабс информации, использующим нейросети;

- разработаны методы постановки задач и оценки результатов примене нейросетей в области делового применения (бизнес-задачи);

на основании проведенного эксперимента получены дани подтверждающие первоначальные предположения относител постановки задач, а также сформулированы методы автоматичес оптимизации настройки нейросетей.

- разработаны способы интеграции нейросетевых модулей в существую! приложения и организации взаимодействия с конечным пользовате. («фабрика нейросетей»);

Практическая ценность.

На основе проведенных исследований и полученных результг реализованы системы прогнозирования изменения финансовых парамет товарных и фондовых рынков для задач инвестиционных и брокере компаний, включая собственно нейросетевые модули и техноло «фабрика нейросетей».

Апробация работы.

новные результаты работы докладывались на Второй международной нференции по неравновесным процессам в соплах и струях (С-Пб, июнь 98 г.), семинарах НАУФОР (Национальная ассоциация участников )Ндового рынка) - Москва, апрель 1998 г.

бликации.

тематике диссертации опубликовано 6 печатных работ. руктура и объем диссертации.

ссертация состоит из введения, трех глав, заключения, и трех сложений; содержит 105 страниц машинописного текста, 12 рисунков, 9 элиц и список литературы из 23 наименований.

филожениях приведены справочные данные по системе Nexpert Object с интегрированной среде разработки; структура комплекса поддержки снятия решений, основанного на технологии «фабрика нейросетей»; ссание EIS-интерфейса на примере продукта ¡Think Analyst.

СОДЕРЖАНИЕ ДИССЕРТАЦИИ

Во ВВЕДЕНИИ сформулирована цель работы, определены поставл задачи, требующие решения, определены актуальность работы, ее нау-новизна и практическая ценность проведенных исследований.

В ПЕРВОЙ главе даны обзор основных принципов построе корпоративных информационных систем (КИС) и методов поддер принятия решений на их основе, а также анализ существующих систе продуктов. На основании анализа выделены приемы постановки задач разработке и реализации подобных систем, а также набор требовав разрабатываемым системам с точки зрения поставленных задач.

Основная классификация и перечень наиболее известных КИС привед ниже (Таблица 1). В диссертационной работе указана более подроб классификация и проведен анализ существующих схем Таблица 1.

Локальные Малые Средние Крупные

системы интегрирова интегрирова интегрирова

иные системы

нные системы

нные системы

БЭСТ

Инотек

ИНФИН

Инфософт

СуперМенеджер

Турбо-Бухгалтер

Инфо-Бухгалтер

+ более 100 систем

Concorde XAL Exact NS-2000 Platinum PRO/MIS Scala

SunSystems

БОСС-

Корпорация

Галактика/Пар

ус

Ресурс Эталон

JD Edwards

(Robertson &

Blums)

MFG-Pro

(QAD/BMS)

SyteLine

(СОКАП/

SYMIX)

SAP/R3 (SAP AG)

Baan (Baan)

BPCS

(ITS/SSA)

Oracle

Applications

(Oracle)

Все системы, представленные в таблице, можно разделить на два боль класса: финансово-управленческие и производственные системы.

тансово-управленческие системы

нансово-управленческие системы включают подклассы локальных и пых интегрированных систем. Такие системы предназначены для ;ения учета по одному или нескольким направлениям (бухгалтерия, сбыт, 1ады, учет кадров и т.д.). Системами этой группы может воспользоваться акгически любое предприятие, которому необходимо управление нансовыми потоками и автоматизация учетных функций.

стемы этого класса по многим критериям универсальны, хотя зачастую зработчиками предлагаются решения отраслевых проблем, например, )бые способы начисления налогов или управление персоналом с учетом зцифики регионов. Универсальность приводит к тому, что цикл внедрения ;их систем невелик, иногда можно воспользоваться "коробочным" эиантом, купив программу и самому установив ее на персональном /тьютере.

нансово-управленческие системы (особенно системы российских зработчиков) значительно более гибкие в адаптации к нуждам третного предприятия. Часто предлагаются "конструкторы", с помощью орых можно практически полностью перекроить исходную систему, /юстоятельно, или с помощью поставщика установив связи между ¡лицами баз данных или отдельными модулями.

гя общая конфигурация систем может быть достаточно сложна, актически все финансово-управленческие системы способны работать на )сональных компьютерах в обычных сетях передачи данных Novell tware или Windows NT. Они опираются на технологию выделенного )вера базы данных (file server), которая характеризуется высокой рузкой сетевых каналов для передачи данных между сервером и Зочими станциями. Только отдельные из предлагаемых в России систем :ого класса были разработаны для промышленных баз данных (Oracle, BASE, Progress, Informix, SQL Server). В основном использовались более )стые средства разработки Clipper, FoxPro, dBase, Paradox, которые шнают давать сбои на сложных конфигурациях сети и при увеличении эемов обрабатываемых данных.

оизводственные системы

эизводственные системы включают подклассы средних и крупных ■егрированных систем. Эти системы, в первую очередь, предназначены 1 управления и планирования производственного процесса. Учетные нкции, хотя и глубоко проработаны, выполняют вспомогательную роль и )ой невозможно выделить модуль бухгалтерского учета, так как формация в бухгалтерию поступает автоматически из других модулей.

Производственные системы значительно более сложны в установке (l внедрения может занимать от 6-9 месяцев до полутора лет и более), обусловлено тем, что система покрывает потребности вс производственного предприятия, что требует значительных совмест усилий сотрудников предприятия и поставщика программного обеспечен

Производственные системы часто ориентированы на одну или неског отраслей и/или типов производства: серийное сборочное (электрон! машиностроение), мало-серийное и опытное (авиация, тяже машиностроение), дискретное (металлургия, химия, упаковка), непрерыЕ (нефте- и газодобыча).

Имеют значение также различные типы организации caiv производственного процесса. Например, для дискретного производс возможно: циклическое повторное производство (repetitive manufacturim, планирование выполняется на определенный срок (квартал, ме< неделя); производство на заказ (make-to-order) - планирование только поступлении заказа; разработка на заказ (engineering-to-order) самостоятельная разработка каждого нового заказа с последуки производством; производство на склад (manufacture-to-stock), смешан производство (mixed mode manufacturing) - для производства конечн продукта используется несколько типов организации производствен процесса.

Такая специализация отражается как в наборе функций системы, так существовании бизнес моделей данного типа производства. Налм встроенных моделей для определенных типов производства отли^ производственные системы друг от друга, у каждой из этих систем < глубоко проработанные направления и функции, разработка которых то; начинается или вообще не ведется.

Если поставщик придерживается, открытой маркетинговой политики, то демонстрации систем вам будет сказано, на какое производство в пер очередь ориентирована система в мире и какие модули были переведен локализованы для России.

Производственные системы по многим параметрам значительно бо жесткие, чем финансово-управленческие. Производственное предпри* должно, в первую очередь, работать как хорошо отлаженные часы, основными механизмами управления являются планирование оптимальное управление производственным процессом, а не ) количества счетов-фактур за период. Эффект от внедре производственных систем чувствуется на верхних эшелонах управле предприятием, когда видна вся взаимосвязанная картина рабе включающая планирование, закупки, производство, запасы, продг конкуренцию среди участников рынка, побуждая и тех, и других вклады!

лощью промышленных баз данных. В большинстве случаев используется :нология клиент-сервер, которая предполагает разделение обработки иных между выделенным сервером и рабочей станцией. Технология юнт-сервер оправдывает себя при обработке больших объемов данных и |росов, так как позволяет оптимизировать интенсивность передачи ■шых по компьютерной сети.

и подробном изучении КИС разных типов можно выделить методику их лроения.

тодика построения информационно-аналитических систем данного юса известна и активно используется ведущими компаниями -!работчиками и интеграторами бизнес-приложений (SAS, BAAN, SAP R/3, acle, IBM и др.). Первоначально данная методика ограничивалась щепцией Data Warehouse - «информационных хранилищ», однако на нный момент концепция существенно расширена и собственно нформационное хранилище» может использоваться как один из гментов системы, но не как вся система в целом.

щая концепция заключается в создании интеллектуальной системы ставки информации (с использованием «хранилища данных» - базы жий в рамках предметной области), то есть в принципиальном переходе моделей данных к моделям информации.

ассические базы данных построены на принципах оперативной обработки чных (модели ввода данных) для автоматизации рутинной работы. При iM классическая СУБД обрабатывает большой объем простых операций с юльзованием статических приложений.

стемы доставки информации строятся на принципах извлечения

формации из системы для принятия оптимальных бизнес-решений. При

iM система обрабатывает небольшое число сложных структурированных

|росов с использованием динамических приложений.

чичная система доставки информации (см. схему) строится с включением

канизмов:

равление данными (в классических концепциях баз данных - OLTP, Оп-е transactions processing), включая модули извлечения данных - бриджи стандартными СУБД разных типов с преобразователями таблиц, анировщики заданий и системы управления метаданными, наконец -рузчики данных в информационное хранилище. Метаданные - здесь: формация об информации», база знаний в рамках предметной области ганизация данных, включая метаданные - некоторую нформационную надстройку» над информационной базой данных

Использование данных, включая модули аналитической обрабо™ реальном времени (OLAP, On-Line Analytical Processing), мод визуализации данных (EIS, Executive Information Service), мод извлечения знаний из данных (Data Mining), модули поддержки приня решений (DSS, Design Support Service).

Необходимо обратить внимание на тот факт, что система доста информации обычно строится по модульному принципу, что делает гибкой с точки зрения интеграции для решения задач конкретн корпоративного пользователя. Модульность и обеспечение надежн межпрограммного взаимодействия обеспечивается выбором еди платформы разработки, включающей в себя интерактивную ср« библиотеки интерфейсов, встроенный платформо-независимый язык. Структурно система доставки информации выглядит следующим образол

При анализе данной схемы в диссертационной работе ocoi внимание мы уделяем OLAP - технологиям (анализ в реалы времени) и EIS - технологиям (информационный cepi непосредственно для принятия решений)

Системы рассуждений на основе аналогичных случаев

,ея систем case based reasoning - CBR - крайне проста. Для того чтобы элать прогноз на будущее или выбрать правильное решение, эти ;темы находят в прошлом близкие аналоги наличной ситуации и бирают тот же ответ, который был для них правильным. Поэтому этот тод еще называют методом "ближайшего соседа" (nearest neighbour), стемы CBR показывают очень хорошие результаты в самых знообразных задачах. Главный их минус заключается в том,

э они вообще не создают каких-либо моделей или правил, обобщающих эдыдущий опыт, - в выборе решения они основываются на всем массиве ступных исторических данных, поэтому невозможно сказать, на основе (их конкретно факторов CBR системы строят свои ответы. Примеры ^тем, использующих CBR, - KATE tools (Acknosoft, Франция), Pattern cognition Workbench (Unica, США).

Деревья решений (decision trees)

нный метод пригоден только для решения задач классификации, и этому весьма ограниченно применяется в области финансов и бизнеса, i чаще встречаются задачи численного прогноза. В результате вменения этого метода к обучающей выборке данных создается рархическая структура классифицирующих правил типа "ЕСЛИ... ТО...", еющая вид дерева (это похоже на определитель видов из ботаники или элогии). Для того чтобы решить, к какому классу отнести некоторый ьект или ситуацию, мы отвечаем на вопросы, стоящие в узлах этого рева, начиная с его корня. Вопросы имеют вид "значение параметра А пьше х?". Если ответ положительный, мы переходим к правому узлу эдующего уровня, если отрицательный - то к левому узлу; затем снова зечаем на вопрос, связанный с соответствующим узлом. Так мы в конце нцов доходим до одного из оконечных узлов - листьев, где стоит указание, акому классу надо отнести рассматриваемый объект. Этот метод хорош и, что такое представление правил наглядно и его легко понять. Но очень гро для деревьев решений стоит проблема значимости. Дело в том, что дельным узлам на каждом новом построенном уровне дерева этветствует все меньшее и меньшее число записей данных - дерево обит данные на большое количество частных случаев. Чем больше этих :тных случаев, чем меньше обучающих примеров попадает в каждый юй частный случай, тем менее уверенной становится их классификация, пи построенное дерево слишком "кустистое" - состоит из неоправданно тьшого числа мелких веточек - оно не будет давать статистически эснованных ответов. Как показывает практика, в большинстве систем,

использующих деревья решений, эта проблема не нахо удовлетворительного решения. Довольно много систем используют с метод. Самыми известными являются С5.0 (RuIeQuest, Австрал Clémentine (Intégral Solutions, Великобритания), SIPINA (University of Lj Франция),IDIS (Information Discovery, ClilA).

6. Генетические алгоритмы

Строго говоря, интеллектуальный анализ данных - далеко не основ область применения генетических алгоритмов, которые, скорее, ну; рассматривать как мощное средство решения разнообраз! комбинаторных задач и задач оптимизации. Тем не менее генетичес алгоритмы вошли сейчас в стандартный инструментарий методов с mining, поэтому они и включены в данный анализ. Этот метод назван потому, что в какой-то степени имитирует процесс естественного отбор природе. Пусть нам надо найти решение задачи, наиболее оптимально точки зрения некоторого критерия. Пусть каждое решение полное описывается некоторым набором чисел или величин нечисловой приро Скажем, если нам надо выбрать совокупность фиксированного чи параметров рынка, наиболее выраженно влияющих на его динамику, будет набор имен этих параметров. Об этом наборе можно говорить кг совокупности хромосом, определяющих качества индивида - данк решения поставленной задачи. Значения параметров, определяю1 решение, будут тогда называться генами. Поиск оптимального решения этом похож на эволюцию популяции индивидов, представленных наборами хромосом. В этой эволюции действуют три механизма: во-перЕ отбор сильнейших - наборов хромосом, которым соответствуют наибо оптимальные решения; во-вторых, скрещивание - производство hoi индивидов при помощи смешивания хромосомных наборов отобран! индивидов; и, в-третьих, мутации - случайные изменения генов у некото индивидов популяции. В результате смены поколений в конце кон вырабатывается такое решение поставленной задачи, которое уже может быть далее улучшено.

С точки зрения нашего анализа генетические алгоритмы имеют два слабых ме Во-первых, сама постановка задачи в их терминах не дает возможно проанализировать статистическую значимость получаемого с их помощью решс и, во-вторых, эффективно сформулировать задачу, определить критерий отС хромосом под силу только специалисту. В силу этих факторов сегс генетические алгоритмы надо рассматривать скорее как инструмент науч! исследования, чем как средство анализа данных для практического применен бизнесе и финансах. Система GeneHunter (Ward Systems Во ВТОРОЙ глэе рамках анализа OLAP - систем дан обзор существующих аналитиче* технологий, рассмотрены нейросетевые парадигмы, а также прове

злиз наиболее характерных задач, решение которых эффективно с чменением нейросетей.

ассы систем интеллектуального анализа данных, применяемые в знесе и финансах

осмотрим традиционные аналитические системы, в том числе эдназначенные для решения узкого класса задач - с точки зрения нимости, интерпретируемости и автоматизма как основных факторов знки.

Предметно-ориентированные аналитические системы

<ие системы очень разнообразны, поэтому рассмотрим здесь один из чболее типичных и важных классов этих систем, а именно системы ализа финансовых рынков, построенные на основе методов технического ализа. Технический анализ представляет собой совокупность нескольких ;ятков методов прогноза динамики цен и выбора оптимальной структуры зестиционного портфеля, основанных на различных эмпирических целях динамики рынка. Эти методы могут быть весьма просты (как, 1ример, методы, использующие вычитание трендового значения), а могут эть достаточно сложную математическую основу - скажем фрактальную тематику или спектральный анализ. Поскольку, как правило, вся теория э "зашита" в эти системы, а не выводится на основании истории рынка, то ;бования статистической значимости выводимых моделей и возможности интерпретации для них не имеют смысла. Заметим лишь, что многие из :сматриваемых систем ориентированы на работу на западных рынках, не пывают наших реалий и поэтому не очень пригодны для применения в хии. Третьему требованию они удовлетворяют в большей степени, чем |Тие обсуждаемые классы систем, оперируют в терминах предметной иасти, понятных специалистам, обычно имеют специализированные -ерфейсы для загрузки финансовых данных и обладают другими ;имуществами специализированных систем. На рынке имеется большое 1ичество программ этого класса - MetaStock (Equis International), aerCharts (Omega Research), Candlestick Forecaster (IPTC), Wall Street ney (Market Arts).

Статистические пакеты

гя последние версии почти всех известных статистических пакетов ночают наряду с традиционными статистическими методами также

элементы data mining, основное внимание в них уделяется все классическим методикам - корреляционному, регрессионному, факторь анализу и другим. Главный недостаток систем этого класса - их невозмс эффективно применять для анализа данных, не имея глубоких знам области статистики. Неподготовленный пользователь должен прс специальный курс обучения. Обычно в процессе исследования даннь помощью статистических пакетов приходится многократно применять на из одних и тех же элементарных операций, однако в этих системах средс автоматизации процесса исследования либо отсутствуют, либо треб программирования на некотором внутреннем языке, что также редкс силам пользователю, если он не статистик и не программист. Все факторы делают мощные современные статистические пакеты слип тяжеловесными для массового применения в финансах и бизнесе качестве примеров можно назвать SAS (компания SAS Institute), SI (SPSS) и Statgraphics (Statistical Graphics).

3. Нейронные сети

Это большой класс разнообразных систем, чья архитектура в некотс степени имитирует построение нервной ткани из нейронов. В одноё наиболее распространенных архитектур, многослойном перцептрон обратным распространением ошибки, эмулируется работа нейроно составе иерархической сети, где каждый нейрон более высокого урс соединен своими входами с выходами нейронов нижележащего слоя, нейроны самого нижнего слоя подаются значения входных параметров основе которых нужно принимать какие-то решения, прогнозиро! развитие ситуации и т. д. Эти значения рассматриваются как сигн; передающиеся в вышележащий слой, ослабляясь или усиливаяс зависимости от числовых значений (весов), приписываемых межнейрон связям. В результате этого на выходе нейрона самого верхнего ( вырабатывается некоторое значение, которое рассматривается как от реакция всей сети на введенные значения входных параметров. Для чтобы сеть можно было применять в дальнейшем, ее прежде i-"натренировать" на полученных ранее данных, для которых извести значения входных параметров, и правильные ответы на них. тренировка состоит в подборе весов межнейронных свя обеспечивающих наибольшую близость ответов сети к извест правильным ответам. Такой подход оказался высокоэффективныг задачах распознавания образов, он также применим к большие финансовых и экономических задач, хотя в российских условиях, не сое удовлетворяет двум из трех сформулированных требований. BrainMaker (CSS), NeuroShell (Ward Systems Group), OWL (HyperLo Стоимость их также довольно значительна: 1500-8000 долл.

)стряет возрастают требования к технической инфраструктуре и лпьютерной

{елинейные регрессионные методы

чек зависимости целевых переменных от остальных ведется в форме нкций какого-то определенного вида. Например, в одном из наиболее иных алгоритмов этого типа - методе группового учета атрибутов (МГУА) исимость ищут в форме полиномов. По всей видимости, этот метод дает iee статистически значимые результаты, чем нейронные сети. К тому же |ученная формула зависимости, полином, в принципе поддается анализу нтерпретации (хотя на практике все же бывает слишком сложна для

го). Это делает данный метод достаточно перспективным для анализа :сийских финансовых и корпоративных данных. В настоящее время МГУА тизован в системе NeuroShell (Ward Systems Group).

Эволюционное программирование

одня это самая молодая и наиболее перспективная ветвь data mining, тизованная, в частности, в системе PolyAnalyst. Суть метода в том, что отезы о виде зависимости целевой переменной от других переменных эмулируются системой в виде программ на некотором внутреннем языке >граммирования. Если это универсальный язык, то теоретически на нем кно выразить зависимость любого вида. Процесс построения этих 1грамм строится как эволюция в мире программ (этим метод немного :ож на генетические алгоритмы). Когда система находит программу, ;таточно точно выражающую искомую зависимость, она начинает юить в нее небольшие модификации и отбирает среди построенных им образом дочерних программ те, которые повышают точность. Таким >азом система "выращивает" несколько генетических линий программ, орые конкурируют между собой в точности выражения искомой исимости. Специальный транслирующий модуль системы PolyAnalyst юводит найденные зависимости с внутреннего языка системы на 1ятный пользователю язык (математические формулы, таблицы и пр.), 1ая их легкодоступными. Для того чтобы сделать полученные результаты э понятнее для пользователя-нематематика, имеется богатый арсенал нообразных средств визуализации обнаруживаемых зависимостей. Для троля статистической значимости выводимых зависимостей 1меняется набор современных методов, например рандомизированное тирование. Все эти меры приводят к тому, что PolyAnalyst показывает в ачах анализа российских финансовых рынков весьма высокие азатели.

аблице 1 приведена оценка упомянутых методов и систем по трем дложенным критериям.

Таблица 1.

тех. анализ Стат. нейросе Пакеты ти свя деревья решений велеНи г^ег МГУА (Меигов ° ЬеИ) а

Значимость нет ++ + - - -

Интерпретир нет +- ++ +- +

уемость

Автоматизм ++ + + + - +

В ТРЕТЬЕЙ главе рассмотрены методы постановки практических задач применении нейросетевых решений, а также методы выбора крите[ оценки результатов работы НС. Поскольку применение нейросет( решений в рамках КИС во многом определяется возможное автоматизации работы на уровне модуля, то постановка задачи до; учитывать этот фактор. Приведенный ниже пример эксперим! демонстрирует это обстоятельство.

ПРЕДИСЛОВИЕ К ПОСТАНОВКЕ ЗАДАЧИ

В настоящий момент на Российском рынке наблюдается значител! конкуренция между участниками рынка в области привлечени; эффективного размещения и управления портфелями инвестицион объектов (далее - ресурсов). Суть конкуренции участников может ( описана любопытной ситуацией, в той или иной мере повторяющейс; протяжении последних полутора лет:

а) отдельный участник рынка успешно решает задачу привлеч! (аккумулирования) начального объема ресурсов - разумеется, некотором избытке предложения со стороны потенциальных инвесторов

б) не имея соответствующих технологий, данный участник практич сразу сталкивается с трудностями в оценке эффективности размещен управления ресурсом;

в) затруднения участника рынка и отсутствие аргументированных крите оценок, в свою очередь, побуждают инвестора обратиться к др участникам рынка, которые тоже испытывают подобные затруднения ;

г) и так далее, что, в свою очередь, порождает дополнительный изб предложения со стороны потенциальных инвесторов и обост возрастают требования к технической инфраструктуре и компьюте платформе. Все без исключения производственные системы разработа

юлнительные средства в разработки и внедрение аналитических нологий.

ж, существует объективный спрос на технологии планирования и авления при решении данного круга задач. Стоит отметить, что санная проблема является по сути комплексной по сути, поскольку для решения необходимы не только аналитические, но и технологические, ровые, информационные, управленческие и некоторые другие усилия, нако в рамках темы остановимся на аналитической стороне вопроса.

СТАНОВКА ЗАДАЧИ (ОБЩАЯ)

; портфелем ресурсов, безотносительно к зависимости от рода ггельности инвестиционной структуры, способа ее управления и формы ственности, подразумевается совокупность финансовых, товарных, ютериальных и прочих активов, требующих оптимального размещения и авления на различных секторах рынка с учетом текущей ситуации. 1ная совокупность с точки зрения внутреннего планирования, авления и учета рассматривается как одно целое (в стоимостном иваленте), но при решении задач внешнего планирования (размещения урсов на различных секторах рынка, учета прибылей и убытков есторов и т.п.) разбивается на группы и подгруппы по секторам, что и азует инвестиционный портфель. В общем случае, задача авления таким портфелем описывается следующей схемой, где:

размер ресурса в стоимостном эквиваленте;

время размещения ресурса;

к - оценка максимальной доходности управления инвестиционным тфелем (расчетный параметр)

I - оценка максимальной доходности управления инвестиционным тфелем (расчетный параметр)

оценка оптимального диапазона доходности управления естиционным портфелем (расчетный параметр)

1 - точка принятия решения о начале инвестиций, в которой эделяются расчетные параметры

end - точка отчетного периода, в которой производится оц< эффективности управления инвестиционным портфелем

dP - критерий эффективности управления инвестиционным портфелем

t1, t2 - контрольные точки промежуточных оценок

a,b - точки принятия решения об изменении состава инвестицион! портфеля (точки активного управления)

Таким образом, общая постановка задачи сводится к двум важ разделам: оценкам и выводам на этапе планирования и оценкам и вывс на этапе управления инвестиционным портфелем.

На этапе планирования и управления оценками являются крит< эффективности использования инвестиционного портфеля - парам« доходности (отношение dP/T) и соотношения доходности к риску (с!Р/Я) К - мера риска, определяемая в общем случае для каждого сектора р как ценовая вариация. Выводом на этапе планирования явля собственно принятие решения об инвестировании в соответстви намеченной программой, на этапе управления - принятие решен; покупке или продаже определенного количества одной или нескольких I активов (точки а и Ь на схеме) для следования в намече субоптимальном коридоре.

наиболее оптимального управления портфелем ресурсов решаются ые задачи увеличения общей доходности с!Р при не увеличении :упных рисков К - с одной стороны, также задачи учета и снижения :упных рисков - с другой стороны. Один из наиболее очевидных путей пения общей доходности - частная задача получения качественных озов изменения цен для различных групп активов с целью гдующей адекватной генерации сигналов к покупке или продаже.

ГАНОВКА ЗАДАЧИ (ЧАСТНАЯ)

частной постановки задачи был поставлен эксперимент: сделана гка прогноза котировок одного из наиболее популярных ггиционных активов (на момент эксперимента, разумеется) -арственных бескупонных краткосрочных облигаций (ГКО) на эвской межбанковской валютной бирже (ММВБ). Для участников торгов при построении стратегии игры необходимо иметь как долгосрочные, I краткосрочные прогнозы цен сделок различных бумаг. Поскольку эный прогноз строится на основании результатов прошедшей торговой 1и, то представляет ценность определение величины изменения цены :и на следующей сессии

)ДНЫЕ ДАННЫЕ

зменение цен сделок ГКО влияют изменение различных параметров 1йского финансового рынка, а также динамика экономической и -ической жизни страны, причем некоторые события, как, например, ;ние валютного коридора, существенно изменяют рынка ГКО. Для юения нейросети необходимы более или менее однородные данные, ^му можно использовать только статистические данные за :ительно небольшой промежуток времени, когда ситуация на рынке ¡льна. В качестве исходных обучающих и тестовых данных шзовалась финансовая информация за 15 торговых дней. Для озирования котировки ГКО использовались данные о ценах /1мум», «максимум», «закрытие» (последняя сделка) - на прошедшей вой сессии, а также аналогичные данные за предыдущие сессии. При жазании изменения цен ГКО на следующую сессию использовалось 7 1исимых факторов.

ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ДАННЫХ

Из обучающей выборки были удалены факты, соответствующие сильных возмущений на рынке ГКО, которые, однако, не оказали влиян дальнейший ход торгов (например, захват заложников Басаевым, что V место во время тестирования системы). Кроме того, цены ГКО, а -некоторые другие исходные данные имели явный тренд поэтому исходных данных были преобразованы к рядам изменений по отноше! предыдущему дню. С помощью подсистемы препроцессинга ЫеИМаке проведен корреляционный анализ данных, и выбраны те ряды, корре; которых с искомыми значениями была больше 0,2. По резуль-корреляционного анализа также глубина зависимости от историч данных была выбрана определена равной 4 (то есть, одна неделя тори

ОБУЧЕНИЕ И АРХИТЕКТУРА СЕТИ

Обучение нейросети проводилось с использованием модуля Вгат1\ Была выбрана трехслойная нейросеть с 9 входными нейронаь выходным и 1 промежуточным слоем с 7 нейронами. Допуст отклонение по мере тренировке нейросети постепенно уменьшалось < до 0,03 (что соответствует разбросу значений котировок 7 ру( Коэффициент фиксировался равным 1. После этого была предпр попытка улучшить точность предсказания с помощью модуля основанного на генетических алгоритмах. В качестве начат

условий были выбраны 100 поколений эволюционного развит! количеством экземпляров в каждом поколении равном 5. По окон1 работы генетического алгоритма 3 из 5 экземпляров последнего пош оказались лучше, чем первоначальная нейросеть.

РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТА

Результаты тестирования лучшей нейросети показали, что точ предсказания находится в пределах 10% от величины реального изме! при вероятности правильного предсказания 80%, что оказ; достаточным для практического применения нейросети.

ВОДЫ ЭКСПЕРИМЕНТА

примере данного эксперимента, имеющего, впрочем, большое стическое значение, продемонстрирована работоспособность эосетевого алгоритма обратного распространения для решения задач досрочных финансовых прогнозов. Точность и статистическая 5ильность получаемых результатов вполне удовлетворяет диалистов, ответственных за принятие решения при управлении гфелями ресурсов. Однако при практическом применении данной юлогии существуют следующие проблемы, требующие решения.

роблема дообучения нейросети. Выражается в том, что по прошествии эторого времени (определяется экспериментально) в обученной эосети накапливается результирующая ошибка, связанная с /юдическим изменением характера ценовых движений (изменением кции плотности распределения вероятности). То есть через эделенные промежутки времени необходимо перегруппировать ^ющую выборку, отбрасывая более старые данные и добавляя новые, тем повторно обучать нейросеть, не меняя настроечных параметров.

роблема нестабильных (нестационарных) ситуаций. Выражается в том, периодически характер ценовых движений меняется псевдохаотически «ценовой выброс») с последующим восстановлением первоначального гояния. Иллюстративные примеры - резкие колебания курса /юнальной валюты в России в 1994 году , паника на азиатской бирже нью 1997 года и т.п. При составлении портфеля ресурсов из активов -юго типа приходится рассматривать подобные ситуации скорее как 1чные, соответственно внося коррективы в настройки нейросетей. блема заключается в идентификации нестационарной ситуации плитуда выброса и возможный срок затухания), попыткам ■позировать наступление и развитие подобных ситуаций по косвенным знакам, определении стратегии поведения в каждой конкретной ^ации.

1роблема автоматизации вычислений. Насколько можно судить из бражений, приведенных выше, для профессионального авления портфелем ресурсов необходимо мощное роприложение, представляющее собой систему нейросетей чаемых на потоке данных по различным секторам рынка. Часть ных сетей находится в

непосредственном применении - «на боевом дежурстве», другая ч; находится в резерве. При наличии достоверного и адекватного крите пригодности конкретной парадигмы для решении конкретной за/: прогноза, можно реализовать замену и дообучение нейросетей с выс< степенью автоматизации. Однако такой комплекс требует значитель вычислительных ресурсов. Для сравнения: аналогичная система в компе LBS Capital Management, USA, поддерживается сетью компьюте включая центральный сервер SUN Ultra и 10 рабочих станций Pentiun 16 управляется подразделением из 10 специалистов с навыками работ нейросетями. Данный комплекс обеспечивает поддержку принятия реше 4 аналитиков компании (по материалам компании LBS Capital Managen 1997 г.)

Тем не менее, создание подобных вычислительных систем для поддер принятия решения в задачах управления портфелями pecypcoi использование в них нейросетевых алгоритмов вполне оправдьн затраты на их создание. Результаты эксперимента позволяют еде) вывод о необходимости проведения работ в направлении автоматизм работы данной технологии. Созданная в рамках данной работы «фаб| нейросетей» позволяет решать указанные проблемы.

В ЗАКЛЮЧЕНИИ сформулированы основные результаты диссертацио! работы.

1. Проведен сравнительный анализ подходов к построению корпоратиЕ информационных систем (КИС) для круга практических задач.

2. Проведен анализ существующих технологий обработки данны реальном времени. Изучены возможности применения нейросетей поставленных задач.

3. Проведен эксперимент, показывающий возможность примеж нейросетей для задач краткосрочного прогнозирования. На основ: результатов эксперимента сформулированы принципы оценки примен< нейросетей, а также пути реализации данной технологии.

4. Предложен принцип «фабрики нейросетей» - как одно из возмо> решений проблемы автоматизации вычислений с контролем точь работы.

5. Предложен подход к созданию пользовательского интерфейса интерпретации результатов действия нейросетей в рамках of постановки задачи.

6. На основании предложенных подходов и принципов реали; программный модуль «фабрика нейросетей». Указанный програм

\уль прошел опытную эксплуатацию как в составе разрабатывавшейся так и в качестве самостоятельного продукта.

Исследованы характеристики предложенного подхода к реализации росетевых приложений и определены пути его дальнейшего развития.

теме диссертации опубликованы следующие работы:

золдырев М.Н. Методы финансового анализа и программные продукты 1X основе. «Рынок ценных бумаг», №3/96

юлдырев М.Н. Нейросети: современное оружие финансовых операций. ,iHOK ценных бумаг», №4/96

Болдырев М.Н. Генезис в финансах. Выбор оптимальных путей. «Рынок ных бумаг», №6/96

Волдырев М.Н. Нейросети и анализ временных рядов. «Рынок ценных lar», №5/97

Практические применение нейросетевых алгоритмов в задачах авления ресурсами. В кн: Тезисы докладов II Международной ференции по неравновесным процессам в струях и соплах - С-Пб., 1998, 52

олдырев М.Н. Аналитическая записка (анализ вычислительных ресурсов пании), «Рынок ценных бумаг», №3/98

Болдырев М.Н., Шебеко Ю.А. Концепция организации аналитической жбы инвестиционного фонда, (в печати)