автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Исследование и разработка автоматизированной информационно-управляющей системы с интегрированной функцией поиска в массиве неструктурированных данных

кандидата технических наук
Салбиев, Алан Тасолтанович
город
Владикавказ
год
2007
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Исследование и разработка автоматизированной информационно-управляющей системы с интегрированной функцией поиска в массиве неструктурированных данных»

Автореферат диссертации по теме "Исследование и разработка автоматизированной информационно-управляющей системы с интегрированной функцией поиска в массиве неструктурированных данных"

На правах рукописи

СЛЛБИЕВ АЛАН ТАСОЛТАНОВИЧ

ООЗОбЗ144

ИССЛЕДОВАНИЕ И РАЗРАБОТКА АВТОМАТИЗИРОВАННОЙ ИНФОРМАЦИОННО-УПРАВЛЯЮЩЕЙ СИСТЕМЫ С ИНТЕГРИРОВАННОЙ ФУНКЦИЕЙ ПОИСКА В МАССИВЕ НЕСТРУКТУРИРОВАННЫХ ДАННЫХ

Специальность 05 13 01 - «Системный анализ, управление и обработка информации (промышленность)»

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических паук

? 4 МАЙ 2007

Владикавказ - 2007

003063144

Работа выполнена в Северо-Кавказском Ордена Дружбы Народов горнометаллургическом институте (государственном технологическом университете)

Научный руководитель кандидат технических наук, доцент

Моураов Алан Георгиевич Официальные оппоненты доктор технических наук, профессор

Васильев Игорь Евгеньевич кандидат технических наук, доцент Гамаонов Владимир Георгиевич

Ведущая организация Институт прикладной математики и

информатики ВНЦ РАН и Правительства PCO-Алания,

г Владикавказ

Защита состоится «25» мая 2007 г в 1400 на заседании диссертационного совета Д21224601 в Северо-Кавказском Ордена Дружбы Народов горно-металлургическом институте (государственном технологическом университете) по адресу 362021, г Владикавказ, ул Николаева, 44, СКГМИ (ГТУ) Факс (8672) 40-72-03, e-mail skgtu@skgtu ru

С диссертацией можно ознакомиться в библиотеке СКГМИ(ГТУ)

Автореферат разослан «24» апреля 2007 г Ученый секретарь

диссертационного совета /" .

Д212 246 01, дт и , профессор -Т"" '' В.П. Алексеев

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность работы. В конце XX — начале XXI века мир столкнулся с глобальной угрозой, которая негативно влияет на многие процессы Речь идет о терроризме Кроме того, за последние два десятилетия возросла вероятность техногенных катастроф, чрезвычайных ситуаций Все вышеперечисленное ведет к многочисленным жертвам, огромному экономическому ущербу, как для граждан, так и государства в целом Необходимо разрабатывать эффективные системы по предупреждению и ликвидации негативных последствий указанных выше явлений, в том числе, повышать качество управляющих систем по мониторингу опасных производств

На текущий момент, в Российской Федерации происходят реформы в социальной сфере Меняется система социальной защиты, предоставления льгот В активной фазе проходят приоритетные национальные проекты, призванные улучшить ситуацию в самых проблемных сферах

Приведенные выше задачи не могут решаться в полном объеме без использования современных информационно-коммуникационных

технологий, потому что основным критерием, влияющим на конечный результат в рамках решения поставленных задач, будет служить уровень, качество и оперативность информационного обмена Таким образом, мы затрагиваем самый широкий круг вопросов, требующих систематизации, упорядочивания В большинстве случаев, от того, насколько эффективно в той или иной области налажен информационный обмен и учетные процедуры, зависит судьба многих людей

Информационные системы, призванные автоматизировать указанные выше процессы, относятся к категории социально значимых Кроме проблем стабильности функционирования социально значимых информационных систем, возникают вопросы оперативного поиска информации и группировки сс в нужных разрезах При этом следует учитывать неточность первичной информации (к примеру, сведения о пострадавших, получаемых путем опроса самих пострадавших, находящихся в состоянии глубокого аффекта, либо имеющих тяжелые физические повреждения) Опыт показывает, что именно от максимальной полноты и достоверности выборок информации зависят не только последующие управленческие решения, но и конечный результат, и

3 Практическая значимость результатов диссертационного исследования подтверждается их внедрением на предприятиях металлургической и пищевой промышленности, а также в Федеральной службе по надзору в сфере здравоохранения и социальной защиты населения (г Москва), Министерстве здравоохранения Республики Северная Осетия -Алания (г Владикавказ), территориальном управлении Федеральной службы по надзору в сфере здравоохранения по Республике Северная Осетия -Алания (г Владикавказ), лечебно - профилактических и фармацевтических учреждениях Республики Северная Осетия - Алания,

4 Разработанное автором программное обеспечение использовалось для сбора и анализа информации о пострадавших и распределения поступающей гуманитарной помощи при террористическом акте 1-3 сентября 2004 года в средней школе №1 г Беслан Республики Северная Осетия -Алания

На защиту выносятся:

1 Метод иерархической дифференциации атрибутов информационных объектов управляющей системы с учетом глубины связей между элементами при системном анализе предметной области (ИДАИОПО) и разработанный на его основе алгоритм

2 Методика расчета и применения коэффициента глубины связей между элементами управляющей системы (КГСУС)

3 Метод интеллектуально-симптоматического анализа поискового запроса и разработанный на его основе алгоритм (ИСАЗ)

4 Метод оценки эффективности разработанной инфологической модели системы на основе определения таких показателей, как размер и стабильность

5 Методика оценки эффективности результатов поиска, основанная на вычислении уровня пертинентности

Апробация работы. Основные положения и отдельные результаты работы докладывались и обсуждались на следующих конференциях и семинарах

- на II Международной научно — практической конференции «Актуальные проблемы информатики и информационных технологий», (Тамбов, 2005 г ),

на Всероссийской научно-практическои конференции "Информационное обеспечение реализации национального проекта «Здоровье», (Москва, 2006 г),

- на Всероссийском форуме-выставке «Здоровье нации - основа процветания России», (Москва, 2006 г )

- на I Всероссийской научно-практической конференции «Инновации в здравоохранении», (Москва, 2006 г )

на ряде научно-технических конференциях профессорско-преподавательского состава, научных работников и аспирантов СКГМИ (ГТУ) в 2004-2006 г г

Личный вклад автора: все основные результаты исследований, рассмотренные в диссертации, автором получены самостоятельно В работах [2, 8, 9, 10], выполненных в соавторстве, все существенные положения разработаны автором

Публикации. Основные результаты диссертационной работы опубликованы в 11 печатных работах, из них 5 свидетельств о регистрации программ для ЭВМ, выданных Федеральным институтом промышленной собственности (Роспатент), г Москва

Структура и объем работы: диссертация состоит из введения, четырех глав, заключения, списка литературы, приложений и включает в себя 133 страницы машинописного текста, 9 таблиц, 25 рисунков

СОДЕРЖАНИЕ РАБОТЫ

Во введении рассматривается вопрос актуальности темы, сформированы рассматриваемые в данном диссертационном исследовании вопросы

Работы в области анализа систем, их оптимизации и моделирования ведут многие ученые В В Липаев, А А Штрик, Б А Позин, Г Н Калянов, Е 3 Зиндер, Т Sarson, J Rumbaugh, G Booch, I Jacobson и другие Но при этом крайне мало разработок, которые бы рассматривали прикладные вопросы анализа, к примеру, социально значимых управляющих систем, особенно в сфере ликвидации последствий террористических актов и чрезвычайных ситуаций, предупреждения техногенных катастроф

детерминированном потоке, О (A, S) — оптимальная структура, включающая в себя множество элементов детерминированного потока/), набор связей S/...i„ элементов . .

А\D nD

ч и

S = (s„»2, ,i.)(5),

где , s„ - связи между элементами . .

АЮ AnD и и

Исходя из вышеизложенного, можно вывести следующее равенство (6)

Ka=0(A,S)( 6)

Кроме того, введением константы Dmm можно обеспечить дифференциацию атрибутов па общесистемные и локальные Программный код проверки элемента оптимальной структуры ипфологической модели будет выглядеть следующим образом

Ifl(inc) >= Dm,„ then status = system

lJ V

Константа Dmin, задающая критерий для определения общесистемное™ элемента А определяется экспертным путем и ее величина специфична в

nD

'J

зависимости от функциональных характеристик системы

Алгоритмизация определения значения константы Dmm, не входит в задачи настоящей диссертационной работы и может служить объектом дальнейших исследований и экспериментов

В третьей главе «Метод интеллектуально-симптоматического анализа поискового запроса и построение на его основе алгоритма» автором предлагается концепция интеллектуальной обработки поискового запроса, что позволяет без вспомогательных словарей очищать поисковый запрос от незначащей информации, учитывать некоторые особенности морфологии русского языка и в конечном итоге, оптимизировать поисковый запрос в набор ключевых слов так, чтобы максимально удовлетворить информационные потребности пользователя Кроме того, предлагается механизм определения в поисковом запросе специализированных терминов, их конвертация и осуществление поиска, в том числе по аббревиатуре и условным сокращениям

В ходе рассмотрения методов, предназначенных для анализа текстовой информации, мы пришли к выводу, что из группы методов лингвистического

и статистического анализа, наиболее предпочтительной является группа методов, объединенных в рамках лингвистического анализа Принимая во внимание тот факт, что методы лингвистического анализа хоть и более трудоемкие, сложные в реализации, можно отметить их особенность — они позволяют производить более точный анализ поискового запроса

Предлагаемый метод позволяет решить поставленные вопросы без использования вспомогательных средств (тезаурусов, словарей и т п) и основан на алгоритмизации удаления незначащей информации в поисковом запросе, выделения информативных слов, формирования аббревиатур с определением коэффициента входимости. Конечной целью предлагаемого метода является формализация поискового запроса, приведение лексических единиц к базовой форме для дальнейшего определения устойчивых аббревиатур лишь с учетом некоторых закономерностей и особенностей русского языка

При разработке метода интеллектуально-симптоматического анализа учитывались следующие положения в обработанном тексте запроса не должны содержаться знаки препинания, какие-либо символы кроме букв и цифр, причем символы другого языка не считаются буквами, в зависимости от специфики предметной области длина информативного слова не может быть короче постоянного значения N, как правило, поисковый запрос, содержащий термин ограничивается словами термипа и включает не более двух дополнительных слов

Выполнение метода происходит пошагово 1. УдалеЕше знаков препинания из текста поискового запроса

2 Автоматическое выявление и удаление так называемых «стоп-слов», незначащей информации (неинформативных слов) без использования вспомогательных словарей

3 Оптимизация ключевых слов поискового запроса

4 Выделение терминов из запроса и дополнительный поиск по условным сокращениям (аббревиатурам) без применения вспомогательных словарей

Рассмотрим каждый этап более детально 1 Удаление знаков препинания из текста поискового запроса Алгоритм следующий из всего массива символов, образующих поисковый запрос, мы выполняем удаление всех символов кроме букв и

цифр После ввода текста поискового запроса, происходит его анализ, который начинается с присвоения счетчику символов I нулевого значения Значение счетчика / равно порядковому номеру символа в строке (при этом игнорируются пробелы)

В случае если элемент с порядковым номером / не является буквой или цифрой (символы латиницы, либо других языков за буквы пе принимаются), происходит удаление символа, при этом значение счетчика не увеличивается В случае если элемент с порядковым номером / является буквой или цифрой, увеличивается значение счетчика ¡=¡+1, курсор переходит на следующий символ и итерация цикла повторяется В случае обнаружения символа конца строки значение счетчика I обнуляется, происходит завершение процедуры

2 Автоматическое выявление и удаление «стоп-слов», незначащей информации (неинформативных слов)

Алгоритм следующий задаем специальной константой Ь минимальную длину ключевого слова (символы, обособленные пробелами, либо началом строки или концом строки) При обработке текста запроса слова, длина которых меньше Ь, удаляются Значение константы Ь определяется самим пользователем, исходя из его познаний, опыта На данном этапе исследований, алгоритмизация автоматического определения приемлемого значения константы не предусмотрена

После ввода значения константы Ь, которая ограничивает максимальную длину нсинформативного слова, определяется количество слов в запросе / Вводится дополнительная переменная п, приравнивается I, затем происходит итерация цикла для проверки слова запроса с порядковым номером п Если длина слова с порядковым номером меньше, либо равна данное слово помечается на удаление, в ином случае слово пропускается Затем значение переменной п уменьшается на единицу и в случае ненулевого значения переходим на слово с порядковым номером п-1, происходит новая итерация цикла и так до тех пор, пока п не примет нулевое значение При п=0 из текста запроса удаляются все помеченные слова, после чего процедура завершает работу

3 Оптимизация ключевых слов поискового запроса

Для работы введем константу Ьт которая задает минимальную длину слова Слово с длиной Ь, равной Ьк процедуре оптимизации подвергаться не будет К примеру, присвоим Ьк значение Ь„=4

Алгоритм следующий для слов длиной не менее Ь„= 4, начинаем поиск с конца символов если на конце слова цифра — ничего не удаляем, если на конце согласные - ничего не удаляем, если на конце гласные - удаляем конечные символы до первого согласного Значение константы определено опытным путем, но в поисково-информационной системе его показатель может меняться самим пользователем, исходя из его предпочтений В любом случае, значение переменной Ь„ определяется эмпирически

После инициализации процедуры оптимизации ключевых слов поискового запроса происходит анализ слова с порядковым номером 1-1 В случае если длина текущего слова меньше четырех символов, происходит переход на следующее, с порядковым номером ¡=¡+1 В случае, если длина текущего слова больше, либо равно четырем символам, происходит процесс анализа слова, состоящий из этапов, обозначенных выше

4 Выделение терминов из запроса и дополнительный поиск по условным сокращениям (аббревиатурам) без применения вспомогательных словарей

Алгоритм следующий формируем аббревиатуру из всех ключевых слов поискового запроса Задаем минимальный процент (Птт) входимости аббревиатуры в любое сочетание прописных букв из массива информации, где осуществляется поиск В процессе поиска в случае выполнения условия ЛХ'„>=//„„„ (коэффициент входимости (КСех) набора прописных букв в искомую аббревиатуру больше, либо равно константе Птт), текущая запись заносится в результаты поиска Константа Птш определяет минимальный процент входимости аббревиатуры поиска в содержимое поискового поля и задается вручную

Значение КСех рассчитывается следующим образом (8)

КСм=^£м-*т (8), кот

где КСцв - количество последовательно расположенных начальных букв слов из поискового массива информации, входящих в исходную аббревиатуру, КОПБ - общее количество букв исходной аббревиатуры

Пример константу Птт мы задали в размере 70% Поисковый запрос «минпо-взрывная травма голени» Путем оптимизации запроса остается «['мини'+_+ 'взрывы'+_+ 'травм'+_+ 'голен']» и формируется аббревиатура «МВТГ» После начала процедуры поиска на 1-й строке таблицы базы данных

в массиве информации области поиска в том числе была строка «МВТ конечности»

Рассчитаем значение КСВ\

КС.у =-»100 = 75%

" 4

Таким образом, текущая строка «МВТ конечности» также попадет в результаты поиска

Наши исследования в области интеллектуальной редакции поисковых запросов и минимизации дополнительных механизмов для максимального удовлетворения информационных потребностей пользователя, безусловно, находятся на самом начальном этапе Открывается задел для дальнейших работ в данном направлении

В четвертой главе «Оценка эффективности предлагаемых методов, их применение для решения практических задач» рассмотрены вопросы проведения экспериментальных исследований по оценке эффективности предложенных методик, расчет таких критериев устойчивости системы, как показатели стабильности и размера Дается обзор по современным стандартам в программной инженерии, рассматриваются проблемы человеко-машинного взаимодействия, разрабатываются вопросы эргономичное™ интерфейса программы Поэтапно рассматривается процесс разработки программного комплекса па основе предложенных методик В конце приводится информация по разработкам автора, в которых применяются предлагаемые методы

Исследуя предметную область с любой спецификой, затем разрабатывая модель системы, адекватно отражающую предметную область, прежде всего, возникает вопрос эффективности Иными словами, вопрос оптимального соотношения двух показателей системы размера и стабильности

Для определения эффективности системы существует множество разработок, где предлагается огромный спектр методик по данному вопросу Описанные в этих работах методики в полной мере адекватны поставленным задачам Кроме того, понятия «стабильность» и «размер» можно выводить и на базе инфологической модели системы Чтобы более полно раскрыть вопросы определения уровня эффективности инфологической модели системы, применим два новых показателя

размер системы - количество элементов, из которых состоит система, стабильность — показатель, характеризующий соотношение количества элементов системы с критическими ошибками за период времени и общего количества элементов системы (размером системы) (9), (10) Важнейшей характеристикой стабильности системы является показатель уровня ее ошибок Чем ниже показатель уровня ошибок, тем стабильнее функционирует система

ф = со(()*Ш (9),

где Ф - показатель уровня ошибок системы (подсистемы), <у(0 -коэффициент фатальных изменений состояния системы за период времени X Значение коэффициента фатальных изменений состояния системы за период времени &>(0 определяется по формуле (10)

т0) = г«)а1+ + КОа!.(10)>

а

где у(/)„1 + ' У(0а„ - количество элементов, подвергшихся критическим изменениям вследствие внутренних и внешних фатальных возмущений за период времени ^ СС - общее количество элементов системы (размер системы)

Из формулы (10) следует, что &>(!) >^0, тогда, в соответствии с формулой (9)

0 <= ^ <= 100 (11)

Исходя из формул (9), (10) следует, что можно измерить показатель стабильности не только для всей системы, но и подсистем При замерах стабильности системы выбор значения периода времени г несущественно, так как нас интересуют не абсолютные величины стабильности системы, ее подсистем, но их соотношение за определенный период времени I

Главным критерием для оценки эффективности является такой показатель, как пертинентность поиска Значение уровня пертинентности поиска определим как отношение количества строк в результате поиска к количеству строк в базе данных, соответствовавших смыслу поискового запроса(12)

р

=^.,00 (12),

где Р - уровень пертииентноети поиска, - количество строк в результате поиска, 8Ь - количество строк в базе данных, соответствующих смыслу запроса

Результаты экспериментальных исследований по определению эффективности метода иерархической дифференциации показали, чго структура инфологической модели, разработанной при помощи указанного метода, на 24% имеет более высокий уровень оптимизации (рисунок 1, рисунок 2) Коэффициент распределения атрибутов в информационных объектах в оптимизированной системе составляет 0,472, а в неоптимизированной системе 0,744 (рисунок 3) Показатель уровня ошибок оптимизированной системы равен 8,33%, а в неоптимизированной 15,1% Экспериментальные замеры эффективности результатов поиска, позволяют сделать вывод, что уровень пертииентноети с использованием метода интеллектуально-симптоматического анализа поискового запроса возрастает в среднем на 30%

Количество объектов, ед

Рисунок 1 - Кривая соотношения количества объектов и атрибутов инфологической модели разработанной при помощи метода ИДАИОПО

Количество объектов, ед

Рисунок 2 - Кривая соотношения количества объектов и атрибутов инфологической модели разработанной без помощи метода ИДАИОПО

80

«г о 70

60

о

н

ю ЬО

^

а

ь п 40

о

ш 1- 30

и

т т

С

О 10-

• с ИДАИОПО

* бел ИДАИОПО

»

••

«

■ в • • * ** » * » *

«5 0 V * ® т® *

г,_ * _ Ч ф * «3» » & _ в * Н» % *

40 60 80

Количество объектов, ед

Рисунок 3 - Сравнительный уровень распределения атрибутов в информационных объектах управляющей системы

В заключении приводятся основные выводы и результаты диссертационного исследования

В качестве направлений дальнейших исследований можно выделить разработка новых и усовершенствование существующих методов оптимизации систем, анализа предметной области, разработка новых алгоритмов и усовершенствование существующих по интеллектуальному анализу поисковых запросов для наиболее адекватного отображения информационных потребностей пользователя, проведение исследований в

области оптимизации структуры интерфейса программных средств с точки зрения их эргономичности и интуитивной понятности

ЗАКЛЮЧЕНИЕ

Основной результат исследования состоит в том, что разработанные методы структурного анализа предметной области, интеллектуального анализа поискового запроса значительно дополняют существующие методы и в первую очередь ориентированы на разработку систем управления промышленными предприятиями, управляющих систем по мониторингу опасных производств и технологических установок, прочих промышленных объектов Кроме того, результаты данного диссертационного исследования могут применяться в управлении социально значимыми системами, такими, как система по ликвидации последствий террористических актов, система по ликвидации последствии чрезвычайных ситуаций, территориально распределенная система по дополнительному лекарственному обеспечению льготных категорий граждан В таком ключе проблема рассматривается впервые

В целом, научные и практические результаты проведенных работ можно сформулировать в виде следующих выводов

1 Метод иерархической дифференциации атрибутов информационных обьектов управляющей системы отличается внедрением нового показателя взаимодействия элементов системы - коэффициента глубины связей между объектами и субъектами управления анализируемой предметной области Блаюдаря наличию данного коэффициента, а также регулируемого уровня допустимого минимума в его значении, выявление иерархии и создание инфологической модели предметной области происходит со значительным снижением уровня трудоемкости, ресурсозатрат, а созданные по предлагаемому методу системы, отличаются большей эффективностью, что подтверждается данными экспериментальных исследований и практической реализации

2 Метод интеллектуально-симптоматического анализа поискового запроса позволяет максимально полно удовлетворить информационные потребности пользователя, особенно при поиске специализированной информации (терминов и пр) Предлагаемая методика отличается

отсутствием требований по наличию дополнительных элементов и механизмов (тезаурусов, словарей синонимов, словарей «стоп-слов» и пр), кроме того, удаление из поискового запроса незначащей информации происходит в автоматическом режиме Учет некоторых особенностей морфологии русского языка также происходит без дополнительных баз знаний, что значительно снижает уровень требований по внедрению разработанного метода

3 Процедура разработки автоматизированных информационных систем на базе предлагаемых методов в части определения состава, структуры базы данных гораздо упростилась благодаря разработанному механизму ограничения детализации системы, а также улучшенному анализу атрибутов всего массива информационных объектов управляющей системы

4 Методика быстрого развертывания системы на имеющуюся техническую платформу отличается гибкостью, универсальное гью и малыми затратами времени на внедрение и обучения конечных пользователей, что в ряде случаев может быть критично важно

5 Повышенные требования к эргономичности интерфейса программного средства и дополнительные исследования в этой области позволяют создать интуитивно понятный интерфейс, что крайне важно для человеко-машинного взаимодействия (HCI - Human-Computer Interaction)

6 Предложен коэффициент глубины связей между элементами управляющей системы для оптимизации иерархических структур

7 Система оценки эффективности разработанной при помощи предлагаемого метода и вычисления коэффициента глубины связей иифологической модели управляющей системы

8 Результаты исследования внедрены во многих промышленных предприятиях, ведомствах, учреждениях, на что имеются соответствующие акты Экономический эффект от внедрения результатов исследования в практическую деятельность предприятия металлургического комплекса Уральской горно-металлургической компании ОАО «Электроцинк» (г Владикавказ) составил более 590 тыс руб в год

ПУБЛИКАЦИИ

Основное содержание диссертации отражено в следующих опубликованных работах

1 Салбиев А Т Система непрерывного экологического мониторинга опасных производств // Материалы III Северо-Кавказской региональной конференции «Студенческая наука - экологии России», СКГТУ -Владикавказ, 2003

2 Салбиев А Т, Моураов А Г, Дзарасова Б Н Principles of working out of electronic manuals with an integrated system of knowledge testing for national schools // Материалы 11 Международной научно-практической конференции, ТГУ - Тамбов, 2005

3 Салбиев А Т Свидетельство об официальной регистрации программы для ЭВМ «ECONOM Алко» // Федеральный институт промышленной собственности — Москва, 2005 - №2005612564

4 Салбиев А Т Свидетельство об официальной регистрации программы для ЭВМ «ECONOM Больница» // Федеральный институт промышленной собственности - Москва, 2005 - №2005612566

5 Салбиев А Т Свидетельство об официальной регистрации программы для ЭВМ «ECONOM Личное дело» // Федеральный институт промышленной собственности - Москва, 2005 - №2005612568

6 Салбиев А Т Свидетельство об официальной регистрации программы для ЭВМ «ECONOM Оклад» // Федеральный институт промышленной собственности - Москва, 2005 - №2005612565

7 Салбиев А Т Свидетельство об официальной регистрации программы для ЭВМ «ECONOM Отгрузка» // Федеральный институт промышленной собственности — Москва, 2005 - №2005612567

8 Салбиев А Т, Моураов А Г Разработка информационно-управляющей системы органов власти местного самоуправления на базе современных информационных технологий // Труды молодых ученых, Владикавказ ВНЦ РАН и Правительства РСО-А, №3 - 2005

9 Салбиев AT, Моураов А Г Проблема интеллектуального поиска информации в медицинских системах при условии нечеткой структурированное ги данных в режиме чрезвычайной ситуации // Труды молодых ученых, Владикавказ ВНЦ РАН и Правительства РСО-А, №2 -2006

10 Салбиев А Т, Моураов А Г Оптимизация предметной области и разработка алгоритма по учету и распределению денежных средств па оплату фуда медицинских работников по родовым сертификатам в рамках

приоритетного национального проекта «Здоровье» и создание на его основе комплексного программного средства // Менеджмент качества в сфере здравоохранения и социального развития, М Федеральная служба по надзору в сфере здравоохранения и социального развития (Росздравнадзор), №1 -Москва, 2006

11 Салбиев А Т Некоторые вопросы разработки комплексно1 о программного средства на основе модели иерархической информационно-управляющей системы ликвидации последствий террористических актов // Проблемы безопасности и чрезвычайных ситуаций, М ВИНИТИ РАН, №22007

Сдано в набор 23 04 2007 г , подписано а печать 23 04 2007 г Гарнитура Times New Roman Печать трафаретная Формат 60x84 1/16 Бумага офсетная Уел печ л 10 Тираж 100 экэ Заказ № 53 Типография ООО НПКП «МАВР» Лицензия ПД №01107 362040, г Владикавказ, ул Августовских событий, 8, тел 44-19-31

Оглавление автор диссертации — кандидата технических наук Салбиев, Алан Тасолтанович

ВВЕДЕНИЕ.

1. АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ И ПОСТАНОВКА ИССЛЕДОВАТЕЛЬСКИХ ЗАДАЧ.

1.1. Общественно значимые системы.

1.2. Управляющие системы.

1.3. Иерархические системы.

1.4. Информационный поиск.

1.5. Постановка задач исследования.

1.6. Выводы.

2. РАЗРАБОТКА МЕТОДА ИЕРАРХИЧЕСКОЙ ДИФФЕРЕНЦИАЦИИ АТРИБУТОВ ИНФОРМАЦИОННЫ X ОБЪЕКТОВ УПРАВЛЯЮЩЕЙ СИСТЕМЫ С УЧЕТОМ ГЛУБИНЫ СВЯЗЕЙ МЕЖДУ ЕЕ ЭЛЕМЕНТАМИ.

2.1. Общие сведения по анализу предметной области и моделированию систем.

2.2. Формализация и свойства модели предметной области.

2.3. Порядок построения модели предметной области.

2.4. Структурная схема процесса анализа по принципу иерархической дифференциации элементов управляющей системы с учетом глубины связей между ними.

2.5. Метод иерархической дифференциации атрибутов информационных объектов предметной области.

2.6. Процедура оптимизации структуры множества атрибутов информационных объектов управляющих систем.

2.7. Вопросы эффективности инфологической модели управляющей системы.

2.8. Выводы.

3. МЕТОД ИНТЕЛЛЕКТУАЛЬНО - СИМПТОМАТИЧЕСКОГО АНАЛИЗА

ПОИСКОВОГО ЗАПРОСА И ПОСТРОЕНИЕ НА ЕГО ОСНОВЕ АЛГОРИТМА.

3.1. Информационно-поисковые системы и запросы.

3.2. Особенности процесса поиска.

3.3. Проблемы информационного поиска.

3.4. Релевантность и пертинентность информационного поиска.

3.5. Вопросы формирования поискового запроса.

3.6. Методы анализа текста информационно-поискового запроса.

3.6.1. Лингвистический анализ текстовой информации.

3.6.2. Статистический анализ текстовой информации.

3.7. Некоторые термины, связанные с информационным поиском.

3.8. Особенности метода интеллектуально-симптоматического анализа поискового запроса.

3.9. Метод интеллектуально-симптоматического анализа поискового запроса.

ЗЛО. Выводы.

4. ОЦЕНКА ЭФФЕКТИВНОСТИ ПРЕДЛАГАЕМЫХ МЕТОДОВ, ИХ ПРИМЕНЕНИЕ ДЛЯ РЕШЕНИЯ ПРАКТИЧЕСКИХ ЗАДАЧ.

4.1. Экспериментальные исследования по оценке эффективности метода иерархической дифференциации.

4.1.1. Анализируемая предметная область.

4.1.2. Оценка эффективности метода иерархической дифференциации.

4.1.2.1 Размер инфологической модели системы.

4.1.2.2 Стабильность инфологической модели системы.

4.2. Экспериментальные исследования по оценке эффективности метода интеллектуально-симптоматического анализа поискового запроса.

4.3. Разработка комплексного программного средства.

4.3.1. Стандарты в программной инженерии.

4.3.2. Организация человеко-машинного взаимодействия.

4.3.2.1. Основные принципы создания эргономичного интерфейса.

4.3.3. Разработка программных комплексов серии «ECONOM».

4.3.3.1. Структурный и функциональный анализ предметной области.

4.3.3.2. Создание инфологической модели управляющей системы.

4.3.3.3. Выбор метода динамического программирования для реализации алгоритма интеллектуально-симптоматического анализа поискового запроса.

4.3.4. Дальнейшая работа по реализации КАИС серии «ECONOM».

4.3.5. Прочие разработки.

4.4. Выводы.

Введение 2007 год, диссертация по информатике, вычислительной технике и управлению, Салбиев, Алан Тасолтанович

Весь цивилизованный мир к концу XX - началу XXI века столкнулся с глобальной угрозой, которая может кардинально изменить существующий миропорядок. Речь идет об угрозе терроризма, истоки которой - глобальная борьба за энергетические ресурсы, за благоприятный ареал обитания, противодействие глобализации, возникновение новых радикальных течений в религиях, жизненной риторике, в агрессивной внешней политике некоторых мировых держав.

Кроме того, за последние два десятилетия из-за роста масштабов терроризма возросла вероятность техногенных катастроф, чрезвычайных ситуаций. Все вышеперечисленное ведет к многочисленным жертвам, огромному экономическому ущербу, как для граждан, так и государства в целом. Необходимо разрабатывать эффективные системы по предупреждению и ликвидации негативных последствий указанных выше явлений, в том числе, повышать качество управляющих систем по мониторингу опасных производств.

В нашей стране на законодательном уровне предпринимаются попытки регламентировать такие понятия, как «терроризм», «террористический акт», разрабатывается нормативная база как для процедуры устранения причин террористического акта, так и ликвидаций его последствий [1]. Таким образом, система ликвидации последствий террористических актов, чрезвычайных ситуаций, относится к классу систем, имеющих особую общественную значимость.

На текущий момент, в Российской Федерации происходят реформы, особо - в общественной сфере. Стремительно меняется законодательство, правила и уклад жизни. Меняется система общественной защиты, предоставления льгот. В активной фазе проходят приоритетные национальные проекты, призванные улучшить положение дел в самых болевых точках общества.

Приведенные выше задачи не могут решаться в полном объеме без использования современных информационно-коммуникационных технологий, потому что основным критерием, влияющим на конечный результат в рамках решения поставленных задач, будет служить уровень, качество и оперативность информационного обмена.

Таким образом, мы имеем самый широкий круг вопросов общественной направленности, которые требуют систематизации, упорядочивания. В большинстве случаев, от того, насколько эффективно в той или иной сфере налажен информационный обмен, учет, зависит судьба миллионов людей.

Информационные системы, призванные автоматизировать указанные выше процессы, относятся к категории общественно значимых. Иными словами, от их наличия и стабильности функционирования зависит благополучие и жизнедеятельность определенных групп общества.

Кроме проблем отказоустойчивости общественно значимых информационных систем, возникают вопросы оперативного поиска информации и группировки ее в нужных разрезах. Более того, при поиске, ранжировании и группировке информационного массива следует учитывать неточность первичной информации (к примеру, сведения о пострадавших, получаемых путем опроса самих пострадавших, находящихся в состоянии глубокого аффекта, либо имеющих тяжелые физические повреждения).

Опыт показывает, что именно от максимальной полноты и достоверности информации зависят не только последующие управленческие решения, но и конечный результат, и эффективность всей работы общественно значимых автоматизированных информационных систем.

Эксперт не всегда может справиться с поставленной задачей, здесь может быть несколько факторов:

1. Большой объем поступающей информации.

2. Неточность, недостоверность исходных (первичных) данных.

3. Отсутствие достаточных знаний для осуществления анализа всего массива информации.

Таким образом, на каждом участке, где требуется внедрение общественно значимых автоматизированных информационных систем, должна быть развернута комплексная управляющая система, как на уровне законодательных, нормативных актов, межведомственных соглашений, так и на уровне методологической, технической реализации подобной системы с максимальным привлечением современных информационно -коммуникационных технологий.

Для общественно значимых систем, где длительность, стабильность функционирования и эффективность информационного поиска становятся критично важными факторами, должен быть разработан метод, который помимо снижения трудозатрат на построение оптимальной инфологической модели предметной области, сможет обеспечить стабильность ее функционирования.

Кроме того, для общественно-значимых систем, особенно тех, что работают в режиме чрезвычайной ситуации и содержат массивы неструктурированной, нечетко заданной информации, должен быть разработан метод интеллектуального анализа поисковых запросов, и этому есть несколько причин:

1. Пользователь не всегда может четко сформулировать поисковый запрос, тем более в режиме чрезвычайной ситуации.

2. Трудно подобрать ключевые слова для адекватного поиска нужных данных в массиве неструктурированной, неточной информации, в том числе специализированных терминов.

3. Стандартные методы интеллектуального поиска здесь неприемлемы, так как подобные алгоритмы требуют наличия множества заполненных тезаурусов (справочников синонимов, справочников «стоп-слов» и пр.), на создание которых нужны эксперты, а состав информации всегда зависит от специфики общественно значимой системы, что приводит к существенному увеличению трудозатрат при ее разработке и внедрении.

Метод и алгоритм интеллектуальной обработки информационных запросов не должны требовать наличия каких-либо прочих вспомогательных элементов, при этом, после интеллектуального анализа, поисковый запрос, как и сами результаты поиска по данному запросу, должны максимально полно отвечать информационным требованиям пользователя.

Анализ информации по существующим исследованиям показал, что существует множество работ, посвященных вопросам системного анализа предметной области, оптимального моделирования систем.

Работы в области анализа систем, оптимизации и моделировании ведут многие ученые: Т. Sarson, J. Rumbaugh, G. Booch, I. Jacobson, В. В. Липаев, A. А. Штрик, Б. А. Позин, Г. H. Калянов, Е. 3. Зиндер и другие [88]. Но при этом крайне мало разработок, по крайней мере, в свободном доступе, которые бы рассматривали вопросы изучения, к примеру, системы управления по ликвидации последствий террористических актов.

Принимая во внимание тот факт, что для разработки общественно значимых информационных систем, существенным фактором является снижение уровня трудозатрат, а соответственно и себестоимости, нас в полной мере существующие разработки удовлетворить не могут.

Также множество работ посвящены вопросам поиска информации, в том числе с элементами интеллектуального анализа. Указанной тематике посвятили свою деятельность такие видные ученые, как: И. С. Некрестьянов, И. Е. Кураленок, А. Е. Ермаков, М. Р. Когаловский, G. Salton, L. Gravano, J. Kleinberg и другие [130].

Но крайне мало исследований в области интеллектуальной обработки поискового запроса, в то время как подобная процедура может максимально полно удовлетворить информационные потребности пользователя, не требуя при этом дополнительных механизмов. Это существенно снизит трудоемкость, ресурсоемкость при разработке подобных систем, а также их себестоимость.

Разработка эффективных методов анализа специфической предметной области для оптимального моделирования ее инфологической структуры, разработка метода интеллектуальной обработки поискового запроса для нахождения требуемой информации в массиве неточных (искаженных) данных, а также создание на основе этих методов комплексных автоматизированных информационных систем и составляет суть диссертационной работы.

Целью диссертационной работы является разработка метода и на его основе алгоритма быстрого и эффективного анализа структуры управляющей системы для создания ее оптимальной инфологической модели (ИМУС), а также создание метода и на его основе алгоритма интеллектуальной обработки поискового запроса, не требующего вспомогательных механизмов (тезаурусы, словари и т.п.), но вместе с тем наиболее полно удовлетворяющего информационные потребности пользователя по поиску в массиве неточных (искаженных) данных специализированной информации, создание на основе разработанных методов и алгоритмов комплексного программного средства.

Поставленная цель потребовала решения следующих задач:

1. Создание нового метода атрибутного анализа управляющей системы и составления ее оптимальной инфологической модели.

2. Разработка метода интеллектуального анализа поискового запроса для максимального удовлетворения информационных потребностей пользователя без использования вспомогательных средств.

3. Разработка принципов построения на основе указанных выше методов комплексного программного средства.

4. Создание системы для оценки эффективности применения предлагаемых методов.

Методы исследования. В работе были использованы аппарат математической логики; теорий: множеств, графов, структур данных, построения и анализа эффективных алгоритмов, системного анализа, оптимизации на графах.

Научная новизна работы:

1. Разработан метод расчета коэффициента глубины связей между элементами иерархической управляющей системы (КГСУС), основанный на утверждении о том, что указанный коэффициент зависит от количества управляющих сигналов между элементами системы за определенный период времени.

2. Разработан метод иерархической дифференциации атрибутов информационных объектов управляющей системы с учетом глубины связей между элементами при системном анализе предметной области (ИДАИОПО), позволяющий существенно дополнить стандартные методы оптимизации структуры управляющих систем за счет введения нового показателя -коэффициента глубины связей между элементами системы.

3. Разработан метод интеллектуально-симптоматического анализа поискового запроса, позволяющий увеличить уровень пертинентности результатов поиска без применения дополнительных механизмов, к примеру, тезаурусов, основываясь лишь на содержимом массива информации, в котором осуществляется поиск.

4. Разработан метод оценки эффективности инфологической модели системы по таким показателям, как стабильность функционирования и размер.

5. Сформулированы критерии оценки эффективности результатов поиска за счет вычисления уровня пертинентности.

Практическая значимость результатов диссертационной работы состоит в использовании полученных модели, метода и алгоритмов для решения задач оптимального структурного анализа предметной области; максимальном удовлетворении информационных потребностей пользователя без дополнительных механизмов, затрат времени, вычислительных ресурсов; быстрой разработке структуры базы данных на основе эффективной инфологической модели предметной области; существенном снижении трудозатрат на проектирование систем при помощи метода иерархической дифференциации атрибутов информационных объектов управляющей системы.

Предложенный метод и алгоритм интеллектуального анализа поискового запроса могут быть использованы при разработке особо критичных к стабильности функционирования поисково-информационных систем, как локальных, так и территориально распределенных любого уровня сложности.

Практическая значимость результатов диссертационного исследования подтверждается их внедрением на предприятиях металлургической и пищевой промышленности, а также в Федеральной службе по надзору в сфере здравоохранения и социальной защиты населения (г. Москва), Министерстве здравоохранения Республики Северная Осетия - Алания (г. Владикавказ), территориальном управлении Федеральной службы по надзору в сфере здравоохранения по Республике Северная Осетия - Алания (г. Владикавказ), и лечебно - профилактических и фармацевтических учреждениях Республики Северная Осетия - Алания.

Разработанное автором программное обеспечение использовалось для сбора и анализа информации о пострадавших и распределения поступающей гуманитарной помощи при террористическом акте 1-3 сентября 2004 года в средней школе №1 г. Беслан Республики Северная Осетия - Алания.

Обоснованность и достоверность научных положений и выводов подтверждается результатами экспериментальных исследований и расчетов, работоспособностью разработанных на основе предлагаемых методов автоматизированных информационных систем, в том числе регионального уровня.

На защиту выносятся следующие положения:

1. Метод иерархической дифференциации атрибутов информационных объектов управляющей системы с учетом глубины связей между элементами при системном анализе предметной области (ИДАИОПО) и разработанный на его основе алгоритм.

2. Методика расчета и применения коэффициента глубины связей между элементами управляющей системы (КГСУС).

3. Метод интеллектуально-симптоматического анализа поискового запроса и разработанный на его основе алгоритм (ИСАЗ).

4. Метод оценки эффективности разработанной инфологической модели системы на основе определения таких показателей, как размер и стабильность.

5. Методика оценки эффективности результатов поиска, основанная на вычислении уровня пертинентности.

Апробация работы.

Основные положения и отдельные результаты работы докладывались и обсуждались на следующих конференциях и семинарах:

- на II Международной научно - практической конференции «Актуальные проблемы информатики и информационных технологий», (Тамбов, 2005 г.); на Всероссийской научно-практической конференции "Информационное обеспечение реализации национального проекта «Здоровье», (Москва, 2006 г.);

- на Всероссийском форуме-выставке «Здоровье нации - основа процветания России», (Москва, 2006 г.).

- на I Всероссийской научно-практической конференции «Инновации в здравоохранении», (Москва, 2006 г.).

Личный вклад автора: все основные результаты исследований, рассмотренные в диссертации, автором получены самостоятельно. В работах [2, 8, 9, 10], выполненных в соавторстве, все существенные положения разработаны автором.

Публикации. Основные результаты диссертационной работы опубликованы в И печатных работах, из них 5 свидетельств о регистрации программ для ЭВМ, выданных Федеральным институтом промышленной собственности (Роспатент), г. Москва.

Структура и объем работы: диссертация состоит из введения, четырех глав, заключения, списка литературы, приложений и включает в себя 133 страницы машинописного текста, 9 таблиц, 25 рисунков.

Заключение диссертация на тему "Исследование и разработка автоматизированной информационно-управляющей системы с интегрированной функцией поиска в массиве неструктурированных данных"

Результаты исследования внедрены во многих промышленных предприятиях, ведомствах, учреждениях, на что имеются соответствующие акты. Экономический эффект от внедрения результатов исследования в практическую деятельность предприятия металлургического комплекса Уральской горно-металлургической компании ОАО «Электроцинк» (г. Владикавказ) составил более 590 тыс. руб. в год.

Основные положения и отдельные результаты работы докладывались и обсуждались на следующих конференциях и семинарах:

- на II Международной научно - практической конференции «Актуальные проблемы информатики и информационных технологий», (Тамбов, 2005 г.); на Всероссийской научно-практической конференции "Информационное обеспечение реализации национального проекта «Здоровье», (Москва, 2006 г.);

- на Всероссийском форуме-выставке «Здоровье нации - основа процветания России», (Москва, 2006 г.). на I научно-практической конференции «Инновации в здравоохранении», (Москва, 2006 г.).

В качестве направлений дальнейших исследований можно выделить:

- разработка новых и усовершенствование существующих методов оптимизации систем, анализа предметной области;

- усовершенствование методологии составления многокритериальных поисковых запросов;

- разработка новых алгоритмов и усовершенствование существующих по интеллектуальному анализу поисковых запросов для наиболее адекватного отображения информационных потребностей пользователя;

- проведение исследований в области оптимизации структуры интерфейса программных средств с точки зрения их эргономичности и интуитивной понятности.

ЗАКЛЮЧЕНИЕ

В работе рассмотрены теоретические и практические вопросы решения задач по созданию новых методов структурного анализа предметной области для создания эффективных инфологических моделей иерархических управляющих систем, метода интеллектуального анализа поискового запроса для его оптимизации в целях максимально полного удовлетворения информационных потребностей пользователя. Кроме того, рассмотрена концепция создания на базе предлагаемых методов комплексной автоматизированной информационной системы с учетом особенностей человеко-машинного взаимодействия, требований эргономики.

Разработаны: метод иерархической дифференциации атрибутов информационных объектов управляющей системы, коэффициент глубины связи между элементами управляющей системы, позволяющий эффективно создавать инфологическую модель управляющей системы анализируемой предметной области. Также разработан метод интеллектуально-симптоматического анализа поискового запроса, предназначенного для повышения уровня пертинентности результатов поиска, на основе указанного метода построен алгоритм.

Реализовано комплексное программное средство на основе вышеуказанных исследований. Предложенная модель, метод и алгоритмы, а также технология реализация программного средства могут использоваться как для решения конкретных задач оптимального управления общественно значимыми системами, так и для решения общих задач развертывания автоматизированных информационно-управляющих систем в условиях необходимости оперативного контроля, распределения ресурсов и составления максимально полных и точных информационных выборок из массива нечетких, либо недостоверных данных. Также в диссертации заложен базис для дальнейшей теоретической и практической проработки вопросов создания новых и совершенствования существующих методов по оптимизации анализируемой предметной области, по созданию инфологических моделей. Кроме того, чрезвычайно важно продолжить исследования в области методов интеллектуального анализа поисковых запросов для получения максимально адекватного результата поиска. Нужно прорабатывать систему оценки эффективности создаваемых методов, алгоритмов, процедур, а также улучшению методологических основ технологии реализации комплексных программных средств на основе разработанных оптимальных моделей.

Основными результатами, полученными в диссертации, являются:

1. Метод иерархической дифференциации атрибутов информационных объектов управляющей системы.

2. Предложен коэффициент глубины связей между элементами управляющей системы для оптимизации иерархических структур.

3. Метод интеллектуально-симптоматического анализа поискового запроса и построение на его основе алгоритма для повышения уровня пертинентности результатов поиска.

4. Регламент разработки на основе предлагаемых методов комплексной автоматизированной информационно - управляющей системы.

5. Порядок оптимального развертывания информационно - управляющей системы на базе доступных технических средств.

6. Система оценки эффективности разработанной при помощи предлагаемого метода и вычисления коэффициента глубины связей инфологической модели управляющей системы.

7. Принципы повышения уровня эргономичности интерфейса программ для ЭВМ.

Программное обеспечение, разработанное в рамках диссертационной работы, нашло свое применение в управляющей системы по ликвидации последствий террористического акта в СОШ №1 г. Беслан Республики Северная Осетия - Алания 1-4 сентября 2004 года. Некоторые положения диссертации использованы при разработке различных автоматизированных информационных систем. Новизна решений подтверждена пятью свидетельствами об официальной регистрации программ для ЭВМ, выданных Роспатентом, г. Москва.

Библиография Салбиев, Алан Тасолтанович, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. «Российская газета» (Федеральный выпуск) №4014 от 10 марта 2006 г.

2. АСОФ СПб. Модель предметной области. // СПб: Илка, 1997г.

3. Абрамов Л.М., Капустин В.Ф. Математическое программирование. Л.: ЛГУ, 1981,328 с.

4. Адарюков В.И. Исследование и разработка машинно-ориентированного метода инфологического моделирования информационно-поисковых систем фактографического типа: Дис. . к-та технич. наук: 05.13.06 / ЛЭТИ. СПб., 1988,255-256 с.

5. Анфилатов B.C. и др. Системный анализ в управлении: Учебное пособие М.: Финансы и статистика, 2002,368 с.

6. Артемьев В.И. Обзор способов и средств построения приложений // СУБД, № 5-6, 1996.

7. Ашманов И., Григорьев С., Гусев В., Харин Н., Шабанов В. Применение статистических методов для интеллектуальной компьютерной обработки текстов. // Сборник тезисов докладов международного семинара Диалог-97. Ясная Поляна, 10-15 июня 1997,33-37 с.

8. Балашов У.П. Эволюционный синтез систем. М.: Радио и связь, 1985, 328 с.

9. Белянин В.П. Введение в психолингвистику. Изд. 2-е, испр. и доп., -М.: ЧеРо, 2000,128 с.

10. Брукс Ф. Создание программных систем. СПб.'Символ-Плюс, 1999, 301с.

11. Брусиловский Б.Я. Теория систем и система теорий. Киев: издательство «Высшая школа», 1977,185-191 с.

12. Бурков В.И. Теория активных систем и совершенствование хозяйственного механизма: учебное пособие. -М.:Наука, 1984,267 с.

13. Бусленко Н.П. Моделирование сложных систем. М.: Наука, 1968, 356с.

14. Буч Г., Рамбо Д., Джекобсон А. Язык UML. Руководство пользователя //№, изд-во ДМК, 2000г.

15. Васютович В.В., С.С.Самотохин, Г.С.Никифоров. Регламентация жизненного цикла программных средств // М., Computer World Россия, журнал «Директору информационной службы» № 07-08, 2000г.

16. Вендров A.M. CASE-технологии, чЛ. IIМ.-Финансы и статистика, 1998, 120 с.

17. Вендров А.М. CASE-технологии, ч.2. // М.:Финансы и статистика, 1998,57 с.

18. Гительман Л.Д. Развитие хозяйственного управления в электроэнергетике (теория, методология, реализация): Дисс. . д-ра экономических наук: 08.00.21 / УПИ Свердловск, 1987, 390-391 с.

19. Горбатов В.А. Теория частично упорядоченных систем. М.: издательство «Советское радио», 1976,320-337 с.

20. ГОСТ 34.003-90. Комплекс стандартов по информационным технологиям. Термины и определения.

21. ГОСТ 34.601-90. Стандарты по руководящим документам на автоматизированные системы, стадии создания автоматизированных систем.

22. ГОСТ 34.602-89. Комплекс стандартов и руководящих документов на автоматизированные системы, техническое задание на создание автоматизированных систем.

23. ГОСТ 7.73 96. Межгосударственный стандарт - стандарты по информации, библиотечному и издательскому делу.

24. Громов А.В., Чубинидзе К.А. Динамическая классификация для аналитиков // Открытые системы №11 - 2005,42-46 с.

25. Гэйн К., Сарсон Т. Структурный системный анализ: средства и методы. М.: «Эйтекс», 1993, 86 с.

26. Дегтярев Ю.И. Системный анализ и исследование операций -М.:Высшая школа, 1996,335 с.

27. Денисов А. А. Теория больших систем управления Л.:Энергоиздат, 1982,285 с.

28. Дружинин В.В. и др. Проблемы системологии. М.: издательство «Советское радио», 1976, 291-296 с.

29. Дубинский А.Г. Некоторые вопросы применения векторной модели представления документов в информационном поиске // Управляющие системы и машины, №4, 2000, 81-84 с.

30. Ермаков А.Е. Эксплицирование элементов смысла текста средствами синтаксического анализа-синтеза // Компьютерная лингвистика и интеллектуальные технологии: труды Международной конференции Диалог'2003. М.: Наука, 2003.

31. Ермаков А.Е. Неполный синтаксический анализ текста в информационно-поисковых системах // Труды I Международного семинара Диалог'2002, т.2. Москва, 2002,179-187 с.

32. Плешко В.В. Ассоциативная модель порождения текста в задачах классификации и формализации // Информационные технологии, №12, 2000.

33. Ершов Ю.Л. Проблемы разрешимости и конструктивные модели. М.: Наука, 1980,416 с.

34. Ефремов В.А. Особенности умного поиска. // Открытые системы. -№11.- 2005, 48-52 с.

35. Зиндер Е.З. Бизнес-реинжиниринг и технологии системного проектирования -М.: ЦИТ, 1996, 54-96 с.

36. Зиндер Е.З. Методы и инвариантный инструмент синтеза инфологической модели для интегрированной САПР. В кн.: Численные методы и средства проектирования и испытания РЭА (тезисы докладов). Т. 2. -Таллинн, ТЛИ, 1987,131-134 с.

37. Макарова Н.В. Информатика: учебник,- 3-е переработанное издание. -М.: Финансы и статистика, 2005, 786 с.

38. Калашников В.В. Сложные системы и методы их анализа Математика и кибернетика - М.:3нание, №9,1980, 63 с.

39. Калянов Г.Н. CASE. Структурный системный анализ (автоматизация и применение), ч.1. -М.: Лори, 1996.

40. Калянов Г.Н. CASE. Структурный системный анализ (автоматизация и применение), ч.2. -М.: Лори, 1996.

41. Калянов Г.Н. Теория и практика реорганизации бизнес-процессов: учебное пособие М.:СИНТЕГ, 2000, 54 с.

42. Кейслер Г., Чэн Ч.Ч. Теория моделей. М.: Мир, 1977,614 с.

43. Когаловский М.И. Перспективные технологии развития информационных систем. М.: изд-во «ДМК Пресс», 2003, 276-288 с.

44. Когаловский М.Р. Энциклопедия технологий баз данных, 2 издание -М.:Финансы и статистика, 2002, 765 с.

45. Козлов Е. Б., Метелкин А. В., Хорошевский В. Ф. Мультиагентная система поиска информации в Интернет // Труды седьмой национальной конференции по искусственному интеллекту с международным участием КИИ'2000. М.: Физматлит, 2000, 840-850 с.

46. Кранощеков П.С., Петров А.А. Принципы построения моделей. М.: ФАЗИС, 2000,410-412 с.

47. Кузнецов А.В., Холод Н.И. Математическое программирование -Минск:«Вышэйшая школа», 1984,217-219 с.

48. Некрестьянов И.С. и др. Автоматическая классификация документов на основе латентно-семантического анализа // Труды I научно-методической конференции «Электронные библиотеки». СПб., 1999,86-94 с.

49. Лагоша Б.А. и др. Основы системного анализа (учебное пособие) -М.:МЭСИ, 1998, 106 с.

50. Липский В. Комбинаторика для программистов. М.: МГУ, 1988, 118 с.

51. Лурия А.Р. Основы нейропсихологии М.: МГУ, 1973,374 с.

52. Маркусова В.А., Реброва М.П., Страшко В.П. Особенности интерактивного поиска проблемно-ориентированной информации в базе данных SCI-SEARCH. НТИ. Сер. 2, №3,1988,26-30 с.

53. Мартин Дж. Планирование развития автоматизированных систем, перевод с англ. М.:Финансы и статистика, 1984, 86-94 с.

54. Математическое моделирование. Под ред. Гупало Ю.П. М.: Мир, 1979, 277 с.

55. Международный стандарт КОЛЕС 12207. Первое издание 01.08.1995г.

56. Международный стандарт ISO/TR 10006:1997. Первая редакция 15.12.1997г.

57. Мейер Д. Теория реляционных баз данных: учебное пособие М.:Мир, 1987, 607 с.

58. Месарович М, Такахара Я. Общая теория систем / перевод с англ. М.:Мир, 1978, 309-311 с.

59. Месарович М., Мако Д., Такахара Н. Теория иерархических систем / перевод с англ. М.:Мир, 1973,342-343 с.

60. Месарович М., Такахара Я. Общая теория систем / перевод с англ. -М.:Мир, 1978,312-313 с.

61. Мессарович М.Д., Мако Д., Такахари И. Теория иерархических многоуровневых систем / перевод с англ. М.:Мир, 1973,344-345 с.

62. РД 50-34.698-90 Методические указания, требования к содержанию документов.

63. Методология DATARUN. // Русский перевод АО «Аргуссофт», М.: 1996, 54-68 с.

64. Мороз А.И. Курс теории систем: Учебное пособие. М: издательство «Высшая школа». - 1987, 301-304 с.

65. Некрестьянов И.С. Тематико-ориентированные методы информационного поиска: Дисс. . к-та технич. наук: 05.13.11 СПГУ - СПб., 2000, 80 с.

66. Нечипоренко В.И. Структурный анализ систем. М.: издательство «Советское радио», 1977, 205-211 с.

67. Николаев В.И. и др. Системотехника: методы и приложения / учебное пособие Л:Машиностроение, 1985, 198 с.

68. Николаевская С.Г. Исследование и разработка машинно-ориентированного метода логического проектирования информационно-поисковых систем: Дисс. к-та технич. наук: 05.13.06 / Ташкентский политехнический институт. Ташкент, 1990, 139-148 с.

69. Новиков Ф. А. Дискретная математика для программистов (учебное пособие для студентов технических вузов) СПб.:Питер, 2002,189-209 с.

70. Новоженов Ю.В. Объектно-ориентированные технологии разработки сложных программных систем: учебное пособие М.: Аргуссофт, 1996,24-31 с.

71. Осипов Г. С., Куршев Е. П., Кормалев Д. А., Трофимов И. В., Рябков О. В., Тихомиров И. А.: Препринт // Семантический поиск в среде Интернет. -Переславль-Залесский, ИПС РАН, 2003.

72. Павловский Ю.Н. Имитационные модели и системы. М.: ФАЗИС, 2000, 134 с.

73. Паронджанов С. Д. Методология и технология создания информационных систем организаций // Труды конференции Индустрия программных средств, Москва, сентябрь 1996г.

74. Перегудов Ф.И. Введение в системный анализ: учебное пособие для студентов высших учебных заведений. М.: Высшая школа, 1989, 362-367 с.

75. Петров В.Н. Информационные системы: учебное пособие для студентов высших учебных заведений / В.Н. Петров.- СПб.: Питер, 2003, 688 с.

76. Преснякова Г.Ф. Проектирование баз данных в АСУ. Учебное пособие. Л.:ЛИАП, 1985, 62 с.

77. Рапопорт B.C. Развитие организационных форм управления НТП в промышленности-М.:Экономика, 1979, 219 с.

78. Савин Г.И. Системное моделирование сложных процессов / учебное пособие. М.: изд-во ФАЗИС, 2000, 275-277 с.

79. Салбиев А.Т., Моураов А.Г. Разработка информационно-управляющей системы органов власти местного самоуправления на базе современных информационных технологий // Владикавказ, ВНЦ РАН и Правительства РСО-Алания, журнал «Труды молодых ученых» № 3,2005г.

80. Семенова С.Ю. Поиск параметрической информации в тексте // Труды Международного семинара Диалог'96. М., 1996,227-230 с.

81. Семяшкин Ф.И. Вопросы решения организационных проблем производственно-хозяйственных подразделений промышленности: Дисс. . д-ра экономических наук Свердловск, 1983, 359-360 с.

82. Строганов Р.П. Управляющие машины и их применение: учебник для студентов технических вузов М.:Высшая школа, 1986,245 с.

83. Сэлтон Г. Автоматическая обработка, хранение и поиск информации -М.:Советское радио, 1973, 550-553 с.

84. Тиори Т., Фрай Дж. Проектирование структур баз данных М.: Мир, 1985, т.1, 287 с.

85. Тудер И.Ю. Коллективное моделирование предметной области большой размерности: Дисс. к-та техн. наук. Москва, 2002. - 136 с.

86. Ульман Дж. Основы систем баз данных, пер. с англ. М.:Финансы и статистика, 1983,335 с.

87. ФЗ РФ от 06.03.06 № 35-Ф3 «О противодействии терроризму».

88. Фрумкина P.M. Психолингвистика. М.: Академия, 2001,320 с.

89. Хаббард Дж. Автоматизированное проектирование баз данных: учебное пособие, пер. с англ. М.:Мир, 1984.

90. Харламов А.А. и др. Технология обработки текстовой информации с опорой на семантическое представление на основе иерархических структур из динамических нейронных сетей, управляемых механизмом внимания // Информационные технологии 1998 - № 2 - 26-32 с.

91. Храмцов П.А. О поисковых системах, доменных именах и поисковой оптимизации. // Открытые системы. 2005. - №11. - с. 58-61.

92. Черняк Л.И. От информационно-поисковых систем к корпоративному поиску. // Открытые системы. 2005. - №11. - с. 36-40.

93. Яковлев С.А. Анализ структуры текста и прогнозирование нечисловых величин // Материалы I Общероссийской НТК Вологда: ВоГТУ, 2003,202-204 с.

94. Яковлев С.А. и др., Анализ текста, применительно к решению задач поиска документов по образцу // ИНФОС 2003 - Вологда: ВоГТУ, 2003. - 4952 с.

95. Шилейко А.В. и др. Введение в информационную теорию систем / учебное пособие М.: издательство «Радио и Связь», 1985,276-278 с.

96. Шрейдер Ю.А., Шаров А.А. Системы и модели. М.: Радио и связь, 1982,152 с.

97. Эшби У.Р. Введение в кибернетику (перевод с английского) -М.:Иностранная литература, 1959,32-35 с.

98. Barker R. CASE * Method. Entity Relationship Modeling. Copyright Oracle Corporation UK Limited, Addison-Wesley Publishing Co., 1990.

99. Boehm B.W. A Spiral Model of Software Development and Enhancement // ACM SIGSOFT Software Engineering Notes. Aug. 1986.

100. Brown E.W. Execution Performance Issue in Full-Text Information Retrieval. Dissertation. University of Massachusetts. Department of Computer Science. February 1996.

101. Dublin Core Metadata Element Set Reference Description, Version 1.1 // www.purl.org/dc/documents/proposedrecommendations/pr-dces-19990702.html.

102. Dumais S. Latent semantic indexing: TREC-3 report. In Proc. of the Third Text Retrieval Conference, 1995.

103. Foltz P.W. Using latent semantic indexing for information filtering. In ACM Conference on Office Information Systems (COIS), pages 40-47,1990.

104. Gruber T. A translation approach to portable ontology specifications. Knowledge Acquisition, 5(2), 1993, pp. 199-220.

105. Harman D. Latent semantic indexing (LSI) and TREC-2. In Proc. of the Second Text Retrieval Conference, 1994.

106. Held M., Karp R.M. A Dynamic Programming Approach to Sequencing Problems. //J. Soc. Industry and Appl. Math. 10NN1 (1960), p. 196-210.

107. Jackson M.A. System Development. Englewood Cliffs, New Jersey: Prentice Hall International, 1983.

108. Jensen R. A Dynamic Programming Algorithm for Cluster Analysis. //«OpenRes», 1969, №6.

109. Jing Y., Croft W.B. An Association Thesaurus for Informational Retrieval. Department of Computer Science, University of Massachusetts at Amherst, 1994.

110. Kruchten P. The Rational Unified Process: an introduction. Second edition // Addison Wesley Longman, inc., 2000.

111. Land A.H., Doig A.G. An Automatic Method for Solving Discrete Programming Problems. Econometric.

112. Landauer Т., Foltz P., and Laham D. An introduction to latent semantic analysis. Discourse Processes, 25:259-284.

113. Maron M.E., Kuhns J.L. On relevance, probabilistic indexing and information retrieval. Jornal of the ACM, No. 7,1960, pp. 216-244.

114. Martin J. Recommended Diagramming Standards for Analysts and Programmers. N.J., Prentice Hall, 1987.

115. Martin J., Rapid Application Development, MacMillan Publishing Company, 1991.

116. Merkl D. A Handbook of Natural Language Processing: Techniques and Applications for the Processing of Language as Text, chapter Text data mining. Marcel Dekker, New York, 1998.

117. Rumbaugh J., Blaha M., Premerlani W., Eddy F., Lorensen W. Object-oriented modeling and design. Englewood Cliffs, NJ. Prentice Hall, 1991.

118. Salton G., Lesk M.E. Computer Evaluation of Indexing and Text Searching. Journal of the ACM. 1968, Vol. 15, N 1, p. 8-36.

119. Salton G., Buckley C. Term-weighting approaches in automatic text retrieval. Information Processing and Management, 24:513-523,1988.

120. Salton G., Fox E., and Wu H. Extended Boolean information retrieval. Communications of the ACM, Vol. 26, No. 4, December 2001, pp. 35-43.

121. Salton G., McGill M. J. Introduction to modern Information Retrieval. McGraw-Hill Computer Science Series. McGraw-Hill, New York, 1983.

122. Singhal A. Modern Information Retrieval: A Brief Overview. Data Engineering Bulletin, IEEE Computer Society, Vol. 24, No. 4, December 2001, pp. 35-43.

123. Stephen B. Hunter-Gatherer: Applying Constraint Satisfaction, Branch-and-Bound and Solution Synthesis to Natural Language Semantics NMSU CRL Technical Report. MCCS-96-292.

124. Stiles H.E. The Association Factor in Information Retrieval. Journal of the ACM, 1961, Vol. 8, N 2, p. 271 279.

125. Turtle H. R. Inference Networks for Document Retrieval. Dissertation. University of Massachusetts. Department of Computer and Information Science. February 1991.

126. Yang Y., Pederson J. Feature selection in statistical learning of text categorization. In Proc. of the ICML"97, pages 412-420,1997.

127. Чугреев B.JI. Модель структурного представления текстовой информации и метод ее тематического анализа на основе частотно-контекстной классификации: Дисс. к-та техн. наук. Санкт-Петербург, 2003. - 5 с.

128. ГОСТ 774 96 Межгосударственный стандарт - система стандартов по информации, библиотечному и издательскому делу, термины и определения.

129. Международный стандарт ISO 5127-6-83. Первое издание 1983г.

130. Бусленко Н.П. и др. Лекции по теории сложных систем -М.:Советское радио, 1973,317-324 с.

131. Касьянов В.Н. Оптимизирующие преобразования программ. М.: Наука, 1988,100-106 с.

132. Яковлев А.П. и др. Автоматизированные информационные системы в условиях многопрофильного стационара. М.: ФФОМС, 2000,13-60 с.

133. Степанов М.Л., Степанова С.В. Методические указания по курсу «Исследование операций и методы оптимизации», чЛ. Владикавказ: Терек, 2000,5-10 с.

134. Степанов М.Л., Степанова С.В. Методические указания по курсу «Исследование операций и методы оптимизации», ч.2. Владикавказ: Терек, 2000, 5-16 с.

135. Кармен Т. и др. Алгоритмы: построение и анализ (перевод с английского) М.:МЦНМО, 2001, 88-100 с.

136. Тейксейра С., Пачеко К. Delphi 5. Руководство разработчика, т.1. М.: Вильяме, 2000, 145-153 с.

137. Тейксейра С., Пачеко К. Delphi 5. Руководство разработчика, т.2. М.: Вильяме, 2000, 604-649 с.