автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Информационная система обработки и хранения больших массивов данных с различной структурой по химии и химической технологии

кандидата технических наук
Жуков, Дмитрий Юрьевич
город
Москва
год
2005
специальность ВАК РФ
05.13.01
Диссертация по информатике, вычислительной технике и управлению на тему «Информационная система обработки и хранения больших массивов данных с различной структурой по химии и химической технологии»

Автореферат диссертации по теме "Информационная система обработки и хранения больших массивов данных с различной структурой по химии и химической технологии"

На правах рукописи

Жуков Дмитрий Юрьевич

ИНФОРМАЦИОННАЯ СИСТЕМА ОБРАБОТКИ И ХРАНЕНИЯ БОЛЬШИХ МАССИВОВ ДАННЫХ С РАЗЛИЧНОЙ СТРУКТУРОЙ ПО ХИМИИ И ХИМИЧЕСКОЙ ТЕХНОЛОГИИ

05.13.01 Системный анализ, управление и обработка

информации

(химическая технология, нефтехимия и нефтепереработка,

биотехнология)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва - 2005 г.

Работа выполнена в Российском химико-технологическом университете имени Д.И. Менделеева.

Научный руководитель - доктор технических наук, профессор

Меньшутина Наталья Васильевна

Официальные оппоненты - доктор технических наук, профессор

Бессарабов Аркадий Маркович

- кандидат технических наук, доцент Богомолов Борис Борисович

Ведущая организация - Открытое акционерное общество

«Центральный научно-исследовательский институт комплексной автоматизации» (ОАО «ЦНИИКА»)

Защита состоится "29" декабря 2005 г. в 11 часов в Конференц-зале на заседании диссертационного совета Д 212.204.03 в РХТУ имени Д.И. Менделеева по адресу: 125047, Москва, А-47, Миусская пл., д. 9.

С диссертацией можно ознакомиться в Научно-информационном центре РХТУ им. Д.И. Менделеева.

Автореферат разослан "28" ноября 2005 г.

Ученый секретарь диссертационного совета Д 212.204.03

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность проблемы. Химия является одной из наиболее быстро развивающихся наук, поскольку ее достижения применяются практически во всех областях жизни человечества. Химические знания используются для производства энергии, получения продуктов питания, синтеза всевозможных материалов, обеспечения здравоохранения и решения экологических проблем. Развитие различных направлений химии сопровождается стремительным ростом объемов получаемой информации. Так, только число известных химических соединений удваивается каждые 6-7 лет. С появлением высокопроизводительных ЭВМ, компактных средств хранения больших объемов информации и высокоскоростных электронных сетей, связывающих ЭВМ между собой, появились реальные возможности качественного и количественного преобразования подходов в хранении и обработке информации. Оценки тенденций развития информационных технологий свидетельствуют о перспективности создания электронных библиотек, объединяющих в единое целое:

• систему создания и хранения электронных версий печатных изданий;

• систему электронных каталогов, аккумулирующих данные обо всех имеющихся носителях информации (книгах, журналах, отчетах, базах данных и пр.), позволяющих осуществить быстрый поиск необходимой информации;

• систему доступа к первичным носителям информации (выполнение заказов на передачу полных текстов первоисточников по электронным сетям и средствами межбиблиотечного обмена и т.п.).

Однако специфика информации, потребляемой и производимой химической отраслью, такова, что данная информация практически не имеет какой бы то ни было детерминированной структуры, то есть, массивы производимых и потребляемых различным типам:

структурированным, слабоструктурированным и нестрктурированным. Обработка такой информации массовыми программными продуктами, предназначенными для управления информацией, крайне затруднена и является, в большинстве случаев, нетривиальной задачей. Этот факт связан с той же слабой структурированностью исходной «сырой» информации и, как следствие, с большими трудностями при переработке такой информации, при переносе ее в базы данных (БД).

Разработка новых подходов и технологий создания информационных систем (ИС) хранения и управления информацией с различной структурой, реализующая механизмы оперативного информационного обеспечения специалистов предприятий химической отрасли, является актуальной задачей.

Основные разделы диссертационной работы выполнены в соответствии с заданием Министерства образования и науки РФ «Совершенствование информационной и патентной базы, защита интеллектуальной собственности, маркетинговые исследования по промышленной реализации проектов направления» Федеральной целевой научно-технической программы "Исследования и разработки по приоритетным направлениям развития науки и техники" на 2002-2006 годы", Блок 2 "Прикладные исследования и разработки", раздел «Новые материалы и химические продукты", подраздел "Химические процессы" (протокол № 1 от 17 января 2002 г.).

Цель работы. Основная цель работы заключалась в создании программно-информационного комплекса, предназначенного для работы с большими массивами данных с различной структурой по химии, химической технологии и смежным областям. Для достижения поставленной цели необходимо решить следующие задачи: • Разработка подхода к созданию информационной системы обработки и хранения больших объемов структурированной, слабоструктурированной и неструктурированной информации.

• Создание программно-информационного решения, реализующего функции накопления информации, интеграции существующих баз данных в единой системе, обеспечивающего быстрый и бесконфликтный ввод новой информации произвольной структуры.

• Проектирование программной структуры, реализующей разработанную фактографическую модель и обеспечивающую объединение и совместное использование информации баз данных различными организациями.

• Разработка оригинального поискового механизма.

• Обеспечение различных пользователей возможностью пополнения базы данных.

• Обеспечение возможности использования сторонними организациями и предприятиями информационных ресурсов, созданных при работе с системой.

• Сбор и организация значительного количества информации в области химии и химической технологии в рамках предлагаемой фактографической модели.

Научная новизна. Предложена архитектура информационной системы по химии и химической технологии, позволяющая хранить большие объемы разнородной информации (структурированной, слабоструктурированной и неструктурированной), позволяющая унифицировать процесс анализа, транспорта и конверсии данных и отличающаяся отсутствием необходимости соответствия структуры вводимой информации заранее заданной модели.

Создан алгоритм поиска как по ключевым словам, так и с использованием каталогов. Запрос может быть сформулирован и в терминах ключевых слов, и как полнотекстовый поиск по всему тексту единиц хранения БД. Формализованный, правильный запрос определяет объем понятия формулой вместо прямого перечисления.

Предложена оригинальная модель организации данных и выделения формальных признаков для описателей информации предметной области (метаинформацик). Данные, структурированные с помощью механизма автоматического анализа данных, обладают высокой устойчивостью к структурным повреждениям, независимостью от структуры вновь добавляемых блоков данных и высокой информационной эффективностью

Практическая значимость. Разработана информационно-программная среда, позволяющая значительно уменьшать временные и трудовые затраты на поиск информации для решения ряда задач, возникающих в ходе разработки и проведения производственных и исследовательских проектов.

Разработана фактографическая система хранения информации, включающая следующие основные аспекты: российские и зарубежные патенты, рефераты и статьи из российских и зарубежных журналов, материалы российских и зарубежных выставок и конференций, маркетинговую информацию, правовые документы в области химии и химической технологии, химическую (формулы, физико-химические и другие свойства) и технологическую информацию предприятий-производителей.

Собрана и распределена информация в области химии и химической технологии в рамках предлагаемой фактографической системы (более 8 млн. единиц информации).

Программный продукт отвечает высоким требованиям информационной эргономики. В ходе практической эксплуатации информационной системы были получены высокие оценки специалистов.

Основные научные результаты диссертации внедрены в некоммерческом партнерстве «Химико-технологический научный центр».

Апробация работы. Результаты работы были представлены на Первом Международном конгрессе молодых ученых по химии и химической технологии «МКХТ-2005», Москва, 2005 г.

Публикации. По материалам диссертации опубликовано 3 печатных работы.

Структура и объем диссертации. Диссертация состоит из введения, 4

глав, заключения, приложения и содержит_страниц основного текста,_

рисунков,_таблиц и список литературы из_наименований.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность проблемы, поставлена цель работы, обоснован применяемый к решению проблемы подход.

В первой главе приведен развернутый анализ литературных источников, затрагивающих проблемы хранения и управления информацией в области химии и химической технологии. Рассмотрены основные источники информации, используемые специалистами химических предприятий в повседневной деятельности.

Приведены основные модели организации данных, применяемые в современных средствах обработки информации, рассмотрены типы и примеры приложений, используемых при обработке информации.

Проведен обзор основных БД в области химии и смежных с ней наук. В соответствии с целью работы и на основании выводов, сделанных в результате анализа литературы, сформулирована постановка задачи и намечены этапы ее решения.

Вторая глава посвящена системному анализу информации предметной области и разрабо!ке модели хранения данных. В данной главе рассматриваются различные типы данных, используемых специалистами в области химии и химической технологии, выделяются категории информации, формулируются основные признаки принадлежности данных к той или иной категории.

Рассматривая любой типовой процесс химического производства, можно выделить два базовых класса процессов - производственные процессы и исследовательские процессы. Специалистам, организующим эти процессы, требуется информация различного рода, представленная на рис. 1. Эта информация может быть собрана из различных источников: баз данных, лабораторных журналов и так далее.

тоНзМпститйШщан млЛлМ&ШсЪв- '

ЗАКОНОДАТЕЛЬСТВО

Рис. 1. Информация, как часть производственного процесса

Вся требуемая информация, как правило, имеет различные типы данных:

• неструктурированные данные (лабораторные журналы, статьи, публикации, модели и другие);

• слабоструктурированные данные (параметры процесса, результаты эксперимента и другие);

• структурированные данные (например, патенты).

Объяснением этого факта является то, что основная часть используемой информации традиционно представлена в документарном виде.

Следующим шагом работы был процесс выделения характеристических особенностей химической информации в содержании документарных данных с

различной структурой. Системный анализ имеющихся данных позволил выявить следующие особенности: данные предметной области включают большой процент устойчивых терминологических сочетаний и, как правило, значительное количество особого типа информации - химических формул, анализ которых может быть частично или полностью автоматизирован; имеется большая вероятность встречи пары терминов, разделенных известным количеством слов (сегментная метаструктура); данные предметной области имеют большое количество перекрестных связей и могут быть сгруппированы по общей тематике.

С учетом этих особенностей, в ходе работы была разработана расширенная модель организации данных, представленная на рис. 2. Это расширенная сетевая модель, управляемая специальной информацией -метаданными, описывающими блоки хранимой информации.

ИНФОРМАЦИЯ ПРЕДМЕТНОЙ' ОБЛАСТИ

ОЦЕНКА КАЧЕСТВЕННЫХ ХАРАКТЗДиСТЙК ИНФОРМАЦИИ

МЕТАДАННЫЕ

"X

/

I ^ ' » г Ч ^

< N •

у г !

« - ЕДИНИЦА ХРАНЕНИЯ

&1 И

Рис. 2. Расширенная модель организации данных

База данных, являющаяся физическим воплощением представленной модели организации данных, ориентирована на хранение большого количества информации, изначально имеющей документарную форму. Такая база данных буде! являться фактографической, то есть, хранящей фактическую информацию, либо информацию о факте существования некоторой другой информации.

База данных системы включает, а программные механизмы системы активно используют «информацию об информации» или, так называемую, метаинформацию, которая является специфической особенностью созданной системы. Использование мстаинформации в поисковых механизмах системы позволяет значительно ускорить работу поисковых подсистем и существенно улучшить такой критерий, как качество выдаваемой по запросу информации, т е повысить смысловую эффективность поисковой подсистемы.

Применение расширенной модели организации данных и хранящейся в базе данных системы метаинформации позволяет разработанной системе учитывать структурную и смысловую специфику хранимой информации. Модель при этом ориентирована на максимальную смысловую эффективность результатов работы соответствующих поисковых систем. Под смысловой эффективностью понимается максимальное соответствие отобранной по запросу информации изначальным требованиям пользователя, создавшего запрос.

Предлагаемая расширенная модель делает возможным создание проблемно-ориентированных БД с максимально широким охватом сопутствующей информации, без необходимости адаптации и интегрирования (зачастую, невозможного) набора существующих решений. Становится возможным создание баз данных, например, по переработке драгметаллов, мембранным технологиям, очистке воды и других, пополняемых из любых источников, в том числе вручную и со сканера, взаимосвязанных с базами данных по правовым вопросам, по существующему производственному

оборудованию, по российским и зарубежным патентам и так далее. Набор сопутствующих баз данных и других информационных хранилищ определяется исключительно самим пользователем, в зависимости от потребностей и возможностей использования. Сама система при этом не претерпевает каких-либо концептуальных изменений, требующих переработки программной части. Таким образом, система обретает истинную модульность и практически неограниченную масштабируемость. Естественность модели хранения данных в системе дает возможность пользователю получать именно те данные и именно в том виде, в котором они ему необходимы.

Третья глава посвящена описанию процесса проектирования созданной системы. Рассмотрены основные объекты системы, их отношения и взаимодействия. Спроектирована структура программного комплекса и всех его составляющих, от элементарных единиц хранения данных, до особенностей и функциональности пользовательского интерфейса и методик подготовки и ввода данных в систему.

Проектирование выполнялось по классической схеме «снизу-вверх», заключающейся в расширении функциональности и возможностей системы за счет использования (объединения, дополнения) ранее спроектированных структурных единиц, имеющих элементарную структуру. Данный метод используется при построении систем в концепции объектно-ориентированного программирования.

Для моделирования структуры был использован подход, базирующийся на введении понятия «единица хранения». Базовой единицей хранения информации в разработанной фактографической БД является документ, при этом единица хранения фактографической БД, например, книга, может быть разбита на отдельные составляющие либо по смысловому принципу - на главы, либо по метрическому - на страницы. Эти составляющие в концепции предлагаемой структуры разработанной фактографической БД являются единицами хранения. Такие единицы хранятся и обрабатываются поисковыми

механизмами отдельно друг от друга и являются полностью структурно самостоятельными.

Для четкого разграничения понятий единицы хранения разработанной фактографической базы данных и исходного источника информации в работе вводится понятие первичного или исходного документа.

Разделение первичных документов на части (единицы хранения фактографической БД) позволяет разумно организовать работу поисковых и аналитических модулей, работающих с информацией БД разработанной системы.

Физически, вся база данных состоит из взаимосвязанных или самостоятельных единиц хранения. После создания, единица хранения интегрируется в существующую БД, становясь, с одной стороны, неотъемлемой ее частью и сохраняя, с другой стороны, собственную структурную независимость.

Важнейшим свойством разработанной модели организации данных, помимо структурной независимости, является взаимосвязанность единиц хранения БД, которая условна и существует только в виде блока метаданных, сформированного аналитической подсистемой. Взаимосвязь единиц хранения фактографической БД строится на основе сетевой модели организации данных.

Блоки метаданных формируются при вводе данных в систему, в автоматическом или полуавтоматическом режиме и представляют собой, набор формальных признаков принадлежности единиц хранения к определенным группам.

Разработанная модель структурных элементов принималась как набор правил, управляющих аналитическим механизмом, основными этапами работы которого, в соответствии с разработанной моделью структурных элементов, являются:

• этап выделения терминов;

• этап выделения словосочетаний;

• этап выделения сегментной метаструктуры;

• этап выделения ссылок на другие документы;

• этап выделения структурированных блоков.

Последние два этапа являются опциональными и проходят только с привлечением пользователя. Процесс повторяется до исчерпания входного массива данных.

Метаданные активно используются поисковой подсистемой при исполнении пользовательских запросов. На основании метаданных рассчитывается параметр, определяющий степень соответствия единицы хранения пользовательскому запросу - релевантность.

Разработанный поисковый запрос представляет собой текстовую строку, включающую искомые термины, объединяемые командами управляющего языка запросов. Язык запросов, разработанный для управления информацией системы, включает в себя специальные символы знакозамены, логические операторы (табл. 1) и операторы контекстного и сегментного поиска (табл. 2). Запрос может быть сформулирован и в терминах ключевых слов, и как

полнотекстовой поиск по всему тексту единиц хранения БД.

Таблица 1.

Логические операторы

Оператор Пример Комментарий

A AND В Золото AND серебро А и В одновременно находятся в документе;

A SEGM В Золото SEGM серебро А и В одновременно находятся в одном фрагменте;

A not В Золото NOT серебро А должно, а В не должно находиться в документе;

A OR В Золото OR серебро или Золото серебро хотя бы один термин (или А, или В) находится в документе

A XOR В Золото XOR серебро только один термин (либо А, либо В) находится в документе

NO А N0 золото А не встречается в документе

Таблица 2.

Контекстные операторы

Оператор Пример Комментарий

А СТХг] В карбид+ СТХО вольфрам+ А и В находятся в документе в заданном порядке (А предшествует В) и между ними не более т| слов;

А 1ЧЕА1Ь1 В алюминий №А115 кобальт А и В находятся в документе в любом порядке и между ними не более г) слов;

АСТХл В сталь СТХ1 углерод* ищет "сталь углеродистая", "сталь с углеродом"

АКЕАКп В сталь КЕАШ углерод дополнительно ищет "сталь содержит углерод"

Руководствуясь поисковым запросом, поисковая подсистема формирует выборку из единиц хранения, сортируя найденное по релевантности. Элементы, имеющие наивысшую релевантность, располагаются вверху списка.

Четвертая глава диссертационной работы посвящена описанию практической реализации спроектированной системы и ее испытаний в условиях рабочего процесса реального предприятия. Глава содержит ряд примеров практического использования разработанной системы, а также содержит количественные характеристики хранилища информации, обрабатываемого созданной системой.

Хранилище данных разработанной системы включает различную информацию. На текущий момент система состоит из 10 разделов, содержащих более 8 млн. единиц хранения. Объем информационного хранилища системы составляет приблизительно 16,2 гигабайта.

Благодаря развитой функциональности подсистемы ввода информации, процессы переноса данных в разработанную систему большей частью были автоматизированы, а сам процесс занесения данных занял относительно небольшое время.

Программная часть системы представляет собой приложение, исполненное в операционной среде Windows, не требующее никаких дополнительных программных модулей от сторонних производителей Интерфейс программы интуитивно понятен, и соответствует требованиям информационной эргономики. Система предоставляет возможность работы в многооконном режиме. Поддерживается одновременая независимая работа с различными хранилищами данных и их разделами.

Посредством интерфейса пользователь имеет возможность управлять данными, получать отображение хранимой информации, проводить поиск и структурирование информации системы, вводить новые данные и так далее. Пример интерфейса пользователя системы представлен на рис. 5.

Система может использоваться как единая база данных предприятия, хранящая данные по проводимому проекту или исследованию. Информация может использоваться различными специалистами предприятия, выполняющими разнородные задачи. Однако каждый пользователь может получить полную информационную картину текущего проекта и использовать всю накопленную информацию в своей работе.

Приводятся данные сравнительного тестирования на примерах других информационных решений: электронных каталогов выставок, электронных версий журналов и так далее. Делается вывод о высокой адекватности и полноте информации, выдаваемой поисковыми механизмами разработанной системы.

Важнейшим свойством разработанной системы является обеспечение возможности групповой работы пользователей с самой системой и с хранящейся в ней информацией.

В заключении приводятся выводы и результаты практического применения разработанной системы в некоммерческом партнерстве «Химико-технологический научный центр».

_ • vi .a

гацгв« дс

щ

щ

\mirn

FpSS

,.: ФИ ГОСУЛА^СТКННОЕПЯСДПРНЯ1ИСПОПРСНЛОДСТВ»V I ойаество опрьио»о ги

1 т$т?Ш ^llMteate!

(1>ЯЖ "ШЕРОНСГ ЛЕР£В0С1РАШЫ8АШЕ ЛР0ИЯ0Ш1Е1 (!>» ТЛННОЗЕМ ПИМЕ6СКСЁ ОБЬСАИКСННЕ 01КРЫГС1 Ш <1>ЙГ ТОРККНСКИЙХИМИЧЕСМЙ ЗАВО ДИОНЕРНОЕ ОЕЯЕС <МЩ ТОСУДДКГвШЫЙ «ЧСГИТУ7 по JM

<\>т ТОЛДАРСШИИЫЙ hucikw no DPOEKTKPOIAHWI ПР

<ЬШ tAtWPOflbWfl ЗА60Д- ШРЫШ АКЦИОНЕРНОЕ 05КЕС

<1.8» ПАНСКИЙ НОЖНЦПИМ мог мрытоеишюнн ■

<!)«* -иЖ1ЯИГ'АЫИОНЕРНО{ ООДОТО ЗАКРЫТОГО ТИПА. ФШ "КАТАЛИЗАТОР" А* ЦНОЯЕРНОЕ 9ШС160 ОТКРЫТОГО 1И (»Of "КАУРИ" ФИРМ*. 05вШ« С ОГРАНИЧЕННОЙ 0T8EICW <ЫЁ171Г ТЕРМОПЛАСТ-КОМПАНИЯ ОБЩЕСТВО С ОГРАЛИЧЕКН <Ч|»230 ^ПРОбИОСИНТЕГОПкРВТКАКЦИОНЕРНОЕ 05«ЕС «1>Й| Й1 ТИПРС1АУЧУР ОТКРЫТОЕ ШИЗ МЕРНОЕ 0Я1ЕСТЮ <1ЙЁ* Ж Т0СУйАРСТ8£ННЬЛ ИНСТИТУТ 10 ПРОШИРО$АКИ1

«жяятаятвкияшяшявят ?

<1>ЯЕ т "KAflPOflAKTAM"ОТКРЫТОЕ АКЦИОНЕРНОЕ Of 6СТ8(

•......WKOTUWnUEWUiCUBUUW

125311 г Моема. ? й Анвумюоний Тепегайг 111571 riep/wr Факс (055) 15? <1-80 I5J-45-09 Ген директор £листН»«Ойб*Ив Ten (0J5U51 ¡8-81 1Н «MS Основные иалреыкнмднтвяьнос лрммиромим* лромиодег» по _газопиеменнэо аИравошинетажш

IliLL

Рис. 5. Пример интерфейса системы. Окна запроса и вывода результатов поиска

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

1. Проведен всесторонний анализ данных, которые используются предприятиями и специалистами в области химии и химической технологии. Отмечено разнообразие информации и типов данных, предоставляемых различными изданиями - патенты, статьи, справочники - что не позволяет создать единое информационное пространство и обеспечить эффективный поиск информации и обмен ею между конечными пользователями.

2 Разработана архитектура фактографической программно-информационной системы, предназначенной для хранения большого объема слабоструктурированной информации. Спроектирована структура, реализующая разработанную фактографическую модель и обеспечивающая объединение и совместное использование различными организациями информации, содержащейся в базах данных.

3. Создан алгоритм поиска как по ключевым словам, так и с использованием каталогов. Запрос может быть сформулирован и в терминах ключевых слов, и как полнотекстовой поиск по всему тексту единиц хранения БД Формализованный, правильный запрос определяет объем понятия формулой вместо прямого перечисления.

4. Разработана фактографическая система хранения информации, включающая следующие основные разделы: российские и зарубежные патенты, рефераты и статьи из российских и зарубежных журналов, материалы российских и зарубежных выставок и конференций, маркетинговая информация, правовые документы в области химии и химической технологии, химическая и технологическая информация предприятий-производителей.

5. Собрана и распределена информация в области химии и химической технологии в рамках предлагаемой фактографической системы (более 8 млн. единиц информации).

6. Обеспечена возможность наполнения базы различными пользователями, а также возможность использования созданных при работе с системой информационных ресурсов для сторонних организаций и предприятий.

7. Разработанная фактографическая система используется в закрытом доступе для государственных унитарных предприятий.

1. Жуков Д.Ю., Гончарова C.B., Меныиутина Н.В Корпоративная база данных для работников химической промышленности // Химическая промышленность сегодня. - 2004. - № 11. - С. 52-54.

2. Жуков Д.Ю., Гончарова СВ., Меныиутина Н.В. Разработка корпоративной базы данных в области химии и химической технологии // Программные продукты и системы. - 2004. - № 4. - С. 45-47.

3. Жуков Д.Ю., Чунихин E.H., Гусева Е.В. Корпоративная база данных для химической промышленности: возможности, структура, принципы поиска информации // Сб. научных трудов I Международного конгресса молодых ученых по химии и химической технологии «МКХТ-2005». - М.: РХТУ, 2005. - T.XIX, - № 2. - С. 16-19.

СПИСОК ПУБЛИКАЦИЙ

Заказ № "У ^_Объем 1,0 п.л._Тираж 100 экз.

Издательский центр РХТУ им. Д.И.Менделеева

V 22 9 4 9

РНБ Русский фонд

2006-4 27000

Оглавление автор диссертации — кандидата технических наук Жуков, Дмитрий Юрьевич

Введение.

1. Литературный обзор.

1.1. Модели представления данных.

1.2. Типы информационных приложений.

1.3. Базы данных по химии и смежным наукам.

1.4. Постановка задачи.

2. Системный анализ информации по химии и химической технологии. Расширенная модель хранения данных.

2.1. Анализ информации предметной области: информация в химии и химической технологии.

2.2. Характер и свойства информации предметной области. Основные типы информации.

2.3. Возможности использования существующих моделей организации данных.

2.3.1. Иерархическая модель.

2.3.2. Реляционная модель.

2.3.3. Сетевая модель.

2.4. Расширенная модель хранения данных.

3. Архитектура информационной системы по химии и химической технологии.

3.1. Базовые объекты системы.

3.2. Базовая единица хранения.

3.2.1. Модель единицы хранения.

3.2.2. Интеграция единицы хранения в базу данных.

3.2.3. Связывание единиц хранения.

3.3. Полнотекстовые индексы.

3.4. Структура фактографической базы данных.

3.5. Поисковая подсистема.

3.5.1. Режимы поиска информации.

3.5.2. Запросы и язык запросов.

3.5.3. Интегрированный язык запросов.

3.6. Характеристические особенности информационной системы.

3.7. Функционирование и качественные показатели созданной информационной системы.

4. Практическая реализация.

4.1. Оценка эффективности разработанной информационной системы.

4.2. Критерии оценки.

4.3. Сравнительное тестирование на примерах узкоспециализированных программно-информационных решений.

4.3.1 Электронный проспект.

4.3.2. Электронная версия журнала.

4.3.3. Сборник рефератов патентов.

4.4 Визуализация данных фактографической программно-информационной системы.

5. Выводы.

Введение 2005 год, диссертация по информатике, вычислительной технике и управлению, Жуков, Дмитрий Юрьевич

Химия является одной из наиболее быстро развивающихся наук, поскольку ее достижения применяются практически во всех областях жизни человечества. Химические знания используются для производства энергии, получения продуктов питания, синтеза всевозможных материалов, обеспечения здравоохранения и решения экологических проблем. Развитие различных направлений химии сопровождается стремительным ростом объемов получаемой информации. Так, только число известных химических соединений удваивается каждые 6-7 лет. С появлением высокопроизводительных ЭВМ, компактных средств хранения больших объемов информации и высокоскоростных электронных сетей, связывающих ЭВМ между собой, появились реальные возможности качественного и количественного преобразования подходов в хранении и обработке информации [1-6]. Оценки тенденций развития информационных технологий свидетельствуют о перспективности создания электронных библиотек, объединяющих в единое целое:

• систему создания и хранения электронных версий печатных изданий;

• систему электронных каталогов, аккумулирующих данные обо всех имеющихся носителях информации (книгах, журналах, отчетах, базах данных и пр.), позволяющих осуществить быстрый поиск необходимой информации;

• систему доступа к первичным носителям информации (выполнение заказов на передачу полных текстов первоисточников по электронным сетям и средствами межбиблиотечного обмена и т.п.).

Однако специфика информации, потребляемой и производимой химической отраслью, такова, что данная информация практически не имеет какой бы то ни было детерминированной структуры, то есть, массивы производимых и потребляемых данных относятся к различным типам: структурированным, слабоструктурированным и неструктурированным.

Обработка такой информации массовыми программными продуктами, предназначенными для управления информацией, крайне затруднена и является, в большинстве случаев, нетривиальной задачей. Этот факт связан с той же слабой структурированностью исходной «сырой» информации и, как следствие, с большими трудностями при переработке такой информации, при переносе ее в базы данных (БД).

Разработка новых подходов и технологий создания информационных систем (ИС) хранения и управления информацией с различной структурой, реализующая механизмы оперативного информационного обеспечения специалистов предприятий химической отрасли, является актуальной задачей.

Основные разделы диссертационной работы выполнены в соответствии с заданием Министерства образования и науки РФ «Совершенствование информационной и патентной базы, защита интеллектуальной собственности, маркетинговые исследования по промышленной реализации проектов направления» Федеральной целевой научно-технической программы "Исследования и разработки по приоритетным направлениям развития науки и техники" на 2002-2006 годы", Блок 2 "Прикладные исследования и разработки", раздел «Новые материалы и химические продукты", подраздел "Химические процессы" (протокол № 1 от 17 января 2002 г.).

Основной целью диссертационной работы являлось создание программно-информационного комплекса, предназначенного для работы с большими массивами данных с различной структурой по химии, химической технологии и смежным областям. Для достижения поставленной цели необходимо было решить следующие задачи: • Разработка подхода к созданию информационной системы обработки и ф хранения больших объемов структурированной, слабоструктурированной и неструктурированной информации. • Создание программно-информационного решения, реализующего функции накопления информации, интеграции существующих баз данных в единой системе, обеспечивающего быстрый и бесконфликтный ввод новой информации произвольной структуры.

• Проектирование программной структуры, реализующей разработанную фактографическую модель и обеспечивающую объединение и совместное использование информации баз данных различными организациями.

• Разработка оригинального поискового механизма.

• Обеспечение различных пользователей возможностью пополнения базы данных.

• Обеспечение возможности использования сторонними организациями и предприятиями информационных ресурсов, созданных при работе с системой.

• Сбор и организация значительного количества информации в области химии и химической технологии в рамках предлагаемой фактографической модели.

Вышеперечисленные задачи решались в следующем порядке.

В первой главе - литературном обзоре - приведен развернутый анализ литературных источников, затрагивающих проблемы хранения и управления информацией в области химии и химической технологии. Рассмотрены основные источники информации, используемые специалистами химических предприятий в повседневной деятельности.

Приведены основные модели организации данных, применяемые в современных средствах обработки информации, рассмотрены типы и примеры приложений, используемых при обработке информации.

Проведен обзор основных БД в области химии и смежных с ней наук. В соответствии с целью работы и на основании выводов, сделанных в результате анализа литературы, сформулирована постановка задачи и намечены этапы ее решения.

Во второй главе был проведен системный анализ информации предметной области. Были рассмотрены различные типы данных, используемых специалистами в области химии и химической технологии, выделены категории информации и сформулированы основные признаки принадлежности данных к той или иной категории. С учетом этих особенностей была разработана расширенная модель организации данных, представляющая собой расширенную сетевую модель, управляемую специальной информацией - метаданными, описывающими блоки хранимой информации. База данных, которая представляет собой физическое воплощение представленной модели организации данных и ориентированная на хранение большого количества информации, изначально имеющей документарную форму, будет являться фактографической.

Третья глава посвящена описанию процесса проектирования созданной системы. Рассмотрены основные объекты системы, их отношения и взаимодействия. Спроектирована структура программного комплекса и всех его составляющих, от элементарных единиц хранения данных, до особенностей и функциональности пользовательского интерфейса и методик подготовки и ввода данных в систему.

В четвертой главе диссертационной работы описывается практическая реализация спроектированной системы и ее испытаний в условиях рабочего процесса реального предприятия. Глава содержит ряд примеров практического использования разработанной системы, а также содержит количественные характеристики хранилища информации, обрабатываемого созданной системой.

Автор выражает глубокую благодарность руководителю работы профессору Менынутиной Н.В., доцентам Гончаровой С.В. и Гусевой Е.В., научному сотруднику Шишулину Д.В. и инженеру Гордиенко М.Г. за обсуждение материалов и помощь в подготовке диссертации.

1. Литературный обзор

В настоящее время Россия по уровню развития электронных сетей и создания электронных библиотек значительно отстает от развитых стран мирового сообщества. Перенесение всей имеющейся информации на электронные носители в силу большого объема накопленных знаний, требует весьма продолжительного времени. Это в полной мере относится к изданиям, вышедшим до появления электронных средств подготовки печатных изданий. Однако практически любые вновь издаваемые книги, научные журналы и т.п., подготовленные с использованием компьютерных средств, могут стать доступными для пользователей электронных сетей за обозримое время.

В этих странах существуют несколько типов глобальных, региональных и локальных сетей, объединяющих информационные источники различного профиля (издательства, информационные и статистические службы и другие) и их пользователей (банки, производителей продуктов и товаров, торговые фирмы, исследовательские организации, учебные учреждения, библиотеки, издательства, коммунальные службы и частных лиц). Создаются и развиваются сети, позволяющие объединить вычислительные возможности различных организаций (концепция мезо-компьютера). Для организации таких сетей используются как специально созданные высокоскоростные оптоволоконные, так и обычные телефонные линии. Практически все крупные организации имеют собственные локальные сети, имеющие выходы в соответствующие региональные и международные сети.

Уровень развития электронных сетей можно характеризовать, например, тем, что большинство продающихся в США бытовых компьютеров имеет встроенные сетевые адаптеры и факс-модемы, мультимедийные устройства, позволяющие их пользователям получать и передавать информацию, связываться с обслуживающими их банками, коммунальными службами, информационными серверами и так далее. 8

Причем, стоимость этих компьютеров относительно невысока (от 500 долларов). По оценкам специалистов более 50 % американских семей имеют бытовые компьютеры, которые представляют постоянно растущий рынок потребления информационных услуг.

В России при неудовлетворительном развитии информационных сетей, обслуживающих индивидуальных пользователей, научные и банковские учреждения имеют достаточно крупные и разветвленные сети. Развитие этих сетей идет довольно быстрыми темпами [7], несмотря на серьезные финансовые трудности и отставание в техническом уровне коммуникационных технологий.

Согласно [7] в стране насчитывается до 30 тысяч баз данных (БД), содержащих сотни гигабайт информации, которые встроены в различные автоматизированные информационные системы (АИС) и используются только в рамках этих систем. БД, доступных для широкого круга пользователей, насчитывается около трех тысяч. Средний объем и срок жизни большинства российских БД существенно уступает зарубежным аналогам. В силу отказа от вычислительных машин типа ЕС в настоящее время идет работа по переводу имеющихся баз на компьютеры западного производства. Можно прогнозировать, что в ближайшие 2-3 года практически все научные учреждения и учебные заведения будут иметь выходы в INTERNET или другие сети. Однако возникает другая проблема -отсутствие доступа к отечественным базам данных и практическое отсутствие отечественных электронных библиотек. Для устранения этой проблемы требуется также значительное привлечение сил и средств. В настоящее время имеется лишь ограниченный доступ к базам ВИНИТИ, БЕН. Вместе с тем имеется большое количество баз и банков данных за рубежом, доступных на коммерческой основе. Так, например, только Chemical Abstracts Service, являющаяся отделением Американского Химического Общества, предоставляет доступ к 10 базам данных, аккумулирующих сведения более чем о 20 млн. названий химических веществ, 14 млн. регистрационных номеров химических соединений, 12 млн. библиографических ссылок в области химии, биохимии, геологии, металлургии, материаловедческих наук и других, 1,8 млн. патентов, 200 тыс. структур, 2 млн. химических реакций.

Практически все университетские библиотеки развитых западных стран имеют мощные библиографические базы данных (например, кумулятивные базы Chemical Abstracts), а также большинство всех значимых баз экспериментальных данных. Так, например, библиотека среднего по размерам университета г. Кливленда (Огайо, США, Case Western Reserve University) имеет более 170 электронных баз на оптических дисках.

Заключение диссертация на тему "Информационная система обработки и хранения больших массивов данных с различной структурой по химии и химической технологии"

5. Выводы

1. Проведен всесторонний анализ данных, которые используются предприятиями и специалистами в области химии и химической технологии. Отмечено разнообразие информации и типов данных, предоставляемых различными изданиями - патенты, статьи, справочники - что не позволяет создать единое информационное пространство и обеспечить эффективный поиск информации и обмен ею между конечными пользователями.

2. Разработана архитектура фактографической программно-информационной системы, предназначенной для хранения большого объема слабоструктурированной информации. Спроектирована структура, реализующая разработанную фактографическую модель и обеспечивающая объединение и совместное использование различными организациями информации, содержащейся в базах данных.

3. Создан алгоритм поиска как по ключевым словам, так и с использованием каталогов. Запрос может быть сформулирован и в терминах ключевых слов, и как полнотекстовой поиск по всему тексту единиц хранения БД. Формализованный, правильный запрос определяет объем понятия формулой вместо прямого перечисления.

4. Разработана фактографическая система хранения информации, включающая следующие основные разделы: российские и зарубежные патенты, рефераты и статьи из российских и зарубежных журналов, материалы российских и зарубежных выставок и конференций, маркетинговая информация, правовые документы в области химии и химической технологии, химическая и технологическая информация предприятий-производителей.

5. Собрана и распределена информация в области химии и химической технологии в рамках предлагаемой фактографической системы (более 8 млн. единиц информации).

6. Обеспечена возможность наполнения базы различными пользователями, а также возможность использования созданных при работе с системой информационных ресурсов для сторонних организаций и предприятий.

7. Разработанная фактографическая система используется в закрытом доступе для государственных унитарных предприятий.

Библиография Жуков, Дмитрий Юрьевич, диссертация по теме Системный анализ, управление и обработка информации (по отраслям)

1. Кафаров В.В. Методы кибернетики в химии и химической технологии. М.: Химия. 1985. С. 8-21.

2. Кафаров В.В., Дорохов И.Н. Системный анализ процессов химической технологии. Основы стратегии. М.: Наука. 1976. С. 4-10.

3. Мешалкин В.П. Экспертные системы в химической технологии. Основы теории, опыт разработки и применения. М.: Химия, 1995. С. 10-15.

4. Кафаров В.В., Мешалкин В.П. Анализ и синтез химико-технологических систем. Учебник для вузов. М.: Химия. 1991. С.10-12.

5. Анализ, хранение и обработка информации в химической технологии/ Под ред. Н. В. Меныпутиной. Калуга. 2002. С.150-185.

6. Информационные системы в науке 95. /Под ред. Ю.И.Журавлева, Л.А.Калиниченко, Ю.Е.Хохлова. - Фазис, 1995, 121 с.

7. Вербовецкий А.А. Основы проектирования баз данных. //М.: Радио и связь, 2000, 86 с.

8. Хансен Г., Хансен Д. Базы данных: разработка и управление. Пер. с англ. //М.: БИНОМ, 2000, 699 с.

9. Шумаков П.В. Delphi 3 и создание приложений баз данных. //М.: Нолидж, 1999, 704 с.

10. Филиппов В.И. Обобщенная модель данных и ее реализация. Программное обеспечение информационных систем. //М.: Наука, 1989.-103 с.

11. Марков А.С., Лисовский К.Ю. Базы данных: Введение в теорию и методологию. М.: Финансы и статистика, 2004, 511 с.

12. Голицына О.Л., Максимов Н.В., Попов И.И. Базы данных. //М.: Форум, 2004, 351 с.

13. Малыхина М.П. Базы данных: основы, проектирование, использование. //СПб.: БХВ-Петербург, 2004, 499 с.

14. Хансен Г., Хансен Дж. Базы данных. Разработка и управление. М.: Бином, 2000, 704 с.

15. Хомоненко А.Д. и др. Базы данных.- 2-е издание. М.: Корона Принт, 2002, 672 с.

16. Paredaens J., Kuijpers В. Модели данных и языки запросов в базах пространственных данных / Data models and query languages for spatial databases. //Data and Kkowledge Engineering, № 1-2, 1998, p. 29-53.

17. Корнеев B.B., Гарев А.Ф., Васютин C.B., Райх В.В. Базы данных. Интеллектуальная обработка информации. //М.: Нолидж, 2000, 351 стр.

18. Кириллов В.В. Основы проектирования реляционных баз; данных /СПб. Государственный институт точной механики и оптики (технический университет). 2002. С. 15-25.

19. Саймон А. Стратегические технологии баз данных. //М.: Финансы и статистика, 1999, 478 с.

20. Цаленко М.Ш. Моделирование семантики в базах данных. //М.: Наука. Гл. ред. физ-мат. лит., 1989, 288 с.

21. Кузнецов С.Д. Объектно-ориентированные базы данных: основные концепции, организация и управление. //Львов, 23-27 сентября 1991.

22. Андреев A.M., Березкин Д.В., Кантонистов Ю.А. Среда и хранилище: ООБД. Обзор по объектно-ориентированным базам данных, включающим средства разработки. //Мир ПК В мире персональных компьютеров. №4, 1998, с. 74-81.

23. Бойко В.В., Савинков В.М. Проектирование баз данных информационных систем. М.: Финансы и статистика. 1989. С. 351.

24. Конноли Т., Бегг К. Базы данных. Проектирование, реализация и120сопровождение. Теория и практика. 2е изд., Вильяме. 2000. С. 300350.

25. Моррис С. Объектно-ориентированное программирование. М.: Enter Феникс. 1997. С. 10-23.

26. Мейн Майкл, Савитч Уолтер. Структуры данных и др. объекты С++. 2-е изд.: Пер. с англ. М.: издательский дом «Вильяме». 2002. С. 631670.

27. Шамис В.А. Техника визуального программирования Borland С++ Builder 3. М.: Нолидж, 1998. С. 132-140.

28. Шумаков П.В. Delphi 3 и создание приложений баз данных. М.: Нолидж. 1999. С. 92-684.

29. Гофман В., Хомоненко А. Работа с базами данных в Delphi. СПб.: БХВ-Санкт-Петербург. 2000. С. 313-472.

30. Фридман A.JI. Основы объектно-ориентированного программирования на языке Си ++. М.: Радио и связь. 1999. С. 15.

31. Холингворт Джаррод, Сворт Боб. Borland С++ Builder 6. Руководство разработчика.: Пер. с англ. М.: издательский дом «Вильяме». 2003. С. 350-450.

32. Перов А., Новые технологии управления полнотекстовыми базами данных. //READ.ME, № 3, 1998, с. 46-48.

33. Мутушев Д.М. Методы обеспечения доступа к объектно-ориентированным базам данных на основе стандартов реляционных систем. //Диссертация на соискание уч. ст. канд. техн. наук. Москва, 1998, 85 с.

34. Кодд Э.Ф. Реляционная модель данных для больших совместно используемых банков данных.//СУБД, № 1, 1995.

35. Грабер М. Введение в SQL. //М.: Лори, 2000, 375 с.

36. Сичкаренко В.А. SQL-99. Руководство разработчика баз данных. ДиаСофтЮп. 2002.С. 800 816.

37. Боуман Джудит С., Эмерсон Сандра Л., Дарновски Марси. Практическое руководство SQL. Использование языка121структурированных запросов. Вильяме. 2001. С. 302 336.

38. Власов А.И., Лыткин C.JL, Яковлев В.Л. Краткое практическое руководство разработчика информационных систем на базе СУБД Oracle. М.: 2000. С. 20-50.

39. Хернандес Майкл Дж., Вьескас Джон Л. SQL-запросы для простых смертных. Практическое руководство по манипулированию данными в SQL. Лори. 2003. С. 462 480.

40. Кауфман Джон, Матсик Брайан, Спенсер Кевин. SQL. Программирование. Бином. Лаборатория знаний. 2002. С. 739 746.

41. Анзер Г. Oracle Power Objects. Визуальное проектирование приложений клиент/сервер для реляционных баз данных. М.: Фонд актуальной биологии. 1997. С. 323-414.

42. Спирли Эрик. Корпоративные хранилища данных. Планирование, разработка, реализация. Том 1.: Пер. с англ. М.: Издательский Дом «Вильяме». 2001. С. 320-380.

43. Архиденсов С.А., Голубев Д.В., Максименко О.М. Хранилища данных. От концепции до внедрения. М.: Диалог-МИФИ. 2002. С. 350 528.

44. Саймон А.Р. Стратегические технологии баз данных: менеджмент на 2000 год: Пер. с англ. / Под ред. и с предисл. М.Р. Когаловского. М.: Финансы и статистика. 1999. С. 331 339.

45. Когаловский М.Р. Энциклопедия технологий баз данных. М.: Финансы и статистика. 2002. С. 780 800.

46. Дейт К.Дж. Введение в системы баз данных. 7-е изд., Вильяме, 2001. С. 220-300.

47. Соломатин Н.М. Информационно-семантические системы. — М., Высшая шк., 1989 127 с.

48. Когаловский М.Р. Абстракции и модели в системах баз данных СУБД. // СУБД №4. 1998. С. 12-23.

49. Когаловский М.Р. Абстракции и модели в системах баз данных СУБД.//СУБД №5. 1998. С. 10-21.122

50. Коллинз Уильян Дж. Структуры данных и стандартная библиотека шаблонов. М.: ООО «Бином-Пресс». 2004. С. 600 624.

51. Цуканов В.А. Разработка системы информационных баз данных в области сушки на основе реляционной модели и объектно-ориентированного программирования: Дис. канд. технич. наук. / Рос. хим.-технол. ун-т им. Д.И. Менделеева. М. 2000. С. 29.

52. Пржиялковский В.В. Абстракции в проектировании БД. // СУБД №1. 1998. С. 10-20.

53. Пржиялковский В.В. Абстракции в проектировании БД. // СУБД№2. 1998. С. 11-18.

54. Дунаев С. Доступ к базам данных и техника работы в сети. //М.: Диалог-МИФИ, 2000, 316 стр.

55. Гайдамакин Н.А. Автоматизированные информационные системы, базы и банки данных. Вводный курс: Учеб. пособие. М.: Гелиос АРВ. 2002. С. 198 -368.

56. Дейт К. Дж., Дарвен Хью. Основы будущих систем баз данных. Третий манифест. Изд-во 2-е / Пер. с англ. Под ред. Кузнецова С.Д. М.: Янус-К. 2004. С. 58 656.

57. Архангельский А .Я. Разработка прикладных программ для Windows в Delphi 5. М.: Бином. 1999. С. 97-115.

58. Архангельский А.Я. Программирование в С++ Builder 6. М.: изд-во «БИНОМ». 2004. С. 980-1152.

59. Ветров А.В., Меныпутина Н.В. СУБД как средство автоматизации учета научных исследований // Международ, конф. молодых ученых по химии и хим. технологии «МКХТ-2002». М., 2002. С. 53-56.

60. Дроган С.В., Копанев А.А., Францев Р.Э. Основы информационных систем. //СПб.: СПГУВК, 1998, 88 стр.

61. Raghavan V.V., Deogun J.S., Sever Н. Специальный тематический выпуск: выявление знаний и разработка информации / Special topic issue: Knowledge discovery and data mining. //J. American Society of Information Science, № 5, 1998, стр. 395-402.123

62. Гаврилова Т.А., Хорошевский В.Ф. Базы знаний интеллектуальных систем. — СПб.: Питер, 2000. — 384 с.

63. Попов Э.В. и др. Статические и динамические экспертные системы. — М.: Финансы и статистика, 1996. — 320 с.

64. Джексон П. Введение в экспертные системы.— М.:Вильямс, 2001.— 624 с.

65. Змитрович А.И. Интеллектуальные информационные системы. -Минск, Тетрасистемс, 1997. 367 с.

66. Любарский Ю.Д. Интеллектуальные информационные системы. М.: Наука, 1990. —350 с.

67. Тугенгольд А.К., Рубанчик В.Б. Искусственный интеллект в машиностроительных технологических системах: Учеб. пособие /ДГТУ , 1996. —140 с.

68. Шафрин Ю. Информационные технологии. В 2-х частях. //М.: Лаборатория базовых знаний, 2000, 315 с.

69. Могилев А.В., Пак Н.И., Хеннер Е.К. Информатика. //М.: Академия, 1999, 811 с.

70. Рубанчик В.Б. Введение в логическое программирование и программирование на Прологе: Учеб. пособие /ДГТУ , 1996. — 140 с.

71. Рубанчик В.Б. Методические указания к лабораторным работам по курсу "Логическое программирование". Применение системных предикатов /ДГТУ, 1995. — 26 с.

72. Рубанчик В.Б. Методические указания к лабораторным работам по курсу "Логическое программирование". Среда разработки программ /ДГТУ, 1995. — 30 с. Галатенко В., Гвоздев А. Типы и структуры данных в INFORMIX-Universal Server. //СУБД, №3, 1997.

73. Галатенко В., Гвоздев А. Типы и структуры данных в INFORMIX-Universal Server. //СУБД, №3, 1997.

74. Филиппов В.И., Пржиялковский В.В., Шкотин А.В. Инструментальные средства информационного моделирования. //Управляющие системы и машины, №7, 1991.

75. Доу К. Руководство Informix-OnLine Dynamic Server. М.: Лори. 1997. С. 129-301.к

76. Jajodia S., Kerschberg L. Advanced Transaction Models and Architectures. //George Mason University, 1997, USA, 400 pp.

77. Крисевич B.C., Кузьмич Л.А., Шиф A.M. Экспертные системы для персональных компьютеров: методы, средства, реализации. //Справ, пособие. М.: Высшая школа, 1990, 197 с.

78. Поспелов Г.С. Искусственный интеллект основа новой информационной технологии. //Серия Академические чтения. М.: Наука, 1988, 200 стр.

79. Eom S.B. Decision support systems research: reference disciplines and a cumulative tradition. The International Journal of Management Science, 23, 5, October 1995, p. 511-523.

80. Ginzberg M.J., Stohr E. A. A decision support: Issues and Perspectives. -Processes and Tools for Decision Support. Amsterdam: North-hollandi Publ.Co, 1983.

81. Берштейн Л.С., Карелин В.П., Целых A.H. Модели и методы принятия решений в интегрированных интеллектуальных системах. Монография. -Ростов-на-Дону: Издательство Ростовского университета, 1999.

82. Трахтенгерц Э.А. Компьютерный анализ в динамике принятия решений. Приборы и системы управления. №1, 1997, с. 49-56.

83. Трахтенгерц Э.А. Построение распределенных систем группового проектирования. АиТ, №9, 1993, с. 154-174.

84. Берштейн Л.С., Боженюк А.В. Нечеткие модели принятия решений: дедукция, индукция, аналогия. Монография. Таганрог: Изд-во ТРТУ, 2001.

85. Ульянов С.В. Нечеткие модели интеллектуальных систем управления: технические и прикладные аспекты (обзор) // Известия Академии наук.щ) Техническая кибернетика. 1991. №3. С.3-28.

86. Искуственный интеллект: применение в химии: Пер. с англ./Д. Смит, Ч. Риз, Дж. Стюарт и др. Под ред. Т. Пирса, Б. Хони.-М.: Мир, 1988. -430 с.

87. В. Львов, Создание систем поддержки принятия решений на основе хранилищ данных. / СУБД, №3. 1997. С.30-40.

88. Kumar V., Son S. Н. Database recovery. //The Kluwer international series on advances in database systems 12. 1998, USA, 112 pp.

89. Subrahmanian V.S., Tripathi S.K. Multimedia Information Retrieval. //Multimedia tools and applications, 7:1-2, 1998, USA, 152 pp.

90. Shishulin D.V., Avramenko G.V., Leuenberger H., Gordeev L.S. Creation of multimedia education courses in pharmaceutics area / 15th International. Congress of Chemical and Process Engineering CHISA-2002, Prague, Czech Republic, Summaries 5, 2002.- P .9.

91. Шишулин Д.В., Мишина Ю.В., Менынутина H.B. Мультимедийные курсы обучения в области химической технологии и фармацевтики Учеб. пособие.-М.: Рос. хим.-технол. ун-т им. Д.И. Менделеева, 2004.- 213 с.

92. Фролов А., Фролов Г. Базы данных в Интернете. //М.: Русская редакция, 2000, 413 стр.

93. Кузнецов С.Д. Доступ к базам данных с использованием технологии WWW. //СУБД, №5-6, 1996.

94. Елепов Б.П. Живая душа науки. Информационно-библиотечная система Российской академии наук. (http://www.sbras.ru/HBC/2000/n20-21/fl0.htmn.

95. Fogelzang А.Е., Serushkin V.V., Sinditskii V.P., Egorshev V.Y., Combustion of Explosives Database. Powerful Analytical Tool: Proc. // 24 Inter. Annual Conference of ICT. June 29-July 2, 1993, Karlsruhe, P 591 598.

96. Жуков Д.Ю., Гончарова C.B., Меныпутина H.B. Корпоративная база * данных для работников химической промышленности // Химическаяпромышленность сегодня. 2004. - № 11. - С. 52-54.

97. Жуков Д.Ю., Гончарова С.В., Меныпутина Н.В. Разработка корпоративной базы данных в области химии и химической технологии // Программные продукты и системы. 2004. - № 4. - С. 45-47.