автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Разработка и построение распределенной информационно-библиотечной системы на основе СУБД CDS/ISIS

кандидата технических наук
Мазов, Николай Алексеевич
город
Новосибирск
год
2000
специальность ВАК РФ
05.25.05
цена
450 рублей
Диссертация по документальной информации на тему «Разработка и построение распределенной информационно-библиотечной системы на основе СУБД CDS/ISIS»

Автореферат диссертации по теме "Разработка и построение распределенной информационно-библиотечной системы на основе СУБД CDS/ISIS"

На правах рукописи

а 2 & ми

Мазов Николай Алексеевич

РАЗРАБОТКА И ПОСТРОЕНИЕ РАСПРЕДЕЛЕННОЙ ИНФОРМАЦИОННО-БИБЛИОТЕЧНОЙ СИСТЕМЫ НА ОСНОВЕ СУБД CDS/ISIS

Специальность 05.25.05 Информационные системы и процессы

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

Новосибирск - 2000

Диссертация выполнена в Объединенном институте геологии, геофизики и минералогии им. акад. A.A. Трофимука Сибирского отделения Российской академии наук.

Научные руководители

доктор технических наук, профессор Елепов Б.С.

кандидат физ.-мат. наук Жижимов O.JI.

Официальные оппоненты

доктор физ.-мат. наук, профессор Федотов A.M.

кандидат технических наук Карпачев Г.И.

Ведущая организация Институт научной информации

по общественным наукам Российской академии наук

Защита состоится 21 декабря 2000 г. в 10 часов на заседании диссертационного совета К 200.51.01 по присуждению ученой степени кандидата наук в Государственной публичной научно-технической библиотеке Сибирского отделения Российской академии наук по адресу: 630200, г. Новосибирск-200, ул. Восход, 15.

С диссертацией можно ознакомиться в ГПНТБ СО РАН. Автореферат разослан^- / ноября 2000 г.

Ученый секретарь диссертационного совета

кандидат педагогических наук ¡^{¿-^¿Д^- Артемьева Е.Б.

£ MS. & о

Актуальности темы Лавинообразное увеличение количества и повышение качества компьютерного оборудования, применяемого в информационно-библиотечных учреждениях России, использование локальных и глобальных вычислительных сетей в их деятельности, раз витие специального и польз овательского програм м ного обеспечения неизбежно ставят эти организации перед решением проблемы расширения доступа к своим информационным ресурсам.

Наряду с этим, в информационном сообществе России наблюдается тенденция к интеграции компьютерных парков и информационных ресурсов различных учреждений в единое инф ормационноб пространство, что предполагает решение задачи унифицированного доступа к информационно-библиотечным базам данных, используя возможности сети Интернет и открытых международных стандартов. Об этом свидетельствуют различные проекты, поддерживаемые Российским фондом фундаментальных исследований(РФФИХ Институтом «Открытое общество» и др., направленные на решение этих задач. Такие работы ведутся на базе различного им портного оборудования, операционных сред и программного обеспечения, что затрудняет процесс построения распределенных информационных систем с целью интеграции информационных ресурсов. Несмотря на то, что в отечественной и зарубежной научной литературе вопрос построения распределенных инф орм ационных систем достаточно изучен, реальный опыт раз работки и построения таких систем в России крайне недостаточен.

В начале 90-х годов в связи с переходом от машин серии ЕС на персональные компьютеры, перед различными информационно-библиотечным и учреждениям и встала задача переноса накопленной ранее машиночитаемой информации на ПЭВМ и выбора програм м ных средств для ее обработки. В качестве системы управления базам и данных (С У БД) для обработки информационно-библиотечных массивов многие организации воспользовались некоммерческой системой CDS/IS1S. На основе этой СУБД были разработаны различные автоматизированные информационные ибиблиотечные системы. Для многих организаций эта система стала основным программным средством ведения баз данных научно-технической инф ормации, электронных каталогов их библиотек, а также для решения других технологических задач. В связи с этим возникает практическая потребность на примере реально функционирующейинформационнойсистемы, базирующейся на основе СУБД CDS/ISIS, изучить возможность построения и создания распределенной информационной системы, что является актуальной

научной и технической задачей.

Целью настоящей работы является разработка и построение распределенной информационно-библиотечной системы на основе СУБД CDS/1SIS.

Реализация данной цели предполагает последовательное решение следующих задач-

• исследование современныхинформационно-библиотечныхсистем для хранения и обработки больших информационных массивов на основе СУБД CDS/ISIS и определение требований, предъявляемых к информационно-поисковым системам для построения распределенных инф орм ационно-библиотечных систем;

• анализ существующих решений в информационно-библиотечных системах на основе СУБД С DS/1SIS: локального и сетевого-в режиме «файл-сервер», решения с использованием Web-cepeepa совместное CGI-приложением (Common Gateway Interlace)и возможности решения «клиент-сервер» на основе использования протокола Z39.50 (ISO-23950);

• разработка программных средств для обеспечения вышеперечисленных режимов при построении распределенной системы на основе СУБД CDS/ISIS;

• внедрение в информационно-библиотечную практику результатов, полученных в ходе диссертационного исследования.

Базой исследований являлись информационные ресурсы Сибирского отделения РАН (СО РАН): Государственной публичной научно-технической библиотеки (ГПНТБ), Объединенного института геологии, геофизики и м инералогии(ОИГТМ), Института катализа (ИК), Института вычислительных технологий (ИВТ), Института цитологии и генетики (ИЦГ), Института органической химии (ИОХ).

В качестве базовой интегрированной информационно-поисковой системы для создания и использования информационно-библиотечных ресурсов СО РАН была выбрана СУБД CDS/ISIS. Поэтому основные информационно-библиотечные ресурсы СО РАН накоплены и эксплуатируются именновсредеэтойСУБД.В настоящее время репертуар основных внешних отечественных и зарубежных баз данных, эксплуатируемых в СО РАН под управлением CDS/ISIS выглядит следующим образом:

• РЖ ВИНИТИ «Химия» 1987-2000 гг.;

• РЖ ВИНИТИ «Физика» 1995 -2000 гг.;

• РЖ ВИНИТИ «Механика» 1987-2000 гг.;

• РЖ ВИНИТИ «Геология» 1987-2000 гг.;

• РЖ ВИНИТИ «Геофизика» 1987-2000 гг.;

• различные зарубежные базы данных;

• региональные библиографические базы данных, электронные каталоги ГПНТБ СО РАН и других организаций СО РАН.

Общий объем указанных информационных ресурсов составляет около 15 млн записей, что занимает достаточно большой объем дискового пространства - свыше 20 Гб на различных информационных серверах вышеперечисленных организаций, с которых обеспечивается доступ в промышленном режиме кбазам данныхСУБД CDS/ISIS как в локальном, так и сетевом режимах.

Объектом исследования являются машиночитаемые информационные ресурсы научно-технической информации.

Предмет исследования - СУБД в распределенных информационно-библиотечных системах для хранения и использования больших массивов информации.

Изученность темы и методология исследования. В широком смысле тема построения распределенных информационныхсистем не теряет своей актуальности на протяжении последних десятилетий, о чем свидетельствует ее постоянное обсуждение в специальной литературе и на различных всероссийских и международных конференциях. Однако, основной акцент при этом переносится на использование дорогостоящих реляционных СУБД (Oracle, Informix, IBM DB2 и др.) и различных развивающихся технологий (CORBA, Java, XML и др.), в том числе л корпоративных (OLE DB, DC ОМ и др.). При этом для информационных систем на основе СУБД CDS/ISIS практически отсутствуют работы по анализу возможности ее применения в больших сетевых распределенных информационных системах и технологий, реализующих эту возможность.

Методологической основой исследования явились положения, изложенные в трудах в области проектирования и эксплуатации региональных информационных систем, использования информационных ресурсов: Епепова Б.С., Боброва Л.К., Каленова Н.Е, Баженова С.Р.; в области построения и эксплуатации автоматизированных библиотечных систем - Шрайберга Я.Л., Воройского Ф.С., Маршака Б.И., Бродовского А.И. Существенной методологической опорой при проведении исследований в области проектирования и создания распределенных информационныхсистем стали положения, изложенные в работах Калиниченко JI.A., Шокина Ю.И., Федотова A.M., Жижимова О.Л., Племнека А.И.

Методы исследования. Основным методом исследования являлся анализ опытной и промышленной эксплуатации нескольких версий раз рабаты ваем ой распределенной информ ационной систем ы в различной конфигурации и архитектуре, с произвольным количеством пользователей. При построении системы применялся метод сравнительного анализа характеристик и возможностей используем ых в информационной практике различных информационно-поисковых систем. При этом активно использовались разработки, в том числе оригинальные, направленные на повышение эффективности используем ого программного обеспечения, его устойчивости по отношению к нештатным ситуациям, а также на оптимизацию организации и представления данных.

Научная новизна работы состоит в том, что впервые распределенная информационно-библиотечная система, основанная на СУБД CDS/ISIS, рассмотрена как самостоятельный предмет исследования. На основе обобщения существующего опыта эксплуатации библиографических баз данных научно-технической информации больших объемов выявлены факторы, которые целесообразно учитывать при раз работке и построении распределенных информационно-библиотечных систем, и сформулированы требования, которым необходимо следовать при разработке систем подобного класса. Исходя из этого, впервые реализована полнофункциональная распределенная информационная система для баз данных CDS/ISIS.

В процессе выполнения работы также:

• предложен подход и решена задача по совместному использованию базы данных трудов сотрудников научного учреждения и баз данных Института научной информации США для определения индекса цитирования их научных работ;

• разработанаиреализовананнформационнаятехнологня для ведениябаз данных тезаурусов, рубрикаторов и различных классификаторов;

• модифицирован и реализован алгоритм CRC-кодирования с целью построения уникальных идентификационных ключей для различных текстовых полей баз данных.

Практическая значимость. Разработанная распределенная информ ационно-библиотечная система в настоящее врем я функционирует в научно-исследовательских учреждениях СО РАН: в ГПНТБ, в Информационно-библиотечном Центре ОИГТМ, в Информационном центре ИК,в Институте вычислительного моделирования Красноярского научного центра и активно внедряется в другие библиотеки и информационные органы, использующие в своейработе СУБД CDS/ISIS.

Отдельные технологические элементы разработанной системы внедрены в ГПНТБ России, Центральной научной сельскохозяйственной библиотеке (ЦНСХБ)Россельхозакадемии, Российской государственной библиотеке.

Апробация результатов Основные положения диссертации обсуждались на I - VII международных конференциях «Крым» -«Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества» (Евпатория, 1994 - 1995, Форос, 1996, Судак, 1997 -2000); на I, П, IV, V международных рабочих совещаниях по электронным публикациям (ЕЫ>иВ)(Новосибирск, 1996-2000); на И-Г^/ Всероссийских конференциях«ЫВСОМ» (Москва, 1997-1999);на Пи VII м еждународных научно-практических конференциях - «Инф орм ационные системы и технологии» (Владивосток, 1995, 2000); на I международной конференции «Библиотечно-информ ационные ресурсы в науке, образовании, культуре и бизнесе» (Узбекистан, Самарканд, 1999); на 11 международной конференции «Интернет - Общество - Личность -2000 "ИОЛ-2000": Новые информационно-педагогические технологии» (Санкт-Петербург, 2000); на П всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (Протвино, 2000), а также на ряде других конф е ре нций исеминаров,орг аниз ов анны х РФФИ, ВИНИТИ,ГПНТБСО РАН, Библиотекой по естественным наукам РАН.

Разработанная система неоднократно демонстрировалась на указанных форумах. В рекомендациях программы 1Л\УеЬ, поддерживаем ой РФФИ, основные положения системы приняты в качестве типовых для решений подобного класса. Разрабатываемая система в рамках исследований получала поддержку РФФИ в 1994 - 2000 гг., Министерства промышленности, науки и технологии РФ в 1996-2000 гг., Института «Открытое общество» в 1997 -1998 гг., 2000 г.

Внедрение данной системы позволило организовать оперативный удаленный доступ к информационным ресурсам научно-технической информации СО РАН на основе открытых м еждународных стандартов. Результаты исследования могут быть использованы приразработке систем подобного класса, использующие в качестве основы СУБД СОБЛБ^. Система внедрена ГПНТБ СО РАН, ОИГТМ СО РАН, ИК СО РАН, что подтверждается актами внедрения.

Разработанная система доступна на информационном сервере ОИГТМ СО РАН ЬКр7/ЕеоИЬг.шЕЕт.п<;с.П1, сервере ГПНТБ СО РАН Нпр://\у\у\у spsl.nsc.ni, информационном сервере ИК СО РАН http•//яltяiг(^:яtяlys is ^к и/.

По теме диссертации опубликовано 28 работ.

На защиту выкосятся г пр пушите положения:

• СУБД CDS/ISIS может быть эффективно использована в современных информационно-библиотечных системах.

• Функциональные возможности СУБД CDS/ISIS могут быть существенно расширены за счет использования дополнительного программного обеспечения, реализующего архитектуру м ногоуровневого сетевого приложения.

• Наиболее эффективный способ организации распределенной информационной системы на основе СУБД CDS/ISIS- соответствие ее модели «клиент-сервер».

• Применение технологийZ39.50 позволяет построить распределенную информационную систему в архитектуре «клиент-сервер» на основе СУБД CDS/ISIS.

• Распределенная информационно-библиотечная система на основе СУБД CDS/ISIS обеспечивает оперативный доступ пользователей к массивам научно-технической библиографической информации, основанный на работе по стандартным протоколам.

Цель и задачи исследования определили логику изложения материала и структуру ппптрпсния диссертации. Диссертация состоит из введения, трех глав, заключения, списка литературы,содержащего 118 источников, и 4 приложений. Работа проиллюстрирована рисунками.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновывается актуальность темы диссертационной работы, формулируется цель и определяются задачи исследования. Рассматриваются особенности объекта и предмета исследования. Анализируются предпосылки создания распределенной информационно-библиотечной системы, ориентированной на использование библиографических баз данных, эксплуатируемых под управлением СУБД CDS/ISIS. Определяется научная новизна, практическая значимость, приводятся основные результаты работы.

В первой главе дана общая характеристика СУБД CDS/ISIS, ее основное назначение и распространение в России и за рубежом. Рассматриваются информационные и библиотечные системы, основанные на использовании базовой версии СУБД CDS/ISIS для локального использования и в сетевом режиме в архитектуре «файл-сервер». Формулируются основные требования, предъявляемые к информационно-библиографическим системам. На примере доступа к отечественным и зарубежным библиографическим базам данных рассмотрено решение в

архитектуре «файл-сервер», реализованное в ходе исследований в СО РАН. Рассматриваются недостатки такого решения, показывается необходимость построения У/еЬ-ориентированной полнофункциональной инф орм ационной систем ы.

Функции, выполняем ые инф орм ационно-библиотечным и систем ам и, входящими в состав крупных информационных центров и библиотек, становятся значительно сложнее, и затраты на их реализацию возрастают. Приэтом в информационно-библиотечном сообществе России отмечается тенденция использования в качестве базового программного обеспечения для построения информационных систем сравнительно дешевых или свободно распространяем ыхСУБД целевого назначения. Такое положение дел обуславливается еще и тем, что при внедрении больших СУ БД с целью создания информационно-библиотечныхсистем возникает ряд трудностей, которые могут быть сведены к следующим проблемам:

• имеющиеся в распоряженииу пользователейСУБД представляют собой достаточно сложные программные комплексы, для эксплуатации которых требуется наличие высококвалифицированных специалистов и значительных машинных ресурсов;

• пользователи, им еющие опыт создания и эксплуатации систем, разработанных в соответствии с принципами «табличной» организации данных, часто бывают морально не подготовлены к восприятию идей и методов, связанных с организацией и ведением библиографических баз данных.

Разработанные в России и за рубежом СУБД для построения информационно-библиотечны-х систем отличаются как структурами хранимых данных, так и прямым назначением.

Как показывает практика, наиболее успешно внедряются СУБД, не предъявляющие жестких требований к уровню квалификации пользователя, доступные по цене и в тоже время пригодные для решения практических задач обработки данных в информационно-библиотечных системах.

При этом должно соблюдаться соответствие уровня сложности решаемых задач требованиям к обработке данных, предъявляемым в соответствующих библиотеках и инф орм ационно-библиотечных центрах. Установившиеся методы обработки информации, а также общий уровень внедрения автоматизации информационно-библиотечных процессов в организациях объективно определяют эти требования. Таким образом, хорошо применяются системы:

• не отличающиеся особой сложностью;

• характеризующиеся ориентацией на массовое применение в библиотеках и информационных центрах;

• доступные по цене или свободно распространяемые.

Очевидно, что при применении той или иной СУБД должно четко

соблюдаться соответствие между набором средств используем ой системы и с пециф икой решаем ых задач. Уровень сложности прим еняем ой систем ы должен соответствовать уровню сложности конкретного применения. Поэтому в инф ормационно-библиотечной практике не получают широкого прим енения системы,обладающие широким диапазоном предоставляемых средств, но сложные в освоении к эксплуатации, например Oracle, Informix, MS SQLServer, IBM DB2 и ряд других, поскольку пользователи могут пойтина ограничение средств,предоставляемыхемусистемой,с целью получения практических результатов в более короткие сроки. Кроме этого, сложность существующих коммерческих СУБД, с одной стороны, предполагает наличие достаточно мощного машинного парка, а с другой стороны, требует значительных усилий на их освоение и предъявляет повышенные требования к квалификации пользователей.

С этой точки з рения целесообраз но прим енение такой С У БД, которая была бы ориентирована на массовое применение в информационно-библиотечной практике и сводила к минимуму различные ограничения. Прим енение такой систем ы позволяет сократить затраты, связанные с переходом к широкому использованию библиографических баз данных и непосредственной реализацией информационно-библиотечных систем.

Результаты анализа действующих систем показали, что СУБД, ориентированная на массовое применение в информационно-библиотечной практике, должна обеспечивать следующее:

• возможность реализации большинства информационно-библиотечных задач в соответствии с потребностью соответствующих информационно-библиотечных учреждений;

• сочетание необходимого сервиса с простотой освоения и использования системы;

• сравнительно легкий переход от традиционного способа обработки информации к обработке с применением СУБД;

• дополнительные уровни сервиса за счет возможности введения в систему специальных программ и программных комплексов.

Во второй главе рассматриваются основные требования для построения Web-ориентированной распределенной инф ормационно-библиотечной системы. Подробно рассмотрен способ организации доступа

к базам данных СDS/ISIS из Web. Определены достоинства и недостатки описанного решения. Показывается необходимость построения собственного провайдера данных CDS/ISIS для построения распределенной полнофункциональной информационной системы.

В настоящее время применение сервисных возможностей, предоставляемых сетью Интернет, все глубже проникает в повседневную деятельность человека. Прежде всего, это связано с ее открытостью и простотой. Пользователь быстро овладевает и привыкает к работе с унифицированными интерфейсами, построенными на механизме гипертекстовых ссылок и поисковых форм. Приэтом используются все преимущества технологии «клиент-сервер», что снижает требования к программному обеспечению пользователя (клиента). Для работы требуется, чтобы компьютер пользователя был подключен к сети Интернет и на нем был установлен один из стандартных Web-браузеров для просмотра информации.

Наиболее известными Web-браузерами в настоящее время являются «Microsoft Internet Explorer» и «Netscape Navigator», без которых сегодня уже трудно представить компьютер, подключенный к сети Интернет. Поэтом у целесообраз но было бы предоставить польз ователям воз м ожность работы с информационными ресурсами в сети Интернет. Идеальным решением в данной ситуации является применение Интернет-технологии на основе протокола HTTP (HyperText Transfer Protocol). При ее использовании обеспечивается снижение сетевоготрафика,требований к вычислительным ресурсам рабочей станции пользователя и не происходит дублирования ресурсов (формально они могут быть расположены в одном месте).

Архитектура «клиент-сервер» предполагает, что хранение данных и их обработка производится на сервере, визуализация результатов обработки производится на ком пьютере клиента. Клиент в данном случае -это рабочая станция, с установленным Web-браузером, а сервер-станция со значительными вычислительными и дисковыми ресурсами (для хранения баз данных) с установленным Web-сервером (для взаимодействия с.Web-браузером клиента). Притаком подходе отпадает необходимость держать на ком пьютере клиента программное обеспечение СУБД, оно исполняется на сервере. На компьютере клиента остается только клиентское программное обеспечение, предназначенное для организации связи с сервером баз данных, формирования запросов и визуализации.

Схема взаимодействия при этом выглядит следующим образом:

клиент (пользователь) посылает запрос V/еЬ-серверу; на запрос клиента Web-cepeep через CGI-приложение, реализующего функции СУБД, получает информацию из баз данных и отсылает их обратно клиенту.

В качестве сервера была выбрана комбинация из V/еЬ-сервера MSHS и CGI-приложения WWWISIS для доступа к базам данных CDS/ISIS, разработанного в ВIREME/PAHO/WHO (Бразилия). На данный момент BIREME/PAHO/WHO является одним из ведущих центров по разработке программного обеспечения для обработки баз данных под управлением CDS/ISIS. В настоящий момент существуют версии WWWISIS для наиболее распространенных аппаратных платформ. WWWISIS взаимодействует с Web-сервером через интерфейс CGI, который на сегодня поддерживается всеми существующими Web-серверами. Использование Win32 API в версии WWWISIS для MS Windows NT, позволяет существенно повысить быстродействие одновременной (м ногопользовательской) обработки запросов к базам данных CDS/ISIS (м ногопоточность при выполнении запроса) по сравнению с быстродействием традиционной СУБД CDS/ISIS.

На основе анализа действующих систем, как отечественных, так и зарубежных, были определены требования к интерфейсу пользователя создаваемой системы и разработана Web-ориентированная информационно-поисковая система, которая сегодня успешно функционирует в трех организациях СО РАН.

Третья глава посвящена вопросам построения распределенной информационно-библиотечной системы для баз данных CDS/ISIS на основе использования протокола сетевого обмена Z39.50 (ISO 23950). Описаны основные требования к провайдеру данных CDS/ISIS для возможности работы по протоколу Z39.50. Подробно описывается реализация распределенной информационно-библиотечной системы СО РАН для библиографических баз данных, находящихся под управлением СУБД CDS/ISIS.

Ряд организаций, располагающих базами данных, работает в настоящее время над тем,чтобы обеспечить унифицированный сетевой доступ к имеющимся ресурсам по стандартным протоколам для более широкого обращения к ним ученых, исследователей или других пользователей. В гетерогенной информационной системе, где используются серверы различных производителей, плохо или абсолютно не взаимодействующих друг с другом, возникают проблем ы построения единого информационного пространства. Все перечисленные серверы работают на ф ирм енных протоколах обм ена данным и. Эти протоколы, как

правило, между собой несовм естим ы. Поэтому на клиентском ком пьютере нужно держать клиентское програм м ное обеспечение для каждого из этих серверов.

Проблем ы несовм естим ости протоколов обм ена данным и становятся неразрешим ым и, когда в качестве единого информационного пространства рассматривается вся сеть Интернет или ее большая часть. Заранее неизвестно, какие серверы могут предоставить нам данные и какое клиентское программное обеспечение потребуется для доступа к ним.

Решение проблем ы воз м ожно при униф икации доступа к серверам любых производителей и базам данных. Именно для этой целив мировом сообществе принят набор правил под общим названием -протокол Z39.50.

Протокол Z39.50 - это правила обмена информацией между ком пьютерам и, непосредственно не касающиеся конечного пользователя, но обеспечивающие его каким -либо сервисом. Этот протокол определяет такие правила взаимодействия компьютеров, которые позволяют пользователю при помощи специальной програм м ы, выполняющейся на компьютере-клиенте, производить поиск информации в базах данных, поддерживаемых компьютерами-серверами. Для пользователя это означает, что он со своего рабочего м еста, оборудованного недорогим персональным компьютером, может производить поиск, получать и обрабатывать в электронном виде библиографическую информацию, хранящуюся в больших базах данных на мощных ЭВМ.

В отличие от других протоколов, обеспечивающих поиск и извлечение информациив глобальных информационных системах (HTTP, Gopher и др.Х Z39.50 отличается от них тем, что способы форм ирования поисковых запросов и форм а представления результатов поиска не зависят от источника информации. Протокол Z39.50 позволяет абстрагироваться от способа организации данных конкретной СУБД, сделать доступ к ее содержанию независимым от форм ы хранения ее данных. Использование протокола Z39.50 позволяет избавить пользователя от необходимости адаптации к различным источникам информации, что в свою очередь позволяет сократить непроизводительное время на обучение его работе с различными базам и данных. Это явилось предпосылкой для создания специализированного провайдера данных CDS/ISIS в рамках разрабатываемой в СО РАН распределенной информационной системы на основе протокола Z39.50. Настоящая разработка является уникальной и актуальной не только для организаций СО РАН, но и для других учреждений России, использующих в своей работе базы данных под управлением CDSVISIS.

Разработанный провайдер CDS/ISIS удовлетворяет следующим условиям:

• соответствие спецификациям программного интерфейса абстрактного провайдера данных сервера Z39.50;

• эффективные по времени и потребляем ым системным ресурсам способы обработки информации в многозадачном окружении;

• переносимость программного кода провайдера на различные аппаратные платформы в средах операционных систем Windows NT, UNIX;

• низкая себестоимость разработки.

Провайдер CDS/ISIS для сервера Z39.50 версии 1 реализован в виде набора функций, вызываем ых из динамически загружаем ой библиотеки (ОЩдля Windows NT. В качестве основного средства доступа к базам данных CDS/ISIS в версии 1 провайдера были использованы функции библиотеки WWWISIS.DLL(Бразилия, BIREME'PAHO/WHO, версии 3.0).

Провайдер CDS/ISIS для сервера Z39.50 версии 2 организован как встраиваемый модуль сервера Z39.50 и реализован как аппаратно-независим ый м одуль, что отличает его от версии 1. Этот м одуль является оригинальной разработкой автора.

Основной задачей функций этих провайдеров является отображение запросов на обработку данных для Z39.50 в логику запросов СУБД CDS/ISIS и отображение ответов из баз данных CDS/ISIS в логику ответов для Z39.50.

Адаптация конкретной базы данных CDS/ISIS для работы по протоколу Z39.50 с использованием описываемого провайдера заключается в корректном построении ряда служебных таблиц.

Описанные провайдеры CDS/ISIS прошли апробацию в составе серверов Z39.50, функционирующих в СО РАН (ОИГТМ, ГПНТБ, ИВТ), ГПНТБ России. Эксплуатация провайдеров CDS/ISIS показала высокую э ф ф е ктив ность при поис ке, из влече нии и предоста вле нии инф орм ации из баз данных CDS/ISIS, а также высокую степень надежности при нештатных ситуациях. Сервер Z39.50, в составе которого функционируют провайдеры CDS/ISIS, прошел успешное тестирование и сертификацию на соответствие стандарту Z39.50, проводимую KOMnaHHefilndexData, и был включен в список серверов Z39.50, доступных в м ире.

В приложениях припелены примеры интерфейсов пользователейдля информационной системы, функционирующей в локальном режиме, систем ы функционирующей в Web-окружении и распределенной систем ы, работающей по протоколу Z39.50. Приведены различные

конфигурационные файлы таблицы для работы с 6a3aMHflaHHbixCDS/ISIS по протоколу Z39.50.

В ходе исследования получены следующие результаты:

1. Исследованы современныеинформационно-библиотечныесистемы для хранения и обработки больших информационных массивов на основе СУБД CDS/ISIS и определены основные требования, предъявляем ые к информационно-поисковым системам для построения распределенных инф орм ационно-библиотечных систем.

2. На основании анализа существующих решений и м ноголетнего опыта эксплуатации информационно-библиотечных систем на основе СУБД CDS/ISIS разработана и реализована информационная технология для ведения и коллективного использования отечественных и зарубежных баз данных, находящихся под управлением CDS/ISIS:

• Разработано программ ное обеспечение, позволяющее организовать работу в локальном и в сетевом режиме «файл-сервер», расширяющее функциональные возможности базовой СУБД CDS/ISIS и набор интерфейсов пользователя. Это программное обеспечение успешно внедрено в промышленную эксплуатацию в следующих организациях: ГПНТБ СО РАН, ОИГТМ СО РАН, ИК СО РАН, ИЦГСО РАН.

• Создан ком плект програм м ного обеспечения и построена сетевая информационная система на основе Web-технологий и СУБД CDS/ISIS для обеспечения доступа к информационным ресурсам СО РАН. Система и ее отдельные ком поненты функционируют в ГПНТБ СО РАН, ОИГТМ СО РАН, ИК СО РАН.

• Разработано програм мное обеспечение для работы с базам и данных CDS/ISIS по протоколу Z39.50, независимое от базовой СУБД, вошедшее в комплект серверного программного обеспечения ZooPARK (сервер Z39.50, различные провайдеры данных и др.). Это программное обеспечение успешно функционирует в организациях, использующих в своей работе базы данных CDS/ISIS и ИРБИС: корпоративная библиотечная сеть г. Новосибирска (ГПНТБСО РАН, ОИГГМ СО РАН, Новосибирская областная специальная библиотека для незрячих и слабовидящих и др.), Московская корпоративная библиотечная сеть, ЦНСХБ Россельхозакадем ии.

3. Предложен подход и реализована информационная технология, позволяющая определять индекс цитирования работ научных сотрудников, используя совместно базы данныхтрудов сотрудников научного учреждения и Института научной информ ации США.

4. Разработано и реализовано программное обеспечение для ведения и использования баз данных тезаурусов, рубрикаторов и различных классификаторов.

По теме диссертаиии опубликованы следующие работы:

1. Опыт эксплуатации ППП CDS/ISIS/M: достоинства и недостатки системы // Автоматизированные библиотечно-информационные системы: IV науч. семинаре м еждунар. участием: Тез. докл. и сообщ. -Новосибирск, 1991. -С. 44-46. -(В соавт.).

2. Опыт обработки ПОБД на персональной ЭВМ в среде ППП CDS/ISIS/M // Эффективность использования интерактивных библиотечны х с истем: Сб. науч. тр. - Новосибирск, 1994. - С. 50 - 57. -(В соавт.).

3. Статистическая обработка ПОБД в среде ISIS/M на ПЭВМ II Эффективность использования интерактивных библиотечных систем: Сб. науч. тр. -Новосибирск, 1994. -С. 133 - 137. -(В соавт.).

4. Разработка программных средств «Интерфейс пользователя CDS/ISIS/MwZ/Материалы. 1 междунар. конф.«Крым 94».-М., 1994.-С. 176- 177.-(В соавт.).

5. Типовая документальная ИПС на базе ППП CDS/ISIS/M // Автоматизированные библиотечно-информационные системы: V Сиб. науч. семинаре междунар.участием:Тез. докл.-Новосибирск, 1994.-С. 30-32.-(В соавт.).

6. Современные технологии в библиотеке академического института // Материалы 2 междунар. конф. «Крым 95». - М., 1995.-Т. 1.-С.218-220.

7. Организация доступа к базам данных CDS/ISIS/M из INTERNET // Материалы 3 междунар. конф. «Крым 96». - М., 1996. - Т. 2. -С. 177- 179.-(В соавт.).

8. Организация и функционирование информационно-библиотечного центра по наукам о Земле // Автоматизированные библиотечно-информационные системы: VI Сиб. науч. семинар с междунар. участием: Тез. докл. и сообщ. - Новосибирск, 1996. - С. 115-117.-(В соавт.).

9. Доступ к базам данных ISIS из Internet и построение распределенной инф орм аиионной систем ы // В ычислительные технологии, 1997. - Т. 2. -№3.-С. 45 -50.-(В соавт.).

10. Комплексное использование информационных ресурсов в решении задач информационно-библиотечного центра //Материалы 4 междунар. конф. «Крым 97». - Симферополь, 1997. - Т. 2. - С. 399 - 401. -

(В соавт.).

11. Базы данных CDS/ISIS в среде Windows: проблемы и решения // Материалы 4 междунар.конф.«Крым 97».-Симферополь, 1997.-Т.2.-С. 481.

12. Создание системы открытого публичного доступа из Интернет к распределенным библиографическим базам данных CDS/ISIS // Материалы 4 между нар. конф.«Крым 97».-Симферополь, 1997.-Т. 2.-С. 482-483.-(В соавт.).

13. Новые формы информационного и библиотечного обслуживания в научно-исследовательском институте//Информационные ресурсы. Интеграция. Технологии: «НТИ-97»: Материалы конф. - М., 1997. -С. 103- 104.-(В соавт.).

14. Создание программного комплекса доступа из Интернет к базам данных на основе WWW-ISIS// Научные и технические библиотеки, 1999.- № 2. - С. 47 - 52. - (В соавт.).

15. Система обеспечения контроля и учета доступа из Интернет к распределенным библиографическим базам данных//Материалы 6 междунар. конф. «Крым 99». - Симферополь, 1999. - Т. 1. -С. 226-228.-(В соавт.).

16. CDS/ISIS: критический взгляд апологета (дискуссия)//Материалы 6 междунар. конф. «Крым 99».-Симферополь, 1999.-Т. 2. -С.251 -252.

17. Построение распределенной информационной системы на базе протокола Z39.50 (ISO 23950)//Новые информационные технологии в университетском образовании: Материалы междунар. науч.-метод. конф. -Новосибирск, НГУ, 1999. -С. 165 - 166. -(В соавт.).

18. Применение протокола Z39.50 в распределенной информационной системе Сибирского отделения РАН//Библиотечно-информационные ресурсы в науке, образовании, культуре и бизнесе: Материалы междунар. конф.-Самарканд, 1999.-С. 118- 125.-(В соавт.).

19. Корпоративная библиотечно-информационная система Сибирского региона: проблем ы и решения // «Интернет - Общество - Личность -2000 "ИОЛ-2000": Новые информационно-педагогические технологии»: 2 междунар. конф. - СПб., 2000. - С. 354. - (В соавт.).

20. Принципы корпоративной распределенной библиотечной системы Сибирского региона//Материалы 7 междунар. конф. «Крым 2000».-Симферополь, 2000. - Т. 2. - С. 72 - 74. - (В соавт.).

21. Современные информационные технологии в крупной библиотеке // Материалы 7 междунар. конф. «Крым 2000».-Симферополь, 2000. -Т. 1.-С. 171 - 173.-(В соавт.).

22. Web-ориентированная система ведения библиографических баз данных CDS/ISIS // Материалы 7 междунар. конф. «Крым 2000». -Симферополь, 2000. -Т. 2. -С. 381 -383. -(В соавт.).

23. Программ ный ком плекс доступа к базам данных ГПНТБ С О РАН из Интернет // Оптимизация информационно-библиографического обслуживания ученых и специалистов: Сб. науч. тр. - Новосибирск, 2000. - С. 45 - 51. - (В соавт.).

24. Пример распределенной информационной системы на основе м етаданных и м еждународных стандартов //Электронные библиотеки: перспективные методы и технологии, электронные коллекции: 2 всерос. науч. конф.: Сб. докл. - Протвино, 2000. -С. 102 - 106. -(В соавт.).

25. Состояние и перспективы использования протокола Z39.50 в информационном сообществе России//Информационное общество, 2000, № 2.-С. 39-43.-(В соавт.).

26. Интеграция Z39.50 и CDS/ISIS: состояние и перспективы развития // Научные и технические библиотеки, 2000. - № 5. - С. 76 - 79. -(В соавт.).

27. Web-ориенгированная информационно-поисковая система для доступа к базам данных CDS/ISISZ/Научные итехнические библиотеки,2000.-№2.-С. 52 -57.-(В соавт.).

28. Унификация построения и организации доступа к тезаурусам и классификационным схемам в распределенных информационных системах по протоколу Z39.50 // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: 2 всерос. науч. конф.: Сб. докл. - Протвино, 2000. - С. 230 - 233. - (В соавт.).

Оглавление автор диссертации — кандидата технических наук Мазов, Николай Алексеевич

Введение.

Глава 1. Построение локальных и файл-серверных информационных систем с использованием CDS/ISIS.

1.1. Практика использования СУБД для решения информационно-библиотечных задач.

1.2. Основные принципы и требования выбора СУБД для построения информационно-библиотечных систем.

1.3. Характеристика и история развития СУБД CDS/ISIS.

1.4. Локальные решения CDS/ISIS.

1.5. Архитектура «файл-сервер» как простой вариант сетевого взаимодействия.

1.7. Файл-серверные решения CDS/ISIS и их распространенность в

Сибирском отделении РАН.

Выводы.

Глава 2. Web-ориентированные информационные системы для баз данных CDS/ISIS.

2.1. Отличительные черты архитектуры «клиент-сервер».

2.2. Использование Web в качестве универсальной среды построения сетевых приложений.

2.3. Требования, предъявляемые к Web-ориентированной информационной системе для баз данных CDS/ISIS.

2.4. Пример WEB-ориентированной информационной системы для баз данных CDS/ISIS, реализованной в СО РАН.

Выводы.

Глава 3. Протокол Z39.50 и CDS/ISIS.

3.1. Характеристика и история развития протокола Z39.50.

3.2. Z39.50 как универсальный протокол доступа к базам данных в архитектуре «клиент-сервер».

3.3. Требования, предъявляемые к распределенной информационной системе на основе протокола Z39.50.

3.4. Структура информационной системы на основе Z39.50.

3.5. Сервер ZooPARK как основа построения распределенной информационной системы в СО РАН.

3.6. Требования к провайдеру данных CDS/ISIS.

3.7. Реализация провайдера данных CDS/ISIS.

Выводы.

Введение 2000 год, диссертация по документальной информации, Мазов, Николай Алексеевич

Актуальность темы. Лавинообразное увеличение количества и повышение качества компьютерного оборудования, применяемого в информационно-библиотечных учреждениях России, использование локальных и глобальных вычислительных сетей в их деятельности, развитие специального и пользовательского программного обеспечения неизбежно ставят эти организации перед решением проблемы расширения доступа к своим информационным ресурсам [2, 13,21, 32, 37, 39, 63, 72, 95].

Наряду с этим, в информационном сообществе России наблюдается тенденция к интеграции компьютерных парков и информационных ресурсов различных учреждений в единое информационное пространство, что предполагает решение задачи унифицированного доступа к информационно-библиотечным базам данных, используя возможности сети Интернет и открытых международных стандартов [1, 17, 19, 22, 41, 43, 44, 64, 68, 79, 102]. Об этом свидетельствуют различные проекты, поддерживаемые Российским фондом фундаментальных исследований (РФФИ), Институтом «Открытое общество» и др., направленные на решение этих задач [30, 75, 77, 78, 86, 91]. Такие работы ведутся на базе различного импортного оборудования, операционных систем (ОС) и программного обеспечения, что затрудняет процесс построения распределенных информационных систем с целью интеграции информационных ресурсов. Несмотря на то, что в отечественной и зарубежной научной литературе вопрос построения распределенных информационных систем достаточно изучен [3, 5, 7, 16, 25, 33, 40, 45, 65, 66, 71, 87, 90, 94, 104, 105, 107 - 109, 114, 117, 118], реальный опыт разработки и построения таких систем в России крайне недостаточен.

В начале 90-х годов в связи с переходом от машин серии ЕС на персональные компьютеры, перед различными информационно-библиотечными учреждениями встала задача переноса накопленной ранее машиночитаемой информации на ПЭВМ и выбора программных средств для ее обработки [1, 32, 61, 74, 80, 88]. В качестве системы управления базами данных (СУБД) для обработки информационно-библиотечных массивов многие организации воспользовались некоммерческой системой CDS/ISIS. На основе этой СУБД были разработаны различные автоматизированные информационные и библиотечные системы. Для многих организаций эта система стала основным программным средством ведения баз данных научно-технической информации, электронных каталогов их библиотек, а также для решения других технологических задач. В связи с этим возникает практическая потребность на примере реально функционирующей информационной системы, базирующейся на основе СУБД CDS/ISIS, изучить возможность построения и создания распределенной информационной системы, что является актуальной научной и технической задачей.

Целью настоящей работы является разработка и построение распределенной информационно-библиотечной системы на основе СУБД CDS/ISIS.

Реализация данной цели предполагает последовательное решение следующих задач:

• исследование современных информационно-библиотечных систем для хранения и обработки больших информационных массивов на основе СУБД CDS/ISIS и определение требований, предъявляемых к информационно-поисковым системам для построения распределенных информационно-библиотечных систем;

• анализ существующих решений в информационно-библиотечных системах на основе СУБД CDS/ISIS: локального и сетевого - в режиме «файл-сервер», решения с использованием Web-cepBepa совместно с CGI-приложением (Common Gateway Interface) и возможности решения «клиент-сервер» на основе использования протокола Z39.50 (ISO-23950);

• разработка программных средств, обеспечивающих вышеперечисленные режимы при построении распределенной системы на основе СУБД CDS/ISIS;

• внедрение в информационно-библиотечную практику результатов, полученных в ходе диссертационного исследования.

Базой исследований являлись информационные ресурсы Сибирского отделения РАН (СО РАН): Государственной публичной научно-технической библиотеки (ГПНТБ), Объединенного института геологии, геофизики и минералогии (ОИГГМ), Института катализа (ИК), Института вычислительных технологий (ИВТ), Института цитологии и генетики (ИЦГ), Института органической химии (ИОХ).

В качестве базовой интегрированной информационно-поисковой системы для создания и использования информационно-библиотечных ресурсов СО РАН была выбрана СУБД CDS/ISIS. Поэтому основные информационно-библиотечные ресурсы СО РАН накоплены и эксплуатируются именно в среде этой СУБД. В настоящее время репертуар основных внешних отечественных и зарубежных баз данных, эксплуатируемых в СО РАН под управлением CDS/ISIS выглядит следующим образом:

• РЖ ВИНИТИ «Химия» 1987 - 2000 гг.;

• РЖ ВИНИТИ «Физика» 1995 - 2000 гг.;

• РЖ ВИНИТИ «Механика» 1987 - 2000 гг.;

• РЖ ВИНИТИ «Геология» 1987 - 2000 гг.;

• РЖ ВИНИТИ «Геофизика» 1987 - 2000 гг.;

• различные зарубежные базы данных;

• региональные библиографические базы данных, электронные каталоги ГПНТБ СО РАН и других организаций СО РАН.

Общий объем указанных информационных ресурсов составляет около

15 млн записей, что занимает достаточно большой объем дискового пространства — свыше 20 Гб на различных информационных серверах вышеперечисленных организаций, с которых обеспечивается доступ в промышленном режиме к базам данных СУБД CDS/ISIS как в локальном, так и сетевом режимах.

Объектом исследования являются машиночитаемые информационные ресурсы научно-технической информации.

Предмет исследования - СУБД в распределенных информационно-библиотечных системах для хранения и использования больших массивов информации.

Изученность темы и методология исследования. В широком смысле тема построения распределенных информационных систем не теряет своей актуальности на протяжении последних десятилетий, о чем свидетельствует ее постоянное обсуждение в специальной литературе и на различных всероссийских и международных конференциях. Однако, основной акцент при этом переносится на использование дорогостоящих реляционных СУБД (Oracle, Informix, IBM DB2 и др.) и различных развивающихся технологий (CORBA, Java, XML и др.), в том числе и корпоративных (OLE DB, DCOM и др.) [57, 79, 112]. При этом для информационных систем на основе СУБД CDS/ISIS практически отсутствуют работы по анализу возможности ее применения в больших сетевых распределенных информационных системах и технологий, реализующих эту возможность.

Методологической основой исследования явились положения, изложенные в трудах в области проектирования и эксплуатации региональных информационных систем, использования информационных ресурсов: Елепова Б.С., Боброва JI.K., Каленова Н.Е., Баженова С.Р. [1, 20, 21, 32, 40, 65, 80]; в области построения и эксплуатации автоматизированных библиотечных систем - Шрайберга Я.Л., Воройского Ф.С., МаршакаБ.И., Бродовского А.И. [10, 11, 14, 59, 96, 97,

101]. Существенной методологической опорой при проведении исследований в области проектирования и создания распределенных информационных систем стали положения, изложенные в работах Калиниченко J1.A., ШокинаЮ.И., Федотова A.M., Жижимова О.Л., Племнека А.И. [23, 25 - 27, 33 - 35, 69 - 71, 89, 93 - 95].

Методы исследования. Основным методом исследования являлся анализ опытной и промышленной эксплуатации нескольких версий разрабатываемой распределенной информационной системы в различной конфигурации и архитектуре, с произвольным количеством пользователей. При построении системы применялся метод сравнительного анализа характеристик и возможностей, используемых в информационной практике различных информационно-поисковых систем. При этом активно применялись разработки, в том числе оригинальные, направленные на повышение эффективности используемого программного обеспечения, его устойчивости по отношению к нештатным ситуациям, а также на оптимизацию организации и представления данных.

Научная новизна работы состоит в том, что впервые распределенная информационно-библиотечная система, основанная на СУБД CDS/ISIS, рассмотрена как самостоятельный предмет исследования. На основе обобщения существующего опыта эксплуатации библиографических баз данных научно-технической информации больших объемов выявлены факторы, которые целесообразно учитывать при разработке и построении распределенных информационно-библиотечных систем, и сформулированы требования, которым необходимо следовать при разработке систем подобного класса. Исходя из этого, впервые реализована полнофункциональная распределенная информационная система для баз данных CDS/ISIS.

В процессе выполнения работы также:

• предложен подход и решена задача по совместному использованию базы данных трудов сотрудников научного учреждения и баз данных Института научной информации США для определения индекса цитирования их научных работ;

• разработана и реализована информационная технология для ведения баз данных тезаурусов, рубрикаторов и различных классификаторов;

• модифицирован и реализован алгоритм CRC-кодирования с целью построения уникальных идентификационных ключей для различных текстовых полей баз данных.

Практическая значимость. Разработанная распределенная информационно-библиотечная система в настоящее время функционирует в научно-исследовательских учреждениях СО РАН: в ГПНТБ, в Информационно-библиотечном Центре ОИГГМ, в Информационном центре ИК, в Институте вычислительного моделирования Красноярского научного центра и активно внедряется в другие библиотеки и информационные органы, использующие в своей работе СУБД CDS/ISIS. Отдельные технологические элементы разработанной системы внедрены в ГПНТБ России, Центральной научной сельскохозяйственной библиотеке (ЦНСХБ) Россельхозакадемии, Российской государственной библиотеке.

Апробация результатов Основные положения диссертации обсуждались на I - VII международных конференциях «Крым» -«Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества» (Евпатория, 1994 - 1995, Форос, 1996, Судак, 1997 -2000); на I, II, IV, V международных рабочих совещаниях по электронным публикациям (EL-PUB) (Новосибирск, 1996 - 2000); на II - IV Всероссийских конференциях «LIBCOM» (Москва, 1997 - 1999); на II и VII международных научно-практических конференциях - «Информационные системы и технологии» (Владивосток, 1995, 2000); на I международной конференции «Библиотечно-информационные ресурсы в науке, образовании, культуре и бизнесе» (Узбекистан, Самарканд, 1999); на II международной конференции «Интернет - Общество - Личность - 2000 "ИОЛ-2000": Новые информационно-педагогические технологии» (Санкт-Петербург, 2000); на II всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (Протвино, 2000), а также на ряде других конференций и семинаров, организованных РФФИ, ВИНИТИ, ГПНТБ СО РАН, Библиотекой по естественным наукам РАН.

Разработанная система неоднократно демонстрировалась на указанных форумах. В рекомендациях программы LibWeb, поддерживаемой РФФИ, основные положения системы приняты в качестве типовых для решений подобного класса. Разрабатываемая система в рамках исследований получала поддержку РФФИ в 1994 - 2000 гг., Министерства промышленности, науки и технологий РФ в 1996 - 2000 гг., Института «Открытое общество» в 1997 -1998 гг., 2000 г.

Внедрение данной системы позволило организовать оперативный удаленный доступ к информационным ресурсам научно-технической информации СО РАН на основе открытых международных стандартов. Результаты исследования могут применяться при разработке систем подобного класса, использующие в качестве основы СУБД CDS/ISIS. Система внедрена ГПНТБ СО РАН, ОИГГМ СО РАН, ИК СО РАН, что подтверждается актами внедрения.

Разработанная система доступна на информационном сервере ОИГГМ СО РАН http://geolibr.uiggm.nsc.ru, сервере ГПНТБ СО РАН http://www.spsl.nsc.ru, информационном сервере ИК СО РАН http://altair.catalysis.nsk.su.

Диссертационная работа выполнялась в ОИГГМ СО РАН.

За время научно-исследовательской деятельности автором опубликовано более 90 работ, из которых 28 отражают основные положения диссертационного исследования.

На защиту выносятся следующие положения:

• СУБД CDS/ISIS может быть эффективно использована в современных информационно-библиотечных системах.

• Функциональные возможности СУБД CDS/ISIS могут быть существенно расширены за счет использования дополнительного программного обеспечения, реализующего архитектуру многоуровневого сетевого приложения.

• Наиболее эффективный способ организации распределенной информационной системы на основе СУБД CDS/ISIS -соответствие ее модели «клиент-сервер».

• Применение технологий Z39.50 позволяет построить распределенную информационную систему в архитектуре «клиент-сервер» на основе СУБД CDS/ISIS.

• Распределенная информационно-библиотечная система на основе СУБД CDS/ISIS обеспечивает оперативный доступ пользователей к массивам научно-технической библиографической информации, основанный на работе по стандартным протоколам.

Цель и задачи исследования определили логику изложения материала и структуру построения диссертации. Диссертация состоит из введения, трех глав, заключения, списка литературы, содержащего 118 источников, и 4 приложений. Работа проиллюстрирована рисунками.

Заключение диссертация на тему "Разработка и построение распределенной информационно-библиотечной системы на основе СУБД CDS/ISIS"

Основные результаты исследования заключаются в следующем:

1. Исследованы современные информационно-библиотечные системы для хранения и обработки больших информационных массивов на основе СУБД CDS/ISIS и определены основные требования, предъявляемые к информационно-поисковым системам для построения распределенных информационно-библиотечных систем.

2. На основании анализа существующих решений и многолетнего опыта эксплуатации информационно-библиотечных систем на основе СУБД CDS/ISIS разработана и реализована информационная технология для ведения и коллективного использования отечественных и зарубежных баз данных, находящихся под управлением CDS/ISIS:

• Разработано программное обеспечение, позволяющее организовать работу в локальном и в сетевом режиме «файл-сервер», расширяющее функциональные возможности базовой СУБД CDS/ISIS и набор интерфейсов пользователя. Это программное обеспечение успешно внедрено в промышленную эксплуатацию в ГПНТБ СО РАН, ОИГГМ СО РАН, РЖ СО РАН, ИЦГ СО РАН.

• Создан комплект программного обеспечения и построена сетевая информационная система на основе Web-технологий и СУБД CDS/ISIS для обеспечения доступа к информационным ресурсам. Система и ее отдельные компоненты функционируют ГПНТБ СО РАН, ОИГГМ СО РАН, ПК СО РАН.

• Разработано программное обеспечение для работы с базами данных CDS/ISIS по протоколу Z39.50, независимое от базовой СУБД, вошедшее в комплект серверного программного обеспечения ZooPARK (сервер Z39.50, различные провайдеры данных и др.). Это программное обеспечение успешно функционирует в организациях, использующих в своей работе базы данных CDS/ISIS и ИРБИС (ГПНТБ России): Корпоративная библиотечная сеть г. Новосибирска (ГПНТБ СО РАН, ОИГГМ СО РАН, Новосибирская областная специальная библиотека для незрячих и слабовидящих и др.), Московская корпоративная библиотечная сеть, ЦНСХБ Россельхозакадемии.

3. Предложен подход и реализована информационная технология, позволяющая определять индекс цитирования работ научных сотрудников, используя совместно базы данных трудов сотрудников научного учреждения и Института научной информации США.

4. Разработано и реализовано программное обеспечение для ведения и использования баз данных тезаурусов, рубрикаторов и различных классификаторов.

В заключение следует отметить, что описанное в настоящей работе программное обеспечение успешно функционирует во многих учреждениях Российской Федерации. Оно находится в развитии и постоянно обновляется.

Заключение

Проведенное автором исследование посвящено рассмотрению проблем построения распределенной информационно-библиотечной системы на основе СУБД CDS/ISIS.

Показано что:

1. СУБД CDS/ISIS может быть эффективно использована в современных информационных системах.

2. Функциональные возможности СУБД CDS/ISIS могут быть существенно расширены за счет использования дополнительного программного обеспечения, реализующего архитектуру многоуровневого сетевого приложения.

3. Наиболее эффективный способ организации распределенной информационной системы на основе СУБД CDS/ISIS -соответствие ее модели «клиент-сервер».

4. Применение технологий Z39.50 позволяет построить распределенную информационную систему в архитектуре «клиент-сервер» на основе СУБД CDS/ISIS.

Библиография Мазов, Николай Алексеевич, диссертация по теме Информационные системы и процессы, правовые аспекты информатики

1. Алексеев A.C., ЕлеповБ.С., Бобров JI.K. Развитие инфраструктуры информации Сибирского отделения РАН // Информационные ресурсы. Интеграция. Технология. / Междунар. конф. НТИ-97. М., 26 28 ноября 1997 г.-М., 1997.-С. 15- 16.

2. Алфимов М.В. Развитие отечественной науки // Мир библиогр. 1998. -№2.-С.-25 - 30.

3. Андреев A.M., Березкин Д.В., Кантонистов Ю.А. Выбор СУБД для построения информационных систем корпоративного уровня на основе на основе объектной парадигмы // СУБД. 1998. - № 4 - 5. - С. 26 - 50.

4. Анзер Г. Oracle power objects. Визуальное проектирование приложений клиент/сервер для реляционных баз данных. М.: АБФ, 1997. - 463 с.

5. Ахтырченко К.В., Леонтьев В.В. Распределенные объектные технологии в информационных системах // СУБД. 1997. - № 5 - 6. - С. 52 - 64.

6. Бакстон Э., Хопкинсон А. Руководство по CDS/ISIS: Пер. с англ. / ГПНТБ России. М, 1997. - 228 с.

7. Бернстайн Ф. Middleware: модель сервисов распределенной системы // СУБД. 1997. - № 2. - С. 41 - 60.

8. Бобров Л.К., Мазов H.A. Опыт обработки ПОБД на персональной ЭВМ в среде ППП CDS/ISIS/M // Эффективность использования интерактивных библиотечных систем: Сб. науч. тр. / Рос. акад. наук. Сиб. отд-ние. ГПНТБ. Новосибирск, 1994. - С. 50 - 57.

9. Бобров Л.К., Мазов H.A. Опыт эксплуатации ППП CDS/ISIS/M: достоинства и недостатки системы // Автоматизированные библиотечно-информационные системы: IV науч. семинар с междунар. участием: Тез. докл. и сообщ. Новосибирск, 1991. - С. 44 - 46.

10. Ю.Бродовский А.И. Программные средства, расширяющие возможности ППП CDS/ISIS и их применение для автоматизации библиотечно-информационных процессов в ГПНТБ России // Науч. и техн. б-ки.1995.-№2. С. 24-34.

11. П.Бродовский А.И., Касаракин В.А. Доступ к базам данных CDS/ISIS через Интернет: универсальное решение // Науч. и техн. б-ки. 1999. - № 2. -С. 52- 54.

12. Web-ориентированная информационно-поисковая система для доступа к базам данных CDS/ISIS / Мазов H.A., Малицкий Н.В., Баженов С.Р., Жижимов О.Л. // Науч. и техн. б-ки. 2000. - № 2. - С. 52 - 57.

13. Вислый А.И. Информационные ресурсы библиографирующих организаций. Проблемы создания и использования // Науч. и техн. б-ки. -2000.-№5.- С. 22-27.

14. М.Воройский Ф.С., Грибов В.Т., Каленов Н.Е. Рынок программного обеспечения для автоматизированных библиотечно-информационных систем // Инф. ресурсы России. 1998. - № 5. - С. 18 - 22.

15. ГНПБ им. К.Д. Ушинского на основе ППП CDS/ISIS // Науч. и техн. б-ки, 1995.-№2,- С. 35 - 39.

16. Григорьев Ю.А. Проблемы выбора модели доступа к данным при проектировании информационных систем на основе СУБД // Инф. технол. 1999.-№ 5.-С. 2-7.

17. Джим Грей. О сегодняшнем и завтрашнем дне баз данных // СУБД.-1998. -№3.- С. 20-21.

18. Елепов Б.С. Основные принципы создания автоматизированной системы научно-технической информации региона на базе Сибирского отделения АН СССР: Дисс. . докт. техн. наук. Новосибирск, 1990. - 67 с.

19. Елепов Б.С., Баженов С.Р., МазовН.А. Современные информационные технологии в крупной библиотеке // Материалы 7 междунар. конф. «Крым 2000». Симферополь, 2000. - Т. 1. - С. 171 - 173.

20. Ершова Т.В., Хохлов Ю.Е. Межведомственная программа «Российские электронные библиотеки»: подходы и перспективы // Инф. общество.1999.-№3. С. 5.

21. Жижимов O.JI. Введение в Z39.50. Новосибирск: Изд-во НГОНБ,2000.- 196 с.

22. Жижимов O.JI., Мазов H.A. Состояние и перспективы использования протокола Z39.50 в информационном сообществе России // Инф. общество. 2000. - № 2. - С. 39 -43.

23. Жижимов О.Л., Мазов H.A., Фролов A.C. Доступ к базам данных ISIS из Internet и построение распределенной информационной системы // Вычислительные технологии. 1997. - Т. 2. - № 3. - С. 45 - 50.

24. Информационные системы и научные телекоммуникации. (Проблематика и разработки по проектам РФФИ) / Вольфенгаген В.Э., Калиниченко Л.А., Мендкович A.C. и др. // Вестник РФФИ. 1998. -№ 4. - С. 4 - 50.

25. Использование ППП CSD/ISIS/M для автоматизации библиотечных процессов и обслуживания пользователей ГПНТБ России // Экспресс-информация. Информатика / ВИНИТИ. 1996. - № 4. - С. 7 - 13.

26. Каленов Н.Е. Библиографические ресурсы библиотек РАН и типовые средства для их представления в электронном виде // Инф. ресурсы России. 1998. - № 6. - С. 26 - 27.

27. Калиниченко Л.А. Методы и средства интеграции неоднородных баз данных. М.: Наука, 1983. - 423 с.

28. Калиниченко Л.А. Реализация программ многократного применения над базами данных, независимых от СУБД // Системы и средства информатики: Ежегодник. М.: Наука, 1989. - Вып. 1. - С. 3 - 17.

29. Калиниченко Л.А., ПлечоваО.А., Сюнтюренко О.В. Семинар совещание «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» // Вестник РФФИ. 1999. - № 2. - С. 74 - 77.

30. Кириллова О.В., Мазов H.A. Новые формы информационного и библиотечного обслуживания в научно-исследовательском институте // Информационные ресурсы. Интеграция. Технологии: «НТИ-97»: Материалы конф. М., 1997. - С. 103 - 104.

31. Кисельков А.И., Сизов Б.Н. Автоматизация библиотечных процессов в ГНПБ им. К.Д. Ушинского на основе ППП CDS/ISIS // Науч. и техн. б-ки. 1995. - № 2. - С. 35 - 39.

32. Красилыцикова В.М. На пути к международной кооперации // Библиотечные компьютерные сети: Россия и Запад. Современные тенденции корпоративной работы библиотек в сетях передачи данных. -М., 1998.-С. 200-201.

33. Кузнецов С. Доступ к базам данных с использованием технологии WWW // СУБД. 1996. - № 5 - 6. - С. 4 - 9.

34. Кузьмин Е.И. К новой России с новыми библиотеками: проблемы интеграции и доступности информационных ресурсов российских библиотек // Научные и технические библиотеки. 1999. - № 1. -С. 35 -46.

35. Куприянов И.Ю., Делаков А.П. Корпоративная сеть Российской национальной библиотеки // Библиотечные компьютерные сети: Россия и Запад. Современные тенденции корпоративной работы библиотек в сетях передачи данных. М., 1998. - С. 110 - 117.

36. Ладыженский Г.М. Архитектура корпоративных информационных систем // СУБД. 1997. - № 5 - 6. - С. 17 - 24.

37. Ладыженский Г.М. Технология клиент-сервер и принципы Upsizing // Сети. 1995.-№3.-С. 32.

38. Мазов H.A. Базы данных CDS/ISIS в среде Windows: проблемы и решения // Материалы 4 междунар. конф. «Крым 97». М., 1997. - Т. 2. -С. 481.

39. Мазов H.A. Современные технологии в библиотеке академического института // Материалы 2 междунар. конф. «Крым 95». М., 1995. -Т. 1. - С. 218 -220.

40. Мазов H.A. CDS/ISIS: критический взгляд апологета (дискуссия) // Материалы 6 междунар. конф. «Крым 99». Симферополь, 1999. - Т. 2. -С. 251 -252.

41. Мазов H.A., Баженов С.Р., Шрамкова Е.Г. Разработка программных средств «Интерфейс пользователя CDS/ISIS/M» // Материалы 1 междунар. конф. «Крым 94». М., 1994. - С. 176 - 177.

42. Мазов H.A., Жижимов О.Л. Интеграция Z39.50 и CDS/ISIS: состояние и перспективы развития // Науч. и техн. б-ки. 2000. - № 5. - С. 76 - 79.

43. Мазов H.A., Жижимов О.Л., Поморцев А.Ю. Организация доступа кбазам данных CDS/ISIS/M из INTERNET // Материалы 3 междунар. конф. «Крым 96». М., 1996. - Т. 2. - С. 177 - 179.

44. Мазов H.A., Жижимов O.JI., Фролов A.C., Баженов С.Р. Создание системы открытого публичного доступа из Интернет к распределенным библиографическим базам данных CDS/ISIS // Материалы 4 междунар. конф. «Крым 97». Симферополь, 1997. - Т. 2. - С. 482 - 483.

45. Малицкий H.A., Мазов H.A. Web-ориентированная система ведения библиографических баз данных CDS/ISIS // Материалы 7 междунар. конф. «Крым 2000». Симферополь, 2000. - Т. 2. - С. 381 - 383.

46. Марчук А.Г. Система поддержки работы с удаленными XML-документами // Электронные библиотеки: перспективные методы и технологии, электронные коллекции: 2 Всерос. науч. конф.: Сб. докл. -Протвино, 2000. С. 220 - 223.

47. Маршак Б. ISIS. Мы сделали свой выбор // Библиотека. 1997. - № 10. -С. 35 - 36.

48. Маршак Б.И. CDS/ISIS в ГПНТБ России: действующие системы и перспективные разработки // Науч. и техн. б-ки. 1995. - № 2. -С. 22 -23.

49. Наговицына Т. Использование ЭВМ и ПЭВМ в локальной АСНТИ НИИ на базе ППП CDS/ISIS/M. Создание БД на ПЭВМ // Новые технологии винформационно-библиотечном обеспечении научных исследований: Сб. науч. тр.-М., 1992,- С. 81-82.

50. Найк Дилип. Стандарты и протоколы Интернета / Пер. с англ. М.: Издательский отдел «Русская редакция» ТОО «Channel Trading Ltd», 1999.-384 с.

51. Нечипоренко В.П. Информационное обеспечение науки и техники // Информационные ресурсы России. 1998. - № 3. - С. 4 - 10.

52. Нечипоренко В.П., Антошкова O.A., Белоозеров В.Н. Государственная система научно-технической информации. Средства систематизации и поиска научно-технической информации, стандартизация // НТИ. Сер. 1.- 1997.-№ 12. С. 1-3.

53. Пакет прикладных программ CDS/ISIS/M версия 2.3: Методические материалы и документация по пакетам прикладных программ. Вып. 70. М.: МЦНТИ, 1991.-257 с.

54. Племнек А.И., Усманов Р.Т. Z39.50: открытый доступ к библиографической информации // Науч. и техн. б-ки. 1998. - № 8. - С. 4 - 28.

55. Племнек А.И., УсмановР.Т., СоваД.Н. Использование протоколов Z39.50 и http в современных библиотечных информационных системах // Инф. бюл. РБА. 1998. - № 12. - С. 240 - 257.

56. Поляк Ю.Е., Сигалов A.B. Интернет в России: Сетевая инфраструктура и информационные ресурсы // Библиотечные компьютерные сети: Россия и Запад. Современные тенденции корпоративной работы библиотек в сетях передачи данных. М., 1998. - С. 10-34.

57. Принципы корпоративной распределенной библиотечной системы Сибирского региона / Баженов С.Р., Елепов Б.С., Жижимов O.JL, Мазов H.A., Бредихина H.A., Кон Л.Ф. // Материалы 7 междунар. конф. «Крым 2000». Симферополь, 2000. - Т. 2. - С. 72 - 74.

58. Принципы создания интегрированной базы данных в ГПНТБ СССР с использованием 111111 CDS/ISIS / Андреев А.Ф., Городничий B.JL, Дунаевская С.М., Сбойчакова Н.Д. // Юбилейный сборник научных трудов ГПНТБ России 1970 1995 гг. - М., 1999. - С. 139 - 150.

59. Программы и проекты Института «Открытое общество» в России // Инф. бюл. РБА 1998. - № 12. - С. - 234 - 240.

60. Проект Библиотечные сети учреждений науки и образования Северо

61. Западного региона России / Племнек А.И., Агажданова J1.H., Баранов B.JI. и др. // Науч. и техн. б-ки. -1997. № 11. - С. 3 - 15.

62. Проектирование баз данных / Энсор Д. и др., Пер. с англ. Киев: BHV, 1999.- 557 с.

63. Проектирование и эксплуатация региональных АСНТИ / Елепов Б.С., Бобров JI.K., Баженов С.Р., Каленов Н.Е. Новосибирск: Наука. Сибирское отд-ние, 1991. - 175 с.

64. Рик Эйр, Кевин Рейчард и др. Вычислительные сети и сетевые протоколы. М.: Мир, 1982. - 486 с.

65. Рубцов В.В., Масевич А.Ц., Пименов E.H. Расширение возможностей ППП CDS/ISIS и ISIS/Pascal // Науч. и техн. б-ки. 1998. - № 2. - С. 126 -129.

66. Система обеспечения контроля и учета доступа из Интернет к распределенным библиографическим базам данных / Баженов С.Р., Баженов И.С., Мазов H.A., Малицкий H.A. // Материалы 6 междунар. конф. «Крым 99». Симферополь, 1999. - Т. 1. - С. 226 - 228.

67. Создание программного комплекса доступа из Интернет к базам данных на основе WWW-ISIS / Баженов С.Р., Мазов H.A., Малицкий H.A., Баженов И.С. // Науч. и техн. б-ки. 1999. - № 2. - С. 47 - 52.

68. Фенин Ю.И., Востриков А.Н. CDS/ISIS в информационной системе Библиотеки Администрации Президента Российской Федерации // Науч. и техн. б-ки. 1995. - № 2. - С. 39-41.

69. Федотов A.M. Новые информационные технологии // Материалы научно-практической конференции «Проблемы информатизации региона». -Красноярск, 1993. С. 32 - 48.

70. Флореску Д., Леви А., Мендельсон А. Технологии баз данных для WWW: Обзор // СУБД. 1998. - № 4 - 5. - С. 3 - 25.

71. Хохлов Ю.Е., Воройский Ф.С. Проектирование распределенной логической библиотечной сети LIB WEB // Науч. и техн. б-ки 1998. -№ 2. - С. 24 - 30.

72. Шокин Ю.И., Федотов A.M. Информационные технологии Internet // Вычислительные технологии. 1997. - Т. 2. - № 3. - С. 80 - 87.

73. Шокин Ю.И., Федотов A.M. Распределенные информационные системы// Вычислительные технологии. 1998. - Т. 3. - № 5. -С. 79-93.

74. Шокин Ю.И., Федотов A.M., Никульцев B.C. Вопросы развития сети Internet новосибирского научного центра // Вычислительные технологии. 1997. - Т. 2. - № 3. - С. 97 - 103.

75. ШрайбергЯ.Л. Автоматизация библиотек сегодня: оценка и осмысление подходов и проблем: Докл. на конф. «Б-ки и ассоц. в меняющемся мире:

76. Нов. технол. и нов. формы сотрудничества» («Крым 98»), Судак, 6-14 июня, 1998 // Науч. и техн. б-ки. 1999. - № 2. - С. 1 - 73.

77. ШрайбергЯ.Л. Международная Ассоциация пользователей CDS/ISIS и деятельность дистрибьютерского центра ЮНЕСКО: новая ступень интеграции автоматизированного библиотечно-информационного ресурса // Науч. и техн. б-ки. 1995. - № 1. - С. 19 - 22.

78. Шрайберг Я.Л. Современное состояние развития библиотечных технологий и место CDS/ISIS // Науч. и техн. б-ки. -1995. Спец. выпуск. - С. 5 - 8.

79. ШрайбергЯ. CDS/ISIS и международное сотрудничество: отечественный опыт // Библиотека. 1999. - № 1. - С. 49-51.

80. Шрайберг Я.Л., Воройский Ф.С. Автоматизированные библиотечно-информационные системы. М.: Либерия: ГПНТБ России, 1996. - 273 с.

81. Эпштейн М.Я. Использование современных информационно-поисковых систем // Инф. рес. России. 1998. - № 1. - С. 28-33.

82. ANSI/NISO Z39.50-1995. Information Retrieval (Z39.50): Application Service Définition and Protocol Spécification. Z39.50 Maintenance Agency Offical Text for Z39.50-1995, July 1995. http://lcweb.loc.gov/z3950/agency.

83. AyresF.H., Nielsen L.P.S., RidleyM.J. BOPAC2: A new concept in OPAC design and bibliographie control // Cat. and Classif. Quart. 1999. -Vol. 28,-№2.-P. 17-44.

84. BeheshtiJ. The evolving OPAC // Cat. and Classif. Quart. 1997. -Vol. 24. -№ 1 -2. - P. 163 - 185.

85. BIREME/PAHO/WHO. WWWISIS: Ver. 3.0. Sao Paulo, Brasilian, Oct.1997. http://www.bireme.br/wwwisis.htm.

86. DempseyL. Distributed library and information systems: the significance of Z39.50 // Managing information. 1994. - Vol. 1. - № 6. - P. 41 - 43.

87. DempseyL., Russell R., Murray R. The emergence of distributed library services. A European perspective // J. Amer. Soc. Inf. Sci. 1998. - Vol. 49. -№ 10.-P. 942-951.

88. Muhlhauser Gerd A. European Information Network Services EINS: Adding to today's globally networked information society // Int. Forum Inf. Doc. - 1997. - Vol. 22. - № 4. - P. 11 - 14.

89. RFC 2056, «Uniform Resource Locators for Z39.50»

90. RFC 2068, «Hypertext Transfer Protocol HTTP 1.1»

91. Thompson V. Easier access to libraries // Byte. 1998. - Vol. 23. - № 4. -P. 3 -6.

92. Turner F. Selecting a Z39.50 client or Web gateway // Libr. Hi Tech.1998,- Vol. 16. -№2. P. 7- 18.