автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Исследование принципов организации, функционирования и разработка распределенного электронного каталога библиотечного консорциума

кандидата технических наук
Колобов, Олег Сергеевич
город
Новосибирск
год
2007
специальность ВАК РФ
05.25.05
Диссертация по документальной информации на тему «Исследование принципов организации, функционирования и разработка распределенного электронного каталога библиотечного консорциума»

Автореферат диссертации по теме "Исследование принципов организации, функционирования и разработка распределенного электронного каталога библиотечного консорциума"

На правах рукописи

Колобов Олег Сергеевич

ИССЛЕДОВАНИЕ ПРИНЦИПОВ ОРГАНИЗАЦИИ, ФУНКЦИОНИРОВАНИЯ И РАЗРАБОТКА РАСПРЕДЕЛЕННОГО ЭЛЕКТРОННОГО КАТАЛОГА БИБЛИОТЕЧНОГО КОНСОРЦИУМА

Специальность 05 25.05 - информационные системы и процессы, правовые аспекты информатики

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

НОВОСИБИРСК - 2007

Диссертация выполнена в Институте сильноточной электроники СО РАН и Институте вычислительных технологий СО РАН.

Научный руководитель чл -корр РАН

Федотов Анатолий Михайлович

Официальные оппоненты доктор технических наук

Каленов Николай Евгеньевич

кандидат технических наук Мазов Николай Алексеевич

Ведущая организация

Ярославский государственный университет им П.Г Демидова

Защита состоится . . 2007 г в ?? «»часов на за-

седании диссертационного совета Д 003 046.01 по защите диссертаций на соискание ученой степени кандидата наук в Институте вычислительных технологий Сибирского отделения Российской академии наук по адресу 630090, г Новосйбирск-90, проспект Академика Лаврентьева, 6.

С диссертацией можно ознакомиться в Специализированном читальном зале библиотеки ИВТ СО РАН

Автореферат разослан

2007 г

Ученый секретарь диссертационногсьсовета Д 003.046.01 доктор физ.-мат. наук, профессор Л {/Нубаров Л.Б

1 Общая характеристика работы

Актуальность проблемы. В настоящее время информационные ресурсы российских библиотек сосредоточены в библиографических, фактографических и полнотекстовых базах данных. Хронологический охват баз данных составляет более 25 лет, количественная оценка совокупного объема имеющихся баз данных составляет более 30 миллионов библиографических записей 1 Для обеспечения удаленного доступа к подобным базам данных используется специализированные средства, чаще всего системы класса О РАС2, которые адаптированы для конечного пользователя и ориентированы на работу с локальной библиотечно-информационной системой

Базы данных создавались под управлением разнородных систем, как следствие, такие базы данных имеют различные средства для удаленного поиска, извлечения и представления библиографической информации Начиная с 1999 года, наиболее активная часть российских библиотек, начала работу по объединению в библиотечные консорциумы по региональному признаку, а также по тематической направленности. Целью такого объединения является стремление обеспечить универсальный и простой доступ к библиографической информации независимо от используемых библиотечно-информационных систем

В процессе создания библиотечного консорциума возникают реальные технические проблемы, связанные с необходимостью сопряжения различных информационно-библиотечных систем, разработки общих подходов для индексирования, поиска, извлечения и представления информации, а также в создании распределенной информационной системы основанной на распределенном электронном каталоге. В связи с этим является актуальным исследование, направленное на разработку технологии создания и поддержки распределенного электронного каталога и организации удаленного доступа к нему Особое значение для развития технологии создания распределенного электронного каталога имеют задачи поиска и извлече-

1По данным Ассоциации Региональных Библиотечных Консорциумов (АРБИКОН) и Всероссийского института научной и технической информации (ВИНИТИ)

2 Online Public Access Catalog (англ ) - компьютеризированный он-лайн каталог материалов хранящихся в библиотеке

ния информации в полнотекстовых баз данных, находящихся под управлением информационных систем класса цифровых депозитариев, которые ориентированы на совместное хранение полнотекстовых документов и их метаданных.

Цель диссертационной работы. Разработать технологию построения распределенного электронного каталога библиотечного консорциума на основе требований, предъявляемых к распределенным информационным системам

Направление исследований. Реализация данной цели предполагает решение следующих задач-

1 Сформулировать и проанализировать основные требования для распределенного электронного каталога;

2. Разработать модель распределенного электронного каталога на основе 3-х уровневой архитектуры,

3 Разработать технологию удаленного доступа к распределенному электронному каталогу для поиска, извлечения и представления информации,

4 Разработать технологию создания метаописаний баз данных для распределенного электронного каталога.

На защиту выносятся:

• Модель метапоисковой машины для 3-х уровневой архитектуры распределенного электронного каталога библиотечного консорциума, которая обеспечивает выполнение распределенного поиска информации по протоколу 239 50.

• Технология удаленного доступа к распределенному электронному каталогу по протоколу 81Ш/81^

• Технология создания метаописаний баз данных на основе стандартных сервисов для протоколов ЪЪ9 50 и 81Ш/8Е\У.

• Программное обеспечение, сервер Z39.50, мета-сервер, Д^еЬ-ориентирование приложение для доступа к распределенному электронному каталогу, программа-робот для

создания метаописаний баз данных Для этого программного обеспечения выполнены требования соответствия профилю г39 503

Научная новизна. На основе требований предъявляемых к распределенным информационным системам, впервые сформулированы требования к распределенному электронному каталогу библиотечного консорциума Предложена модель ме-тапоисковой машины для 3-х уровневой архитектуры распределенного электронного каталога, которая реализована в виде метапоискового сервера на основе стандартных протоколов поиска и извлечения информации. Реализован алгоритм слияния результатов поиска для метапоискового сервера. Создано расширение протокола 81Ш/8К\У для поддержки логического группирования баз данных на стороны метапоискового сервера Предложена технология создания метаданных баз данных на основе стандартных сревисов протоколов 739 50 и

БЙ-и/вГОУ

Методы исследований, достоверность и обоснованность результатов. В работе применялись эмпирические и теоретические методы исследования Эмпирический анализ базируются на экспериментальных данных полученных для параллельного поиска на множестве распределенных в сети баз данных и известных теоретических положениях для распределенных информационных систем При решении задач использованы рекомендации международных и российских стандартов по поиску, извлечению, представлению и индексированию информации Достоверность полученных результатов подтверждается промышленной эксплуатацией созданного программного обеспечения для распределенного электронного каталога библиотечного консорциума Обоснованность полученных результатов подтверждается соответствием профилю применяемых стандартов

Практическая значимость. На основе предложенных и сформулированных требований построена распределенная информационная система, которая объединяет библиографические базы данных более 20 членов Томского библиотечного консорциума Научно-технической библиотеки Томского по-

3 Корпоративный профиль Ассоциации российских библиотечных консорциумов (АРВИКОН).

литехнического университета, Научно-медицинской библиотеки Сибирского государственного медицинского университета, Томской областной универсальной научной библиотеки и др. (полный список организаций приведен в диссертации в Приложении А)

Реализация метапоисковой машины для 3-х уровневой архитектуры распределенного электронного каталога позволила объединить распределенные в сети библиографические базы данных и цифровые депозитарии консорциума в единую распределенную информационную систему - распределенный электронный каталог на основе протокола Z39 50

Созданный распределенный электронный каталог доступен для удаленного поиска и извлечения информации через единую точку доступа по протоколу SRU/SRW, которая реализована на основе метапоисковой машины

Создано программное обеспечение для организации служб протокола Z39.50 членов библиотечного консорциума- сервер Z39.50, метапоисковый сервер для протоколов Z39 50 и SRU/SRW, web-ориентированное клиентское приложение, функционирующие на основе протокола SRU/SRW А также программное обеспечение для создания метаданных баз данных на основе стандартных сервисов протоколов Z39 50, SRU/SRW

Апробация работы. Результаты по теме диссертации получены в ходе выполнения хоздоговорных и инновационных работ по созданию библиотечного консорциума.

По теме диссертации были сделаны сообщения и доклады на научно-практических конференциях "Крым" (Международная конференция "Библиотеки и ассоциации в меняющемся мире", Судак, 2000-2006 гг), "LIBCOM" ("Информационные технологии, компьютерные системы и издательская продукция для библиотек", г. Ершово, 2001-2004 гг), 25 Library Systems Seminar ELAG (г. Прага, 2001), EL-PUB (рабочие совещание, конференция по электронным библиотекам, г Новосибирск, 2004, 2005 гг.), INVIROMIS (г. Томск, 2006)

Личный вклад автора. Работы по теме диссертации выполнены в Томском политехническом университете (ТПУ) и в Институте сильноточной электроники (ИСЭ) СО РАН автором совместно с аспирантами кафедры "Прикладной математики" факультета автоматики и вычислительной техники

ТПУ - Пачуевым К Е. и Татарским Ф Е ; сотрудниками Научной медицинской библиотеки Сибирского государственного медицинского университета - Мешечак Н А , Шамардиной JI А , сотрудником Муниципальной библиотечной системы г Томска - Караушем А. С. Работа выполнялась в рамках хоздоговорных работ и проектов - "Открытая электронная библиотека", "Открытая электронная медицинская библиотека" при поддержке грантов Института "Открытое общество"

Все результаты, включенные в диссертацию, получены автором лично или в неделимом соавторстве. Автором совместно с Татарским Ф Е. и Пачуевым К Е было разработано следующее программное обеспечение

• Сервер Z39 50 (CUBA Z39 50-сервер, Колобов ОС),

• Метапоисковый сервер для протоколов Z39 50 и SRU/SRW (CUBA мета-сервер, Колобов ОС),

• Web-ориентированный клиент на основе протокола SRU/SRW (CUBA-OPAC, Колобов О С , Пачуев К Е.),

• Программа-робот для создания метаданных баз данных (Колобов О С , Пачуев К Е , Татарский Ф Е );

Публикации. По теме диссертации опубликовано 12 печатных работ (объемом 3 7/29 печатных листов), в том числе 5 статей [1—5] в изданиях рекомендованных ВАК для представления результатов кандидатских диссертаций (в скобках в числителе указан общий объем публикаций, в знаменателе - объем, принадлежащий лично автору). Основные результаты диссертации содержаться в работах [1-12], список которых приведен в конце автореферата.

Структура и объем диссертации. Диссертация состоит из введения, 3-х глав, заключения и 2-х приложений. Объем диссертации составляет 130 страниц, включая основное содержание, список литературы и приложения Список литературы содержит 94 наименования

2 Краткое содержание работы

Во введении обоснована актуальность проблемы создания сети библиографических баз данных и их объединения в рас-

пределенный электронный каталог. Обозначены основные проблемы, которые необходимо решить при создании распределенного электронного каталога Формулируются цель и задачи работы Сформулирован ключевой аспект всей работы в делом - распределенный электронный каталог рассматривается как распределенная информационная система

В первой главе анализируются подходы и технологии применяемые для постановки задачи построения распределенного электронного каталога Для организации распределенного электронного каталога рассмотрены централизованный и децентрализованный подходы Централизованный подход подразумевает создание выделенной службы для поиска и извлечения информации на основе создаваемого центрального индекса, который отражает содержимое всех баз данных находящихся в разных узлах сети Децентрализованный подход основан на возможности осуществления распределенного поиска на множестве баз данных. Приводится обоснование применения децентрализованного подхода для распределенного электронного каталога

Приведен анализ технических и технологических требований, предъявляемых к распределенным информационным системам, применительно к распределенному электронному каталогу На основе проведенного анализа показано, что технология на основе стандарта ANSI/NISO Z39 50-19954 (далее Z39 50) наиболее полно удовлетворяет этим требованиям. Сформулирована основная проблема применимости протокола Z39.50 для распределенных информационных систем, а также рассмотрены возможные пути ее решения А также, для распределенного электронного каталога сформулированы технические рекомендации, выполнение которых позволит эффективно выполнять распределенный поиск

Показано, что при создании приложений на основе протокола Z39 50 требуется преодолевать высокий технологический барьер, так как существует необходимость в взаимнооднозначном представлении передаваемых данных на различных платформах, создании специализированных средств для управления структурами данных и создании средств для пе-

4ANSI/NISO Z39 50-1995 Information Retneval (Z39 50) Application Service Définition and Protocol Spécification / Z39 50 Maintenance Agency Officiai Text for Z39 50-1995 - July 1995

редачи сообщений на основе стандартного коммуникационного стека протоколов TCP/IP Для снижения технологического барьера проанализирована технология на основе протокола SRU/SRW5, которая использует семантику протокола Z39.50, и основана на использовании XML-ориентированных технологий для управления структурами данных и протокола НТТР для их передачи Показано, что такая технология позволяет создавать приложения, применяя более универсальные и широко распространенные средства для решения задач поиска, извлечения и представления информации

Сформулирована проблема создания метаописаний баз данных При наличии множества баз данных появляется необходимость периодически отслеживать такие события, как перемещении баз данных по сети, изменение конфигураций баз данных, а так же в появлении новых баз данных Для решения задачи создания метаописаний баз данных конструктивно рассмотрены три подхода Z39 50 Explam6, Explam Lite7 и ZeeRex8 В работе приводится обоснование применения подхода на основе ZeeRex, который снимает выявленные недостатки остальных двух подходов Так для случаев Z39 50 Explam и Explam. Lite необходимая информация о базах данных может быть получена только субъектом протокола Z39 50, и только для тех базах данных, которые расположены на данном сервере. Подход ZeeRex наиболее полно удовлетворяет требованиям для распределенного электронного каталога, так как описания баз данных доступны для обработки не только клиентам протокола Z39.50, а также есть возможность создавать описания баз данных, которые расположены на различных серверах

Приводится обзор работ, в которых рассматриваются вопросы создания распределенного электронного каталога Ка-

5Search Retneve via URL (SRU) - протокол поиска и извлечения информации применяемый для поиска в Интернет с использованием языка запросов CQL (Common Query Language) Search Retneve Web Service (SRW) - является вариацией протокола SRU и использует метод передачи сообщений между клиентом и сервером в виде XML поверх протокола НТТР на основе рекомендаций S О АР консорциума W3C

6Z39 50 Explam является частью стандарта Z39 50-1995

7Расширение стандарта Z39 50-1995 для Explam, которое основано на представлении записей Explam в синтаксисе XML

8NISO Z39 92-200х Information Retrieval Service Description Spécification DRAFT STANDARD FOR TRAIL USE November 1, 2005 - October 31,2006

чественные особенности построения таких систем рассмотрены в работах О JI. Жижимова, Н А Мазова, А И Племне-ка, Н.В Соколовой, Р.Т Усманова Рассмотрены практические примеры распределенных электронных каталогов- Распределенная информационная система СО РАН, Распределенный электронный каталог БЕН РАН, Интернет-портал "Сиг-ла", Интернет-портал АРБИКОН, Интернет-служба общедоступных поисковых индексов "Open Content" Дана таблица для сравнения практических примеров распределенного каталога, которая показывает как та или иная система удовлетворяет требованиям для распределенных информационных систем, а также техническим рекомендациям для распределенного электронного каталога

В заключении к первой главе сформулированы результаты анализа существующих технологий, которые могут быть использованы для решения поставленных задач

Во второй главе развивается подход к построению распределенного каталога на основе технологии Z39.50. Объясняется, как автор решает основную проблему применимости протокола Z39 50 для удаленного доступа к распределенным по сети базам данных.

Для решения основной проблемы применимости протокола Z39 50, автором предложен подход на основе 3-х уровневой архитектуры распределенного электронного каталога Эта архитектура отличается от классической архитектуры построения приложений на основе протокола Z39 50, но применима без ущерба общности ее использования для субъектов протокола Z39.50 источник и приемник. В терминах модели клиент/сервер источник - это клиент, а приемник - это сервер 9 Предлагаемая архитектура основана на добавлении в классическое взаимодействие субъектов Z39 50 промежуточного уровня, который представлен в виде метапоисковой машины Метапоиск понимается здесь, как распределенный поиск, параллельный поиск, широковещательный поиск и используется для определения основной компоненты промежуточного

9 Применение специальных терминов для обозначения субъектов взаимодействия обусловлено тем, что существуют условия когда приемник может инициировать посылку сообщения к источнику (например стандартная задача Z39 50 Close), что выходит за рамки модели клиент/сервер

уровня в 3-х уровневой архитектуре.

Для предлагаемой 3-х уровневой архитектуры рассматривается модель метапоисковой машины, которая обладает следующими свойствами: выполняет роли источника и приемника для субъектов протокола Z39.50 одновременно; реализует асинхронный метод работы с одним или несколькими субъектами протокола 739.50, играющими роль приемника-, предоставляет возможность логической группировки множества приемников для произвольного источника. Перечисленные свойства позволяют реализовать единую точку доступа по протоколу г39.50 к распределенным информационным ресурсам без внесения дополнительных расширений для клиентов и серверов протокола 739.50.

ЕЕ [Щ •■■ ОЕП И

V_____/

С1

С2 | ■•■ | Сп

Б - сервер М - мета-сервер 6- шлюз С - клиент №13С - УУеЬ-клиенг

Рис. 1: 3-х уровневая архитектура распределенного электронного каталога на основе метапоисковой машины.

Для снижения технологического барьера применения протокола 239.50 в 3-х уровневой архитектуре показана применимость технологии основанной на стандартном протоколе 8Пи/8К\У. Поддержка этой технологии для метапоисковой машины, позволила наладить взаимодействие между клиентами Б1Ш/8К\¥ и сервис-провайдерами по протоколам £39.50, БКи/ЯКАУ. Как и в случае 739.50, метапоисковая машина с

введением поддержки протокола SRU/SRW приобретает дополнительные свойства выполняет роли клиента и сервера SRU/SRW, реализует асинхронный метод работы со множеством серверов, предлагает возможность логической группировки множества серверов для произвольного клиента.

Показано, что применение 3-х уровневой архитектуры на основе предлагаемой модели метапоисковой машины требует разрешения проблем связанных с выделенной сессией пользователя, однозначным преобразованием запросов и однозначным преобразованием извлекаемых записей Перечисленные проблемы решаются средствами метапоисковой машины, а именно - преобразование Z39 50 запросов в запросы SRU/SRW и наоборот, преобразование записей представленных не в XML-синтаксисе в XML и наоборот Выделенную пользовательскую сессию предложено не распространять на нижележащие сервера Z39 50 и SRU/SRW, а ограничиться ее существованием между клиентом и метапоисковой машиной

Для создания метаописаний баз данных используется технология ZeeRex Концепция этой технологии основывается на обмене записями, между клиентом и сервером, в схеме данных ZeeRex. Каждая запись ZeeRex содержит метаданные одной базы данных и в совокупности такие записи представляют собой мета базу данных, которая доступна для поиска и извлечения записей по протоколам Z39 50 и SRU/SRW По аналогии с Explain10, такая база данных имеет предопределенное название, что удобно для ее идентификации клиентом. Предложено поддерживать мета базу данных , содержащую записи ZeeRex всех баз данных распределенного электронного каталога, на одном из серверов Для поддержания в актуальном состоянии метаописаний баз данных используется программа-робот

В третей главе описывается реализация распределенного электронного каталога на основе программного обеспечения CUBA, которое включает в себя Z39 50 сервер, мета-сервер и* web-ориентированное клиентское приложение для доступа к распределенному электронному каталогу, а также программа агента для создания метаописаний баз данных.

Дано описание созданного программного обеспечения Разработана прикладная автоматизированная система для ведения распределенного электронного каталога библиотечно-

10 Имеется в виду стандартная служба Z39 50 Explain

го консорциума включающая в себя следующие компоненты:

• CUBA Z39 50 сервер Рассмотрены архитектура сервера и его функциональность Приведены основные характеристики сервера, в том числе выполнение требований соответствия профиля Z39.50 Показано функционирование сервера в составе распределенного электронного каталога, в том числе использование сервера для обеспечения сбора метаописаний баз данных.

• CUBA мета-сервер, на основе которого реализована ме-тапоисковая машина Рассмотрена архитектура и функциональность мета-сервера. Приведены основные характеристики мета-сервера. Дано описание применяемых расширений протокола SRU/SRW

• CUBA ОРАС Рассмотрена архитектура и функциональность ОРАС Приведены основные характеристики ОРАС Дано описание технологии представления информации, которая применима для широкого набора структурированных данных

• Агент - программа-робот ZeeRex. Рассмотрена функциональность робота и приведены его основные характеристики Показано функционирование робота на примере множества баз данных распределенного электронного каталога

Проведено экспериментальное исследование применительно к предлагаемым решениям с целью оценки их эффективности. Рассмотрены два теста производительности и эксперимент

Для оценки времени поиска информации в распределенном электронном каталоге были выполнены два теста производительности. Первый тест UNIQUE основан на том, что в систему, через равные интервалы времени посылались уникальные поисковые запросы. Второй тест REPEAT основан на том, что в систему посылались повторяемые поисковые запросы, которые извлекались из конечного списка случайным образом, так же как и в первом тесте через равные интервалы времени В результате тестирования были получены экспериментальные данные, которые позволяют оценить время поиска

и извлечения информации Для этого в работе приведены результаты обработки экспериментальных данных в виде графиков зависимости времени затраченного на выполнение запроса от порядкового номера запроса На основе полученных данных установлено, что время выполнения запросов на поиск и на извлечения записей, для уникальных поисковых запросов, примерно в 10 раз выше времени выполнения этих запросов для повторяемых поисковых запросов. А также установлено, что для большинства уникальных поисковых запросов время затраченное на поиск записей больше времени затраченного на извлечение записей, а в случае повторяемых поисковых запросов ситуация ровно наоборот

Повторное использование результирующего множества может повысить производительность поиска информации в распределенном электронном каталоге в 10 раз В реальных условиях, когда поисковые запросы вводятся различными пользователями, повторное использование результирующего множества встречается значительно меньше, чем это можно наблюдать в случае теста REPEAT Для получения ответа на вопрос о том как часто встречается повторное использование результирующего множества в распределенном электроном каталоге был проведен эксперимент, по результатам которого можно оценить эффективность применения кеширова-ния результирующих множеств на стороне мета-сервера Эксперимент был проведен на основе системы распределенного электронного каталога, которая состоит из web-приложения ОРАС, мета-сервера и 16 баз данных под управлением серверов Z39 50 расположенных в различных узлах сети. В такой системе все поисковые запросы пользователя поступают через web-приложение ОРАС и передаются мета-серверу, который в свою очередь выполняет распределенный поиск и слияние результатов поиска для выдачи пользователю. Для оценки числа результирующих множеств, которые повторно использовались при поиске информации в распределенном электронном каталоге, на стороне мета-сервера была собрана статистика их использования Необходимо отметить, что данные эксперимента были собраны за длительный промежуток времени (более 30 суток), который значительно больше времени простоя отдельного результирующего множества Это означает, что часть из рассмотренных результирующих множеств воссоздавались за-

ново, так как время простоя составляет 60 сек и о повторном использовании для таких результирующих множеств мы можем говорить только условно Этот эксперимент показал, что повторное использование результатов распределенного поиска встречается в 43% случаев. Это означает, что применение механизма кеширования результатов распределенного поиска в программном обеспечении позволяет существенно повысить среднее время затраченное на распределенный поиск

В заключении сформулированы основные результаты исследований по теме диссертации.

Приложение А Содержит список членов Томского регионального библиотечного консорциума

Приложение В Содержит листинг программы клиента протокола БИи для тестирования распределенного электронного каталога

3 Заключение

В диссертационной работе выполнен анализ перспективных подходов и технологий, применимых для сопряжения различных информационно-библиотечных систем в области поиска, извлечения и представления информации Сформулированы основные принципы организации функционирования информационно-библиотечных систем и информационных процессов для распределенного электронного каталога библиотечного консорциума (БК). Впервые сформулированы требования к распределенному электронному каталогу БК на базе известных требований к распределенным информационным системам. Предложено техническое обеспечение информационной системы и обоснование выбранной технологии на основе международного стандарта 239 50 для создания распределенного электронного каталога БК Сформулирована и решена основная проблема применимости протокола 739 50 к распределенному электронному каталогу БК Решена проблема оптимизации информационных процессов связанных с задачей обработки повторных запросов к распределенному электронному каталогу БК Решена проблема создания метаописаний баз данных распределенного электронного каталога БК для автоматического учета и контроля

Основные научные выводы и практические результаты заключаются в следующем.

1 Предложена модель метапоисковой машины для 3-х уровневой архитектуры распределенного электронного каталога библиотечного консорциума на основе протокола 239 50 Добавление промежуточного уровня для субъектов протокола 239 50 позволило решить проблему применимости протокола г39.50 для распределенного поиска Промежуточный уровень представлен в виде метапо-искового сервера, который выполняет асинхронный параллельный поиск информации с применением алгоритмов метапоиска на множестве распределенных в сети баз данных по протоколу 239 50

2 Разработана технология удаленного доступа к распределенному электронному каталогу, которая позволяет представить множество распределенных по сети баз данных в виде одной базы данных для пользователя Для снижения технологического барьера предложено использовать протокол 81Ш/81^, на основе которого функции поиска и извлечения информации распределенного электронного каталога доступны для клиентов широко распространенного протокола НТТР

3 Предложена технология создания метаописаний баз данных распределенного электронного каталога, которая основана на применении схемы данных ЕееЯех.

4 Для распределенного электронного каталога создано и конструктивно проработано программное обеспечение 239 50 сервер, мета-сервер, \теЬ-ориентированное приложение для доступа к распределенному электронному каталогу, программа-робот для создания метаописаний баз данных

Список литературы

1 Организация 239 50 ресурсов корпоративного объединения "Открытая электронная библиотека (ОЭБ) г. Томск"

/О .С Колобов, К Е Пачуев, Ф Е. Татарский // Научные и технические библиотеки / ГПНТБ России - М , 2004 - Вып 3-С 60-66

2. Представление тезауруса MeSH в формате RUSMARC посредством протокола Z39 50 / О С Колобов , Н А. Меше-чак, А. С Карауш // Научные и технические библиотеки / ГПНТБ России - 2005 - вып 1 - С 92-95

3 Модель комплексного доступа к медицинским информационным ресурсам / НА. Мешечак, О С Колобов, JI. А. Шамардина, М В Терехова // Научные л технические библиотеки / Государственная публичная научно- техническая библиотека России - 2006 - Вып 6 - С 72-75

4 Интеграция авторитетной базы данных "Медики Рос-сии"в электронный каталог НМБ СибГМУ / Н. А. Мешечак, О С. Колобов, J1 А Шамардина, А. С Карауш // Научные и технические библиотеки / Государственная публичная научно-техническая библиотека России. -2006.-Вып 7-С 52-56

5. Metasearch XML Gateway for Tomsk Scientific Center of SB RAS / I. Yu Turchanovsky, О S. Kolobov, F E Tatarsky // Вычислительные технологии - 2006 - T11, Ч 1 - 2006 -С 132-135.

6 Программное обеспечение Z39.50 корпоративного объединения "Открытая электронная библиотека г. Томска" / О С Колобов, К Е Пачуев, Ф Е Татарский // Библиотеки и ассоциации в меняющемся мире* новые технологии и новые формы сотрудничества- тр 8-й Междунар. конф "Крым 2001" - М ГПНТБ России, 2001. - Т. 2 - С 760763

7 Программное обеспечение Z39 50 корпоративного объединения "Открытая электронная библиотека (ОЭБ) г Томска" 2002 / К Е Пачуев О С. Колобов, Ф Е Татарский // Библиотеки и ассоциации в меняющемся мире новые технологии и новые формы сотрудничества, тр 9-й Междунар конф "Крым 2002" - М ГПНТБ России, 2002 -Т 2 - С 539-542

8 Техническая поддержка проекта "Электронная библиотека г Томска" /ОС Колобов // Библиотеки и ассоциации в меняющемся мире новые технологии и новые формы сотрудничества тр 9-й Междунар конф "Крым 2002" -М ГПНТБ России, 2002 - Т 2.- С 630-633.

9. Концептуальные основы организации Томского информационного библиотечного консорциума "Открытая электронная библиотека" / Ф Е. Татарский, К Е. Пачуев, О С. Колобов, Д. В Дробышевский // Библиотеки и ассоциации в меняющемся мире- новые технологии и новые формы сотрудничества тр. 10-й Междунар конф. "Крым 2003" - М ГПНТБ России, 2003 - Т 2. - С. 657-661

10 Технические особенности организации Томского консорциума "Открытая электронная библиотека" К Е Пачуев, Ф Е Татарский, О С Колобов // Библиотеки и ассоциации в меняющемся мире, новые технологии и новые формы сотрудничества тр 10-й Междунар конф. "Крым 2003" - М ГПНТБ России, 2003 - Т. 2 - С. 685-687

11 Широковещательный поиск-извлечение данных на основе протокола SRU как средство интеграции разнородных ресурсов / О. С Колобов Ф.Е. Татарский, И Ю Тур-чановский, Р Т. Усманов // Корпоративные библиотечные системы, технологии и инновации труды IV научно-практической конференции АРБИКОН, 2 июля - 7 июля 2006 года, Санкт-Петербург / АРБИКОН и др - СПб АРБИКОН, 2006

12. Применение протокола SRW/U на примере стандартных задач [Электронный ресурс] /ОС Колобов // Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса: доклады и тез докладов - М • ГПНТБ России, 2005 - 1 CD-ROM

Формат 60x84/16 Бумага офсет N1 Гарнитура Тайме Офсетная печать Печ л 1 Тираж 100 Заказ 285

Издательство СО РАН 630090, Новосибирск, Морской пр 2 Филиал "Гео" 630090, Новосибирск, пр Ак Коптюга, 3

Оглавление автор диссертации — кандидата технических наук Колобов, Олег Сергеевич

Введение

1 Анализ информационных систем и информационных технологий

1.1 Информационные процессы.

1.2 Поиск информации и информационные системы.

1.2.1 Информационные системы с автоматизированным анализом содержания

1.2.2 Библиотечно-информационные системы.

1.2.3 Распределенный электронный каталог.

1.2.4 Требования РИС и распределенный электронный каталог.

1.3 Информационные технологии для поиска информации *.

1.3.1 Форматы представления данных.

1.3.2 Протоколы поиска информации.

1.3.3 Распределенный поиск.

1.3.4 Метапоиск.

1.3.5 Метаданные баз данных.

1.4 Технические рекомендации для распределенного электронного каталога.

1.5 Примеры распределенных электронных каталогов.

1.5.1 Распределенная информационная система СО РАН.

1.5.2 Распределенный каталог БЕН РАН.

1.5.3 Сигла.

1.5.4 АРБИКОН.

1.5.5 Open Content.

1.5.6 Сравнение реализаций распределенного электронного каталога.

1.6 Выводы.

2 Развитие технологии построения распределенного электронного каталога библиотечного консорциума на основе протокола Z39.

2.1 Единая точка доступа к РЭКБК по протоколу Z39.

2.2 Основные компоненты и архитектура РЭКБК.

2.2.1 Сервер Z39.

2.2.2 Метапоисковая машина.

2.2.3 Мета база данных.

2.2.4 Архитектура РЭКБК.

2.3 Применение протокола SRU/SRW для единой точки доступа к РЭКБК.

2.4 Распределенный поиск.

2.5 Слияние результатов поиска.

2.5.1 Простое слияние на основе метода round-robin.

2.5.2 Слияние на основе метода borda-fuse.

2.6 Управление результирующим множеством.

2.7 Кеширование записей.

2.8 Создание метаданных баз данных.

2.9 Выводы.

3 Разработка распределенного электронного каталога библиотечного консорциума

3.1 Программное обеспечение.

3.1.1 Программная модель для Z39.50 и SRU/SRW приложений.

3.1.2 Сервер Z39.

3.1.3 Мета-сервер.

3.1.4 Web-ориентированное приложение ОРАС.

3.1.5 Программа-робот ZeeRex.

3.2 Тест производительности.

3.2.1 Тест производительности на основе уникальных поисковых запросов (UNIQUE)

3.2.2 Тест производительности на основе повторяемых поисковых запросов (REPEAT)

3.2.3 Сравнение результатов тестирования.

3.3 Эксперимент: повторное использование результирующих множеств.

3.4 Информационная система "Распределенный электронный каталог Томского регионального библиотечного консорциума".

3.4.1 Постановка задачи.

3.4.2 Основные компоненты.

3.4.3 Реализация поиска информации.

3.4.4 Представление данных в ОРАС.

3.4.5 Управление результирующим множеством

3.5 Выводы.

Введение 2007 год, диссертация по документальной информации, Колобов, Олег Сергеевич

Актуальность проблемы. В настоящее время информационно-библиографические ресурсы российских библиотек сосредоточены в библиографических, фактографических и полнотекстовых базах данных. Хронологический охват баз данных составляет более 25 лет, количественная оценка совокупного объема имеющихся баз данных составляет более 30 миллионов библиографических записей1. Для обеспечения удаленного доступа к подобным базам данных используется специализированные средства, чаще всего системы класса ОРАС2, которые адаптированы для конечного пользователя и ориентированы на работу с локальной библиотечно-информационной системой.

Базы данных создавались под управлением разнородных информационно-библиотечных систем и, как следствие, такие базы данных имеют различные средства для удаленного поиска, извлечения и представления библиографической информации. Начиная с 1999 года, наиболее активная часть российских библиотек, начала работу по объединению в библиотечные консорциумы по региональному признаку, а также по тематической направленности. Целью такого объединения является стремление обеспечить универсальный и простой доступ к библиографической информации независимо от используемых библиотечно-информационных систем.

1По данным Ассоциации Региональных Библиотечных Консорциумов (АРБИКОН) и Всероссийского института научной и технической информации (ВИНИТИ).

2 ОРАС - Online Public Access Catalog (англ.) - компьютеризированный он-лайн каталог материалов хранящихся в библиотеке.

В процессе создания библиотечного консорциума возникают реальные технические проблемы, связанные с необходимостью сопряжения различных информационно-библиотечных систем, разработки общих подходов для индексирования, поиска, извлечения и представления информации, а также связанные с созданием распределенной информационной системы, основанной на распределенном электронном каталоге. В связи с этим является актуальным исследование, направленное на разработку технологии создания и поддержки распределенного электронного каталога и организации удаленного доступа к нему. Особое значение для развития технологии создания распределенного электронного каталога имеют задачи поиска и извлечения информации в полнотекстовых базах данных, находящихся под управлением информационных систем класса цифровых депозитариев, которые ориентированы на совместное хранение полнотекстовых документов и их метаданных.

Цель диссертационной работы. Разработать технологию построения распределенного электронного каталога библиотечного консорциума на основе требований, предъявляемых к распределенным информационным системам.

Направление исследований. Реализация данной цели предполагает решение следующих задач:

1. Разработать модель распределенного электронного каталога на основе 3-х уровневой архитектуры;

2. Разработать технологию удаленного доступа к распределенному электронному каталогу для поиска, извлечения и представления информации;

3. Разработать технологию создания метаописаний баз данных для распределенного электронного каталога.

Методы исследований, достоверность и обоснованность результатов. В работе применялись эмпирические и теоретические методы исследования. Решения задач базировались на экспериментальных данных, полученных для параллельного поиска на множестве распределенных в сети базах данных, и известных теоретических положениях для распределенных информационных систем. При решении задач использованы международные и российские стандарты по поиску, извлечению, представлению и индексированию информации. Достоверность полученных результатов подтверждается промышленной эксплуатацией созданного программного обеспечения для распределенного электронного каталога, а также результатами исследований других авторов. Обоснованность полученных результатов подтверждается соответствием профилю применяемых стандартов.

На защиту выносятся:

• Модель метапоисковой машины для 3-х уровневой архитектуры распределенного электронного каталога библиотечного консорциума, которая обеспечивает выполнение распределенного поиска информации по протоколу Z39.50.

• Технология удаленного доступа к распределенному электронному каталогу по протоколу SRU/SRW.

• Технология создания метаописаний баз данных на основе стандартных сервисов для протоколов Z39.50 и SRU/SRW.

• Программное обеспечение: сервер Z39.50, мета-сервер, Web-ориентирование приложение для доступа к распределенному электронному каталогу, программа-робот для создания метаописаний баз данных. Для этого программного обеспечения выполнены требования соответствия профилю Z39.503. корпоративный профиль Ассоциации российских библиотечных консорциумов (АРБИКОН)

Научная новизна. На основе требований предъявляемых к распределенным информационным системам, впервые сформулированы требования к распределенному электронному каталогу библиотечного консорциума. Предложена модель метапоисковой машины для 3-х уровневой архитектуры распределенного электронного каталога, которая реализована в виде метапоискового сервера на основе стандартных протоколов поиска и извлечения информации. Разработан алгоритм объединения результатов параллельного поиска для метапоисковой машины. Создано расширение протокола SRU/SRW для поддержки необходимой функциональности со стороны метапоисковой машины. Предложена технология создания метаданных баз данных на основе стандартных сревисов протоколов Z39.50 и SRU/SRW.

Практическая значимость. На основе сформулированных требований построена распределенная информационная система, которая объединяет библиографические базы данных более 20 членов Томского библиотечного консорциума (см. Приложение А).

Реализация метапоисковой машины для 3-х уровневой архитектуры распределенного электронного каталога позволила объединить распределенные в сети библиографические базы данных и цифровые депозитарии консорциума в единую распределенную информационную систему -распределенный электронный каталог на основе протокола Z39.50.

Созданный распределенный электронный каталог доступен для удаленного поиска и извлечения информации через единую точку доступа по протоколу SRU/SRW, которая реализована на основе метапоисковой машины.

Создано программное обеспечение для организации служб протокола Z39.50 членов библиотечного консорциума: сервер Z39.50, метапоисковый сервер для протоколов Z39.50 и SRU/SRW, webМориентированное клиентское приложение, функционирующие на основе протокола SRU/SRW. А также программное обеспечение для создания метаданных баз данных на основе стандартных сервисов протоколов Z39.50, SRU/SRW.

Апробация работы. Результаты по теме диссертации получены в ходе выполнения хоздоговорных и инновационных работ по созданию библиотечного консорциума.

По теме диссертации были сделаны сообщения и доклады на научно-практических конференциях: "Крым" (Международная конференция "Библиотеки и ассоциации в меняющемся мире", Судак, 2000-2006 гг.), "LIBCOM" ("Информационные технологии, компьютерные системы и издательская продукция для библиотек", г. Ершово, 2001-2004 гг.), 25 Library Systems Seminar EL AG (г. Прага, 2001), EL-PUB (рабочие совещание, конференция по электронным библиотекам, г. Новосибирск, 2004, 2005 гг.), INVIROMIS (г. Томск, 2006).

Личный вклад автора. Работы по теме диссертации выполнены в Томском политехническом университете (ТПУ) и в Институте сильноточной электроники (ИСЭ) СО РАН автором совместно с: аспирантами кафедры "Прикладной математики" факультета автоматики и вычислительной техники ТПУ - Пачуевым К. Е. и Татарским Ф. Е.; сотрудниками Научной медицинской библиотеки Сибирского государственного медицинского университета - Мешечак Н. А., Шамардиной JI. А.; сотрудником Муниципальной библиотечной системы г. Томска - Караушем А. С. Работа выполнялась в рамках хоздоговорных работ и проектов - "Открытая электронная библиотека", "Открытая электронная медицинская библиотека" при поддержке грантов Института "Открытое общество".

Все результаты, включенные в диссертацию, получены автором лично или в неделимом соавторстве. Автором совместно с Татарским Ф.Е. и Пачуевым К.Е. было разработано следующее программное обеспечение:

• Сервер Z39.50 (CUBA Z39.50-cepBep, Колобов O.C.);

• Метапоисковый сервер для протоколов Z39.50 и SRU/SRW (CUBA мета-сервер, Колобов О.С.);

• Web-ориентированный клиент на основе протокола SRU/SRW (CUBA-OPAC, Колобов О.С., Пачуев Ф.Е.);

• Программа-робот для создания метаданных баз данных (Колобов О.С., Пачуев К.Е., Татарский Ф.Е.);

Публикации. Основные материалы диссертации изложены в 12 публикациях [3-14].

Заключение диссертация на тему "Исследование принципов организации, функционирования и разработка распределенного электронного каталога библиотечного консорциума"

3.5 Выводы

1. Для распределенного электронного каталога библиотечного консорциума создано программное обеспечение: Z39.50 сервер, мета-сервер, web-ориентированное приложение для удаленного доступа к распределенному электронному каталогу, программа-робот для создания метаописаний баз данных.

2. Выполнено тестирование производительности программного обеспечения в отношении поиска информации в распределенных по Сети базах данных. Результаты тестирования показали, что в общем случае время, затраченное на распределенный поиск записей в два раза выше времени затраченного на извлечение записей. Также результаты тестирования показали, что повторное использование результатов распределенного поиска повышает производительность поиска информации в 10 раз.

3. На основе прототипа распределенного электронного каталога был выполнен эксперимент, который показал, что повторное использование результатов распределенного поиска встречается в 43% случаев. Это означает, что применение механизма кеширования результатов распределенного поиска в программном обеспечении позволяет существенно снизить среднее время затраченное на распределенный поиск.

4. На основе созданного программного обеспечения реализована распределенная информационно-библиотечная система Томского регионального библиотечного консорциума в виде распределенного электронного каталога. На примере этой практической реализации показана эффективность применения 3-х уровневой архитектуры на основе метапоисковой машины.

Заключение

В диссертационной работе выполнен анализ перспективных подходов и технологий, применяемых для сопряжения различных информационно-библиотечных систем в области поиска, извлечения и представления информации. Сформулированы основные принципы организации, функционирования распределенного электронного каталога библиотечного консорциума (БК). Впервые сформулированы требования к распределенному электронному каталогу БК на базе известных требований к распределенным информационным системам. Предложено техническое обеспечение информационной системы и обоснование выбранной технологии на основе международного стандарта Z39.50 для создания распределенного электронного каталога БК. Сформулирована и решена основная проблема применимости протокола Z39.50 к распределенному электронному каталогу БК. Решена проблема оптимизации информационных процессов, связанных с задачей обработки повторных запросов к распределенному электронному каталогу БК. Решена проблема создания метаописаний баз данных распределенного электронного каталога БК для их автоматического учета и контроля.

Основные научные выводы и практические результаты:

1. Предложена модель метапоисковой машины для 3-х уровневой архитектуры распределенного электронного каталога библиотечного консорциума на основе протокола Z39.50. Добавление промежуточного уровня для субъектов протокола Z39.50 позволило решить проблему применимости протокола Z39.50 для распределенного поиска. Промежуточный уровень представлен в виде метапоискового сервера, который выполняет асинхронный параллельный поиск информации с применением алгоритмов метапоиска на множестве распределенных в Сети баз данных по протоколу Z39.50.

2. Разработана технология удаленного доступа к распределенному электронному каталогу, которая позволяет представить множество распределенных по Сети баз данных в виде одной базы данных для пользователя. Для снижения технологического барьера предложено использовать протокол SRU/SRW, на основе которого функции поиска и извлечения информации распределенного электронного каталога доступны для клиентов широко распространенного протокола HTTP.

3. Предложена технология создания метаописаний баз данных распределенного электронного каталога, которая основана на применении схемы данных ZeeRex.

4. Для распределенного электронного каталога создано программное обеспечение: Z39.50 сервер, мета-сервер, Web-ориентированное приложение для доступа к распределенному электронному каталогу, программа-робот для создания метаописаний баз данных.

Библиография Колобов, Олег Сергеевич, диссертация по теме Информационные системы и процессы, правовые аспекты информатики

1. Сэлтон Г. Автоматическая обработка, хранение и поиск информации / Г. Сэлтон. - М.:Советское радио, 1973. - 560с.: ил., табл.

2. Жижимов O.JI. Принципы построения распределенных информационных систем на основе протокола Z39.50 / O.JI. Жижимов, Н.А. Мазов ; ОИГГМ СО РАН. Новосибирск: изд-во ИВТ СО РАН, 2004. - 361с.: ил., табл.

3. Колобов О. С. Организация Z39.50 ресурсов корпоративного объединения "Открытая электронная библиотека (ОЭБ) г. Томск" / О. С. Колобов, К. Е. Пачуев, Ф. Е. Татарский // Научные и технические библиотеки / ГПНТБ России. 2004. - Вып. 3. - С. 60-66.

4. Колобов О. С. Представление тезауруса MeSH в формате RUSMARC посредством протокола Z39.50 / О. С. Колобов , Н. А. Мешечак, А. С. Карауш // Научные и технические библиотеки / ГПНТБ России. 2005. - Вып 1. - С. 92-95.

5. Модель комплексного доступа к медицинским информационным ресурсам / Н. А. Мешечак, О. С. Колобов, JI. А. Шамардина, М.

6. В. Терехова // Научные и технические библиотеки / ГПНТБ России. 2006. - Вып. 6 . - С. 72-75.

7. Turchanovsky I. Yu. Metasearch XML Gateway for Tomsk Scientific Center of SB RAS / I. Yu. Turchanovsky, O. S. Kolobov, F. E. Tatarsky // Вычислительные технологии 2006. - T.ll, 4.1 - 2006.- С. 132-135.

8. Интегрированная библиотечно-информационная система ИРБИС Электрон, ресурс. Режим доступа: http://www.elnit.org/irbis/irbis.html

9. Открытые библиотечные системы АБИС "Руслан" Электрон, ресурс. - РежимflOCTyna:http: //obs.ruslan.ru/?product:systemdescription

10. Visionary Technology in Library Solutions^eKTpoH. ресурс. -Режим доступа: http://www.vtls.com/Products/virtua.shtml

11. Salton G. The SMART automatic document retrieval systems an illustration / G. Salton, M. E. Lesk // Commun. ACM. - 1965. - Vol. 8, N 6. - P. 391-398.

12. Российский семинар по Оценке Методов Информационного Поиска Электрон, ресурс. Режим доступа: http://romip.narod.ru/

13. Google Electronic, resource. Mode of access: http://www.google.ru/]

14. MARC STANDARDS Electronic, resource. Mode of access: http://www.loc.gov/marc/]

15. CDS/ISIS database software: UNESCO-CI Electronic, resource. -Mode of access: http://portal.unesco.org/ci/en/ev.php-URLID=2071&URLDO=DOTOPIC &URLSECTION=201.html

16. ONIX for Books Electronic, resource. Mode of access: http://www.editeur.org/onbc.html

17. Dublin Core Metadata Element Set, Version 1.1: Reference Description Electronic, resource. Mode of access:http: / / dublincore.org/documents / dees/

18. MODS Electronic, resource., Mode of access: http://www.loc.gov/standards/mods /

19. Metadata Authority Description Schema (MADS)Electronic, resource. Mode of access: http://www.loc.gov/standards/mads/

20. UNIMARC Manual: Bibliographic Format 1994 IFLA Universal Bibliographic Control and International MARC Core Programme (UBCIM) Electronic, resource. - Mode of access:http: / /www.ifla.org/VI/3/pl996-l / sec-uni.htm

21. Российский коммуникативный формат. Указатель Электрон, ресурс. Режим доступа: http://www.rba.ru/rusmarc/]

22. Extensible Markup Language (XML)Electronic, resource. Mode of access: http://www.w3.org

23. MARC 21 XML SchemaElectronic. resource. Mode of access: http://www.loc.gov/standards/marcxml /

24. W3C HTML Electronic, resource. Mode of access: http://www.w3.org/html/]

25. XHTML2 Working Group Home Page Electronic, resource., Mode of access: http://www.w3.org/MarkUp/]

26. International Standard Book Number Electronic, resource., Mode of access: http://en.wikipedia.org/wiki/Wikipedia:ISBN]

27. International Standard Serial Number Electronic, resource. Mode of access:http://en.wikipedia.org/wiki/InternationalStandardSerialNumber.

28. Uniform Resource Locators Electronic, resource. Mode of access: http://www.w3.org/Addressing/URL/0verview.html]

29. Digital object identifier Electronic, resource. Mode of access: http://en.wikipedia.org/wiki/Digitalobjectidentifier]

30. DC-Library Application Profile (DC-Lib)Electronic, resource. Mode of access:http://dublincore.org/documents/library-application-profile/.

31. ANSI/NISO Z39.50-1995. Information Retrieval (Z39.50): Application Service Definition and Protocol Specification / Z39.50 Maintenance Agency Offical Text for Z39.50-1995. July 1995.

32. Registry of Z39.50 Object Identifiers Electronic, resource. Mode of access: http://www.loc.gov/z3950/agency/defns/oids.html]

33. N1 SO National Information Standards Organization Electronic, resource. - Mode of access: http://www.niso.org/]

34. ISO 23950: Information and documentation. Information retrieval (Z39.50). Application service definition and protocol Specification. -1998.

35. Z39.50: Bib-1 Electronic, resource. Mode of access: http://www.biblio-tech.com/html/z3950bib-l.html]

36. Z39.50 ASN.l Electronic, resource. Mode of access: http://www.loc.gov/z3950/agency/revision/asnl.pdf]

37. Schneider W. A Distributed Library Information System on the Basis of the Z39.50 Protocol Electronic, resource. / W. Schneider // Berlin University of Technology. 1999. - Mode of access: http://wolfram.schneider.org/lv/diplom/index-en.html

38. HTTP Hypertext Transfer Protocol Overview Electronic, resource. -Mode of access: http://www.w3.org/Protocols/]

39. ZING Z39.50 International: Next Generation Home (Library of Congress) Electronic, resource. - Mode of access: http://www.loc.gov/z3950/agency/zing/]

40. SRU (Search/Retrieve via URL) Electronic, resource. Mode of access: http://www.loc.gov/standards/sru/]

41. Simple Object Access Protocol (SOAP) 1.1 Electronic, resource. -Mode of access: http://www.w3.org/TR/soap/]

42. CQL: Common Query Language; http://zing.z3950.org/cql/.

43. Aslam A. Models for Metasearch / A. Aslam, J. Montague, M. Montague // ACM SIGIR-01. 2001. - P. 276-284.

44. Thompson P. A combination of expert opinion approach to probabilistic information retrieval, part 1: the conceptual model / P. Thompson // Information Processing and Management. 1990. - Vol. 26, N 3. -P. 371-382.

45. Thompson P. A combination of expert opinion approach to probabilistic information retrieval, part 2: mathematical treatment of CEO model 3 / P. Thompson // Information Processing and Management. 1990. - Vol. 26, N 3. - P. 383-394.

46. ONE-2 Project Electronic, resource. Mode of access: http:/ /www.one-2.org

47. Z39.50 Part 7 Explain Facility / Z39.50 Maintenance Agency, 1995 Electronic, resource. Mode of access:http: //www.loc.gov/z3950/ agency/markup/07.html

48. Explain Lite / Rob Bull, 2001 Electronic, resource., Mode of access: http: //www.one-2.org/exp-lite]

49. ZeeRex: The Explainable "Explain" Service / Mike Taylor, 2002 Electronic, resource. Mode of access: http://explain.z3950.org]

50. NISO Z39.92-200x. Information Retrieval Service Description Specification. DRAFT STANDARD FOR TRAIL USE: November 1, 2005 October 31, 2006.

51. ISO Metasearch Initiative Metasearch XML Gateway Implementation Guide version 0.3 Electronic, resource. - Mode of access: http://www.niso.org/standards/resources/MI-MXGv03.pdf]

52. Ray Denenberg. Metasearch and SRU: MXG, the Metasearch XML Gateway Electronic, resource. Mode of access:http://www.loc.gov/standards / sru / march06-meeting/mxg.ppt.

53. An Overview of ZeeRex Electronic, resource. Mode of access: http://explain.z3950.org/overview/index.html]

54. Распределенная информационная система CO РАН Электрон, ресурс. Режим доступа: http://z3950.nsc.ru:210/

55. WEB сервер ZooPARK Electronic, resource. Mode of access: http://z3950.uiggm.nsc.ru:210/index.htm]

56. БЕН РАН. Распределенный каталог (Z39.50) Электрон, ресурс. -Режим доступа: http://www.benran.ru/Zgw/

57. Сигла Поиск Электрон, ресурс. - Режим доступа: http://www.sigla.ru

58. АРБИКОН Электрон, ресурс. Режим доступа: http://www.arbicon.ru/

59. Корпоративный профиль АРБИКОН Электрон, ресурс. Режим доступа: http://www.arbicon.ru/downloads/html/arliconprofile.html

60. Племнек А. И. Использование протоколов Z39.50 и HTTP в современных библиотечных информационных системах / А. И.

61. Племнек, Р.Т. Усманов, Д. Н. Сова // Информационный бюллетень РБА. 1998. -N 12. - С. 240-257.

62. Review of Z39.50 servers and Z39.50 environment in Russia / V. Baranov, A. Plemnek, N. Sokolova et al. // Library Hi Tech. 2000. -Vol. 18, N 4. - P. 304-314.

63. Хохлов А.Ю. Организация адаптивного распределенного поиска по библиотечным каталогам с использованием протокола Z39.50 Электрон, ресурс. / А.Ю. Хохлов

64. Электронные библиотеки. 2003. - Т. 6, Вып. 2. - Режим доступа: http://www.elbib.ru/index.phtml?page=elbib/rus/journal/2003/part2/xoxla

65. Wikipedia Electronic, resource. Mode of access: http://www.wikipedia.org/]

66. MasterKey Electronic, resource. Mode of access: http://www.indexdata.dk/masterkey/]

67. MetaProxy Electronic, resource. Mode of access: http://www.indexdata.dk/metaproxy/]

68. IRSpy Electronic, resource. Mode of access: http://irspy.indexdata.com/]

69. OpenContent Electronic, resource. Mode of access: http://www.indexdata.dk/opencontent/]

70. The Bath Profile: An International Z39.50 Specification for Library Applications and Resource Discovery; Version 1.1; June 2000 Electronic, resource. Mode of access:http://www.collectionscanada.ca/bath/bp-current.htm.

71. The Bath Profile: An International Z39.50 Specification for Library Applications and Resource Discovery; Release 2.0; Internationally

72. Registered Profile ISO TC 46 SC 4, February 2004 Electronic, resource. Mode of access:http://www.collectionscanada.ca/bath/tp-bath2-e.htm.

73. MARCXML Electronic, resource. Mode of access: http: / / www.loc.gov/standards / marcxml/]

74. MODS Electronic, resource. Mode of access: http: / / www.loc.gov/ standards / mods /

75. Dublin Core (DC) Electronic, resource. Mode of access: http://www.dublincore.org

76. Extended Service Z39.50 Electronic, resource. Mode of access: http: / / www.loc.gov/ z3950/agency/markup / 06.html

77. Basic Encoding Rules (BER) Electronic, resource. Mode of access: http://asnl.elibel.tm.fr/introduction/index.htm

78. ASN.l Electronic, resource. Mode of access: http://asnl.elibel.tm.fr/introduction/index.htm

79. Prefix Query Format (PQF) Electronic, resource. Mode of access: http://www.indexdata.dk/yaz/doc/tools.tkl#PQF

80. YAZ Electronic, resource. Mode of access: http://www.indexdata.dk/yaz/

81. Secure Sockets Layer (SSL) Electronic, resource. Mode of access: http://en. wikipedia.org/wiki / Ssl

82. Zebra Electronic, resource. Mode of access: http://www.indexdata.dk/zebra/

83. Indexed Sequential Access Method (ISAM); http://en.wikipedia.org/wiki/ISAM.

84. Perl Electronic, resource. Mode of access: http://perl.org

85. Tool Command Language (TCL) Electronic, resource. Mode of access: http://en.wikipedia.org/wiki/Tcl

86. Character Set and Language Negotiation (3) Electronic, resource. -Mode of access:http://www.loc.gov/z3950/agency/defns/charneg-3.html

87. SOAP::Lite for Perl Electronic, resource. Mode of access: http://www.soaplite.com/

88. Web Services Description Language (WSDL) 1.1 Electronic, resource. Mode of access: http://www.w3.org/TR/wsdl

89. Apache AxKit Electronic, resource. Mode of access: http://axkit.org

90. XSL Transformations (XSLT) Electronic, resource. Mode of access: http://www.w3.org/TR/xslt