автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Создание и применение в библиотечной практике корпоративной технологии на базе протокола Z39/50
Автореферат диссертации по теме "Создание и применение в библиотечной практике корпоративной технологии на базе протокола Z39/50"
На правах рукописи
КИРИЛЛ АНАТОЛЬЕВИЧ КОЛОСОВ
СОЗДАНИЕ И ПРИМЕНЕНИЕ В БИБЛИОТЕЧНОЙ ПРАКТИКЕ КОРПОРАТИВНОЙ ТЕХНОЛОГИИ НА БАЗЕ ПРОТОКОЛА г39.50
Специальность 05 25 05 Информационные системы и процессы, правовые аспекты информатики
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Москва 2008
003167933
003167933
Работа выполнена на кафедре информационных технологий и электронных библиотек Федерального государственного образовательного учреждения высшего профессионального образования «Московский государственный университет культуры и искусств»
Научный руководитель
Официальные оппоненты
кандидат технических наук, профессор Феликс Семенович Воройский Федеральное государственное учреждение «Государственная публичная научно-техническая библиотека России»
доктор технических наук, профессор Александр Борисович Антопольский
Федеральное государственное образовательное учреждение высшего профессионального образования «Московский государственный университет культуры и искусств»
доктор технических наук, профессор Борис Степанович Елепов Научно-исследовательское учреждение «Государственная публичная научно-техническая библиотека Сибирского отделения Российской академии наук»
Ведущая организация:
Всероссийский институт научной и технической информации РАН
(ВИНИТИ РАН)
Защита диссертации состоится 30 мая 2008 года в 11 часов на заседании диссертационного совета Д 210 010 01 при Федеральном государственном образовательном учреждении высшего профессионального образования «Московский государственный университет культуры и искусств» по адресу 141406, Московская обл, г Химки-6, ул Библиотечная, д 7, ауд 218
С диссертацией можно ознакомиться в научной библиотеке Московского государственного университета культуры и искусств
Автореферат разослан « 11 » апреля 2008 г
Ученый секретарь
диссертационного совета _____ В Т Клапиюк
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследования. Интенсивное развитие информационных и телекоммуникационных технологий и открытых стандартов явилось технологической основой создания библиотечных корпораций, широкое распространение которых происходит во всем мире в последнее десятилетие Для читателей библиотечные корпорации предоставляют такие новые возможности, как поиск в виртуальном сводном каталоге, объединяющем информационные ресурсы участников корпорации, доступ к полнотекстовым документам из виртуального сводного каталога, заказ оцифрованных документов через службу электронной доставки, доступ к подписным базам данных и полнотекстовым изданиям, получаемым на основе корпоративного комплектования Для сотрудников библиотек корпоративные технологии дают возможности сократить рутинные операций и существенно снизить трудоемкость и затраты за счет использования технологии каталогизации путем заимствования записей
Современные технические решения позволяют любой крупной библиотеке создавать и поддерживать собственные порталы, использующие доступ к ресурсам библиотечных корпораций на основе протокола Z39 50, с целью более полного удовлетворения запросов поиска и получения информации для своей читательской аудитории и обеспечивающие передачу поисковых запросов в интерактивном режиме к любому числу серверов В зависимости от профиля библиотеки и назначения поискового портала число каталогов, входящих в виртуальный сводный каталог, может составлять от нескольких десятков до нескольких сотен Несмотря на очевидные преимущества распределенной информационной системы, время обработки поисковых запросов в ней может существенно превышать значения, получаемые при поиске в системах, использующих предварительную индексацию документов, - таких, как поисковые Инернет-порталы (Yandex, Google и т п ) Это обстоятельство создает ситуацию, когда задержки при обработке поисковых запросов, а также значительный объем информации при поиске по большому числу источников, препятствуют полноценному использованию корпоративных библиотечных порталов
Начавшийся поиск путей решения этой проблемы привел к идее создания целевых поисковых групп, сужающих охват информационных источников на основе тематических и географических критериев Такие решения реализованы, в частности, на портале Ассоциации российских библиотечных консорциумов (АРБИКОН)
Однако большинство поисковых порталов библиотечных корпораций, использующих решения на основе протокола Z39 50, не в полной мере используют его функциональные возможности, обеспечивающие параллельность обработки пользовательских запросов и представления результатов поиска, что приводит к возникновению значительных временных задержек при поиске по большому числу информационных источников
В связи с этим возникла потребность на базе портала корпоративной сети московских библиотек исследовать причины возникновения задержек при поиске по группе серверов Z39 50 и предложить программные и технологические решения, повышающие производительность поиска в корпоративных библиотечных сетях, что является актуальной научной и технической задачей
Одним из перспективных направлений развития корпоративных библиотечных порталов является интеграция поиска по электронным каталогам и полнотекстовым коллекциям документов Технические решения для поддержки такого комбинированного поиска, используемые, в частности, в проекте Европейской библиотеки (TEL), базируются на протоколе SRU, являющемся дальнейшим развитием протокола Z39 50 и позволяющем проводить поиск и по электронным коллекциям, поддерживающим технологию OAI-PMH
Однако значительное число российских библиотек, в том числе вузовских, в течение ряда лет используют программные решения ИРБИС для создания электронных каталогов полнотекстовых ресурсов Данные решения в сочетании с решениями системы автоматизации библиотек ИРБИС для поиска по массивам полнотекстовых документов образуют техническую среду для создания электронных библиотек Использование корпоративных технологий на основе протокола Z39 50 позволяет расширить число подключаемых информационных источников и повысить эффективность обработки поисковых запросов пользователей при работе с электронными библиотеками, использующими программные решения ИРБИС Таким образом, возникает потребность исследовать теоретические и практические аспекты создания и применения в библиотечной практике корпоративной технологии на базе протокола Z39 50 с целью дальнейшего ее совершенствования, что является актуальной научной и технической задачей
Разработанность темы исследования. Использование протокола Z39 50 в библиотечных корпорациях за последние несколько лет стало повседневной практикой, вопросы повышения эффективности технических
решений на основе этого протокола постоянно обсуждаются в специальной литературе и на различных российских и международных конференциях
Широкий комплекс вопросов проектирования корпоративных библиотечных систем был подробно рассмотрен в трудах ЯЛ Шрайберга, Ф С Воройского Вопросы использования протокола Z39 50 при разработке и реализации библиотечных Интернет-комплексов подробно исследованы в работах М В Гончарова Теоретические и технические аспекты построения распределенных информационных систем на основе протокола Z39 50 рассмотрены в трудах О JI Жижимова, в том числе в его докторской диссертации Вопросы построения распределенных информационных систем на основе СУБД CDS/ISIS и технологии Z39 50 изучались в работах Н А Мазова Проблемы создания распределенного электронного каталога библиотечного консорциума, использующего протокол Z39 50 для поиска информации, рассматривались в работах О С Колобова
Отдельные проблемы, касающиеся оптимизации обработки поисковых запросов в информационной системе, состоящей из шлюза HTTP-Z39 50 и группы серверов корпоративной библиотечной сети, уже были рассмотрены в научной литературе Так, в работах О JI Жижимова изучались вопросы оптимизации задержек при обработке запросов с использованием провайдера удаленного доступа сервера ZooPARK и уменьшения числа одновременных сеансов взаимодействия между клиентом и сервером Вопросы использования многопоточности при обработке поисковых запросов в информационной среде, состоящей из шлюза HTTP-Z39 50 и группы серверов Z39 50, рассматривались в работах А Ю Хохлова и впервые в российской практике были решены в разработанном им портале СИГЛА Использование мониторинга серверов Z39 50 с целью исключения неактивных серверов при обработке широковещательных поисковых запросов было предложено в работах Р Т Усманова и А А Кузнецова и реализовано в рабочей версии портала АРБИКОН
Однако до настоящего времени не проводилось комплексного исследования информационной системы, состоящей из шлюза HTTP-Z39 50 и группы серверов Z39 50 корпоративной библиотечной сети, с целью разработки комплекса технических решений, повышающих производительность поиска Кроме того, не исследовались вопросы создания типового решения электронной библиотеки вуза с использованием программных решений ИРБИС и шлюза HTTP-Z39 50 Данная диссертация предполагает восполнить этот пробел.
Объектом исследования является теория и практика программных и технических решений на основе протокола 239 50 с позиции эффективности их использования при обслуживании пользователей информационных ресурсов корпоративных библиотечных систем
Предмет исследования: способы оптимизации программно-технических средств обработки поисковых запросов в корпоративных библиотечных сетях, использующих протокол Z39 50
Цель исследования: выявление и анализ совокупности причин увеличения временных задержек при поиске по большому числу серверов 239 50 в библиотечной корпорации, а также определение путей повышения эффективности обработки поисковых запросов пользователей, в том числе при создании электронных библиотек вузов на основе программных решений ИРБИС и шлюза НТТР-239 50
Поставленная цель достигается путем решения следующих задач:
анализ программно-технических решений реализации корпоративных библиотечных порталов и выявление основных факторов, влияющие на временные задержки при обработке поисковых запросов пользователей,
разработка и анализ математической модели обработки поисковых запросов в системе, состоящей из шлюза НТТР-239 50 и группы серверов,
- разработка обобщенных алгоритмов передачи поискового запроса серверам корпоративной сети и представления результатов на поисковом портале,
- разработка типового решения портала электронной библиотеки на основе использования технологии ЪЪ9 50 и программных решений ИРБИС с возможностями интегрированного поиска по электронному каталогу библиографических описаний и массиву полнотекстовых документов
Методологической основой исследования явились положения, изложенные в трудах по основным принципам разработки и эксплуатации автоматизированных библиотечно-информационных систем библиотек Я Л Шрайберга, Ф С Воройского, Б И Маршака, М В Гончарова, А И Бродовского, разработки в области информатики, в частности - по созданию информационных систем и баз данных Дж Мартина, проектирования и эксплуатации региональных информационных систем и использования информационных ресурсов Н Е Каленова Существенной методологи-
ческой опорой для проведения исследования в области корпоративных сетей, использующих протокол 239 50, стали положения, изложенные в работах О Л Жижимова, Н А Мазова, А И Племнека
Ввиду комплексного характера исследования в качестве инструментария для его проведения использовались метод сравнительного анализа, моделирование, анкетирование, инженерные методы анализа и синтеза информационных систем, положения теории систем и сетей массового обслуживания
Научная новизна. В результате анализа технологических решений современных российских библиотечных корпораций, использующих протокол г39 50, в настоящей работе выявлены основные факторы, влияющие на эффективность обработки поисковых запросов пользователей Разработана математическая модель обработки поисковых запросов в корпоративной сети, позволяющая повысить функциональные характеристики корпоративного портала Предложено типовое решение для портала электронной библиотеки вуза на основе шлюза НТТР-239 50 Определен новый подход к интеграции поиска по электронному каталогу библиографических описаний и массиву полнотекстовых документов с использованием провайдера данных 239 50 для полнотекстового модуля АБИС ИРБИС
На защиту выносятся следующие основные положения:
1 Шлюз НТТР-239 50 должен обеспечивать обработку поисковых запросов пользователей библиотечной корпорации с минимальными задержками
2 Решение задачи повышения характеристик порталов на основе шлюзов НТТР-239 50 может быть достигнуто за счет обеспечения фонового мониторинга библиотечной корпоративной сети с целью выявления неактивных серверов, а также с помощью навигации и уточнения поисковых запросов в пользовательском интерфейсе портала
3 Предложенная автором математическая модель обработки поискового запроса библиотечной корпоративной сети на основе шлюза 239 50 позволяет сделать следующие выводы
- функциональные возможности поискового портала на основе шлюза НТТР-239 50 могут быть существенно улучшены при исключении неактивных серверов из числа опрашиваемых,
- при большом числе заданий в системе возрастают требования к производительности центрального узла - шлюза НТТР-239 50
4 Электронная библиотека вуза, созданная на основе шлюза НТТР-г39 50 и программных решений ИРБИС, обеспечивает интегрированный поиск по электронным каталогам и полнотекстовым массивам документов
5 Порталы КСМБ и «Электронная библиотека МГУКИ» целесообразно строить на основе предложенных автором технических решений, использующих результаты исследования шлюза НТТР-239 50 и сервера 232/264
Теоретическая значимость исследования состоит в развитии концепции создания поисковых порталов библиотечных корпораций, использующих технологию 239 50, а также в определении технологических и организационных принципов их дальнейшего расширения для создания электронных библиотек
Практическая значимость и реализация результатов исследования заключаются в создании программного комплекса, состоящего из шлюза НТТР-239 50 и сервера 232/264, входящего в состав АБИС ИРБИС, который используется для создания корпоративных библиотечных систем, в том числе и в Корпоративной сети московских библиотек, а также для создания электронных библиотек вузов, в частности, для пилотной версии электронной библиотеки МГУКИ
Апробация результатов проходила в ГПНТБ России Разработанное программное обеспечение используется в составе АБИС ИРБИС, что подтверждено свидетельством об официальной регистрации, выданным Федеральной службой по интеллектуальной собственности, патентам и товарным знакам Кроме того, результаты исследования реально используются в Корпоративной сети московских библиотек, ГПНТБ России, ВГБИЛ им М И Рудомино Основные положения диссертации изложены в 14 публикациях, в том числе в монографии (совместно с М В Гончаровым), неоднократно докладывались на международных конференциях «Крым» и ЛИБКОМ
Достоверность результатов исследования обусловлена использованием теоретических и эмпирических методов, адекватных целям и задачам исследования, апробацией идей диссертационного исследования на практике, на различных научных конференциях
ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ
Поставленные научные задачи обусловили следующую структуру диссертации работа состоит из введения, трех глав, заключения, списка литературы и приложений
Первая глава «Протокол 239.50. история создания, область и опыт использования» посвящена рассмотрению возможностей использования протокола 239 50 в библиотеках и библиотечных корпорациях, анализу современных тенденций развития программных решений на основе этого протокола, выявлению ряда проблем, связанных с неполной совместимостью серверов, а также причин временных задержек при поиске по группе серверов 239 50
В первом разделе первой главы «История появления и области использования протокола 239 50» рассмотрены причины, обусловившие использование протокола г39 50 при создании библиотечных корпораций, описаны возможности современных версий этого протокола, приведены особенности использования наборов поисковых атрибутов и профайлов Рассмотрена история появления и развития библиотечных корпораций в России, проанализированы особенности наиболее распространенных решений российских разработчиков, использующих Z39 50
Во втором разделе первой главы «Применение протокола '¿39 50 в библиотечных технологиях» рассматриваются основные направления использования технологий на основе данного протокола в библиотечной практике, а именно создание виртуальных сводных каталогов, поддержка корпоративной каталогизации и каталогизации путем заимствования записей На основе анализа литературы подробно описаны преимущества и недостатки создания физических и виртуальных сводных каталогов Для виртуальных сводных каталогов, основанных на использовании технологии 239 50, подробно рассмотрены требования к полноте предоставляемой информации, включая доступность документов и возможность их получения через службу ЭДД и МБА Сделан вывод о преимуществе использования \!УЕВ-шлюзов по сравнению с программами-клиентами при создании пользовательских порталов Проведен обзор дополнительных программных решений на основе протокола 239 50, используемых для автоматизации ведения библиографии, интеграции с текстовыми процессорами для вставки ссылок в документы и автоматического импорта ссылок
Третий раздел первой главы «Использование решений на основе протокола 239 50 для целей корпоративной каталогизации» посвящен анализу
использования технологии каталогизации путем заимствования записей в зарубежных и российских библиотечных корпорациях
В четвертом параграфе первой главы «Новые тенденции использования технологии на основе протокола Z39 50 в библиотечных сетях и корпорациях» рассмотрены отдельные решения, повышающие эффективность обработки поисковых запросов пользователей корпоративных библиотечных порталов, в частности, приведены особенности создания целевых поисковых групп, образованных по географическому и тематическому принципам отбора информационных ресурсов, с целью уменьшения суммарного числа серверов, участвующих в обработке отдельных запросов Кроме того, рассмотрены новые направления развития корпоративных технологий протоколы SRU/SRW, проект OAI и интеграция поиска по электронным каталогам национальных библиотек и коллекциям электронных документов, реализованная в проекте Европейской библиотеки (TEL)
В пятом разделе первой главы «Проблемы, возникающие при работе с виртуальными сводными каталогам, из-за неполной совместимости серверов 239 50» анализируются причины, снижающие эффективность поиска через корпоративные порталы, связанные с особенностями реализации некоторых программных решений, и делается вывод о необходимости соблюдения требований профайла Bath для всех программных решений на основе протокола Z39 50, используемых в библиотечных корпорациях
В шестом разделе «Проблемы временных задержек при поиске по группе серверов Z39 50» анализируется зарубежный опыт исследования данной проблемы Приведен анализ временных задержек, возникающих при поиске по ряду серверов Z39 50 в Великобритании, показано, что наличие хотя бы одного медленного или неактивного сервера Z39 50 приводит к существенному ухудшению характеристик корпоративного поискового портала Сделан вывод о том, что решение задачи повышения характеристик поисковых порталов на основе шлюзов HTTP-Z39 50 связано с оптимизацией представления результатов поиска по группе серверов Z39 50, с решением проблемы минимизации задержек, возникающих из-за опроса неактивных серверов, и с улучшением возможностей навигации и уточнения поисковых запросов в пользовательском интерфейсе портала
Вторая глава «Использование шлюзов HTTP-Z39.50 в российских библиотечных корпорациях и задачи развития программных решений»
посвящена рассмотрению основных тенденций использования шлюзов HTTP-Z39 50 при создании поисковых порталов российских библиотечных
корпораций и исследованию их функциональных и временных характеристик при обработке поисковых запросов пользователей
В первом разделе второй главы «Российские разработки порталов на основе использования протокола Z39 50» рассматриваются интерфейсы и анализируется функциональность ведущих российских библиотечных корпоративных порталов Корпоративной сети московских библиотек (КСМБ), Омского корпоративного библиотечного консорциума, распределенного корпоративного каталога библиотек Сибири, Научной библиотеки Томского государственного университета, распределенного каталога LIBWEB ЦНСХБ (г Москва), Ассоциации российских библиотечных консорциумов (АРБИКОН), Научной библиотеки МГУ им М В Ломоносова (портал СИГЛА), Российского информационно-библиотечного консорциума (РИБК) Сделан вывод о том, что для рядового пользователя использование поисковых интерфейсов российских библиотечных корпораций во многих случаях может вызывать затруднения, связанные с необходимостью задания большого числа исходных параметров поиска списка серверов, выбора поисковых атрибутов и указания ряда дополнительных параметров
Во втором разделе второй главы «Анализ производительности поисковых запросов в КСМБ» рассматриваются функциональные характеристики и исследуются временные задержки, возникающие в результате поиска по каждому из 14 отобранных серверов КСМБ, а также при поиске по группам серверов, состоящим из работающих и неактивных серверов Z39 50 на момент проведения эксперимента Делается вывод о том, что при наличии хотя бы одного неработающего сервера Z39 50 суммарная задержка обработки поискового запроса на портале КСМБ может достигать 17 секунд
В третьем разделе второй главы «Моделирование вычислительного комплекса, созданного на основе протокола Z39 50 с целью определения путей его совершенствования» исследуется математическая модель системы, созданной с использованием положений теории сетей массового обслуживания и включающей шлюз HTTP-Z39 50, а также несколько групп серверов Z39 50 На этой модели проведены расчеты по алгоритму Бузена, вычислены значения величин средней длины очереди L,(K) в узлах модели (г -узел, К - число запросов в системе) для двух вариантов обслуживания при наличии в поисковой группе неактивных серверов и при предварительном исключении неактивных серверов из числа опрашиваемых Сделаны выводы о том, что с увеличением числа неактивных серверов пропорционально возрастает средняя длина очереди заданий, выполняющихся с большими задержками При втором варианте обслуживания, предусматривающем пред-
варительное исключение неактивных серверов, характеристики системы существенно лучше С ростом числа заданий в системе К значения средней длины очереди Ь, (г=1 4) увеличиваются пропорционально и линейно Отсюда следует, что число заданий в системе не влияет на задержки обработки запросов, связанных с поиском в распределенной информационной среде При большом числе заданий в системе возрастают требования к производительности центрального узла - шлюза НТТР-г29 50
В третьей главе «Решения на основе использования протокола 239 50 в проектах Корпоративной сети московских библиотек (КСМБ) и электронной библиотеки МГУКИ» предложены подходы и описаны алгоритмы, разработанные для решения ряда проблем, рассмотренных в предыдущих главах исследования
В первом разделе третьей главы «Решения на основе протокола 239 50 при разработке портала корпоративной сети московских библиотек» описаны цели создания КСМБ и изложены решенные при ее проектировании и реализации следующие основные задачи
- создана общая организационная, программно-технологическая и техническая среда, обеспечивающая объединение информационных и трудовых ресурсов библиотек Москвы в корпоративную систему для совместного их использования в интересах повышения качества библиотечно-информационного обслуживания различных категорий пользователей,
- разработана и внедрена технология корпоративной каталогизации,
- достигнута информационная и лингвистическая совместимость электронных каталогов КСМБ на основе реализации требований российского библиотечного коммуникативного формата ЫШМАЖ:,
- разработана и внедрена система электронной доставки документов (ЭДД)
Одной из главных причин использования решений на основе протокола 239 50 в КСМБ является наличие у ее участников разнородных АБИС Поисковый портал КСМБ функционирует как шлюз НТТР-739 50, основу которого составляет аналогичный программный модуль из состава \VEB-ИРБИС Для достижения функциональной полноты решений ИРБИС и удобства пользователей АБИС ИРБИС в ГПНТБ России был разработан сервер ХЪ2!Х64 Оба программных решения предложены автором данной работы с учетом выводов и рекомендаций, сделанных на основе проведенного исследования
Во втором разделе третьей главы «Шлюз НТТР-239 50 портала КСМБ» описаны алгоритмы и программные решения, использованные в модифицированном портале КСМБ Для минимизации задержек при обработке поисковых запросов разработан алгоритм фонового мониторинга серверов 239 50 библиотечной корпорации, позволяющий исключить неактивные серверы из числа опрашиваемых Пользователь формирует поисковый запрос с помощью \УЕВ-формы При простом поисковом запросе используется строка ввода, в которую пользователь записывает слово или фразу В процессе обработки шлюзом НТТР-239 50 введенный запрос приводится к форме, использующей набор атрибутов ЫЬ-1 протокола 239 50 в формате польской инверсной записи следующего вида
@ог @апс1 @ап<1 @ап<1 @аПт 1=1035 @айг 5=1 <слово_1> @айг 1=1035 @а«г 5=1 <слово_2> @айг 1=1035 @а«г 5=1 <слово_п> @а«т 1=4 @айг 5=1 <слово_1 слово_2 словоп >
В данном случае используется дизъюнкция двух групп атрибутов набора ЫЬ-1 1035 (поиск по любому полю) и 4 (поиск по заглавию), а также установлено усечение окончаний (значение 1 для атрибутов пятой группы набора ЫЬ-1) В свою очередь группа атрибутов 1035 (поиск по любому полю) образуется из конъюнкции слов (слово_1 слово п), составляющих введенную поисковую фразу Использование комбинации двух вариантов поисковых атрибутов позволяет находить записи на серверах 239 50, не поддерживающих поиск по любому полю (аИг 1=1035), а также на серверах, где поиск такого вида не выдает полных результатов Конъюнкция ключевых слов, формируемая при обработке поискового запроса, позволяет искать записи, в которых встречаются все слова, присутствующие в поисковой фразе Расширенный поисковый запрос позволяет пользователю производить поиск по автору, заглавию, рубрике и году издания В этом случае пользователь применяет для ввода соответствующие строки поисковой формы При обработке запроса выполняется конъюнкция введенных элементов запроса и используются атрибуты набора Ь1Ь-1, соответствующие используемым поисковым полям
Представлены и подробно описаны алгоритм передачи поискового запроса серверам 239 50 и алгоритм обработки ответов от серверов 239 50 с использованием асинхронного режима опроса Необходимо отметить следующие особенности формата вывода результатов поиска
- из списка исключаются серверы, на которых не были найдены записи по введенному запросу, а также все недоступные (неактивные) серверы на момент выполнения запроса,
- пользователь может перейти по гиперссылке (число найденных записей) к просмотру записей, не дожидаясь окончания вывода результатов от всех серверов,
- результаты поиска выводятся группами, образованными из результатов, полученных от всех баз данных на отельном сервере 239 50
Основными особенностями разработанного алгоритма является применение последовательной поисковой навигации с использованием региональной целевой группы серверов и тематической целевой группы каталогов, доступных на выбранном сервере При этом региональная целевая группа формируется из серверов, входящих в состав КСМБ, с программным исключением неактивных серверов на момент выполнения запроса Тематическая целевая группа формируется пользователем самостоятельно путем выбора баз данных, участвующих в поиске
В третьем разделе третьей главы «Использование решений на основе протокола 239 50 при разработке электронной библиотеки МГУКИ» рассматриваются вопросы применения программных решений ИРБИС и корпоративной технологии на базе использования протокола ZЪ9 50 для создания электронной библиотеки вуза Подробно описаны требования и стадии проектирования вузовской электронной библиотеки (ВЭБ) Сделан вывод о том, что ВЭБ может рассматриваться как подсистема вузовской АБИС
В четвертом разделе третьей главы «Пример концептуального проектирования программно-аппаратного комплекса ВЭБ на примере электронной библиотеки МГУКИ» изложены вопросы создания электронной библиотеки вуза, представлены блок-схемы алгоритма работы модели электронной библиотеки МГУКИ, использующей программные решения ИРБИС и корпоративную технологию на основе протокола 239 50 В разработанном программном пакете представлены два способа поиска информации по полному тексту документов, основанных
- на загрузке полнотекстовых документов в базу данных ИРБИС-64 с последующим обращением к этой базе данных через сервер 264 и выводом результатов через шлюз НТТР-239 50,
- на индексации массива документов, находящихся на файловом сервере, с последующим доступом к ним через шлюз НТТР-239 50
В зависимости от целей использования и полноты имеющегося библиографического описания возможно использование первого или второго способа создания полнотекстовых баз При наличии библиографических описаний индексируемых документов целесообразнее использовать их размещение в базе данных ИРБИС-64, что позволит пользователю выводить
как описание документов, так и их полные тексты При отсутствии внешних библиографических описаний документов, а также при наличии в НТМЬ-документах полей метаданных, содержащих сведения ВиЫш Соге, возможно использование второго способа, предусматривающего индексацию произвольного набора документов
В пятом разделе третьей главы «Реализация опытной модели ЭБ МГУКИ» изложены особенности проектирования портала электронной библиотеки МГУКИ, подробно описаны возможности пользовательского интерфейса и особенности навигации при проведении поиска Кроме того, описана структура информационных ресурсов МГУКИ и особенности их обработки для загрузки в электронную библиотеку
Одним из основных направлений развития корпоративных библиотечных порталов в ближайшее время будет интеграция поиска по электронным каталогам и полнотекстовым коллекциям документов, а также повышение производительности поиска и удобства пользовательского интерфейса В этой связи разработанная технология интегрированного поиска для электронных библиотек и предложенный алгоритм исключения неактивных серверов из поисковой группы являются важным результатом диссертационного исследования
В заключении диссертации отмечается, что развитие библиотечных корпоративных технологий на современном этапе неразрывно связано с использованием программных и технологических решений на основе протокола 239 50 На основе проведенного анализа современных библиотечных корпоративных порталов сформулирован вывод о необходимости повышения их функциональности за счет сокращения временных задержек, а также интеграции поиска по электронным каталогам и полнотекстовым коллекциям документов Для решения этой задачи разработана математическая модель информационной системы, состоящей из шлюза НТТР-739 50 и группы серверов, проведено моделирование с использованием математического аппарата теории массового обслуживания и вычислены значения средней длины очереди в зависимости от числа заданий в системе для каждого узла рассматриваемой модели На основании результатов моделирования сделаны выводы о том, что с увеличением числа неактивных серверов пропорционально возрастает средняя длина очереди заданий, выполняющихся с большими задержками, а с увеличением числа поисковых запросов в корпоративной сети возрастают требования к производительности шлюза НТТР-739 50 С учетом выводов результатов моделирования разработаны новые программные и технологические решения шлюз НТТР-239 50, обеспечи-
вающий поддержку фонового мониторинга серверов корпоративной сети и исключение неактивных серверов из числа опрашиваемых при обработке поисковых запросов пользователей, сервер Z32/Z64 с провайдером данных для АБИС ИРБИС
Показано, что использование целевых поисковых групп, создаваемых на основе географических и тематических критериев, а также применение средств навигации и уточнения пользовательских запросов позволяют повысить результативность поиска Предложен алгоритм первоначального выполнения поискового запроса с групповым обращением ко всем базам данных, поддерживаемым на каждом из опрашиваемых серверов Z39 50 Дальнейшая навигация и уточнение поискового запроса связана с формированием тематической целевой группы, создаваемой пользователем из отобранных баз данных на одном сервере Z39 50 корпоративной библиотечной сети Опыт создания портала Корпоративной сети московских библиотек позволяет выявить эффективность предложенных решений для повышения качества обслуживания пользователей
Предложено типовое решение электронной библиотеки на основе использования технологии Z39 50 и программных средств полнотекстового поиска ИРБИС, что позволяет повысить функциональность поисковых порталов на основе шлюза HTTP-Z39 50 за счет увеличения числа подключаемых информационных источников и обеспечения интегрированною поиска по электронным каталогам и полнотекстовым коллекциям документов
В результате проведенного исследования разработан программный комплекс, включающий шлюз HTTP-Z39 50 и сервер Z32/Z64, являющийся типовым решением при внедрении корпоративной технологии на основе протокола Z39 50 для библиотек, использующих АБИС ИРБИС
Результаты исследования были использованы при создании портала Корпоративной сети московских библиотек (http //corporate gpntb га), портала Научной электронной библиотеки ГПНТБ России (в сети интранет ГПНТБ России) и портала пилотной версии электронной библиотеки МГУКИ (http //library gpntb ru/mguki)
СПИСОК РАБОТ, ОПУБЛИКОВАННЫХ ПО ТЕМЕ ДИССЕРТАЦИИ
Отдельные издания
1 Гончаров М.В. Практическая реализация библиотечного Интернет-комплекса науч -практич пособие / М В Гончаров, К А Колосов - М ФАИР-ПРЕСС, 2005 - 192 с
Публикация в журнале, рекомендованном ВАК
2 Воройский Ф.С. Основные технологические принципы разработки электронных библиотек гуманитарных вузов России / Ф С Воройский, К А Колосов//Науч итехн б-ки -2008 -№2 - С 20-32
Статьи и тезисы докладов
3. Колосов К.А. Система электронной доставки документов (ЭДД) и межбиблиотечного абонемента (МБА) в корпоративной сети публичных библиотек Москвы (КСПБМ) / К А Колосов // Проблемы развития вузовских сетевых информационно-библиотечных систем тез докл межвузов совещ - М РХТУим ДИ Менделеева, 2000 -С 16-21
4 Колосов К.А. Электронная доставка документов в корпоративном проекте публичных библиотек г Москвы / К А Колосов // Вторая международная конференция «ИОЛ-2000» тез докл - СПб Институт «Открытое общество», 2000 - С 366-367
5 Колосов К.А. Особенности реализации системы электронной доставки документов на втором этапе разработки корпоративной сети публичных библиотек Москвы / К А Колосов // Библиотеки и ассоциации в меняющемся мире новые технологии и новые формы сотрудничества материалы конф «Крым-2001» -М ГПНТБ России, 2001 -Т 2 - С 721723
6 Колосов К.А. Принципы реализации и развитие технологии электронной доставки документов в корпоративной сети публичных библиотек г Москвы / К А Колосов // Библиотеки и ассоциации в меняющемся мире новые технологии и новые формы сотрудничества материалы конф «Крым-2002» -М ГПНТБ России, 2002 -Т 2 - С 721-723
7 Колосов К.А. Особенности реализации шлюза HTTP-Z39 50 в новой версии WEB-IRBIS [Электронный ресурс] / К А Колосов // Библиотеки и ассоциации в меняющемся мире новые технологии и новые формы сотрудничества материалы конф «Крым-2003» - М ГПНТБ России, 2003 - Режим доступа http //www gpntb ru/win/mter-events/cnmea2003/ tmd/toml/sec/Doc63 HTML
8 Колосов К.А. Новые возможности на основе протокола Z39 50 для пользователей ИРБИС [Электронный ресурс] / К А Колосов // Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса материалы конф «Крым-2004» - М ГПНТБ России, 2004 - Режим доступа http //www gpntb ru/win/mter-events/ cri-mea2004/disk/doc/45 pdf
9 Колосов K.A. Учебно-образовательный портал по библиотечному делу партнерский проект ВГБИЛ - ГПНТБ [Электронный ресурс] / К А Колосов, ЕЛ Крепкова // Информационные технологии, компьютерные системы и издательская продукция для библиотек докл и тез докл ме-ждунар конференции «Libcom-2004» - М ГПНТБ России, 2004 - Режим доступа http //www gpntb ru/libcom4/mdex3 cfm'?n= tez/doc3/doc6
10 Колосов К.А. Новые возможности поисковых средств портала ВГБИЛ [Электронный ресурс] / К А Колосов // Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса материалы конф «Крым-2005» - М ГПНТБ России, 2005 - Режим доступа http //www gpntb ru/wm/mter-events/crimea2005/disk/183 pdf
И Колосов K.A. Оптимизация обработки поисковых запросов на WEB-портале ВГБИЛ [Электронный ресурс] / К А Колосов, Е Л Крепкова // Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса материалы конф «Крым-2006» - М , 2006 - Режим доступа http //www gpntb ru/win/mter-events/crxmea2006 /disk2/215 pdf
12 Гончаров M.B. Перспективы развития Интернет-комплекса ГПНТБ России / М В Гончаров, К А Колосов // Электронные ресурсы и электронные библиотеки ежегод межвед сбор науч тр - М ГПНТБ России, 2006 - С 18-25
13 Колосов К.А. Модернизированный портал корпоративной сети московских библиотек [Электронный ресурс] / К А Колосов // Информационные технологии, компьютерные системы и издательская продукция для библиотек докл и тез докл междунар конференции «Libcom-2007» -М ГПНТБ России, 2007 - Режим доступа http //www gpntb ru /hbcom7/disk/47 pdf
14 Колосов K.A. К вопросу об уменьшении задержек при обработке широковещательных поисковых запросов с использованием шлюзов НТТР-Z39 50 / К А Колосов // Современные направления развития библиотек ежегод межвед сбор науч тр -М ГПНТБ России, 2007 -С 10-14
Кирилл Анатольевич Колосов
СОЗДАНИЕ И ПРИМЕНЕНИЕ В БИБЛИОТЕЧНОЙ ПРАКТИКЕ КОРПОРАТИВНОЙ ТЕХНОЛОГИИ НА БАЗЕ ПРОТОКОЛА Х39 50
Автореферат диссертации на соискание ученой степени кандидата технических наук
ЛР № 020536 Подписано в печать 17 04 08
Формат 60x84 1/16 Печать офсетная
Уел печ л 1,16 Уч изд л 1
Заказ 19 Тираж 120 экз
Издательско-репрографический Центр ГПНТБ России 107996, Москва, К-31, ГСП-6, Кузнецкий мост, 12
Оглавление автор диссертации — кандидата технических наук Колосов, Кирилл Анатольевич
Список использованных сокращений.
Введение.
Глава I. Протокол 239.50: история создания, области и опыт использования.
1.1. История появления и области использования протокола 239.50.
1.2 Применение протокола 239.50 в библиотечных технологиях.
1.3 Использование решений на основе протокола 239.50 для целей корпоративной каталогизации за рубежом.
1.4 Новые тенденции использования технологии на основе протокола 239.50 в библиотечных сетях и корпорациях.
1.5. Проблемы, возникающие при работе с виртуальными сводными каталогами, из-за неполной совместимости серверов 239.50.
1.6 Проблемы временных задержек при поиске по группе серверов 239.50.
1.7 Выводы.
Глава II. Использование шлюзов НТТР-239.50 в российских библиотечных корпорациях и задачи развития программных решений.
2.1. Российские разработки порталов на основе использования протокола 239.50.
2.2. Анализ производительности обработки поисковых запросов вКСМБ.
2.3. Моделирование вычислительного комплекса, созданного на основе протокола 239.50, с целью определения путей его совершенствования.
2.4 Выводы.
Глава III. Решения на основе использования протокола Z39.50 в проектах корпоративной сети московских библиотек (КСМБ) и электронной библиотеки МГУКИ.
3.1 Решения на основе протокола г39.50 при разработке портала корпоративной сети московских библиотек.
3.2 Шлюз НТТР-г39.50 портала КСМБ.
3.3 Использование решений на основе протокола 739.50 при разработке электронной библиотеки МГУКИ.
3.4. Пример концептуального проектирования программно-аппаратного комплекса ВЭБ на примере электронной библиотеки МГУКИ.
3.5. Реализация опытной модели ЭБ МГУКИ.
3.6 Выводы.1Ю
Введение 2007 год, диссертация по документальной информации, Колосов, Кирилл Анатольевич
Актуальность темы. Предоставление читателям информации из всех доступных источников, как печатных, так и электронных, является одной из основных задач современных библиотек. Практически во всех библиотеках электронные каталоги заменили карточные, читатели имеют доступ к электронным изданиям и базам данных. Интенсивное развитие информационных и телекоммуникационных технологий и открытых стандартов явилось технологической основой создания библиотечных корпораций, широкое распространение которых происходит во всем мире в последнее десятилетие [7, 8 ,9]. Для читателей библиотечные корпорации предоставляют такие новые возможности, как поиск в виртуальном сводном каталоге, объединяющем информационные ресурсы участников корпорации, доступ к полнотекстовым документам из виртуального сводного каталога, заказ оцифрованных документов через службу электронной доставки, доступ к подписным базам данных и полнотекстовым изданиям, получаемым на основе корпоративного комплектования [17, 18]. Для сотрудников библиотек корпоративные технологии дают возможности сократить рутинные операций и существенно снизить трудоемкость и затраты за счет использования технологии каталогизации путем заимствования записей.
Современные технические решения позволяют любой крупной библиотеке создавать и поддерживать собственные поисковые Интернет-порталы, использующие доступ к ресурсам библиотечных корпораций на основе протокола 239.50, с целью более полного удовлетворения запросов поиска и получения информации для своей читательской аудитории. В зависимости от профиля библиотеки и назначения поискового портала число каталогов, входящих в виртуальный сводный каталог, может составлять от нескольких десятков до нескольких сотен. Несмотря на очевидные преимущества распределенной информационной системы, время обработки поисковых запросов в ней может существенно превышать значения, получаемые при поиске в системах, использующих предварительную индексацию документов, например Google. Это обстоятельство создает ситуацию, когда задержки при обработке поисковых запросов через порталы библиотечных корпораций, а также значительный объем информации, выдаваемой на экран при поиске по большому числу источников, препятствуют полноценному использованию корпоративных библиотечных порталов [74].
Начавшийся поиск путей решения этой проблемы привел к идее создания целевых поисковых групп, сужающих охват информационных источников на основе тематических и географических критериев [105]. Такие решения реализованы, например, на портале Ассоциации российских библиотечных консорциумов (АРБИКОН) (http://www.arbicon.ru) .
Однако большинство поисковых порталов библиотечных корпораций, использующих решения на основе протокола Z39.50, не в полной мере используют его функциональные возможности, обеспечивающие параллельность обработки пользовательских запросов и представления результатов поиска, что приводит к возникновению значительных временных задержек при поиске по большому числу информационных источников.
В связи с этим возникла потребность на базе портала корпоративной сети московских библиотек исследовать причины возникновения задержек при поиске по группе серверов Z39.50 и предложить программные и технологические решения, повышающие производительность поиска в корпоративных библиотечных сетях, что является актуальной научной и технической задачей.
Одним из перспективных направлений развития корпоративных библиотечных порталов является интеграция поиска по электронным каталогам и полнотекстовым коллекциям документов. Технические решения для поддержки такого комбинированного поиска, используемые, в частности, в проекте Европейской библиотеки (TEL), базируются на протоколе SRU, являющемся дальнейшим развитием протокола Z39.50 и позволяющем проводить поиск и по электронным коллекциям, поддерживающим технологию ОА1-РМН.
Однако значительное число российских библиотек, в том числе вузовских, в течение ряда лет используют программные решения ИРБИС для создания электронных каталогов полнотекстовых ресурсов. Данные решения в сочетании с решениями системы автоматизации библиотек ИРБИС для поиска по массивам полнотекстовых документов образуют техническую среду для создания электронных библиотек. Использование корпоративных технологий на основе протокола 739.50 позволяет расширить число подключаемых информационных источников и повысить эффективность обработки поисковых запросов пользователей при работе с электронными библиотеками, использующими программные решения ИРБИС. Таким образом, возникает потребность исследовать теоретические и практические аспекты создания и применения в библиотечной практике корпоративной технологии на базе протокола 739.50 с целью дальнейшего её совершенствования, что является актуальной научной и технической задачей.
Целью настоящего исследования является выявление и анализ совокупности причин увеличения временных задержек при поиске по большому числу серверов 239.50 в библиотечной корпорации, а также определение путей повышения эффективности обработки поисковых запросов пользователей, в том числе при создании электронных библиотек вузов на основе программных решений ИРБИС и шлюза НТТР-739.50.
Реализация данной цели достигается путём решения следующих задач:
- анализ программно-технических решений реализации корпоративных библиотечных порталов и выявление основных факторов, влияющие на временные задержки при обработке поисковых запросов пользователей;
- разработка и анализ математической модели обработки поисковых запросов в системе, состоящей из шлюза НТТР-239.50 и группы серверов;
- разработка обобщенных алгоритмов передачи поискового запроса серверам корпоративной сети и представления результатов на поисковом портале;
- разработка типового решения портала электронной библиотеки на основе использования технологии Z39.50 и программных решений ИРБИС с возможностями интегрированного поиска по электронному каталогу библиографических описаний и массиву полнотекстовых документов. Поставленные задачи решались на базе Государственной публичной научно-технической библиотеки России (ГПНТБ), являющейся сетевым центром-провайдером корпоративной сети московских библиотек (КСМБ). ГПНТБ располагает значительным объемом информационных ресурсов на сервере Z39.50, отражающих фонды библиотеки, а также имеет сводные каталоги на основе библиографических данных, получаемых от московских и российских библиотек-партнеров. Кроме того, результаты работы были использованы при разработке программных решений на основе протокола Z39.50 в новой версии АБИС ИРБИС.
Изученность темы
Широкий комплекс вопросов проектирования корпоративных библиотечных систем был подробно рассмотрен в трудах Я.Л. Шрайберга, Ф.С. Воройского. Вопросы использования протокола Z39.50 при разработке и реализации библиотечных Интернет-комплексов подробно исследованы в работах М.В. Гончарова. Теоретические и технические аспекты построения распределенных информационных систем на основе протокола Z39.50 рассмотрены в трудах O.JI. Жижимова, в том числе в его докторской диссертации. Вопросы построения распределенных информационных систем на основе СУБД CDS/ISIS и технологии Z39.50 изучались в работах H.A. Мазова. Проблемы создания распределенного электронного каталога библиотечного консорциума, использующего протокол Z39.50 для поиска информации, рассматривались в работах О.С. Колобова.
Отдельные проблемы, касающиеся оптимизации обработки поисковых запросов в информационной системе, состоящей из шлюза HTTP-Z39.50 и группы серверов корпоративной библиотечной сети, уже были рассмотрены в научной литературе. Так, в работах O.JI. Жижимова изучались вопросы оптимизации задержек при обработке запросов с использованием провайдера удаленного доступа сервера ZooPARK и уменьшения числа одновременных сеансов взаимодействия между клиентом и сервером. Вопросы использования многопоточности при обработке поисковых запросов в информационной среде, состоящей из шлюза HTTP-Z39.50 и группы серверов Z39.50, рассматривались в работах А.Ю. Хохлова и впервые в российской практике были решены в разработанном им портале СИГЛА. Использование мониторинга серверов Z39.50 с целью исключения неактивных серверов при обработке широковещательных поисковых запросов было предложено в работах Р.Т. Усманова и A.A. Кузнецова и реализовано в рабочей версии портала АРБИКОН.
Однако до настоящего времени не проводилось комплексного исследования информационной системы, состоящей из шлюза HTTP-Z39.50 и группы серверов Z39.50 корпоративной библиотечной сети, с целью разработки комплекса технических решений, повышающих производительность поиска.
Кроме того, не исследовались вопросы создания типового решения -электронной библиотеки вуза с использованием программных решений ИРБИС и шлюза HTTP-Z39.50. Данная диссертация предполагает восполнить этот пробел.
Объектом исследования является теория и практика программных и технических решений на основе протокола Z39.50 с позиции эффективности их использования при обслуживании пользователей информационных ресурсов корпоративных библиотечных систем.
Предмет исследования: способы оптимизации программно-технических средств обработки поисковых запросов в корпоративных библиотечных сетях, использующих протокол Z39.50.
Методологической основой исследования явились положения, изложенные в трудах по основным принципам разработки и эксплуатации автоматизированных библиотечно-информационных систем библиотек Я.Л.
Шрайберга, Ф.С. Воройского, Б.И. Маршака, М.В. Гончарова, А.И. Бродовского, разработки в области информатики, в частности - по созданию информационных систем и баз данных Дж. Мартина, проектирования и эксплуатации региональных информационных систем и использования информационных ресурсов Н.Е. Каленова. Существенной методологической опорой для проведения исследования в области корпоративных сетей, использующих протокол Z39.50, стали положения, изложенные в работах O.JI. Жижимова, H.A. Мазова, А.И. Племнека.
Ввиду комплексного характера исследования в качестве инструментария для его проведения использовались: метод сравнительного анализа, моделирование, анкетирование, инженерные методы анализа и синтеза информационных систем, положения теории систем и сетей массового обслуживания.
На защиту выносятся следующие результаты работы и положения:
1. Шлюз HTTP-Z39.50 должен обеспечивать обработку поисковых запросов пользователей библиотечной корпорации с минимальными задержками.
2. Решение задачи повышения характеристик порталов на основе шлюзов HTTP-Z39.50 может быть достигнуто за счет обеспечения фонового мониторинга библиотечной корпоративной сети с целью выявления неактивных серверов, а также с помощью навигации и уточнения поисковых запросов в пользовательском интерфейсе портала.
3. Предложенная автором математическая модель обработки поискового запроса библиотечной корпоративной сети на основе шлюза Z39.50 позволяет сделать следующие выводы:
- функциональные возможности поискового портала на основе шлюза HTTP-Z39.50 могут быть существенно улучшены при исключении неактивных серверов из числа опрашиваемых;
- при большом числе заданий в системе возрастают требования к производительности центрального узла - шлюза HTTP-Z39.50.
4. Электронная библиотека вуза, созданная на основе шлюза HTTP-Z39.50 и программных решений ИРБИС, обеспечивает интегрированный поиск по электронным каталогам и полнотекстовым массивам документов.
5. Порталы КСМБ и «Электронная библиотека МГУКИ» целесообразно строить на основе предложенных автором технических решений, использующих результаты исследования: шлюза НТТР-239.50 и сервера 232/264.
Научная новизна. В результате анализа технологических решений современных российских библиотечных корпораций, использующих протокол 239.50, в настоящей работе выявлены основные факторы, влияющие на эффективность обработки поисковых запросов пользователей. Разработана математическая модель обработки поисковых запросов в корпоративной сети, позволяющая повысить функциональные характеристики корпоративного портала. Предложено типовое решение для портала электронной библиотеки вуза на основе шлюза НТТР-239.50. Определен новый подход к интеграции поиска по электронному каталогу библиографических описаний и массиву полнотекстовых документов с использованием провайдера данных 239.50 для полнотекстового модуля АБИС ИРБИС.
Теоретическая значимость исследования состоит в развитии концепции создания поисковых порталов библиотечных корпораций, использующих технологию 239.50, а также в определении технологических и организационных принципов их дальнейшего расширения для создания электронных библиотек.
Практическая значимость и реализация результатов исследования заключаются в создании программного комплекса, состоящего из шлюза НТТР-239.50 и сервера 232/264, входящего в состав АБИС ИРБИС, который используется для создания корпоративных библиотечных систем, в том числе и в Корпоративной сети московских библиотек, а также для создания электронных библиотек вузов, в частности, для пилотной версии электронной библиотеки МГУКИ.
Цели и задачи исследования определили логику изложения материала и структуру построения диссертации. Она состоит из введения, трех глав и за
Заключение диссертация на тему "Создание и применение в библиотечной практике корпоративной технологии на базе протокола Z39/50"
3.6 Выводы
Разработанные решения и описанная выше технология обработки поисковых запросов на шлюзе НТТР-239.50 позволили улучшить характеристики поискового портала, существовавших в предыдущих реализациях корпоративных библиотечных порталов, а именно:
- устранены задержки, связанные с опросом неактивных серверов 239.50;
- уменьшено число одновременных сеансов 239.50 за счет использования целевых поисковых групп;
- используется последовательная навигация с применением региональных и тематических поисковых групп;
- для библиотек, использующих АБИС ИРБИС, разработано типовое решение портала электронной библиотеки, включая интегрированный поиск по электронному каталогу библиографических описаний и массиву полнотекстовых документов.
Одним из основных направлений развития корпоративных библиотечных порталов в ближайшее время будет интеграция поиска по электронным каталогам и полнотекстовым коллекциям документов, а также повышение производительности поиска и удобства пользовательского интерфейса. В этой связи разработанная технология интегрированного поиска для электронных библиотек и предложенный алгоритм исключения неактивных серверов из поисковой группы являются важным результатом диссертационного исследования.
ЗАКЛЮЧЕНИЕ
Развитие библиотечных корпоративных технологий на современном этапе неразрывно связано с использованием программных и технологических решений на основе протокола Z39.50. Проведенное автором исследование посвящено рассмотрению проблем создания поисковых корпоративных порталов на основе шлюза НТТР-239.50. Анализ современного состояния и использования решений на основе протокола 239.50 для создания виртуальных сводных каталогов, корпоративной каталогизации, электронной доставки документов и проведенный анализ параметров интерфейсов ряда российских корпоративных библиотечных порталов, позволил выявить ряд проблем, возникающих при практической реализации корпоративных библиотечных порталов. Проведенное автором исследование временных задержек при поиске по серверам 239.50 корпоративной сети московских библиотек с использованием шлюза НТТР-239.50 позволило разработать базовую модель обработки запросов в информационной системе, состоящей из шлюза НТТР-239.50 и группы серверов 239.50. На основании результатов моделирования сделаны выводы о том, что с увеличением числа неактивных серверов пропорционально возрастает средняя длина очереди заданий, выполняющихся с большими задержками, а с увеличением числа поисковых запросов в корпоративной сети возрастают требования к производительности шлюза НТТР-239.50. С учетом выводов результатов моделирования разработаны новые программные и технологические решения: шлюз НТТР-239.50, обеспечивающий поддержку фонового мониторинга серверов корпоративной сети и исключение неактивных серверов из числа опрашиваемых при обработке поисковых запросов пользователей; сервер 232/264 с провайдером данных для АБИС ИРБИС.
В ходе исследования показано что:
1. Корпоративные порталы на основе шлюза НТТР-239.50 могут эффективно использоваться для поиска в современных библиотечных корпорациях.
2. Функциональные возможности корпоративных порталов, использующих шлюз НТТР-739.50, могут быть существенно улучшены в случае применения технологии, исключающей неактивные сервера из числа опрашиваемых.
3. Использование целевых поисковых групп, создаваемых на основе географических и тематических критериев, а также применение средств навигации и уточнения пользовательских запросов позволяют повысить результативность поиска.
4. Технология на основе использования протокола 739.50 может эффективно применяться при создании электронных библиотек.
В ходе исследования получены следующие результаты:
1. Исследована информационная система корпоративной сети московских библиотек, состоящая из шлюза НТТР-739.50 и группы серверов 739.50 и определены основные требования, предъявляемые к поисковым библиотечным порталам, использующим технологию 739.50.
2. На основании анализа существующих решений и результатов моделирования разработан алгоритм, позволяющий уменьшить время обработки поисковых запросов за счет использования фонового мониторинга серверов 739.50 библиотечной корпорации и исключения неактивных серверов из числа опрашиваемых шлюзом НТТР-739.50.
3. Предложен подход и реализован алгоритм, предусматривающий последовательную навигацию при поиске с использованием региональных и тематических поисковых групп.
4. Разработан комплект программного обеспечения для узлов информационной системы корпоративной сети библиотек, включающий шлюз НТТР-739.50 и сервер 732/764 с провайдером данных для АБИС ИРБИС. Это программное обеспечение успешно функционирует в корпоративной сети московских библиотек, внедрено в ГПНТБ России, ВГБИЛ им. М.И.Рудомино, в библиотеках КСМБ, использующих ИРБИС, а также включено в комплект поставки системы автоматизации библиотек ИРБИС, распространяемой ассоциацией
ЭБНИТ. Сервер 232/764 успешно используется в узлах библиотек, входящих в Российский информационно-библиотечный консорциум (РИБК) для поддержки электронного каталога ВГБИЛ и электронного каталога Парламентской библиотеки
5. Предложено типовое решение вузовской электронной библиотеки, основанное на использовании технологии 239.50, разработано программное обеспечение и реализована опытная модель ЭБ МГУКИ. Аналогичное решение внедрено в опытной модели ЭБ ГПНТБ России.
Библиография Колосов, Кирилл Анатольевич, диссертация по теме Информационные системы и процессы, правовые аспекты информатики
1. Бродовский А.И. Система автоматизации библиотек ИРБИС 2000: что нового? / А.И. Бродовский // Науч. и техн. б-ки 2001. - №2. - С. 2531.
2. ГПНТБ России, 2004. режим доступа: http://www.gpntb.ru/win/inter-events/crimea2004/disk/doc/133 .pdf
3. Воройский Ф.С. Информатика: Новый систематизир. толковый слов.-справ: введение в соврем, информ. и телекоммуникац. технологии в терминах и фактах / Ф.С. Воройский . М.: ФИЗМАТЛИТ, 2003 . - 755 с.
4. Воройский Ф.С. Информатика. Энциклопедический систематизированный словарь-справочник: введение в современные информационные и телекоммуникационные технологии в терминах и фактах / Ф.С. Воройский . М.: ФИЗМАТЛИТ, 2006 . - 767 с.
5. Воройский Ф.С. Корпоративные автоматизированные библиотечно-информационные системы: состояние,принципы построения и перспективы развития: аналит. обзор / Ф.С. Воройский, Я.Л.Шрайберг . М., 2003 . - 129 с.
6. Воройский Ф.С. О корпоративных библиотечных системах и перспективах их развития в России / Ф.С. Воройский // Инф. ресурсы России . -2001. №3-4. - С.7-10.
7. Воройский Ф.С. Основные технологические принципы разработки электронных библиотек гуманитарных вузов России / Ф.С. Воройский, К.А. Колосов // Науч. и техн. б-ки . 2008 . - №2. - С.85-102.
8. Воройский Ф.С. Основы проектирования автоматизированных библиотечно-информационных систем / Ф.С. Воройский. 2-е изд. перераб. и доп. - М.: ФИЗМАТ ЛИТ, 2007. - 521 с.
9. Воройский Ф.С. Разработка средств организационно-технологического обеспечения АБИС / Ф.С. Воройский // Науч. и техн. б-ки. 2001. - №9. -С. 71-86.
10. Воройский Ф.С. Сетевые технологии нового поколения Электронный ресурс. / Ф.С. Воройский // Науч. и техн. б-ки . 2007. - №7 . -М.-.ГПНТБ, 2006. - режим доступа: http://ellib.gpntb.m/?journal=ntb &year=2007&num=7&art=6
11. Воройский Ф.С. Создание корпоративной сети публичных библиотек Москвы: проблемы и решения / Ф.С. Воройский // Науч. и техн. б-ки . -2000.-№12.-С. 23-30.
12. Глухов В.А. Электронная доставка документов / В.А. Глухов, O.JI. Лав-рик. М.: ИНИОН РАН, 1999. - 132 с.
13. Гончаров М.В. Интернет-технологии в современной библиотеке / М.А. Гончаров // Библиотеки и ассоциации в меняющемся мире: новые формы технологии и новые формы сотрудничества: материалы конф. «Крым-2000». -М.: ГПНТБ России, 2000. Т. 1. - С. 208-210.
14. Гончаров М.В. Перспективы развития Интернет-комплекса ГПНТБ России / М.В. Гончаров, К.А. Колосов // Электронные ресурсы и электронные библиотеки: ежег. межвед. сбор. науч. тр . М.: ГПНТБ России, 2006 .-С.18-25.
15. Гончаров М.В. Практическая реализация библиотечного интернет-комплекса: науч.-практич. пособие / М.В. Гончаров, К.А. Колосов. М.: ФАИР-ПРЕСС, 2005 . - 192 с.
16. ГОСТ 34.601-90. Комплекс стандартов на автоматизированные системы. Автоматизированные системы. Стадии создания. Введ. 29.12.90. Взамен ГОСТ 24.601-86 и ГОСТ 24.602-86. Переиздан. Июнь 1997 г.
17. Жижимов О.Л. Введение в Z39.50 / О.Л. Жижимов. 4-е изд. доп. и пере-раб. - Новосибирск: изд-во НГОНБ. - 2003. - 263 с.
18. Жижимов О.Л. Доступ к базам данных ISIS из Internet и построение распределенной информационной системы / О.Л. Жижимов, H.A. Мазов, A.C. Фролов // Вычислительные технологии. 1997. - №3. - С.45-50.
19. Жижимов О.JI. Опыт построения распределенных информационных систем на основе протокола Z39.50 / O.JI. Жижимов, H.A. Мазов // Науч. и техн. б-ки. 2003. - №2. - С.24-28.
20. Жижимов O.JI. Построение распределенных информационных систем на основе протокола Z39.50: автореф. дисс. доктора техн. наук: 05.25.05 / O.JI. Жижимов. Новосибирск, 2004.
21. Жижимов О.JI. Принципы построения распределенных информационных систем на основе протокола Z39.50 / О.Л. Жижимов, H.A. Мазов. -Новосибирск: МВТ СО РАН. 2004. - 361 с.
22. Жижимов О.Л., Мазов H.A. Z39.50 в информационном сообществе России: состояние и перспективы / О.Л. Жижимов, H.A. Мазов // Сб. научн. ст.: Библиотечные компьютерные сети: Россия и Запад. — Вып. 2 . М.: Либерия. - 2003. - С.99-109.
23. Жожикашвили В.А. Сети массового обслуживания. Теория и применение к сетям ЭВМ / В.А. Жожикашвили, В.М. Вишневский. М.: Радио и связь, 1988 .- 192 с.
24. Калёнов Н.Е. Библиографические ресурсы библиотек РАН и типовые средства для их представления в электронном виде / Н.Е. Калёнов // Инф. ресурсы России. 1998. - № 6. - С. 26-27.
25. Колобов О.С. Исследование принципов организации, функционирования и разработка распределенного электронного каталога библиотечногоконсорциума: автореф. дисс. канд. техн. наук: 05.25.05 / О.С. Колобов. -Новосибирск, 2007.
26. Колосов К.А. Электронная доставка документов в корпоративном проекте публичных библиотек г. Москвы / К.А. Колосов // Вторая международная конференция «ИОЛ-2000»: тез. докл. СПб.: Институт "Открытое общество", 2000 . - С.366-367.
27. Крепкова E.JI. Библиотечный сайт как информационный портал / E.JI. Крепкова // Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества: материалы конф. «Крым-2001». -М.: ГПНТБ России, 2001. -Т.1. С.213-215.
28. Мазов H.A. Интеграция Z39.50 и CDS/ISIS: состояние и перспективы развития / H.A. Мазов, О.Л. Жижимов // Науч. и техн. б-ки. 2000. - №5. - С.76-79.
29. Мазов H.A. Разработка и построение распределенной информационно-библиотечной системы на основе СУБД CDS/ISIS: автореф. дисс. канд. техн. наук: 05.25.05 / H.A. Мазов. Новосибирск, 2000.
30. Мартин Дж. Вычислительные сети и распределенная обработка данных: программное обеспечение, методы и архитектура: пер. с англ / Дж. Мартин. М.: Финансы и статистика, 1986. - 269 е., ил.
31. Моделирование вычислительных систем / И.Н.Альянах . JL: Машиностроение, 1988 . - 223 с.
32. Племнек А.И. Использование протоколов Z39.50 и http в современных библиотечных информационных системах / А.И. Племнек, Р.Т. Усманов, Д.Н. Сова // Инф. бюл. РБА. 1998. - № 12. - С.240-257.
33. Племнек А.И. Z39.50: Открытый доступ к библиографической информации / А.И. Племнек, Р.Т. Усманов // Науч. и техн. б-ки. 1998. - №8. -С.24-28.
34. Создание Корпоративной сети публичных библиотек Москвы: раб. проект Электронный ресурс. / Я.Л. Шрайберг, Ф.С. Воройский, А.И. Бродовский, М.В. Гончаров и др. М.: ГПНТБ России, 2001. - Режим доступа: http://corporate.gpntb.ru/documents.php
35. Степанов В.К. Анализ Z39.50 ресурсов с точки зрения пользователя / В.К. Степанов // Библиотеки и ассоциации в меняющемся мире: новые формы технологии и новые формы сотрудничества: материалы конф. «Крым-2001». М.: ГПНТБ России, 2001. -Т. 1. - С.222-224.
36. Столяров Ю.Н. Сущность информации / Ю.Н. Столяров. М., 2000. - 107 с.
37. Хохлов А.Ю. Сигла: портал доступа к библиографической информации Электронный ресурс. / А.Ю. Хохлов // Труды Всероссийской науч. конференции RCDL2004. Пущино, 2004. - Режим доступа: http://www.rcdl.ru/papers/2004/paper34.pdf
38. Шрайберг Я.Л. Автоматизированные библиотечно-информационные системы / Я.Л. Шрайберг, Ф.С. Воройский. М.: Либерия, ГПНТБ России, 1996.-273 с.
39. ANSI/NISO Z39.50-1995. Information Retrieval (Z39.50): Application Service Definition and Protocol Specification Electronic resource. Z39.50 Maintenance Agency Official Text for Z39.50-1995, 1995, July. - Mode of access: http://www.loc.gov/z3950/agency
40. Arms C. Available and useful: OAI at the Library of Congress / C. Arms // Library Hi Tech . 2003. - Vol.21, N2 . - P.129-139.
41. Baranov V. Review of Z39.50 servers and Z39.50 environment in Russia / V. Baranov et al. // Library Hi Tech . 2000. - Vol. 18, N4. - P.304-314.
42. BookWare is Z39.50 client of chois for the consorcium of Finnish university libraries . 2002. - lp.
43. Copeland L. The COPPUL virtual library resource sharing software / L. Copeland et al. // Library Hi Tech. 1999. - Vol. 17, N2. - P. 165-171.
44. Coyle K. The Virtual Union Catalog: A Comparative Study Electronic resource. / K. Coyle // D-Lib Magazine. 2000. - Vol. 6. - №3. - Mode of access: http://www.dlib.org/march00/coyle/03coyle.html
45. Dempsey L. Distributed library and information systems: the significance of Z39.50 / L. Dempsey // Managing information. 1994. - Vol. 1. - №6. - P.41-43.
46. Dempsey L. The emergence of distributed library services: a European perspective / L. Dempsey et al. // J. Amer. Soc. Inf. Sci. 1998. - Vol. 49. -№10. -P.942 - 951.
47. East J.W. Z39.50 and personal bibliograpfic software / J.W. East // Library Hi Tech. 2003. - Vol.16, N1. - P. 34-43.
48. Ferrer R. University of Illinois the Federation of digital libraries: interoperability among heterogeous information systems / R. Ferrer // Sci. and Technol. Libr. 1999. - Vol. 17. - №3 - 4. - P.81-119.
49. Hammer S. YAZ User's Guide and Reference Electronic resource. / S. Hammer [et al.]. Mode of access: http://www.indexdata.dk/yaz/doc
50. Hogg M. Using Z39.50 to build a virtual union catalogue Music Libraries online: a subject clump / M. Hogg, J. Field // Catalogue and Index. 2001. -N139. -P.1-4.
51. ISO 23950: information and documentation: information retrieval (Z39.50): application service definition and protocol Specification. 1998.
52. Lynch C. Comments on Scenarios for Future Development of Union Catalogs in Denmark Electronic resource. / C. Lynch. 2002, 6p. - Mode of access: http://www.bs.dk/bibliotekdk/bilag2lynch.pdf
53. Macgregor G. Z39.50 broadcast searching and Z-server response times: perspectives from CC-interop / G. Macgregor // Online Information Review. -2005.-Vol. 29,N1.-P.90- 106.
54. Miyazawa A. Network of East Asian Library Networks: Feasibility / A. Miya-zawa // Workshop on authority control among Chinese, korean and japanese languages (CJK Authority 3) March 14- 18, 2002, Karuizawa, Tokyo, Kyoto. 2002. - 4p.
55. Needleman M. Z39.50 a review, analysis and some thoughts on the future / M. Needleman // Library Hi Tech. - 2000. - Vol.18, N2. - P.158-165.
56. OAI-PMH Electronic resource. Mode of access: http ://www. openarchives. org
57. Stubley P. Clumping in the UK: towards virtual union catalogues / P. Stubley //New Library World. 1998. - Vol.99, N7. - P. 287-290.
58. Stubley P. Document delivery design: systems for users, not users for systems / P. Stubley // 69th IFLA General Conference and Council. Berlin, 2003 . -12p.
59. Stubley, P. Feasibility Study for a National Union Catalogue Electronic resource.: Final Report / P. Stubley [et al.]. University of Sheffield. - 2001. -Mode of access: http://www.shef.ac.uk/archive/uni/projects/uknuc/ NUCrep.pdf
60. Taylor S. A quick guide to Z39.50 / S. Taylor // Interlanding & Document Supply. 2003. - Vol.31, N1. - P.25-30.
61. Tennant R. Library Catalogs: The Wrong Solution / R. Tennant // Library Journal. 2003, Februrary 15. - P. 28.
62. The Bath Profile Electronic resource.: An International Z39.50 Specification for Library Applications and Resource Discovery, Release 2.0. Mode of access: http://www.collectionscanada.ca/bath/tp-bath2-e.htm
63. Turner F. Selecting a Z39.50 Client or Web Gateway / F. Turner // Library Hi Tech. 1998. -Vol. 16, N2.- P.7-18.
64. Williams J.F. An overview of Z39.50 for consumers / J.F. Williams // Library Technology Report. 1997. - Vol. 33, N5. - P.507-514.
65. ZING Z39.50 International: Next Generation Electronic resource. / Library of Congress, Washington DC. - Mode of access: http ://www.loc. gov/z3950/agency/zing/zing-home, html
-
Похожие работы
- Исследование принципов организации, функционирования и разработка распределенного электронного каталога библиотечного консорциума
- Организационные и технологические основы создания корпоративных информационных ресурсов библиотечных консорциумов
- Построение распределенных информационных систем на основе протокола Z39.50
- Формирование региональной автоматизированной системы публичных библиотек
- Библиотечные Интернет-комплексы