автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Технология построения информационно-справочных систем для научного сообщества

кандидата технических наук
Леонова, Юлия Викторовна
город
Новосибирск
год
2005
специальность ВАК РФ
05.25.05
цена
450 рублей
Диссертация по документальной информации на тему «Технология построения информационно-справочных систем для научного сообщества»

Автореферат диссертации по теме "Технология построения информационно-справочных систем для научного сообщества"

На правах рукописи

ЛЕОНОВА Юлия Викторовна

ТЕХНОЛОГИЯ ПОСТРОЕНИЯ ИНФОРМАЦИОННО-СПРАВОЧНЫХ СИСТЕМ ДЛЯ НАУЧНОГО СООБЩЕСТВА

Специальность 05.25.05 - Информационные системы и процессы, правовые

аспекты информатики

Автореферат диссертации на соискание ученой степени кандидата технических наук

Новосибирск - 2005

Работа выполнена в Институте вычислительных технологий Сибирского отделения РАН

Научный руководитель

член-корреспондент РАН, Федотов Анатолий Михайлович

Официальные оппоненты:

доктор технических наук, профессор

Елепов Борис Степанович

кандидат технических наук, Мазов Николай Алексеевич

Ведущая организация:

Институт вычислительного моделирования СО РАН

Защита состоится «1» июля 2005 г. в 14:30 на заседании Диссертационного совета Д 003.046.01 при Институте вычислительных технологий Сибирского отделения РАН по адресу: пр. Академика М.А.Лаврентьева, д. 6, 630090, Новосибирск, Россия Телефон: (383-2) 331882, Факс: (383-2) 306342 E-MAIL: dsovet@ict.nsc.ru

С диссертацией можно ознакомиться в читальном зале вычислительной математики и информатики отделения ГПНТБ и ИВТ СО РАН.

Отзывы на автореферат в двух экземплярах, заверенные печатью организации, следует направлять в адрес диссертационного совета.

Автореферат разослан «20» мая 2005 г

Ученый секретарь диссертационного совета, доктор физико-матема'

наук, профессор

6ЫЧ

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность исследования. Информационные ресурсы, переведепные в электронную форму, приобретают новое качество, которое обеспечивает им более широкое распространение и эффективное использование. Важными аспектами успешной научной деятельности являются информационная поддержка подготовки проектов, обеспечение научных мероприятий справочной информацией.

Необходимым условием деятельности для крупного территориально распределенного научного сообщества, такого как Сибирское отделение РАН (СО РАН) является доступ к управленческо-административным ресурсам (УАР). УАР - это информация о структуре научных организаций, контактная информация, данные о руководстве организаций, научных сотрудниках, описания проектов и т.п. Поэтому построение научной информационно-справочной системы (НИС), предназначенной для предоставления доступа к УАР СО РАН, является актуальной задачей.

Существует большое число справочных информационных систем, функционирующих на серверах организаций и хранящих информацию о научном сообществе, но эта информация разобщена по интерфейсам систем, что не дает возможности осуществления общего поиска по всем ресурсам. Необходимость объединения разрозненных научных информационных ресурсов в концептуально едипую справочную информационную систему, обеспечения централизованного поиска и доступа через единый интерфейс к информации является актуальной задачей.

Не все имеющиеся справочные системы удовлетворяют требованиям интероперабельности, то есть способности к взаимодействию с другими информационными системами, что делает невозможным интеграцию ресурсов этих систем и осуществление единого поиска по всем ресурсам. Важным системообразующим элементом построения единой справочной системы является унификация доступа к совокупности источников информации, что позволяет создать у пользователя иллюзию объединенного источника информации. Для успешной интеграции ресурсов в справочную систему требуется преодолеть различия в форматах и структуре даппых, поставляемых в нее из разных информационных источников.

Поэтому выработка технологических решений для построения единой информационно-справочной системы, обеспечивающей интеграцию существующих и вновь создаваемых информационных ресурсов в общее информационное пространство, является актуальной задачей.

Степень изученности проблемы. Идея сетевого и унифицированного доступа к справочным электронным ресурсам не нова. Одним из крупных проектов, связанных с построением единой справочной информационной системы была разработка рекомендаций Х.500. Х.500 (ISO 9594) представляет собой группу стандартов и рекомендаций для построения справочников (в русскоязычной литературе встречается также термин "служба каталогов", однако, по мнению автора, он не подчеркивает справочной специфики описываемой технологии). Рекомендации Х.500 предлагают построение глобального распределенного справочника, в котором части информации размещенные на различных серверах, объединены по определенным правилам, и, таким образом, с точки зрения пользователя, образуют единый логический каталог, то есть единую систему директорий.

Для доступа к справочникам в среде Internet в 1997 году был разработан протокол LDAP (Lightweight Directory Access Protocol). Фактически создание протокола LDAP было попыткой приспособить стандарт Х.500 к стеку протоколов TCP/IP.

Почти параллельно с Х.500 развивалась справочная информационная система WAIS (Wide Area Information Servers) - распредел вая система сети

Internet, которая обеспечивает поиск до

гмЛ

теме на основе

ключевых слов В результате проводимых библиотекой конгресса США исследований и разработок, технология WAIS превратилась в распределенную систему доступа к каталогам, содержащим каталожные карточки, а протокол Z39.50 был принят как международный стандарт Это сыграло ключевую роль в развитии распределенных систем доступа к каталогам и организации метаданных на базе стандарта Z39 50 Поскольку справочник - это частный случай каталога, на базе протокола Z39 50 может быть организован доступ к справочникам, в которых может содержаться и административная информация.

Кроме того, существуют также не стандартизированные справочные информационные системы, функционирующие на серверах организаций, которые содержат информацию о научном сообществе, такую как данные о публикациях, конференциях, проектах, информацию о структуре организаций, сотрудниках отдельных организаций, связях, совместных программах и т.п.

Проведенный анализ показал, что в настоящее время существуют различные рекомендации и стандарты построения справочных систем Также в научных учреждениях ведутся работы по созданию электронных справочных информационных ресурсов, в том числе и с использованием Интернет-технологий Однако для того, чтобы придать этому процессу системный характер, облегчить поиск необходимых ресурсов, необходимо, на наш взгляд, перейти к созданию интегрированных информационных систем научных учреждений, построенных на основе согласованных стандартов и с применением современных информационных технологий.

Цель диссертационной работы состоит в выработке технологических решений построения НИС, которые допускают как интеграцию разнородных информационных ресурсов, так и интеграцию с другими информационными системами

Для достижения этой цели решены следующие основные задачи:

1. Исследованы современные справочные информационные системы и определены требования, предъявляемые к информационным системам для построения интегрированных НИС.

2. Проведен анализ существующих технологий, протоколов и стандартов в области проектирования и построения информационно-справочных систем, с доступом через Internet.

3. Разработана модель информационных процессов в НИС.

4. Определены схемы данных для представления информации рассматриваемой предметной области.

5. Реализована прикладная логика и пользовательские интерфейсы НИС, обеспечивающие выполнение предъявляемых требований. Построена НИС на основе структурированной модели документа, поддерживающая много языков (как для интерфейсов, так и для хранимых документов), предоставляющая удобные интерфейсы для поиска, просмотра, редактирования документов и обеспечивающая разные права доступа к документам для разных категорий пользователей.

Научная новизна работы связана с разработкой технологии построения НИС

1. Предложены технологические требования, предъявляемые к основным элементам реализации НИС, которые должны учитываться при построении интегрированных НИС.

2. Впервые в научных справочных информационных системах был применен коллекционный подход для представления документов системе, позволяющий настраиваться на требуемую предметную область информационно-справочной системы.

3. Впервые предложена многоуровневая модель информационных процессов, обеспечивающая функционирование многопользовательской НИС и интероперабельность в другими системами.

4. Разработана информационная модель отношений между документами, позволяющая описывать отношения между персонами и организациями, персонами и проектами, организациями и подразделениями.

Практическая ценность

Предложенная информационная модель НИС реализована в информационной системе «База данных организаций и сотрудников СО РАН», а также в «Элеиропном полнотекстовом каталоге журналов» и «Электронном каталоге книг» для Издательства СО РАН.

Исходя из технологических требований к НИС, разработанная технология их построения может быть перенесена на другую предметную область. Примером такого переноса являются созданные автором «Электронный полнотекстовый каталог журналов» и «Электронный катало! книг» для Издательства СО РАН.

Достоверность и обоснованность результатов диссертационной работы подтверждаются:

1. Результатами анализа существующих технологий, протоколов и стандартов в области проектирования и построения информационно-справочных систем, с доступом через Internet.

2. Результатами анализа существующих научных информационно-справочных систем на соответствие технологическим требованиям.

3. Теоретическим обоснованием построенных моделей НИС.

4. Успешным практическим использованием системы «БД организаций и сотрудников СО РАН», заполнение которой осуществляется Президиумом СО РАН, отделами кадров институтов СО РАН.

5. Успешным практическим использованием в Издательстве СО РАН «Электронного полнотекстового каталога журналов» (содержит 18 журналов) и «Электронного каталога книг» (содержит информацию о ~ 800 книгах).

6. Признанием достижений автора на конференциях и присуждением автору диплома второй степени конкурса молодых ученых, проведенного администрацией Новосибирской области в 2002 г.

Основные положения, выносимые на защиту:

1) Предложены технологические требования, предъявляемые к основным элементам реализации НИС, позволяющие создавать интегрированные НИС, которые обеспечивают доступ через Интернет к разнородным информационным ресурсам.

2) Предложена информационная модель представления документов в системе, построенная на основе коллекционного подхода, которая не зависит от копкретной предметной области. На основе международных стандартов и рекомендаций

I обоснован выбор схем данных, позволяющих описывать структуры документов в

коллекциях НИС.

3) Предложена новая многоуровневая модель процессов в НИС, разработанная на основе современных международных стандартов взаимодействия открытых систем, которая обеспечивает функционирование многопользовательской НИС и интероперабельность с другими системами Предложена информационная модель отношений между документами, построенная на основе RDF, позволяющая описывать отношепия между персонами и организациями, персонами и проектами, организациями и подразделениями и т.п. Построена модель информационного хранилища, позволяющая реализовать доступ к распределенным БД.

4) На основе выработанных технологических решений разработаны научные информационно-справочные системы:

— «База данных организаций и сотрудников СО РАН», которая предоставляет доступ к справочной управленческо-административной информации СО РАН;

— «Электронный полнотекстовый каталог журналов», который предоставляет доступ к аннотациям и полным текстам статей из научных журналов, издаваемых в СО РАН;

— «Электронный каталог книг», который предоставляет доступ к описаниям учебников, научных и научно-популярных книг, издаваемых в СО РАН, с возможностью заказа книг.

Личный вклад автора. Основные результаты, представленные в работе, получены непосредственно автором, а именно: технологические требования, предъявляемые к НИС, структурированная модель документа, модель представления отношений между документами, модель информационных процессов, обоснование выбора схем данных для описания структуры документов, модель информационного хранилища, информационные системы «БД организаций и сотрудников СО РАН», электронный полнотекстовый каталог журналов и электронный каталог книг для Издательства СО РАН.

Апробация работы. Научные результаты, изложенные в диссертации докладывались на следующих конференциях: Конференция молодых ученых, посвященной 10-летию ИВТ СО РАН, Новосибирск, 2000; VI-VIII международные рабочие совещания по электронным публикациям (El-Pub), Новосибирск, 2001-2004, Конференция, посвященная 90-летию со дня рождения A.A. Ляпунова, Новосибирск, 2001; Конференции молодых ученых по математическому моделированию и информационным технологиям, Новосибирск, 2001, 2002, Красноярск, 2003; Международная конференция «Вычислительные технологии и математическое моделирование в науке, технике и образовании», Алма-Ата, 2002; Четвертая Всероссийская научная конференция «Электронные библиотеки- перспективные методы и технологии, электронные коллекции», Дубна, 2002; Международные конференции "Вычислительные и информационные технологии в науке, технике и образовании", Усть-Каменогорск. 2003, Алма-Ата, 2004; Ш Всероссийская конференция «Математика, информатика, управление», посвященной памяти профессора OB. Васильева, Иркутск, 2004.

Работа «Интегрированная информационная система научного сообщества» в 2002 г. была награждена дипломом второй степени конкурса молодых ученых, проведенного администрацией Новосибирской области.

Публикации. По теме диссертации опубликовано 17 печатных работ из них 8 тезисов.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Структура и объем работы

Диссертация состоит из введения, 4 глав, заключения, списка цитированной литературы, 5-ти приложений Основное содержание работы изложено на 125 страницах текста, содержит 46 рисунков, 7 таблиц Список цитированной литературы включает 72 наименования

Во введении обосновывается актуальность темы диссертационной работы, рассматривается изученность проблемы, представляются цель и задачи исследования Определяются научная новизна и практическая значимость, приводятся основные результаты работы. Также формулируются основные положения, выдвигаемые на защиту

Первая глава посвящена исследованию современных справочных НИС и определению требований, предъявляемых к интегрированным НИС.

В разделе 1.1 определены и охарактеризованы недостатки некоторых функционирующих НИС. Обозначена проблема, связанная с обновлением информации функционирующих НИС - ее актуализация. Для решения проблемы актуализации в информационно-справочных системах предлагается располагать информацию таким образом, чтобы она сопровождалась (администрировалась) непосредственно людьми, собирающими эту информацию на местах, например администраторами институтов, т е. информация должна собираться там, где она образуется.

В разделе 1 2 обозначены задачи, которые должна решать НИС и сформулированы требования потенциальных пользователей НИС. На основании пользовательских требований определены технологические требования, предъявляемые к основным элементам реализации НИС:

1 Распределенность. Информация должна храниться там, где образуется (например, на разных компьютерах, распределенных в сети, в разных таблицах), но вся обработка информации должна выполняться центральным диспетчером, т.е. система должна быть централизованно-распределенной Распределенность нужна только в некоторых случаях:

1) при необходимости х-ранения документов в месте их создания;

2) если некоторые части НИС являются уже существующими ИС, такими, как кадровые базы.

Соответственно для обеспечения интеграции ресурсов НИС СО РАН должна допускать возможность работы с коллекциями, расположенными на различных серверах, различных аппаратно-программных платформах. Коллекция состоит из таблиц, имеющих одинаковую логическую структуру.

2. Децентрализация. Коллекции и/или их части могут администрироваться различными людьми, обеспечивающими актуализацию информации. НИС должна предоставлять различные уровни административных прав по доступу к информации. Например, администратор системы имеет полный доступ к информационным ресурсам системы, а администратор подразделения может модифицировать только информацию о своем подразделении.

3. Сопряжение с другими системами. Это требование вытекает, в том числе, из распределенности.

Должен использоваться унифицированный интерфейс запроса и ответа, позволяющий интегрировать ресурсы НИС с другими системами. Приложение должно взаимодействовать с НИС, которая перенаправляет запросы информационному хранилищу, используя унифицированный формат запроса (именованный запрос) и получать результат в унифицированном формате, например XML (extensible Markup Language - расширяемый язык для разметки текстовой информации).

4. Открытость и расширяемость. В качестве интеграционной основы информационная система должна использовать принципы открытых систем, суть которых состоит в обеспечении совместимости используемых программных компонентов за счет применения развивающихся, общедоступных и общепризнанных стандартов на продукты информационных технологий. Поэтому общая схема системы должна удовлетворять двум основным требованиям:

1) иметь многоуровневую структуру, аналогичную иерархической модели открытых систем (OSI - Open System Interconnect);

2) должна быть основана на метаданных для описания структуры и содержания ресурсов, что сразу обеспечит выполнение требования сопряжения с другими системами. Для выполнения этого требования необходимо при подключении таблиц использовать единый стандарт именования полей (схемы данных, например, LDAP для персон) или использовать таблицу соответствия полей Также необходимо использовать унифицированные словари значений для унификации ввода информации и организации поиска. При подключении таблицы должны быть приведены в соответствие с существующими словарями.

5. Независимость системы от структуры коллекции. Настройка НИС на работу с другой коллекцией должна выполняться без изменения программного кода системы, что достигается использованием метаданных. НИС может работать с коллекцией, если документы коллекции имеют правильное метаописание.

6 Обеспечение навигации между документами на основе классификационных признаков и связей. Это требование не является принципиальным.

7 Метапоиск обеспечивается выполнением трех требований:

1) объединение распределенных таблиц при поиске, что обусловлено требованием распределенности, и достигается использованием метаданных. При поиске система должна настраиваться по метаописанию на зарегистрированные в ней таблицы и выполнять одновременный поиск по всем этим таблицам. Полученные в результате поиска данные, должны обрабатываться системой (извлечение данных для внешнего представления, сортировка и т.п ).

2) использование различных видов атрибутного поиска, что обусловлено справочным назначением системы:

— поиск по словарю (тематический) обладает большей точностью и полнотой по сравнению с простым контекстным поиском, так как позволяет искать документы по заданной теме;

— поиск с учетом синонимов с одной стороны увеличивает полноту выборки, а с другой стороны увеличивает объем "шума" Однако в некоторых случаях он просто необходим, например, в случае различных сокращений может иметься несколько вариантов написания слова;

3) применение каталогизаг{ии, которая необходима для более точного описания документов, что облегчает их поиск. Документ в своей структуре наряду с информационным содержанием должен содержать элементы каталожной карточки - описательные метаданные, такие как автор, название, дата создания и т.д., используемые при организации поиска не по пространству первичных документов, а по их описаниям.

На основании проведенного анализа некоторых функционирующих НИС (ЕНИП, Соционет, Информика) выявлено, что ни одна из рассмотренных НИС не удовлетворяет в полной мере сформулированным технологическим требованиям, предъявляемых к построению интегрированных НИС. Это обстоятельство приводит к необходимости разработки собственной НИС, которая соответствовала бы сформулированным требованиям.

Вторая глава посвящена разработке информационной модели НИС.

В разделе 2.1 рассматривается информационная модель представления документов в системе НИС представляется как множество связанных различными отношениями документов Даются определения документа и коллекции.

Документом с!, называется пара: = <5,, V, >,

где 5, - структура документа в соответствии с выбранной схемой данных, V, - содержание документа (информационное наполнение).

В НИС документом является информационный ресурс, которому приписаны структурные метаданные.

Коллекция - это множество документов с выделенной фиксированной структурой, содержание которых имеет одинаковую тематическую направленность Унифицированность работы с документами достигается благодаря тому, что документы, принадлежащие одной коллекции, имеют одинаковые структурные метаданные Описывается модель информационных процессов в НИС, имеющая пять уровней (рис 1) Движение информации между уровнями осуществляется в обе стороны, что обеспечивает возможность, как презентации информации, так и внесения изменений.

Внешний Внешний

запрос запрос Шаблон

доступа

Движение документа Хранимое представление - Обработка документа Внутреннее представление

Рис 1. Модель информационных процессов в НИС

Функционирование информационной модели процессов при направлении движения информации "уровень презентации - уровень хранения" представлено следующим образом:

1. "Уровень хранения" - выполняет выборку информации из информационного хранилища.

2 "Уровень коллекции" - выполняет вычисление отношений и подтверждение прав

доступа запроса к документу на уровне его структуры. 3. "Уровень обмена" - выполняет генерацию внутреннего представления документа Внутреннее представление - это промежуточный документ, содержащий полный набор элементов (без учета прав доступа) в обменном формате (содержащий в себе описание структуры данных и сами данные) для внешних запросов Для выполнения поиска и каталогизации ИС необходим доступ к документу, содержащему полную информацию, вне зависимости от прав. Кроме того, при выполнении обмена информацией между различными системами также необходимо передавать полный документ.

4 "Уровень отбора" - на основании запроса и прав доступа выполняет отбор необходимых элементов документа {усеченный документ) Усеченный документ необходим при просмотре документа. 5. "Уровень презентации" - генерирует презентационное представление документа в

виде, удобном для пользователя В разделе 2 2 приводится описание структурированной модели документа. Даются основные определения.

Схема данных - совокупность элементов, имена которых фиксированы. Элемент схемы данных коллекции называется структурным элементом (далее просто элемент). Элемент имеет идентификатор и обладает некоторыми свойствами, определяющими характер работы с элементом. Тип элемента является его свойством Экземпляр элемента имеет значение (или содержание) Структура документа - это набор элементов Содержание документа - объединение значений экземпляров элементов, составляющих документ.

На множестве значений элементов могут быть заданы функции Основным предназначением функций является генерация виртуальных элементов, например, преобразование имени, отчества в инициалы Здесь совокупность двух элементов отображается в новый элемент, отсутствующий в системе, но определенный в схеме данных.

Документ может быть простым или сложным Простой документ, в отличие от сложного, не имеет связей с другими документами.

В разделе 2.3 обосновывается выбор схем данных для описания структуры документов.

НИС содержит следующие коллекции:

— коллекции, содержащие основную информацию в системе - «Персоны» и «Организации»;

— дополнительные коллекции'

1) коллекция «Неструктурированные документы», содержащая дополнительную информацию, как по персонам, так и по организациям

2) коллекция «Каталог» (публикаций, проектов и т д.).

Дополнительные коллекции могут быть и внешними по отношению к НИС, например, «БД основных разработок институтов СО РАН»

Имена элементов схемы данных формируются в соответствии с требованиями международных стандартов (если они есть) Для представления персон и организаций выбраны схема данных Dublin Соге (стандарт метаданных Дублинского ядра, набор элементов для описания широкого спектра сетевых ресурсов) и схема данных LDAP, а для дополнительных коллекций - схема данных Dublin Соге

В разделе 2.4 рассматривается модель описания отношений между документами В основу нашей модели отношений между документами в НИС легла модель RDF (Resource Description Framework) Основное отличие предлагаемой модели от модели RDF состоит в том, что выстраиваемые в НИС отношения переносятся на уровень элементов, определяющих структуру документов. В НИС само отношение определяется не ресурсом, а структурными метаданными коллекций документов системы.

В НИС связи между документами устанавливаются путем задания на множестве документов бинарных отношений, которые в соответствии с правилами RDF могут быть записаны в виде A(R,V)' объект R имеет атрибут А со значением V Например, тот факт, что Иванов А И занимает некоторую должность (post) в ИВТ СО РАН, записывается как Post('HBT СО РАН', 'Иванов А И'), где Post - то или иное значение из списка (тезауруса) должностей. В НИС выделяются два вида отношений:

— Отношение порядка между документами, выстраивающее иерархию подчинения в коллекции, например отношение подчиненности между документами в коллекции «Организации»: Head ('ИВТ СО РАН', 'ННЦ').

Отметим, что такой тип отношения предполагает установление только односторонней связи между документами

— Отношение связи между документами, например отношение "принадлежности" между документами коллекции «Организации» и документами коллекции «Персоны»: Post ('ИВТ СО РАН', 'Иванов А.И '). Этот тип отношения допускает установление двусторонней связи между документами, в том смысле, что одновременно может существовать и обратная связь, например Position ('Иванов А И ', 'ИВТ СО РАН') Направленность связи определяется порядком записи аргументов отношения A(R,V)

Отношения первого типа, как правило, имеют не более одного атрибута, например "тип подчинения" (территориальное, научно-методическое и т д )

Отношения второго типа, как правило, имеют несколько дополнительных атрибутов Например, отношение "Post" не просто описывает принадлежность персоны к организации, но и обладает следующими атрибутами: название должности, ключевые слова, дата назначения, дата освобождения от должности, видимость документа и др

Для отношения A(R,V) аргументом R называется головной документ, а V - подчиненный документ В НИС выделено четыре вида отношений и все они - отношения типа "головной-подчиненный".

В документе можно выделить два вида элементов.

1) элементы, содержание которых не зависит от значений атрибутов отношения,

2) элементы, содержание которых можег зависеть от значений атрибутов отношения (например, от должности персоны в организации зависит служебная информация)

Заметим, что элементы второго вида могут содержать списки ссылок на другие документы, списки вставок

В третьей главе приводится описание информационного хранилища.

В разделе 3 1 дается обоснование выбора реляционной модели для модели хранения коллекций.

В разделе 3 2 описана реализация информационного хранилища, которое представляет собой надстройку над СУБД, по запросу предоставляющую доступ к таблицам, соответствующим одной коллекции, которые могут быть распределены по сети В этом же разделе формулируются технологические принципы построения информационного хранилища-

1) Регистрация. В системе выполняется определение прав доступа и физического расположения базы данных Базе данных сопоставляется соответствующий идентификатор для доступа к ней в системе, физический адрес в сети, права и пароли доступа.

2) Именование. К системе могут подключаться различные таблицы, которые могут г не соответствовать стандартной схеме данных коллекции На уровне именования

выполняется установление взаимосвязи между стандартной схемой данных коллекции и схемой данных конкретной таблицы.

3) Провайдер данных. Использование провайдера данных позволяет приложению абстрагироваться от типа СУБД, под которыми функционируют конкретные базы данных в информационном хранилище Другими словами, приложение обращается к провайдеру данных стандартным образом, а провайдер данных уже обращается к конкретной СУБД

Здесь же описана реализация технологических принципов в информационном хранилище и взаимодействие с базой данных Провайдер данных представляет собой совокупность Ядра и набора драйверов Коллекция направляет именованные запросы провайдеру данных (рис. 2). Именованный запрос отличается 01 ЗС^Ь-запроса тем, что в нем указываются не реальные названия таблиц и полей, а названия стандартной схемы данных Ядро, приняв именованный запрос от коллекции, в зависимости от метода доступа конвертирует его в синтаксис 8(ЗЬ-запроса к конкретной базе данных Далее Ядро активизирует определенный драйвер этого типа БД и передает ему SQL-запрос для выполнения

Провайдер данных

Рис.2. Схема функционирования ядра

В разделе 3 3 дается отображение информационной модели отношений на реляционную модель. Для представления отношений в информационном хранилище выбран способ "таблица на свойство", в котором для каждого отношения строится своя матрица инцидентности. Такая модель представления отношений отвечает предъявляемым требованиям к системе, поскольку такое представление является унифицированным и не зависит от конкретного свойства и позволяет моделировать как отношения, так и дополнительные свойства, которые, как правило, появляются в процессе существования системы. Гем самым появление новых свойств не отражается на общей целостности системы.

В разделе 3.4 на основе модели отношений описывается представление информации на нескольких языках Свойство-отношение "язык" - отношение первого типа. В документах НИС выделяются два типа элементов:

1) элементы, содержание которых не зависит от языка;

2) элементы, содержание которых зависит от языка.

Для НИС построена модель представления многоязычной информации, которая является аналогом модели представления многоязычной информации в тезаурусе, модифицированной с учетом модели документа. Рассматривается модель представления многоязычной информации в информационных коллекциях и словарях и ее отображение на реляционную модель.

В разделе 3 5 описываются информационные коллекции. Приведено описание схем данных информационных коллекций. Описывается представление свойств-отношений (второго типа) в документах на примере свойства "Position".

Персона может занимать различные позиции: быть автором или редактором публикации, занимать некоторую должность в организации, быть председателем или членом совета и т.д.

В документах коллекции "Персоны" выделяются два вида элементов:

1) элементы, содержание которых не зависит от позиции персоны в организации,

2) элементы, содержание которых зависит от позиции персоны в организации (служебная информация).

Отмечено, что элементы второго вида, как правило, являются множественными Все версии служебной информации персоны содержатся во внутреннем представлении документа. При запросе выбирается нужная версия служебной информации В этом же разделе приводится реляционное представление информационных коллекций Также описывается тезаурус Position, применяемый для классификации отношений между персонами и организациями. Тезаурус Position содержит список наименований позиций и отношения между ними, существующих в рамках научных организаций. Тезаурус «Position», прежде всего, необходим

1) для именования отношения принадлежности персоны к организации,

2) для группировки (сортировки) персон по должностям

Часть из позиций являются должностями, а часть - названиями групп должностей.

В четвертой главе содержится описание программного обеспечения с использованием представленной в работе технологии построения НИС

В разделе 4 1 рассматриваются технологические принципы построения НИС Технологическая часть НИС основывается на многоуровневой модели клиент-сервер НИС реализована в виде Web-приложения и функционирует в режиме запрос-ответ В информационной модели НИС внутреннее представление документа отделено от презентационного представления документа, поэтому при реализации НИС выделяются два компонента:

— ядро НИС (далее ядро), обеспечивающее работу клиентов с НИС;

— приложения НИС (далее приложения), реализующие клиентские запросы и формирование человеко-машинного интерфейса, который обеспечивает работу пользователей с НИС Приложения посылают запрос ядру НИС согласно протоколу запроса.

Реализованными приложениями являются— информационная система "БД организаций и сотрудников СО РАН";

— электронный полнотекстовый каталог журналов и электронный каталог книг для Издательства СО РАН

— приложения, предназначенные для сборки составных документов.

Ядро предоставляет интерфейсы для выполнения запросов от приложений. Реализованы интерфейсы, поддерживающие выполнение следующих запросов от приложений:

— запрос на выдачу списка документов из коллекции (персон, организаций, должностей, метаданных и т д.);

— запрос на выдачу документа из коллекции (о персоне, организации, метаданных элемента и т.д.);

— запрос на обновление документа в коллекции (добавление, исправление, удаление) информации;

По функциональному назначению интерфейсы ядра НИС разбиваются на два типа— интерфейсы для извлечение информации - получают запрос от приложения, а в качестве ответа возвращают внутреннее представление документа (ВПД);

— интерфейсы для модификации информации - получают запрос от приложения, выполняют операцию над документом (исправление, удаление, добавление) и возвращают стандартный ответ, соответствующий успешному или неуспешному выполнению запроса.

При выполнении запроса на извлечение информации работа приложения разделяется на три этапа:

1. формирование запроса через человеко-машинный интерфейс;

2. извлечение ВПД из хранилища;

3. обработка приложением управляющих параметров шаблона и генерация презентационного представления документа.

В разделе 4.2 описывается информационная система "База данных организаций и сотрудников СО РАН". Стартовая страница информационной системы содержит переключатель между русскоязычной и англоязычной версией и ссылки на четыре раздела:

— Список организаций;

— Поиск сотрудников СО РАН;

— Поиск организаций СО РАН;

— Авторизованный вход.

Первые три раздела предназначены для доступа к публичной информации и относятся к пользовательской части системы. Последний раздел относится к административной части системы.

Пользовательская часть ИС обеспечивает следующие возможности:

— Просмотр информации и навигацию по структуре;

— Поиск информации по запросам и просмотр выданной по запросам информации Раздел "Список организаций" отражает организационно-сгруктурное деление СО РАН Навигация позволяет получить информацию о научно-методическом подчинении и структурных подразделениях СО РАН, обеспечивает доступ к информационным ресурсам этих подразделений, к информации об основных направлениях деятельности подразделений, к данным об администрации и о сотрудниках подразделений. Страница данного раздела обеспечивает навигацию по структуре зависимостей иерархической модели подчинения, сходящейся к одному подразделению или человеку (рис. 3).

Связи подчинения могут быть следующих типов:

— территориальное подчинение;

— научно-методическое подчинение;

— административное (юридическое) подчинение.

Навигационная часть ИС (навигатор) построена по принципу тезауруса и позволяет пользователю перемещаться по иерархии дерева, начиная от корня (рис 4) Когда пользователь перемещается по узлам дерева, то на странице ИС он видит семантическую информацию текущего узла (организация) и список подчиненных узлов дерева (подчиненные подразделения), представленный гипсрссылками Выбрав нужную

гиперссылку, пользователь может открыть страницу подразделения, содержащую информацию об этом подразделении и его структуре

файл еваеие^Спяе** ^

Мм»

См*»"»** С*т*»»"« *

Сибирское отделение Российской академии наук

630ОТ0 НяюсяСнрск.

» ---------- -------------~~ г г' -«igaswka.

Рис. 3. Страница раздела "Список организаций"

На странице организации имеется раздел "Администрация", содержащий ссылку на документ с информацией о руководящем составе и сотрудниках организации. Списки сотрудников формируются в соответствии с правилами выдачи и сортировки

1) для каждого элемента списка выдается краткая визитная карточка сотрудника или ФИО со ссылкой на полную визитную карточку сотрудника, выдаваемую по шаблону сотрудника;

2) используется сортировка сотрудников по должностям в соответствии с тезаурусом «Position».

Рис. 4 Пример навигационной структуры «подчинения» в СО РАН Раздел "Поиск сотрудников СО РАН" позволяет вести поиск сотрудников по фамилии, имени, отчеству, специальности, ключевым словам, раздел "Поиск организаций СО РАН" - поиск организаций по названию, ключевым словам Результат поиска - список сотрудников или организаций, удовлетворяющих условиям поиска При поиске используется алфавитная сортировка.

— В разделе 4 3 описывается административная часть приложения "БД организаций и сотрудников СО РАН" (рис 5), которая обеспечивает: навигацию, модификацию (ввод, редактирование, удаление) и просмотр информации, а также управления правами пользователей системы.

В административной части системы имеется следующая иерархия пользователей'

— суперадминистратор системы;

— администратор организации;

— привилегированный пользователь системы

j В» 6» 4f— ***** pg^^gP

J - -О» 4 Щ HA***., wmmt ошк», a-i<

¿2¿aR

ДОПОЛНИТЕЛЬНАЯ ИНФОРМАЦИЯ. 1Си»иим1

—Mi

Поля, о&оатимшм Ч"

'■an. оботаачащ I* |

OfemizMinn пщпе fhriEt) [-)

11олю< пашне ирг»»а*м [ *]

ОгЩЛ|7*ИК1 Mm (|Ы1> [*]

^СЦГ

Рис.5. Интерфейс редактирования информации об организации

Введение такой иерархии также позволяет реализовать доступ пользователей к тематическим группам информации, а также возможность формирования запросов на модификацию в соответствии с правами пользователей. В заключении приводятся основные результаты работы'

1 Построена структурированная модель документа и предложена информационная модель представления документов в системе, построенная на основе коллекционного подхода. Эта модель не зависит от конкретной предметной области и может быть адаптирована к другой предметной области путем введения метаданных

2. Предложена многоуровневая модель информационных процессов, обеспечивающая функционирование многопользовательской НИС и интероперабельность с другими системами.

3 Предложена информационная модель отношений между документами, позволяющая описывать отношения между персонами и организациями, персонами и проектами, организациями и подразделениями

4 Предложена реализация НИС в виде следующих коллекций документов

— коллекций, содержащих основную информацию в системе - «Персоны» и «Организации»;

— дополнительных коллекций-

1) коллекции «Неструктурированные документы», содержащей дополнитеяьную информацию, как по персонам, так и по организациям;

2) коллекции «Каталш » (публикаций, проектов и т д )

На основе международных стандартов и рекомендаций выбраны следующие схемы данных, необходимые для описания структуры документов в коллекциях' для представления персон и организаций - схемы данных Dublin Core и LDAP, а для дополнительных коллекций - схема данных Dublin Core Количество коллекций в системе может быть расширено при необходимости

5 Реализована модель информационного хранилища, предоставляющего по запросу доступ к таблицам, соответствующим одной коллекции, которые могут быть распределены по сети.

6. Разработашше технологические принципы реализованы в ИС «База данных организаций и сотрудников СО РАН», и применены в «Электронпом полнотекстовом каталоге журналов» и «Электронном каталоге книг» для Издательства СО РАН.

Дальнейшее развитие и применение технологии, предложенной в диссертации, представляется перспективным. Основные направления развития НИС связаны с расширением предложенной технологии на реализацию других коллекций и других отношений, которые возникают в научном сообществе: проекты, научные достижения, разработки и т.д.

Внедрение результатов диссертации подтверждено актами о внедрении.

В приложении 1 приводится описание схемы данных Dublin Core, в приложении 2 -описание схемы данных LDAP. В приложении 3 представлено полное внутреннее представление документа, содержащего информацию об Институте вычислительных технологий. В приложении 4 содержится описание модели представления многоязычной информации в тезаурусах. Приложение 5 содержит акты о внедрении, подтверждающие применение полученных в диссертационной работе результатов. Основные результаты исследований по теме диссертации опубликованы в следующих работах:

1. Леонова Ю.В. К проблеме использования географических информационных систем для формирования баз данных по биологическому разнообразию // Труды Конференции молодых ученых, посвященной 10-летию ИВТ СО РАН, Новосибирск: ИВТ СО РАН, 2000.-T. I. - С.44-48.

2. Леонова Ю.В. Использование JSP шаблонов для инкапсуляции компоновки Web-страниц и поддержки модульного проектирования // Материалы VI рабочего совещания по электронным публикациям "El-Pub2001", Новосибирск: ИВТ СО РАН, 2001. -http://www.ict.nsc.ru/ws/elpub2001/2032/

3. Леонова Ю.В. Информационная система «База данных организаций и сотрудников Сибирского отделения РАН» // Тезисы конференции молодых ученых по математике, математическому моделированию и информатике, Новосибирск: ИВТ СО РАН, 2001. -С.46.

4. Ермаков Н.Б., Леонова Ю.В., Федотов A.M. Использование информационных систем для формирования баз данных по биологическому разнообразию // Труды Конференции, посвященной 90-летию со дня рождения A.A. Ляпунова - Новосибирск, 2001. - С.203-208.

5. Леонова Ю.В., Федотов A.M., Шокин Ю.И. Технология создания распределенных информационных систем на примере системы ИРИС // Вычислительные технологии, Спец. Выпуск - 2002. Т.7, №3. - Ч.З. - С. 207-215.

6. Леонова Ю.В. Объектный подход к построению информационных систем // Тезисы международной конференции молодых ученых по математическому моделированию и информационным технологиям, Новосибирск: ИВТ СО РАН, 2002. - С.61 -62.

7. Шокин Ю.И., Федотов А.М, Леонова Ю.В. Объектная модель документа в электронных коллекциях // Материалы УП Международной конференции по электронным публикациям "El-Pub2002", Новосибирск, 2002 г., http://www.ict nsc.ru/ws/elpub2002/4488/

8. Леонова Ю.В., Федотов A.M. Структурные метаданные в технологии распределенного обмена // Материалы VII Международной конференции по электронным публикациям "EL-Pub2002", Новосибирск: ИВТ СО РАН, 2002. http://www.ict nsc.ru/ws/show_abstract.dhtml?ru+45+4527.

9. Шокин Ю.И., Федотов A.M., Леонова Ю.В. Принцип динамического формирования документов в информационных системах, па примере интегрированной распределенной информационной системы (ИРИС) СО РАН // Труды Четвертой Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» - Дубна, 2002. - Т.2. - С.159-169.

10. Леонова Ю.В., Федотов А.М Унификация доступа к данным в ИРИС // Материалы VTII Международной конференции по электронным публикациям "El-Pub2003", Новосибирск- ИВТ СО РАН, 2003 - httpVAvww ict nsc.ru/ws/elpub2003/6198/

11. Леонова Ю.В Система информационного обеспечения научного сообщества технология построения и содержательное наполнение // Тезисы IV Всероссийской конференции молодых ученых по математическому моделированию и информационным технологиям, Красноярск- ИВМ СО РАН, 2003. - С 61

12. Леонова Ю.В., Федотов А.М О содержательном наполнении системы информационного обеспечения научного сообщества // Вычислительные технологии, (Совместный выпуск) Региональный вестник Востока, 2003 - 4.4. - С. 294-303.

13 Леонова Ю.В., Федотов А.М Унификация доступа к данным в ИРИС// Вычислительные технологии, (Совместный выпуск) Региональный вестник Востока -2003. -Т.8, №3.-4.4, С. 304-311.

14. Шокин Ю И., Федотов A.M., Клименко О А, Леонова Ю.В. Содержательное наполнение справочно-информационной системы научною сообщества // Вычислительные технологии, (Совместный выпуск) Вестник КазНУ им аль-Фараби Серия: Математика, механика, информатика -2004. - Т. 42, № 3.-Ч.4 - С. 346-350. 15 Шокин ЮИ, Федотов A.M., Клименко O.A., Леонова Ю.В. Справочно-информационная система СО РАН // Материалы IX рабочего совещания по электронным публикациям (EL-Pub 2004), Новосибирск: ИВТ СО РАН, 2004 http://www.ict.nsc.ru/ws/elpub2004

16. Информационная система «База данных организаций и сотрудников СО РАН» (справочно-методические материалы) / Леонова Ю.В., Клименко O.A.; под ред. Федотова А.М - Новосибирск: РИЦ "Прайс-Курьер", 2005.

17. Барахнин В.Б., Леонова Ю.В. Информационная модель отношений между документами в информационной системе // Вычислительные технологии - 2005 -Т10, №3. -С. 23-33.

Соискатель Леонова Ю В.

Отпечатано в ЗАО РИЦ «Прайс-курьер», тел 307-202, зак № Ъ5Ч .тираж -100

¡

РНБ Русский фонд

2006-4 6314

Оглавление автор диссертации — кандидата технических наук Леонова, Юлия Викторовна

ВВЕДЕНИЕ.

ГЛАВА 1 ИССЛЕДОВАНИЕ СОВРЕМЕННЫХ СПРАВОЧНЫХ НИС И ОПРЕДЕЛЕНИЕ ТРЕБОВАНИЙ, ПРЕДЪЯВЛЯЕМЫХ К ИНТЕГРИРОВАННЫМ НИС.

1.1 Анализ недостатков существующих НИС.

1.2 Определение требований, предъявляемых к НИС.

1.3 Обзор наиболее близких решений.

Выводы к главе 1.

ГЛАВА 2 ИНФОРМАЦИОННАЯ МОДЕЛЬ НИС.

2.1 Информационная модель НИС.

2.2 Информационная модель документа.

2.3 Выбор схемы данных.

2.4 Модель отношений между документами.

Выводы к главе 2.

ГЛАВА 3 ИНФОРМАЦИОННОЕ ХРАНИЛИЩЕ.

3.1 выбор модели хранения коллекций.:.

3.2 Уровень реализации хранилища данных.

3.3 Отображение информационной модели отношений на реляционную модель.

3.4 Представление информации на нескольких языках.

3.5 Описание информационных коллекций.

Выводы к главе 3.

ГЛАВА 4 РЕАЛИЗАЦИЯ И ВНЕДРЕНИЕ.

4.1 технологические принципы реализации НИС.

4.2 Описание приложения "БД Организаций и сотрудников СО РАН".

4.3 Описание приложения "администратор БД Организаций и сотрудников СО РАН".

Выводы к главе 4.

Введение 2005 год, диссертация по документальной информации, Леонова, Юлия Викторовна

Актуальность исследования

Информационные ресурсы, переведенные в электронную форму, приобретают новое качество, которое обеспечивает им более широкое распространение и эффективное использование. Важными аспектами успешной научной деятельности являются информационная поддержка подготовки проектов, обеспечение научных мероприятий справочной информацией.

Необходимым условием деятельности для крупного территориально распределенного научного сообщества, такого как Сибирское отделение РАН (СО РАН), является доступ к управленческо-административным ресурсам (УАР). УАР [58] - это информация о структуре научных организаций, контактная информация, данные о руководстве организаций, научных сотрудниках, описания проектов и т.п. Поэтому построение научной информационно-справочной системы (НИС), предназначенной для предоставления доступа к УАР СО РАН, является актуальной задачей.

Существует большое число справочных информационных систем, функционирующих на серверах. организаций и хранящих информацию о научном сообществе, но эта информация разобщена по интерфейсам систем, что не дает возможности осуществления общего поиска по всем ресурсам. Необходимость объединения разрозненных научных информационных ресурсов в концептуально единую справочную информационную систему, обеспечения централизованного поиска и доступа через единый интерфейс к информации является актуальной задачей.

Не все имеющиеся справочные системы удовлетворяют требованиям интероперабельности, то есть способности к взаимодействию с другими информационными системами, что делает невозможным интеграцию ресурсов этих систем и осуществление единого поиска по всем ресурсам. Важным системообразующим элементом построения единой справочной системы является унификация доступа к совокупности источников информации, что позволяет создать у пользователя иллюзию объединенного источника информации. Для успешной интеграции ресурсов в справочную систему требуется преодолеть различия в форматах и структуре данных, поставляемых в нее из разных информационных источников.

Поэтому выработка технологических решений для построения единой информационно-справочной системы, обеспечивающей интеграцию существующих и вновь создаваемых информационных ресурсов в общее информационное пространство, является актуальной задачей. Важнейшие аспекты этой задачи: интеграция информационных ресурсов в единое пространство; использование метаданных для описания информационных ресурсов; применение открытых стандартов взаимодействия систем, поиска, обмена и представления информации.

При формировании своей содержательной информации НИС должна использовать информацию, которая находится в организациях СО РАН, например, такие информационные ресурсы как кадровые базы, информационные системы, содержащие управленческо-административную информацию.

Взаимодействие НИС с другими информационными системами может строиться на общих стандартах OSI, единых схемах данных, согласовании схем данных НИС и подключаемых информационных систем. Для обеспечения доступа должна быть решена доверительность на уровень поиска и сформулированы правила доступа, реализованные в НИС.

Разработанная НИС может быть использована как единая «точка входа» для доступа к различным ресурсам, создаваемых в организациях СО РАН, включая и кадровые базы.

Таким образом, при создании НИС были решены следующие важные задачи: интеграция информационных ресурсов; разработка удобного для пользователя интерфейса;

• соблюдение требований интероперабельности.

Для обеспечения решения этих задач была проделана следующая работа.

Построена модель документов, формализована структура обменных документов для обеспечения интероперабельности.

Построена модель взаимодействия НИС с другими системами.

Разработаны механизмы представления пользовательских интерфейсов НИС на основе шаблонов, описывающих способ визуализации информации.

Степень изученности проблемы

Идея сетевого и унифицированного доступа к справочным электронным ресурсам не нова.

Одним из крупных проектов построения единой справочной информационной системы была разработка рекомендаций Х.500, описывающего работу электронного справочника.

Рекомендации справочника3 Х.500 разработаны Международным телекоммуникационным союзом - ITU, как справочная служба для систем передачи сообщений на основе стандарта Х.400. Х.500 (ISO 9594) представляет собой группу стандартов и рекомендаций для построения справочников [68]. Первая его версия появилась в 1988 году, затем она дорабатывалась в 1993 и 1996 годах. Х.500 предлагает описание модели, услуги протоколов взаимодействия справочных систем и является частью модели взаимодействия открытых систем (ВОС, OSI). Главная его цель - обеспечить доступ различных систем (почтовых служб, систем выдачи сертификатов, электронной подписи) к единой справочной информации. С этой точки зрения Х.500, как и другие стандарты OSI, определяет правила "внешнего" поведения систем с минимальными предположениями об их внутреннем устройстве.

Справочник Х.500 может содержать сетевую информацию, адреса электронной почты, телефонные номера и другую информацию, например, касающуюся идентификации и авторизации пользователей. Услуги справочника могут предоставляться как другим приложениям, так и конечным пользователям. Человек может искать в справочнике номер телефона, а приложение - например, сетевой адрес какого-либо другого процесса.

Стандарт Х.500 появился, конечно же, не на пустом месте - у него есть предшественники, опыт использования которых был учтен в ходе разработки. Среди них важное место занимает протокол finger, при помощи которого пользователи ОС Unix получали информацию друг о друге.

Предшествующий опыт позволил сформулировать требования, предъявляемые к идеальному справочнику [33]. Он должен иметь: децентрализованное управление: каждый сервер должен отвечать только за свою локальную часть базы справочника, чтобы обновление данных и сопровождение можно было выполнять немедленно; мощные возможности поиска, позволяющие пользователям создавать запросы произвольной степени сложности; единое глобальное пространство имен по аналогии с DNS4; структурированный информационный каркас, допускающий локальные расширения;

3 В русскоязычной литературе встречается также термин "служба каталогов", однако, по мнению автора, он не подчеркивает справочной специфики описываемой технологии.

4 DNS - служба доменных имен, основное предназначение которой — хранить информацию о соответствии IP-адресов доменным именам и наоборот, а также множество других полезных сведений, например адреса сервера почтового обмена для домена. стандартный интерфейс, единый протокол доступа. Приложения, нуждающиеся в ресурсах справочника, должны производить запросы, используя стандартизированный протокол, одинаковый для всех платформ.

Всем этим требованиям как раз и отвечают системы, построенные на основе рекомендаций Х.500.

Большие изменения в технологии Х.500 и в построении систем на базе этой технологии произошли в 1997 году [46]. Были приняты изменения в рекомендациях, которые позволяли использовать международные символьные наборы в справочниках. В литературе появился термин "распределенные глобальные" справочники (global distributed directory).

Глобальные распределенные справочники подразумевают справочники, в которых части информации размещены на различных серверах, объединенных по определенным правилам, и, с точки зрения пользователя, образуют единый логический каталог.

Доступ к справочникам, построенным по Х.500 технологии, осуществляется по протоколу DAP, имеющего все механизмы доступа к справочникам, включая реплицирование, механизмы защиты и другие. Протокол DAP реализован в ряде операционных систем, например, в Windows 2003 (Active Directory) и на отдельных платформах Unix.

Для доступа к справочникам в среде Internet в 1997 году был разработан протокол LDAP. Фактически создание протокола LDAP было попыткой приспособить стандарт Х.500 к стеку протоколов TCP/IP. LDAP отвечает только за доступ клиентских систем к каталогам Х.500, в то время как полное соответствие Х.500 предполагает наличие совместимости между серверами.

Этот прорыв, как в технологии построения глобальных справочников, так и в технологии доступа к ним, породил бурное развитие прикладных приложений на базе технологии Х.500.

В 1997 году был создан первый распределенный глобальный мировой справочник Challenge'97 [6]. Он был построен более чем на 30 серверах справочников, расположенных в 9 странах мира. При построении данного справочника использовалось программное обеспечение различных фирм производителей.

В России технологии Х.500 были применены для построения справочников, используемых в различных отраслях. Например, на Центральном телеграфе была создана "Единая Справочная Служба Главных телеграфных узлов" [45], которая представляет собой распределенную службу справочных серверов Х.500, содержащих адресную и другую дополнительную информацию о различных сетях и субъектах (организациях, фирмах, частных лицах). В рамках Ассоциации документальной электросвязи построен справочник контактных координат людей и организаций АДЭ (vvww.ctel.msk.ru/x500).

Почти параллельно с Х.500 развивалась справочная информационная система WAIS5 [23], использовавшая простой язык -управления, близкий к естественному. WAIS базировалась на протоколе Z39.50, который описывает прикладной уровень взаимодействия распределенных информационно-поисковых систем. С развитием протокола HTTP6 WAIS была вытеснена системой поиска ресурсов WWW. Фактически Z39.50 - это протокол доступа к каталогам, а не к самим ресурсам. Поэтому WAIS - это система доступа к каталогам. (Каталог является более широким понятием, чем справочник)

В результате проводимых библиотекой конгресса США исследований и разработок, технология WAIS превратилась в распределенную систему доступа к каталогам, содержащих каталожные карточки (метаданные) — описания некоторых неэлектронных информационных ресурсов, а протокол Z39.50 в 1998 году был принят как международный стандарт ISO-23950. Это сыграло ключевую роль в развитии распределенных систем доступа к каталогам и организации метаданных на базе стандарта Z39.50. В России наибольшее распространение протокол Z39.50 [43, 44] получил в системах доступа к библиотечным каталогам. При этом область применения протокола Z39.50 не ограничивается библиотечными каталогами. Поскольку справочник - это частный случай каталога, на базе протокола Z39.50 может быть организован доступ к справочникам, в которых может содержаться и административная информация.

Кроме того, существуют также не стандартизированные справочные информационные системы, функционирующие на серверах организаций, которые содержат информацию о научном сообществе, такую, как данные о публикациях, конференциях, проектах, информацию о структуре организаций, сотрудниках отдельных организаций, связях, совместных программах и т.п.

Особой разновидностью справочника являются системы доступа к каталогам библиотек, издательств и т.п.

В настоящее время в институтах СО РАН библиотечных ресурсов представлено мало. Библиотечные ресурсы представлены на сайтах отдельных институтов СО РАН. Библиотечные информационные системы имеются только в Государственной публичной научно-технической библиотеке г. Новосибирска (ГПНТБ) и Объединенном институте геологии, геофизики и минералогии СО РАН (ОИГГМ), и в некоторых библиотеках научных

5 WAIS (Wide Area Information Servers) - распределенная информационно-поисковая система сети Internet, которая обеспечивает поиск документа по определенной теме на основе ключевых слов

6 HTTP (HyperText Transfer Protocol) - протокол прикладного уровня для распределенных, совместных, многосредных информационных систем центров, которые являются филиалами ГПНТБ. В ОИГГМ O.JI. Жижимовым и А.Н. Мазовым был создан корпоративный каталог библиотек Новосибирска и Сибири, работающий на базе протокола Z39.50 [44]. Этот каталог интегрирует электронные каталоги библиотек Новосибирска: ГПНТБ, Областной научной библиотеки и крупных библиотек в других городах Сибири [35].

В издательстве СО РАН автором диссертации был разработан сводный электронный полнотекстовый каталог журналов и электронный каталог книг, выпускаемых в СО РАН.

Примером НИС является Интегрированная система информационных ресурсов Российской Академии Наук (ИСИР РАН) созданная коллективом ученых под руководством В.А. Серебрякова [42]. Основной целью проекта ИСИР РАН являлась разработка концептуальной структуры для интеграции разнородных информационных и вычислительных ресурсов РАН в единое информационное пространство. Текущая версия ИСИР РАН реализована как информационно-поисковый справочник РАН, ориентированный на накопление и предоставление оперативной научно-административной информации. ИСИР РАН обеспечивает доступ к данным об институтах, ученых, проектах, публикациях.

Коллективом, возглавляемым С.И. Париновым, была разработана система "Соционет", которая содержит информацию о различных информационных ресурсах [67]. Среди них архивы электронных публикаций, оглавления онлайновых журналов, каталоги новых поступлений библиотек, планы издательств и др., информация об организациях, персонах.

На сервере ГосНИИ информационных технологий и телекоммуникаций М.В. Булгаковым и С.С. Внотченко создана информационная система "Информика", содержащая ряд баз данных по организациям, персонам, технологиям, конференциям в Российской Федерации, журналам и газетам в сфере образования и информационных технологий [38]. С точки зрения структуры информации - это наиболее полная система, предназначенная для информационной поддержки научно-образовательного сообщества.

Зарубежными учеными также ведутся разработки НИС.

Хельсинский университет технологий (Helsinki University of Technology, HUT) создал информационную систему для отчетной деятельности о событиях, видах деятельности, и другой. научной информации о проводимых университетом исследованиях. Следует отметить, что HUT удалось интегрировать в одну информационную систему и связать процессы научной и учебной деятельности [31].

Шью (Shyu), Ю-Мей (Yuh-Mei), Чию-Фэнг (Chiu-Fang) [29] была создана информационная система для обеспечения информационных потребностей управления наукой и прикладными исследованиями Government Research Bulletin (GRB). Предложена схема жизненного цикла информации о проектах, в которой участвуют как ученые, так и академические и правительственные чиновники. Система интегрирует данные о проектах, отчетах, патентах, исследователях.

А. Ассерсон (A. Asserson), К. Джеффери (К. Jeffeiy), А. Лопатенко (A. Lopatenko) была разработана модель ИСС на базе стандарта CERIF для описания научных ресурсов и научных баз данных [1].

Проведенный анализ показал, что в настоящее время существуют различные рекомендации и стандарты построения справочных систем. Также в научных учреждениях ведутся работы по созданию электронных справочных информационных ресурсов, в том числе и с использованием Интернет-технологий. Однако для того, чтобы придать этому процессу системный характер, облегчить поиск необходимых ресурсов, необходимо, на наш взгляд, перейти к созданию интегрированных информационных систем научных учреждений, построенных на основе согласованных стандартов и с применением современных информационных технологий.

Цель диссертационной работы состоит в выработке технологических решений построения НИС, которые допускают как интеграцию разнородных информационных ресурсов, так и интеграцию с другими информационными системами.

Для достижения этой цели решены следующие основные задачи:

1. Исследованы современные справочные информационные системы и определены требования, предъявляемые к информационным системам для построения интегрированных НИС.

2. Проведен анализ существующих технологий, протоколов и стандартов в области проектирования и построения информационно-справочных систем с доступом через Internet.

3. Разработана модель информационных процессов в НИС.

4. Определены схемы данных для представления информации рассматриваемой предметной области.

5. Реализована прикладная логика и пользовательские интерфейсы НИС, обеспечивающие выполнение предъявляемых требований. Построена НИС на основе объектной модели документа, поддерживающая много языков (как для интерфейсов, так и для хранимых документов), предоставляющая удобные интерфейсы для поиска, просмотра, редактирования документов и обеспечивающая разные права доступа к документам для разных категорий пользователей.

Исходя из поставленных целей в работе были получены следующие основные результаты.

1. Построена структурированная модель документа и предложена информационная модель представления документа в системе на основе коллекционного подхода. Информационная система рассматривается как множество связанных различными отношениями документов. Документ обладает структурой и содержанием. Структура документа - это набор структурных элементов. Содержание документа - объединение значений экземпляров элементов, составляющих документ. Коллекция - это множество документов, обладающих одинаковой структурой и одинаковой содержательной направленностью. Эта модель не зависит от конкретной предметной области и может быть адаптирована к другой предметной области путем введения метаданных.

2. Предложена многоуровневая модель информационных процессов, обеспечивающая функционирование многопользовательской НИС и интероперабельность с другими системами.

Модель информационных процессов имеет пять уровней: уровень хранения выполняет выборку информации из информационного хранилища; уровень коллекции выполняет вычисление отношений и подтверждение прав доступа запроса к документу на уровне его структуры; уровень обмена выполняет генерацию внутреннего представления документа; уровень отбора выполняет отбор необходимых элементов документа на основании запроса и прав доступа; уровень презентации генерирует презентационное представление документа в виде, удобном для представления пользователю.

3. Предложена модель описания отношений между документами, даны примеры отображения модели отношений ■ в общепринятые модели представления информационных структур (реляционная, графовая модели). Для описания отношений между документами в НИС выбран язык описания структурированной информации RDF7. Отношения в НИС выстраиваются на уровне элементов, определяющих структуру документов.

4. Предложена реализация НИС в виде следующих коллекций документов: коллекций, содержащих основную информацию в системе - «Персоны» и

Организации»;

7 RDF (Resource Description Framework) - Схема описания ресурсов, стандарт RDF. Основанный на языке XML стандарт, утвержденный консорциумом W3C. Вводит правила создания метаданных, позволяет стандартным образом описывать содержание ресурсов Интернет. дополнительных коллекций, включающих в себя о коллекцию «Неструктурированные документы», содержащую дополнительную информацию, как по персонам, так и по организациям; о коллекцию «Каталог» (публикаций, проектов и т.д.). На основе международных стандартов и рекомендаций выбраны следующие схемы данных для описания структуры документов в коллекциях: для представления персон и о организаций - схемы данных Dublin Core (DC) и LDAP, а для дополнительных коллекций - схема данных Dublin Core. Количество коллекций в системе может быть расширено при необходимости.

5. Реализована модель информационного хранилища, предоставляющего по запросу доступ к таблицам, соответствующим одной коллекции, которые могут быть распределены по сети.

6. Разработанные технологические принципы реализованы в ИС «База данных организаций и сотрудников СО РАН», и применены в «Электронном полнотекстовом каталоге журналов» и «Электронном каталоге книг» для Издательства СО РАН.

На защиту выносятся следующие положения:

1) Предложены технологические требования, предъявляемые к основным элементам реализации НИС, позволяющие создавать интегрированные НИС, которые обеспечивают доступ через Интернет к разнородным информационным ресурсам.

2) Предложена информационная модель представления документов в системе, построенная на основе коллекционного подхода, которая не зависит от конкретной предметной области. На основе международных стандартов и рекомендаций обоснован выбор схем данных, позволяющих описывать структуры документов в коллекциях НИС.

3) Предложена новая многоуровневая модель процессов в НИС, разработанная на основе современных международных стандартов взаимодействия открытых систем, которая обеспечивает функционирование многопользовательской НИС и интероперабельность с другими системами. Предложена информационная модель отношений между документами, построенная на основе RDF, позволяющая описывать отношения между персонами и организациями, персонами и проектами, организациями и подразделениями и т.п. Построена модель информационного хранилища, позволяющая реализовать доступ к распределенным БД.

4) На основе выработанных технологических решений разработаны научные информационно-справочные системы:

8 Dublin Core - Стандарт метаданных Дублинского ядра (Dublin Core), набор элементов для описания широкого спектра сетевых ресурсов.

База данных организаций и сотрудников СО РАН», которая предоставляет доступ к справочной управленческо-административной информации СО РАН;

Электронный полнотекстовый каталог журналов», который предоставляет доступ к аннотациям и полным текстам статей из научных журналов, издаваемых в СО РАН;

Электронный каталог книг», который предоставляет доступ к описаниям учебников, научных и научно-популярных книг, издаваемых в СО РАН, с возможностью заказа книг.

Научная новизна работы связана с разработкой технологии построения НИС.

1. Предложены технологические требования, предъявляемые к . основным элементам реализации НИС, которые должны учитываться при построении интегрированных НИС.

2. Впервые в научных справочных информационных системах был применен коллекционный подход для представления документов в системе, позволяющий настраиваться на требуемую предметную область информационно-справочной системы.

3. Впервые предложена многоуровневая модель информационных процессов, обеспечивающая функционирование многопользовательской НИС и интероперабельность с другими системами.

4. Разработана информационная модель отношений между документами, позволяющая описывать отношения между персонами и организациями, персонами и проектами, организациями и подразделениями.

Практическая ценность

Предложенная информационная модель НИС реализована в информационной системе «База данных организаций и сотрудников СО РАН», а также в «Электронном полнотекстовом каталоге журналов» и «Электронном каталоге книг» для Издательства СО РАН.

Исходя из технологических требований к НИС, разработанная технология их построения может быть перенесена на другую предметную область. Примером такого переноса являются созданные автором «Электронный полнотекстовый каталог журналов» и «Электронный каталог книг» для Издательства СО РАН.

Достоверность и обоснованность результатов диссертационной работы подтверждаются:

1. Результатами анализа существующих технологий, протоколов и стандартов в области проектирования и построения информационно-справочных систем с доступом через Internet. . .

2. Результатами анализа существующих научных информационно-справочных систем на соответствие технологическим требованиям.

3. Теоретическим обоснованием построенных моделей НИС.

4. Успешным практическим использованием системы «БД организаций и сотрудников СО РАН», заполнение которой осуществляется Президиумом СО РАН, отделами кадров институтов СО РАН.

5. Успешным практическим использованием в Издательстве СО РАН «Электронного полнотекстового каталога журналов» (содержит 18 журналов) и «Электронного каталога книг» (содержит информацию о ~ 800 книгах).

6. Признанием достижений автора на конференциях и присуждением автору диплома второй степени конкурса молодых ученых, проведенного администрацией Новосибирской области в 2002 г.

Личный вклад автора. Основные результаты, представленные в работе, получены непосредственно автором, а именно: технологические требования, предъявляемые к НИС, структурированная модель документа, модель представления отношений между документами, модель информационных процессов, обоснование выбора схем данных для описания структуры документов, модель информационного хранилища, информационные системы «БД организаций и сотрудников СО РАН», «Электронный полнотекстовый каталог журналов» и «Электронный каталог книг» для Издательства СО РАН.

Апробация работы Научные результаты, изложенные в диссертации докладывались на следующих конференциях.

1. Конференция молодых ученых, посвященная 10-летию ИВТ СО РАН, Новосибирск, 2000;

2. VI-ое Международное рабочее совещание по электронным публикациям (El-Pub2001), Новосибирск, 2001;

3. Конференция, посвященная 90-летию со дня рождения А.А. Ляпунова, Новосибирск, 2001;

4. Конференция молодых ученых по математике, математическому моделированию и информатике, Новосибирск, 2001;

5. Международная конференция «Вычислительные технологии и математическое моделирование в науке, технике и образовании», Алма-Ата, 2002;

6. Международная конференция молодых ученых по математическому моделированию и информационным технологиям, Новосибирск, 2002;

7. УП-ая Международная конференция по электронным публикациям " El-Pub2002", Новосибирск, 2002;

8. Четвертая Всероссийская научная конференция «Электронные библиотеки: перспективные методы и технологии, электронные коллекции», Дубна, 2002;

9. Международная конференция "Вычислительные и информационные технологии в науке, технике и образовании", Усть-Каменогорск, 2003;

10. УШ-ая Международная конференция по электронным публикациям "El-Pub2003", Новосибирск, 2003;

11. Г/-ая Всероссийская конференция молодых ученых по математическому моделированию и информационным технологиям, Красноярск, 2003;

12. Ш-я Всероссийская конференция «Математика, информатика, управление», посвященная памяти профессора О.В. Васильева, Иркутск, 2004;

13. IX-ое Международное рабочее совещание по электронным публикациям (El-Pub2004), Новосибирск, 2004;

14. Международная конференция "Вычислительные и информационные технологии в науке, технике и образовании", Алма-Ата, 2004.

Работа «Интегрированная информационная система научного сообщества» в 2002 г. была награждена дипломом второй степени конкурса молодых ученых, проведенного администрацией Новосибирской области.

Публикации. По теме диссертации опубликовано 17 печатных работ из них 8 тезисов.

Структура и объем работы

Диссертация состоит из введения, 4 глав, заключения, списка цитированной литературы, 5-ти приложений. Основное содержание работы изложено на 128 страницах текста, содержит 46 рисунков, 7 таблиц. Список цитированной .литературы включает 71 наименование.

Заключение диссертация на тему "Технология построения информационно-справочных систем для научного сообщества"

Выводы к главе 4

1. Разработаны механизмы представления пользовательских интерфейсов НИС на основе шаблонов, описывающих способ визуализации информации.

2. С использованием разработанной в данной работе технологии построения НИС реализованы два приложения: ИС «БД организаций и сотрудников СО РАН» и ИС «Администратор БД организаций и сотрудников СО РАН».

ЗАКЛЮЧЕНИЕ

К основным результатам диссертации можно отнести следующие.

1. Построена структурированная модель документа и предложена информационная модель представления документа в системе на основе коллекционного подхода. Информационная система рассматривается как множество документов, связанных различными отношениями. Документ обладает структурой и содержанием. Структура документа - это набор структурных элементов. Содержание документа - объединение значений экземпляров элементов, составляющих документ. Коллекция - это множество документов, обладающих одинаковой структурой и одинаковой содержательной направленностью. Эта модель не зависит от конкретной предметной области и может быть специфицирована на другую предметную область путем введения метаданных.

2. Предложена многоуровневая модель информационных процессов, обеспечивающая функционирование многопользовательской НИС и интероперабельность с другими системами.

Модель информационных процессов имеет пять уровней: уровень хранения выполняет выборку информации из информационного хранилища; уровень коллекции выполняет вычисление отношений и подтверждение прав доступа запроса к документу на уровне его структуры; уровень обмена выполняет генерацию внутреннего представления документа; уровень отбора выполняет отбор необходимых элементов документа на основании запроса и прав доступа; уровень презентации генерирует презентационное представление документа в виде, удобном для представления пользователю.

3. Предложена модель описания отношений между документами, позволяющая описывать отношения между персонами и организациями, персонами и проектами, организациями и подразделениями. Даны примеры отображения модели отношений в общепринятые модели представления информационных структур (реляционная, графовая модели). Для описания отношений между документами в НИС используется язык представления структурированной информации RDF. Отношения в НИС выстраиваются на уровне элементов, определяющих структуру документов.

4. Предложена реализация НИС в виде следующих коллекций документов: коллекций, содержащих основную информацию в системе - «Персоны» и «Организации»; дополнительных коллекций, включающих в себя о коллекцию «Неструктурированные документы», содержащую дополнительную информацию, как по персонам, так и по организациям; о коллекцию «Каталог» (публикаций, проектов и т.д.). Выбраны следующие схемы данных для описания структуры документов в коллекциях: для представления персон и организаций - схемы данных Dublin Core и LDAP, а для дополнительных коллекций - схема данных Dublin Core. Количество коллекций в системе может быть расширено при необходимости.

5. Реализована модель информационного хранилища, предоставляющего по запросу доступ к таблицам, соответствующим одной коллекции, которые могут быть распределены по сети.

6. Разработанные технологические принципы реализованы в ИС «База данных организаций и сотрудников СО РАН», и применены в «Электронном полнотекстовом каталоге журналов» и «Электронном каталоге книг» для Издательства СО РАН.

Дальнейшее развитие и применение технологии, предложенной в диссертации, представляется перспективным. Основные направления развития НИС связаны с расширением предложенной технологии на реализацию других коллекций и других отношений, которые возникают в научном сообществе: проекты, научные достижения, разработки и т.д.

Библиография Леонова, Юлия Викторовна, диссертация по теме Информационные системы и процессы, правовые аспекты информатики

1. Assersori A., Jeffery К. G., Lopatenko A. CERIF: Past, Present and Future: An Overview // www.eurocris.org

2. Barker, P. and S. Kille, The COSINE and Internet X.500 Schema, RFC 1274, November 1991.

3. Bemers-Lee Tim. Relational Databases on the Semantic Web // http://www.w3 .org/Designlssues/RDB-RDF.html

4. Bemers-Li Т., Fielding R., Irvine U.C., Masinter L. Uniform Resource Identifiers (URI): General Syntax. RFC 2396. August 1998.

5. Brian Matthews, Alistair Miles, Michael Wilson. CRISs, Thesauri and the Semantic Web

6. Challenge "97 толчок в сторону X.500 //Сети, №9, 1996, http://www.osp.ni/nets/l 996/09/104.htm

7. Dagobert Soergel. Data models for an integrated thesaurus database

8. Dawson, F. , Howes, T. vCard MIME Directory Profile, RFC 2426, Lotus Development Corporation, Netscape Communications, September 1998.

9. Deutsch P., Emtage A., Koster M., Stumpf M. Publishing Information on the Internet with Anonymous FTP, INTERNET DRAFT, Bunyip, Nexor, Munich University of Technology, January 1995 //http://www.ifla.org/documents/libraries/cataloging/metadata/iafa.txt

10. Dublin Core Metadata Element Set Reference Description, Version 1.1, 1999-07-02. http://purl.org/dc/documents/proposedrecommendations/pr-dces-19990702.htm.

11. Dublin Core Qualifiers. Dublin Core Meta Data Initiative Recommendation. http://purl.org/dc/documents/rec/dcmes-qualifiers-20000711 .htm.

12. Extensible Markup Language (XML) 1.0 (Second Edition). W3C Recommendation. 6-October-2000. http://www.w3.org/TR/2000/REC-xml-20001006.

13. Extensible Stylesheet Language (XSL). Version 1.0. W3C Working Draft. 18 October 2000. http://www.w3.org/TR/2000/WD-xsl-20001018.

14. H.Foster I., Kesselman C., Nick J.M., Tuecke S. The Phisiology of the Grid. An Open Grid Services Architecture for distributed system interation // Grid Computing.

15. Making the Global Infrastructure a Reality. New York: Wiley & Sons, 2003.-P.217-250.

16. IS02788: Guidelines for establishment and development of monolingual thesauri, 2nd ed., Geneva: ISO 1986.

17. IS05964: Guidelines for establishment and development of multilingual thesauri, 1 st ed., Geneva: IS01985.

18. Jurg, P. Introduction to White Pages Services based on X.500, RFC 1684, SURFnet bv, August 1994.

19. Hardcastle-Kille S.E. Replication and Distributed Operations extensions to provide an Internet Directory using X.500, RFC 1276, University College London, November 1991.

20. Keranen S. Content Management Concept and Indexing Term Equivalence in a Multilingual Thesaurus

21. Microsoft.Net // http://www.microsoft.com/net/

22. Modelling Thesauri for the Semantic Web // http://www.w3.org/2001/sw/Europe/plan/workpackages/live/esw-wp-8.html

23. Open Information Model. XML Encoding. Version 1.0. Review Draft 2. Meta Data Coalition. December 1999

24. Pan Z., Heflin J. DLDB: Extending Relational Databases to Support Semantic Web Queries// http://www.cse.lehigh.edu/~heflin/pubs/psss03-poster.pdf

25. Pierre, M. St., Fullton, J., Gamiel, K., Goldman, J., Kahle, В., Kunze, J., Morris, H., Schiettecatte, F. WAIS over Z39.50-1988, RFC 1625, WAIS, Inc., CNIDR, Thinking Machines Corp., UC Berkeley, FS Consulting, June 1994.

26. RDF Encoding of Multilingual Thesauri // http://www.w3c.rl.ac.Uk/SWAD/deliverables/8.3.html

27. Resource Description Framework (RDF). Schema Specification 1.0.

28. W3C Candidate Recommendation 27 March 2000. http://www.w3.org/TR/2000/CR-rdf-schema-20000327.

29. Review of RDF Thesaurus Work // http://www.w3c.rl.ac.Uk/SWAD/deliverables/8.2.html

30. Seguin K. The Code Project Creating multilingual websites - Part 2 //ASP.NET http://www.codeproject.com/aspnet/LocalizedSamplePart2.asp

31. Shyu, Yuh-Mei and Kao, Chiu-Fang. The Integrated Research Information System: Government Research Bulletin (GRB)// (CRIS-2000) ftp://ftp.cordis.lu/pub/cris2000/docs/shyufulltext.pdf

32. Smith, M. Definition of the inetOrgPerson LDAP Object Class, RFC 2798, Netscape Communications, April 2000, http://www.ietf.org/rfc/rfc2798.txt

33. TENTTU Information Retrieval System. Helsinki University Technology http://otatrip.hut.fi/tkk/englindex.html

34. Wahl, M. A Summary of the X.500(96) User Schema for use with LDAPv3, RFC 2256, Critical Angle Inc., December 1997.

35. Х.500 На пути к информационному раю//Мир Internet, №5, 2002, http://www.iworld.ru/magazine/index.phtml?do=shownumber&m=94701987

36. XForms 1.0. W3C Working Draft 16 February 2001. http://www.w3.org/TR/2001/WD-xforms-20010216.

37. Барахнин В.Б., Леонова Ю.В. Информационная модель отношений между документами в информационной системе // Вычислительные технологии -2005. Т.10, №3.-С. 23-33.

38. Брюхов Д.О., Задорожный В.И., Калиниченко Л.А., Курошев М.Ю., Шумилов С.С. "Интероперабельные информационные системы: архитектуры и технологии"//СУБД, 1995, №4.

39. Булгаков М. В., Внотченко С. С. Реализация каталога образовательных Интернет ресурсов в составе образовательного федерального портала.

40. ГОСТ 7.25-80: Тезаурус информационно-поисковый одноязычный. Правила разработки, структура, состав и форма представления.

41. ГОСТ 7.24-90: Тезаурус информационно-поисковый многоязычный. Состав, структура и основные требования к построению.

42. Давид Бич. К объектным базам данных // Открытые системы-1994, №4

43. ЕНИП РАН (http://isir.ras.ru)

44. Жижимов O.JI. Введение в Z39.50. Новосибирск: Изд-во НГОНБ, 2001.

45. Жижимов O.JI., Мазов Н.А. Принципы построения распределенных информационных систем на основе протокола Z39.50 // ОИГГМ СО РАН, Новосибирск: Изд-во ИВТ СО РАН, 2004.

46. ЗАО РОСТЕЛЕГРАФ Справочная Служба (Х500)// http://rt.rostelemail.ru/treeinfo.htm

47. ИгнатьеваМ. Итоги развития Х.500 в 1997 году //Сборник АДЭ, 1998, http://www.ctel.msk.ru/x500/Publ/myp.pdf

48. Информационная система «База данных организаций и сотрудников СО РАН» (справочно-методические материалы) / Леонова Ю.В., Клименко О.А.; под ред. Федотова A.M. Новосибирск: РИЦ "Прайс-Курьер", 2005.

49. Информика (http://www.informika.ru/text/centre/)

50. Когаловский М.Р. Глоссарий по технологиям XML. http://www.libweb.ru/resource/docs/xml/xml-gloss.html.ru.

51. Концепция открытых систем // Материалы к межотраслевой Программе "Развитие и применение открытых систем" http://www.cplire.rU/nis/casr/os/3l/3.htm

52. Кричел Т., Паринов С.И.База данных RePEc и ее российский партнер система Соционет//Электронные библиотеки -2002 Т. 5 - Выпуск 2

53. Кричел Т., Ляпунов В.М., Паринов С.И. Онлайновые информационные ресурсы для исследователей по экономике: база данных RePEc и веб-портал RuPEc //Электронные библиотеки -1999 Т. 2 - Выпуск 3

54. Кузнецов С. Объектно-ориентированные базы данных -основные концепции, организация и управление: краткий обзор // http://www.citforum.ru/database/articles/art24.shtml

55. Леонова Ю.В., Федотов A.M. О содержательном наполнении системы информационного обеспечения научного сообщества // Вычислительные технологии, (Совместный выпуск) Региональный вестник Востока, 2003. — 4.4. -С. 294-303.

56. Леонова Ю.В., Федотов A.M. Унификация доступа к данным в ИРИС// Вычислительные технологии, (Совместный выпуск) Региональный вестник Востока-2003. -Т.8, №3.-4.4, С. 304-311.

57. Лопатенко А. С. Современные Научные Информационные Системы. Перспективы использования // http://e-science.narod.ru/CRISDOC.htm

58. Паринов С.И., Ляпунов В.М., Пузырев Р.Л. Система Соционет как платформа для разработки научных информационных ресурсов и онлайновых сервисов // Электронные библиотеки -2003 Т. 6 - Выпуск 1

59. Петер Пин-Шен Чен. Модель "сущность-связь" шаг к единому представлению о данных //СУБД, 1995, №3.

60. Приказ от 11 декабря 1992 г. N 1126 Об утверждении разрядов оплаты труда и тарифно-квалификационных требований.по должностям работников науки и научного обслуживания Российской Федерации

61. Сетевые службы //http://mf.grsu.by/UchProc/livak/kursi/po/lections/setsl.htm

62. Словарик ООП // http://www.ctc.msiu.ru/materials/Book/node86.html

63. Созыкин А.В., Масич Г.Ф., Масич А.Г., Бездушный А.Н. Вопросы интеграции управления идентификацией пользователей сетевых, вычислительных и информационных сервисов // Электронные библиотеки -2004 Т. 7 - Выпуск 2.

64. Соционет (http://socionet.ru/)

65. Стандарты службы справочников // http://www.fima.net/mac/x500.html

66. Таненбаум Э., Ван Стеен М. Распределенные системы. Принципы и парадигмы// СПб.: Питер, 2003.

67. Шокин Ю.И., Федотов A.M., Леонова Ю.В. Объектная модель документа в электронных коллекциях // Материалы VII Международной конференции по электронным публикациям "El-Pub2002", Новосибирск, 2002 г., http://www.ict.nsc.ru/ws/elpub2002/4488/.