автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Исследование и моделирование систем управления доступом к гетерогенным информационным ресурсам
Оглавление автор диссертации — доктора технических наук Максимов, Николай Вениаминович
Введение
Глава 1. Методы и модели представления информации в обобщенной системе обработки и генерации знания
1.1. Информационные системы и информационная деятельность
1.1.1. Информационные компоненты в системах управления
1.1.2. Информация в системах обработки и генерации знания
1.1.3. Характер информационных составляющих
1.2. Представление информации и информационной потребности в совокупной информационной системе
1.3. Информация и преобразования в модели «наука-техника-производство»
1.4. Информационное обеспечение на основе распределенных ИР
1.4.1. Взаимодействие и совместимость АИС. Общая постановка задачи распределения потоков информации в сети
1.4.2. Характер взаимодействия. Типы совместимости ИС
1.4.3. Общая схема решения задачи распределения потоков
1.4.4. Лингвистическое обеспечение в информационных сетях 53 Выводы по первой главе
Глава 2. Методы оценки информационной совместимости АИС
2.1. Теоретико-множественная модель координатного индексирования
2.2. Статистический коэффициент ассоциации дескрипторов
2.3. Определение формальной меры информационной совместимости
2.4. Мера и критерий семантической совместимости для бестезаурусного
2.5. Динамическая модель рабочего словаря
2.6. Экспериментальное исследование информационной совместимости АИС
2.7. Структурно-логическая совместимость АИС
2.7.1. Хранение информации
2.7.2. Представление информации
2.7.3. Механизмы поиска информации 100 Выводы по второй главе
Глава 3. Модели и технологии информационного поиска в документальных БД
3. 1. Человеко-машинный поиск. Восприятие и использование информации
3.1.1. Модели взаимодействия пользователя с информационной системой. Типология поисковых задач и план действий
3.1.2. Стереотипы поведения пользователя при взаимодействии с ИС
3.1.2.1. Уровневая модель человеко-машинного взаимодействия
3.1.2.2. Когнитивные аспекты человеко-машинного взаимодействия
3.1.2.3. Типология и стереотипы поведения пользователей. Типы пользователей
3.1.2.4. Исследование поведения пользователей 127 3.2. Обобщенная технология информационного поиска документов
3.2.1. Характер информационных потребностей и виды поиска
3.2.2. Интерактивный поиск документальной информации. Основные понятия и компоненты
3.2.2.1. Стратегия поиска
3.2.2.2. Методы и технологии поиска
3.2.3. Средства хранения, поиска и обработки результатов
3.2.4. Поисковые интерфейсы
3.2.5. Обобщенная схема поиска
3.3. Теоретико-множественная модель отбора документов
3.4. К оценке технической эффективности АИС 172 выводы по третьей главе
Глава 4. Информационное и программное обеспечение управления распределенными ИР
4.1. Сетевые информационные системы и электронные библиотеки как информационный ресурс
4.1.1. Компоненты распределенных ИР
4.1.2. Общие принципы и используемые протоколы взаимодействия
4.1.3. Обобщенная схема электронной библиотеки и организация 187 доступа
4.1.4. Особенности реализации протокола ЪЪ 9.5 0 в ИПС ИРБИС
4.2. Администрирование информационного сервера
4.2.1. Категории пользователей и управление доступом к ресурсам
4.2.2. Управление доступом к информационным ресурсам ЭБ
4.2.3. Получение статистической отчетности об использовании информационных ресурсов
4.2.4. Обеспечение сессионности поиска
4.2.5. Администрирование сервера баз данных 204 Выводы по четвертой главе 211 Заключение 212 Список литературы 215 Приложение 1 227 Приложение 2 235 Приложение 3 256 Приложение
Введение 2001 год, диссертация по документальной информации, Максимов, Николай Вениаминович
С того времени, когда научные исследования стали индустрией, проблемы информационного обеспечения преобразовались в самостоятельное направление, в значительной степени ориентированное на вычислительную технику и электронные средства коммуникаций.
Достижения очевидны и ощутимы. Практически обеспечена возможность организации всемирного каталога публикаций через объединение (унификацию средств доступа, например, на основе протокола Z39.50) каталогов и баз данных крупнейших национальных библиотек и информационных центров практически всех развитых стран, включая РФ. Глобальная сеть Internet сделала реальностью открытость и доступность в реальном масштабе времени информационные ресурсы (ИР) самого разного объема и содержания, от частной коллекции до национальных архивов.
Однако даже широкое внедрение информационных систем и баз данных в сочетании с сетевыми решениями, тем не менее, остается пока лишь очередным этапом в попытках человека справиться с проблемами получения и переработки информации. Интенсивное развитие вычислительной техники и кибернетических методов управления информационными потоками по существу дало только новые (электронные) носители и сверхбыстрый доступ к хранилищам. Это позволило на порядки увеличить скорости получения данных и объемы оперативно доступного информационного пространства, однако ситуация с использованием собственно информации практически не изменилась.
Причины здесь кроются не столько в финансовой, организационной или технической сфере, сколько в том, что человек, как система переработки и генерации самой информации, принципиально не изменился. Библиотеки и автоматизированные банки данных это внешняя, глобальная, но пассивная память, хранящая разнородную и по-разному представленную информацию, a Internet и разнообразные средства вычислительной техники являют собой высокоэффективные, но, тем не менее, узко специализированные средства доступа к данным, хранимым в машиночитаемом виде. Причем, объемы данных и темпы их прироста, а также разнообразие форм и динамика представления информации настолько велики, что в некоторых случаях «.по сути дела легче открыть новый факт или создать теорию, чем удостовериться, что они еще не были созданы или выведены» [20].
Однако упомянутый тезис должен восприниматься конечно же не в качестве отрицания информационных технологий, а скорее как фактор, стимулирующий исследования и разработки направлений, связанных с изучением глубинных процессов переработки информации в человеко-машинных системах и, прежде всего, для задач генерации нового знания. Само развитие информационных технологий и их повсеместное внедрение практически во все сферы деятельности человека (по крайней мере той, которая связана или завершается документом или коллекцией данных) уже привело к тому, что электронная форма представления информации принята официально (и законодательно, например, в СССР еще в 1980г.). Радикальность и необратимость этого процесса признана в том числе в такой консервативной области, как архивоведение, что констатировалось на Международном совещании архивистов (Италия, Масерата, 1991г., Москва, 27-28 ноября 1997г).
Развитие информационных технологий в области документалистики и информационного обеспечения научных исследований получило развитие в многочисленных проектах создания и внедрения электронных библиотек (ЭБ) как глобального, так и локального масштаба. По результатам исследований Института развития информационного общества [45], в той или иной форме идея электронной библиотеки уже работает во многих университетах и крупных библиотеках ведущих стран мира. Например, электронная "библиотека XXI века" создается в Японии путем соединения усилий Агентства по внедрению новых технологий, Национальной парламентской библиотеки, ряда министерств, библиотек и культурных центров. Несколько лет назад Библиотека Конгресса США начала реализацию национальной программы создания электронной библиотеки. Начиная с 1994 г. по инициативе NSF, DARPA и NASA в США была развернута исследовательская программа Digital Libraries Initiative по электронным библиотекам. На второй стадии развития в начале 1998 г. эти программы были объединены в единую межведомственную программу (DLI -Phase 2), в которой, кроме того, участвуют Национальная медицинская библиотека, Агентство по статистике США, Национальный гуманитарный фонд, Национальный архив США и другие федеральные агентства. Начиная с 1995 г., осуществляется проект Bibliotheca Universalis создания электронных библиотек для стран «семерки». С 1995 г. осуществляется национальная программа eLib в Великобритании. В других странах (Канада, Германия и т.д.) многочисленные разрозненные проекты в последние годы также стали превращаться в национальные и международные программы создания электронных библиотек.
В России реализация проектов по созданию электронных библиотек начата сравнительно недавно. С 1998 г. до инициативе Российского фонда фундаментальных исследований и Российского фонда технологического развития осуществляется программа "Российские электронные библиотеки", в рамках которой ведутся работы по общесистемным вопросам создания и функционирования электронных библиотек, развитию инфраструктуры, разработке инструментальных средств, а также создание конкретных электронных библиотек по областям науки, культуры и образования. В настоящее время успешно функционируют электронные библиотеки ИНИОН РАН, ВИНИТИ РАН, ВНТИЦентра, РГБ, электронные каталоги БЕН, ГПНТБ и др.
Одним из крупнейших проектов является создание Научной электронной библиотеки — проект Российского фонда фундаментальных исследований, который выполняется по "Программе поддержки российских научных библиотек", начатой РФФИ в 1997 году. С 1998 года в рамках программы РФФИ поучает по подписке электронные версии более 2000 названий зарубежных научных журналов. Основная задача этого проекта - обеспечить российских ученых, специалистов, преподавателей и студентов ВУЗов доступом к электронным версиями журналов практически по всем направлениям фундаментальной науки.
Одно из определений термина "электронная библиотека", принятое в 1995 году Ассоциацией исследовательских библиотек США, гласит что, «.под электронными библиотеками понимается технология создания распределенных информационных систем, характеризующихся высокой степенью интероперабельности составляющих компонент, предоставляющих универсальный доступ к хранящейся информации, и содержащих мультимедийную информацию, а также сами информационные ресурсы, созданные с помощью такой технологии» (цитируется по [110]).
Основные задачи электронной библиотеки - интеграция информационных ресурсов и эффективная навигация в них. Здесь под интеграцией понимается их объединение (с сохранением особенностей представления) с целью предоставления доступа к различной по назначению и форме представления информации, а также обеспечение пользователю эффективных возможностей для ее поиска и обработки, предпочтительно в функционально однородной среде. При этом объединение ресурсов не обязательно должно осуществляться физически - оно может быть и виртуальным, но в любом случае обеспечивать пользователю восприятие ресурсов как единого информационного пространства [6, 27].
Фактически, такое понимание ЭБ сочетает особенности, свойственные как традиционным библиотекам (систематизированное обслуживание читателей), так и специализированным информационным центрам (технологическим комплексам, предназначенным для информационного обеспечения задач определенной проблемной области). Это отражается, например, в провозглашенной OCLC задаче каталогизации и систематизации ресурсов Internet, а также таких особенностях ЭБ, как про-фильность хранимой информации и инвентаризация информационных объектов (т.е., наличие определенной концепции формирования информационного пространства, доступного пользователю).
Наряду с упомянутыми примерами, представляющими, в основном, масштабные проекты и, главное - имеющими преимущественно информационную историю, вобравшими лучшие традиции информационной деятельности^ ориентированной на обслуживание пользователя, заметной составляющей (по крайней мере Internet-ресурсов) стали коллекции информационных объектов различного вида и назначения [70, 127]. Особенностью таких ресурсов1 помимо распределенности является гетерогенность - практически неограниченное разнообразие форм их представления (форматов и сред хранения), а также разнокалиберность условий и методов доступа. Сюда относятся ресурсы самого разного масштаба: от отдельных электронных документов, размещенных на авторской Internet-странице, до электронных коллекций и библиотек крупнейших издательств, таких как Elsevier, Kluwert, Springer и т.д. Но, следует отметить, что в любом случае информационный ресурс, в отличие от набора данных, идентифицируется не только адресом хранения, но и содержанием, имеющим информационную природу (практически каждый ресурс создается изначально ориентированным на адресное хотя, возможно, и неоднозначное восприятие, что и является предпосылкой создания новой информации), а его доступность обеспечивается встроенным или внешним более или менее развитым поисковым средством, избыточном по отношению к самому ресурсу.
В общем случае можно заметить, что в качестве компонентов здесь выступают электронные каталоги (библиографические и реферативные базы данных), полнотекстовые массивы (электронные журналы, фактографические базы данных, коллекции электронных документов или копий первоисточников и т.д.), справочно-нормативные файлы (рубрикаторы, тезаурусы, авторские, предметные, географические и другие указатели), возможно связанные между собой ссылками, указателями хранения или условиями поиска. Например, записи электронных каталогов содержат
1 Информационные ресурсы в [86] определяются как совокупность накопленной информации, зафиксированной на материальных носителях в любой форме, обеспечивающей ее передачу во времени и пространстве. Таким образом, в контексте автоматизированных информационных систем под информационными ресурсами можно подразумевать информационные массивы и базы данных, рассматриваемые совместно с информационными технологиями, обеспечивающими их доступность. указания местоположения книг, а справочно-нормативные файлы традиционно используются в качестве "точек входа" в библиографические и реферативные базы данных. С появлением технических возможностей создания полнотекстовых баз данных справочно-поисковый аппарат и собственно массив информации технологически становятся единым целым, и на первый план выходит задача организации такой взаимосвязи, чтобы переход по ссылке от компонентов одного ресурса к компонентам другого, а также от компонентов одного уровня к компонентам другого, воспринимался пользователем как простейший одноактный процесс, подобный перевороту страницы книги.
Поскольку конечной целью построения любой информационной системы является обеспечение пользователю условий получения нужной информации, немаловажную роль играет форма и процедура подачи этой информации. Для того чтобы пользователь мог легче воспринимать большие объемы информации, разработано множество форм и методов ее представления, что выражается, например, в создании «фирменных» стандартов хранения и методов поиска, а также интерфейсов, адаптируемых каждым конкретным пользователем для себя. В то же время для пользователя Internet привычным, а иногда и наиболее удобным является использование таких стандартных программ, как Internet Explorer или Netscape Navigator [29].
Другой особенностью современности является наблюдаемый режим "информационного самообслуживания". Пользователь, привыкший к интуитивному освоению программных сред (в основном, стандартных средств операционной системы, большинство из которых имеет существенно более простой и дружественный интерфейс), часто неадекватно оценивает состояние и результаты поиска. Показательными примерами являются такие ситуации, как: принятие безаппеляционного решения о "плохой" базе данных или поисковой системе после получения неудовлетворительного или нулевого результата по первому же запросу, иногда даже не являющемуся правильным с точки зрения поискового языка; прекращение пользователем развития запроса, если он получает известные или собственные публикации, т.е. когда происходит подмена критерия остановки процесса поиска по условию нахождения нужной новой информации или остановки по условию отсутствия новой информации в каждой следующей выдаче фактом подтверждаемое™ "результативности" выражения запроса.
Кроме того, пользователь рискует обрести некоторую убежденность в том, что поисковые системы (особенно когда речь идет о поисковых средствах Интернет) всемогущи и вездесущи, а их способности извлекать информацию (знания) из текстов и массивов документов бесконечно выше человеческих. Такой подход в самом безобидном случае приводит к некритичному отношению к результату поиска, т.е. пользователь удовлетворяется уже фактом получения выдачи (а современные поисковые системы часто устроены так, чтобы практически всегда пользователю выдавались какие-нибудь документы, пусть даже и в минимальной степени соответствующие запросу).
Поскольку система является всего лишь инструментом, используемым человеком при поиске, а не интеллектуальным автоматом для поиска информации, эффективность ее использования зависит от того, насколько хорошо человек знает природу объектов и свойства инструмента, посредством которого он с этими объектами работает.
Т.е. с точки зрения процесса человеко-машинного взаимодействия не менее важными факторами, чем эффективность организации данных, становится эффективность организации интерфейса, не только адекватно представляющего потенциально полезные возможности системы, но и учитывающего психологические особенности восприятия человеком как отдельных элементов самого интерфейса, так и результат взаимодействия с системой в целом.
Таким образом, можно сказать, что процесс информационного обеспечения (поиска и предоставления информации по проблеме) предполагает определение (построение) информационного пространства (среды), включающей: информационные ресурсы, содержащие данные, сведения и знания, зафиксированные на соответствующих носителях информации; организационные структуры, обеспечивающие функционирование и развитие информационного пространства, в частности, сбор, обработку, хранение, распространение, поиск и передачу информации; средства поддержки информационного взаимодействия, в том числе программно-технические средства и организационно-нормативные документы, обеспечивающие доступ к информационным ресурсам на основе соответствующих информационных технологий, рассматриваемых в контексте условия наследования особенностей существующего положения и требования преемственности будущих решений.
Изложенные выше аспекты позволяют выделить три уровня задач организации, создания и использования информационных ресурсов:
1) Уровень взаимодействия пользователей с ресурсами - задачи организации работы пользователей с информационными ресурсами (свойства и характер используемых ресурсов, интерфейсы и технологии поиска, справочно-обучающая поддержка и т.д.).
2) Уровень системной организации информационного пространства - задачи, связанные со структурой информационного пространства (состав и взаимосвязи данных, технологии поиска и выдачи информации, а также модели и средства взаимодействия, обеспечивающие интероперабельность).
3) Организационно-технологический уровень - задачи функционирования и сопровождения информационного ресурса на протяжении всего его жизненного цикла (выбор источников, средства создания и ведения баз данных, выбор стандартов хранения информации, протоколов взаимодействия и доступа и т.д.).
Необходимо отметить, что все компоненты и задачи тесно связаны между собой и должны рассматриваться параллельно и в контексте конечной цели - такой организации взаимодействия компонент совокупной человеко-машинной системы (взаимодействия пользователя с распределенным информационным ресурсом), которая обеспечит эффективность процесса генерации нового знания.
Таким образом, организация информационного пространства (отдельных информационных ресурсов и их взаимодействие) рассматривается как задача управления распределенными ИР (на уровне управления потоками информации) в контексте обобщенной задачи информационного обслуживания абстрактного пользователя, воспринимающего сеть взаимосвязанных автоматизированных систем (АИС) как единый ресурс. Соответственно, управление информационными ресурсами (как замкнутый цикл основной и информационной деятельности) должно рассматриваться в следующих аспектах:
1) производство ИР (баз данных как основной составляющей ИР) - определение предметной области, базирующееся на анализе и классификации информации и потребителей информации; определение характера представления ИР (типа БД); создание дополнительных и справочных информационных массивов;
2) создание систем (технических, технологических и организационных), обеспечивающих эффективный доступ пользователей различных категорий к ИР на уровне локальных или распределенных ассоциаций баз данных. Задачи этого уровня предполагают определение круга потенциальных пользователей и типов информационных потребностей, а также координацию обслуживания пользователей путем выбора внешних баз данных и средств их использования;
3) использование ИР (эксплуатация информационно-поисковой системы как рабочей станции) - предполагает локальное администрирование БД (определение структуры документа и связей с внешними БД; обновление БД и т.д.), а также адаптацию пользовательского поискового интерфейса (технологии и интерфейсные объекты, использование справочных и метаинформационных БД);
Причем, как отмечается в [87], автоматизация информационной деятельности и управления ИР на всех уровнях обуславливает необходимость разработки общих принципов и теоретических основ семантико-статистического моделирования, которые, во-первых, охватывали бы максимальное количество типов и уровней информационных процессов и технологий управления ИР, а во-вторых - были бы работоспособны с позиций реализации конкретных систем.
В потоках информации, поступающих потребителю, можно выделить две составляющие:
- документы локального ресурса, поступающие непосредственно от источников комплектования;
- информация, поступающая от других элементов сети по каналам обмена.
Наличие этих двух составляющих в информационных потоках, многоаспектность и большое количество источников информации, существенное влияние фактора рассеяния информации делает задачу о распределении потоков информации сла-боструктурируемой. Кроме того, необходимо рассматривать информационное пространство как единую среду, поскольку именно такой подход позволит расширить круг источников информации и обеспечить возможность поиска по смежным и комплексным тематикам. Т.е., проектирование и разработка систем поддержки такого информационного пространства необходимо основывается на решении вопроса о совместимости образующих сеть систем, рассматриваемой в контексте лингвистической и структурно-логической интероперабельности.
Поскольку обеспечение информационной совместимости по лингвистическим средствам и процедурам аналитико-синтетической обработки документов является основной предпосылкой, в настоящей работе предпринята попытка разработки автоматизированной системы управления информационными ресурсами и логикосемантического обеспечения, включающего комплекс проблемно-ориентированных моделей. Это позволит на основе постоянно (и в основном автоматически) отслеживаемых данных об изменениях семантических параметров документальных потоков и информационных потребностей автоматически определять рациональную структуру взаимодействия. Такой подход соответствует специфике систем научной информации, проявляющейся в динамизме развития структуры сети и ее элементов, наличии сильного взаимодействия и взаимовлияния отдельных структурных элементов, обладающих при этом значительной степенью автономности.
Доступ к распределенным информационным ресурсам должен рассматриваться шире, чем только нахождение некоторых документов. Взаимодействие пользователя с комплексом гетерогенных информационных ресурсов определяется и, соответственно, рассматривается как процесс, зависящий от двух групп основных факторов. С одной стороны - это особенности назначения и характера информации, а с другой - особенности и специфика восприятия и переработки человеком как основной (целевой) информации, так и технологической, обеспечивающей условия взаимодействия пользователя с информационной средой. Это предполагает необходимость персонификации представления проблемно-ориентированного информационного пространства и, соответственно, разработку интерфейсов информационно-поисковых систем как адаптируемых подсистем организации и развития процесса человеко-машинного взаимодействия.
Целью диссертационной работы является исследование интегрированных человеко-машинных информационных систем и создание комплекса моделей и методов разработки автоматизированных систем управления гетерогенными информационными ресурсами, ориентированных на задачи информационного обеспечения научных исследований.
В работе определены следующие основные задачи:
- исследование системообразующих основ и разработка структурно-логических моделей обобщенной системы воспроизводства информации;
- разработка математических моделей информационного поиска в распределенных документальных базах; исследование и разработка моделей и поведенческих стереотипов пользователей при поиске информации в автоматизированных АИС;
- разработка средств создания масштабируемых распределенных информационных систем.
Диссертационная работа состоит из введения, четырех глав, заключения и приложения.
Заключение диссертация на тему "Исследование и моделирование систем управления доступом к гетерогенным информационным ресурсам"
Выводы по третьей главе
1. На основе анализа специальной литературы по когнитивным и поведенческим моделям пользователей введена схема типизации.
2. Проведены экспериментальные исследования статистики поисковых сессий пользователей на примере обращений к серверу баз данных по общественным наукам ИНИОН РАН. Результаты анализа подтвердили, что пользователи могут быть квалифицированы в соответствии с поведенческими типами на основании статистических показателей функциональной активности.
3. Систематизированы основные понятия интерактивного поиска документальной информации.
4. Разработана обобщенная технология поиска информации в документальных базах данных. Выделены интерфейсные объекты и технологические схемы поиска. Определены примерные технологии для различных категорий пользователей.
5. Предложена характеристика, задаваемая распределением функции вероятности отбора сообщения по фиксированному порогу формальной релевантности, отражающая отношение потребителя, заданного его информационным профилем, к документальному потоку, образующему ципфовское распределение на совокупном словаре. Сопоставление такой характеристики уровня вторичных документов аналогичной характеристике уровня первоисточников позволяет определить параметры семантических средств, используемых вторым контуром.
Глава 4. Управление распределенными гетерогенными ИР
4.1. Сетевые информационные системы.
Электронные библиотеки как информационный ресурс
Сетевые информационные системы, имея в качестве основной задачи обеспечение эффективной навигации в так или иначе локализованных ресурсах владельца, постепенно трансформируются в т.н. электронные библиотеки, объединяющие в том или ином виде не только собственные, чаще всего однородные информационные ресурсы, но и внешние. При этом объединение ресурсов не обязательно должно быть физическим - оно может быть виртуальным (объединением через указание связи), но воспринимаемым пользователем как единое информационное пространство.
Кроме того, современные сетевые средства, обеспечивающие практически моментальный доступ к удаленным ресурсам, в сочетании с вычислительными мощностями персональных компьютеров, способных обрабатывать объемы информации, сравнимые с объемами национальных библиотек, уже сами по себе предполагают необходимость, и реально позволяют создавать по существу персональный информационный сервис на базе распределенных ресурсов информационного пространства, представляемый пользователю как специализированный информационный портал.
Все это позволяет говорить об организации систематизированного информационного пространства, обеспечивающего пользователю как разноплановое вхождение в предметную область (через рубрикаторы, описатели ассоциированных ресурсов, тематический поиск и т.д.), так и об эффективной технологии управления доступом к полным текстам документов путем предоставления электронной копии или переадресацией к соответствующему хранилищу.
4.1.1. Компоненты распределенных ИР
С точки зрения характера размещения информационных ресурсов (т.е. их локализации в вычислительной среде, что в итоге и определяет технологию и условия их использования) можно выделить два класса систем:
- локализованные, когда метаинформационная, поисковая и информационная компоненты объединены в одной программной и общей вычислительной среде;
- распределенные, когда компоненты находятся, возможно, в различном сочетании, на взаимно удаленных вычислительных системах, взаимодействующих на уровне сетевого протокола и функционирующих под управлением разных программных систем. Здесь, в свою очередь, можно выделить два типичных варианта. Первый - системы, использующие ассоциированные ресурсы, когда 180 локализована метаинформационная, а также, возможно, поисковая компоненты, а информационная компонента является распределенной (удаленной и независимо изменяющейся). Второй - с произвольно распределенными компонентами, когда о ресурсе известны только его Интернет-адрес и, возможно, параметры для генерации поискового запроса.
Системы первого типа обеспечивают доступ удаленных пользователей к ресурсам, сосредоточенным на поисковом сервере. Эти системы в большинстве случаев функционально эквивалентны локальным системам, например, на CDROM-носителях.
Ко второму типураспределенных ИР относятся системы, использующие данные, находящиеся на Web-серверах, в качестве распределенных первичных информационных ресурсов; вторичные и индексные данные сосредоточены на поисковом сервере, осуществляющем обслуживание пользователей. Это такие системы, как AltraVista, Rambler, Lycos, OpenText и пр.
К третьему типу относятся системы, использующие принципы Wais. Здесь процесс поиска реализуется на совокупности серверов, распределенных по сети, которые при обработке запроса опрашивают друг друга, причем исходные и промежуточные данные поиска также имеют распределенный характер.
В контексте такой типологии рассматриваемая электронная библиотека, построенная на основе сетевой версии АИС IRBIS, относится к первому и, частично при использовании ассоциированных ресурсов - ко второму типам.
С точки зрения типологии информационных компонент, можно говорить, что в общем случае они образуют трехуровневую структуру, включающую:
- компоненты метаинформационного уровня, обеспечивающие "узнаваемость" коллекции в целом, идентификацию как ее наполнения, так и формы представления;
- компоненты справочно-поискового описания объектов, обеспечивающих семантическую идентификацию - "узнаваемость" отдельного документа за счет унификации и нормализации представления как элементов данных, так и содержания. Обычно это библиографические записи или какая либо другая вторичная информация, представляющая поисковые образы документов;
- компоненты уровня первичной информации: текст, графику, аудио, и т.д., то есть собственно информативные документы.
На рис. 4.1 приведена обобщенная типология взаимосвязей компонент различного уровня, где в скобках даны примеры, характерные для автоматизированных или традиционных информационных систем.
Рассматривая эту схему как технологию поиска, можно видеть, что ссылки вполне узнаваемы и представляют собой привычные правила и приемы отыскания информации в условиях традиционной библиотеки, где поиск начинается с классификационной схемы, указателя или каталога, и далее через библиографические описания приводит к первоисточнику, по которому, используя теперь уже пристатейные ссылки и указатели, поиск может быть снова продолжен, например, с метаинформационного уровня. Именно такого рода структура обеспечивает эффективность, сочетая преимущества естественного и искусственного интеллектов с ориентацией на приоритет возможностей человека как лица, готовящего и принимающего решения.
Связи между компонентами информационного и метаинформационного уровня могут быть реализованы как на уровне спецификации возможности перехода в соответствующую базу для локальной работы и последующего возврата, так и "оперативного" связывания, контекстно-обусловленного содержанием текущего документа. В первом случае эта возможность реализуется через визуализацию ссылок на соответствующий ресурс в целом, во втором - через генерацию динамической связи с использованием в качестве идентификаторов указываемых документов ключевых элементов данных текущего документа.
Связи между документами компонент первичной и вторичной информации могут быть построены на таких идентификаторах, как ISBN и ISSN или DOI. В тех случаях, когда такие идентификаторы отсутствуют, одним из решений может быть генерация динамических связей, генерируемых во время обращения к записи. В качестве основы для построения таких идентификаторов здесь могут выступать либо уникальные элементы записи, либо их свертки.
Массив библиографии обычно разделен по тематическому признаку на несколько проблемно-ориентированных баз данных, а электронные копии хранятся в специальных разделах сервера. С другой стороны, библиографические описания отдельных книг и статей из журналов могут быть включены сразу в несколько баз.
Связь библиографического описания и электронной копии здесь определена на уровне структуры идентификатора копии, который генерируется из элементов библиографического описания источника - шифра хранения, года издания и некоторых других элементов библиографического описания. Когда пользователь обращается к той или иной библиографической записи, система поиска генерирует идентификатор предполагаемой копии, и, после проверки ее наличия в хранилище, визуализирует сгенерированную гиперссылку. Если копия по каким-либо причинам удаляется из электронного хранилища, то, соответственно, ссылка во всех библиографических базах генерироваться не будет.
Переход к другой знаковой системе Стаблицы перекрестных ссылок)
Метаинформация
Тезаурусы, рубрикаторы, указатели, типовые запросы)
Переход из класса справочной области к тематическому кластеру первичных документов (указатели ци-тируемости, авторские указатели)
Переход из класса справочной области к тематическому кластеру вторичных документов (тематические указатели))
Структурно-определенная ссылка см. также", документ-аналог) Л
Запрос справочной информации поисковые поля, ИПЯ)
Вторичная информация реферативно-библиографические БД, поисковые образы документов)
Адресная ссылка Ошифр хранения)
Контекстно-определенная ссылка (гипертекст) Л
Ссылки на аналоги и первоисточники (библиография, указатели имен)
Ссылка на определение понятия или логической структуры ("см. определение ")
Первичная информация полные тексты, графические образы)
Рис. 4.1. Типология взаимосвязей (ссылок) между элементами данных информационных компонент различного уровня
Конечно, это возможно лишь при достаточно строгой структуризации данных и применении алгоритмов свертки, допускающих минимальный процент дублирования. Установленные подобным образом связи допускают возможность ошибочного определения объекта, однако, это решение кажется приемлемым, так как позволяет не отслеживать частые изменения компонентов электронных библиотек.
Еще к одному типу активных связей относятся так называемые внешние связи, направленные к компонентам удаленных электронных коллекций, поддерживаемых разными производителями. Если такой ресурс представляет собой полнотекстовую базу данных с собственным поисковым аппаратом, то связеобразующий механизм может функционировать на уровне обмена запросами. При этом запрос от электронной библиотеки к внешнему (ассоциированному) ресурсу должен формироваться программно, базируясь на данных исходной записи. Для примера рассмотрим механизм связывания записей рефера-тивно-библиографических баз данных с электронными журналами Научной электронной библиотеки (НЭБ) РФФИ.
При формировании результатов поиска в реферативной базе для записей, которые соответствуют каталогу журналов (это определяется по справочнику соответствующего ассоциированного ресурса), система строит ТЖЬ-запрос к Научной электронной библиотеке. При инициировании такой сгенерированной ссылки полный текст статьи, в случае его обнаружения на сервере НЭБ и после проверки прав доступа, выдается пользователю. Таким образом, создаются активные гипертекстовые ссылки, которые распространяются только на определенный набор ресурсов.
4.1.2. Общие принципы взаимодействия и используемые протоколы
Общие требования, необходимость которых продиктована опытом эксплуатации локальных информационных систем, сводятся к следующим положениям:
- информационная система должна допускать возможность работы с данными, расположенными на разных физических серверах (на различных аппаратно-программных платформах) и хранящимися в различных внутренних форматах;
- информационная система строится на основе абстрактной схемы данных, на которую должны быть отображены конкретные базы данных. Это позволяет объединять данные из разнородных систем в одной логической групп;
- система должна оперировать не конкретным синтаксисом запросов, а его логической сутью на основе абстрактных атрибутов;
- система должна предоставлять полную информацию о себе и всех своих ресурсах;
- система должна быть способна предоставлять различные уровни привилегий пользователей на доступ к информации (разграничение доступа);
- система должна легко расширяться и быть основана на открытых стандартах и протоколах;
- связь с другими системами - возможность интегрировать свои ресурсы с ресурсами других информационных систем;
- легкость в общении - для пользователей система должна предоставлять простые интерфейсы доступа к информации.
Надо отметить, что сотрудничество библиотек будет осуществляться по принципу распределенных библиотечных систем на базе открытых стандартов обмена данными. В области автоматизации функционирования библиотек существуют как минимум два таких протокола: Z39.50 и HTTP.
Одним из различий между Z39.50 и HTTP является способ связи клиента и сервера. HTTP-серверу ничего не известно о результатах предыдущего взаимодействия с клиентом, в то время как Z39.50 ориентирован на поддержание какого-либо режима работы (поиск, представление данных и т.п.),причем каждый режим работы использует информацию о результатах выполнения предыдущих операций. Например, извлечение документов производится при помощи результирующего множества, сформированного в результате обработки запроса на поиск и хранимого сервером до закрытия Z-соединения. На практике это различие относительно. Существует несколько способов имитации постоянного соединения при использовании HTTP. С другой стороны, непрерывно увеличивающаяся производительность машин-клиентов и серверов снижает потребность в поддержании постоянного Z-соединения в реализациях Z39.50 (т.е. отпадает необходимость в хранении и сложном администрировании результатов поиска - серверу проще обработать весь запрос снова).
Следующим критерием сравнения протоколов может являться сложность их реализации. HTTP - простой протокол, по сравнению с Z39.50. По существу, единственной услугой, которую предлагает HTTP, является возможность получения документа, указанного URL. Это также возможно и с помощью Z39.50, но последний предлагает множество других услуг.
Еще одним важным свойством рассматриваемых протоколов является их интеллектуальность. Рассматривая HTTP и Z39.50 как протоколы извлечения информации, следует отметить, что 239.50-клиент более пассивен, чем HTTP-клиент, но более интеллектуален. HTTP-клиент запрашивает у сервера поисковую форму, определяющую сложность запроса, составляемого конечным пользователем путем заполнения этой формы. 239.50-клиент имеет возможность посылать сложные запросы без консультаций с сервером. Z39.50-клиент может информировать сервер о своем состоянии, также как сервер клиента о результатах поиска информации.
И, наконец, Z39.50 и HTTP можно сравнить по их назначению. Z39.50 является специализированным протоколом с возможностями, которые необходимы в контексте автоматизации библиотечных процессов и поддержки доступа к базам данных в реальном масштабе времени. HTTP же является протоколом общего назначения.
Возможности построения информационных систем на базе Z39.50 и HTTP
Нетрудно видеть, что оба протокола имеют свои достоинства и недостатки. Поэтому имеет смысл строить информационные системы с использованием обоих протоколов так, чтобы скомпенсировать недостатки одного протокола достоинствами другого, тем более, что как уже было сказано выше, нет принципиальных ограничений на построение таких систем.
Оба рассмотренных протокола постоянно развиваются, предоставляя разработчикам новые функциональные возможности обработки информации. По-видимому, это развитие будет происходить параллельно, представляя два альтернативных способа коллективного доступа.
За относительно небольшой срок существования HTTP и Z39.50 создано довольно большое количество соответствующих серверов и клиентов. Однако общедоступные их реализации обладают только ограниченным набором возможностей. При построении сложных систем обработки информации требуется, создание оригинального программного обеспечения, выполняющего все необходимые функции, или приобретение коммерческих систем, если таковые имеются.
Каждая библиотека на своем сервере представляет имеющиеся электронные каталоги, посредством которых осуществляется поиск информационных ресурсов. Национальным форматом обмена библиографических данных в России является коммуникативный формат RUSMARC, который поддерживают почти все библиотеки, но помимо него библиотеками поддерживаются и другие, например, МЕКОФ или USMARC. Признанный в Internet формат обмена данными Dublin Core у нас в стране находится на стадии зарождения, над его внедрением в сеть российских электронных библиотек работает РГБ.
В результате проведенного сравнительного анализа была получена следующая сводная таблица 4.1 использования протоколов ведущими библиотеками РФ
Заключение
Задачи повышения эффективности информационного обеспечения научных исследований рассматриваются на двух уровнях:
- локальном, как организация информационного пространства пользователя, представляющего информационные ресурсы (документальные базы данных) адекватно решаемым задачам; системном, как средства, обеспечивающие интеграцию ИР в контексте задач поиска документальной информации. Организация информационного пространства (отдельные информационные ресурсы и их взаимодействие) рассматривается как задача управления распределенными ИР на уровне управления потоками информации в контексте обобщенной задачи информационного обслуживания абстрактного пользователя, воспринимающего сеть АИС как единый ресурс. На основании анализа технологии обработки документов в АИС проводится систематизация и дается описание различных видов совместимости как основного фактора, определяющего интероперабельность информационных систем. Выделяются два класса задач: логико-семантические, связанные с анализом близости тематических потоков и/или профилей, и оптимизационные, связанные с генерацией рациональной структуры. Основное внимание уделено сравнительному анализу известных принципов и методов статистической оценки меры семантической близости ИПЯ как интегрального показателя, характеризующего тематическую близость информационных ресурсов.
Разработана теоретико-множественная модель ИПЯ, учитывающая структуру семантических отношений, свойственных классификационным языкам, и комбина-тивность, характерную для дескрипторных языков. Определен показатель, динамически отражающий статистические особенности документального потока, заданного на ИПЯ, и учитывающий структуру отношений, задаваемых классификационной схемой предметной области.
Оптимизация информационного пространства по организации доступа к распределенным ресурсам проблемной области строится на использовании формальной меры информационной совместимости, которая построена на основе математической модели индексирования текста дескрипторами информационно-поискового тезауруса. Введенная мера учитывает совместимость процессов индексирования, совместимость языков по лексике и структуре семантических отношений, а также формальный критерий смыслового соответствия. Влияние изменений семантических параметров взаимодействующих систем отражает динамическая модель рабочего словаря индексирования АИС. Проведен эксперимент по оценке информационной совместимости на отраслевых массивах вторичных документов. Содержательный анализ результатов подтвердил адекватность предложенных моделей.
Для оценки фактора стандартизации представления и передачи информации проведен сравнительный анализ спецификаций и стандартов, который позволил выделить следующие группы по особенностям их использования на разных этапах обработки информации: обменные форматы; форматы представления информации; специализированные стандарты, ориентированные на поиск и предоставление пользователю документальной информации. Проведен сравнительный анализ особенностей идентификации наполнения групп и элементов данных коммуникативных форматов для обмена вторичной информацией. Построен репозиторий описаний элементов данных. Определен механизм представления и сопоставления метаданных.
Для анализа и оценки факторов, определяемых особенностями восприятия и целевой обработки информации человеком с помощью АИС, на основе материалов исследований по когнитивным и поведенческим моделям введена схема типизации пользователей. Проведены экспериментальные исследования статистики поисковых сессий пользователей на примере обращений к серверу баз данных по общественным наукам ИНИОН РАН. Результаты анализа подтвердили, что пользователи могут быть квалифицированы в соответствии с поведенческими типами на основании статистических показателей функциональной активности.
Для определения требований, предъявляемых к интерактивным системам документального поиска, разработана обобщенная технология поиска информации в документальных базах данных. Систематизированы основные понятия интерактивного поиска документальной информации. Выделены интерфейсные объекты и технологические схемы поиска.
Разработана математическая модель, позволяющая оценить отношение потребителя, заданного его информационным профилем, к документальному потоку, что в свою очередь позволяет определить параметры семантических средств, используемых при отборе документов.
Разработана обобщенная схема организации информационных ресурсов, представляемых в форме электронных библиотек. Определен состав и взаимосвязь
214 компонентов, обеспечивающих интероперабельность электронных библиотек, использующих протоколы HTTP и Z39.50. Разработаны средства управления представлением документальной информации. Язык описания данных позволяет специфицировать тип и форму представления элементов информации и связи, как на уровне элементов данных, так и на уровне коллекций или отдельных документов.
Результаты исследований были положены в основу и использованы при разработке ряда программного обеспечения информационных систем и технологических комплексов, что подтверждается соответствующими актами о внедрении.
Библиография Максимов, Николай Вениаминович, диссертация по теме Информационные системы и процессы, правовые аспекты информатики
1. Абдеев Р.Ф. Философия информационной цивилизации. М.: Владос, 1994
2. Аверьянов Л.Я. Почему люди задают вопросы? М.: Социолог, 1993, 152с.
3. Аветисян Д. О. Проблемы информационного поиска. М.: Финансы и статистика, 1981.
4. Аграев В.П., Кобрин Р.Ю., Шульц М.М. О совместимости информационно-поисковых систем. // НТИ, Сер. 2, 1974, № 4.
5. Андрукович П.Ф., Королев Э.И. О статических и лексико-грамматических свойствах слов. // НТИ, Сер. 2,1977, № 4.
6. Антопольский А.Б., Вигурский К.В. Концепция электронных библиотек. // Электронные библиотеки, Т.2, Вып.2, М., 1999.
7. Арапов М.В., Ефимова E.H., Шрейдер Ю.А. О смысле ранговых распределений. // НТИ, Сер. 2, 1975, № I.
8. Арапов М.В., Ефимова E.H. Понятие лексической структуры текста. // НТИ, Сер. 2, 1975, № 6.
9. Арапов М.В., Тер-Гаспарян Л.И., Херц H.H. Сравнение частотных словарей. // НТИ, сер. 2,1978, № 4.
10. И.Белецкая О. Д. Когнитивно-коммуникативная интерпретация вопросно-ответных единств. Дисс. на соискание уч. степени канд. филол. наук. Тверь.: ТвГУ, 1999, 126с.
11. Белнап Н., Стал Т. Логика вопросов и ответов. М.: Прогресс, 1981.
12. Блек В.А. Информационное обеспечение научных исследований -Л.: Наука, 1974.
13. Богданов Ю.В. О сущности понятий и количественной оценке содержательности и ценности информации // НТИ, Сер. 2, 1974, № 3, с.3-6.
14. Большаков И.А. Освоение новых слов, независимо появляющихся в однородном тексте. // НТИ, Сер. 2,1972, № 3.
15. Бриллюэн Л. Научная неопределенность и информация. М., 1966.
16. Васина E.H., Голицына О.Л., Максимов Н.В. Документальная информационно-поисковая система IRBIS (редакция 2.1) // Свидетельство №940422 от 29.09.1994г. Государственный реестр программ для ЭВМ, 1994г.- 216
17. Виленская C.K. О совместимости информационно-поисковых языков. // НТИ, Сер. 2,1977, № 5.
18. Влэдуц Г.Э., В.В.Налимов, Н.И. Стяжкин. Научная и техническая информация как одна из задач кибернетики. УФН, 1959, т.60, №1.
19. Воробьев Г.Г. Проблема документальной информации / сб. Кибернетика и документалистика. Механизмы процесса накопления, хранения и поиска научной информации. М.: Наука. -1966., с.5-34.
20. Войскунский В.Г. Адаптивный информационный поиск: теория и стратегии // НТИ. Сер. 2, 1999, №9, стр.1-10.
21. Войшвилло И.К. Понятие. М., 1967.
22. Герасименко В.А. Основы информационной грамоты. -М.: Энергоатомиздат, 1996.-320 с.
23. Гиляревский Р. С. К проблеме совместимости информационно-поисковых языков различных типов. //НТИ, Сер. 2, 1978, № I.
24. Глухов В.А. Исследование, разработка и построение системы электронной доставки документов в библиотеке: Автореф. дис. Новосибирск, 2000. - 18 с.
25. Глухов В.А., Лаврик О.Л. Электронная доставка документов. М.: ИНИОН РАН, 1999. - 132 с.
26. Глухов В.А., Голицына О.Л., Максимов Н.В. Электронные библиотеки. Организация, технология и средства доступа. НТИ, сер.2, 2000г., №10, стр. 18.
27. Глушков В.М., Скороходько Э.Ф., Стогний A.A. Оценка степени совместимости информационно-поисковых языков документальных ИПС //НТИ, сер.2, 1978, № I.
28. Голенский С.П., Пустельникова Е.Г., Захаров В.П.,. Масевич А.Ц Информация + технологии: опыт сотрудничества Библиотеки Российской академии наук и Института высокопроизводительных вычислений и баз данных // Электронные библиотеки.-1999, т.2, вып.2.
29. Голицына О.Л. Максимов Н.В., Человеко-машинный поиск в документальных базах данных. // Теория и практика общественно-научной информации, Вып.12, 1996.-с.107-117.
30. Горностаев Ю.М., Сумароков Л.Н. Интегрированные информационные системы. М.: Информэлектро, 1972.
31. Горькова В.И., Петренко Б.В., Нешитой В.В., Шикло Ю.М. Статические методы анализа входных документов информационного потока. Обзорная информация -Минск: ВНИИ НТИ, 1974.
32. Горькова В.И., Зотова ДА. Критерии оценки структурных связей понятий классификационных систем. -" НТИ", сер. 2, 1979, № 9.
33. Григорьев В.А. Стереотипы и фантазия в интеллектуальных системах. // НТИ, Сер.2-1999, №7, стр. 10-27.
34. Грознов К.Ю. Психологический интеллектуальный интерфейс адаптивного общения пользователя с вычислительной системой. Дисс. На соискание уч. Степени к.т.н. М.: МИРЭА, 1996, 396с.
35. Гультяев А.К., Машин В.А. Проектирование и дизайн пользовательского интерфейса. СПб.: Коронапринт, 2000. -352с.
36. Дернер Д. Логика неудач. М.: Смысл, 1997.
37. Дидук H.H. Элементы теоретического аппарата для количественного описания и анализа ситуаций неопределенности. Дисс. на соискание уч. степени канд. физ-мат. наук. К.: КГУ, 1991.
38. Димитрова К. Стратегии информационного поиска // Библиотека, 1995,3, №1, С. 16-22.
39. Дорожкин A.M. Научный поиск как постановка и решение проблем. Н.Новгород: Нижегородский гуманитарный центр, 1995.
40. Дракин В.И., Попов Э.В., Преображенский А.Б. Общение конечных пользователей с системами обработки данных. М.: Радио и связь, 1988. -288с.
41. Дружинин В.В., Конторов Д.С. Проблемы системологии. М., "Советское радио", 1976.
42. Дюбуа Д., Прад А. Теория возможностей. Приложение к представлению знаний в информатике: Пер. с фр. М.: Радио и связь, 1990. -288с.
43. Дюран Б., Оделл П. Кластерный анализ. М.: Статистика, 1977.
44. Ершова Т.В., Хохлов Ю.Е. Межведомственная программа "Российские электронные библиотеки": подходы и перспективы // Электронные библиотеки.-1999, т.2, вып.2.
45. Заличев H.H. Энтропийный подход к прогнозированию развития научных исследований. / Дисс. на соискание уч. степени докт. техн. наук. М.: Институт физ.-техн. проблем РАН, 1991, 229с.
46. Заличев H.H. Энтропия информации и сущность жизни. -М. Радиоэлектроника, 1995. -192с.
47. Зинченко В.П. От классической к органической психологии // Вопр. психол. 1996, №6, стр. 6-25.
48. Злочевский С.Е. Информационные потребности специалистов при организации и проведении НИР. Киев: Общество "Знание" УССР, 1971.
49. Карначук В.И. Классификация информационно-поисковых стратегий. -Новосибирск, 1986.
50. Каширина М.Е. О типах распределений лексических единиц в тексте. в кн.: "Статистика речи и автоматический анализ текста". - Л.: Наука, 1974.
51. Кашперский В.И. Отражение и функция в развивающихся системах. Дисс. на соискание уч. степени докт. филос.наук. Свердловск.: УрГУ, 1989, 355с.
52. Кононенко Р.Н. Разработка методов и алгоритмов мультиагентного поиска релевантной информации в информационных средах гипертекстовой организации. Дисс. на соискание уч. степени канд. техн. наук. Таганрог: ТРТУ, 2000, 335с.
53. Котик М.А., Емельянов А.М. Природа ошибок человека-оператора. М.: Транспорт, 1993.
54. Коутс Р., Влейминк И. Интерфейс «человек-компьютер». М.:Мир, 1990. -501с.
55. Криницкий H.A., Миронов Т.Д., Фролов Г.Д. Автоматизированные информационные системы /Под ред. Дородницына A.A. М.: Наука, 1982. -384 с.
56. Кузнецов H.A. О развитии фундаментальных исследований по информационному исследованию в природе и обществе, www.ippi.ras.ru-Новости.-1998,12 янв.
57. Кулик А.Н. Информационные сети и языковая совместимость дескрипторных ИПС. -М.: "Советское радио", 1977.
58. Ланкастер Ф. Информационно-поисковые системы. М.: Мир, 1972.
59. Леонтьева Т.М., Маргаритов В.Б. Статистический анализ и количественные характеристики элементов тезаурусной системы. НТИ, сер. 2,1970, № 107
60. Лешинер Д.Р. Построение диалоговых средств фактографической автоматизированной информационной системы в интересах пользователей различных категорий. Дисс. на соискание уч. степени канд. техн. наук. М.: ВИНИТИ АН СССР, 1990,180с.
61. Логика и методология системного анализа. Киев - Одесса: Вища школа, 1977.
62. Ломов Б.Ф. Когнитивные процессы как процессы психологического отражения. // Когнитивная психология. Материалы финско-советского симпозиума. -М.:Наука, 1986. с.7-21.
63. Мазур М. Качественная теория информация. М.: Мир, 1974, 239с.
64. Малинин С.Г., Румянцев В.П., Скрипкин В.А., Сумароков Л.Н. О системе моделей управления системами НТИ. в сб.: "Вопросы моделирования и оптимизации информационных систем'", вып. 4, М., "Информэлектро", 1973.
65. Малиновский П.В. Объяснительная функция метафор Hesse. // Объяснение и понимание в науке. Реф. сборник. М.: ИНИОН АН СССР, 1982, с.60-69.
66. Маршакова Н.Б. Построение информационно-поискового тезауруса методов дистрибутивно-статистического анализа. // НТИ, Сер. 2, 1977, № 5.
67. Михайлов А.И., Черный А.И., Гиляревский P.C. Основы информатики. М.: Наука, 1968.
68. Михайлов O.A. Электронные документы в архивах. М.: Диалог-МГУ, 2000г., 325с.
69. Моделирование и познание / Под ред. Штоффа В.А. Минск: Наука и техника, 1974.
70. Москович В.А. Информационные языки. М.: Наука, 1971.
71. Найссер У. Познание и реальность. М., 1981.
72. Никифоров И. С. Разработка средств поддержки процесса навигации в гипермедиа системах. / Дисс. на соискание уч. степени канд. техн. наук. -СпБ., 2000, 127с.
73. Остапов А.И. Библиотечная когнитология. / Под ред. Саяпиной И.А. -Краснодар: КГАК, 1995. 331с.
74. Пиотровский Р.Г. Текст, машина, человек. Л.: Наука, 1975.
75. Племнек А.И., Усманов Р.Т. Z39.50: Открытый доступ к библиографической информации // Научные и технические библиотеки.-1998, N 8, с.24-28.
76. Племнек А.И., Усманов Р.Т., Сова Д.Н. Использование протоколов Z39.50 и HTTP в современных библиотечных информационных системах // Информационный бюллетень РБА.-1998, N 12, с.240-257.
77. Плотников Б.А. Об использовании лексико-графических данных при построении тезауруса.//НТИ, Сер. 2. 1975, № 9.
78. Покрас Ю.Л. Об одном способе установления парадигматических отношений при построении информационно-поискового тезауруса. // НТИ, Сер. 2, 1971, №3.
79. Попов И.И., Попов С.В. Об одном подходе к оценке технической эффективности ИПС и ее анализу. // НТИ, Сер. 2, 1979, № 6.
80. Попов И. И., Романенко А. Г. Некоторые вопросы оптимизации комплектования информационных фондов. // Вопросы моделирования и оптимизации информационных систем, Вып. 4 М.: Информэлектро, 1973.
81. Попов И.И., Романенко А.Г. Сумароков Л.Н. Обобщенная модель процессов информационного обмена. // Вопросы моделирования и оптимизации информационных систем. М.: Информэлектро, 1973.
82. Попов И. И., Романенко А. Г., Сумароков Л. Н. Математическая модель рассеяния информации. // Вопросы моделирования и оптимизации информационных систем. Вып. 4, М.: Информэлектро, 1973.
83. Попов И.И., Романенко А. Г. Моделирование информационных систем. М.: МИФИ, 1979.
84. Попов И.И. Информационные ресурсы и системы: реализация, моделирование, управление. М.: ТПК АЛЬЯНС, 1996,408с.
85. Попов И.И. Моделирование и оптимизация автоматизированных информационных систем и технологий управления документальными информационными ресурсами. / Дисс. на соискание уч. степени доктора техн. наук.-М.:РГГУ, 1996.
86. Попов Э.В. Экспертные системы: решение неформализованных задач в диалоге с ЭВМ. М.: Наука. -288с.
87. Поспелов Г.С., Ириков В. А. Программно-целевое планирование и управление. М.: Советское радио, 1975.
88. Разумовский О.С. От конкурирования к альтернативам. Экстремальные принципы и проблема единства научного знания. Новосибирск: Наука, 1983.
89. Решение основных задач проблема автоматизации управления отраслевой системы НТИ. 7/ Под ред. Малинина С.Г., Романенко А. Г. -М.:Информэлектро, 1975.
90. Риггс Дж. Производственные системы: планирование, анализ, контроль. М.: Прогресс, 1972.
91. Романенко А. Г. Моделирование и оптимизация управления информационными ресурсами в документальных информационных системах и сетях. / Дисс. на соискание уч. степени докт. техн. наук. М., 1990, 392с.
92. Санковский Ю.Е. Метод построения оконного интерфейса пользователя на основе моделирования пользовательских целей. / Дисс. на соискание уч. степени канд. техн. наук. М., 1999, 130с.
93. Серебрянный А.И. Связь кривой роста словаря и распределения части слов. // НТИ, Сер. 2,1974, № 4.
94. Сидоренко В. Д. Семантическая структура тезауруса: современное состояние и направления ее совершенствования. // НТИ, Сер. 2,1976, № 9.
95. Скороходько Э.Ф. Лингвистические проблемы обработки теистов в автоматизированных информационно-поисковых системах. //Вопросы информационной теории и практики. М.: ВИНИТИ, 1974.
96. Смирнов В.А., Финн В.К. Предисловие к книге Белнап Н., Стал Т. Логика вопросов и ответов. М.: Прогресс, 1981.
97. Смирнов С.Н. Элементы философского содержания понятия «система» как ступени развития познания и общественной практики. // Системный анализ и научное знание. М.: Наука, 1978, с.60-83.
98. Соловей Л.А. Практическая природа идеалов познавательной деятельности (на материалах философии и математизированного естествознания). / Дисс. на соискание уч. степени докт. филос.наук К: КГУ, 1988, 390с.
99. Солсо Р.Л. Когнитивная психология. М.: Тривола, 1996.
100. Стрелков Ю.К. Инженерная психология. http://www.psy.msu.ru/science/public/strelkov
101. Сэлтон Г. Автоматическая обработка, хранение и поиск информации. М.: Советское радио, 1973.
102. Сюнтюренко О.В. Электронные информационные ресурсы: проблемы создания и использования / Научный сервис в сети Интернет: Тезисы докладов Всерос. науч. конф. 20-25 сент. 1999 г., Новороссийск. М.: Изд-во МГУ, 1999. с.3-9.
103. Урманцев Ю.А. Начала общей теории систем. / Системный анализ и научное знание. М.: Наука, 1978, с.7-41.
104. Урсул А.Д. Отражение и информация. М.: Мысль, 1973.
105. Феллер В. Введение в теорию вероятностей и ее приложения, т. I. М.: Мир, 1967.
106. Финн В.К. К формальному определению понятия ИПС. //НТИ, сер.2, 1981, №5.
107. Финн В.К., Черный А.И. Интеллектуальные системы и новые информационные технологии в ВИНИТИ. // Итоги науки и техники, Информатика, т. 15 М.: ВИНИТИ, 1991.
108. Фонотов А.Г., П.П. Якуцени П.П. Роль электронных библиотек в передаче технологий // Электронные библиотеки.-1999, т.2, вып.4.
109. Ходж Г., Кэррол Б. Цифровое электронное архивирование: современное состояние и практика // Междунар. форум по информ. и докум., 1999, № 3
110. Целищев В.В. Философские проблемы семантики возможных миров. -Новосибирск, 1977.
111. Чебанов С В. Теория классификаций и методика классифицирования. -"НТИ", сер. 2,1977, № 10.
112. Чепайкин А.О. Разработка математического и программного обеспечения систем управления знаниями на основе семантических сетей для поиска информации. Дисс. на соискание уч. степени канд. техн. наук. М.: МГАПИ, 1999, 147с.
113. Черный А.И. Введение в теорию информационного поиска. М.: Наука, 1975.
114. Шайкевич А.Я. Дистрибутивно-статистический анализ в семантике. // Принципы и методы семантических исследований М.:Наука, 1976.
115. Шемакин Ю.И. Тезаурус в автоматизированных системах управления и обработки информации. М.: Воениздат, 1974.
116. Шеннон К. Работы по теории информации и кибернетике. М.: Иностранная литература, 1963.
117. Шкаренкова Л. Оптимизация стратегии поиска при работе с зарубежными базами данных. София, 1987.
118. Эшби У.Р. Системы и информация. // Вопросы философии, 1964, № 3.
119. Эшби У.Р. Введение в кибернетику. М.: Иностранная литература, 1959.
120. Якушин Б.В. Алгоритмическое индексирование в информационных системах. М.: Наука, 1978.
121. Arms W. Digital Libraries. МГГ Press, 2000, 240p.
122. Bates M. How to use information search tactics online. // Online, 1987, 11, №3
123. Bates M. Search strategies for dialog's view fee. // Online, 1995,1, pp.22-31.
124. Belkin N.J., Cool C., Stein A., Thiel U. Cases, scripts, and information-seeking strategies: On the design of interactive information retrieval systems. // Expert Syst. Appl., 1995, 9, 3, pp.379-395.
125. Belkin N.J., Oddy R.N., Brooks H.M. Ask for information retrieval: Part I. Background and theory // Journal of Documentation, 1982, 38(3), ppl45-164.
126. Borlund P., Ingwersen P. The development of a method for the evaluation of interactive information retrieval systems // J. Doc., 1997, 53, 3, pp.225-250.
127. Boughanem M., Chrisment C., Soule-Dupuy C. Query modification based on relevance back-propagation in an ad hoc environment // Inf. Process, and Manag., 1999, 35, pp.121-139.
128. Brajnik, Mizzaro and Tasso. Intelligent Interface of Bibliographic DateBase. -Milano: Franco Angeli, 1995 pp.95-128.
129. Bruner J.S., Oliver R.R. & Greenfield P.M. (Eds.). Studies in cognitive growth. -New York: Wiley, 1973.
130. Buckland M., Plaunt C. On the construction of selection systems // Libr. Hi Tech., 1994, 12, 4, pp. 15-28.
131. Butler D. Souped-up search engines // Nature, 2000, 405, pp.112-119.
132. Chen H„ Danowitz A. K„ Lynch K. J., Goodman S. E., McHenry W. K. Explaining and alleviating information management indeterminism: A knowledge-based framework // Inf. Process, and Manag., 1994, 30(4), pp.537-577.
133. Chen H., Martinez J., Kirchhoff A., Ng Tobun D„ Schatz B.R. Alleviating search uncertainty through concept associations: Automatic indexing, co-occurrence analysis, and parallel computing // J. Amer. Soc. Inf. Sci., 1998,49(3), pp.206-216.
134. Cory K. Discovering hidden analogies in an online humanities database //Libr. Trends, 1999, 48, pp.60-71.
135. Courtois M.P., Berry M.W. Results ranking in Web search engines // Online, 1999, 23, 3, pp.39-46.
136. Cranach, M. v., Kalbermatten, U. Indermuhle Zielgerichtetes Handeln. Bern, 1980.-77 p.
137. Daniels P.J. Cognitive models in information retrieval // J. of documentation, 1986, Vol. 42, N 4. P. 272-304.
138. Dimitroff A. Mental models theory and search outcome in a bibliographic retrieval system // Libr. a inform, science research, 1992, Vol. 14, N 2. P. 141156.
139. Documentation Guidelines for the Establishment and Development of Monolingual Thesaurus. ISO, 1974.
140. Ellis D. A behavioural approach to information retrieval system design // J. of documentation, 1989, Vol. 45, N 3. P. 171-212.
141. Ellis D. A behavioural model for information retrieval system design // J. Inf. Sci., 1989,15(4-5), pp.237-247.
142. Ellis D., Cox D., Hall K. A comparison of the information seeking patterns of researchers in the physical and social sciences // J. Doc., 1993, 49(3), pp.356-369.
143. Field B. S. A Thesaurus-Based Indexing and Classification System Developed for INSPEC Products and Services. // Journal Documentation, 1974, 30, N 1.
144. Gregory R.L. The confounded eye. // R.L.Gregory & E.H. Gombrich (Eds.). Illusion in nature and art. New York: Scribner, 1977.
145. Hacker W. Activity: A fruitful concept in industrial psychology. / M.Frese & J.Sabini (Eds.), Goal directed behavior: The concept of action in psychology. -Hillsdale, New Fersey: LEA., 1985. 262p.
146. Hearst Marti A. User Interface and Visualization. // Modern Information Retrieval, 2000.
147. Ingwersen P. Wormell I. Modern indexing and retrieval techniques matching different types of information needs. // 44th FID Conf. and Congr., Aug. 28 Sept. 1, 1988. Pt 1. - 1988, pp. 192-203.
148. Ingwersen P. Information Retrieval Interaction. London: Taylor Graham, 1992.
149. Jakobovits L.A., Nahl-Jakobovits D. Measuring information searching competence // College a. research libr. 1990, Vol. 51, N 5. - P. 448-462.
150. Jacquesson A., Schieber W. Term Association Analysis on the Large File of Bibliographic Data, Using a Highly-Controlled Index in Vocabulary. // Information Storage and Retrieval, 1973, 9, N 2.
151. Kerr S.T. Wayfinding in an electronic database: the relative importance of navigational cues vs. mental models // Inform, processing a. management, 1990, Vol.26, N4. -P. 511-533.
152. Knowledge Finder. Data Base Manual. Aries System Corporation, 1998.
153. Koenemann J., Belkin N. A case for interaction: a study of interactive information retrieval behavior and effectiveness. // Proceedings of CHI '96 (Vancouver, Canada, May 1996). ACM Press, 1996, pp.205-212.
154. Kuhlthau C.C., Turock B.J., George M.W., Belvin R.J. Validating a model of the search process: a comparison of academic, public and school library users // Libr. a inform, science research, 1990, Vol. 12, N 1. P. 5-31.
155. Kuhlthau C.C. A principle of uncertainty for information seeking // J. Doc., 1993, 49, №4, pp.339-355.
156. Mackay D.M. What makes the question. // The Listener, 1960,63(5), pp.789-790.
157. Maron M.E. Probabilistic design principles for conventional and full-text retrieval systems. // Inf. Process, and Manag., 1988, 24, 3.
158. Mizzaro S. How many relevances in information retrieval?
159. Miyamoto S. Application of rough sets to information retrieval // J. of the Amer. soc. for inform, science Vol. 49, N 3. P. 195-205
160. Mohan K. C. Free-text retrieval systems: R&D in information retrieval // J. Sci. and Ind. Res., 1993, 52, №5, pp. 338-349.
161. Oppermann R., Reiterer H. Software evaluation using the 9241 evaluator. // Behaviour & information Technology. 1997. Vol. 16, No.4-5. - pp.232-245.
162. Pejtersen A.M. Design of intelligent retrieval systems for libraries based on models of users search strategies. New York, 1986.
163. Rijsbergen C.J. Information Retrieval. London-Boston, Butterworths, 1975.
164. Rijsbergen K.v. Logics for information retrieval. // Note recens. e notiz, 1988, 37 (1-2), pp.121-124.
165. Roget P.M. Thesaurus of Words and Phrases. N.York, 1947.
166. Saracevic T„ Spink A., Wu M. Users and Intermediaries in Information Retrieval: What are They Talking About? / Jameson A. Paris C., Tasso C. User Modeling: Proceedings of the Sixth International Conference, UM97. CISM, -1997.
167. Shaw W. M. Retrieval expectations, clusterbased effectiveness, and performance standards in the CF database // Inf. Process, and Manag., 1994,30, №5, pp.711-723.
168. Spink A. Study of interactive feedback during mediated information retrieval // J. of the Amer. soc. for inform. Science, 1997, Vol. 48, N 5. P. 382-394.
169. Spink A., Saracevic T. Interaction in information retrieval: selection and effectiveness of search terms // J. of the Amer. soc. for inform. Science, 1997, Vol. 48, №8. pp.741-761.
170. Stohn C. Von der bibliographischen Recherche zum Volltext: Das Konzept ERL von SilverPlatter. //ABI-Techn., Vol. 17 , 3, 1997, pp.243, 245-251.
171. Swanson D. R. Undiscovered public knowledge // Libr. Quart. 1986, 56, №2.
172. Tague J. Schultz R. Evaluation of the user interface in an information retrieval system: a model. // Inf. Pocess. and Manag., 1989,25, №4, pp. 377-389.
173. Tailor R.S. Question-negotiation and information seeking in libraries. // College and Research Libraries, 1968, 29, pp. 178-194.
174. Tenopir C. Online information hunting //J. Amer. Soc. Inf. Sci., 1993, 44, №6, pp.365-367.
175. Wilson T. Exploring models of information behaviour: the "uncertainty" project. // Inf. Process, and Manag., 1999, 35, pp.839-849.
176. Yoon K. Nilan M.S. Towards a reconceptualization of information seeking research: focus on the exchange of meaning // Inf. Process, and Manag., 1999, №35, pp.871-890.
177. Zadeh L. Probability Measures of Fuzzy Set. // Journal Mathematical Analysis and Applications, 1961, 23, N 2.
178. Zadeh L. Fuzzy Languages. // Information Sciences, 1969, 1.
-
Похожие работы
- Исследование и разработка моделей и средств обеспечения документального поиска в распределенных гетерогенных информационных ресурсах
- Алгоритмы снижения уровня задержек при информационном взаимодействии систем в гетерогенных средах
- Методология интеграции гетерогенных информационных систем по свойствам неорганических веществ
- Герт-сетевой анализ временных характеристик работы узлов распределенных систем обработки информации
- Математическое и программное обеспечение информационных систем реального времени с гетерогенной средой распределенных СУБД