автореферат диссертации по документальной информации, 05.25.03, диссертация на тему:ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ БИБЛИОТЕК АПК: МЕТОДИКА ФОРМИРОВАНИЯ И ПУТИ СОВЕРШЕНСТВОВАНИЯ
Автореферат диссертации по теме "ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ БИБЛИОТЕК АПК: МЕТОДИКА ФОРМИРОВАНИЯ И ПУТИ СОВЕРШЕНСТВОВАНИЯ"
ЛгЗЗ-йР
На правах рукописи
ПИРУМОВА ЛИДИЯ НИКОЛАЕВНА
ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ БИБЛИОТЕК АПК: МЕТОДИКА ФОРМИРОВАНИЯ И ПУТИ СОВЕРШЕНСТВОВАНИЯ
05.25.03 - библиотековедение, б и бл л иг рл фон ед £ I ш е и книговедение
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата педагогических наук
/
Москва - 2003
Работа выполнена на кафедре документных ресурсов и докумепташг-ониого обеспечения управления Московского государственного университета культуры и искусств.
Научный руководитель: кандидат экономических наук,
доцент В.Г. Поздняков
Официальные оппоненты: доктор филологических наук,
профессор Р.С. Гмляревскин
кандидат педагогических наук, профессор Л.Н. Караганова
Ведущая организация: Государственная публичная научно-
техническая библиотека России
Зашита состоится 30 мая 2003 года в 11.00 часов на заседании диссертационного совета Д 210.010.01 при Московском государственном университете культуры и искусств по адресу: 141406, Московская область, г. Химкн-б. ул. Библиотечная, 7, ауд. 218 (новый корпус).
С диссертацией можно с ^комнться в научной библиотеке Московского государственного университет;1 культуры и искусств
Автореферат разослан « апреля 2003 г.
Ученый с* .
'01
В.Т. Кланнюк
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследования. Обеспеченность информационными ресурсами является необходимым условием функционирования и раз вития агропромышленного комплекса (АПК) России. Научно-технические библиотеки (НТВ) занимают важное место в государствен ной системе научно-технической информации (ГСНТИ), которая при звана создавать и развивать информационные ресурсы и ииформацион ное обеспечение науки и производства. Современный период развития НТВ рассматривается как новый этап компьютеризации, связанный с переходом на сетевые информационные технологии, широкое исполь зование электронных документов п ВД. Научные сельскохозяйственные библиотеки (НСХБ), обеспечивающие информационное сопровождение деятельности ученых и специалистов АПК, активно формируют сего дня собственные электронные документные ресурсы, используют доступные по телекоммуникационным каналам машиночитаемые ресурсы других библиотек и информационных служб, разрабатывают и совер шенствуют методы и средства информационного поиска. При этом они вынуждены использовать традиционные и автоматизированные инфор мациопно-понсковые системы (ИПС).
Если под ИПС мы понимаем совокупность информационно
поисковых массивов, их носителей, информационно-поискового языка,
правил его использования, критериев выдачи, программных и техниче
ских средств, то традиционные ИПС представлены системой карточных
каталогов и картотек, где информационно-поисковыми языками явля
готся элементы библиографического описания (автор индивидуальный
или коллективный, тин документа, язык документа и т.д.), классифика
ции отраслей знания (УДК, ВБК, десятичная классификация Дьюи и
т.п.), схемы предметных рубрик и т.п. Информационно-поисковый язык
(ИПЯ) -формализованный искусственный язык для индексирования
документов; информационных запросов и описания фактов с целью по
следующего их хранения и поиска. ИПЯ и дополняющие их методики
систематизации документов, инструкции по ведению каталогов и т.п.
составляют лингвистическое обеспечение традиционных ИПС, В авто
матизированных ИПС используются специально разработанные ИПЯ
(рубрикаторы, словари ключевых слов, тезаурусы и т.д.). Информзци
оннымн массивами являются электронные каталоги и базы данных на
машиночитаемых носителях; организация и использование информаци
онных массивов определяются соответствующими стандартами и обес
печиваются "п средствами. Эффекта в
ностъ ипформ щмУйИ&Япм тизнропанных ИПС в значн Мсвк. амккокоа. акадмм
иГШда
тельной степени зависит от ее лингвистического обеспечения: ИПЯ и средств их ведения и поддержки.
От выбора лингвистического обеспечения зависит совместимость языковых средств данной И ПС с другими, а значит и возможности информационного поиска в них, поскольку совместимость лингвистического обеспечения - это возможность использования в ИПС поисковых образов документов на одном ИПЯ, а поисковых предписаний на другом, а также возможность автоматического или ручного перевода поискового образа документа с одного ИПЯ на другой. Создание единого информационного пространства АПК подразумевает возможность использования любых ИПС для получения нужной информации с любого, подключенного в единую информационную сеть терминала. Для того, чтобы поиск в этих информационных ресурсах был возможен, прост и оперативен, необходимо разработать в каждой НСХБ оптимальное лингвистическое обеспечение, позволяющее осуществлять переход из одной ИПС в другую легко и комфортно для пользователя. Теоретические разработки по лингвистическому обеспечению НСХБ отсутствуют.
По статистике 2002 г. только 30% НСХБ находились на разных стадиях внедрения автоматизации в биб л и отсчн о-библ и ографи чес кие процессы. Наиболее передовые позиции в этом занимает Центральная научная сельскохозяйственная библиотека Россельхозакадемии (ЦНСХБ), которая является федеральным учреждением ГСНТИ в области АПК, крупнейшей НСХБ РФ, осуществляющей функции отраслевого информационного центра, в т.ч. генерацию документографических БД, создание реферативной и обзорной информации, выпуск реферативных изданий. В ЦНСХБ автоматизированы основные библиотечно-библлографические процессы в рамках интегрированной автоматизированной библиотечно-информационноГг системы (АБИС), созданы электронные ресурсы по проблематике АПК федерального значения, в т.ч. крупнейшая в мире русскоязычная БД по АПК «АГРОС». ЦНСХБ является головным методическим центром для 688 научно-технических библиотек АПК, которые используют ее разработки и информационные продукты в своей практической деятельности. Как методический центр ЦНСХБ проводит работы, направленные на формирование единого информационного пространства отрасли. Она имеет самую сложную из всех библиотек АПК структуру лингвистических средств и систему методических пособий по работе с инми. Лингвистическое обеспечение ИПС ЦНСХБ складывалось исторически, в условиях автоматизации назрела необходимость его онхимизации;-К объектам оптимизации следует отнести состав используем^рц ИЦЯ, ¿хх совместимость и гармонизацию в рамках ИПС, совершецсхвдвание самих ИПЯ и средств их ве-
дения и поддержки. Разработка оптимальной структуры лингвистического обеспечения ИПС ЦНСХБ будет способствовать ее эффективному функционированию в рамках единого информационного пространства АПК РФ. Такая структура лингвистического обеспечения ИПС может служить моделью для других НСХБ. Все это обусловливает актуальность выбранной темы для исследования.
Разработанность проблемы. Проблемы лингвистического обеспечения НСХБ ранее углубленно не изучались. Отдельные вопросы разработки лингвистического обеспечения рассматривались в контексте решения общих проблем развития ИПС, электронных каталогов по АПК. Эти вопросы затрагивались в работах МЛ. Лветисова, ГХБыстровой, С.А. Дубинской, Л.М.Фрида, В работах В.Г. Позднякова подчеркивается роль лингвистического обеспечения в информационном обслуживании ученых и практиков АПК, а также необходимость сотрудничества НСХБ в решении рада проблем.
Однако эти работы носят общий характер, трактующий лингвистическое обеспечение как неотъемлемую часть ИПС, но не касаются детального рассмотрения методики построения, ведения, использования и назначения лингвистических средств.
Разработка теоретических и методологических проблем лингвистического обеспечения началась в 60-х годах, когда пришло понимание того, что без информационно-поисковых, языков вычислительные машины остаются только машинами, л начался вслед за этапом «механическим» новый «логнко-лингвистический», по определению
A.B. Соколова, этап в развитии ИПС.
Вопросы лингвистического обеспечения поднимаются, с разной степенью детализации, во всех трудах, касающихся ИПС, поскольку лингвистическое обеспечение является се неотъемлемой частью. Это подчеркивают в своих работах Ю.М. Арский, Г.Г. Бслоногов,
B.А, Глинский, Б.А. Кузнецов, А.И. Михайлов, В.А. Мишин, В.В. Морозов, В.В. Попов, ЯЛ. Ш pari бе р г ц др.
Ранние разработки в области ИПЯ касались лингвистического обеспечения больших электронно-вычислительных машин и отражены в работах М.Г. Гаазе-Рап о порта, Р.Г. Котова, Б.В, Якушина. Работы последних лет относятся к ИПС, работающим в диалоговых режимах на персональных компьютерах. Теоретические разработки проблемы лингвистического обеспечения автоматизированных ИПС касались в 60-70-х годах только информационных центров, что объясняется отсутствием автоматизации в библиотеках и библиотечно-библиографическнх процессах. Работы Л.Б. Л нтопольского, Г.Г. Артаманова, Б,Р. Певзнсра, A.B. Соколова, А.И. Черного послужи-
ли основой для дальнейшего развития теории лингвистического обеспечения ИПС.
С развитием автоматизации бнблиотечно-бнблио1рафических процессов появились работы, посвященные развитию ИПЯ библиотечных ИПС. Проблемы лингвистических средств для библиотечных технологий рассматриваются в трудах Л.И. Беневоленской, Е,М. Зайцевой, O.A. Фурапева, В.М, Экстрем и др.
В работах H.H. Гендиной обобщены и развиты принципы лингвистического обеспечения, описанные в трудах отечественных исследователей, в приложении к библиотечным технологиям, рассматривается широкий спектр вопросов, относящихся к лингвистическому обеспечению, в т.ч. индексированию, информационному поиску и т.д.
Ряд научных разработок посвящен отдельным аспектам лингвистического обеспечения. Вопросы классификационных ИПЯ исследовались такими учеными, как MA, Довбенко, E.H. Пименов, Ю.А. Шрейдер и др. Развитию Библцотечно-библиографической классификации (ББК) носвящен ряд работ Э.Р. Сукиасяна. Проблемы ведения, разработки, актуализации Универсальной десятичной классификации (УДК) отражены в работах O.A. Антошковой, H .Д. Борисовой,
A.В.Владимировой, О.В. Караджи, Б.В. Кристального, Л.В.Лобовой, Б.И. Маршака, Т.В. Тужил ковой и др.
Рубрикатору ГСНТИ посвящены работы В.Н. Белоозерова, И.Е. Гепдлиной, Б.В. Кристального, Н.В. Лукашевич, В.М. Полонского, Ю.Ф. Тарасюк, З.М. Храпкина и др.
С развитием и совершенствованием автоматизированных баз данных все большее внимание уделяется дескрипторным языкам. Методика создания информационно-поискового тезауруса содержится в работах O.A. Лавреневой, A.B. Соколова. Выявлению и обоснованию оптимальных путей развития дескрипторных языков посвящены труды Л.П. Алексеевой, Д.Н. Бакун, С.А. Белькова, П.И. Браславского, С.Л. Гольдштейн, C.B. Гринева, В.М. Лейчик, С.А. Мамонтова,
B.М. Масляковой, Л.И. Оранской, Т.Я. Ткаченко и др.
ИПЯ непосредственно связаны с аналитико-синтетической обработкой информации, поскольку именно на этом этапе осуществляется перевод информации с естественного на искусственные языки и создается поисковый образ документа. Исследованиями в облзсти аналитико-синтетической обработки информации занимаются теоретики и практики библиотековедения и информационной деятельности: В.А. Архангельская, C.B. Базарова, C.B. Васюткин, Ф.С. ВороЙскиЙ,
A.Ф. Гареев, В.В. Корнесв. В.П.Леонов, P.P. Мдивани, E.H. Пименов,
B.В. Райх, Г.С. Щербинина и др. В работах последних лег поднимаются
проблемы автоматизированного индексирования, о них пишут Л.В. Кнорина, H.H. Литвинова, Н.В. Лукашевич, Т.В. Молчанова, H.A. Пащенко.
Важное место в разработке лингвистического обеспечения ИГ1С отводится проблеме совместимости информацнонно-поисковых языков. Особенно важной и актуальной проблема совместимости ИПЯ становится в наши дни с развитием сетевых технологий, глобальной сети Интернет. Большой интерес, в этой связи, представляют труды A.B. Бобно, P.C. Гпляревского, Т,Б. Грищенко, А.Ю. Евсюкова, Л.А. Жариковой, A.C. Калиновского, Ю.В. Ланграф, Н.В. Рябовой, P.A. Скарук и др.
Особую область исследований составляют проблемы информационного поиска в ИПС, который во многом зависит от разработанности, лексической наполненности и актуальности ИПЯ, поскольку от них зависит лояльность ИПС к пользователю, качество составления поискового образа документа, отражения в нем всех важнейших вопросов и аспектов документа. Вопросы информационного поиска освещали в своих трудах В.Л. Бирзовнч, A.B. Бобко, Л.А.Жарикова, О.Л. Лаврик, А.Ц. Масевич, P.P. Мдивани, Г.А. Скарук, Л.В. Шемберко и др.
В отличие от информационных центров, где информация хранится преимущественно в электронной форме, в библиотеке информация часто существует на бумажных носителях и наряду с электронными формами обслуживания применяются традиционные формы. Поэтому особый интерес представляет перевод карточных катаюгов в электронные (конверсия каталогов), и в связи с этим - концепции объединения традиционных и электронных каталогов в единую информационно-поисковую систему с единым лингвистическим обеспечением. Эти проблемы освещены в работах С,К. Виленской, H.A. Галюк, М.Н. Захаровой, М.И. Романовой, Е.М. Ручимской, OA. Фуралева, И.Ю. Черкасовой и др.
Проблемы лингвистического обеспечения постоянно обсуждаются на страницах библиотечной печати, ею занимаются видные теоретики библиотековедения и информатики, но эти разработки чаще носяг теоретический характер и могут служить базой для дальнейших разработок прикладного характера. Практически отсутствуют работы о структуре лингвистического обеспечения НСХБ, Однако необходимость в этом назрела, поскольку актуальной стала задача создания единой сетевой ИПС по вопросам АПК с единым или совместимым лингвистическим обеспечением. В этой ситуации с новых позиций следует рассматривать традиционные ИПЯ, которые используются в НСХБ и могут быть использованы в автоматизированной библиотечной ИПС. Поэтому необходимо глубокое и всестороннее исследование лингвистических
средств НСХБ с целью разработки структуры ее лингвистического обеспечения, выработки рекомендаций по его совершенствованию. Недостаточная разработанность проблемы применительно к сельскохозяйственной ИПС явилась еще одним основанием для выбора темы исследования.
Задачей исследования является обоснование структуры лингвистического обеспечения НСХБ, способствующей максимально полному удовлетворению информационных потребностей ученых и практиков в релевантной информации по вопросам АПК.
Эта задача решается поэтапно, в следующем порядке:
изучить современное состояние лингвистического обеспечения ИПС НСХБ, его роль и место в автоматизированной библиотечной информационной системе на основе последних теоретических разработок в области лингвистики;
проанализировать систему информационно-поисковых языков ИПС библиотек ЛПК, эффективность ее использования в автоматизированном информационном поиске и определить необходимые условия создания единого отраслевого информационного пространства;
провести сравнительное исследование лингвистического обеспечения крупнейших зарубежных БД по сельскому хозяйству с целью совершенствования лингвистических средств отечественных. ИПС по АПК;
- разработать методы формирования и оптимизации структуры лингвистического обеспечения ИПС НСХБ.
Основной базой исследования является система библиотек АПК.
Методологической основой исследования послужили общие положения теории лингвистического обеспечения, изложенные в трудах А.В. Соколова и Н.И. Гендиной. Отправным методологическим пунктом стали также общие положения теории информатики, библиотечно-библиографической и информационной деятельности, основополагающие идеи отечественных и зарубежных исследователей по аналитико-синтетическон обработке документов и формированию баз данных.
Методы исследования
Использовался ряд общенаучных и специальных методов: обобщение, анализ и синтез, исторический метод, структурно-функциональный анализ, описательно-аналитический метод при изучении нормативных, методических и инструктивных материалов, сравнение и описание для характеристики лингвистического обеспечения зарубежных баз данных, контент-анализ при сравнительном анализе терминологических баз ИПЯ.
Научная новизна исследования заключается в рассмотрении лингвистического обеспечения ИПС библиотек АПК, с одной стороны, как самостоятельного объекта, с другой стороны, как комплексной совокупности ИПЯ, средств их ведения и поддержки.
Предложен концептуальный подход к созданию отраслевой автоматизированной ИПС, основанный на использовании традиционных и специально разработанных для автоматизированного поиска лингвистических средств, адаптированных к условиям современной информационной среды.
Сформулированы методы достижения совместимости лингвистических средств в ИПС отдельных НСХБ библиотечной сети АПК, входящей в отечественную информационную среду.
Разработана модель структуры лингвистического обеспечения ИПС НСХБ, учитывающая разнообразие внутри б ибл йоте чн ых процессов и межбиблиотечного взаимодействия.
Рекомендована концепция построения русскоязычного информационно-поискового тезауруса по сельскому хозяйству и продовольствию на основе сравнительного анализа отечественного и зарубежного опыта ведения тезаурусов.
Теоретическая значимость исследования состоит в конкретизации общей теории лингвистического обеспечения ИПС применительно к лингвистическому обеспечению ИПС НСХБ, в развитии и обогащении научного представления о значимости и роли лингвистического обеспечения в формировании ИПС; обобщении имеющегося опыта создания лингвистического обеспечения в отечественных и зарубежных сельскохозяйственных базах данных; в создании теоретико-методологической основы для оптимизации лингвистического обеспечения НСХБ, необходимой для научных исследований по проблемам семантического анализа документов и производства современных информационных продуктов, а также обеспечения совместимости лингвистических средств, их разработки, ведения и актуализации.
Практическая ценность исследования заключается в том, что разработанная структура лингвистических средств внедрена и успешно функционирует в ЦНСХБ и может быть использована в практике библиотек АПК.
Результаты диссертационного исследования используются для актуализации Государственного рубрикатора научно-технической информации, подготовки методических рекомендаций по совершенствованию Отраслевого рубрикатора. Методики ведения информационно-поисковых языков, разработанные в диссертации, применяются в процессе подготовки выпуска РЖ ВИНИТИ «Экономика агропромышлен-
ного комплекса».
На основе предложенной в ходе диссертационного исследования концепции разрабатываются информационно-поисковый тезаурус и Отраслевой рубрикатор по сельскому хозяйству и продовольствию, методики их ведения.
Выводы диссертационного исследования легли в основу методических рекомендаций по индексированию документов по проблемам АПК и применяются в аналитико-синтетической обработке документов в ЦНСХБ и других библиотеках АПК.
В ходе диссертационного исследования разработаны рекомендации по совершенствованию отдельных информационно-поисковых языков, которые реализуются в ЦНСХБ.
Практические разработки диссертанта отражены в современных версиях информационно-поискового тезауруса и Отраслевого рубрикатора по сельскому хозяйству и продовольствию, используемых более, чем в 20 библиотеках различных систем и ведомств в процессе аиалн-тико-синтетической обработки документов для автоматизированной ИПС.
Результаты исследования могут быть положены в основу программы повышения квалификации библиотечных кадров в АПК, а также могут быть использованы в вузовском образовании.
На защиту выносятся следующие положения:
1) Необходимым условием функционирования библиотечно-библиографических процессов является оптимальное сочетание традиционных и автоматизированных технологий, обеспечивающее эффективный информационный поиск и создание современных информационных продуктов. Требуется совершенствование ИПЯ и их приспособление к условиям автоматизированной ИПС.
2) Предлагаемая методика формирования структуры лингвистических средств НСХБ определяется спецификой аграрной науки как политематической отрасли знания, задачами библиотеки по информационному обеспечению конкретных контингентов пользователей, структурой используемых ИПЯ, определением наиболее приемлемых ИПЯ для конкретной НСХБ и дальнейшей их адаптацией к условиям ИПС.
3) Разработанная модель структуры лингвистических средств НСХБ оптимизирует использование ИПЯ: УДК (ББК), язык библиографического описания, Отраслевой рубрикатор, информационно-поисковый тезаурус, язык ключевых слов, на внутрибиблиотечном и межбиблиотечном уровнях н обеспечивает лингвистические взаимодействия библиотек АПК.
4) Совместимость лингвистических средств достигается путем внедрения в работу библиотек ЛПК наиболее реальных в современных условиях мер: рекомендуемых общеотраслевых ИПЯ, соблюдения стандартов их ведения, единых методик индексирования, конверсии ИПЯ.
5) Расширение функциональных возможностей используемых в НСХБ информационно-поисковых языков реализуется, с одной стороны. путем адаптации классификационных языков для традиционного поиска к условиям автоматизированной системы, с другой стороны, совершенствованием ИПЯ для автоматизированных систем.
Апробация результатов исследования. Основные положения и результаты исследования докладывались на международных научных конференциях «Крым-99», «Крым-2000», «Крым-2001» «Библиотеки и ассоциации в меняющемся мире: новые технологии и новые формы сотрудничества»; ежегодных международных научных конференциях «Библиотечное дело- 1997, 1998, 2000, 2001, 2002»; на научной конференции «Современные информационные технологии в библиотеках» (Санкт-Петербург, !7-19 ноября 1997 г.); на Всероссийском семинаре «Новые информационные технологии в научных сельскохозяйственных библиотеках» (Москва, ЦНСХБ, 13-15 ноября 2002 г.), на Днях повышения квалификации для работников библиотек АПК в ЦНСХБ.
По теме диссертации опубликовано шестнадцать печатных научных работ.
ОСНОВНОЕ СОДЕРЖАНИЕ ДИССЕРТАЦИИ
В первой главе «Современное состояние лингвистического обеспечения информационно-поисковых систем библиотек АПК»
рассмотрены теоретические проблемы лингвистического обеспечения ИПС и теоретические составляющие понятия «лингвистическое обеспечение», проанализированы роль и место лингвистического обеспечения в ИПС.
Рассмотрены различные виды информационно-поисковых языков, их назначение и функции в ИПС. Подчеркивается, что именно ннфор-мациоино-понсковые языки являются основным компонентом лингвистического обеспечения ИПС, структурирующим информационные массивы и определяющим грзницы и возможности информационного поиска, Определена роль информационно-поисковых языков в создании поисковых образов документов. Изучены этапы формирования, тенденции и особенности развития лингвистического обеспечения ИПС НСХБ. Подчеркивается, что лингвистическое обеспечение любой библиотеки уникально, поскольку складывается исторически и отражает
особенности ее пользователей, состав библиотечного фонда, сложившиеся формы обслуживания, специфику конкретной отрасли сельскохозяйственной науки.
Методические пособия по ведению ИПЯ в НСХБ самостоятельно не разрабатывались, использовались материалы, созданные в ЦНСХБ. Основным методическим пособием при работе с карточным систематическим каталогом являются контрольная картотека и картотека методических решений. Автоматизация бр 5л иотеч! ю- библ и ографич еских процессов идет в библиотеках АПК медленно: только 30% библиотек оснащены компьютерами; 2% библиотек имеют выход в Интернет и менее 0,5% библиотек имеют свои сайты в Интернете. На первом этапе автоматизации библиотеки создают свои электронные каталоги и в качестве ИПЯ используют УДК и/или ББК, язык ключевых, слов и язык библиографического описания. Лингвистическое обеспечение в ЦНСХБ включает семь ИПЯ: схему комплексно-системного каталога (КСК), УДК, ББК, язык библиографического описания, Отраслевой Рубрикатор, разработанный на основе ГРНТИ, Информационно-поисковый тезаурус, язык ключевых слов. Рассмотрены структура построения, лингвистические особенности и поисковые возможности каждого ИПЯ, используемого в ЦНСХБ.
Проанализированы этапы формирования лингвистического обеспечения ИПС ЦНСХБ с момента создания ее первого информационно-поискового языка - схемы комплексно-системного каталога в 1935 г. Схема комплексно-системного каталога, справочно-поисковый аппарат комплексно-системного каталога и его главный элемент - АПУ, насчитывающий свыше 58 тыс. терминов, послужили основой для создания новых информационно-поисковых языков для автоматизированной системы ЦНСХБ.
С 1962 г. в ЦНСХБ н других библиотеках АПК применяется УДК, разработанная в 1895-1905 гг. П. Отлс и А. Лафонтеном на основе «Десятичной классификации» М.Дьюи, По УДК формируются фонды и систематические каталога библиотек НИИ, сельскохозяйственных вузов и среднсспециальных учебных заведений. В ЦНСХБ по УДК строятся подсобные фонды. ЦНСХБ как методический центр в течение ряда лет разрабатывала «Рабочие отраслевые таблицы по УДК для сельскохозяйственных библиотек», которые служили методическим и практическим пособием по УДК для НСХБ и информационных служб АПК. Ею разработаны также методические иособия по систематизации документов по УДК.
ББК является иерархической комбинационной классификацией универсального типа, разработанной в 1958-1968 гг. в СССР. По ББК
формируют фовды и систематические каталога общественно-политической тематики сельскохозяйственные вузы и среднеспециаль-ные учебные заведения. Весь фонд и систематические каталоги библиотеки опытно-производственных станций формируют по ББК. ЦНСХБ СО Россельхозакадемии строит по ней лишь систематические каталоги. Государственный рубрикатор научно-технической информации (ГРНТИ) служит основой единой классификации документов в системе НТИ и обеспечивает логическую совместимость информационной продукции, подготавливаемой в разных частях национальной сети НТИ. В АПК ГРНТИ активно используется только в ЦНСХБ. На его основе здесь разработан Отраслевой Рубрикатор, который представляет собой детализацию до 5-го уровня раздела «68 Сельское хозяйство». Отраслевой Рубрикатор существует в печатной и электронной форме и выполняет важные функции: формирование и структурирование информационных массивов ИПС, а также печатных и электронных изданий. Язык библиографического описания издревле использовался в библиотеках в виде библиографического описания документа на каталожной карточке. В условиях автоматизации бнб ли отечно-биб л и ографических процессов его функции расширяются и определяются возможностями коммуникативного формата, который позволяет идентифицировать документ по каждому из его элементов. В НСХБ используется формат MARC, RUSMARC. Язык ключевых слов используется только в автоматизированных ИПС. В ЦНСХБ он применяется с 1992 г., в остальных НСХБ -в процессе создания электронного каталога.
Информационно-поисковый тезаурус (ИПТ) - контролируемый словарь лексических единиц дескрипторного языка, основанный на лексике естественного языка. Тезаурус создается в целях повышения качества информационного поиска в автоматизированных ИПС и выполняет следующие функции: индексирование входного документального потока, контролирование и нормализация лексики отрасли знания, единообразие и формализация представления информации в ИПС, отражение парадигматических отношений, существующих между лексическими единицами отрасли знания. Информационно-поисковый тезаурус по сельскому хозяйству и продовольствию разработан в ЦНСХБ на основе тезауруса аграрной науки и смежных отраслей знания. Иерархические деревья в ИПТ формируются с целью создания средств для автоматизированного расширения поискового образа документа или информационного запроса. Функция автоматизированного расширения поискового образа документа (включение в него более широких терминов тезауруса по отношению к дескрипторам, использованным индексатором) имеет важное значение для методических принципов индек-
сирования, стратегии поиска.
Определены методические основы формирования отдельных видов лингвистических средств. На примере ИПЯ ЦНСХБ изучена эффективность применения каждого ИПЯ в информационном поиске.
Во второй главе: «Совместимость лингвистического обеспечения информацп он но-n онсковых систем библиотек АПК» приведены результаты исследования зарубежных баз данных по сельскому хозяйству и продовольствию, истории их создания, тематического диапазона и объема. В мире существует примерно 25 крупных баз данных по сельскому хозяйству, однако, основной объем информации (около 65%) по сельскому хозяйству отражен в 3 крупнейших БД: «CAB ABSTRACTS», создаваемая Международным сельскохозяйственным бюро стран Британского содружества (CABI), Великобритания; «AGRICOLA», создаваемая Национальной сельскохозяйственной библиотекой США; «AGRIS», создаваемая Международной информационной службой по сельскому хозяйству (FAO). Из узкоспециализированных международных БД выделяется «Food science technology abstracts» (FSTA) Международной информационной системы по продовольствию (IFIS). Однако по тематическому диапазону она не может сравниться с тремя другими БД, т.к. включает только одну из их тематических областей. Лингвистическое обеспечение этих крупнейших зарубежных баз данных соответствует их задачам и функциям. Все они, кроме «AGRÍCOLA», создаются информационными центрами, и их лингвистическое обеспечение состоит из Списка категорий - Рубрикатора, тезауруса, языка ключевых слов. «AGRICOLA» создается библиотекой, ее лингвистическое обеспечение учитывает ряд функций, присущих библиотеке: расстановку фонда и обслуживание пользователей, поэтому, кроме того, включает Десятичную классификацию Дьюи, классификацию библиотеки Конгресса.
С появлением Интернет - глобальной мировой информационной сети, обеспечивающей доступ к многочисленным БД, представленным в ней, особенно актуальным становится вопрос о совместимости средств лингвистического обеспечения, отвечающих за информационный поиск в них. Совместимость лингвистических средств облегчает поиск информации, повышает степень ее полноты и релевантности. Существуют разнообразные методы достижения совместимости лингвистического обеспечения ИПС. Некоторые из них используются в отдельной ИПС, другие - в отраслевой сети. Предложены наиболее реальные для библиотек АПК методы совмещения лингвистических средств в рамках ИПС отдельной НСХБ н в рамках системы ИПС отрасли. В ЦНСХС используются следующие методы взаимодействия
лингвистических средств: стандартизация, унификация, сопряжение, конверсия, использование общесетевого ИПЯ (ПРНТИ), обмен языковыми средствами, сосуществование различных языковых средств. Отраслевая сельскохозяйственная информационная система строится как сеть ИПС НСХБ. В настоящее время только треть НСХБ приступила к созданию электронных каталогов, поэтому автоматизированная ИПС с распределенным информационным ресурсом АПК находится в стадии создания. На этом этане особенно важно выбрать тс методы совместимости лингвистических средств, которые будут наиболее эффективны. Вопрос о совместимости является актуальным и для зарубежных БД, где он решается разными ме тодами. БД «AGR1S» создается совместными усилиями более 100 стран, при этом применяется метод использования общесистемного языка (поэтому ее англоязычный тезаурус AGROVOC имеет версии на б языках), а также метод стандартизации и унификации правил его использования и индексирования на нем. БД «CAB ABSTRACTS» и «AGRICOLA» используют тезаурус CABI в качестве единого ИПЯ, Существует идея создания единого тезауруса для этих трех крупнейших аграрных БД.
В рамках диссертационного исследования проведен сравнительный анализ двух англоязычных тезаурусов БД «AGRIS» (AGROVOC) и БД CABI с точки зрения их совместимости между собой и с тезаурусом ЦНСХБ для совершенствования идеологии построения последнего. Проведено исследование особенностей развития тезаурусов, тематического охвата, структуры словарных статей, анализ нескольких выбранных терминологических областей. В тематическом диапазоне тезаурусов не выявлено четко выраженных различий. Однако AGROVOC отражает только вопросы сельского хозяйства, а тезаурус CABI включает также и общебиологические вопросы и по количеству терминов является наиболее полным тезаурусом. Естественнонаучные классификации организмов в тезаурусе САВ1 являются прекрасным справочным материалом, делают его более научным в сравнении с AGROVOC. Сопоставительный анализ лексических элементов словарных блоков трех тезаурусов показал, что существенных различий в их наборе нет. Сравнительный анализ разных терминологических областей англоязычных тезаурусов выявил достаточно большое количество несовпадающих понятий, в т.ч. и в плане их раскрытия через парадигматические связи. Поэтому можно говорить только о сходстве тезаурусов, но не об их совместимости. На основе анализа разработан ряд предложений по совершенствованию информационно-поискового тезауруса ЦНСХБ.
В третьей главе «Оптимизация лингвистического обеспечения информационно-поисковых систем библиотек АПК» предложены
пути оптимизации структуры лингвистических средств и совершенствования информационно-поисковых языков НСХБ. Разработана методика формирования лингвистического обеспечения И ПС, включающая анализ задач, стоящих перед НСХБ, ее функций и библиотечко-бнблиографическнх процессов, обеспечивающих их выполнение; определение роли и функций информационно-поисковых языков в ИПС, анализ эффективности использования собственных информационно-поисковых языков в автоматизированной ИПС и изучение существующих отраслевых информационно-поисковых языков с целью возможного применения их в данной ИПС, подбор информационно-поисковых языков, обеспечивающих выполнение всех функций НСХБ, их адаптацию к условиям НСХБ, разработку методических пособий по работе с ними.
Разработана двухуровневая структура лингвистических средств ЦНСХБ. Первый - внутрибиблиотечный уровень - обеспечивает выполнение библиотечно-библиографических процессов, в т.ч.; формирование и структурирование фонда, обработку входного документального потока, распределение информационных потоков информации, издание текущих изданий, информационное обслуживание пользователей, предоставление доступа к информационным ресурсам библиотеки, эффективный информационный поиск информации в ИПС. Второй - межбиблиотечный - уровень обеспечивает информационную деятельность библиотеки в пространстве отрасли и страны, создавая условия для участия ЦНСХБ в корпоративных проектах, в т.ч. по каталогизации, обеспечивая процессы обмена информацией с другими информационными учреждениями отрасли и предоставления доступа пользователей ЦНСХБ к их информационным ресурсам.
Разработанная структура лингвистического обеспечения ИПС ЦНСХБ включает пять информационно-поисковых языков: язык библиографического описания, УДК, Отраслевой рубрикатор, Информационно* поисковый тезаурус, язык ключевых слов. Обосновано включение в структуру каждого из этих языков, а также исключение из структуры лингвистического обеспечения схемы комплексно-системного каталога и ББК. Исследуя перспективы использования схемы комплексно-системного каталога в качестве информационно-поискового языка ИПС, были рассмотрены несколько аспектов: использование ее в качестве терминологической базы, ее поисковые возможности в автоматизированной ИПС, использование систематизации документов для комплекс ho-cj i стелi ного каталога при ретроко] ¡версии карточных каталогов,
С появлением тезауруса схема комплексно-системного каталога перестала быть единственной терминологической базой АПК, но требо-
валось изучить их сопоставимость. Сравнительное изучение проводилось статистическим методом в части объема терминологии в этих информационно-поисковых языках, способов отражения научных понятий комплексно-системного каталога терминами тезауруса для определения его состояния в момент исследования и тенденций развития. Репрезентативная выборка документов позволила сделать сопоставительный анализ по специально разработанной методике, которая предусматривала установление полного или частичного совпадения терминов, соотнесение понятий комплексно-системного каталога к одному или нескольким понятиям тезауруса, синонимичности терминов, соответствия термина современному состоянию науки и требованиям лингвистического обеспечения.
Анализ показал, что словарный состав информационно-поискового тезауруса позволяет адекватно отображать большую часть понятий комплексно-системного каталога, тенденция к полной совместимости термннологического покрытия усиливается с пополнением тезауруса новой лексикой каждый год; степень покрытия и совпадения терминологии тезауруса и комплексно-системного каталога имеет несущественные различия; причинами отсутствия терминов комплексно-системного каталога в тезаурусе следует считать их моральное и научное устаревание, а также методические решения по идеологии информационно-поискового тезауруса. Анализ позволил сделать вывод о дублировании функций терминологической базы АПК двумя информационно-поисковыми языками, один из которых существует в электронной форме, что расширяет сферу его использования, а другой только в печатной форме, что затрудняет работу с ним.
Проанализирован тематический поиск по систематизации комплексно-системного каталога, показано, что релевантный тематический поиск не обеспечивается из-за ее ненормализованной записи, которая не воспринимается автоматизированной системой. Однако, если рассматривать систематизацию комплексно-системного каталога как набор ключевых слов и дескрипторов, которые требуется записать в соответствии с правилами ведения Отраслевого рубрикатора и тезауруса, то поиск оказывается достаточно результативным. Это дает основания говорить о целесообразности использования систематизации комплексно-системного каталога при реггроконверсии карточных каталогов ЦНСХБ.
На основе анализа существующего состояния информационно-поисковых языков ЦНСХБ разработаны предложения, направленные на повышение их эффективности и роли в И ПС и автоматизированном поиске, увеличение качества ИПС и создание единого информационного пространства АПК.
Совершенствование УДК предполагает создание электронных рабочих таблиц для АПК и электронного АПУ к ним, а также таблиц соответствия Отраслевого рубрикатора и УДК. В Отраслевом рубрикаторе требуется разработать до 5-го уровня раздел «65 Пищевая промышленность», сформировать АПУ к Отраслевому рубрикатору и таблицы соответствия с УДК. Совершенствование информационно-поискового тезауруса предполагает создание микротезаурусов по отдельным отраслям АПК, систематической части тезауруса, таблиц соответствия с Отраслевым рубрикатором и УДК; пополнение словарных статей тезауруса за счет включения исторических, хронологических и других примечаний.
Для каждого из информационно-поисковых языков требуется разработка методических рекомендаций по ведению и индексированию на нем. Оптимизация лингвистических средств 11СХБ может иметь несколько этапов:
1) определение путей совершенствования лингвистического обеспечения, лингвистических и поисковых возможностей информационно-поисковых языков, адаптация каждого из них к условиям автоматизированного поиска, обеспечение их совместимости;
2) обеспечение совместимости лингвистических средств в рамках сети библиотек АПК с целью взаимодействия в едином информационном пространстве АПК;
3) решение проблемы автоматизированного индексирования входного документального потока и приспособление ИГ1Я к такому индексированию.
Рассмотрена роль и задачи ЦНСХБ как головного методического центра в формировании единой отраслевой ИПС.
В заключении сформулированы основные теоретические выводы и практические рекомендации, касающиеся формирования и обоснования структуры лингвистического обеспечения ИСХБ. В диссертации доказано, что необходимым условием функционирования библиотечно-библиографических процессов является оптимальное сочетание традиционных и автоматизированных технологий, обеспечивающих эффективный информационный поиск и создание современных информационных продуктов. Адаптация информационно-поисковых языков, разработанных для карточных каталогов, и совершенствование информационно-поисковых языков для автоматизированных технологий расширяет функциональные возможности и повышает эффективность их использования в автоматизированной ИПС. Современные автоматизированные библиотечные ИПС НСХБ требуют совместимости лингвистических средств как внутри отдельной ИПС, так и разных ИПС, входя-
щих в информационное пространство отрасли. В ходе исследования решены практические задачи, способствующие реализации данной идеи, и подтверждены все положения, вынесенные на защиту. Разработана методика формирования структуры лингвистических средств НСХБ, которая определяется спецификой аграрной науки как политематической отрасли знания, задачами НСХБ по информационному обеспечению конкретных контннгептов пользователей, структурой существующих в ИПС лингвистических средств и включающей: анализ эффективности использования собственных информационно-поисковых языков в ИПС, изучение существующих отраслевых языков, выбор информационно-поисковых языков, обеспечивающих эффективное функционирование автоматизированной ИПС и их адаптацию к условиям НСХБ. Создана и обоснована структура, обеспечивающая функционирование библиотеки в новых условиях как на внутрибиблиотечном, так и на межбиблиотечном уровнях, которая внедрена в ЦНСХБ и может быть использована как модель в библиотеках АПК. Предложены наиболее реальные в условиях НСХБ меры, способствующие совместимости лингвистических средств отдельной НСХБ и разных библиотек, входящих в информационное пространство отрасли: методологическое единство в развитии и ведении лингвистических средств, использование нескольких информационно-поисковых языков, соблюдение стандартов их ведения, унификация индексирования, использование общеотраслевых информационно-поисковых языков, конверсия информационно-поисковых языков. Разработанные рекомендации по совершенствованию отдельных информационно-поисковых языков и созданию совместимых лингвистических средств способствуют повышению эффективности их использования в автоматизированной ИПС. Созданные на основе разработанной в ходе исследования концепции информационно-поисковый тезаурус и Отраслевой рубрикатор применяются в ЦНСХБ и более чем в 20 НСХБ. Результаты исследования также использованы при актуализации Государственного Рубрикатора НТИ и подготовке методических рекомендаций по совершенствованию Отраслевого рубрикатора. Методики ведения и поддержания информационно-поисковых языков, разработанные в исследовании, применяются в процессе подготовки выпуска РЖ ВИНИТИ «Экономика агропромышленного комплекса». Приложения включают: таблицы; фрагменгы отечественных и зарубежных информационно-поисковых языков; графическое изображение модели структуры лингвистического обеспечения НСХБ; Акт о внедрении.
По теме днссертзции опубликованы следующие работы:
1. Пирумова Л..Н. Информационно-поисковые языки ЦНСХБ и развитие сельского хозяйства I Л.Н, Пирумова !! Тез. докл. Междунар. науч. конф., г. Краснодар. - Краснодар, 2000, - С. 200-202.
2. Пирумова Л.Н. К вопросу о совместимости средств лингвистического обеспечения баз данных по сельскому хозяйству / Л.Н. Пирумова П Б-кн и ассоц. в меняющемся мире: новые технологии и новые формы сотрудничества: Тр. конф. Судак, Украина, 3-11 июня 2000 г./ ГПНТБ России. - Судак, 2000. - Т. 1. - С. 397-401.
3. Пирумова Л.Н. Лингвистическое обеспечение баз данных по сельскому хозяйству: проблемы кооперации / Л.Н. Пирумова Н Б-ки и ассоц. в меняющемся мире: новые технологии и новые формы сотрудничества: Материалы конф. Судак, Украина, 5-13 июня 1999 г. / ГПНТБ России. - Судак, 1999. - Т. 2. - С. 90-92.
4. Пирумова Л.Н. Лингвистическое обеспечение производства текущих изданий ЦНСХБ Россельхозакадемпи / Л.Н. Пирумова II Библ. дело-2000. Пробл. формирования открытого информ. о-ва: Тез. докл. 5-й междунар. науч. конф. (М„ 25-26 апр. 2000 г.). - М., 2000. - С. 170171.
5. Пирумова Л.Н. Новый этап в информационном обслуживании потребителей ЦНСХБ / Л.Н. Пирумова // Аграрная наука. - 1998. - № 3. - C.2S-29.
6. Пирумова Л.Н. Об информативности прнстатсйных резюме в отечественных изданиях по вопросам АПК / Л.Н. Пирумова // Библ. дело-2001. Рос, б-кн в мировом информ. и интеллект, пространстве: Тез. докл. 6-й междунар. науч. конф. (М„ 26-27 апр. 2001 г.),- М., 2001. -С. 176-178,
7. Пирумова Л.Н. Проблемы адаптации читателей к новым формам информационных услуг / Л.Н. Пирумова I! Тез. докл. междунар. науч. конф. «Информ, о-во: культурол. аспекты н пробл.» Краснодар, 9 сент. 1997 г. - Краснодар, 1997. - С. 293-295.
8. Пирумова Л.Н. Совершенствование лингвистического обеспечения БД ЦНСХБ «АГРОС» / Л.Н. Пирумова // Тез. докл. и сообщ, науч. конф. «Библ. дело и демократия», S-I0 апр. 1997 г. - М., 1997. -С. 62-65.
9. Пирумова ЛТН, Сравнительный анализ лингвистического обеспечения БД «АГРОС» и БД CAB ABSTRACTS / Л.Н. Пирумова // Тез. докл. и сообщ. междунар. науч. конф. «Библ. дело на пороге XXI века» (М„ 15-16 апр. 1998 г.).-М., J99S.-C. 146-147.
10. ПирумоваЛ.Н. Аналитическая деятельность ЦНСХБ I Л,Н. Пирумова, О.Б. Сладкова // Ииформ. ресурсы России. - 1998, -№1.-С. 34-37.
11. ПирумоваЛ.Н. Проблемы лингвистического обеспечения в БД. «ЛГРОС» документального потока по пищевой промышленности / Л.Н. Пирумова // Библ. дело и пробл. информатизации о-ва: Тез. докл. между пар. науч. конф., М., 27-28 апр. 1999 г. / МГУК. - М., 1999. -Ч. 1.-С. 175-177.
12. Пирумова Л.Н. Роль и место ЦНСХБ в формировании современной отраслевой информационной среды / Л.Н. Пирумова Я НТИ. Сер. 1,- 1995.-№2.-С. 36,38.
13. Пирумова Л.Н. О совершенствовании структуры лингвистических средств ЦНСХБ Россельхозакадемии / Л.Н. Пирумова, В.Гк Поздняков // Б-ки и ассоц. в меняющемся мире: новые технологии и новые формы сотрудничества: Тр. конф. Судак, Украина, 9-17 июня 2001 г. / ГПНТБ России. - Судак, 2001. - Т. 1.- С. 528-531.
14. Пирумова Л.Н. Вопросы непрерывного образования специалистов АСОВ в отраслевой научной библиотеке / Л.Н. Пирумова, Л .К. Садовская // Науч. и техн. б-ки. 2001. - № 2. - С. 112-118.
15. ПирумоваЛ.Н. Индексирование документов базы данных ЦНСХБ / Л.Н. Пирумова, Л.Т. Харченко. - М„ 1995. - 35 с.
16. ПирумоваЛ.Н. Тезаурус по сельскому хозяйству и продовольствию: индексирование документов и поиск информации в БД АГРОС: (Метод, материалы) / Л.Н. Пирумова, Л.Т. Харченко. -М., 2001. ~ 68 с.
107139, Москва, Орликов пер,, д. 3, кори, В. Тел. 207-5398
ЛР 020532 Поди, в печ. 23.04.2003 Формат <50x84/16
Объем 1,2 печ.л. Бумага кссроксиая Тираж 100 экз. Заказ .Ча 229
Отпечатано на ризографе ц Отделе оперативной полиграфии ЦНСХБ Росссльхозакадемии
-
Похожие работы
- Лингвистическое обеспечение информационно-поисковых систем библиотек АПК
- Лингвистическое обеспечение электронной библиотеки крупной промышленной корпорации
- Функциональный анализ лингвистических средств библиотечной технологии
- Гипертекстовое лингвистическое пространство электронной библиотеки
- Лингвистическое обеспечение библиотечной технологии