автореферат диссертации по документальной информации, 05.25.05, диссертация на тему:Интегральная система информационного обеспечения научных исследований в области математических наук: концепция создания и перспективы развития
Автореферат диссертации по теме "Интегральная система информационного обеспечения научных исследований в области математических наук: концепция создания и перспективы развития"
□ОЗ169661
На правах рукописи
Никольская Инга Юрьевна
Интегральная система информационного обеспечения научных исследований в области математических наук: концепция создания и перспективы развития
05.25.05 - Информационные системы и процессы, правовые аспекты информатики
Автореферат
диссертации на соискание ученой степени доктора технических наук
2 2 МАЙ 2008
Москва - 2008
003169661
Работа выполнена во Всероссийском институте научной и технической информации Российской академии наук (ВИНИТИ РАН)
Научные консультанты: академик РАН Арский Юрий Михайлович
чл -корр РАН Жижченко Алексей Борисович
Официальные оппоненты.
доктор технических наук Зеленков Юрий Григорьевич,
доктор технических наук, профессор У хин Юрий Юрьевич
доктор технических наук, профессор Шрайберг Яков Леонидович
Ведущая организация Институт проблем информатики РАН
Защита состоится "25" июня 2008 г в 11 часов на заседании диссертационного совета Д 002.026.01 во Всероссийском институте научной и технической информации по адресу: 125190, Москва, ул Усиевича, д 20
С диссертацией можно ознакомиться в библиотеке ВИНИТИ РАН
Автореферат разослан "15" мая 2008 г.
Ученый секретарь диссертационного совета
доктор технических наук, профессор
Д 002.026 01
Цветкова Валентина Алексеевна
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследования
Информационная наука, процессы формирования электронных ресурсов и сетей прошли большой путь развитая На этом пути имеются крупные достижения ках в систематизации информации, так и в создании глобальных и локальных информационных сетей На сегодняшний день теоретически общедоступен электронный каталог публикаций, создана всемирная сеть Интернет, обеспечивающая в реальном масштабе времени доступ к библиотечным ресурсам, банкам и базам данных Однако применение поисковых механизмов в сети Интернет ввиду некоторой анархичности и недостаточной структуризации предоставляемой информации приводит к тому, что, как правило, значительная часть полученной информации становится излишней, а собранная по конкретному запросу информация оказывается неполной В вопросах получения релевантной информации остаются нерешенными многие задачи, поскольку созданная информационная среда имеет гетерогенный (неоднородный) характер, а последующая обработка такой информации требует огромных временных, физических, интеллектуальных и, как правило, финансовых затрат К этому следует добавить, что крайне важной, но нерешенной задачей остается ведение прямого диалога пользователя с различными по архитектуре и содержанию банками и базами данных Здесь заметная роль в научных разработках принадлежит ученым Российской академии наук (РАН) и, в частности, Всероссийскому институту научной и технической информации (ВИНИТИ РАН)
Лавинообразное нарастание отечественных и зарубежных информационных ресурсов, а также необходимость повышения эффективности их использования ставят новые вопросы в методологии сбора, переработки, хранения и предоставления информации пользователям, требуют коренного улучшения информационного обслуживания ученых и специалистов В предлагаемой работе рассматриваются вопросы обоснования и создания интегральных проблемно-ориентированных информационных полей из разнородных документальных потоков В представлении автора такое поле включает сбор информационных ресурсов из максимально возможного числа источников информации, приведение этой информации в сопоставимый вид исходя из ориентации на конкретный запрос, «отсеивание» излишней информации и возможность использования данных этого поля для решения различных аналитических и прикладных задач
Цель диссертационной работы состоит в разработке концептуальных основ формирования интегральных проблемно-ориентированных информационных полей и эффективной системы взаимодействия пользователей с этими полями на примере математических и других точных наук
Современным проблемам информатики и информационной поддержке научных исследований посвящено значительное количество работ (труды Арского Ю М, Артамонова Г Т, Белоногова Г Г , Блюменау Д И, Воробьева Г Т, Гиляревского Р С, Глушкова В М, Горьковой В И, Доброва Г М, Жижченко А Б , Журавлева Ю И , Каленова Н Е, Лопухина М М, Мазура М , Малова В С , Марчука Г И , Маршаковой И В, Махотенко Ю А, Михайлова А И , Полтева А А , Попова И И , Поспелова Г С , Сифорова В И , Стогния А А , Сумарокова Л Н, Тараканова К В , Черного А И, Четвертакова М М , Финна В К , Шемакина Ю И, ШрейдераЮА идр)
Выполненный автором анализ многочисленных публикаций на указанную тему позволяет сделать следующие выводы
а) важнейшим направлением развития качественного и оперативного информационного сопровождения науки является сопряжение различных систем классификации знаний, обеспечивающее единообразное понимание определений, терминов, понятий, категорий в различных отраслях науки и техники
как в России, так и в зарубежных странах При этом особую
роль играет дальнейшее развитие классификации знаний, т е их детализации и охвата новых областей и направлений в науке, а также основ необходимой идентификации родственных фрагментов различных классификационных систем и схем,
б) все более очевидной становится необходимость развития и практического внедрения целенаправленных навигационных средств, позволяющих пользователю осуществлять адресный и масштабный поиск информации в различных отечественных и зарубежных источниках,
в) решение первых двух задач должно сопровождаться дальнейшей разработкой и развитием представлений о навигационных механизмах в математических и других точных науках - рубрикаторов, систем указателей, терминологических словарей, тезаурусов, которые позволяют пользователям поэтапно ставить и решать большой круг задач
В указанных направлениях ведутся исследования в ряде крупных отечественных и зарубежных научных центров, среди которых существенную роль играют разработки ВИНИТИ На сегодняшний день в ВИНИТИ создана и продолжает развиваться одна из крупнейших информационных систем мира, включающая уникальный по составу и объему политематический банк данных (БнД), и архивы, представленные как в традиционной печатной форме, так и в электронном виде, развивается специализированный портал, призванный обеспечить многоцелевую навигацию в электронных ресурсах по различным отраслям науки и техники, между регионами России и зарубежными странами и эффективному взаимодействию с международной сетью Интернет
Встраивание в информационную систему ВИНИТИ новых фрагментов обязывает учитывать как накопленный опыт, так и новые представления по решению указанных выше задач В этой связи на первый план выдвигаются концептуальные вопросы взаимосвязи ресурсов разнородных баз и банков данных и создание интегральных проблемно-ориентированных информационных полей на основе взаимодействия пользователя с информационными массивами
Автор понимает термин "интегральное проблемно-ориентированное информационное поле" как вновь сформированный информационный массив, полученный пользователем из отечественных и зарубежных информационных источников, в котором все данные сведены к одной из выбранных им классификаций званий Тем самым обеспечивается возможность дальнейших поисков необходимой информации из гетерогенных источников и приведение этой информации к виду, пригодному для решения стоящих перед пользователем задач
В представлении автора практическое решение указанных проблем в значительной мере демонстрируется созданием в составе политематического (многодисциплинарного) банка данных ВИНИТИ базы данных "Математика" Следует отметить, что последующее развитие этой базы данных в соответствии с предлагаемой концепцией и приведет к формированию информационной системы "Математика", которая до последнего времени отсутствовала в информационной системе ВИНИТИ
Основными задачами исследования в данной работе являются
- анализ состояния существующих классификационных систем и схем, применяемых для структуризации информационных ресурсов в банках и базах данных,
- обоснование идеологии сопряжения классификационных систем для целей формирования интегральных проблемно-ориентированных информационных полей,
- обоснование направлений развития элементов поисковых систем, обеспечивающих эффективный поиск данных по математическим и другим точным
наукам в отечественных и зарубежных информационных ресурсах, - обоснование основ формирования многоцелевой информационной системы «Математика» и создание пилотного варианта БД «Математика» в составе политематического БнД ВИНИТИ
Объектом исследования являются существующие информационные ресурсы по математическим и другим точным и естественным наукам, действующие способы их систематики и средства доступа пользоватетей к этим ресурсам
Предметом исследования являются пути перехода на качественно новый уровень информационного сопровождения научных исследований, включая направления и процессы, позволяющие формировать структурированные и проблемно-ориентированные информационные массивы по математическим и другим точным наукам, адекватные запросам пользователей
Методы исследования базируются на применении системного анализа, математической статистики, теории графов, теории информации и информационных процессов, компьютерного моделирования, положений, стандартов и нормативных документов, анализе полученных результатов по созданию баз и банков данных
Связь выполняемой работы с другими научными исследованиями
Научные исследования, проводимые в ВИНИТИ за последние 10 лет, тесно связаны с постановкой и решением указанных выше задач современной информатики
В частности речь идет о координирующей роли ВИНИТИ в разработке Государственной системы научно-технической информации (ГСНТИ), Федеральной целевой программе (ФЦП) «Электронная Россия», о реализации важнейших программ РАН (например, «Разработка фундаментальных основ создания научной распределенной информационно-вычислительной среды на основе технологий ГРИД»), реализации контрактов и договоров с Министерством промышленности, науки и технологий Российской Федерации (ныне Министерство образования и науки), ("Формирование открытых баз данных научной и научно-технической информации, развитие Государственной системы научно-технической информации" Гос контракт № 37 670 11 0131 от 14 05 2002, "Программно-технологический комплекс обеспечения формирования и использования государственных ресурсов научно-технической информации" Гос контракт № 37 053 1 1 0055 от 01 02 2002 г в рамках ФЦНТП "Исследования а разработки по приоритетным направлениям развития науки и техники на 2002-2006 гг", "Навигационные системы по информационным ресурсам Государственной системы НТИ", Гос контракт № 37 053 1 1 0058 от 01 02 2002 г), с Минэкономразвития ("Формирование открытых баз данных научно-информационных ресурсов в области образования, науки и культуры (2002-2010 гг)" в рамках ФЦП "Электронная Россия", Гос контракты № 14 152 и № ЭР 06 19 от 29 11 2005 г), в выполнении серии проектов РФФИ (0107-90130 «Создание базы данных "Математика"», 04-07-90332 и 06-07-89154 "Развитие базы данных "Математика"), (01-01-14045, 02-01-14047 и 06-01-14042 «Издание сборников научных статей «Итоги науки и техники» Серия «Современная математика и ее приложения»), а также НИР, выполняемых в ВИНИТИ Кроме того следует отметить ряд работ, выполнявшихся непосредственно в ВИНИТИ "Совершенствование классификационных систем ВИНИТИ (в части Рубрикатора отраслей знания, рубрицированием информационных продуктов ВИНИТИ и УДК)" (январь 2003 - декабрь 2005), "Совершенствование классификационных систем областей знания для целей индексирования и информационного поиска в базах данных ВИНИТИ" (2004-2006 гг), "Генерация Единой технологической базы данных ВИНИТИ и развитие ее программно-аппаратного комплекса" (2005 - 2007), "Генерация и развитие базы данных и полнотекстовой электронной библиотеки русскоязычной физико-математической литературы" (2005-2007 гг) или в сотрудничестве с другими институтами РАН при
координирующей роли ВИНИТИ ("Разработка проектов государственных стандартов, рубрикаторов, кодификаторов и классификаторов дня обеспечения функционирования федеральной системы кодификации знаний", Дог № 2-кз от 04 12 02002 г , "Концептуальное обоснование информационной онлайн-службы по физико-математическим наукам и информатике как альтернативной теоретической базы для разработки концепции ГРИД-интеграции научной распределенной информационно-вычислительной среды с фактическим использованием технологии ГРИД для Интернет-ресурсов" (2004-2006 гг)
Важно подчеркнуть, что ВИНИТИ за последние годы провел ряд совместных исследований в указанных направлениях с Отделением математических наук РАН (ОМН РАН), Отделением информационных технологий и вычислительных систем (ОИТВС РАН), а также с международными организациями (Международный совет по научно-технической информации (МСНТИ), Комитет по численным данным для науки и техники (КОДАТА), Международный Консорциум УДК)
В перечисленных работах автор принимала участие в качестве исполнителя, ответственного исполнителя, руководителя разделов
Научная новизна работы
Развиты представления об интегральных проблемно-ориентированных информационных полях, которые могут быть сформированы пользователями из различных гетерогенных (разнородных) информационных источников Концепция создания таких полей опирается на предложенные автором
- систему сопряжения соответствующих классификационных фрагментов информационных ресурсов путем их отображения в виде классификационных "деревьев" (графов) и последующей идентификации "ветвей" этих "деревьев",
- необходимые изменения и дополнения в существующие классификационные системы (Универсальная десятичная классификация (УДК), Государственный рубрикатор научной и технической информации (ГРНТИ), рубрикатор ВИНИТИ (РВИНИТИ) по разделам "Математика".
- направления совершенствования важнейших элементов навигационных систем, обеспечивающих получение адекватных ответов на запросы пользователей, в том числе впервые разработанный интегральный рубрикатор ВИНИТИ "Математика"
Базируясь на изложенных концептуальных положениях в составе политематического БнД ВИНИТИ, сформирован новый тематический фрагмент - БД ВИНИТИ "Математика", и научно обоснованы пути ее последовательного преобразования в интегральную систему информационного обеспечения математических и других точных наук
Практическое значение результатов исследований
В изданиях УДК 2006-2007 отражены предложения автора по развитию систематики математических наук В результате создания в 2005-2007 гг интегрального рубрикатора ВИНИТИ "Математика" впервые реализовано сопряжение соответствующих разделов рубрикатора ВИНИТИ и "Mathematics Subject Classificaton-2000", применяемого для классифицирования информационных ресурсов по математическим наукам в странах Западной Европы и США
Впервые создана и функционирует БД "Математика" в единой информационной системе ВИНИТИ
На основе выполненных разработок подготовлены и опубликованы переработанные издания рубрикатора ВИНИТИ по математике, специальные выпуски списков ключевых слов и словосочетаний рубрик и указателей
Опыт разработки БД "Математика" обобщен в книге «Принципы и методы создания БД «Математика» в составе информационной системы ВИНИТИ [11]
Выполненные исследования обеспечили возможность создания и распространения новых электронных продуктов по математике (электронных реферативных журналов (РЖ) «Математика» и «Вычислительные науки» [12])
Впервые создан новый фрагмент для БД «Математика» - «Итоги науки и техники Современная математика»
Созданная база данных «Математика» органически встроена в информационную систему ВИНИТИ и доступна для пользователей в сети Интернет
Личный вклад автора состоит в обосновании идеологии и практической реализации ряда шагов по переходу на качественно новый уровень информационного обслуживания ученых и специалистов в области математических и других точных наук (автор - ответственный исполнитель проектов РФФИ 01-07-90130 "Создание базы данных "Математика", 04-07-90332 и 06-07-89154 "Развитие базы данных "Математика" и др и НИР ВИНИТИ "Генерация и развитие базы данных и полнотекстовой электронной библиотеки русскоязычной физико-математической литературы" (2005-2007 гг )
Апробация результатов работы
Все основные результаты работы докладывались в течение 2002-2006 гг на следующих отечественных и зарубежных конференциях и семинарах 6-ая международная конференция «Информационное общество Интеллектуальная обработка информации Информационные технологии», 16-18 октября 2002 г ВИНИТИ, Москва, 19-ая Международная конференция КОДАТА "Информационное общество Новые горизонты науки (The Information Society New Honzons for Science)», 7-10 ноября, 2004 г, Берлин, Германия, 11-ая Международная конференция «Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса», 2004, Крым, Международная конференция «Информационное обеспечение фундаментальных и прикладных наук», 27 мая, 2005 г, Москва, 9-ая Международная конференция и выставка "Информационные технолопш, компьютерные системы и издательская продукция для библиотек" ("LIBCOM-2005"), 14-18 ноября 2005 г, Звенигород, Семинар «Универсальная десятичная классификация Современное состояние и методика применения», 5-6 апреля, 2006 г, Москва, ВИНИТИ, Международный семинар "Российские электронные ресурсы по науке и технике Проект РусЭМБ как часть международной электронной библиотеки по математике", 1-2 февраля 2006 г, ГПНТБ, Москва, 13-ая Международная конференция "Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса", Крым, 2006 г, Международный Консорциум УДК (09 12 2005, 31 03 2006, 02 10 2006), Гаага, Нидерланды, 7-ая международная конференция «Информационное общество Интеллектуальная обработка информации Информационные технологию», 24-26 октября 2007 г, Москва, ВИНИТИ
Публикации
Основные результаты диссертационной работы опубликованы в 20 печатных работах, в числе которых две книги и одно учебное пособие, и отражены в 11 отчетах по НИР
Структура и объем работы.
Диссертация состоит из введения, пяти глав, заключения, списка использованной литературы и приложений Диссертационная работа изложена на 286 страницах, содержит 42 рисунка, 28 таблиц и библиографию из 318 наименований Диссертация сопровождается 6-ю приложениями
Основное содержание работы
Во введении дается общая характеристика проблем, связанных с эффективным использованием электронных информационных ресурсов Определяется роль информационной системы ВИНИТИ в поддержке научных исследований, особенно в области математики и других точных наук На основе проведенного автором анализа формулируются основные задачи совершенствования современной систематики информационных ресурсов, поисковых механизмов и перехода на качественно новый уровень обслуживания пользователей (на примере принципиально нового фрагмента в информационной системе ВИНИТИ - БД «Математика»)
В первой главе последовательно рассматриваются вопросы истории развития и современного состояния информационной поддержки научных исследований в области фундаментальных и других точных наук, в первую очередь математики В большинстве случаев научные исследования опираются на тщательное изучение достигнутых результатов, которые обычно фиксируются в статьях, докладах, книгах, трудах различных научных форумов (семинарах, конференциях, симпозиумах, конгрессах, школах и др ) На основе опубликованных материалов формируются разнообразные архивы и хранилища достижений науки, некоторые из которых имеют историю в сотни лет
В историческом разрезе ведущая роль информационной поддержки научных исследований принадлежала библиотекам Анализ объемов информации, содержащейся в научных журналах, книгах и других источниках, показывает, что эти объемы стремительно растут и в последнее время более чем удваиваются практически каждые 10-15 лет Чтобы облегчить поиск и использование необходимой информации, стали применяться различные системы классификации информационных ресурсов Впоследствии широкое распространение получили реферативные журналы, среди которых необходимо отметить широко известную в мире систему реферативных журналов ВИНИТИ
В последнее время получают широкое распространение и электронные аналоги опубликованной литературы, сведения о которых концентрируются в многочисленных банках и базах данных В результате со всей остротой встала проблема перехода от количественного накопления первоначальных данных к аналитической обработке научных публикаций
На основе проведенного автором аналитического обзора современных источников формирования электронных информационных ресурсов, в том числе по математическим и другим точным наукам, показано, что к основным требованиям, предъявляемым к информационному сопровождению научных исследований, относятся полнота и доступность информации, релевантной запросам пользователей В этой связи важно кратко охарактеризовать существующие электронные информационные источники за рубежом и в России
Сегодня одним из крупнейших в мире источников научной информации, в том числе по математике и другим точным наукам, является международное объединение STN International (Scientific & Technical Information Network), которое было создано в 1987 г и управляется совместно тремя крупнейшими информационными центрами - FIZ Karlsruhe (Германия), CAS (США) и nCST (Япония)
В STN International три ее континентальных сервисных центра связаны между собой оптоволоконными телекоммуникационными линиями связи и образуют систему, работающую как единое целое Пользователи обращаются к STN International как к единой системе
FIZ Karlsruhe (Fachmformationszentrum Karlsrue) является ведущим информационным центром Германии в облаете математики, физики, энергетики и смежных отраслей знаний С первого дня основания в 1987 г он работает как сервисный центр для пользователей библиографических, фактографических и полнотекстовых БД в режиме online
Реферативная служба по химии Американского химического общества (CAS) является
главным мировым центром в области химической информации и ряда других областей знаний
Информационный центр по науке и технике Японии (Japan Information Center foT Science and Technology (JICST)) был создан в 1957 г и является главным информационным центром по науке и технике этой страны JICST производит разнообразные БД Наиболее известной из них является БД JICST-EPLUS, с 19S5 г отражающая на английском языке все японские публикации в областях науки, техники и медицины
В работе приводятся примеры, характеризующие конкретные БД в сети STN International (их насчитывается более 200), и указываются отражающие информацию по математике и смежным областям науки и техники Базы данных, рассмотренные в работе, ранжированы следующим образом
1 Математические БД, представляющие фундаментальную и прикладную математику, а также информацию о проблемах математического образования
2 Политематические БД, в предметных классификаторах которых содержатся математические разделы
3 БД, в которых есть сведения о смежных с математикой областях знаний, и БД, в которых представлены некоторые аспекты математики и которые могут быть выявлены в результате прямого поиска.
4 БД по инженерным дисциплинам, использующим математический аппарат и математические методы
Обширные сведения о реферативных и полнотекстовых базах данных содержит каталог американской информационной фирмы Cambridge Scientific Abstracts (CSA), формирование которого обеспечивается постоянным мониторингом около 100 информационных источников, включающих журналы, научные труды институтов, научных и образовательных центров, ассоциаций, фонды библиотек и т п Ряд общих сведений из этого каталога, имеющих прямое отношение к математическим наукам и смежным с ними отраслям знаний, включен в работу
Приводятся сведения и о базах данных, которые содержат различного рода справочную информацию и являются путеводителями в сети STN International В числе таких БД можно назвать LINSPEC и STNGUIDE БД LINSPEC является учебной и предназначена для обучения пользователей баз данных INSPEC и INSPHYS База данных STNGUIDE содержит справочные сведения обо всех базах данных, доступных в сети STN International
Отдельный интерес представляет информационное наполнение математической базы данных, генерируемой FIZ Karlsruhe (MATH) Ее содержательная часть включает библиографию математической литературы, базу данных для поиска опубликованных статей и книг, средства для получения содержащихся в базе информационных документов
Для усовершенствования действующей системы обслуживания и поиска в базе данных MATH предполагается проведение исследований в следующих направлениях улучшение возможностей идентификации, «близкие поиски», расширение распределенного ввода, электронное реферирование, создание веб-портала для национальных и региональных электронных предложений - подключение узлов и реализация сетевой программы Европейского Сообщества.
Кроме STN рассматриваются еще две международные сети, которые оказывают своим пользователям компьютеризованные услуги по поиску и выдаче научной и технической информации в области смежных с математикой наук Компьютерный библиотечный центр с онлайновым доступом (Online Computer Library Center (OCLC) и Электронная коллекция с онлайновым доступом (Electronic Collection Online (ECO))
OCLC создан в 1967 г для предоставления пользователям компьютеризованных библиотечных услуг и ставит своей целью дальнейшее расширение доступа к мировой информации OCLC имеет наибольшую в мире библиографическую БД Каталог OCLC является наиболее широко используемым в высшем образовании и содержит более 84 млн
каталожных записей на 40 языках OCLC предлагает диапазон услуг, отвечающих потребностям библиотек всех уровней На сегодняшний день членами OCLC являются более 57 тыс библиотек в 112 странах
ECO является частью службы OCLC и обеспечивает веб-доступ к полным текстам более чем 5000 журналов по всем отраслям науки Справочная служба ECO в режиме online осуществляет доступ к более чем 80 БД, содержащим 3,3 млн полнотекстовых статей по множеству предметных областей ECO также обеспечивает онлайновый доступ к электронным книгам
Среди национальных информационных центров, из которых поступают сведения о результатах и достижениях в области математических и других точных и естественных наук и оказывающих услуги по информационной поддержке научных исследований в математике и смежных областях знаний, необходимо выделить следующие Institute for Scientific Information (ISI, Филадельфия, США), Institute de l'information scientifique et technique (INIST, Франция), Information Service for Physics, Electronics and Computing (INSPEC, Великобритания), Japan Information Center for Science and Technology (JICST, Япония)
ISI обрабатывает различные источники (журналы, книги, материалы конференций и т п ) и на их основе формирует многодисцишгинарную базу данных В настоящее время ISI выпускает более 50 различных информационных продуктов Основными изданиями ISI являются многодисциплинарные специализированные указатели цитирования (Science Citation Index (SCI) - указатель библиографических ссылок в журнальных статьях по точным и естественным наукам) Кроме SCI выпускаются и другие указатели цитирования, среди которых - указатель цитирования публикаций в области математики CompuMath Citation Index В ISI (ныне Thomson Scientific, TS) выходят также бюллетени сигнальной информации Current Contents (СС), основанные на использовании оглавлений научных журналов СС издаются в виде семи отраслевых выпусков TS создает БД SciSearch, отражающую библиографические ссылки во всех существенных публикациях более чем в 4,5 тыс научно-технических журналов
TS формирует также БД Current Contents С 1997 г доступна служба доставки полных текстов статей, указанных в Current Contents, - ISI Document Solution. ISI является издателем БД, нацеленных на выпуск информационных продуктов для Web и предлагающих научно-исследовательскую информацию по точным и гуманитарным наукам БД ISI охватывает более 16 тыс международных журналов, книг и трудов конференций Объем БД с расширенным указателем цитирования по точным наукам, доступный через Интернет, составляет 7 Гбайт
INIST формирует БД PASCAL (Programme Appliqué et à la Selection Compilation Automatiques de la Littérature) PASCAL является политематической / базой данных,
охватывающей с 1973 г основную научную литературу по науке, технике и медицине, и содержит более 13,1 млн библиографических ссылок Наиболее полно в этой БД представлена французская и европейская научная литература, в том числе более 4000 названий научной периодики Доступ к БД PASCAL возможен тремя путями
- в режиме online через ИПС Questel-Orbit, Dialog, Data Star, RLG,
- через Minitel (видеотекс),
- на CD-ROM, которые читаются программой GTIINIST в DOS или Windows
В INSPEC ежегодно отражается содержание около 4 тыс наименований научных журналов и материалов и более 2 тыс конференций, проходящих в мире, а также книги, технические отчеты и диссертации по смежным наукам - физике, автоматике, вычислительной технике и др С 1967 г INSPEC формирует БД, ретрофонд которой в настоящее время - более 16 млн записей с ежегодным приростом 500 тыс записей, группируемых в четырех тематических разделах А - физика, В - электротехника и электроника, С - ЭВМ и управление, D -информационные технологии
С 1989 г INSPEC предлагает пользователям следующие БД на компакт-дисках-INSPEC Ondisc - полная версия БД INSPEC,
INSPEC - Physics Ondisc - соответствует тематическому разделу А, INSPEC - Electronics and Computing Ondisc - соответствует разделам В, С и D INSPEC издает также три печатных реферативных журнала "Physics Abstracts", "Electrical and Electronics Abstracts", "Computer and Control Abstracts" Их содержание соответствует аналогичным тематическим разделам в БД INSPEC
JICST формирует БД, которые содержат информацию о научных исследованиях, ведущихся в областях науки, техники и инженерного дела. Источники для описания и справок включают обзоры исследований в национальных, общественных и частных институтах и университетах, отчеты о НИР и ОКР, периодические и продолжающиеся издания, материалы конференций
В 1995 г создана Европейская служба математической информации (European Mathematical Service, EMIS), которая предоставляет разнообразные }слуги, связанные с электронной информацией и коммуникацией базы данных, как Zentralblatt MATH (ZBMATH), электронные журналы, монографии и материалы конференций Помимо этого в EMIS можно найти ссылки на проекты по созданию систем поиска математической информации, рубрицированию математических публикаций за прошлые годы, созданию динамических web-документов и основам управления в области математики В будущем в Европейской службе математической информации предлагается создать БД анимированных геометрических объектов
Следует отметить неоднородность систематики информационных ресурсов в различных зарубежных банках и базах данных, что затрудняет поиск информации и ее обмен, а также поиск ответов на запросы пользователей Систематизированная автором информация об отечественных и зарубежных базах данных (целевых или в составе политематических) приводится в тексте диссертационной работы
Растущее влияние электронных средств на исследования и обучение в области математических и других точных наук имеет большие преимущества, но создает также и сложные проблемы, которые еще предстоит решать адекватный обмен информацией, исключение «информационного шума», предварительная аналитическая обработка, расширение зоны поиска адресной информации, семантическая разметка
В России крупнейшими информационными центрами, осуществляющими централизованную обработку мирового потока научно-технической литературы и документации (включая математические науки и смежные с ней области знаний), являются Всероссийский институт научной и технической информации РАН (ВИНИТИ), Всероссийский научно-технический информационный центр (ВНТИЦ), Библиотека по естественным наукам РАН (БЕН) и Библиотека Российской академии наук (БАН), Федеральное государственное унитарное предприятие «Всероссийский научно-исследовательский институт межотраслевой информации» (ВИМИ) и другие Электронный каталог баз данных России и стран СНГ, включающий сведения об электронных ресурсах и выпускаемой информационной продукции и охватывающий около 2,5 тыс баз данных, отражается в соответствующих государственных регистрах
В работе дается краткая характеристика наиболее значительных баз данных по математическим наукам России и стран СНГ Сведения об информационных центрах России, осуществляющих централизованную обработку мирового потока научно-технической литературы и документации, приводятся в периодически издаваемом ВИНИТИ специализированном справочнике "Информационные и телекоммуникационные центры"
В России действуют несколько классификационных систем для информационных ресурсов по фундаментальным и точным наукам, в том числе рубрикаторы ГСНТИ и ВИНИТИ, номенклатура научных специальностей ВАК, различные библиотечные системы и пр Ряд дополнительных вопросов о повышении точности адресного поиска информации, отраженных в соответствующих классификациях, возникает в связи с интеграцией различных наук математической физики, математической биологии, математической геологии и др
В результате проведенного анализа информационных ресурсов, включая их виды, потоки, объекты накопления и хранения, автор приходит к выводу, что в целом в рассматриваемом информационном поле недостаточно разработаны
- понятие общего информационно-коммуникационного пространства, призванного обеспечить повышение уровня доступности достижений математической науки для различных сфер науки и техники,
- единообразие в понимании классификации знаний и терминологии,
- процессы и механизмы, обеспечивающие предоставление пользователям релевантной информации из всей совокупности информационных источников
Перечисленные задачи являются предметом исследования широкого круга ученых Вместе с тем автор показывает возможные пути их решения на примере разрабатываемой при ее непосредственном участии информационной системы «Математика», функционирующей в составе политематического банка данных ВИНИТИ
Сведения об опубликованных работах в области математических и других точных наук в печатной форме представлены в крупнейших библиотеках мира Библиотеке Конгресса США (Library of Congress), Национальной библиотеке Канады (National Library of Canada), Британской библиотеке (Великобритания, British library), Немецкой библиотеке (Германия, Berlin State Library Prussian Cultural Heritage), Королевской библиотеке (Нидерланды, Royal Library of the Netherlands), Национальной библиотеке Франции (Bibliotheque National de France), Национальной библиотеке Испании (Biblioteca Nacional de Espana), Национальной библиотеке Италии (Biblioteca Nationale Centrale di Rome), Королевской (The Royal library) и национальной (The National library of Denmark) библиотеках Дании, Парламентской библиотеке Японии (Tokyo Main Library), Российской государственной библиотеке (РГБ), Российской национальной библиотеке (РНБ), Библиотеке Российской академии наук (БАН), Библиотеке по естественным наукам РАН (БЕН), Государственной публичной научно-технической библиотеке (ГПНТБ), Центральной политехнической библиотеке (ЦПБ), Научной библиотеке Московского государственного университета (НБ МГУ), национальных библиотеках стран СНГ и в научно-технических библиотеках ведущих научных центров, институтов и высших учебных заведений
В настоящее время теоретически решена задача организации всемирного каталога публикаций через объединение каталогов и БД крупнейших национальных библиотек и информационных центров большинства развитых стран, включая Россию Технологические достижения в области информационного обеспечения научных исследований нашли отражение в многочисленных проектах создания и внедрения электронных библиотек (ЭБ) как глобального, так и локального масштаба
С 1998 г по инициативе Российского Фонда Фундаментальных Исследований (РФФИ) и Российского Фонда Технологического Развития (РФТР) осуществляется программа «Российские электронные библиотеки», в рамках которой с участием ВИНИТИ ведутся работы по общесистемным вопросам создания и функционирования электронных библиотек для различных областей науки, культуры и образования
Вместе с тем до настоящего времени не создана надежная адресная навигационная система, позволяющая пользователям получать гомогенную информацию из гетерогенных источников В этом направлении ведутся масштабные исследования и разработки, в которых участвуют МИАН им В А Стеклова РАН, суперкомпьютерный ВЦ РАН, ГПНТБ, РФФИ, ВИНИТИ РАН, МГУ им М В Ломоносова и др Решению этой проблемы в определенной степени и посвящена настоящая работа
Вторая глава рассматривает вопросы систематизации информационных потоков в отечественной и зарубежной практике в области фундаментальных и точных наук При рассмотрении существующих классификационных систем необходимо различать цели их создания Таковыми могут быть научные результаты и перспективы научных исследований, классификация накопленных знаний в разных областях, систематизированная номенклатура
научных специальностей и патентов, классификации знаний для учебных и образовательных целей и др
С позиции использования классификаций знаний необходимо выделить мировой (международный) уровень, национальный (государственный) и локальный (отраслевой и региональный) Отметим, что классификационные системы знаний разных уровней постоянно развиваются, при этом скорость изменения оказывается неодинаковой для разных уровней и видов знаний Когда основной задачей становится поиск необходимых информационных ресурсов, возникает множество проблем по «стыковке» и взаимоувязке накопленной информации, систематизированной различным образом
В целях возможного сопряжения различных классификационных систем автор использует для каждой из них понятие «классификационное дерево», имеющее горизонтальную и вертикальную составляющие, ветви, вершину и основание Практически такое дерево является сложным графом В этом случае сопоставление разделов и понятий различных классификаций можно теоретически свести к сопряжению соответствующих "ветвей деревьев" При этом необходимо отметить, что эта проблема является чрезвычайно сложной, так как при ее решении придется иметь дело с пересечениями соответствующих графов как внутри одного "дерева", так и между ними Начало формирования такой системы деревьев предусмотрено перспективами развития политематического банка данных ВИНИТИ и получает конкретное воплощение при разработке и создании информационной системы ВИНИТИ «Математика»
Количество конкретных задач для поиска необходимой информации стремительно возрастает по мере движения от вершины классификационного дерева к его основанию В этой ситуации крайне важно руководствоваться обоснованной схемой определений и понятий по отраслям знаний и видам наук В этом смысле автором выполнен научный анализ существующих классификационных систем с целью обоснования принципов сквозного поиска необходимой информации
Историю развития систем информационного поиска можно вести от работ К Муэрса, который предложил описывать содержание документов простым перечислением дескрипторов - терминов, особенно употребляющихся в самом документе и тем самым выражающих его содержание в пределах терминологии данной предметной области Предполагалось, что перечень дескрипторов, существенных для описания документов определенной предметной области, не слишком велик, что его можно свести в словарь, в котором будут выражены отношения между дескрипторами наподобие соотношения иерархии классов понятий, и использовать этот ограниченный словарь, называемый информационно-поисковым тезаурусом (ИПТ), как язык для индексирования документов Во многих областях эта идеология привела к созданию успешно действующих поисковых систем со специализированными тезаурусами Подобные тезаурусы создавались для различных сфер деятельности как за рубежом, так и в нашей стране Следует отметить, что специализированные тезаурусы математических терминов практически не разрабатывались Так, за время действия службы регистрации информационно-поисковых языков Государственной системы научно-технической информации СССР (ГСНТИ) в 1960-х- 1980-х годах не было зарегистрировано ни одного математического ИПТ
Обратимся к широко известным международным и отечественным классификациям знаний Наиболее известной и широко распространенной в мире классификацией знания является Универсальная десятичная классификация (УДК), история которой насчитывает более 100 лет В нашей стране она является обязательной для централизованного индексирования литературы по точным, естественным, техническим наукам и всей книжной продукции УДК - это одна из наиболее распространенных международных классификаций, используемая во многих научных библиотеках для систематизации фондов
УДК построена по систематическому принципу один и тот же предмет может встречаться в разных местах в зависимости от отрасли знания и аспектов, в которых он рассматривается Например, термин "матрица" встречается как в математике, так и в других
точных науках и в некоторых технических дисциплинах
УДК построена и по иерархическому принципу В основе иерархического принципа лежит деление понятий от общего к частному с использованием цифрового десятичного кода При этом основными видами отношений являются подчинение (иерархия) и соподчинение
Анализ этой классификации, как и других, необходим для выявления основных способов поиска необходимой информации на их методологической базе и в конечном итоге для построения современного поискового аппарата для БД "Математика" УДК возникла и развивалась на базе "Десятичной классификации Дьюи" (ДК), разработанной американским библиотекарем Мельвилем Дьюи (1851-1931), согласно которой вся сумма человеческих знаний делилась на 10 равноправных частей по принципу десятичных дробей или по децимальному (десятичному) принципу Например, естественные и точные науки имеют шифр 0,5 Каждая из этих частей делилась на десять последующих равноправных частей и далее на десять более мелких делений и т д
Десятичная классификация Дьюи была принята за основу при разработке Универсальной десятичной классификации (УДК) для систематизации мировой библиографии Разработчиками и создателями Универсальной десятичной классификации были бельгийские библиографы Поль Отле и Анри Лафонтен, организаторы Международного библиографического института и первой Международной библиографической конференции (1895 г )
Основным дополнением, качественно отличающим УДК от системы Дьюи, было введение общих и специальных определителей, а также знаков, позволяющих отражать связи между понятиями основного содержания документов и классифицировать сложные понятия
Процесс классификации является одним из самых трудоемких и сложных, тах как помимо растущего количества информации значительно усложняется содержание публикаций, а следовательно и их классификация Одним из основных путей решения этой проблемы является развитие базовой системы классификационных «деревьев» для различных сегментов мирового научного пространства В частности, для России под базовой системой классификационных «деревьев» автор предлагает взаимосвязанную системообразующую цепочку, в вершине которой находится УДК, далее - рубрикаторы ГРНТИ и ВИНИТИ Эту цепочку автор условно предлагает именовать «централизованной классификацией»
При централизованной классификации все виды публикаций по математическим, естественным, техническим наукам и всем другим отраслям знаний индексируются либо одним, либо несколькими звеньями взаимосвязанной системообразующей цепочки
Основная задача централизованной классификации заключается в обеспечении потребителей информации индексами, точно и полно раскрывающими основное содержание (тему) документов
Задача централизованной классификации, с учетом словарного состава УДК и возможностей применения различных приемов и средств индексирования, может быть решена с различной степенью точности и полноты раскрытия содержания документа индексатором (систематизатором) В связи с этим к индексам централизованной классификации предъявляются не только особые, но и единые требования, которые обеспечивают оптимальное использование индексов при централизованной классификации на местах без их существенной редакции
УДК является информационно-поисковым языком (ИПЯ) классификационного типа это специализированный искусственный язык, предназначенный для описания (выражения) центральных тем и предметов и формальных характеристик документов с целью последующего отыскания нужных документов среди множества других или для выражения содержания информационных запросов и поиска нужных документов
С точки зрения лексики УДК имеет довольно развитую детализацию понятий В полном издании УДК насчитывается более 150 тыс индексов Благодаря этому УДК не уступает дескрипторным языкам по семантической силе в том смысле, что почти для каждого ключевого слова дескрипторного ИПЯ существует эквивалентный индекс УДК
Индексы УДК построены так, что каждая последующая присоединяемая цифра не меняет значения предыдущих, а лишь уточняет, обозначая более частное понятие Например, индекс понятия "арифметика эллиптических кривых" 512 742 72 складывается следующим образом
51 Математика 512 Алгебра
512 7 Алгебраическая геометрия
512 74 Алгебраические группы, включая абелевы многообразия 512 742 Абелевы многообразия и схемы 512 742 7 Арифметика абелевых многообразий 512 742 72 Арифметика эллиптических кривых
Неотъемлемой частью УДК является алфавитно-предметный указатель, который служит вспомогательным аппаратом или ключом к схеме
Автор обращает особое внимание на то, что именно наличие вспомогательного аппарата к классификациям позволяет осуществлять сопоставление и "стыковку" различных классификационных схем
К области точных наук в УДК следует отнести раздел 51 Математика, а также условно разделы других естественных и технических наук, в которых численные и количественные методы составляют основное содержание научного исследования Таковыми являются следующие классы УДК
004 Информационные технологии Вычислительная техника Обработка данных 007 Деятельность и организация Общая теория связи (кибернетика)
52 Астрономия Астрофизика Исследование космического пространства Геодезия
53 Физика
558 Кристаллография
621 Общее машиностроение Ядерная технология Электротехнология Технология машиностроения
629 Техника средств транспорта (наземный транспорт, водный транспорт, авиация, космонавтика)
Характер использования точных (математических) методов в указанных научных областях различен Информационные технологии по сути дела являются практической реализацией математических моделей Кибернетика-исследование математическими методами процессов управления В физике и астрономии только математический расчет позволяет выявлять результаты экспериментов и наблюдений, а также интерпретировать полученные данные Кристаллография полностью основана на специфической математической теории симметрий В технических дисциплинах (машиностроение и машинные технологии) только математические методы могут гарантировать эффективность и безопасность хозяйственной деятельности Доминирующую роль имеют математические методы в таких отраслях техники, как ядерные технологии, радиотехника, электроника, приборостроение, электросвязь
Области точных знаний существуют и в других сферах науки и хозяйства (в экономике, лингвистике, генетике, химии, геологии, логике и др) Выделение их с помощью классов УДК может быть осуществлено достаточно точно, но требует отдельного исследования
Слово "матрица" в силу неоднозначности его содержания в разных областях знания не может рассматриваться только как математический термин В математике раздел 512 643 посвящен "Теории матриц", в разделе 511 8 "Некоммутативная арифметика" можно найти понятие 51182 "Арифметика матриц", в разделе 517 98 "Функциональный анализ"-517 982 276 "Пространства последовательностей и матриц", в разделе 519 61 "Численные методы в алгебре" - 519 613 "Численные методы обращения матриц" В биологических науках -в разделе 577 2 "Молекулярные основы жизни Молекулярная биология" 577 213 37 "Свойства
и поведение матрицы в репликации ДНК-затравка", 577 213 38 "Свойства продукта и его идентичность с матрицей" или 577 214 42 "Связь фермента с матрицей" В физике-в разделе 539 4 "Прочность" 539 422 53 "Разрушение матрицы композитных материалов" В машиностроении - в разделе 621 98 "Обработка листового материала Способы (технология), машины, инструменты" - 621 983 07 "Формообразующие инструменты Штампы Матрицы Пуассоны" В полиграфии в разделе 655 "Полиграфическая промышленность Издательское дело" - 655 222 6 "Изготовление форм высокой печати с матриц"
Такое явление, называемое множественной локализацией понятий, отражает многоаспектность УДК Это свойство необходимо всегда учитывать при индексировании документов и поиске их в проиндексированном ранее массиве (библиотеке, информационном центре)
Точные науки занимают около 3,3% логического объема классификации Однако исключительная научная и хозяйственная важность этих областей знания привела к повышенной степени развития занятого точными науками объема классификационной таблицы В результате мы видим, что точными науками занято примерно 1,5 тома из 10 томов полного издания таблиц, те 15% фактического объема, что составляет примерно 20тыс отдельных позиций (рубрик) классификационной системы
В качестве основных поисковых механизмов в УДК используются принципы индексирования, ИПЯ и некоторые другие приложения Не углубляясь далее в детали построения УДК, отметим, что рассмотренная система является как бы "вершиной" классификационного айсберга, а проблемы сегодняшнего дня при построении баз и банков данных сводятся как к необходимому развитию определенных составных частей УДК (51 "Математика"), так и нахождению прямых и косвенных связей с другими системами В этой работе применительно к точным наукам автор принимала участие в течение многих лет
Десятичная классификация Дьюи
Указанные выше особенности УДК отчасти объясняют широкое распространение в мире конкурирующей системы - Десятичной классификации Дьюи (ДКД) Основными конкурентными преимуществами ДКД перед УДК являются ее статус национальной классификации США и применение в самой крупной международной системе кооперативной каталогизации документов (ОСЬС)
Имея с УДК общее происхождение и единую систему основных классов, ДКД ограничивается сравнительно неглубоким их членением и не предлагает широкого комбинирования кодов классов при индексировании Все это упрощает пользование классификацией и повышает однозначность индексирования элементов знания К сожалению, ДКД совсем не применялась в России, и ее использование с учетом специфики потребностей нашей страны невозможно в силу закрытости системы ведения ДКД
Классификация Бибчиотеки конгресса США
Наряду с ДКД в США и некоторых других странах пользуется популярностью другая национальная классификация США - Классификация Библиотеки конгресса (КБК) Эта система ориентирована исключительно на отражение фонда именно Библиотеки конгресса США и характеризуется принципиальной консервативностью структуры, связанной с естественной консервативностью исторически накапливаемого библиотечного фонда Консервативность классификации приводит во многих случаях к произвольным классификационным решениям и затрудняет поиск в системе информации по актуальным научным проблемам Нет оснований рассматривать КБК в качестве перспективной классификации для использования в России
Классификация Ранганатана
Современная теория библиотечных классификаций была заложена индийским математиком Ш Ранганатаном, который разработал универсальную фасетную систему классифицирования "Классификация с двоеточием" (1933 г) В настоящее время "Классификация с двоеточием" Ранганатана (КДР) представляет собой развитую, методически выдержанную систему универсального охвата, способную удовлетворить потребности тематической систематизации источников знания, в частности - информационных ресурсов по точным наукам Таблицы КДР были изданы на разных языках, включая русский Однако в России эта классификация не применяется В других странах (главным образом в Индии) она применяется также в незначительном числе организаций
Классификация Блисса
У теоретиков классификации знаний большим авторитетом пользуется также классификация, разработка которой начата библиографом Блиссом В настоящее время Библиотечная классификация Блисса (БКБ) разрабатывается группой исследователей, которые на единых методических основаниях развивают различные области знания К сожалению, до сих пор не изданы полные таблицы БКБ и нет опьгга ее практического использования
Классификация Индекса научного цитирования
Среди мировых классификаций знаний следует также упомянуть системы, разработанные не для целей информационного обслуживания, а для наукометрических и издательских целей. Большую популярность имеет классификация, применяемая в американском Институте научной информации (ISI, Филадельфия, Пенсильвания) на основе анализа базы данных о цитировании публикаций 65 стран Классификация Института научной информации (КИНИ) представляет собой не столько классификацию знаний, сколько систему упорядочения данных о науховедческих исследованиях Она включает всего 140 классов в естественно-технической и 70 классов в общественной области знания Эти классы образуют неглубокую иерархическую структуру с 2-3 уровнями подклассов Каждый из классов соответствует довольно обширной научной сфере, внутри которой могут сочетаться вопросы точных наук с аспектами эмпирического н умозрительного знания Таким образом, описание тематики информационного ресурса по КИНИ может использоваться для тематически широкого обзора фонда информации
Классификация Организации экономического содействия и развития
Наукометрическая классификация Организации экономического содействия и развития (ОЭСР) выделяет 6 основных полей исследований Ныне действующий вариант классификации делит эти поля на 20 рубрик второго (нижнего) уровня, среди которых только три рубрики отражают проблемы фундаментальных наук
1 1 Математика и компьютерные науки - Mathematics and computer sciences 1 2 Физические науки - Physical sciences
Для повышения значимости данная классификация должна быть углублена еще на один уровень Для математических наук такими рубриками третьего уровня могут быть следующие 1 1 Математика и компьютерные науки - Mathematics and computer sciences 1 1 1 Чистая и прикладная математика 1 1 2 Статистика и теория вероятностей 1 1 3 Компьютерные и информационные науки
Классификация информационных ресурсов, баз и банков научных данных
В последнее время все большее значение приобретают классификационные системы, используемые электронными источниками научных знаний Некоторые из них используют
библиотечные классификации Так, в мировой сети библиотек OCLC, в рамках которой предоставляется доступ к участвующим в сети банкам данных библиотек, используются национальные американские классификации - Классификация Библиотеки конгресса и Десятичная классификация Дьюи, поскольку эта сеть развилась на основе корпоративного объединения библиотек США Другие базы научных текстов разрабатывают новые собственные классификации, приспособленные к задачам именно данной системы, лишенные бремени докомпьютерной традиции и лучше отражающие состояние современного знания К числу таких классификаций относится Государственный рубрикатор научно-технической информации, о котором пойдет речь ниже Другие примеры включают рубрикации национальных систем научно-технической информации Pascal, JICST и INSPEC, которые являются ведущими реферативными источниками в области точных, естественных и технических наук Третий вид научных баз данных, возникших на основе хранения текстов журнальных публикаций в электронном виде, использует для систематизации данных рубрикации исходных научных журналов Таким примером является классификация Американского математического общества (American Mathematics Subject Classification -AMSC) Каталог математических ресурсов, доступных через Интернет, создан в нашей стране в виде веб-портала Mathtree под руководством академика Ю П Ершова Упорядочение ресурсов по тематике также ведется в этом каталоге согласно AMSC
Особенности этих классификаций описываются в следующих разделах
Рубрикации национальных информационных ресурсов
Рубрикатор системы PASCAL
Система PASCAL (Programme Applique a la Selection et a la Compilation Automatiques de la Litterature) создана в Центре научной и технической информации Национального центра научных исследований Франции для подготовки РЖ "Bulletin signaletique" и создания БД на его основе В БД преимущественно отражаются европейская литература (около 60%) по математике, физике, химии, технологии в различных областях науки и техники, наукам о Земле, включая геофизику и астрономию, наукам о живом и медицине, включая биологические аспекты психологии
Классификационная схема БД PASCAL представляет собой иерархическую предметную классификацию, в которой систематизированы главным образом два направления точные науки и технология, имеющие код первого уровня - 001, биология и медицина, имеющие код первого уровня - 002 Наполнение рубрик классов 001 и 002 примерно одинаково Из класса 001 половина занята математикой, информатикой и физикой С учетом высокотехнологичной техники точные знания занимают примерно треть классификации Математический раздел содержит 112 рубрик
Нотация кодов буквенно-цифровая NNNANNANNA , где N- цифра, А -буква В классификационной схеме БД PASCAL ряд кодов имеют отсыпки к другим кодам используемой системы классификации, что значительно увеличивает полноту информации и раскрывает междисциплинарный характер отдельных тематических направлений Классификатор предоставляется в свободном доступе через Интернет
Рубрикатор системы JICST
Информационный центр по науке и технике Японии (Japan Information Center for Science and Technology-JICST) начал издание РЖ в 1957 г, а с 1985 г генерируется политематическая БД по естественным наукам, технике и медицине Часть этой БД JICST-Eplus (по научно-технической литературе Японии) на японском языке предоставляется
пользователям в переводе на английский язык через STN International Индексирование отраженных в БД публикаций проводится одновременно по двум классификационным схемам по УДК и по национальному иерархическому классификатору Рубрикатор JICST имеет шестиуровневый буквенно-цифровой код A i A2N1N2N3N4N 5 A3, где А-буква, N- цифра. 24 класса первого уровня JICST определяют ее тематическую направленность физика, ядерная техника и технология, химия, химическая технология и химическая промышленность, биология, сельское хозяйство и медицина, науки о Земле и космосе, материаловедение, металлургия, машиностроение, электронная и электротехническая промышленность, строительство, приборы и методы измерения, техника связи и вычислительная техника, экономика промышленности
Рубрикатор системы INSPEC
БД и РЖ INSPEC (Information Service for Physics, Electronics and Computing) содержат информацию о публикациях в области физики, электроники, электротехники, вычислительной техники, информационным технологиям и некоторым разделам машиностроения Основатели -Институт инженеров-электриков (Institute of Electrical Engineers) и Физическое общество в Лондоне (The Physical Society) INSPEC состоит из четырех РЖ Physics Abstracts, Electrical Engineering and Electronics Abstracts, Computer and Control Abstracts и Automation Abstracts Систематический иерархический рубрикатор БД INSPEC включает четыре раздела А -Физика, В - Электротехника и электроника, С - Компьютеры и автоматика, D - Информатика и Е-Технология и оборудование Каждый раздел при необходимости развивается на глубину до 6 уровней, включая первый уровень, совпадающий с индексом раздела Нотация кодов буквенно-цифровая A NNNNA, где N- цифра, А - буква Рубрикатор содержит алфавитно-предметный указатель Рубрикационная схема периодически актуализируется, достаточно быстро отражая новые научные направления и изменяющиеся интересы потребителей В качестве примера можно привести введение в рубрикатор уже в 1992 г разделов по нанотехнологии, включая тематическое направление, связанное с фуллеренами, открытыми в 1990 г, и введение с 2004 г 120 новых кодов для систематизации информации в новом разделе INSPEC-E
Несмотря на то, что в рубрикаторе INSPEC отсутствует специальный раздел, по «чистой математике», из общего числа рубрик около 80% посвящено проблемам точных наук
Классификация американского математического общества
AMSC (American Mathematical Subject Classification, ныне действует версия 2000 г ) представляет собой трехуровневую буквенно-цифровую иерархию Общий вид кода рубрики -FFLTT, где FF-двузначный цифровой номер рубрики первого уровня, L-латинская буква, обозначающая рубрику второго уровня, TT- двузначный цифровой номер рубрики третьего уровня На первом уровне выделено 63 класса, расположенных примерно в логическом порядке от фундаментальных математических дисциплин (математическая логика и основания математики) до статистики, вычислительных методов, приложений и преподавания математики Всего рубрикатор содержит около 5800 рубрик, что делает его самой подробной международной классификацией в области математики (против 2200 рубрик в Рубрикаторе ВИНИТИ, 1500 классов в УДК, 180 в ГРНТИ или 120 в PASCAL) На этой основе AMSC может использоваться как эталон для сопоставления содержания рубрик других рубрикаторов Однако здесь отсутствуют рубрики других точных наук, которые представлены только применяемыми там математическими методами
Национальные российские классификаторы информации
Российская Библиотечно-библиографическая классификация
В отечественной практике наряду с УДК применяется и другая универсальная система индексирования - «большая» Библиотечно-библиографическая классификация (ББК) Эта система во многом подобна УДК с ее достоинствами и недостатками Она также охватывает весь универсум знания, допускает комбинирование классов при индексировании и имеет глубокую иерархию классов Техническим недостатком ББК является то, что она известна в трех независимых модификациях в виде полного издания для научных библиотек, вышедшего в 60-х годах, сравнительно недавно вышедшего краткого варианта для массовых библиотек и среднего издания в 8 томах, три выпуска которого вышли к настоящему времени Выпущено также руководство по применению классификации
ББК применяется в РГБ и, главным образом, в системе массовых библиотек, но почти не известна в области информации о точных науках К достоинствам ББК следует отнести факт ее принятия как основного классификационного средства в электронной библиотеке РГБ «ОРЕЛ»
Государственный рубрикатор НТИ (ГРНТИ)
В соответствии с целью своего создания ГРНТИ, являясь универсальной иерархической классификацией областей знания, предназначен для описания тематики информационных потоков и массивов в различных процессах научно-информационной деятельности при решении следующих задач
• определение тематического охвата информационных служб, систем, баз и банков данных,
• формирование информационных массивов с целью информационного обмена,
• систематизация материала в информационных изданиях,
• тематическое индексирование и поиск документов в фондах,
• адресация запросов в информационных сетях
Совместимость с друпши классификационными системами обеспечивается разработкой перекодировочных таблиц, которые позволяют совместить использование нескольких классификаций для сходных целей Большое значение имеет наличие таблицы соответствия рубрик ГРНТИ классам УДК Это позволяет осуществить связь массивов, проиндексированных по ГРНТИ, с мировым фондом информации Разрабатывались также перекодировочные таблицы между ГТНТИ и Международной патентной классификацией Методика таких разработок проверена и может быть использована на новом этапе развития
Особенностями ГРНТИ как классификационной системы являются универсальный охват научных и технических знаний, сравнительно неглубокая иерархия (3 уровня), децимальный принцип деления классов (позволяющий иметь в сети классов резервные места для развития системы), согласованность структуры классов со структурой управления народным хозяйством и системой образования Применение Рубрикатора ГАСНТИ было нормировано рядом документов и государственным стандартом ГОСТ 7 49-84 В настоящее время идет работа над национальной российской версией стандарта (ГОСТ Р 7 0 49), который поддерживает состав ГРНТИ в соответствии с современной практикой Для развития структуры ГРНТИ отраслевые информационные органы, а также заинтересованные предприятия и организации разрабатывают на более глубоких уровнях локальные рубрикаторы по отдельным отраслям и проблемам, в государственном реестре зарегистрировано свыше 200 локальных рубрикаторов Только в ВИНИТИ используются 25 локальных рубрикаторов по естественным,
техническим и экономическим отраслям знания, имеющих глубину до 9 уровня Рубрикаторы ВИНИТИ в настоящее время стали фактически общим стандартом для поиска в базах данных (раздел 27 - Математика, раздел 28 - Кибернетика, раздел 30 - Механика и т д)
Основа точных наук - математика - представлена в ГРНТИ 150 рубриками Существенным моментом здесь является то, что в этом разделе достигнуто полное соответствие структуры ГРНТИ и УДК классы этих систем на определенном уровне совпадают по номенклатуре, наименованиям и содержанию Это соответствие открывает возможность прямого включения отечественной информации по математике, систематизированной по ГРНТИ, в мировое научное информационное пространство
Классификационная система ВИНИТИ
В настоящее время роль ВИНИТИ в лингвистическом обеспечении индексирования и поиска научно-технической информации характеризуется сосредоточением здесь управляющих функций относительно основных средств тематической классификации и информационного поиска, применяемых в нашей стране для межсистемного и международного обмена сведениями о научных разработках и технологических решениях
С 2ООО г ВИНИТИ является членом международного Консорциума УДК и входит в управляющий совет этой организации, которая теперь обладает авторскими правами и несет интеллектуальную ответственность за развитие и использование Универсальной десятичной классификации ВИНИТИ имеет исключительное правом формировать официальный текст таблиц УДК на русском языке и распространять их потребителям независимо от государственной принадлежности
После того как большинство отраслевых центров НТИ прекратили свою деятельность, локальный Рубрикатор ВИНИТИ стал фактически межотраслевым стандартом, поскольку на него ориентируются многочисленные пользователи информационных услуг ВИНИТИ из всех областей науки, отраслей экономики, сфер образования и т п
Рубрикатор ВИНИТИ
В настоящее время информационная продукция ВИНИТИ систематизируется с помощью Рубрикатора ВИНИТИ (РВИНИТИ), в развитии которого автор принимала и принимает активное участие Он представляет собой совокупность 30 отдельных рубрикаторов отраслей знания (РОЗ) Каждый из РОЗ является выборкой рубрик Государственного рубрикатора НТИ (ГРНТИ) с их дальнейшим развитием (в случаях необходимости) на глубину до 9-го уровня
Классификация знаний должна прямо отражаться в классификациях программ преподавания этих знаний На высшем уровне образовательного процесса находится Номенклатура специальностей ученых Высшей аттестационной комиссии (НВАК) Фактически эта номенклатура содержит две сопряженных классификации наук В основе лежит дисциплинарная классификация наук по их предметному содержанию, объекту изучения и преподавания Эта классификация нормативно закреплена Общесоюзным классификатором специальностей высшей научной квалификации (ОКСВНК), который представляет собой трехуровневую иерархическую классификационную систему с децимальным принципом деления классов наподобие ГРНТИ
Как уже отмечалось, разработаны сопоставительные таблицы НВАК и ГРНТИ, позволяющие соотнести специализацию ученых с системой научно-технической информации и облегчающие подбор как научных данных для подготовки специалистов высшего уровня, так и подбор специалистов соответствующей квалификации для решения проблем, возникающих в конкретных сферах знания Через ГРНТИ, связанный с международной классификаций знаний УДК, номенклатура ВАК сопрягается со всемирным репертуаром научных сведений ОКСВНК
включает перекодировочную таблицу от специальностей российских ученых к Международной стандартной системе классификации образования (МСКО) Разработка аналогичных сопоставительных таблиц для номенклатур направлений и специальностей образования вузовского и среднего уровня позволит включить все классы образовательных специальностей в единую систему упорядоченного знания на основе ГРНТИ Сравнительную характеристику некоторых описанных выше классификационных систем можно наглядно представить в виде Таблицы 1
Таблица 1 Сравнительная характеристика классификационных систем
Характеристический признак Системы классификации знания
УДК ДВД ББК ГРНТИ КДР БКЕ КИНИ ОСЭР НВАК КБК
Универсальность охвата знаний + + + + + - + + + +
Сфера применения в России НТВ Массовые библиотеки, РГБ АСНТИ ■ Наукометрия Экономика ВАК
Простота и однозначность - + - + - ■ + + + •
Возможность корректировки + - + + - - - - + -
Достаточность детализации + - + - + + - - - +
Возможность дальнейшей детализации + - + + - ■ ■ -
Территория распространения Веде США Россия СНГ ■ - Везде Везде Россия США
Сопоставима с ДКД, ГРНТИ, НВАК УДК • УДК.НВ АК - ГРНТИ
Примечание УДК - Универсальная десятичная классификация, ДКД - Десятичная классификация Дьюи, ББК - российская Библиотечно-библиографическая классификация, ГРНТИ - Государственный рубрикатор научно-технической информации, КДР -«Классификация с двоеточием» Ш Ранганатана, БКБ - Библиотечная классификация Блисса, КИНИ - классификация Института научной информации (США), О СЭР - классификация Организации социально-экономического развития (OECD), НВАК - номенклатура специальностей ученых (ВАК), КБК - Классификация Библиотеки Конгресса США
Краткая характеристика классификационных систем и схем свидетельствует об огромных масштабах информационного поля, в котором осуществляется поиск необходимых дам пользователя данных Основная идея автора заключается не в том, чтобы построить единую классификационную систему знаний, а в том, чтобы определить пути возможного сопряжения разделов действующих классификаций разного уровня Для этого необходимы максимальная гармонизация применяемых терминов, использование и развитие действующих поисковых механизмов тезаурусов, терминологических словарей, предметных указателей, сопоставительных таблиц, дескрипторных списков, метаданных, идентификационных кодов и поисковых образов В разных классификационных системах эти механизмы разработаны с
неодинаковой степенью детализации.
В третьей главе рассматриваются основы построения и функционирования информационной системы ВИНИТИ. В понимании автора под такой системой следует подразумевать всю совокупность информационных ресурсов в традиционном (печатном) и электронном виде и механизмы управления ими в целях эффективного сопровождения научных исследований. Значительная часть работы посвящена политематическому банку данных ВИНИТИ (БнД ВИНИТИ), состояние и перспективы развития которого подробно рассмотрены в [10].
Важными составляющими элементами информационной системы ВИНИТИ являются традиционные (печатные) и электронные архивы первоисточников, их рефераты, а также процедуры информационного обмена с отечественными и зарубежными пользователями. Политематический БнД ВИНИТИ создавался в течение длительного времени (более 25 лет) и сегодня является одним из крупнейших в мире политематическим (преимущественно реферативным) банком данных, содержащим около 30 млн. документов. Характерной его особенностью является постоянное совершенствование механизмов функционирования. Банк данных ВИНИТИ включает двадцать девять тематических фрагментов (баз данных) по различным областям знаний.
Ниже приводятся сведения об использовании в политематическом банке данных ВИНИТИ информационных ресурсов тематического фрагмента «Математика» в тематических фрагментах других точных наук (рис. 1 ).
Химия 2,4%
Астрономия 14%
Механика 22%
Прочив
Информатика 0,15%
Транспорт 0,9%
Энергетика Электротехника Металлургия 1,1%
Машиностроение _1,9%
Науки о Земле 2,4%
Автоматика и радиоэлектроника 28%
Физика 27%
Рис.1. Использование в политематическом банке данных ВИНИТИ информационных ресурсов тематического фрагмента «Математика» в тематических фрагментах других точных наук.
Самое общее представление об информационных потоках и информационных ресурсах ВИНИТИ дает рис. 2.
Рис. 2. Информационные потоки и ресурсы ВИНИТИ
Современная структура БнД ВИНИТИ представляет собой совокупность нескольких подсистем, функционирующих на различных программно-аппаратных платформах. Среди основных подсистем следует выделить следующие: ведение архива БД, ведение банка данных, обеспеченияе онлайн доступа, административного контроля и управления.
Подсистема ведения архива предназначена для обеспечения хранения исходных массивов и функционирует на базе специально разработанного комплекса программ (СПД), позволяющего реализовать задачи преобразования форматов данных (физических и логических), редактирование заданных элементов данных, перекодирование, реструктуризацию тематического состава БД. Обобщенная архитектура СПД приведена на рис. 3.
Таблицы конверсии
IZT
Входные форматы БД
Кодировочные таблицы
Выходные форматы
БД
Ядро
СПД
i L i. X _ , ь ' г
Модуль Модуль Модуль Модуль Модуль
правил редакти- перекоди- фильтра- сбора
рования рования ции статис-
тики
Данные в ИПС «Сокол»
Рис 3 Обобщенная архитектура системы преобразования данных
Подсистема ведения банка данных функционирует на основе программных комплексов СПД и «Сокол» (разработка ВИНИТИ) и СУБД «My SQL» Комплекс «Сокол» обеспечивает загрузку БД в ИПС. формирование структур данных, необходимых для работы ИПС (словаря, хит-листов, массивов документов), поиск по запросам, позволяющий использовать более двадцати признаков, входящих в описание документа (автор, заглавие, источник, ключевые слова и словосочетания, реферат, рубрики, страна, год, язык издания и тд), поиск по словарю, выполняющему функцию многоаспектного указателя (авторского, предметного, источников, индексов международной патентной классификации, номеров патентных документов, депонированных рукописей и тд), использование словаря при построении и корректировке запросов, сохранение запросов с последующим многократным использованием их для поиска, экспорт результатов поиска в файлы различных форматов Программный комплекс «Сокол» имеет развитую систему помощи пользователю, включающую информацию о тематическом составе информационных ресурсов ВИНИТИ, режимах работы с пошаговыми
инструкциями и рекомендации по обработке найденных документов Общая архитектура комплекса «Сокол» представлена на рис 4
Внешние языковые модули
Рис 4 Обобщенная архитектура ИПС «Сокол»
Подсистема административного контроля и управления обеспечивает ведение учета данных о пользователях, автоматическую регистрацию действий пользователей (биллинг), установку лимитов на использование видов и объемов информации БнД и генерацию отчетов о работе БнД
Подсистема on-lme доступа входит в распределенную систему локальной вычислительной сети (ЛВС) ВИНИТИ и интегрирована с мировой информационной инфраструктурой Наиболее важные структурные части БнД реализованы на базе хост-ЭВМ SUN, а остальные распределены по сети для обеспечения эффективности реализации различных функций БнД
При разработке системы такого рода, как БнД ВИНИТИ, было необходимо предусмотреть ряд характеристик, обеспечивающих жизнеспособность и эффективность системы, в т ч
•расширяемость, т е возможность переноса как системы, так и данных на другие программно-аппаратные платформы без сколько-нибудь существенных затрат на перенос данных,
• возможность настройки на работу с различными формами мульти и гипермедиа данных,
• эффективная работа в гетерогенных средах,
• обеспечение работы с самыми современными средствами универсального доступа к данным, как WWW-броузеры, CASE-средства разработки и т п,
• наращиваемость, т е возможность расширять объемы доступных данных без уменьшения пропускной способности системы
Для достижения этих характеристик была принята стратегия, смысл которой заключается в развитии системы по нескольким направлениям
Основное направление - это создание распределенной системы обработки баз данных, их хранения и доступа в гетерогенной сетевой среде В этой системе предусмотрено разделение ее функций по различным вычислительным комплексам, объединенным в единую многопротокольную сеть Разделение функций диктуется неоднородностью как данных, так и способов доступа к ним, поскольку эффективность обработки различных типов гипермедиа сильно зависит от того, в какой вычислительной среде идет работа с ними Скажем, стоимость и эффективность работы с графическими данными невысокой сложности (а именно такими являются большинство рисунков в базах данных) оптимальна в среде Windows NT В то же время при работе с потоковыми аудио- и видеоданными большую эффективность показывают вычислительные комплексы, построенные на базе ОС UNIX После разделения функций следующим шагом являлось построение схемы единообразного доступа к данным В настоящее время (и, вероятно, в ближайшие несколько лет) в качестве общепризнанной схемы такого доступа будут Internet- и Intranet-техно тогии, поскольку именно они обладают достаточным запасом расширяемости форматов и слабо зависят от вычислительных платформ Сейчас все реальные вызовы данных, адресованные главному WWW-серверу ВИНИТИ, переадресуются через специальные программные фильтры на несколько серверов мощных вычислительных комплексов Это сделано как для равномерного распределения нагрузки, так и для обеспечения эффективности доступа к различным типам данных
При этом базовые программные средства легко переносятся с ишх-ориентированных ЭВМ на мощные NT-серверы К числу этих средств относятся комплексы СПД и «Сокол», HTTP-серверы и СУБД «MySQL»
Информационные ресурсы БнД ВИНИТИ формируются за счет базы данных ВИНИТИ, одним из тематических фрагментов которой и является создаваемая БД «Математика»
Каждый тематический фрагмент БД обновляется ежемесячно за счет новых поступлений литературы В состав обрабатываемой в ВИНИТИ литературы входят статьи из сериальных изданий (они составляют для различных выпусков от 46% до 91 %) и изданий книжного типа (от 3% до 27%), описания изобретений к авторским свидетельствам (45-90%), заявкам и патентам (от 0% до 36%), депонированные работы (от 0% до 1%), диссертации (от 0,2% до 0,6%) и др Усредненные данные для всей БД ВИНИТИ и БД «Математика» за 2006 г приведены в таблице 2
Таблица 2 Виды документов в БД ВИНИТИ и БД «Математика» (2006 г )
Виды документов
Статьи в сериальных изданиях Статьи в книгах, сборниках Книги, сборники
Диссертационные работы (диссертации, авторефераты)
Депонированные научные работы (монографии, сборники)
Нормативные документы
Отдельные выпуски журналов
Статьи в сборниках депонированных научных работ
Проспекты
Картографические издания Суммарный поток документов
Количество документов в БД ВИНИТИ
490955 61673 11524 12207 1393 382
120 108
12 4
638560
(76 9%) (9 7%) (1 8%) (1 9%) (0 2%) (О 06%)
(0 02%)
Количество документов в БД «Математика»
19418 4192 691 372 129 1
1 1
24805
(78 3%) (16 9%) (2 8%) (1 5%) (0 5%)
По основным языкам отражаемых первоисточников документы в различных выпусках БД распределяются следующим образом английский язык до 80%, русский язык до 70%, немецкий язык до 35%, китайский язык до 16%, французский язык до 5%, японский язык до 2%
Специфика РЖ «Математика» не позволяла создавать БД в используемых на начальном этапе генерации форматах СДФ и МЕКОФ из-за необходимости приведения в рефератах (а иногда и в заглавиях) сложных математических формул, описание которых в указанных форматах не было предусмотрено РЖ «Математика» набирался на линотипах и печатался, соответственно, по технологии высокой печати Только в конце 1994 г набор РЖ «Математика» начал осуществляться на ПК с использованием русифицированного издательского пакета ЬаТеХ, а тиражирование - способом офсетной печати
Кроме того, уже в 2001 г стало ясно, что формирование БД «Математика» должно определяться новыми направлениями развития информационной системы ВИНИТИ (новыми представлениями об информационных ресурсах БД, выходами на различные классификационные системы, широкое использование данных из смежных областей знаний и др ) Таким образом встала задача создания более качественной БД, результаты чего послужат импульсом для качественного изменения других баз данных
Благодаря выполненным в 2001-2003 гг работам по приведению выпусков БД «Математика» в соответствие с требованиями НТП 10 «Представление элементов данных во внутрисистемном формате ВИНИТИ» была обеспечена возможность генерации текущих математических выпусков БД и создана их ретроспектива с 1997 г Тематический фрагмент БД,
соответствующий 93-му отдельному выпуску РЖ «Вычислительные науки», генерировался в формате ISO по общим правилам Тематический фрагмент «Математика», включающий все выпуски сводного тома РЖ «Математика», генерировался в формате ISO с элементами ТеХ
Для обеспечения возможности представления сложносимвольных данных в режиме онлайн потребовалось внесение значительных изменений в комплексы СПД и «Сокол» В результате тематический фрагмент «Математика» стал доступен в режиме он-лайн, позволяя использовать как обычный браузер, так и Tex-Explorer
Автор полагает, что развивающаяся навигационная система дотжна опираться прежде всего на идеологию сочетания научных и технологических элементов различных классификационных систем и схем, применяемых в России и за рубежом
В нашем представлении этому положению удовлетворяют международная система УДК и национальные системы сопряженных с ней рубрикаторов по конкретным областям знаний Работы в этом направлении ведутся ВИНИТИ в рамках государственных и отраслевых программ «Электронная Россия» и «Разработка фундаментальных основ создания научной распределенной информационно-вычислительной среды» Автор принимала участие в соответствующих фрагментах этих исследований совместно с учеными Отделения математических наук РАН (ОМН РАН) и Отделения информационных технологий и вычислительных систем РАН (ОИТВС РАН)
Опираясь на анализ состояния и перспектив развития информационной системы ВИНИТИ, автор предлагает пути решения конкретных задач на примере создания и развития ЬД ВИНИТИ «Математика»
В четвертой главе рассматриваются вопросы создания и развития многофункциональной информационной системы «Математика» в составе политематического БнД ВИНИТИ К основным концептуальным положениям, развиваемым автором в данной работе, относится необходимость создания интегральных информационных полей в области математики и других точных наук
Как отмечалось выше, цель работы заключается в теоретическом обосновании и создании практических механизмов формирования пользователями проблемно-ориентированных интегральных информационных полей, обеспечивающих переход на качественно новый, более высокий уровень информационного сопровождения научных исследований Для этого в диссертационной работе решаются следующие проблемы
- расширение зоны поиска релевантной информации и одновременно с этим существенное сокращение излишней информации, что ведет в итоге к ускорению темпов научных исследований,
- разработка интегральной классификационной системы (рубрикатора), обеспечивающей единообразие толкования научных понятий и терминов и позволяющей вести поиск необходимой информации в отечественных и зарубежных источниках,
- разработка механизмов, обеспечивающих быстрый и точный адресный поиск релевантной информации
Решение поставленных задач в основном определяет подходы к предлагаемой автором системы навигации Перечисленные выше задачи предлагается решить на примере БД «Математика» Конкретные шаги в этом направлении связаны с созданием перспективной архитектуры, развитием классификационной системы и, в первую очередь, рубрикатора по математическим наукам и специальных механизмов для повышения адресности поиска и упорядочения информационных полей Эти поля могут формироваться под конкретные задачи отдельного пользователя, проекта, программы научных исследований и разработок
Следует отметить, что важнейшим информационным ресурсом БД «Математика)) является реферативный журнал (РЖ) «Математика», который в течение многих лет создавался и продолжает создаваться трудами сотен ученых и специалистов, в том числе математиками школ МГУ им MB Ломоносова, МИАН им В А Стеклова, МФТИ, математических
институтов РАН и других. Среди ученых, координировавших работу по изданию РЖ «Математика», нельзя не отметить вклад академиков Никольского С.М., Гамкредидзе Р.В., Журавлева Ю.И., членов-корреспондентов Жнжченко А.Б., Кудрявцева Л,Д. и др., профессоров Голода Е.С., Остиану Н.М., Михалева A.B. и многих других.
Для научного обоснования архитектуры БД «Математика», лежащей в основе создаваемой информационной системы «Математика», автором был выполнен анализ структур соответствующих баз данных в России и за рубежом и имеющихся в распоряжении ВИНИТИ тысяч запросов со стороны пользователей РЖ и указанных баз данных. После проведения необходимых обобщений автором предложена новая архитектура БД «Математика». В основе ее построения лежит создание необходимых сегментов, обладающих вертикальной и горизонтальной зональностью (рис. 5).
Информационная сибтема
политвматического банка В „".„.л ЕИНИТИ
KOMI опеке
Рис. 5. Обобщенная архитектура информационной системы ВИНИТИ «Математика»
Информационное наполнение сегмента «Документальные базы данных» составляет более двух миллионов документов. Этот сегмент пополняется систематически, и объем годового пополнения составляет более 35 тыс. документов. В данном сегменте завершается работа по созданию ретроспективного фонда начиная с 1996 г. Общий суммарный поток публикаций, отраженных в БД «Математика» и БД «Вычислительные науки», характеризуется данными таблицы 3.
Таблица 3 Общий суммарный поток публикаций, отраженный в БД "Математика" и "Вычислительные науки" за период 1997-2006 гг
Наименование БД 1997 г 1998 г 1999 г 2000 г 2001 г 2002 г 2003 г 2004 г 2005 г 2006 г
Математика 22810 22455 21277 22401 21870 23943 26584 27232 25641 24805
Вычислите тьные науки 7992 8151 8443 8475 8005 8402 8726 8723 8580 8427
Суммарный массив в БД "Математика" и "Вычислительные науки 30802 30606 29720 30876 29875 32345 35310 35955 34221 33232
В ВИНИТИ реферируется математическая литература, издающаяся в 64 странах мира на 36 языках Наибольшее количество документов публикуется на английском языке - 59%, около 32% - на русском языке, около 5% - на китайском, 1,7% - на французском, остальные языки суммарно составляют менее 2,5%
Одной из существенных задач разделения информационного потока по содержанию является дальнейшая детализация применяемого рубрикатора и других поисковых признаков Классификационные схемы, загруженные в БД "Математика", представлены Рубрикатором ВИНИТИ и связанным с ним регистром информационных продуктов, Государственным рубрикатором научно-технической информации России - ГРНТИ, таблицами УДК, перечнями номенклатуры научных специальностей ВАК, Приоритетными направлениями фундаментальных исследований РАН, Критическими технологиями для РФ
Все классификационные системы сводятся в единую структуру, которая поддерживается СУБД "MySQL" В 2004 г совокупность классификационных схем была пополнена новым объектом - Mathematics Subject Classification, рубрики которого оснащены ссылками на классификационные схемы, используемые в ВИНИТИ
В этом же году была проведена работа по формализации установления связей между вершинами дерева УДК с другими классификационными схемами Полученные результаты по сопряжению отечественных и зарубежных классификационных систем могут быть использованы для работы пользователей с отечественными и зарубежными информационными центрами
Одяим из существенных вопросов сопоставления различных классификационных схем является неодинаковая глубина их разработки Так, если ГРНТИ имеет 3 уровня подчинения, рубрикаторы ВИНИТИ - 4-6, а рубрикатор "Математика" - 5-7 уровней, то многие современные классификационные схемы развития фундаментальных и точных наук требуют глубину разработки - 8-10 уровней Ниже приводится фрагмент установления связей между некоторыми разделами рубрикатора ВИНИТИ "Математика" (РБШ) и Mathematics Subject Classification (MSC).
1 Рубрики РБШ и MSC тождественны (271+33 Интегральные уравнения - 45ХХ Intégral équations)
2 Рубрики РБШ и MSC почти тождественны (непустое глубокое пересечение, рубрики пересекаются, но ни одна из них не содержит другую) (27131 15 Общая теория дифференциальных уравнений с частными производными - 35Ахх + 35Вхх + 35Схх + 35Dxx General theory + Qualitative properties of solutions + représentation of solutions + Generalized solutions of partial differential équations)
3 По существу, рубрика РБШ шире рубрики MSC (271 39 Функциональный анализ - 46ХХ + 47ХХ + 43ХХ Functional analysis + Operator theory + Abstract harmonic analysis)
4 Рубрика РБШ шире рубрики MSC, рубрика MSC более детальна (271 37.17 15 Общая теория систем управления и управляемость (математическая теория) - 35Ахх + 93Вхх + 93Схх + 93Dxx General + Controllability, observability, and system structure + Control systems, guided systems + Stability
В таблице 4 приводится фрагмент интегрального рубрикатора "Математика" (раздел "Линейная алгебра"), объединяющего классификационные системы УДК, ГРНТИ, ВИНИТИ, HBAKnMSC
Таблица 4 Фрагмент интегрального рубрикатора "Математика" (раздел "Линейная алгебра")
Код Код и Рубриха- Код и Приоритет- Английс- Код рубрики Название
номенкла- название ционные название ное кий перевод MSC рубрики
туры специ- рубрики шифры и рубрики направление названия MSC
альностей ГРНТИ название универ- фундамента рубрики
научных рубрики сальной льных рубрикатора
работников (Рубри- десятичной исследова- ВИНИТИ
(ВАК катор классифи- ний РАН (РВИНИТИ)
России) ВИНИТИ) кации (УДК) (ПНФИ РАН)
01 01 Об 27 17 29 271 17 249 512 64 Алгебра Linear 15-xx Linear and
Матема- Линейная Линейная Линейная algebra multilinear
тическая алгебра алгебра алгебра algebra,
логика, matrix theory
алгебра и
теория чисел
010106 27 17 29 271 17 29 01 512 64 0 Алгебра General 15-00, General
Матема- Линейная Общие Общие problems 15-01, reference
тическая алгебра вопрсы вопросы 15-02, works,
логика, 15-03, Instructional
алгебра и 15-04, exposition,
теория чисел 15-06 Research exposition, Historical, Explicit machine computation and programs, Proceedings, conferences, collections, ets
01 01 Об 27 17 29 271 17.29 05 512 64- Алгебра Monographs 15-02 Research
Матема- Линейная Моногра- 028 11 exposition
тическая алгебра фии Моногра- (mono-
логика, фии graphs,
алгебра и survey
теория чисел ; articles)
01 01 06 Математическая логика, алгебра и теория чисел 27 1729 Линейная алгебра 271 17 29 01 09 Вопросы истории линейной алгебры 512 64 94 Вопросы истории линейной алгебры Алгебра Historical questions 15-03 01-xx Historical History and biography
01 01 06 Математическая логика, алгебра и теория чисел 27 17 29 Линейная алгебра 271 17.29 01 И Обзоры 512 64(048 8) Обзоры Алгебра Survey Articles 15-02 Research exposition (monographs, survey articles)
01 01 06 Математическая логика, алгебра и теория чисел 271729 Линейная алгебра 271 1729 01 13 Конференции по линейной алгебре 512 64 0613 Конференции по линейной алгебре Алгебра Conferences 15-06 Proceedings, conferences, collections, ets
010106 Математическая логика, алгебра и теория чисет 27 17 29 Линейная алгебра 271 17 29 0133 Учебная и методическая литература по линейной алгебре 512 64(07) Учебная и методическая литература по линейной алгебре Алгебра Textbooks, tutorial papers 15-01 Instructional exposition (textbooks, tutorial papers, etc)
01 01 06 Математическая логика, алгебра и теория чисел 27 17.29 Линейная алгебра 271 17.29 17 Векторные (линейные пространства) 512 642 Векторные (линейные пространства) Алгебра Vector linear spaces 15A03 Vector spaces, linear dependence, rank
01 01 06 Математическая логика, алгебра и теория чисел 27 1729 Линейная алгебра 271 ¡7 29 17 17 Векторные прстраиства над телами 512 642.2 Векторные прстранства над телами Алгебра Vector spaces over skew fields 15A03 Yector spaces, linear dependence, rank
01 01 06 Математическая логика, алгебра и теория чисел 27 17 29 Линейная алгебра 271 17.29 19 Теория матриц 512 643 Теория матриц Алгебра Theoiy of matrices 15-xx Linear and multilinear algebra, matrix theoiy
010106 Математическая логика, алгебра и теория чисел 27 17 29 Линейная алгебра 271 17 29 19 02 Общие проблемы теории матриц 512 643 1 Общие проблемы теории матриц Алгебра General problems of matrices theory 15-xx Linear and multilinear algebra, matrix theoiy
Современная версия рубрикатора БД "Математика" подготовлена под руководством автора в 2005-2007 гт Полный текст некоторых его разделов приводится в приложении к основному тексту работы
Получение пользователем большого объема информации требует приведения полученных данных в сопоставимый вид для формирования интегрального проблемно-ориентированного информационного поля Решить эту часть проблемы автор предлагает методом комплексного использования систематического, лингвистического и методического обеспечения поисковых систем на примере БД "Математика"
Современная система указателей в БД "Математика" включает авторский, библиографический, предметный и систематический указатели, указатель материалов научных форумов, трудов научных учреждений, персоналий, сериальных изданий Эта система указателей ежегодно развивается при непосредственном участии автора. Каждая из перечисленных систем имеет свою методологию формирования и развития В целом основа их построения базируется на многолетнем опыте издания РЖ и формирования в ВИНИТИ политематического информационного фонда Важнейшим методическим моментом является определение взаимосвязей различных указателей как между собой, так и с рубрикатором ВИНИТИ и УДК В большинстве случаев это делается с помощью таблиц соответствий кодов, индексов и ссылок Основные задачи разработки системы указателей связаны с необходимостью их соответствия постоянному развитию математической науки и появлению новых направлений
Особое значение приобретает использование системы указателей при истолковании запросов пользователей и поиске соответствующих ответов в системе информационных ресурсов Для этих целей в информационной системе ВИНИТИ и, в частности, информационной системе "Математика", создан программно-технологический комплекс, который определяет последовательность включения в поиск системы рубрикаций и указателей Например, для соответствия разделов математических наук рубрикаторов ГРНТИ, ВИНИТИ и РФФИ могут возникать варианты полное соответствие, частичный охват, включение, пересечение, изъятие, ограничение, приблизительное совпадение, сильное рассогласование, диапазон, сокращения, объединение, лакуны Для каждого из указанных вариантов разработан порядок действий, определяющий вид дополнительной информации и ее источник Для целей поиска этой информации существуют сопоставительные таблицы и дополнительные поисковые возможности системы указателей В итоге поиск информации в БД "Математика" начинается с выбора одного из фрагментов и составления поискового предписания, для которых установлены определенные правила, после чего дается команда ввода. Специфика поиска заключается в том, что, как правило, терминология запроса не имеет узконаправленного характера и включает много междисциплинарных терминов, а полный ответ на запрос пользователя может потребовать поиска информации в базах данных других отраслей знаний В целом такая навигационная система начала действовать и продолжает развиваться в информационной системе "Математика"
Не останавливаясь на особенностях создания и развития системы перечисленных указателей, отметим существование в БД "Математика" системы кумулятивных указателей (авторско-библиографяческий, систематическо-предметный) и указателя ошибочных построений (неточности, допущенные в ранее опубликованных работах) При этом виды исправлений маркируются специальными терминами
Сегменты "Обслуживающие базы данных" и "Справочные базы данных" находятся в стадии разработки определены источники поступления данных в эти сегменты и начата загрузка соответствующей информации
На основе проведенных автором исследований и, в частности, предложенных путей развития навигационной системы стало возможным реализовать прямое сопоставление содержательной части математических рубрикаторов (классификационных "деревьев") ВИНИТИ и "Mathematics Subject Classification" На рис 6 представлена структура
классификационного «дерева» MSC, на рис. 7 - экранная форма для редактирования связей вершин в классификационном «дереве» MSC, на рис. 8 - экранная форма для установления связи рубрики MSC с рубриками классификационной схемы ВИНИТИ «Математика».
Mathematics Subject Classification 2000 - Rubi
00 — General
01 — History and biography
g..___03 ~ Mathematical logic and foundations
¡k_ 03.A - !!i
j' a_____ 03..A05 — Philosophical and critical
gl....... 03 .B — General logic
i........... 03.B.05 — Classical prepositional logic
|.......... 03.B.10 — Classical first-order logic
[....... 03.B.15 --Higher-order logic and type theory
— 03.B. 20 — Subsystems of classical logic (including intuitiomstic logic)
|_______03.B.22 --Abstract deductive systems
j_io 03.Bi25—Decidability of theories and sets of sentences
033:30 — Foundations of classical theories (including reverse mathematics) 033.35.-- Mechanization of proofs and logical operations L.hO 03.B.40— Combinatoiy logic anc lamb da-calculus
c_______03.B.42 —Logic ofknowledge andbelief
03.B.44 - Temporal logic
li______033,45 - Modal logic
! 03.B.45.-al -knowledge andbeEef
- j 03'.B.4'5.-a2 — temporal logic
:' f Lin 03.345.-a3 — provability logic
J______ 03.B.47— Substructural logics (including relevance, entailment, linear logic, Lambek calculus,
•..«••5 03.B.4S — Probability and inductive logic ■ —.....^--------a3JR..5Q—..Va«g.ji»)»»<<Jonif ... . .........-........................................................................„-.-
Рис. 6 Структура классификационного «дерева» MSC
iccidability of theories and sets of sentences
.(See also 11TJ05, 12L05, 20F10J
М.И.ОЗ ¡Decidability
12.L.05 (Реа^а'о&у____
20.F. jp jWord problems, other decision problems, connections with. logic'
ЙШ2Х.05 Decidability ¡см. также 8
IJO.F.IO Word problems, other decision problems, connections with loj !см. также 1
Hll.TJ.05 Decidability 1см. также li
-........г, m ....., (п ...... - 4
--—;........с Г, , . ■ ,
Рис. 7. Экранная форма для редактирования связей вершин в «дереве» МБС
I
Рис. 8. Экранная форма для установления связи рубрики MSC с рубриками рубрикатора ВИНИТИ.
В итоге проведенных работ к настоящему времени создан действующий БнД ВИНИТИ «Математика», в составе которого имеется ресурсный, навигационный и программно-технологический комплексы. Ресурсный комплекс содержит документальные и справочные базы данных. Документальные базы данных представлены следующей совокупностью тематических фрагментов: реферативным, цоляотекстовым «Итоги науки и техники. Серия «Математика»; библиографическим «Депонированные рукописи»; справочные базы данных -«Персоналии»; «Научные форумы»; «Информационные центры» и др.
Навигационный комплекс дополнен интегральным рубрикатором «Математика», классификационными схемами РФФИ (НФИ РАН), номенклатурой научных специальностей ВАК (НВАК), MSC, впервые разработанными элементами лингвистического обеспечения и новыми версиями различных указателей.
Программно-технологический комплекс в настоящее время опирается на взаимодействие с действующими СПД (рис 3) и ИПС «Сокол» (рис 4 )
Автору представляется необходимым отметить, что хотя некоторые фрагменты информационной системы «Математика» продолжают развиваться, архитектура и методология ее создания достаточно полно обоснованы, а сама БД «Математика», являющаяся ядерной частью указанной системы, уже функционирует
В пятой главе излагаются основные направления и перспективы дальнейшего развития ИС «Математика» в составе политематического БнД ВИНИТИ Автор отдает себе отчет в том, что выполненный анализ использования научных электронных ресурсов является лишь составной частью дальнейших исследований Последующие разработки в представлении автора рекомендуется проводить в следующих направлениях
А В области классификационных и навигационных систем по математическим и другим точным наукам
- дальнейшее развитие идеологии сопряжения разноуровневых классификационных систем,
- дальнейшее развитие элементов навигационных систем (тезаурусы, многоязычные терминологические словари, построение разветвленной системы указателей),
Б В области развития политематического банка данных ВИНИТИ, имея в виду прямую связь последнего с ИС "Математика"
разработка предложений по реструктуризации БнД ВИНИТИ (особенно в части взаимодействия тематических фрагментов из разных научных областей),
- модернизация ИПС "Сокол",
- создание унифицированного интерфейса пользователя с мощным динамическим контентом,
- развитие сетевых средств доступа и взаимодействия с другими информационными ресурсами,
- перевод наиболее используемой части научного архива и фондов в электронную форму,
- разработка новых форм обслуживания и создание новых информационных продуктов
В В области развития ИС "Математика"
- развитие представлений о систематическом пополнении ресурсного комплекса,
- разработка новой версии ИПС "Сокол" с учетом необходимых дополнений в навигационном и программно-технологическом комплексах,
- обоснование поэтапного создания единой информационной сети по математическим и другим точным наукам, в первую очередь для ученых и специалистов России
Эта работа требует совместных усилий ученых Отделений математических наук и информационных технологий и вычислительных систем РАН
Кроме того автор полагает необходимым приступить к научным разработкам второго этапа создания интегрального информационного поля Под вторым этапом таких исследований понимается приведение в сопоставимый вид условий и факторов, влияющих на моделирование возможных результатов решения конкретных аналитических и прикладных задач, стоящих перед пользователями
Автор считает также важным привести фрагменты действующей БД «Математика», представленной на современном сайте ВИНИТИ (рис 9-10)
• ш
ьми^ с до«, щвл ВИНИТИ: И
□ Документ 3.
Ш'оОм>Н«1д|
ваш! ПН01И Пйиригму!* |1>Ч*Аячммгя пууооа Лм ОТ Кя. амшв- ют* Па Люпити<*ояая о
Ру4рятш27 17.3Х 271.1Г.Х).г1 10.20
огоир в» «*•«» ав^Уввоп и» «Ню»«« о»»г сц/<«ыи«п н
/. аапоа^ ДОМмЯс 1-1
гртпяы ЛИ КО. ТЛв 0гоор о' скЫ» ргвввгИпд ЮПЬотоолиирМотя« о< ><■ вяи.Ч"вг1аг* «*пр<«к Ч* ■
Грутв Л». П»оо
о ТО0ОЫ- 5виси*» шпё иНяпогрЫоп дсоор о» • с!»» в»
ГувршаггГ. 1Т. 19. V117.1t.23 423
«а *
Рис 9. Фрагмент результатов тематического запроса («группа Ли») в БД ВИНИТИ «Математика»
У"; Л
Ж
НаОдшкгЗ дек. ■ БВ ВИНИТИ: Мгаютям 21Жв-2&07
я оператора мв ПТ""* Га*миВарга. ТНв к«« •чивйол Ьг Й»« Не/тН« орвсаюг вп Ям И»«лпЬв»в дгоиц
27t.39.2131. ZT1.Vt.23.l7.21
ОД«»«!!
логооатбоки. Пш Н«а1 е<)и«11ол в1»«" в Чих» оГ 1вМ1а1 ¿«3 иаЬ)вс1»«М
Рис. 10. Фрагмент результатов тематического запроса («уравнение теплопроводности») в БД ВИНИТИ «Математика»
Заключение
Как уже отмечалось, цель работы состояла в обосновании и создании интегрального проблемно-ориентированного информационного поля и системы взаимодействия пользователей с этим полем на примере математических и других точных наук Как показано в работе, создание такого поля позволяет с одной стороны существенно уменьшить наличие «информационного шума» в ответах на запросы пользователей и, с другой стороны, значительно расширить зону адресного поиска релевантной информации
При создание такого поля для оценки систематики информационных ресурсов и возможностей их сопряжения необходимо было проанализировать современные возможности информационной поддержки научных исследований на примере одного из крупнейших в мире банков данных по научно-технической информации - политематического банка данных ВИНИТИ (число обращений к нему пользователей составляет сотни тысяч запросов в год) Этот анализ был необходим в составе этого БнД так предстояло создать новый тематический фрагмент - БД ВИНИТИ «Математика» Построение такого фрагмента предполагало использование уже достигнутых результатов и разработку на этой основе концепции создания и перспектив развития современной системы информационного обеспечения научных исследований в области математических наук
В итоге, опираясь на результаты проведенного автором научного анализа и собственные научные разработки в указанном направлении, автор приходит к следующим выводам
- современный этап развития научной деятельности в области математических и других точных наук выдвигает ряд новых проблем при сборе и обработке научной информации, полученной из различных по архитектуре и содержанию баз и
банков данных,
- для повышения эффективности информационного обеспечения научных исследований автором предложена идеология формирования и организационно-функциональная структура интегрального проблемно-ориентированного информационного поля, так как применяемые классификационные системы и схемы, структурирующие информационные ресурсы в различных базах и банках данных, имеют разную детальность и логику построения,
- обоснована возможность общего концептуального подхода к сопряжению классификационных систем и схем для обеспечения сквозной навигации в существующих информационных ресурсах,
- предложено в качестве основы для решения задачи сопряжения классификационных систем использовать «классификационные деревья» (системы ориентированных графов),
- обосновано положение о том, что для формирования интегрального проблемно-ориентированного информационного поля пользователь должен ориентироваться на базовое (центральное) классификационное дерево, использование которого и позволяет гармонизировать гетерогенную информацию Показано, что в качестве такого «дерева» на информационном пространстве России может выступать конструкция, в вершине которой находится УДК (международный уровень), а ниже - национальные классификации по отраслям знаний и предметным областям (ГРНТИ, РВИНИТИ, НВАК, РФФИ и др) Базовое классификационное дерево и сопровождающие его поисковые механизмы позволяют экспортировать и импортировать информационные файлы в соответствующие интегральные информационные поля,
- в составе РВИНИТИ разработана принципиально новая многоуровневая классификационная схема в области математических наук (рубрикатор), включающая в качестве лингвистической основы предложенную автором новую систему дескрипторного обеспечения и позволяющая вести сквозной поиск научной информации как в российских, так и в зарубежных банках и базах данных,
- разработана и во многом реализована концепция создания многоцелевой системы информационного обеспечения математических наук в составе политематического банка данных ВИНИТИ, для которой обоснована структура базы данных «Математика», развиты представления о механизмах и процедурах последовательного включения в поиск таких инструментов, как различного вида указатели, рубрикаторы, терминологические словари, тезаурусы, метаданные и др,
- развиты представления об интегральной системе информационного обеспечения научных исследований в области математических наук и конкретизированы направления дальнейших исследований, в том числе для реализации прямого диалога пользователей с указанной системой,
- впервые разработанная БД ВИНИТИ «Математика» в составе политемати-ческого БнД ВИНИТИ содержит в своей концептуальной основе рекомендации по формированию единой для институтов РАН, библиотек и других информационных и образовательных центров системы информационной поддержки соответствующих научных исследований,
- выполненные автором разработки привели к изменениям и дополнениям в области систематики математических наук на международном и отечественном уровнях (УДК, рубрикатор ВИНИТИ «Математика»),
- результаты проведенных исследований по систематике знаний нашли отражение в изданном учебном пособии [15, тема 3 «Иерархические классификации и системы навигации»]
В представлении автора предложенная методология создания интегральных проблемно-ориентированных информационных полей может быть использована для решения аналогичных задач в других областях знаний
Основное содержание диссертационной работы изложено в следующих публикациях
1 Никольская И Ю, Трофимов В В Геометрическое оптимальное управление в
экономических системах - «Итоги науки и техники Серия «Современная математика и ее приложения Тематические обзоры», т 76, ВИНИТИ, Москва, 2002 г., с 263-272 English translation ш «Journal of Mathematical Sciences», vol 109, No 2, 2002, Kluwer Academic Consultants Bureau, p 1502-1507
2 Асрибеков В E, Лихтман E П , Никольская И Ю, Смирнов А И Информационная
ситуация в РФ в области физико-математических наук в 2001-2002 годах Материалы 6-ой Международной конференции НТИ-2002 «Информационное общество Интеллектуальная обработка информации Информационные технологии», ВИНИТИ, Москва, 2002 г, с 43-44
3 Асрибеков В Е , Лихтман Е П, Никольская И Ю , Смирнов А И Проект единой
электронной информационной службы по физико-математическим наукам (ЭИС-ФМ), ВИНИТИ Материалы 6-ой Международной конференции НТИ-2002 «Информационное общество Интеллектуальная обработка информации Информационные технологии», ВИНИТИ, Москва, 2002 г, с 44
4 Никольская ИЮ Информационное обеспечение математических исследований
Научно-техническая информация, сер 2 «Информационные процессы и системы», 2004 г,Ш1,стр 6-11
5 Nikolskaya I Yu. «Information Support of Scientific Studies m the Field of Fundamental and
Applied Mathematics», Proc of International CODATA Conference m Berlin 5-12 November, 2004 Workshop of CODATA/EDNES TO «Virtual Laboratones m Earth and Environmental Sciences», electronic publication www ednes org/telesol/events/codata.
6 Ефремеикова В M , Никольская И Ю , Пробст M А Указатели в информационной
системе РЖ ВИНИТИ «Математика», НТИ, сер 1 «Организация и методика
информационной работы», 2005, № 2, с 33-37
7 Никольская И Ю Необходимость разработки системного рубрикатора для обеспечения
математических исследований Сборник трудов Конференции «Информационное обеспечение фундаментальных и прикладных наук», М ВИНИТИ, 2005 г , с 78-79
8 Никольская И Ю, Ефременкова В М Три вида предметных указателей к разделу УДК
по математике НТИ, сер 1 «Организация и методика информационной работа», 2006, № 10, с 25-28
9 Никольская И Ю Проблемы создания и перспективы развития информационной
системы «Математика» в составе информационной системы ВИНИТИ НТИ, сер 2, «Информационные процессы и системы», 2006, № 11, с 21-23
10 Арский Ю М, Леонтьева Т М, Никольская И Ю, Шогин А Н, Банк данных ВИНИТИ Состояние и перспективы развития М ВИНИТИ, 2006, 242 с
11 Никольская И Ю Принципы и методы создания базы данных «Математика)) в составе информационной системы ВИНИТИ М ВИНИТИ РАН, 2006,195 с
12 Никольская И Ю, Шамаев В Г Электронный реферативный журнал ВИНИТИ по математическим наукам Деп ВИНИТИ, № 166-В2006,16 02 2006 г, 83 с
13 Никольская И Ю, Ефременкова В М Статистические характеристики Бд/РЖ ВИНИТИ «Математика», ч I «История создания и развития РЖ/БД по математике в ВИНИТИ Анализ наполнения рубрик рубрикатора РЖ/БД по математике 1997-2005 гг Деп ВИНИТИ, № 1155-И2006, 18 09 2006 г
14 Асрибеков В Е, Никольская И Ю и др Концептуальное обоснование информационной он-лайн службы по физико-математическим наукам и информатике как альтернативной теоретической базы для разработки концепции ОЫО-интеграции научной распределенной информационно-вычислительной среды для Интернет-ресурсов НТИ, сер 1 «Организация и методика информационной работы», 2007 г, № 7, с 21-27
15 ЮМ Арский, ИН Домнина, ВМ Ефременкова, ЛИ Маевская, В А Маркусова, И Ю Никольская и др Геоинформатика Геоэкономика (под ред Ю М Арского и В И Старостина) Учебно-методическое пособие для магистрантов и аспирантов, ВИНИТИ РАН, Москва, 2007, 368 с
16 Никольская ИЮ Обоснование и разработка интегральной классификационной системы ВИНИТИ по математическим наукам, Материалы 7-ой Международной конференции «Информационное общество Интеллектуальная обработка информации Информационные технологии», Москва, ВИНИТИ, 2007 г, с 223-229
17 Никольская ИЮ и др Государственный классификатор НТИ Том 1 Рубрикатор научно-технической информации (ГРНТИ), 6-ое издание ВИНИТИ, Москва, 2007, с 71-75
18 Никольская ИЮ и др Государственный классификатор НТИ Том 2 Алфавитно-предметный указатель ГРНТИ, 6-ое издание ВИНИТИ, Москва, 2007,210 с
19 Никольская ИЮ Концепция создания интегрального проблемно-ориентированного рубрикатора по математическим и другим точным наукам (принята к публикации в научном информационном сборнике «Транспорт (наука, техника, управление), № 1, 2008 г )
20 Никольская И Ю Создание многоаспектного информационного фонда по математическим и другим точным наукам в составе информационной системы ВИНИТИ (принята к публикации в научном информационном сборнике «Транспорт (наука, техника, управление), № 3, 2008 г)
Подписано к печати 06 05 2008 г.
Тираж 100 экз Заказ № 67 Объем 2,3 уч -изд л
ОМР ВИНИТИ РАН 125190, г Москва, ул. Усиевича, д 20
Оглавление автор диссертации — доктора технических наук Никольская, Инга Юрьевна
Введение.
Глава 1. Анализ современного состояния'информационного обеспечения научных исследований на основе электронных ресурсов в области фундаментальных и точных наук.
1.1. Характеристика современных зарубежных электронных информационных научных ресурсов.
1.2. Характеристика современных российских национальных электронных информационных научных ресурсов.
1.3. Характеристика современных национальных электронных информационных научных ресурсов' стран СНГ и ближнего зарубежья.
Глава 2. Основы формирования классификационных систем по точным наукам.
2.1. О проблеме классификации знаний в целом.
2.2. Основные виды информационных ресурсов.
2.3. Тезаурусы как средство классификации знаний.
2.4. Международные классификации знаний.
2.5. Классификации баз и банков научных данных.
2.6. Национальные российские классификации информации.
2.7. Классификационная система ВИНИТИ.
2.8. Классификация системы образования.
2.9. К вопросу об истории классификации математических наук.
2.10. Концептуальные основы процессов сопряжения классификационных систем.
Глава 3. Основы построения и функционирования информационной системы ВИНИТИ.
3.1. Основные характеристики информационной системы ВИНИТИ.
3.2. Элементы данных, загружаемых в БнД ВИНИТИ, преобразование форматов и контроль за наполнением БнД.
3.3. Информационный поиск в БД и БнД ВИНИТИ.
3.4. Основные направления развития БнД ВИНИТИ.
Глава 4. Основы создания интегральной системы информационного обеспечения научных исследований по математическим наукам.
4.1. История развития математики и систем ее классификации.
4.2. Реферативный журнал "Математика" как ресурсная основа создания БД "Математика".
4.3. Основы создания информационной системы и БД "Математика".
4.3.1. Разработка архитектуры информационной системы и БД "Математика".
4.3.2.Электронные информационные ресурсы в БД"Математика"
4.4. Основные результаты исследований, выполненных в Главе 4.
Введение 2008 год, диссертация по документальной информации, Никольская, Инга Юрьевна
Актуальность исследования. Информационная наука, практическое формирование информационных ресурсов и сетей прошли большой путь развития. На этом пути имеются крупные и очевидные достижения как в систематизации информационных ресурсов [30, 39, 62, 97, 111, 114-117, 135, 136, 138, 146, 207, 211, 250], так и в создании глобальных и локальных информационных сетей- [5, 19, 65, 101, 106, 123, 137, 152, 182, 189, 191, 217, 218, 247]. На сегодняшний день теоретически обеспечена возможность организации всемирного каталога публикаций через объединение каталогов, баз и банков данных крупнейших национальных научных и научно-технических библиотек и информационных центров практически всех развитых стран, включая Россию, создана всемирная сеть Интернет, обеспечивающая в реальном масштабе времени доступ к информационным ресурсам самого разного объема и содержания [56, 186, 195, 248, 275, 276, 279, 308, 310]. Таким образом, достигнуты очевидные успехи в вопросах накопления и принципиального доступа к источникам информации. Однако применение поисковых механизмов в сети Интернет ввиду некоторой анархичности и недостаточной структуризации предоставляемой информации приводит к тому, что, как правило, значительная часть полученной информации является излишней, а собранная по конкретному запросу информация оказывается неполной. В вопросах получения релевантной информации остаются нерешенными многие задачи, поскольку созданная информационная среда имеет гетерогенный (неоднородный) характер, а последующая обработка такой информации требует огромных временных, физических, интеллектуальных и, как правило, финансовых затрат. К этому следует добавить, что крайне важной, но нерешенной задачей остается ведение прямого диалога пользователя с различными по архитектуре и содержанию банками и базами данных. Здесь заметная роль в научных разработках принадлежит ученым Российской академии наук (РАН) и, в частности, Всероссийского института научной и технической информации (ВИНИТИ РАН).
Лавинообразное нарастание отечественных и зарубежных информационных ресурсов, а также необходимость повышения эффективности их использования ставят новые вопросы ' в методологии сбора, переработки, хранения и предоставления информации пользователям, требуют коренного улучшения информационного обслуживания ученых и специалистов.
В самом общем виде решение указанных вопросов предполагает ясное представление о современных центрах формирования соответствующих информационных потоков, возможность целенаправленного обращения пользователей к необходимым информационным ресурсам, обеспечение возможности пользователям строить информационные модели в гомогенной (однородной) среде.
Современным проблемам информатики и информационному сопровождению научных исследований посвящено значительное количество работ: труды Арского Ю.М. [2-9], Артамонова Г.Т. [10-14], Белоногова Г.Г. [19-27] , Блюменау Д.И. [33-35], Воробьева Г.Т. [41], Гиляревского P.C. [24-26, 45-53, 149-154], Глушкова В.М. [54], Горьковой В.И. [57-62], Доброва Г.М. [77, 78, 235], Емельянова C.B. [82], Жижченко А.Б. [18, 85], Журавлева Ю.И. [86-92], КаленоваН.Е. [107-110], Лопухина М.М. [125], Малова B.C. [130-132], Марчука Г.И. [133, 134], Маршаковой И.В. [135-138], Махотенко Ю.А. [140-144], Михайлова А.И. [148-154], Полтева A.A. [189, 190], Поспелова Г.С. [192, 193], Сифорова В .И. [206-209], Соколова И.А. [217, 218], Стогния А.А.[212-216], Сумарокова Л.Н. [220, 221], Тараканова К.В. [224-226], Черного А.И. [84, 149-152, 250-255], Четвертакова М.М. [256], Финна В.К. [242-246], Шемакина Ю.И. [259-261], Шрейдера Ю.А. [1,267-271] и др.
Электронные публикации в мировой научной литературе рассеяны по многочисленным изданиям и публикуются на разных языках. Поэтому автоматизированный поиск релевантных публикаций в электронных изданиях является трудоемкой процедурой и к тому же характеризуется невысокой точностью. Это во многом объясняется тем, что, в частности, в глобальной сети Интернет применяемая для поисков система дескрипторов носит достаточно общий характер. Поэтому для процесса научных исследований крайне важно разработать и применять более точный поисковый аппарат. Очевидно, что это очень многоаспектная проблема, которая требует объединения усилий широкого круга ученых. Вместе с тем решение такой крупной проблемы, в нашем представлении, может опираться на локальные разработки по конкретным видам наук.
Выполненный автором анализ публикаций на указанную тему позволяет сделать выводы о том, что [160,163, 165]: а) важнейшим направлением развития качественного и оперативного информационного сопровождения является совершенствование классификации знаний, обеспечивающей единообразное понимание определений, терминов, понятий, категорий в различных отраслях науки как в России, так и в зарубежных странах. При этом особую роль играет дальнейшее развитие классификации знаний в смысле их детализации и охвата новых областей и направлений в науке; б) при наличии указанных классификационных систем становится необходимым развитие и практическое внедрение соответствующих навигационных средств, позволяющих пользователю осуществлять целенаправленный и масштабный поиск информации в отечественных и зарубежных источниках; в) поэтапное решение первых двух задач должно сопровождаться разработкой и развитием представлений о рубрикаторах по математическим и другим точным наукам, совершенствованием систем указателей, терминологических словарей, тезаурусов и др.
Автор представляет, что решение указанных задач, как и собственно переход на качественно новый уровень информационного обслуживания ученых, является сложным и многоэтапным процессом, в котором участвуют многие научные коллективы, отдельные ученые и специалисты. Очевидно, что успехи в этом направлении будут определяться трудами различных коллективов по конкретным сферам знаний. Вместе с тем, по мнению автора, современный этап исследований в указанном направлении требует в первую очередь разработки концептуальных понятий, определяющих возможность сопряжения информационных ресурсов из различных источников и формирования у пользователей интегральных проблемно-ориентированных информационных полей. В представлении автора последующий этап исследований должен определить возможности сопряжения содержательной части информационных ресурсов. Под этим понимается гармонизация условий и факторов, на основе которых получены те или иные решения. В итоге речь идет о том, что исследователь может исключить существенные затраты времени на предварительный анализ проблемно-ориентированного информационного массива.
На первом этапе речь идет о том, чтобы дать возможность пользователю собрать необходимую ему информацию из различных отечественных и зарубежных источников, структурированных различным образом, и привести ее в сопоставимый вид путем гармонизации структурирующих элементов этих источников. Одновременно с этим на первом этапе необходимо применять строго ориентированные процедуры поиска информации, которые позволяли бы осуществлять выборки из информационных массивов, строго соответствующих запросу пользователей. При этом должна исключаться излишняя информация, которая в настоящее время составляет существенную часть от общего объема информационной выборки. Тем самым определяется возможность создания у пользователей интегральных проблемно-ориентированных информационных полей и последующего обмена между пользователями содержательной частью созданных информационных полей.
Последующий этап исследований заключается, по мнению автора, в том, чтобы в рамках интегрального проблемно-ориентированного информационного поля добиться максимально возможной гармонизации условий и факторов, на которых базируются решения задач, полученных разными авторами при решении тематически подобных проблем. Достаточно очевидно, что в этом направлении уже проделана большая работа многими исследователями при построении самых различных информационных моделей, прогнозирующих те или иные решения научных задач. В' итоге речь идет о том, чтобы существенно повысить эффективность научно-исследовательской работы пользователей при аналитической обработке информационных массивов, используемых ими для решения аналогичных по тематике задач.
Цель диссертационной работы состоит в разработке основ формирования интегрального проблемно-ориентированного информационного поля и эффективной системы взаимодействия пользователя с этим полем на примере математических и других точных (смежных) наук (физики, механики, астрономии, информатики и др.) в рамках создаваемой интегральной информационной системы «Математика» в банке данных ВИНИТИ.
По мнению автора, достижение указанной цели требует в качестве первого шага рассмотрения существующих источников генерации тематических информационных ресурсов. Вторым шагом, по-видимому, должен являться сравнительный анализ методов систематики этих ресурсов в различных мировых центрах генерации. В результате становится очевидной необходимость сопряжения соответствующих тематических фрагментов из различных генерирующих информацию структур. Завершающим шагом в этой цепи должно стать создание эффективной системы информационной навигации.
В настоящее время соответствующие исследования ведутся в ряде крупных отечественных и зарубежных научных центров, среди которых существенную роль играют научные исследования и практические разработки ВИНИТИ РАН. На сегодняшний день в ВИНИТИ создана и продолжает развиваться одна из крупнейших информационных систем мира, которая включает уникальный по составу и объему политематический банк данных (БнД), архивы, представленные как в традиционной печатной форме, так и в электронном виде; развивается специализированный портал, который призван обеспечить многоцелевую информационную навигацию в электронных ресурсах по различным отраслям науки и техники, между регионами России и зарубежными странами и эффективное взаимодействие с международной сетью Интернет.
Если опираться на сказанное, то становится очевидной необходимость дальнейшего развития информационной системы ВИНИТИ в указанных направлениях. В этом смысле встраивание в информационную систему ВИНИТИ новых баз данных обязывает учитывать как накопленный опыт, так и новые предложения по решению указанных выше задач. В этой ситуации на первый план выдвигаются проблемы принципов взаимосвязи разнородных баз и банков данных и создание проблемно-ориентированных интегральных информационных полей на основе взаимодействия пользователей с информационными массивами.
Автор понимает термин "интегральное проблемно-ориентированное информационное поле" как консолидированную совокупность электронных данных, полученных пользователем из гетерогенных (разнородных) отечественных и зарубежных информационных источников и адаптированных к одной из выбранных пользователем классификационной системе. Тем самым обеспечивается возможность дальнейших поисков необходимой информации из гетерогенных источников и приведение этой информации к виду, пригодному для решения стоящих перед пользователем задач.
В представлении автора решение указанных проблем, в значительной мере, может быть продемонстрировано созданием в составе политематического банка данных ВИНИТИ базы данных «Математика». Следует отметить, что последующее развитие базы данных «Математика» в соответствии с предлагаемой концепцией и приводит к формированию информационной системы «Математика».
Настоящая работа посвящена созданию нового для информационной системы ВИНИТИ представления об интегральных проблемно-ориентированных информационных полях для комплекса математических и других точных (смежных) наук. Построение таких полей требует создания качественно новой информационной системы «Математика», центральным ядром которой является впервые созданная база данных по математике, и обеспечения взаимодействия создаваемой системы с комплексами как смежных наук, так и с другими базами и банками данных. В итоге речь идет о возможности создавать для индивидуальных и коллективных пользователей (НИИ, ВУЗов, информационных центров, библиотек и др.) интегральные проблемно-ориентированные информационные поля для решения широкого круга научно-исследовательских задач, а практически - о переходе на качественно новый уровень информационной поддержки научных исследований.
Хорошо известно, что политематический банк данных (БнД) ВИНИТИ, включающий информацию о фундаментальных, точных, естественных и технических науках относится к числу крупнейших банков данных мира. Однако до последнего времени в нем отсутствовала база данных по математическим наукам. Вместе с тем становилась все более очевидной необходимость прямого взаимодействия БнД ВИНИТИ с другими отечественными и зарубежными источниками информации, имея в виду формирование специализированных информационных полей по запросам пользователей. Основными задачами исследования в данной работе являются:
- анализ состояния существующих классификационных систем, применяемых для структуризации информационных ресурсов в банках и базах данных;
- обоснование идеологии сопряжения классификационных систем для целей формированияинтегральных проблемно-ориентированных информационных полей; обоснование направлений развития элементов поисковых систем, обеспечивающих эффективный поиск данных по математическим и другим точным наукам в отечественных и зарубежных информационных ресурсах;
- разработка основ формирования интегральной информационной системы «Математика» в составе политематического БнД ВИНИТИ.
Решение поставленных задач тесно связано с научными исследованиями ВИНИТИ за последние 10 лет, в которых автор принимал участие в качестве исполнителя, ответственного исполнителя, руководителя соответствующих программ (федеральные целевые программы, проекты РФФИ, государственные контракты и др.). Выполнение всей работы стало возможным благодаря тому, что интегральная информационная системы и база данных «Математика» встраивались в широко развитую и имеющую многолетний опыт работы информационную систему ВИНИТИ.
Объектом исследования являются собственно информационные ресурсы математических и смежных с ними наук, методы их систематики, средства доступа к этим ресурсам.
Предметом исследования являются: широко известная в России и в мире автоматизированная система по информационному сопровождению научных исследований ВИНИТИ;
- направления и процессы, определяющие формирование качественно новых баз данных по математическим наукам в действующей информационной системе ВИНИТИ;
- поисковые и пользовательские интерфейсы для обеспечения эффективного взаимодействия с отечественными и зарубежными пользователями.
Методы исследования базируются на применении системного анализа, математической статистики, теории графов, теории информации и информационных процессов, компьютерного моделирования, положений, стандартов и нормативных документов, анализе полученных результатов по созданию баз и банков данных.
Связь выполняемой работы с другими научными исследованиями.' Научные исследования, проводимые в ВИНИТИ за последние 10 лет, тесно связаны с постановками и решениями указанных выше задач современной информатики.
В частности, речь идет о координирующей роли ВИНИТИ в разработке Государственной системы научно-технической информации (ГСНТИ), Федеральной целевой программы (ФЦП) «Электронная Россия», о реализации важнейших программ РАН (например,- «Разработка фундаментальных основ создания научной распределенной информационно-вычислительной среды на основе технологий ГРИД»), реализации контрактов и договоров с Министерством промышленности, науки и технологий РФ (ныне Министерство образования и науки РФ) («Формирование открытых баз данных научной и научно-технической информации, развитие Государственной системы научно-технической информации» Гос. контракт № 37.670.11.0131 от 14.05.2002, «Программно-технологический комплекс обеспечения формирования и использования государственных ресурсов научно-технической информации» Гос. контракт № 37.053.1.1.0055 от 01.02.2002 г. в рамках ФЦНТП «Исследования и разработки по приоритетным направлениям развития науки и техники на 2002-2006 гг.», «Навигационные системы по информационным ресурсам Государственной системы НТИ», Гос. контракт № 37.053.1.1.0058 от 01.02.2002 г.), с Министерством экономического развития РФ («Формирование открытых баз данных научно-информационных ресурсов в области образования, науки и культуры (2002-2010)» в рамках ФЦП «Электронная Россия», Гос. контракты № 14.152 и № ЭР.06.19 от 29.11.2005 г.), в выполнении серии-проектов РФФИ (01-07-90130-"Создание базы данных «Математика»", 04-07-90332 и 06-07-89154 "Развитие базы данных «Математика»", 0101-14045, 02-01-14047 и 06-01-14042 "Издание сборников научных статей «Итоги науки и техники»". Серия «Современная математика и ее приложения»), а также НИР, выполняемых в ВИНИТИ. Целый ряд названных работ выполнялся в ВИНИТИ («Совершенствование классификационных систем ВИНИТИ (в части Рубрикатора отраслей знания, рубрицирования информационных продуктов ВИНИТИ индексами УДК» (январь 2003-декабрь 2005), "Совершенствование классификационных систем областей знания для целей индексирования и информационного поиска в базах данных ВИНИТИ" (2004-2006), "Генерация Единой технологической базы данных ВИНИТИ и развитие ее программно-аппаратного комплекса" (2005-2007), "Генерация и развитие базы данных и полнотекстовой электронной библиотеки русскоязычной физико-математической литературы" (2005-2007)) или в сотрудничестве с другими институтами РАН при координирующей роли ВИНИТИ ("Разработка проектов государственных стандартов, рубрикаторов, кодификаторов и классификаторов для обеспечения функционирования федеральной системы кодификации знаний", Дог. № 2-кз от 04.12.02002 г., "Концептуальное обоснование информационной он-лайн службы по физико-математическим наукам и информатике как альтернативной теоретической базы для разработки концепции GRID-интеграции научной распределенной информационно-вычислительной среды с фактическим использованием технологии GRID для Интернет-ресурсов" (2004-2006)).
Кроме того, необходимо отметить, что ВИНИТИ за последние годы провел ряд совместных исследований в указанных направлениях с Отделением математических наук РАН (ОМН РАН), Отделением информационных технологий и вычислительных систем (ОИТВС РАН), ныне Отделение нанотехнологий и информационных систем, а также с международными организациями (Международный Совет по научно-технической информации (МСНТИ), Комитет по численным данным для науки и техники (КОДАТА), Международный Консорциум УДК).
В перечисленных работах автор принимала участие в качестве исполнителя, ответственного исполнителя, руководителя разделов.
Научная новизна работы. Впервые развивается представление о создании в информационной системе ВИНИТИ ориентированного информационного поля по математическим наукам, ядром которого является впервые созданная в ВИНИТИ база данных «Математика». В состав указанного поля входят электронные ресурсы по математическим-и- смежным-"сниминаукам,—а такжемеханизмы "преобразования указанных ресурсов для формирования интегрального информационного поля, необходимого пользователю для решения фундаментальных и прикладных задач.
Предлагаются направления развития соответствующих систем знаний, обеспечивающих взаимодействие различных классификаций математических и смежных с ними наук.
Развиты представления о совершенствовании важнейших элементов поисковых систем, необходимых для формирования интегрального информационного поля (указатели различного вида, рубрикаторы, терминологические словари, тезаурусы, системы ключевых слов и словосочетаний и др.).
В целом, развиваемые в работе научные представления об интегральном поле по математическим наукам являются необходимой ступенью к созданию современных навигационных систем по основным областям знаний.
Лично автором обоснована необходимость создания проблемно-ориентированного интегрального информационного поля по математическим наукам, выполнен анализ различных информационных систем, разработана идея сопряжения древовидных структур классификаций в области математических наук на отечественном и зарубежном уровне, обоснована структура БД «Математика», выполнен комплексный анализ отечественных и зарубежных публикаций по данной проблеме, а результаты этого анализа изложены в учебном пособии для аспирантов и магистрантов МГУ [9, тема 3 "Иерархические классификации и системы навигации"].
Практическое значение результатов исследований. Впервые создана и функционирует БД «Математика» в единой информационной системе ВИНИТИ.
На основе выполненных разработок подготовлены и опубликованы переработанные издания рубрикатора ВИНИТИ по математике, специальные выпуски дескрипторного обеспечения и указателей.
Опыт разработки БД «Математика» обобщен в книге автора «Принципы и методы создания БД «Математика» в составе информационной системы ВИНИТИ» [166].
Выполненные исследования обеспечили возможность создания и распространения новых электронных продуктов по математике (электронные реферативные журналы (РЖ) «Математика» и «Вычислительные науки») [167].
Впервые создан новый фрагмент в составе БД «Математика» - «Итоги науки и техники. Современная математика» - полнотекстовая электронная коллекция многотомного и многосерийного издания ВИНИТИ за период с 1962 г. по настоящее время. - - — — --
Созданная БД «Математика» органически встроена в информационную систему ВИНИТИ и доступна для пользователей в сети Интернет.
В течение ряда лет автор являлась ответственным исполнителем следующих проектов РФФИ: 01-07-90130 «Создание базы данных «Математика», 04-07-90332 и 0607-89154 «Развитие базы данных «Математика» и др. и НИР ВИНИТИ «Генерация и развитие базы данных и полнотекстовой электронной библиотеки русскоязычной физико-математической литературы» (2005-2007 гг.).
Апробация результатов работы. Все основные результаты работы докладывались в течение 2002-2007 гг. на следующих отечественных и зарубежных конференциях и семинарах: б-я Международная конференция «Информационное общество. Интеллектуальная обработка информации. Информационные технологии», 1618 октября 2002 г., ВИНИТИ, Москва; 19-я Международная конференция КО ДАТА «Информационное общество: Новые горизонты науки (The Information Society: New Horizons for Science)», 7-10 ноября 2004 г., Берлин, Германия; 11-я Международная конференция «Библиотеки и информационные ресурсы в современном мире пауки, культуры, образования и бизнеса», 2004 г., Крым; Международная конференция «Информационное обеспечение фундаментальных и прикладных наук», 27 мая 2005 г., Москва; 9-я Международная конференция и выставка «Информационные технологии, компьютерные системы и издательская продукция для библиотек ("LIBCOM-2005")», 14-18 ноября 2005 г., Звенигород; Семинар «Универсальная десятичная классификация. Современное состояние и методика применения», 5-6 апреля 2006 г., Москва, ВИНИТИ; Международный семинар «Российские электронные ресурсы по науке и технике. Проект РусЭМБ, как часть международной электронной библиотеки по математике», 1-2 февраля 2006 г., ГПНТБ, Москва; 13-я Международная конференция «Библиотеки и информационные ресурсы в современном мире науки, культуры, образования и бизнеса»,
2006 г., Крым; Международный Консорциум УДК (09.12.2005, 03.03.2006, 3-4.10.2006), Гаага, Нидерланды; 7-я международная конференция «Информационное общество. Интеллектуальная обработка информации. Информационные технологии», 24-26 октября
2007 г., ВИНИТИ, Москва.
Публикации. Основные результаты диссертационной работы опубликованы в 20 печатных работах, в числе которых две книги и одно учебно-методическое пособие и отражены в 11 отчетах по НИР.
Структура и объем работы. Диссертация состоит из введения, пяти глав, заключения, списка использованной литературы и приложений. Диссертационная работа изложена на 286 страницах, содержит 42 рисунка, 28 таблиц, 6 приложений и библиографию из 320 наименований.
Заключение диссертация на тему "Интегральная система информационного обеспечения научных исследований в области математических наук: концепция создания и перспективы развития"
Выход
Рис. 3.4 Он-лайн приложения
Завершение работы демона биллинга
Рие.3.5 Общая структура подсистемы биллинга
Представление результатов поиска для внешних и внутренних пользователей отличаются по технологии и формам представления в соответствии с различиями в технологиях Интранет и Интернет. На рис. 3.6 и 3.7 представлены некоторые фрагменты ответов на запросы пользователя по тематическому разделу «Математика».
БнД ВИНИТИ - Microsoft Internet Explorer эвка g*д Избранное Сервис ¿правка
--А ■.••-'-■.■ О
V:; J
• Адресу j^ù https://sun2.viniti.ru/cgi-bin/secure/frswww?querybase=ma2001 -20Q5@sun2&query text=%D'.V
ActiveX ¿ÏBindows™ Ц} Internet @Е-эемля Щ Intranet ¿¡gscince ¿JWebFX |£J БнД
-
Похожие работы
- Математическое моделирование и рационализация проектирования интегральных систем обслуживания неоднородного трафика
- Система интеграции и формирования информационных ресурсов территории
- Методика формирования агрегированных требований к реализации информационной системы комплекса автоматизированного проектирования концерна радиостроения
- Автоматизированная система подготовки баз данных и информационных изданий по естественным и техническим наукам
- Научные основы проектирования и построения информационно-образовательной среды технического вуза