автореферат диссертации по документальной информации, 05.25.02, диссертация на тему:Исследование информационно-технологических особенностей непубликуемых документов и разработка концепции федерального центра по серой литературе
Автореферат диссертации по теме "Исследование информационно-технологических особенностей непубликуемых документов и разработка концепции федерального центра по серой литературе"
На правах рукописи
Павлов Леонид Петрович
ИССЛЕДОВАНИЕ ИНФОРМАЦИОННО-ТЕХНОЛОГИЧЕСКИХ ОСОБЕННОСТЕЙ НЕПУБЛИКУЕМЫХ ДОКУМЕНТОВ
И РАЗРАБОТКА КОНЦЕПЦИИ ФЕДЕРАЛЬНОГО ЦЕНТРА ПО СЕРОЙ ЛИТЕРАТУРЕ
05.25.02 - Документалистика, документоведение и архивоведение
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
Москва 1998
Работа выполнена во Всероссийском научно-техническом информационном центре и Российском государственном гуманитарном университете
Научный руководитель - доктор экономических наук,
профессор Архипова Н.И.
Официальные оппоненты:
1. Доктор технических наук, профессор Воробьев Г.Г.
2. Кандидат технических наук, старший научный сотрудник Залаев Г.З.
Ведущая организация - Международный центр научной
и технической информации (МЦНТИ)
Защита диссертации состоится 1998 года в "/5"часов
на заседании диссертационного совета № Д.064.49.03 в Российском государственном гуманитарном университете по адресу: 125267, Москва, Миусская пл., д.6.
С диссертацией можно ознакомиться в библиотеке Российского государственного гуманитарного университета.
Автореферат разослан "^У" _ 1998 года.
Ученый секретарь диссертационного совета
Меркулов В.Н.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность темы. Современный мир характеризуется небывалым возрастанием роли информации. Процесс обретения обществом последних десятилетий XX века нового качества принято характеризовать понятием информатизации, технической базой которой является самая широкая компьютеризация всех сфер человеческой деятельности.
Феноменальный прогресс в области вычислительной техники, достигнутый за последнее десятилетие, во многом снял проблемы объемного характера, обеспечив существенные запасы по вычислительной мощности, памяти персональных компьютеров и пропускной способности каналов связи для решения большинства практических задач.
Однако прорыв произошел не. в области классической теории информации, а в гоюхо формализуемой семантической сфере, которая во все возрастающей степени стала объектом эффективной компьютерной обработки по мере интеллектуализации средств вычислительной техники. Сегодня суть информатизации состоит, таким образом, в формировании виртуальной реальности, поддерживаемой в памяти компьютерных систем и сетевых серверов и существующей параллельно с реальностью привычного физического мира.
Информационно-документальной базой физического мира со времен Гутенберга являлось печатное слово. В информационном обществе печатный документ утрачивает свою ведущую роль. На первый план выдвигаются так называемые непубликуемые источники информации, традиционно занимавшие периферийное место в сфере научно-технической информации (НТИ). Используемые в отечественной документалистике и информатике термины "непубликуемые документы" и "непубликуемые источники информации" перестают быть адекватными тому классу документальных источников, которые составляют информационную базу виртуальной реальности.
Все это требует радикального переосмысливания традиционной парадигмы документалистики в отношении огромного слоя новых форм документов, в частности, в сфере научной и технической информации, новых подходов к организации систем информационного обслуживания, особенно к системам информационного обеспечения сферы НИОКР, от которой во многом зависит сохранение и дальнейшее наращивание научно-технического и промышленного потенциала России.
Основной целью диссертационной работы являются исследование с позиций документалистики, теоретическое и концептуальное обоснование, разработка и практическая реализация новых направлений деятельности по формированию, сохранению и использованию федерального документального фонда серой литературы, разработка и внедрение базовых элементов комплекса новых современных технологий обработки докумен-
тальных потоков серой литературы в федеральном информационном центре России.
Базовой организацией для проведения исследований и внедрения основных положений работы является Всероссийский научно-технический информационный центр (ВНТИЦ), в котором в течение ряда лет при непосредственном участии автора ведутся научные и проектные работы по концептуальному обоснованию и практической реализации современных направлений развития ВНТИЦ как единственного в стране многопрофильного федерального информационного центра по серой литературе. Полученные в данной работе результаты внедряются в технологические процессы Центра, укрепляя его позиции в российском и международом информационном сообществе и усиливая его влияние на научную и экономическую жизнь страны.
Основные задачи исследования
1. Провести анализ основных тенденций развития процессов информатизации, способствующих формированию информационного пространства виртуальной реальности и меняющих в связи с этим отношение к традиционным документальным источникам научно-технической информации.
2. Провести теоретическое исследование и разработку аналитических моделей использования непубликуемых источников в системах информационного обеспечения при решении научно-технических проблем и НИОКР для выявления особенностей документов серой литературы.
3. Провести теоретическое исследование форм существования, представления и использования документов серой литературы, их особенностей и влияния на изменение форм и методов информационной деятельности в целях разработки и реализации концепции дальнейшего развития и формирования новых направлений деятельности многопрофильного федерального информационного центра России по серой литературе.
4. Разработать концепцию федерального центра России по серой литературе, обосновать его место и роль в системе НТИ страны.
5. На основе выявленных особенностей взаимодействия с виртуальной реальностью концептуально обосновать и сформулировать требования и разработать функционально-технологическую схему системы обработки документальных потоков серой литературы в федеральном центре.
6. Внедрить в промышленную эксплуатацию созданную на основе проведенных исследований и разработок технологию обработки вторичных документов ВНТИЦ для ввода в международную систему и базу данных по серой литературе БЮЬЕ.
Научная новизна данной диссертационной работы заключается в развитии современных методических подходов к исследованию и освоению
нового современного этапа информатизации, определяемого как формирование документальных потоков серой литературы в пространстве виртуальной реальности, и в получении следующих новых научных положений и выводов, которые выносятся на защиту:
- предложена новая трактовка процесса информатизации как формирование и развитие виртуальной реальности и дано определение феномена виртуального мира как объективной основы пересмотра традиционной методологии организации информационного обслуживания;
- обосновано введение в русскоязычный научный оборот термина "серая литература", принятого в международной практике, и дано русскоязычное определение этого термина;
- предложена методология теоретического исследования процесса решения научно-технических проблем как системы логических преобразований проблемных ситуаций. Установлены аналогии, соответствующие случаям аксиомы Цермело и теоремы Геделя для процедур информационной поддержки НИОКР;
- предложена математическая модель проектирующей агрегативной системы (формального аналога НИОКР), имеющей два контура информационной поддержки. Обоснован вывод о принципиальных преимуществах метода поддержки НИОКР из виртуального пространства серой литературы;
-разработаны и приняты к реализации базовые положения концепции развития ВНТИЦ как федерального центра России по серой литературе;
- разработаны требования к технологиям обработки серой литературы и функционально-технологическая схема системы обработки документальных потоков серой литературы, частично внедренная во ВНТИЦ;
- разработана и впервые внедрена в промышленную эксплуатацию технология обработки вторичных документов ВНТИЦ для ввода в международную систему и базу данных по серой литературе БЮЬЕ.
В качестве объекта исследования выбраны феномен современного этапа информатизации и формирования мировой виртуальной реальности, документы и документальные потоки серой литературы, ВНТИЦ как технологическая база федерального центра по серой литературе.
В качестве предмета исследования определены:
- особенности современной серой литературы в сравнении с традиционными непубликуемыми документами (на примере НТИ);
- концептуальное, организационное и технологическое обоснование направлений развития ВНТИЦ как федерального центра серой литературы;
- теоретическое обоснование требований и разработка базовых информационных технологий федерального центра, обеспечивающих его вюлоче-
ние в международные системы и документальные потоки серой литературы как одного из мировых центров формирования виртуального мира.
Практическая ценность полученных результатов состоит в определении перспективных направлений развития ВНТИЦ в соответствии с постановлением Правительства Российской Федерации № 950 от 24 июля 1997 г. "Положение о Государственной системе научно-технической информации Российской Федерации" в части реализации возложенных на него функций федерального информационного центра и подтверждена внедрением в промышленную эксплуатацию предложенных базовых элементов Концепции развития ВНТИЦ и его технологического комплекса.
Реализация результатов работы. Результаты работы включены в Концепцию развития ВНТИЦ и его технологического комплекса, частично внедрены в его технологии и подлежат дальнейшему внедрению.
Апробация работы. Основные положения, научные и практические результаты работы доложены и обсуждены на следующих международных научных конференциях, семинаре и симпозиуме: Европейская конференция "Информационные потребности и обеспечение в области социальных наук в меняющейся Европе", Берлин (Германия, 1994); IV Международный семинар "НТИ в странах Центральной и Восточной Европы", Варшава (Польша, 1995); 5-й Международный симпозиум по информатике 181-96, Берлин (Германия, 1996); 3-я Международная конференция по серой литературе (Люксембург, 1997).
Структура и объем диссертации. Диссертационная работа состоит из введения, четырех глав, заключения, списка основной используемой литературы и приложений. Работа представлена на 105 страницах машинописного текста, включает 15 рисунков, 3 таблицы и список литературы из 79 наименований и 6 приложений.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность темы и дается краткая аннотация новых положений, которые вводятся автором в научный оборот в рассматриваемом круге научно-технических проблем, приводятся основные положения и результаты работы, которые выносятся на защиту.
Глава I посвящена обзорно-аналитическому исследованию основных тенденций развития процессов информатизации общества, формирования информационного пространства виртуального мира и обоснованию методологической позиции автора в отношении к традиционным документальным источникам научно-технической информации и документальным потокам серой литературы, порождаемым развитием сферы виртуальной реальности.
Опыт развития мировых открытых сетей, таких, как Интернет, позволяет говорить о начале новой эры в развитии средств и систем переработки информации, при этом под переработкой понимается вся совокупность выполняемых процессов: сбор, обработка, накопление, хранение, представление, передача, распространение и защита информации.
Для характеристики мировых тенденций формирования информационного общества рассматривается опыт США, относящихся к числу стран, построивших у себя информационное общество.
В США утверждена на правительственном уровне и реализуется на практике программа Национальной инфраструктуры информатизации, или Национальной информационной инфраструктуры (N11), которую, благодаря ее масштабности и широте охвата, часто называют Глобальной информационной инфраструктурой. N11 служит основой национальной и - по американским планам - глобальной политики дальнейшего развития информатизации, возглавляя список технологий, имеющих жизненно важное значение для экономического и социального будущего США. Информационно-коммуникационная политика становится единой "суперполитикой", определяющей существование и развитие практически всех других сфер деятельности, включая производство, энергетику, экологический мониторинг. Таким образом, в стратегическом плане ничто другое не приобретает столь фундаментального и всеобщего характера, как информация.
В N11 принято различать три уровня - прикладной, сервисный и канальный. Прикладной уровень охватывает такие сферы человеческой деятельности, как управление кризисными и чрезвычайными ситуациями, производство и проектирование, образование и повышение квалификации, энергетика, торговля, экологический мониторинг, здравоохранение. Сервисный уровень определяет процедуры обмена данными и электронных транзакций, мультимедийные объекты, поддержку интерактивных взаимодействий, возможности и процедуры выявления и распределения ресурсов. Канальный уровень обеспечивает инвариантность по отношению к среде передачи цифровых сигналов, будь то спутниковая связь, волоконно-оптические линии, кабельное телевидение, сотовая телефонная связь или широковещательные каналы.
Еще один важный аспект новой роли информации - в военно-стратегической и разведывательной областях, которому в США придается большое значение.
Информация становится важнейшим военно-стратегическим ресурсом, не менее, а то и более важным, чем традиционные виды вооружений и военной техники. Так как получение информации, её обработка и использование относятся к области разведки, то для выработки победоносных стратегий в будущих войнах или для предотвращения войн новые информацион-
ные условия требуют изменения концепции и реструктуризации разведывательной деятельности и функций, включая и военную разведку. Открытые источники информации в условиях глобального развития сетевых информационных технологий могут обеспечить подавляющее большинство сведений, необходимых для лиц, принимающих решения.
Особую важность приобретает необходимость развития методов и средств интеллектуального анализа информационного сырья квалифицированными специалистами для подготовки кратких и емких обзоров и дайджестов. Упор должен быть сделан на качество, а не количество информации, которая должна предоставляться "точно в срок" именно тем лицам, которым она предназначается, и в оптимальной форме. Эти выводы имеют очень важное значение в контексте данной работы, так как высвечивают одну из сторон новой роли открытой серой литературы, служащей предметом нашего исследования, и подчеркивают необходимость проведения широкомасштабной интеллектуальной аналитической обработки электронных информационных массивов.
Таким образом, важнейшие показатели эффективности информационной инфраструктуры носят не технический, а гуманитарный, социальный характер.
Уникальным, достаточным признаком информатизации, отвечающим условиям информационного общества и века, может служить виртуальная реальность. Автором предлагается определять информатизацию как формирование и развитие виртуальной реальности.
Действительно, информационное общество характеризуется сосуществованием двух миров - привычного физического мира и виртуального мира, созданного человеком и существующего в искусственной компьютерной среде. Виртуальный мир, или виртуальная реальность, является, частичным отображением физического мира в памяти компьютеров, причем величина этой отображенной части стремительно возрастает. Принципиально важным является не простое сосуществование этих двух миров, а их теснейшее взаимодействие и взаимовлияние: в информационный век физический мир уже не может существовать и развиваться без виртуального мира.
Технической основой виртуальной реальности служит формализованное цифровое электронное представление объектов, явлений и процессов физического мира. Катализатором информатизации стал прорыв не в области шенноновской теории информации, а в области формализации и развития методов компьютерной обработки семантической информации, методов искусственного интеллекта. Интеллектуализация средств вычислительной техники стала практически возможной благодаря феноменальным успехам за последние десятилетия в области элементной базы, архитектуры компьютеров и сетевых технологий, что позволило практически снять
ограничения, связанные с объемом памяти и быстродействием компьютеров для решения многих информационных задач.
Развитые сетевые и телекоммуникационные технологии, универсальные протоколы, обеспечивающие объединение глобальных и локальных сетей (Интернет-Интранет), способствуют тому, что отдельные "острова виртуальности" объединяются в единое целое и формируется единый, интегрированный на программно-аппаратном уровне виртуальный мир, в котором изменяются привычные для физического мира пространственно-временные отношения. Расстояние теряет свое лимитирующее значение. Связь и взаимодействие субъектов и объектов в виртуальном мире не зависит от того, находятся ли они в непосредственной близости или на разных континентах.
Виртуальный мир в той или иной мере распространяется сейчас практически на все сферы человеческой деятельности.
Таким образом, виртуальный мир может быть определен как совокупное отображение объектов, явлений, процессов и связей физического мира в памяти компьютеров информационно-коммуникационных систем. Это отображение не статично и не пассивно, но тесно связано и активно взаимодействует с физическим миром, с человеком через системы датчиков, преобразователей, индикаторов и интерфейсов.
Категория виртуального мира чрезвычайно важна для понимания сути информатизации. Новое качество, привнесенное информатизацией в общественное развитие и позволяющее говорить об информационном обществе, связано именно с возникновением и формированием виртуального мира. Переход общества в стадию информационного связан с тем моментом, когда физический мир утрачивает способность существования без виртуального мира, становится "виртуально зависимым", когда виртуальный мир становится частью "метаболизма" мира физического.
В этом контексте совершенно понятна и исключительная важность новой роли информации, среди всех видов которой в условиях электронизации на первый план выступает так называемая непубликуемая информация. Непубликуемые документы и источники информации в мировом профессиональном сообществе принято относить к понятию серой литературы. Исследованию серой литературы в контексте информатизации посвящаются последующие главы работы.
В главе П представлены результаты теоретического исследования с позиций документалистики, форм существования, представления и использования документов непубликуемой НТИ и серой литературы, их особенностей и влияния на изменение форм и методов информационной деятельности.
Новые количественные и качественные характеристики различных видов информационных источников, обусловленные информатизацией, требуют пересмотра и уточнения принятых в этой области терминов. К не
отвечающим современным условиям следует отнести термин "непубли-куемые документы и источники информации" и тем более его разновидность - "неопубликованные документы", используемую в тексте закона "Об обязательном экземпляре документов". Ни тот, ни другой термины не пригодны в качестве общего для описания современного смысла того понятия, которое вкладывается в термин "серая литература", принятый в большинстве языков мира. Термин "серая литература" оказался адекватным тому, чтобы вместить в себя обозначение всей массы новых источников информации, которые циркулируют в электронном виде в цифровых сетях, в противоположность литературе в традиционной, печатной форме, асе более сдающей свои позиции по мере развития виртуального мира.
Термин "непубликуемые" в применении к документам и источникам информации не вмещает, да и не может вместить по самой своей семантике всего того, что понимается под серой литературой в условиях развития информатизации. Пока "публикуемость" была синонимом "печатности", т.е. тиражируемости типографским путем, термин "непубликуемые" был приемлем. Но доминирующая теперь сетевая информационная среда изменила привычные понятия. Распространяемая по сетям информация и документы в электронном виде "публикуются", становятся достоянием самой широкой публики, хотя, по преимуществу, и не в печатном виде, т.е. отличаются от традиционных печатных изданий. Вот почему в новых условиях непубликуемые документы представляют собой лишь весьма малое подмножество серой литературы, и старый термин никак не может далее служить общим, отражающим новое качество электронных документов.
Понятие и термин "серая литература" свободны от перечисленных недостатков, поэтому в диссертационной работе предлагается ввести термин "серая литература" в русскоязычный научный оборот.
До настоящего момента в науке не сформулировано строгое определение серой литературы. "Люксембургская конвенция", принятая Третьей международной конференцией по серой литературе (13-14 ноября 1997 г., г. Люксембург), дала уточненное англоязычное определение серой литературы, ориентированное на реалии XXI века:
"Под серой литературой понимается все множество документальных источников, выпуск которых осуществляется на всех уровнях правительственных, академических, деловых и промышленных институтов (предприятий, организаций и учреждений) в печатной или электронной форме и не связан с коммерческими издательствами" (перевод мой/ - Л.П.).
Таким образом, в диссертации предлагается относить к серой литературе документальные источники, которые не выпускаются коммерческими издательствами и не распространяются через книготорговую сеть. -
Автором составлен перечень видов документальных источников, относимых к серой литературе (отчеты, диссертации, информационные выпуски и вестники, неофициальные правительственные документы и т.д., всего 18 наименований). По содержанию серая литература может охватывать все сферы человеческой деятельности, она может быть научной, технической, учебно-образовательной, коммерческой, относиться к сфере досуга и быта. Можно выделить несколько уникальных характеристик, которые делают серую литературу особо важной в стратегических исследованиях, для обеспечения государственной безопасности: серая литература малотиражна и не распространяется через обычные книгоиздательские каналы, поэтому труднодоступна; по сравнению с другими информационными источниками серая литература обладает высокой информационной ценностью и релевантностью, так как в меньшей мере подвергается (или вообще не подвергается) цензуре; серая литература часто носит междисциплинарный характер, давая общую картину и описывая ситуацию в целом; серая литература обладает огромным инновационным потенциалом и служит средством профессиональных коммуникаций по достигнутым результатам, маркетингу продукции и т.п.
Все это коренным образом отличается от официально публикуемых документов, в которых проводится официальная политика, определяется официальная экспортно-импортная практика.
Чрезвычайно важным выводом является то, что серая литература играет все возрастающую роль не только в области НТИ, но и в мировом информационном пространстве в целом, прежде всего в связи с беспрецедентным развитием глобальной сетевой информационной среды, виртуального мира, значительную долю информационного наполнения которого составляет серая литература. Таким образом, серая литература становится информационной базой виртуального мира, и в этом состоит ее исключительное стратегическое значение. Подобно тому, как печатные издания служили информационной базой эры печатного слова, серая литература становится информационной базой века информатизации.
В основу теоретического исследования методологии решения научно-технических проблем положено представление о научно-техническом творчестве как системе логических преобразований проблемных ситуаций, доопределяемых через информационные процедуры до совокупности адекватных задач.
Таким образом, информационная деятельность по решению какой-либо научно-технической проблемы АП включает в себя некоторое динамическое информационное поле I, представленное различными видами источников научной и научно-технической информации, прямо или косвенно соответствующих решаемой проблеме и входящих в нее задач.
Согласно теории научно-технического творчества, структура проблемной области поиска в информационном поле НТИ может быть представлена как объединение множества информационных элементов проблемной области:
АП;=аХ,иа^и...а2к еА], (1)
где АП; - проблемная область А информации решаемой проблемы АП;
аХь аУр... А - тематические области информационной сферы поиска в проблемной области А информационного поля Л.
Принимая как рабочую гипотезу динамическую комбинаторную модель творчества, полагаем, что в структуре проблемной области АПД информационного поля 3 определено комбинаторное покрытие, соответствующее поиску и обработке информации для А-й области проблемы € П(А) некоторой НИОКР.
Тогда, применяя теорию агрегативных систем, можно представить процесс поиска и обработки информации для решения проблемы как состояние выхода агрегативной системы при переходе ее из начального состояния аЗДО в конечное 2(0, при котором комбинация элементов информации, найденных на множестве АП^ соответствует новому качеству искомого решения, то есть некоторой задаче ¿Щ)'
А2(1) = Н[Л1о)Л]еАП;€А1, (2)
где Н - оператор обработки информации:
Н = Р х аК х Ь, определяемый как прямое (декартово) произведение (X) множеств, задающих состояние (значение) входящих операторов Р, К, Ь над подмножествами информационных элементов проблемной области ЛП].
Р - оператор поиска элементов ах„ ¿/г.., в информационном поле;
аК - закон композиции для допустимых комбинаций информационных элементов;
Ь - оператор граничных условий, определяющий отбрасывание недопустимых комбинаций информационных элементов.
Следовательно, если представить решаемую проблему НИОКР АП (как целое) в виде пересекающегося подмножества подпроблем АП = аП] Л аП,... П аПь то ее решению соответствует искомое пересечение подзадач АХ = П П А, то есть:
1) АП а2 соответственно А2 е АП и
2) 3 [х,, у^... гк], €Аг3 <-> V АП) еАП, где
3) 3 аХ) е А еАП| е I <-»Аг е АП
Возможны следующие варианты.
Случай 1.
3 [х, п у,... П гк] е V л2, е АП, * 0,
если [хь уу.. гк] ф 0 (не пусто).
В этом случае проблема АП решается через поиск элементов описания задач в замкнутом множестве информационного поля Л1. Т.е. проблема решается на основе информационных методов обеспечения НИОКР через комбинацию (модификацию) известных решений, найденных в дЦ е
В данном случае в ходе приведенных выше рассуждений мы независимо пришли к выводу, который теоретически может интерпретироваться как соответствие данной ситуации классической аксиоме выбора (аксиоме Цермело).
Случай 2.
Если Э{х^ у^.. гк} = 0 и
{х; П Ур.. п гк} е V А2, = 0, то =0.
Этот случай соответствует классической теореме Геделя о неполноте, которая здесь интерпретируется в следующей форме: в замкнутой проблемной области информационного поля содержатся те и только те элементы задач, которые заключаются в наборе и комбинациях представленных в этой области знаний, в том числе об известных законах природы, теориях, способах, методах и изобретениях (патентах), которые присутствуют в ней в виде информационных элементов. Если никакие комбинации информационных элементов не дают решения проблемы (перевод ее в разряд задач), то эта информационная область проблемно замкнута.
Поскольку совокупность стадий жизненного цикла (ЖЦ) технического объекта может рассматриваться как агрегативная система, то соответствующая система ее информационного обеспечения также является агре-гативной системой.
Принимаем этапы ЖЦ как агрегаты, соединенные последовательно между собой таким образом, что завершение всех процессов в предыдущем агрегате обеспечивает начало работы следующего. Тогда каждый из этапов ЖЦ представляет собой в общем случае агрегат Аь А2... А„, обладающий основным (функциональным - X) и информационным (Л) входом.
Учитывая, что система обеспечения НИОКР, в особенности компьютеризированная, является сегодня неотъемлемой частью проектирующей системы, принимаем общую модель агрегативной системы разработки технических объектов, состоящую из ряда элементарных ячеек (агрегатов).
Выделим такую ячейку А, и [А1 = ¡А^, представленную на рис. 1.
Рис. 1. Структура элементарной ячейки проектирующего комплекса (ЭЯПК)
В ней обнаруживается два информационных контура I и И, в которых наблюдаются потоки научно-технической информации:
I контур - проблемная информация "внутреннего запроса" 1[Л к информационно-обеспечивающему агрегату 1А1 (ИОА) для разрешения "внутренних" проблем типа А1П агрегата А1.
II контур - проблемная информация "внешнего запроса к внешнему информационному полю для разрешения "совместных" проблем агрегатов А,и1А,г,А£.
Контур I "работает" во "внутренней" среде ЭЯПК и использует ее внутренний информационный ресурс представляющий собой нако-
пленный опыт проектирования, собственные базы и банки данных НТИ и - системную (организационную) информацию. Этот случай соответствует рассмотренному нами случаю 1 - аналогии теоремы Цермело.
Во-вторых, при исчерпании в контуре I итерационно генерируется информация проблемного запроса ^ к внешнему информационному полю.
Контур II обращается к "внешнему" информационному ресурсу, иначе говоря, к "внешнему" информационно-обеспечивающему агрегату, что связано с попыткой разрешения проблемной ситуации второго вида (случай 2 - аналогия с теоремой Геделя). А это означает практически остановку на некоторое время работы ЭЯПК, поскольку проблемный запрос ^ "уходит" во внешнее информационное поле с иной структурой и другими свойствами, нежели внутренний информационный ресурс I контура.
Контур П разомкнут и не подчиняется системной (организационной) информации и поэтому требует для своего функционирования дополнительных затрат организационных, финансовых, временных и других ресурсов проектирующего агрегативнош комплекса
В данном случае систему информационного обеспечения НИОКР можно представить как своеобразного "посредника" между разработчиком и внешним информационным полем, к которому обращается запрос по II контуру в структуре элементарной ячейки проектирующего комплекса.
В этом случае агрегативная проектирующая система или комплекс становится уже трехконтурной, цепь информационно-технологического взаимодействия существенно удлиняется и требует затрат дополнительных ресурсов (в том числе времени) на каждый итерационный цикл информационного обслуживания конкретных проблем НИОКР.
Появление виртуального мира серой литературы, поддерживаемого в мощных компьютерных сетях, радикально изменяет ситуацию в информационном обеспечении НИОКР и практически во всех сферах человеческой деятельности, связанной с процессами информационной поддержки разрешения проблемных ситуаций.
С учетом сказанного можно утверждать, что "подключение" агрега-тивного проектирующего комплекса к сетям виртуальной реальности и размещенным в них массивам серой литературы принципиально изменяет его структуру, устраняя "посредника" - неэффективный III информационный контур и обеспечивая совершенно новые возможности для творческого поиска и обработки информации по широкому спектру проблем.
Структура модели двухконтурного агрегативного проектирующего комплекса с прямым информационным обеспечением из виртуального пространства серой литературы представлена ниже.
Рис. 2. Структура проектирующего агрегативного комплекса с прямым информационным обслуживанием из виртуального пространства серой литературы
В данной агрегативной модели:
Ai, А2, A3 - агрегаты проектирующей системы;
iAJ, 2Aj - агрегаты информационной системы;
(X); (Y) - входные-выходные сигналы-состояния Аь А2, А3 (полупродукты, продукты);
sJi, SJ2, Ж - системная информация проектирующих агрегатов (об организации проектирования объекта);
и J1, nJ2 - научная, научно-техническая информация из проблемной области внешнего информационного поля;
JiA> hA, hA - проблемная информация о состоянии проектирующего агрегата (изделия);
- информация проблемного запроса;
ijJnJ2,„J3 - информация, релевантная запросу ¡J^ ¡J3;
А^ь - выходная проблемная информация, используемая последующим агрегатом;
- документированная информация (конструкторская, технологическая документация и т.п.);
А^ - проектирующий агрегативный комплекс.
Таким образом, проведенное теоретическое исследование процессов решения научно-технических проблем и информационного обеспечения НИОКР позволяет сделать вывод о том, что использование информационно-технологического комплекса, подключенного к виртуальному пространству серой литературы, обеспечивает экономию ресурсов и, что особенно важно, времени, создает новые возможности оперативного творческого поиска и обработки информации, повышает уровень соответствия полученной информации решаемой проблеме.
В главе III представлены основные базовые положения концепции развития федерального центра России по серой литературе.
Основная профильная сфера деятельности ВНТИЦ по формированию, хранению и использованию федерального фонда непубликуемых источников НТИ сохраняет свое важное значение в информационном обслуживании научного, производственного и других сообществ, но не может быть признана достаточной с учетом новых процессов и требований информатизации общества.
Разработаны концептуальные и технологические основы развития на базе ВНТИЦ федерального информационного центра по серой литературе, направления деятельности которого охватывают не только архивирование и распространение широкого спектра традиционных и нетрадиционных видов непубликуемых документов, но и поддерживалют и развивают информационную базу систем и сетей виртуальной реальности. Такой информационный
центр должен выполнять функции информационного обеспечения задач государственного и научного планирования и регулирования процессов информатизации и развития систем и сетей виртуальной реальности, их информационного наполнения. В условиях глобальной информатизации государственное участие в формировании, хранении и распространении серой литературы приобретает первостепенное значение для выработки экономической и политической стратегии государства, проведения ее в жизнь.
Статус, роль и место ВНТИЦ в новой структуре ГСНТИ в ряду федеральных органов научно-технической информации (НТИ) определены Положением о государственной системе научно-технической информации (ГСНТИ), утвержденным Постановлением Правительства Российской Федерации от 24 июля 1997 г. № 950.
Одновременно, в соответствии с Федеральным законом "Об обязательном экземпляре документов" от 29.12.94 № 77-ФЗ, ВНТИЦ выполняет государственную функцию по исполнению этого Закона и формирует "национальный библиотечно-информационный фонд Российской Федерации - собрание всех видов обязательного экземпляра..."
Деятельность федерального центра по формированию, сохранению и использованию федерального фонда серой литературы. Федеральным законом Российской Федерации "Об обязательном экземпляре документов" на ВНТИЦ также возлагается комплектование обязательного бесплатного экземпляра неопубликованных документов (диссертации, отчеты о НИОКР, описания алгоритмов и программ), их регистрация и учет, выпуск информационных изданий о нем, обеспечение его сохранности и использования. Неопубликованные документы определены как результаты научно-исследовательской и опытно-конструкторской деятельности.
Федеральный центр как держатель национального банка идей. В фондах ВНТИЦ хранятся результаты интеллектуального труда ученых и специалистов страны. Важность этих фондов несомненна, однако в условиях широкой демократизации российского общества возникает необходимость более активного использования высокого интеллектуального потенциала и образовательного уровня всех слоев населения России.
Как государственный орган, имеющий большой опыт работы с непу-бликуемыми источниками информации, ВНТИЦ способен решить задачу формирования Национального банка идей - федерального центра, осуществляющего сбор, обработку, хранение и распространение нетрадиционных продуктов интеллектуальной деятельности. Форма заявок, подаваемых во ВНТИЦ, достаточно произвольна, а содержание подвергается лишь самой общей экспертизе. Поступившие в государственное хранилище идеи приобретают определенный официальный и юридический статус, а наличие
современного поискового аппарата в компьютеризированном банке облегчает быстрый доступ к хранимой информации.
Аналитическая, экспертная и научно-исследовательская деятельность. Потребность в информационно - аналитических материалах, обеспечивающих эффективное управление сферой НИОКР, и масштабы их использования имеют тенденцию к быстрому росту во всех развитых странах.
Концепция предусматривает деятельность по подготовке информационно-аналитических материалов для государственных органов управления исследованиями и разработками разного уровня, информационный и методологический анализ российских научно-технических направлений в рамках государственной научно-технической политики. Важной частью этой работы является экспертиза национальной информационной безопасности в сфере открытых НИОКР, выполняемых в России.
К перспективным направлениям научных исследований следует отнести задачи освоения громадного наследия советской науки 60-х - 80-х годов, когда в СССР были накоплены колоссальные научно-технические заделы, не востребованные в силу тяжелого финансового положения российской науки . 90-х годов. ВНТИЦ является естественным хранителем этого ценнейшего ресурса и может служить информационной базой при реализации программы обращения научного сообщества к освоению исследовательских заделов советского времени.
Предполагается, что среди планируемых исследовательских программ Центра существенный интерес представляют следующие: "Научно-техническое наследие России", "Архивно-исторические исследования в фондах серой литературы", "Библиометрические исследования на потоках и в фондах ВНТИЦ", "Анализ информационной среды российских НИОКР и отдельных ее компонентов".
Развитие нормативно-правовой базы в сфере НТИ. В настоящее время все еще не существует адекватной законодательно-нормативной базы для деятельности федерального центра по серой литературе. Принятый в 1994 г. "Закон об обязательном экземпляре документов", обязывающий организации предоставлять во ВНТИЦ экземпляр отчетов о НИОКР, выполненных за счет средств госбюджета, не решил проблем входного потока в силу отсутствия механизмов контроля и санкций. Еще не создана реальная законодательная основа для системы государственных контрактов на проведение НИОКР, где были бы решены, в частности, проблемы интеллектуальной собственности на их результаты.
Разработка таких вопросов потребует глубокого рассмотрения действующего законодательства в информационной сфере с творческим "синтезом" возможных направлений нормативного укрепления уникальной компетенции федерального центра путем разработки и предложения соот-
ветствующих подзаконных актов (постановлений Правительства и т.п.), улучшающих работу законов и придающих Центру как органу их исполнения особую важность и уникальный статус, без которого потребитель в определенных ситуациях не сможет обходиться.
Особенности международного сотрудничества. К важным сторонам перспективной деятельности федерального центра относится международное сотрудничество.
Развитие международного сотрудничества имеет три основных аспекта: информационный - интеграция информационных ресурсов России в международное виртуальное пространство; научно-технический - ознакомление с наиболее передовыми технологиями с целью их освоения и внедрения в Центре; маркетинговый - продвижение информационной продукции и услуг Центра на зарубежные рынки.
Основой стратегии развития международного сотрудничества является, с одной стороны, обеспечение высокой оперативности и качества информационного обслуживания зарубежных пользователей на уровне международных стандартов, а с другой - установление надежных барьеров на путях передачи или продажи ценной информации без гарантий российских правовых и коммерческих приоритетов.
В главе IV на основе выявленных особенностей взаимодействия с виртуальной реальностью концептуально обоснованы и сформулированы требования к системе обработки документальных потоков серой литературы в федеральном центре и разработана функционально-технологическая схема системы. Представлены результаты внедрения в промышленную эксплуатацию созданной на основе проведенных исследований и разработок технологии обработки вторичных документов ВНТИЦ для ввода в международную систему и базу данных по серой литературе БЮЬЕ.
Приведенные в предыдущих главах исследования серой литературы как важнейшего вида информационных ресурсов и направлений деятельности федерального информационного центра по этому виду ресурсов позволили сформулировать на концептуальном и специальном уровне требования к технологиям переработки серой литературы с учетом ее особенностей, а также специфики многопрофильного информационного центра.
С технологической точки зрения и с позиций документалистики важное значение имеют следующие особенности серой литературы: уникальность и труднодоступность документальных источников, связанные с нети-ражируемостью их типографским путем и нераспространяемостью через торговые каналы; худшее по сравнению с печатными документами качество оригиналов; высокая информационная ценность источников, так как большинство из них не подвергается цензуре.
Специфика уникальности источников выдвигает требования обеспечения повышенной эффективности и полноты сбора и надежности хранения документов. Традиционной труднодоступное™ серой литературы должно быть противопоставлено требование использования таких технологий, которые в максимальной степени облегчают широкий доступ к источникам. Свойство высокой информативности источников серой литературы предполагает обеспечение высокой технологичности и возможности применения средств искусственного интеллекта при аналитической обработке информации, содержащейся в документах.
Другая группа технологических требований обусловлена многопро-фильностью федерального центра по серой литературе. Прежде всего комплекс технических и программных средств центра должен поддерживать два основных и наиболее общих направления его функционирования - создание фонда и архивирование серой литературы; распространение и обеспечение возможностей широкого использования серой литературы.
Носители информации, используемые для создания фонда и архива серой литературы, должны обеспечивать высокую разрешающую способность при фиксации документов (не менее 80 линий/мм) для обеспечения возможности высококачественного копирования и обработки изображений документов; юридическую силу хранимых документов; теоретическую бессрочность хранения.
Всем этим требованиям отвечает технология съемки документов оптическими камерами на микрофотоносители. Электронное представление документов не обеспечивает выполнения этих требований.
Для второго направления - распространения и использования серой литературы - очевидны преимущества новейших электронных технологий представления и передачи документов, в том числе в режиме онлайнового поиска.
С учетом особенностей документальных источников, относящихся к серой литературе, и многопрофильного характера федерального центра по серой литературе, предусмотренного концепцией его развития, сформулированы общие требования к технологиям обработки серой литературы, которые положены в основу при разработке комплекса программно-технических средств и технологических процессов информационной системы федерального центра.
Одним из основных аспектов практической реализации предложенной концепции развития федерального центра является разработка такой системы обработки документальных потоков в центре, которая обеспечивала бы техническую и технологическую базу для решения поставленных в концепции задач и отвечала требованиям, связанным со специальной серой литературой и сформулированным в данной работе.
входной поток
ДОКУМЕНТЫ
Рис. 3. Функциональная схема системы обработки документальных потоков серой литературы в федеральном центре
Система должна основываться на новейших информационных технологиях, которые обеспечивают возможности интеграции в мировое информационное пространство и интенсивного развития центра. Вместе с тем система должна обеспечивать преемственность существующих технологий, плавность и безостановочностъ перехода от старых технологий к новым.
С учетом изложенных требований разработана функциональная схема обработки документальных потоков серой литературы в федеральном центре, представленная на рис. 3. Схема состоит из 15 основных модулей, определяет маршруты обработки документов и предлагает общие технические решения по реализации модулей.
Входной поток документов состоит из полнотекстовых первичных документов (например, отчетов и диссертаций, поступающих во ВНТИЦ) и реферативно-библиографических вторичных документов, таких, как регистрационные карты (РК), информационные карты (ИК) отчетов, учетные карты диссертаций (УКД) (в случае ВНТИЦ). На вход должны поступать оригиналы документов на бумажном носителе, которые имеют юридическую силу и могут быть подвергнуты оптическому микрофильмированию. Сопровождение оригинала электронной версией документа может существенно ускорить цикл обработки документов в центре. На вход системы поступают также различные типы тематических, фактографических и справочных запросов, заказы на изготовление копий документов.
Все модули системы компьютеризированы, а компьютеры объединены в локальную вычислительную сеть (ЛВС).
Выходной поток документов состоит из заказанных копий (на бумаге, микрофишах, в электронном виде), аналитических и статистических материалов (обзоров, справок, результатов экспертиз, рейтинговых оценок, сведений о реализации государственных научных программ и т.п.), справочных, реферативных, сигнальных, аналитических, статистических и научных изданий, ответов на запросы, подборок и массивов документов, направляемых по договорам и другим обязательствам центра.
Конкретным примером практической реализации одного из элементов предложенной концепции является разработка и внедрение последовательности технологических процессов обработки вторичных документов, поступающих во ВНТИЦ, для ввода их в международную систему и базу данных по серой литературе S1GLE. Разработанная технология внедрена в промышленную эксплуатацию во ВНТИЦ для учетных карт диссертаций (УКД) в переводе на английский язык в сентябре 1997 г.
База данных SIGLE доступна для онлайнового поиска на двух хост-компьютерах: STN-International - для пользователей всего мира и BLAISE-LINE - для пользователей стран Европейского сообщества. Кроме того, файл SIGLE содержится теперь и на Web-сайте BLAISE.
) УКД (
Из архива
1 Входная обработка
2 Рубрицирование и индексирование
3 Копирование
4 Тематический отбор
5 Перевод РЯ-*АЯ, постредактирование
б Редактирование
7 Ввод в компьютер
8 Корректорская считка
9 Ввод корректуры
10 Создание архива
Архив
с ^
мтп
И Автоматизированное перерубрицнрование ГРНТИ-БЮЬЕ
12 Смысловое пострубрицирование
13 Конвертирование в формат ЯГСЬЕ
14 Контроль и формирование файлов ¿КЗЬЕ
15 Сжатие и передача файлов через 1КТЕЮМЕТ
/ 1'
Загрузка файлов в Ви58С-сервер ЭЮЬВ
С-----Л
ря-ед
БД БЮЬЕ
Рис. 4. Технологическая схема обработки вторичных документов ВНТИЦ для ввода в систему БЮЬЕ 21
Каждый из хост-компьютеров содержит всю необходимую информацию о базе данных и инструкции для пользователей с подробными описаниями процедур входа, поисковых команд и стратегий. Поисковыми реквизитами в БЮЬЕ являются рубрики, ключевые слова, авторы, организации-источники документов, страны и даты публикации, язык оригинала, номера отчетов.
В базе данных БЮЬЕ используется структура представления документов, принятая в Международной информационной системе по ядерной физике и технике (ШШ). Рубрицирование документов производится в соответствии с незначительно модифицированной версией рубрикатора СОБАП Комитета по научной и технической информации Федерального совета США по науке и технологиям. Рубрикатор СОБАТЬБЮЬЕ двухуровневый; в нем используются 22 рубрики первого (цифровой код) и 246 рубрик второго (буквенный код) уровня. В среднем каждый документ снабжен двумя рубриками при максимальном числе рубрик на один документ - три. В диссертации приводится разработанная русскоязычная версия рубрикатора СОБАП-БЮЬЕ, которая практически используется в технологии ВНТИЦ при перерубрицировании документов из рубрик принятого во ВНТИЦ Государственного рубрикатора научно-технической информации (ГРНТИ) в рубрики рубрикатора СОЗАП-БЮЬЕ.
Внедренная технологическая схема обработки вторичных документов ВНТИЦ для ввода в систему БКЗЬЕ представлена на рис. 4. При разработке и внедрении технологии обработки УКД для ввода в базу данных БЮЬЕ основные трудности были связаны с переводом карт на английский язык и последующей обработкой англоязычных карт, а также с гармонизацией рубрикаторов СОБАП и ГРНТИ. И та, и другая задачи не могут бьггь полностью компьютеризированы и требуют интеллектуальной обработки документов специалистами.
За период с сентября 1997 г. по апрель 1998 г. в режиме промышленной эксплуатации рассмотренной технологии во ВНТИЦ было подготовлено 12000 англоязычных УКД, которые за 4 сеанса были переданы на ВЬОБС-сервер и введены в базу данных БГСЬЕ.
В заключении приводится сводка основных результатов диссертационной работы.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ
В результате выполненных исследований и разработок автором получены следующие новые научные положения и выводы.
1. Обоснована новая трактовка процесса информатизации как формирование и развитие виртуальной реальности. Дано определение феномена
виртуального мира. Показана объективная основа необходимости пересмотра традиционной методологии организации информационного обслуживания.
2. Обоснована целесообразность введения в русскоязычный научный оборот термина "серая литература". Предложено русскоязычное определение этого термина.
3. Проведено теоретическое исследование решения проблем научно-технических разработок как системы логических преобразований проблемных ситуаций, доопределяемых через информационные процедуры до совокупности адекватных задач. Установлены аналогии, соответствующие случаям аксиомы Цермело и теоремы Геделя для процедур информационной поддержки НИОКР.
4. Предложена математическая модель проектирующей агрегативной системы (формального аналога НИОКР). Сделан вывод о принципиальных преимуществах метода информационной поддержки НИОКР из виртуальной среды.
5. Выявлено новое качество серой литературы как информационной базы виртуального мира, что придает серой литературе особо важную роль в системах информационного обслуживания в условиях информатизации.
6. Разработаны и приняты к реализации базовые положения концепции развития федерального центра России по серой литературе, обоснованы его место и роль в системе НТИ страны, основные направления деятельности по формированию, сохранению и использованию федерального фонда серой литературы, формированию национального банка идей. Разработаны предложения по развитию аналитической, экспертной и научно-исследовательской деятельности Центра, нормативно-правовой базы в сфере НТИ, международного сотрудничества.
7. Разработаны и частично внедрены на базе ВНТИЦ требования к технологиям обработки серой литературы и функционально-технологическая схема системы обработки документальных потоков серой литературы в федеральном центре.
8. Разработана и внедрена в промышленную эксплуатацию технология обработки вторичных документов ВНТИЦ для ввода в международную систему и базу данных по серой литературе БЮЬЕ. Впервые в режиме промышленной эксплуатации подготовлены и переданы в систему БЮЬЕ 12000 англоязычных документов из фондов ВНТИЦ.
Публикации. Основные положения диссертации изложены в следующих работах:
1. Павлов Л.П., Куратов О.В. Структурные и технологические преобразования во ВНТИЦ в соответствии с новыми экономическими условиями // Тезисы докладов IV Международного семинара "НТИ в странах Центральной и Восточной Европы". Варшава, 1995. С. 54-55.
2. Pavlov L.P. Transformation Processes in Scientific and Technical Information Centre of Russia // Social Sciences in Transition. V. 4. Bonn, 1996. P . 437-440.
3. Pavlov L.P. New Challenges and Solutions: Structural and Technological Transformations at the Scientific and Technical Information Centre // Proceedings des 5 Internat. Symposiums fur Informationswissenschaft (ISI'96), Konstanz Univ.-Verl., 1996. P . 323-330.
4. Pavlov L.P., Nechiporenko V.P. Russian Grey Literature Collection and Dissemination Centre: Status, Profile of Activities and Development // 3 Internat. Conference on Grey Literature. Luxembourg, 1997. P . 23-24.
5. Павлов Л.П. Место ВНТИЦ в новой структуре ГСНТИ // Информ. бюлл. ВНТИЦ. 1997. № 2. С. 22-24.
6. Павлов Л.П., Борисов B.C., Ермаков Ю.С. и др. Концепция развития ВНТИЦ как федерального органа по непубликуемым источникам информации // Информ. бюлл. ВНТИЦ. 1997. № 3. С. 10-46.
7. Павлов Л.П. ВНТИЦ в информационной среде России // Информ. бюлл. ВНТИЦ. 1997. № 1. С. 5-8.
8. Павлов Л.П. Комментарий к Концепции развития ВНТИЦ // Информ. бюлл. ВНТИЦ. 1997. № 4. С. 5-9.
9. Павлов Л.П. Информация и информатизация: мировые тенденции развития // Информ. бюлл. ВНТИЦ. 1998. № 4-5. С. 8-13.
-
Похожие работы
- Исследование концептуальных основ и разработка системы формирования и использования фонда непубликуемых научно-технических документов
- Автоматизированная система анализа конъюнктурной информации в геологии для поддержки принятия управляющих решений
- Создание и развитие системы научно-технической информации Республики Казахстан
- Методическое и технологическое знание о библиотечной деятельности
- Возникновение и развитие отчетов о научно-исследовательских работах в СССР как одного из видов научно-технических документов