автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:WEB-ориентированные инструментальные средства для изучения семантически-структурированных предметных областей

кандидата физико-математических наук
Брызгалов, Петр Александрович
город
Москва
год
2006
специальность ВАК РФ
05.13.11
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «WEB-ориентированные инструментальные средства для изучения семантически-структурированных предметных областей»

Автореферат диссертации по теме "WEB-ориентированные инструментальные средства для изучения семантически-структурированных предметных областей"

Московский государственный университет им. М.В. Ломоносова Научно-исследовательский вычислительный центр

\¥ЕВ-ОРИЕНТИРОВАННЫЕ ИНСТРУМЕНТАЛЬНЫЕ

СРЕДСТВА ДЛЯ ИЗУЧЕНИЯ СЕМАНТИЧЕСКИ-СТРУКТУРИРОВАННЫХ ПРЕДМЕТНЫХ ОБЛАСТЕЙ

Специальность 05.13.11 - математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

АВТОРЕФЕРАТ диссертации на соискание учёной степени кандидата физико-математических наук

На правах рукописи

Брызгалов Петр Александрович

Москва 2006 г.

Работа выполнена в Научно-исследовательском вычислительном центре Московского государственного университета им. М.В. Ломоносова

Научный руководитель: доктор физико-математических наук,

профессор, академик РАН, Воеводин Валентин Васильевич

Официальные оппоненты: доктор физико-математических наук,

профессор,

член-корреспондент РАО Розов Николай Христович

доктор технических наук, профессор Арушанян Олег Багратович

Ведущая организация: Южно-Уральский государственный

университет

Защита состоится "<£" иММД 2006 года в часов на заседании диссертационного совета К 501.001.11 Московского государственного университета им. М.В. Ломоносова по адресу: 119992, г. Москва, Ленинские горы, МГУ, НИВЦ, конференц-зал.

С диссертацией можно ознакомиться в библиотеке НИВЦ МГУ.

Автореферат разослан "Л " Д*4А/с4»С*200б года

Учёный секретарь диссертационного совета кандидат физ.-мат. наук

Суворов В.В.

_а£ОбА

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В последние годы происходит бурное развитие дистанционного обучения, основанного на использовании компьютеров и сети Интернет. Публикация издания в Интернете существенно отличается от публикации книжного издания своей доступностью, возможностью опубликовать не только тексты и графику, яо и видео, и звук, сделать электронное издание интерактивным. Многие научные области быстро развиваются, и образовательные, особенно справочные, издания в печатном виде по таким областям устаревают очень быстро. С другой стороны, электронные издания, распространяемые через сеть, можно постоянно дополнять и изменять. Даже для тех областей, которые уже устоялись и со временем меняются мало, электронные справочные издания открывают новые возможности поиска информации, позволяют ее отбирать, группировать, сохранять и обрабатывать.

Настоящая работа посвящена созданию \veb-ориентированных инструментальных средств, позволяющих создавать электронные энциклопедии, справочники и учебники по различным областям знаний.

Исследование показало, что новые возможности электронных изданий используются недостаточно. Одно из главных достоинств таких изданий - потенциально неограниченные возможности поиска и отбора нужной информации (статей), на практике используется очень слабо. В большинстве случаев эти возможности ограничиваются лишь оглавлением и предметным указателем (как и в печатных изданиях), поиском по ключевым словам и гипертекстовыми ссылками, позволяющими быстро переходить от одной статьи издания к другой.

Гипертекстовые перекрестные ссыпки между статьями существенно упрощают поиск дополнительной информации, когда содержание первоначально найденных статей не понятно или его не достаточно. На настоящий момент использование ссылок в электронных изданиях, на наш взгляд, имеет два основных недостатка. Если в тексте статьи встречаются термины, которые объясняются в других статьях данного издания, то обычно ставят ссылки, позволяющие переходить от первой статьи к дополнительным, т.е. к статьям, содержащим объяснения терминов. Но ясно, что знания одних только терминов не достаточно для

РОсТЩЩЩАЖЩГ БНБЛ!Н>г£КЛ

оэ

кт 3 [

понимания сложных фактов, например доказательств теорем. Другим недостатком является то, что расстановка ссылок при подготовке справочного издания не имеет заранее намеченного плана. Ссылки расставляются без учета удобства изучения материала, его сложности, и предназначены быть лишь второстепенным средством поиска дополнительной информации. Вдобавок, ссылки вводят альтернативность в способ подачи информации. Это значит, что пользователю периодически предлагается несколько путей: он может читать статью дальше, а может перейти по одной из ссылок к другой статье. Такая альтернативность существенно усложняет восприятие информации.

Необходимо сделать электронные справочные издания более эффективным средством изучения материала, отражающим внутреннюю логическую структуру предметной области, и ориентировать их, главным образом, на работу через сеть Интернет. В то же время, надо иметь возможность распространять их на компакт-дисках среди пользователей, не имеющих выхода в глобальную сеть.

Целью данной диссертационной работы является развитие и реализация новых подходов к анализу семантически-структурированных предметных областей. Семантическая структурированность означает, что предметная область имеет некоторую логическую структуру, которая может быть представлена направленным графом. Вершины графа представляют собой статьи, на которые разбита предметная область, а дуги - логические отношения между статьями.

В данной работе реализован новый подход к логическим отношениям, как к средству формирования последовательностей статей, содержащих всю информацию, необходимую для освоения нужного материала. Общая идея подхода была представлена в докладе В.В.Воеводина и Вл.В .Воеводина "Интернет-макет теоретического курса линейной алгебры", сделанном на Всероссийской научной конференции "Научный сервис в сети Интернет" в 1999 г.* Созданная на этой идее система должна

t Воеводин В.В., Воеводин Вл.В. Интернет-макет теоретического курса линейной алгебры. Труды всероссийской научной конференции "Научный сервис в сети Интернет", Москва, Изд-во МГУ, 1999, С. 22-25.

избавить пользователя от необходимости перепрыгивать по гипертекстовым ссылкам от статьи к статье в поисках нужной информации, ведь такой поиск отвлекает от изучения основного материала и серьезно затрудняет ориентацию. У пользователя неизбежно возникают вопросы: "Где то место, на котором я прервал изучение основного материала?", "Как вернуться к статье, которую я недавно прочитал?" и другие. С помощью функций системы пользователь должен иметь возможность получить список статей, которые содержат всю необходимую ему информацию, причем полученный список статей должен быть удобен для последовательного изучения. Составляться данный список должен с учетом знаний конкретного пользователя, т.е. не содержать информации, которая ему уже известна, и не содержать слишком сложных статей, если пользователь пожелает ограничить объем требуемой информации.

Научная новизна диссертации заключается в развитии, разработке и реализации методов применения новых подходов к анализу семантически-структурированных предметных областей в электронных справочных изданиях. Эти методы позволяют отражать внутреннюю логическую структуру предметной области и формировать последовательности статей, содержащих всю информацию, необходимую для освоения заданного материала с учетом знаний конкретного пользователя.

Кроме того, в созданной в рамках данной работы системе, которая получила название "Ареола", реализован новый, не встречавшийся нам в других системах метод структуризации информации, а именно: иерархическая структуризация статей по сложности. Она позволяет ограничивать сложность доступной пользователю информации из справочника заданным уровнем. Ограничение уровня сложности не нарушает структуры, образованной логическими отношениями между статьями.

Практическая значимость. Представленная в работе система "Ареола" может быть использована для создания электронных справочных изданий, энциклопедий и учебников по различным предметным областям, как естественнонаучным, так и гуманитарным.

Многочисленные функции системы "Ареола" делают построенные на ее основе электронные издания полезными как для изучающих предмет, так и преподавателей.

На основе разработанной системы созданы два электронных справочника: базовая электронная энциклопедия по линейной алгебре "Линеал" и базовая электронная энциклопедия по параллельным вычислениям "Параллель". Они доступны для работы через сеть Интернет по адресам: lineal.guru.ru и parallel.guru.ru.

Апробация работы. Результаты работы докладывались на научно-методологическом семинаре НИВЦ МГУ, в институте вычислительной математики РАН, на Всероссийской научной конференции "Научный сервис в сети Интернет", г. Новороссийск, на Интернет-конференции "Информационно-вычислительные технологии в фундаментальных и прикладных физико-математических исследованиях", на научной конференции "Ломоносовские чтения", г. Москва. По итогам Всероссийского конкурса образовательных Интернет-ресурсов и электронных учебных пособий "ИТ-образование в Рунете" проект "Линеал" стал лауреатом в номинации "электронные учебники" за новую концепцию образовательного справочно-энциклопедического интернет-ресурса в 2005 г.

Публикации. По материалам диссертации опубликовано 5 работ и созданы две доступные в сети Интернет электронные энциклопедии по линейной алгебре и по параллельным вычислениям.

Структура и объем работы. Диссертация состоит из введения, трех глав, и списка литературы. Общий объем диссертации - 117 страниц.

СОДЕРЖАНИЕ РАБОТЫ

Введение носит постановочный характер, содержит обоснование актуальности работы. Во введении содержится обзор методов структуризации информации, использующихся в существующих электронных справочных изданий. Эти методы следующие:

• разделение информации на статьи,

• иерархическая структуризация статей по разделам,

• разбиение статьи на поля,

• предметный указатель,

• разделение статей по типу,

• перекрестные ссылки между статьями.

Одной из целей данной диссертационной работы является попытка реализовать принципиально новый подход к перекрестным ссылкам. Во-первых, они являются средством отражения внутренней логической структуры предметной области, и, во-вторых, используются для формирования последовательностей статей, содержащих всю информацию, необходимую для освоения заданного материала.

Первая глава посвящена общему описанию системы. Одним из достоинств системы "Ареола" является отражение внутренней логической структуры предметной области, образованной логическими отношениями между статьями энциклопедии. Что представляют собой эти отношения? Во многих предметных областях одни статьи используют факты, содержащиеся в других, то есть одни статьи опираются на другие. Подобные предметные области будем называть "семантически-структурированными". Они могут быть представлены направленным ациклическим графом, в котором вершины — это статьи, а из одной вершины в другую ведет дуга тогда и только тогда, когда вторая статья опирается на первую. Будем называть статью, из которой выходит дуга "предшественником", а в которую входит — "следствием". Начальными вершинами графа должны стать основные утверждения и определения, объяснение или обоснование которых выходит за рамки предметной области. Такой граф не однозначен, и каждый специалист, разрабатывающий новое справочное издание, может построить свой, отличный от других граф. Подчеркнем, что логические отношения между статьями расставляются авторами электронного издания.

Система "Ареола" позволяет заложить информацию о логических отношениях между статьями и имеет ряд функций, позволяющих использовать логические отношения для более

эффективного изучения материала. Богатый набор функций, использующих логические отношения, не только упрощает пользование справочным изданием, но и значительно расширяет область его применения.

Часто встречается ситуация, когда при изучении энциклопедии или справочника пользователю не достаточно информации, найденной такими традиционными способами поиска, как оглавление, предметный указатель или поиск по ключевым словам. Используя заложенные при создании справочника логические отношения, система "Ареола" позволяет быстро находить дополнительные статьи, в которых содержится вся информация, необходимая для понимания одной или нескольких статей. Для этого не нужно определять ключевые слова и термины для поиска, а также выделять потом нужные статьи из множества статей, содержащих данные термины. Пользователь сразу получает только те, которые могут помочь понять статьи, интересующие его.

Кроме того, что логические отношения делают поиск дополнительных статей несравненно более удобным, они позволяют использовать издание принципиально новым образом. При серьезном изучении некоторой части предметной области часто возникает такая ситуация, когда выполняются два условия: определены те статьи, которые изучающим уже известны или которые не требуют дополнительной информации для понимания, и те статьи, которые должны быть изучены. В этом случае, используя заложенные логические отношения между статьями, можно составить полный теоретических курс, настроенный под нужды конкретных пользователей. Это значит, что данный курс будет опираться только на ту информацию, которая уже известна пользователям, не будет требовать никакой дополнительной информации для понимания конечных статей, то есть курс будет полон, и одновременно не будет содержать лишней информации.

Разработанная система "Ареола" включает ряд функций, позволяющих использовать все удобства работы с логическими отношениями для поиска дополнительных статей и составлять теоретические курсы указанным в предыдущем абзаце образом.

Работа пользователя с системой заключается в поиске и выборе нужных статей и отображении информации об этих статьях и их логических взаимосвязях. Существуют следующие возможности поиска статей:

• поиск по структурному указателю,

• поиск по предметному указателю,

• поиск по ключевым словам,

• поиск статей по номерам,

• переход от статьи к статье по ссылкам,

• поиск логических предшественников и следствий,

• ограничение поиска по статьям с уровнем сложности не выше заданного,

• поиск по графу логических отношений статей.

В отдельную группу можно выделить функции, использующие логические связи между статьями:

• пополнение,

• поиск предшественников группы статей,

• отображение графа логических отношений между выбранными статьями,

• выделение конечных вершин среди предшественников.

К еще одной группе относятся функции по работе со списками выбранных статей:

• сохранение списка выбранных статей,

• объединение нескольких списков статей в один.

К последней группе относятся функции по отображению содержания статей:

• просмотр содержания найденных статей на экране,

• подготовка содержания найденных статей для вывода на печать.

Чтобы выбрать статью, пользователь отмечает ее галочкой в соответствующем поле И. Номера выбранных статей образуют так называемые "выборки". Существует четыре разные выборки, которые соответствуют четырем основным режимам выбора статей: структурному указателю, предметному указателю, поиску по ключевым словам и поиску по номерам. Выборки во время работы

| til« let №<> Гщапаг loots вд

! a- 0 (E®!®©!®©

J_ D_ _ D

J iWKWtf {

J лдегеет hepV/HnoM-flilru ni/lnwtt/nmnjhp Q ВыЯл|»||еиу11мывпужты,отииил*в(н

* 1 Множества, элементы, операции

# 1 1 Вещественные и комплексные числа

* 1 2 Миажестм к монеты

Л 1.3 Эквивалентность и равенство 01 4 Алгебраические операции и их свойстве

* 1 4 1 Алгебраические операции

* 1 4.2 Обратные операции

• 15 Группы

I Кольце и поля

Л 1 7 Линейные пространстве

• 2 Система векторов

* Э Матрицы и операторы Ш А Определители

» 5 Расстояния, углы, объемы Ш 6 Системы линейны» алгабраичеспм уравнение М7 Многочлены

# В Спектральные свойстве матриц

1 4>9 Структура матриц общего вида

■*■ ".............—.....

□! п| п о! о!

D] □

О! Of

□ Г

□ I

□ {

п

[1.1 Веаестеежые и

1.11 Венеотееигмечсла

ki.1 i.i-a

1.12 Гиметримеоюе теецстеодме» момплеииыееюел

ил 1¿Л '-1-Д

Ijjijfi I.M1 1.1*12 1.1-1В 1.1-14 ■1.1.М 1 1-1И 1.1-17 11-1« 1.1.1В

11ЛАлпЦмичеапепикстйвлем

U£1 11-М 1.1.24

И 14МокуАиеалражв1М Xia 119 Ш 1ЛЛ Ш1 IUJB '(««■а ТОртеел 1.VX1 1.148 ил 1 ЦВСтжииирм 1.14* 1лле ujc \ ихт уие

I.1ЛО

II.7 06ил«уи1Ыо IHMW

1.1-40 1.1-41 11-42 1.1-43 1.1-44 ВСЕГО СТАТВЙ: 4«

Теисты

Печать

Греф

Пополнение

Очистить Првдшаствешцци

Т Ф

Сокренить

, gdNCMlfl»

Рис. 1. Структурный указатель

хранятся в оперативной памяти компьютера пользователя. Пользователь может применять к этим выборкам операции сложения, вычитания и пересечения множеств. Полученная в результате "объединенная" выборка загружается в структурный указатель.

Пользователь может сохранить выборки у себя на компьютере, чтобы продолжить работу с ними позже.

На рис. 1 представлено окно Интернет-браузера со структурным указателем энциклопедии по линейной алгебре "Линеал", доступной в Интернете по адресу lineal.guru.ru.

Отдельно упомянем о программе визуализации графа логических отношений между выбранными статьями. Эта программа написана на языке Java и запускается в окне Интернет-

браузера Основные возможности программы включают в себя следующие:

• просмотр графа логических отношений в одном из двух режимов: ярусно-параллельной форме или "плавающей" форме, когда вершины можно свободно передвигать и фиксировать в нужных позициях,

• ограничение видимой на экране части графа несколькими ярусами ярусно-параллельной формы,

• ограничение видимых вершин выбранными и, возможно, связанными с выбранными дугами на один или два шага в ту или иную сторону относительно направления дуг,

• изменение масштаба графа,

• просмотр графа логических отношений между параграфами и главами, в которые входят выбранные статьи,

• упорядоченный список номеров для быстрого поиска статей,

• выбор статей в графе для последующего просмотра их текстов и другие.

На рис. 2 представлено окно браузера с программой отображения логических отношений между статьями энциклопедии по линейной алгебре "Линеал".

Craph applet - Microsoft internee explorer

1x1® ГЦ 0.0®

eee

http//Ikieaigururu/llnetl3/gr«phphp

3 1

& a

¡H 114 11-10 2111 1111 3 1-1« 2 I'M 21-17 21-18 21-10 2 1-» 21-21

21-32 21-21 21-» 2.11 2» Ш Ш 2» 2J-7 UK 2J-3I 11-23 13-23

22-27 2.1-2) 2.1-30 21-11 13-« J 7-1 17-2

Applet Graph mrtid

Сброс

¿7.»

FH @ »«ни a»

)2- 23

#7-15

S53 E3

ВтЗ BjmTI ЩИ

Рис. 2. Плавающая форма графа

Вторая глава называется "архитектура системы". В ней подробно рассматриваются технические аспекты реализации системы "Ареола". Система проектировалась как для использования через сеть Интернет, так и для локальной работы с компакт-диска.

В первом параграфе второй главы описывается принципиальная схема работы системы, которую можно описать формулой "браузер - сервер - база данных - сервер - браузер" (см. рис. 3).

Интернвг-браумр

интерпретатор JavaSaipi

интерпретатор Java

общвнив по протоколу HTTP

компьютер-сервер

HTML-страницы

интерпретатор РНР

база данных Муки

Рис. 3. Архитектура системы "Ареола"

Первый элемент схемы - Интернет-браузер. С его помощью пользователь общается с системой: в окнах Интернет-браузера отображается посылаемая системой информация и с его помощью пользователь посылает запросы системе на новую информацию.

Второй элемент - web-cepeep. Он представляет собой программу, которая обрабатывает запросы пользователя, отправляемые через Интернет-браузер. Общение между сервером и браузером происходит по протоколу HTTP. Если работа происходит через сеть, то web-сервер работает на центральном компьютере,

который также называется сервером, обслуживающем всех пользователей данной системы, а в случае локальной работы сервер запускается на компьютере пользователя. В качестве программы-сервера используется Apache. Он был выбран из соображений доступности, надежности, распространенности и удобства обслуживания. Сценарии работы web-сервера при поступлении того или иного запроса от пользователя описаны на языке PHP. Эти сценарии вставляются непосредственно в код HTML-файлов, отображаемых в браузере пользователя. При поступлении запроса от пользователя на тот или иной HTML-файл (web-страницу), сервер предварительно выполняет сценарии на языке PHP, расположенные на данной странице, подставляет их вывод в исходной код, после чего отправляет страницу пользователю.

Третий элемент схемы - база данных. В ней хранится вся информация, составляющая содержание энциклопедии. Эта информация извлекается из базы данных программой-сервером по мере необходимости. В качестве системы управления базами данных используется Mysql.

Работает система "Ареола" следующим образом. Основу системы составляет набор файлов в формате HTML со вставками на языках PHP и JavaScript. Такие файлы называются динамическими web-страницами. Работа начинается с открытия пользователем первой страницы системы в окне своего Интернет-браузера. Расположенные на ней ссылки позволяют генерировать запросы web-серверу на другие страницы. Запросы могут сопровождаться дополнительными параметрами. Получая такой запрос, web-сервер находит нужный файл и выполняет встроенные сценарии на языке PHP. Эти сценарии могут обращаться за информацией в базу данных. После обработки PHP-сценариев сервер подставляет их вывод в исходную HTML-страницу и отсылает ее пользователю. Эта страница отображается в Интерне-браузере пользователя и расположенные на этой странице ссылки позволяют генерировать новые запросы к серверу.

Во втором параграфе второй главы описывается формат информации, представляющей собой наполнение энциклопедии. В качестве такового был выбран стандартный формат представления информации в сети Интернет - язык гипертекстовой разметки HTML. Выбор был сделан по двум основным причинам. Во-первых, одним из требований к создаваемой системе была возможность работы с ней через сеть, а естественным интерфейсом для работы в

сети является Интернет-браузер, который предназначен для отображения информации, отформатированной при помощи языка HTML. Во-вторых, язык HTML идеально подходит для комбинирования различных видов информации: текста, картинок, звуковой, видео и т.д. Использование не только текста и картинок выгодно отличает электронные образовательные системы от традиционных книг, делая электронные системы более наглядными и способствуя, таким образом, лучшему усвоению материала пользователем.

Далее во втором параграфе рассмотрены альтернативные технологии создания справочных изданий: Java и Macromedia Flash, указаны их достоинства и недостатки.

В третьем параграфе подробно описывается структура базы данных системы. Рассмотрены формат и назначение всех полей основных таблиц базы данных. Там же описан порядок занесения информации в базу данных и внесения исправлений. Перед занесением необходимо подготовить несколько текстовых файлов определенного формата. В этих файлах должна содержаться вся информация по наполнению энциклопедии. Затем, используя специальную программу, данные из файлов заносятся в базу данных.

Для проверки логики данных, составляющих энциклопедию, служит другая программа, также описанная в третьем параграфе. Она позволяет находить такие логические ошибки, как нарушение принципа неубывания сложности при переходе от статьи-предшественника к статье-следствию.

Четвертый параграф второй главы посвящен описанию сценариев работы программы-сервера и Интернет-браузера Напомним, что сценарии работы сервера описаны на языке PHP, а сценарии обработки информации в браузере описываются на языке JavaScript. В этом параграфе подробно рассматривается структура web-страниц, составляющих основные разделы системы, сценарии на языках JavaScript и PHP, исполняемые при активации основных функций системы, описаны способы передачи информации между окнами браузера, приведены подробные схемы и фрагменты кода.

Третья глава диссертации посвящена применению системы на практике. Рассматриваемая система "Ареола" сделана независимой от наполнения и может быть использована для создания энциклопедий по самым различным предметным областям. Энциклопедии, построенные на базе системы "Ареола", имеют

богатый набор функций, которые упрощают процесс получения нужной информации, что позволяет использовать их для дистанционного обучения. Такие энциклопедии могут работать через сеть Интернет и распространяться на компакт-дисках, и поэтому могут бьггь использованы в учебном процессе в качестве глубоко структурированного учебника по теоретическому курсу.

В качестве примера во втором параграфе третьей главы описывается работа с энциклопедией по линейной алгебре "Линеал", построенной с помощью системы "Ареола". В примерах показано, как с помощью функций системы можно быстро находить дополнительную информацию в тех случаях, когда недостаточно информации, найденной традиционными способами - по оглавлению, предметному указателю или с помощью поиска по ключевым словам. Другой пример показывает, как с помощью системы можно составить цикл лекций, посвященный определенной теме. Примеры иллюстрируют практическое применение таких функций системы, как поиск по структурному и предметному указателям, поиск логических предшественников одной статьи, пополнение выборки, поиск предшественников группы статей и других.

В заключении сформулированы основные результаты

работы.

1. Разработана технология создания предметно-независимых \уеЬ-ориентированных инструментальных средств для изучения семантически-структурированных областей знаний.

2. Технология реализована в виде программной системы "Ареола" и комплекса сервисных программ, обеспечивающих наполнение и функционирование системы.

3. На основе системы "Ареола" созданы и успешно апробированы информационно-справочные системы "Линеал" и "Параллель", доступные из сети Интернет и предназначенные для изучения линейной алгебры и параллельных вычислений.

ПУБЛИКАЦИИ

Основные результаты диссертации отражены в следующих

работах:

1. Брызгалов П.А. Система "Ареола". Программная оболочка для создания электронных энциклопедий. // Труды всероссийской научной конференции "Научный сервис в сети Интернет". Москва: Изд-во МГУ, 2004. С. 260-262

2. Брызгалов П.А. Система "Ареола" - программная оболочка для создания электронных энциклопедий. // Вычислительные методы и программирование. Том 6, № 1. Москва: Изд-во МГУ, 2005. С. 136 - 140.

3. Брызгалов П.А. Средство визуализации графа логических отношений между статьями электронной энциклопедии. // Тезисы доклада на Интернет-конференции "Информационно-вычислительные технологии в фундаментальных и прикладных физико-математических исследованиях". Москва, 2005.

4. Брызгалов П.А. База данных системы "Ареола". // Вычислительные методы и программирование. Том 6, № 2. Москва: Изд-во МГУ, 2005. С. 192 -195.

5. Брызгалов П.А. Возможности изучения семантически-структурированных предметных областей с помощью системы "Ареола" // Москва: Изд-во МГУ, 2006. 55 С.

6. Брызгалов П.А., Воеводин В.В., Воеводин Вл.В. Базовая электронная энциклопедия "Линеал" по линейной алгебре. http://lineal.guru.ru

7. Брызгалов П.А., Воеводин В.В., Воеводин Вл.В. Базовая электронная энциклопедия "Параллель" по параллельным вычислениям, http://parallel.guru.ru

Подписано в печать 19.04.2006 г. Формат 60x84/16. Бумага офс. №1. Печать ризо. Усл. печ. л. 1,0. Тираж 100 экз. Заказ №3.

äoOfcfl

99 73

Оглавление автор диссертации — кандидата физико-математических наук Брызгалов, Петр Александрович

ВВЕДЕНИЕ

Обзор методов структуризации в электронных справочных изданиях.

ГЛАВА 1. ОПИСАНИЕ СИСТЕМЫ.

1.1 Общее описание системы.

1.1.1 Использование логических отношений для изучения предметной области.

1.1.2 Программа для визуализации графов логических отношений.

1.1.3 Техническая реализация.

1.2 Структура предметной области. Причинно-следственные связи.

1.2.1 Поиск предшественников и следствий.

1.2.2 Поиск предшественников выборки.

1.2.3 Пополнение.

1.2.4 Уровень сложности.

1.2.5 Типы и структура статей, использование при поиске.

1.3 Функциональные возможности системы.

1.4 Подробное описание функций системы.

1.4.1 Первая страница.

1.4.2 Структурный указатель.

1.4.3 Предметный указатель.

1.4.4 Поиск по ключевым словам.

1.4.5 Ввод номеров.4О

1.4.6 Просмотр текстов выбранных статей.

1.4.7 Вывод для печати.

1.4.8 Граф.

1.4.9 Пополнение.

1.4.10 Просмотр предшественников или следствий одной статьи.

1.4.11 Список предшественников выборки.

1.4.12 Объединение и сохранение выборок.

ГЛАВА 2. АРХИТЕКТУРА СИСТЕМЫ

2.1 Принцип работы "браузер - сервер - БД - сервер - браузер".

2.2 Формат материала - содержания энциклопедии.

2.3 Описание БД и процесса ее наполнения.

2.3.1 Средства ввода и редактирования информации.

2.4 Описание сценариев работы сервера и Интернет-браузера.

2.4.1 Сценарии, относящиеся к структурному указателю.

2.4.2 Сценарии, относящиеся к окну предметного указателя, поиска по ключевым словам и ввода номеров.

2.4.3 Сценарии, относящиеся к функции просмотра содержимого статей.

ГЛАВА 3. ПРИМЕНЕНИЕ

3.1 Возможные применения.

3.2 Система по Линейной Алгебре - Линеал.

Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Брызгалов, Петр Александрович

В последние годы происходит бурное развитие дистанционного обучения, основанного на использовании компьютеров и сети Интернет. Публикация издания в Интернете существенно отличается от публикации книжного издания своей доступностью, возможностью опубликовать не только тексты и графику, но и видео, и звук, сделать электронное издание интерактивным. Многие научные области быстро развиваются, и образовательные, особенно справочные, издания в печатном виде по таким областям устаревают очень быстро. С другой стороны, электронные издания, распространяемые через сеть, можно постоянно дополнять и изменять. Даже для тех областей, которые уже устоялись и со временем меняются мало, электронные справочные издания открывают новые возможности поиска информации, позволяют ее отбирать, группировать, сохранять и обрабатывать.

Выделим основные типы электронных средств, связанных с дистанционным обучением, по функциональному признаку [22]:

Программно-методические издания и системы. В эту группу входят средства для организации учебного процесса и управления им. В английском языке для таких средств принят термин Learning Management Systems (LMS). Существуют стандарты для таких средств: Sharable Content Object Reference Model (SCORM), которые призваны обеспечить возможность взаимодействия различных аппаратных и программных платформ (интероперабильность), доступность и возможность многократного использования компонент LMS.

Обучающие издания — основные средства обучения, представляющие собой электронные учебники, справочники, курсы лекций и т.д.

Вспомогательные издания предлагают задания и упражнения практического характера, способствующие усвоению материала теоретического курса.

Контролирующие издания — тестовые программы, предназначенные как для самоконтроля обучаемых, так и для оценки их успеваемости преподавателем.

Учебно-методические издания — материалы по методике преподавания дисциплины, выполнения курсовых и дипломных проектов, контрольных работ и т.д.

Настоящая работа посвящена созданию web-ориентированных инструментальных средств, позволяющих создавать электронные энциклопедии, справочники и учебники по различным областям знаний.

Исследование показало, что новые возможности электронных изданий используются недостаточно. Одно из главных достоинств таких изданий — потенциально неограниченные возможности поиска и отбора нужной информации (статей), на практике используется очень слабо. В большинстве случаев эти возможности ограничиваются лишь структурным и предметным указателями (как и в печатных изданиях), поиском по ключевым словам и гипертекстовыми ссылками, позволяющими быстро переходить от одной статьи справочного издания к другой.

ОБЗОР МЕТОДОВ СТРУКТУРИЗАЦИИ В ЭЛЕКТРОННЫХ СПРАВОЧНЫХ ИЗДАНИЯХ

Количество электронных справочников и энциклопедий со временем растет. Это не только издания, работающие через Интернет, но и устанавливаемые на компьютер, не использующие сеть. Их разнообразие практически безгранично, однако проведенное нами исследование доступных через Интернет бесплатных справочных систем, а также изучение руководств к платным системам показывает, что все они используют одни и те же методы организации информации. Логично предположить, что и автономные системы используют те же методы, поскольку последние никак не связаны с использованием сети. Эти методы предназначены для облегчения и ускорения поиска нужной информации в справочном издании. К таким методам относятся: разделение информации на статьи, иерархическая структуризация статей по разделам, разбиение статей на поля (обычно только название и текст, но бывают и очень многочисленные и специфические поля), предметный указатель, разделение статей по типу и ссылки между статьями. В большинстве изданий можно искать статьи по словам и словосочетаниям.

Рассмотрим подробнее каждый из этих методов.

Разделение на статьи присутствует во всех исследованных электронных изданиях. Оно позволяет задать логические единицы информации размером от одного предложения до нескольких страниц текста, которые содержат минимальную необходимую информацию для объяснения какого-либо понятия, факта и т.п., т.е. разделение на такие информационные блоки позволяет справочному изданию выполнять свою основную функцию. Такое разделение также необходимо для организации информации по многим остальным упомянутым принципам: структуризации по разделам, разбиению на поля и установлению перекрестных ссылок.

Иерархическая структуризация статей по разделам позволяет ввести более крупные единицы информации (параграфы, главы, разделы и т.п.), тем самым, объединяя несколько подобных статей или подразделов в один блок с общим названием. Это добавляет новую возможность поиска необходимых статей и дает возможность находить дополнительные статьи, связанные по смыслу с исходными.

Разбиение статей на поля обычно позволяет задавать более тонкую структуру информации, по сравнению со структуризацией статей по разделам. Это облегчает поиск и восприятие информации, а также позволяет присваивать статьям атрибуты, что, в свою очередь, расширяет возможности поиска по словам.

Предметный указатель является, наравне со структурным указателем, самым традиционным из способов структуризации информации в справочнике, однако в современных электронных справочниках он присутствует далеко не всегда, особенно когда справочник предназначен для предоставления информации не по одиночным словам, а по сочетаниям из нескольких слов. Видимо, это объясняется сложностью составления грамотного предметного указателя для большого набора достаточно длинных словосочетаний, а также наличием поиска по словам.

Перекрестные ссылки между статьями могут быть как направленными (например, гиперссылки на отдельные термины, встречающиеся в тексте статьи), так и ненаправленными (например, синонимы). Ссылки, на наш взгляд, являются наименее изученным принципом структуризации информации, и за редким исключением авторы справочного издания расставляют ссылки по ходу работы над изданием, не представляя себе в целом ту новую структуру, которую ссылки создают. С одной стороны, ссылки предоставляют много дополнительных возможностей для поиска информации, но с другой, нарушают традиционное последовательное изложение, что может вызвать у пользователей проблемы с усвоением материала [24].

Разделение статей по типу встречается довольно редко и, как правило, различия носят кардинальный характер: это может быть, например, разделение на тексты статей и дополнения к ним в виде обобщающих схем и иллюстраций.

Поиск по словам и словосочетаниям в некоторой степени заменяет предметный указатель и в электронных системах используется гораздо чаще последнего, видимо, из-за сравнительной простоты реализации и эффективности.

Вообще, чем больше методов структуризации используется в справочном издании, тем у пользователей появляется больше свободы и поиск информации становится более удобным: каждая дополнительная структуризация не только добавляет новую возможность поиска информации, но также позволяет сделать остальные способы поиска более гибкими.

Большие (как правило, платные) системы отличаются тем, что используют больше методов структуризации из перечисленных выше, и эти методы используется в специфическом, настроенном под конкретный справочник виде.

Итак, выше мы описали семь методов структуризации информации, использующихся в справочных изданиях. Среди них можно выделить три основных способа поиска статей: описанные методы позволяют пользователям находить нужные статьи по определенным словам или словосочетаниям при помощи поиска по названиям разделов и статей в оглавлении, по списку терминов в предметном указателе или при помощи функции поиска по ключевым словам. Все эти методы предполагают, что пользователю заранее известны ключевые слова или термины, по которым нужно искать информацию. Перекрестные ссылки позволяют найти дополнительные статьи сверх тех, что были найдены первыми тремя способами. Ссылки существенно упрощают поиск дополнительной информации, когда содержание первоначально найденных статей непонятно или его недостаточно. К сожалению, на настоящий момент использование ссылок в электронных справочных изданиях, на наш взгляд, имеет два основных недостатка. Обычно ссылки расставляют следующим образом. Если в тексте статьи встречаются термины, которые объясняются в других статьях данного издания, то ставят ссылки, позволяющие переходить от первой статьи к дополнительным, т.е. статьям, содержащим объяснения терминов. Но понятно, что знания одних только терминов недостаточно для понимания сложных фактов, например, доказательств теорем. Другим недостатком, о котором уже упоминалось выше, является то, что расстановка ссылок при подготовке справочного издания не имеет заранее намеченного плана. Ссылки расставляются без учета удобства изучения материала, его сложности, и предназначены быть лишь второстепенным средством поиска дополнительной информации. Вдобавок, ссылки вводят альтернативность в способ подачи информации. Это значит, что пользователю периодически предлагается несколько путей: он может читать статью дальше, а может перейти по одной из ссылок к другой статье. Такая альтернативность существенно усложняет восприятие информации [24].

Целью данной диссертационной работы является развитие и реализация новых подходов к анализу семантически-структурированных предметных областей. Семантическая структурированность означает, что предметная область имеет некоторую внутреннюю структуру, которая может быть представлена направленным графом, вершины которого представляют собой статьи, на которая разбита предметная область, а дуги — логические отношения между статьями.

Кроме того, в созданной нами системе, которая была названа "Ареолой", реализован новый, не встречавшийся нам в других системах метод структуризации информации, а именно: иерархическая структуризация статей по сложности- Она позволяет ограничивать сложность доступной пользователю информации из справочника заданным уровнем. Ограничение уровня сложности не нарушает структуры, образованной логическими отношениями между статьями.

Созданная система является предметно-независимой. Энциклопедии, построенные на ее основе, не требуют от пользователя специальных навыков, знаний, программных или иных средств.

Заключение диссертация на тему "WEB-ориентированные инструментальные средства для изучения семантически-структурированных предметных областей"

ЗАКЛЮЧЕНИЕ

Программная оболочка "Ареола" на сегодняшний день является завершенным продуктом, позволяющим строить на его основе электронные энциклопедии, справочники и учебники по различным областям знаний, которые могут работать как через сеть Интернет, так и с компакт-дисков. Приведем основные результаты диссертационной работы:

1. Разработана технология создания предметно-независимых web-ориентированных инструментальных средств для изучения семантически структурированных областей знаний.

2. Технология реализована в виде программной системы "Ареола" и комплекса сервисных программ, обеспечивающих наполнение и функционирование системы.

3. На основе системы "Ареола" созданы и успешно апробированы информационно-справочные системы "Линеал" и "Параллель", доступные из сети Интернет и предназначенные для изучения линейной алгебры и параллельных вычислений.

Библиография Брызгалов, Петр Александрович, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Балабанова О., Шашенкова Л. Индивидуальность разработки курсов, или то, о чем обычно забывают. // e-LearningWorld Защищенное электронное обучение №2 Март-Апрель 2005

2. Брызгалов П.А. Возможности изучения семантически-структурированных предметных областей с помощью системы "Ареола" // Москва: Изд-во МГУ, 2006.

3. Брызгалов П.А. Система "Ареола" программная оболочка для создания электронных энциклопедий. // Вычислительные методыи программирование. Том 6, № 1. Москва: Изд-во МГУ, 2005. С. 136- 140.

4. Брызгалов П.А. Система "Ареола". Программная оболочка для создания электронных энциклопедий. // Труды всероссийской научной конференции "Научный сервис в сети Интернет". Москва: Изд-во МГУ, 2004. С. 260-262.

5. Брызгалов П.А. База данных системы "Ареола". // Вычислительные методы и программирование. Том 6, № 2. Москва: Изд-во МГУ, 2005. С.192 195.

6. Воеводин В.В., Воеводин Вл.В. Интернет-макет теоретического курса линейной алгебры. // Труды всероссийской научной конференции "Научный сервис в сети Интернет". Москва: Изд-во МГУ, 1999. С. 22-25.

7. Воеводин В.В., Воеводин Вл.В. ЛИНЕАЛ: электронная энциклопедия по линейной алгебре. // Вычислительные методы и программирование. Том 3, № 3. Москва: Изд-во МГУ, 2002. С. 110.

8. Воеводин В.В., Воеводин Вл.В. Электронные образовательные средства: новые идеи. // Вычислительные методы и программирование. Том 4, № 3. Москва: 2003, С. 1-10.

9. Воеводин Вл.В., Соболев С.И., Брызгалов П.А. АГОРА система Интернет-поддержки проведения научных мероприятий. // Труды всероссийской научной конференции "Научный сервис в сети Интернет". Москва: Изд-во МГУ, 2002 г. С. 291-292.

10. Вымятин В.М. Информационно-технологическое обеспечение ДО // Открытое и дистанционное образование. 2000. № 1. С. 18-28.

11. Вуль В.А. Электронные издания: Учебник. М.- СПб. Петербургский институт печати, 2001.

12. Гасов В.М., Цыганенко A.M. Методы и средства подготовки электронных изданий http://www.hi-edu.ru/x-books/xbook 119/01 /index.html?part-002.htm.

13. Гершунский Б.С. Философия образования для XXI века. Москва, 2002.

14. Григорьев С.Г., Краснова Г.А., Роберт И.В. и др. Разработка концепции образовательных электронных изданий и ресурсов // Открытое и дистанционное образование. № 3 (7). Томск, 2002. С. 31-33.

15. Демкин В.П., Вымятин В.М. Принципы и технологии создания электронных учебников. Томск, 2002.

16. Демкин В.П., Краснова Г.А., Роберт И.В., и другие Основные концепции создания образовательных электронных изданий (ОЭИ). http://www.eir.ru/comission.PHP?doc=/trudi/seminar3 lbelaev

17. Демкин В.П., Можаева Г.В. Классификация образовательных электронных изданий: основные принципы и критерии. http://www.ido.tsu.ru/ss/?unit=214.

18. Демкин В.П., Можаева Г.В. Технологии дистанционного обучения. Томск, 2003.

19. Кедрова Г.Е., Волкова М.В. О дидактических функциях WEB-дизайна. // Научный сервис в сети Интернет. Трудывсероссийской научной конференции "Научный сервис в сети Интернет". Москва: Изд-во МГУ, 2005. С. 289-290.

20. Краснова Г.А., Беляев М.И., Соловов А.В. Технологии создания электронных средств. Москва: Изд-во МГИУ, 2001.

21. Кречетников К.Г. Методология проектирования, оценки качества и применения информационных технологий обучения. Москва: Госкоорцентр, 2001.

22. Новые технологии в информационном обеспечении науки. http://www.benran.ru/Magazin/cgi-bin/Sb01/рг01 .ехе?! 15.

23. Система дистанционного обучения. Санкт-Петербургский Государственный Университет Информационных Технологий, Механики и Оптики http://de.ifmo.ru.

24. Шенников С.А. Открытое дистанционное образование. Москва, 2002.

25. Якубайтис Э.А., Тихонов М.Б. Энциклопедическая система дистанционного обучения. http://www.e-joe.ru/sod/00/600/yak.html.