автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.13, диссертация на тему:Разработка моделей и методов повышения эффективности функционирования системы образовательных Интернет-порталов

кандидата технических наук
Райнова, Ольга Дмитриевна
город
Москва
год
2006
специальность ВАК РФ
05.13.13
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка моделей и методов повышения эффективности функционирования системы образовательных Интернет-порталов»

Автореферат диссертации по теме "Разработка моделей и методов повышения эффективности функционирования системы образовательных Интернет-порталов"

На правах рукописи УДК 621.391.037.372

Райиова Ольга Дмитриевна

Разработка моделей и методов повышения эффективности функционирования системы образовательных Интернет—порталов

Специальность 05.13.13 - Телекоммуникационные системы и компьютерные сети

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Москва, 2006 г.

Работа выполнена в Федеральном государственном учреждении «Государственный научно-исследовательский институт информационных технологий и телекоммуникаций» (ФГУ ГНИИ ИТТ «Информика»)

Научный руководитель: доктор технических наук, профессор, Кулагин

Официальные оппоненты:

доктор технических наук, профессор Жданов B.C.

кандидат физико-математических наук Крейнес М.Г. .

Ведущая организация - Московский государственный институт радиотехники, электроники и автоматики (технический университет)

Защита состоится_2006 года в _ часов на

заседании диссертационного совета Д 212.133.03 в Московском государственном институте электроники и математики (техническом университете) по адресу: 109028, Москва, Трехсвятительский переулок, 13/12 стр.8.

С диссертацией можно ознакомиться в библиотеке Московского государственного института электроники и математики (техническом университете)

Автореферат разослан «_»_2006 г.

Ученый секретарь ЮЛ.Леохин

В.П.

диссертационного совета, кандидат технических наук, доцент

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

В настоящее время в России, в сфере образования и науки, бурно внедряются новые информационные технологии. Особое место в этом процессе занимает внедрение системы образовательных Интернет-порталов, когда пользователь, имея одну точку входа в сложную Интернет-ориентированную систему, может найти всю необходимую ему информацию. А.Н.Тихонов и А.Д.Иванников в работе "Основные положения концепции создания системы образовательных порталов" приводят следующее определение портала: портал — это сетевой узел или комплекс узлов, подключенных к Интернету по высокоскоростным каналам, обладающий развитым пользовательским интерфейсом и предоставляющий единый с концептуальной и содержательной точки зрения доступ к широкому спектру информационных ресурсов и услуг, ориентированных на определенную аудиторию.

Интернет-порталы сегодня занимают исключительно важное место для развития научной и инновационной деятельности в стране, являются незаменимым средством для разработчиков, предпринимателей, ученых, преподавателей, студентов, школьников. Поэтому особо важно постоянно повышать эффективность функционирования системы Интернет-порталов, улучшать качество сервисов предоставляемых пользователям. Главной характеристикой качества работы Интернет-порталов является возможность быстрого поиска необходимой информации. Вместе с тем из-за огромного роста объема информации, доступной в сети Интернет, поисковые методы уже достигают предела своих функциональных возможностей, не говоря уже о пределе их эффективности. Нужную информацию уже не представляется возможным получить сразу, так как в Интернете сейчас находятся миллиарды документов, к тому же сегодня их количество возрастает согласно экспоненциальной зависимости. Другой важной характеристикой, влияющей на повышение эффективности системы Интернет-порталов

является оптимизация прохождения трафика в магистральных сетях, связывающих Интернет-ориентированные системы. Разработке моделей и методов повышения эффективности функционирования образовательных порталов посвящена данная работа.

Большой вклад в становление системы образовательных порталов в сфере образования и науки, а также связывающих их высокоскоростных сетей телекоммуникаций, внесли российские ученые А.Д.Иванников, В.Н.Васильев, ЕШ.Кулагин, Ю.Л.Ижванов, М.В.Булгаков, Ю.В.Гугель, Е.Г.Гридина, М.Г.Крейнес, А.В.Сигалов и другие.

Актуальность темы. Вопросы повышения качества функционирования образовательных порталов, эффективного поиска информации в сети Интернет волнуют как на уровне рядовых пользователей сети Интернет - студентов, учителей, ученых, промышленников, инвесторов и т.д., так. и на уровне министерств и ведомств. Пользователю жизненно нужен навигационный инструментарий, облегчающий его работу в Интернет. Большую заинтересованность в исследовательских работах в области информационных технологий проявляет Министерство образования и науки Российской Федерации, Федеральное агентство по науке и инновациям и Федеральное агентство по образованию. Начало развития образовательных порталов получило в программе «Развитие единой образовательной информационной среды на 2001-2005 годы» и получило дальнейшее развитие в «Федеральной целевой программе развития образования на 2006-2010 годы». В межвузовские программы, в тематические планы ведущих институтов системы науки и образования включаются вопросы, связанные с портальной тематикой, разработкой новых средств информационных технологий, повышающих качество функционирования Интернет-ориентированных систем.

Поэтому решение задач разработки моделей и методов повышения эффективности функционирования системы образовательных Интернет-порталов, новых средств поиска информации, оптимизации транспортной сети порталов, разработки методов оценки их качества является актуальным, требующим постоянного внимания и развития в последующем.

Цель исследования. Диссертационная работа направлена на исследование и разработку моделей и методов повышения эффективности функционирования системы образовательных 'Интернет-порталов (и сети Интернет в целом). При этом основное внимание уделяется поисковым возможностям.

Методы исследования. Результаты основаны на использовании математического аппарата теории исследования операций, теории транспортных сетей, а также теории массового обслуживания.

Объект исследования. Объектом исследования является созданная и развивающаяся в России система образовательных Интернет-порталов.

Предмет исследования. Исследуются качественные характеристики функционирования системы Интернет-порталов (поисковые возможности, достижение гарантированного результата поиска, минимизация времени поиска, оптимальность маршрутизации сетевого трафика и другие).

Задача исследования. Для пользователя качество функционирования Интернет-порталов напрямую связано со скоростью получения необходимой достоверной информации. В настоящее время существует множество поисковых средств в сети Интернет. Несмотря на существующее многообразие исследований, направленных на разработку подходов, методов, средств и технологий поиска, динамика создания моделей, методов и средств поиска должна коррелировать с динамикой роста

информационного наполнения сети Интернет. В противном случае будет наблюдаться отставание в решении вопросов нахождения пользователем необходимой информации. Другими словами, работы по развитию различных средств эффективного поиска должны носить постоянный и динамичный характер.

Научная новизна и положения, выносимые на защиту.

Использование теорий исследования операций, транспортных сетей и массового обслуживания для решения задачи повышения эффективности функционирования Интернет-порталов позволило получить следующие выносимые на защиту новые научные результаты:

1. Метод многопроцессорной клиент-серверной реализации на базе технологии семиотического анализа текстов.

2. Постановка и алгоритм решения задачи достижения гарантированного результата поиска, включающей в себя разработку модели поиска. Модель дает описание цели, процесса, результатов поиска и нахождение оптимальной последовательности действий.

3. Модель оптимального функционирования сети Интернет-порталов на основе теории транспортных сетей и графов, и оптимизация прохождения трафика в магистральных сетях, связывающих Интернет-порталы.

4. Методы оценки качества системы Интернет-порталов на основе аппарата теории массового обслуживания.

Апробация работы. Основные положения диссертационной работы докладывались и обсуждались на Четвертой международной студенческой школе-семинаре «Новые информационные технологии» (Крым, 1996 г.), Научно-технической конференции студентов, аспирантов и молодых специалистов (Москва, 1997 г.), Пятой международной студенческой школе-семинаре «Новые информационные технологии» (Крым, 1997 г.), Научно-технической конференции студентов, аспирантов и молодых специалистов

б

(Москва, 1998 г.), Шестой международной студенческой школе-семинаре «Новые информационные технологии» (Крым, 1998 г.), Седьмой международной студенческой школе-семинаре «Новые информационные технологии» (Крым, 1999 г.), Восьмой международной студенческой школе-семинаре «Новые информационные технологии» (Крым, 2000 г.), на научных семинарах в Государственном научно-исследовательском институте информационных образовательных технологий, Федеральном государственном учреждении «Государственный научно-исследовательский институт информационных технологий и телекоммуникаций».

Практическая значимость. Основной практический итог диссертационной работы состоит в том, что разработанные модели и методы, основанные на теории исследования операций, теории транспортных сетей, а также теории массового обслуживания применены для создания программных средств, обеспечивающих эффективный поиск информации в сети Интернет. Результаты диссертационной работы внедрены в ФГУ ГНИИ ИТТ «Информика». Результаты работы также положены в основу подготовки отчетных материалов по выполнению ФГУ ГНИИ ИТТ "Информика" тематического плана за 2006 год, утвержденного Минобрнауки России. Результаты диссертационной работы были использованы в ГосНИИСИ.

Публикации. По материалам диссертации опубликовано И статей в российских изданиях и тезисов докладов на отраслевых, всероссийских и международных конференциях и семинарах.

Структура и объем диссертации. Диссертация состоит из введения, четырех глав, заключения, списка литературы из 72 наименований, 3-х приложений.

КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность проблемы, формулируется цель диссертации и задачи исследования, научная новизна и практическая значимость, основные положения, выносимые на защиту, излагаются методы исследований.

В первой главе приводится детальный анализ современного состояния системы Интернет-порталов. Рассматриваются структура образовательных Интернет-порталов. При этом оцениваются: работа служб и сервисов портала; архитектура; характеристика каналов связи; объем информационного наполнения; посещаемость, активность работы; дизайн, удобство работы; совместимость каталогов.

Проанализированы существующие каналы доступа к системе Интернет-порталов (на основе глобальной телекоммуникационной сети 1Ш1\Т\ГеО.

Представлен обзор состояния разработки семантических порталов, которые позволяют обрабатывать сложные запросы, находить информацию в репозитариях данных; находить и использовать '^еЬ-сервисы, делегировать решение сложных задач '\УеЬ-агентам.

Дан сравнительный обзор существующих поисковых систем. В этой связи исследуются средства поиска типа агентов, пауков, кроулеров и роботов, использующихся для сбора информации о документах, находящихся в Интернет. Данные средства представляют собой программы, которые занимаются поиском страниц в сети, извлекают гипертекстовые ссылки на этих страницах и автоматически индексируют информацию, которую они находят для построения базы данных. Каждый поисковый механизм имеет собственный набор правил, определяющий последовательность действий как собирать документы. Некоторые следуют за каждой ссылкой на каждой найденной странице и затем, в свою очередь, исследуют каждую ссылку на каждой из новых страниц, и так далее. Некоторые игнорируют ссылки,

которые ведут к графическим и звуковым файлам, файлам мультипликации; другие игнорируют ссылки к ресурсам типа баз данных WAIS; другие проинструктированы, что нужно просматривать прежде всего наиболее популярные страницы. В работе оцениваются положительные качества поисковых систем и ищутся возможности для нахождения резервов повышения эффективности их функционирования.

Обосновываются принципы, реализация, архитектура, информационное и технологическое обеспечение процесса поиска. Предложен вариант создания комплекса поисковых сервисов на базе технологии анализа текстовой информации. Вопросы реализации сценария поиска рассматриваются с точки зрения процессов, происходящих внутри поисковой системы. Анализ результатов поиска дан в виде итогового этапа оценки всей процедуры поиска, который может привести к удовлетворению информационной потребности. В качестве примера среды, позволяющей эффективно реализовать сформулированные принципы и требования, рассмотрена технология вычислительного анализа и поиска текстов, имеющая многопроцессорную клиент-серверную реализацию с \VEB-доступом. Технология базируется на расчетной процедуре построения для произвольного текста списка слов с весами, в своем сочетании являющихся наиболее характерными для конкретного текста.

Во второй главе предложено решение задачи достижения гарантированного результата поиска, базирующееся на теории операций. Формулируется ряд принципов гарантированного результата поиска. Как и всякий процесс, ход поиска (операции) описывается некоторым количеством

п фазовых координат Задание функций £¡(0 полностью описывает конкретное течение операции в данной модели. Степень соответствия хода поиска поставленной цели охарактеризовано достигаемым значением функционала

являющегося критерием эффективности. Цель операции математически означает стремление к увеличению величины критерия эффективности. Таким образом, стремление к увеличению критерия эффективности, является математическим описанием цели операции. Возможности действий оперирующей стороны представлены как набор некоторых величин

— ] — влияющих на фазовые координаты. Эти величины выбираются произвольно оперирующей стороной из некоторого заданного множества. Вообще говоря, этот выбор изменяется со временем или с получением информации о ходе операции, т. е. о фазовых координатах.

Величины Xj трактуются как реальное разбиение активных средств на группы, используемые в разных местах и в разное время, или просто как номер того или иного способа использования активных средств. Стратегией оперирующей стороны с точки зрения исследователя операции является правило поведения, разрешенное ожидающейся информацией, т. е.

операторы

Г, (О], где т, < г -3,, а 5, - неизбежное

запаздывание во времени, необходимое на получение и обработку информации о течении хода поиска и реализацию решения на назначение Ху в момент *.

Показано, что поскольку ¿¡д являются функциями контролируемых и неконтролируемых факторов, в общей схеме модели можно, опуская указание на промежуточную зависимость IV от <Л, записать критерий эффективности IV в виде:

Эта запись является общей схемой модели, если будет указано, что оперирующая сторона стремится увеличивать Ж и что возможные значения векторов X я У1' и У "' находятся в соответствующих областях, известных

10

исследователю операции, а для Ytl известны законы распределения.

Поскольку задание стратегии X = {xi(Xi,Yl',Y,!i! J™)} при данных

значениях неконтролируемых факторов определяет то этим

определяется и значение W. Приведено обоснование, что наряду с вышеуказанной формулой можно пользоваться записью

W = F(X,Y), =

Представлен конкретный пример модели численного поиска экстремума функций (случай минимизации машинного времени для нахождения необходимой пользователю информации).

Рассмотрена оценка эффективности решений при наличии неконтролируемых факторов.

Доказывается, что при соблюдении условий Липшица, при критерии

эффективности поиска гарантированная оценка

эффективности поиска равна

W - -к шах я, ,1 - хм ;0,5 max (х,., - х,)

В этом случае при разумном выборе стратегии ее эффективность возрастает с ростом N, т.е. увеличивается точность определения значения min f(x) вместе с ростом количества активных средств N.

В третьей главе решаются задачи оптимизации трафика транспортной сети Интернет-порталов. Рассматривается транспортная сеть, моделирующая взаимодействие системы Интернет-порталов и пользователей Интернет, дается описание ее структуры, показателей посещаемости, основные характеристики ее пунктов и коммуникаций. Особое внимание в главе уделено решению задачи нахождения кратчайшего пути между Web-страницами. При этом разработан алгоритм эффективного

перемещения пользователей по страницам Интернет-портала. Детально описаны пошаговые алгоритмы решения задачи. Решена задача моделирования сессий пользователя.

Формулируется и решается задача оптимизации сети Интернет-порталов. При определении критериев оптимальности принимается во внимание то, что при функционировании сети Интернет-порталов интересы двух основных групп - пользователей Интернет-порталов и его модераторов (службы поддержки функционирования портала) - частично совпадают. Пользователи Интернет-порталов стремятся получить конкретную интересующую их информацию с минимальными временными затратами. Модераторы Интернет-порталов считают, что их главной целью является максимизация информационного эффекта сети Интернет-порталов. Таким образом, выявляются два критерия оптимальности сети Интернет-порталов:

С

общий объем сессий пользователей (пользователи заинтересованы в

его минимизации) и информационный эффект сети Интернет-порталов р

(модераторы Интернет-порталов заинтересованы в его максимизации).

Любой Интернет-портал на некотором шаге может иметь множество различных реализаций - вариантов состояния портала. Каждый вариант характеризуется неким общим объемом сессий пользователей и информационным эффектом и может быть представлен как точка в двухмерном пространстве, в котором по горизонтальной оси отложен суммарный объем сессий пользователей (временные затраты пользователей), а по вертикальной - информационный эффект сети (он же для модераторов -экономический эффект сети).

пользователей

Вертикальные линии показывают минимально и максимально допустимые уровни временных затрат пользователей Стт и С[П>х.

\УеЬ-сайты, характеризующиеся временными затратами ниже Ст1п, будут слишком примитивными, чтобы удовлетворять запросам пользователей (на них, например, будет отсутствовать графика). \УеЬ-сайты с затратами выше Стах не будут удовлетворять пользователей ввиду избыточной, ненужной информации или ее неоптимальной структуры.

Верхняя горизонтальная линия показывает уровень Еф1т . это такой информационный эффект, который имел бы традиционный заказ информации через обычную читательскую библиотеку. Поисковые мероприятия в сети Интернет характеризуются более низкими временными затратами, а следовательно, приносят более высокий эффект в сравнении с традиционными средствами. Если информационный эффект сети Интернет-порталов ниже уровня Е0д1те, теряются преимущества поиска информации в сети Интернет; поэтому нужно стремиться, чтобы информационный эффект сети Интернет-порталов не снижался ниже уровня -Ефте •

Нижняя горизонтальная линия показывает минимально допустимый информационный эффект сети Интернет-порталов Етт. Снижение информационного эффекта сети Интернет-порталов ниже этого значения ведет к снижению эффективности функционирования Интернет-порталов.

На рисунке изображено пять гипотетических вариантов сети Интернет-порталов, которым соответствуют точки А,В, С,О и Е. Все эти точки лежат в желаемой области (выше линии Еф„ и между линиями Ст;п и Стах ).

Для выбора оптимального варианта сети среди множества допустимых по значению критериев качества функционирования порталов предлагается использовать универсальный критерий оптимальности:

ор* ~ г Е Е

где СС,Р и У - коэффициенты, задаваемые лицом, принимающим решение: сс

В результате задача оптимизации сети Интернет-портала сводится к нахождению набора параметров

г а°р',у = 1,2,...,МЧ,ЪЬ е В?},

при котором целевая функция достигает максимума:

Г = -а-С^ шах1;

а суммарный объем информационных блоков, отображаемых на полстраницах сети, не превышает их максимального объема:

X ) * <у"><? е й,у = 1,2.....Мц

Далее репхается задача оптимизации прохождения трафика в магистральных сетях, связывающих Интернет-порталы, так как нельзя ограничиваться только вопросами локальной оптимизации Интернет-порталов, а следует рассматривать и вопросы минимизации прохождения

трафика в гетерогенной сети Интернет, где узлами сети являются именно порталы. Решается задача минимизации общей задержки пакетов сообщений и, таким образом, устанавливается оптимальный маршрут прохождения сообщений с помощью алгоритма, реализуемого на сетевом уровне эталонной модели ОБ! (рассмотрен фиксированный алгоритм, при котором управление заключается в детерминированном распределении трафика в узле на пропорциональные части для передачи по двум или более выходящим из этого узла каналам). Поиск оптимума осуществляется путем решения системы уравнений при применении численного метода (метод Ньютона).

Рассмотрена сеть коммутации пакетов, состоящая из п узлов. Задача оптимизации заключалась в определении таких иу у=1,л, которые удовлетворяют выбранным ограничениям и минимизируют функционал

г=££Г_!а---1.'

Проанализирован алгоритм адаптивной маршрутизации пакетов в сетевом протоколе 081.

Приводится решение оптимизационной задачи маршрутизации пакетов, основанное на логических, детерминированных шагах, используя как аналог решение транспортных задач по доставке грузов в кратчайшее время и за минимальную стоимость их перевозки. При пуассоновских входных потоках задача оптимальной маршрутизации сводится к задаче минимизации выпуклой функции Т:

0.1)41 . и

при необходимых линейных ограничениях:

¡«V ® ¡«1Л»

где - интенсивность потока, протекающего по линии (у); X - суммарный входной поток;

Сц - пропускная способность канала (у).

Четвертая глава посвящена системному анализу системы Интернет-порталов, в которой она представлена как сложная комбинация Интернет-ориентированных систем - крупных Интернет-порталов (федеральных, региональных, специализированных), различных \УЕВ-серверов, клиентских приложений и систем управления данными. В главе формулируются требования к инструментальным средствам исследования и представляются модели обобщенной системы, обеспечивающие расчет основных технических показателей качества систем Интернет-порталов. Аналитическая модель обобщенной системы рассматривается как замкнутая смешанная стохастическая сеть массового обслуживания с экспоненциальным распределением времен поступления заявок и обслуживания. Использованы алгоритмические средства оценки качества обобщенной системы на основе имитационного моделирования. Осуществлен расчет основных технических, показателей исследуемой системы Интернет-порталов. Получены аналитические выражения для расчета основных параметров систем, таких как пропускная способность, загрузка WEB-cepвepoв и сервера баз данных, параметры очередей, среднее время обслуживания заявки заданного класса. Получен обобщенный вид функционала индекса производительности системы Интернет- порталов.

Заключение В работе осуществлен анализ основных процессов, связанных с формированием единой образовательной среды, а также с организацией эффективного доступа к информационным образовательным ресурсам. С учетом специфики образовательной информации показана необходимость создания комплекса поисковых сервисов на базе семиотического анализа текстов, имеющих многопроцессорную клиент-серверную реализацию с Web-дocтyпoм.

Сформулированы общие принципы решения задачи гарантированного результата поиска информации, и разработана модель минимизации затрат вычислительного ресурса для нахождения необходимой пользователю информации.

Проведено моделирование взаимодействия пользователей сети Интернет и Интернет-порталов и разработан алгоритм эффективного перемещения пользователей по страницам Интернет-порталов. Сформулирована задача оптимизации Интернет-порталов, заключающаяся в расположении информационных блоков на шеЬ-страницах таким образом, чтобы максимизировать нелинейный критерий оптимальности, учитывающий интересы пользователей. Решены задачи минимизации общей задержки пакетов сообщений и оптимизации времени и стоимости доставки пакетов.

Получены аналитические выражения для расчета основных параметров качества образовательных Интернет-порталов. Разработана аналитическая модель обобщенной системы Интернет-порталов в виде замкнутой смешанной стохастической сети массового обслуживания с экспоненциальным распределением времен поступления заявок и обслуживания.

Все разработанные в диссертационной работе модели и методы направлены на повышение эффективности функционирования системы российских образовательных порталов.

СПИСОК ПУБЛИКАЦИЙ ПО ТЕМЕ ДИССЕРТАЦИИ

1. Куракина О.Д. «Выбор маршрутизатора для подключения локальных сетей вузов к глобальным телекоммуникационным системам» //Четвертая международная студенческая школа-семинар «Новые информационные технологии», Крым, 1996 г., с.115.

2. Куракина О.Д. «Построение моделей протокольных реализаций, используемых в глобальных сетях и их тестирование» // Научно-техническая конференция студентов, аспирантов и молодых специалистов, Москва, 1997 г., с.118.

3- Куракина О.Д. «Разработка моделей протоколов Internet и их тестирование на соответствие стандартам» // Пятая международная студенческая школа-семинар «Новые информационные технологии», Крым, 1997 г., с.322.

4. Райнова О.Д. «Разработка поисковой системы с использованием языка программирования Java» // Научно-техническая конференция студентов, аспирантов и молодых специалистов, Москва, 1998 г., с.72.

5. Райнова О.Д. «Разработка поисковой системы для WWW-сервера» // Шестая международная студенческая школа-семинар «Новые информационные технологии», Крым, 1998 г., с.149-150.

6. Райнова О.Д. «Обзор существующих средств поиска информации в глобальных и корпоративных сетях» // «Информатика и машиностроение», Москва, 1999 г. № 1, с.25-27.

7. Райнова О.Д. «Анализ и принцип действия поисковых систем» // Седьмая международная студенческая школа-семинар «Новые информационные технологии», Крым, 1999 г., с.185

8. Райнова О.Д. «Оптимальное индексирование сервера поисковыми машинами» // Восьмая международная студенческая школа-семинар «Новые информационные технологии», Крым, 2000 г., с.334.

9. Райнова О.Д. "Решение задачи достижения наилучшего гарантированного результата поиска" Научно-практический журнал по информационным технологиям в образовании «Открытое образование», Москва, 2006 г., №1, с. 40-49.

10. Райнова О.Д. "Повышение эффективности функционирования Интернет-порталов" // Международная научная конференция "Информационные технологии и телекоммуникации в образовании и науке"

IT@ES'2006 (International Scientific Conference "Information Technologies and Telecommunications in Education and Science), Турция, май 2006, с. 64-67.

II. Райнова О.Д. «Оптимизация сети образовательного интернет-портала» // Журнал «Телекоммуникации и информатизация образования», Москва, № 3 (34), май-июнь, 2006, с. 129-134.

ИД № 06117 от 23.10.2001

Подписано в печать 25.10.2006. Формат 60x84/16. Бумага типографская № 2. Печать - ризография. Усл. печ. л. 1,2 Тираж 100 экз. Заказ

Московский государственный институт электроники и математики 109028, Москва, Б.Трехсвятительский пер., 1-3/12.

[г1 'ух ! Центр оперативной полиграфии I V, (095) 916-88-04, 916-89-25

Оглавление автор диссертации — кандидата технических наук Райнова, Ольга Дмитриевна

Глава

I. Структура системы образовательных порталов

1.1 .Анализ основных процессов информатизации в сфере образования,

1.2. Основные подходы к формированию и использованию образовательных порталов

1.3. Принципы, архитектура и реализация поисковых систем

1.3.1. Анализ поисковых систем

1.3.2. Описание, анализ и формирование зоны поиска

1.3.3. Технология семиотического анализа текстов. Выводы

Глава

II. Решение задачи достижения наилучшего гарантированного результата ноиска

2.1. Принцип гарантируемого результата поиска

2.2.Оценка эффективности решений. Выводы

Глава

III. Моделирование Интернет-норталов нри номощи транснортных сетей и графов

3.1. Описание характеристик интернет-порталов терминами теории сетей и графов

3.2. Моделирование процедур поиска ресурсов интернет-порталов

3.3. Оптимизация трафика в телекоммуникационных сетях, связывающих Интернет-порталы

3.3.1. Критерии оптимальности сети

3.3.2. Методы и алгоритмы управления информационными потоками. Выводы

Глава

IV. Методы оценки качества системы Интернет-норталов

1. Обзор методов исследования и оценки качества систем Интернетпорталов

4.2. Архитектура системы Интернет норталов

4.3. Разработка методов оценки качества системы Интернет-порталов

4.4. Оценка характеристик аналитической системы СИП. Выводы. Заключение Литература

Приложения

Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Райнова, Ольга Дмитриевна

Введение В настоящее время в России, в сфере образования и науки, бурно внедряются новые информационные технологии. Особое место в этом процессе занимает внедрение системы образовательных Интернет-порталов, когда пользователь, имея одну точку входа в сложную Интернет- ориентированную систему, может найти всю необходимую ему информацию. А.Н.Тихонов и А.Д.Иванников в работе "Основные положения концепции создания системы образовательных порталов" приводят следующее определение портала: портал это сетевой узел или комплекс узлов, подключенных к Интернету по высокоскоростным каналам, обладающий развитым пользовательским интерфейсом и предоставляющий единый с концептуальной и содержательной точки зрения доступ к широкому спектру информационных ресурсов и услуг, ориентированных на определенную аудиторию» [23]. Интернет-порталы сегодня занимают исключительно важное значение для развития научной и инновационной деятельности в стране, являются незаменимым средством для разработчиков, предпринимателей, ученых, преподавателей, студентов, школьников. Ноэтому особо важно постоянно повышать эффективность функционирования системы Интернет-порталов, улучшать качество сервисов предоставляемых пользователям. Главной характеристикой качества работы Интернет-портала является возможность быстрого поиска необходимой информации. Вместе с тем из-за быстрого роста информации, доступной в сети Интернет, поисковые методы быстро достигают предела их функциональных возможностей, не говоря уже о пределе их эффективности. Нужную информацию уже не представляется возможным получить сразу, так как в Интернете сейчас находятся возрастает миллиарды документов, к тому же сегодня их количество согласно экспоненциальной зависимости. Другой важной характеристикой, влияющей на повышение эффективности системы Интернет-порталов Введение является оптимизация прохождения трафика в магистральных сетях, связывающих Интернет-ориентированные системы. Разработке моделей и методов повышения эффективности функционирования образовательных порталов посвящена данная работа. Вопросы повышения качества функционирования образовательных порталов, эффективного поиска информации в сети Интернет волнуют как на рядовом уровне пользователей сети Интернет (студентов, учителей, ученых, промышленников, инвесторов и т.д.), так и на уровне министерств и ведомств. Пользователю жизненно нужен навигационный инструментарий, облегчающий его работу в Интернет. Большую заинтересованность в исследовательских работах в области информационных технологий проявляет Министерство образования и науки Российской Федерации, Федеральное агентство по науке и инновациям и Федеральное агентство по образованию. Начало развития образовательных программе порталов получило в «Развитие единой образовательной информационной среды на 2001-2005 годы» и получило дальнейшее развитие в «Федеральной целевой программе развития образования на 2006-2010 годы». В межвузовские программы, в тематические планы ведущих институтов системы науки и образования включаются вопросы, связанные с портальной тематикой, разработкой новых средств информационных технологий, повышающих качество функционирования Интернет-ориентированных систем. Поэтому решение задач разработки моделей и методов повышения эффективности функционирования системы образовательных Интернетпорталов, нахождения новых средств поиска информации, оптимизации транспортной сети порталов, разработки методов оценки их качества является актуальным, требующим постоянного внимания и развития в последующем. Диссертационная работа направлена на разработку моделей и методов повышения эффективности функционирования системы образовательных Введение Интернет-порталов (и сети Интернет в целом). При этом основное внимание уделяется поисковым возможностям. Результаты основаны на использовании математического аппарата теории исследования операций, теории транспортных сетей и графов, а также теории массового обслуживания. Объектом исследования является созданная и развивающаяся в России система образовательных Интернет-порталов. Исследуются системы качественные характеристики функционирования достижение поиска, Интернет-порталов результата (поисковые поиска, возможности, гарантированного минимизация времени оптимальность маршрутизации сетевого трафика и другие). Для пользователя качество функционирования Интернет-порталов достоверной напрямую связано со скоростью получения необходимой информации. В настоящее время существует множество поисковых средств в сети Интернет. Несмотря на существующее многообразие исследований, направленных на разработку подходов, методов, средств и технологий поиска, динамика создания моделей, методов и средств поиска должна коррелировать с динамикой роста информационного наполнения сети Интернет. В противном случае будет наблюдаться отставание в вопросах нахождения пользователем необходимой информации. Другими словами, работы по развитию различных средств эффективного поиска должны носить постоянный и динамичный характер. В данной работе делается попытка внести определенный вклад для улучшения качества функционирования имеющейся системы образовательных Интернет-порталов.

Заключение диссертация на тему "Разработка моделей и методов повышения эффективности функционирования системы образовательных Интернет-порталов"

Выводы:

1. Дан расчет основных качественных показателей исследуемой системы Интернет-порталов (СИП) как стохастической сети массового обслуживания. Получены аналитические выражения для расчета основных параметров качества СИП, таких как пропускная способность, загрузка "\УЕВ-серверов и сервера баз данных, параметры очередей, среднее время обслуживания заявки заданного класса. Получен обобщенный вид функционала индекса производительности СИП.

2. Предложены алгоритмические средства оценки качества СИП на основе имитационного моделирования, отличающиеся учетом параллельной обработки очередной заявки \¥ЕВ-приложением и сервером СУБД.

3. Разработана аналитическая модель обобщенной СИП в виде замкнутой смешанной стохастической сети массового обслуживания с экспоненциальным распределением времен поступления заявок и обслуживания, отличающаяся возможностью изменения класса сообщений и учетом множества \УЕВ-серверов и сервера баз данных.

Заключение Заключение

В работе приведен анализ основных процессов информатизации в системе образования. С учетом специфики образовательной информации показана необходимость создания комплекса поисковых сервисов на базе семиотического анализа текстов, имеющих многопроцессорную клиент-серверную реализацию с \УеЬ-доступом.

Сформулированы общие принципы решения задачи гарантированного результата поиска информации и разработана модель минимизации машинного времени для нахождения необходимой пользователю информации.

Проведено моделирование взаимодействия пользователей сети Интернет и Интернет-портала и разработан алгоритм эффективного перемещения пользователей по страницам Интернет-портала. Сформулирована задача оптимизации Интернет-портала, заключающаяся в расположении информационных блоков на \уеЬ-страницах таким образом, чтобы максимизировать нелинейный критерий оптимальности, учитывающий интересы пользователей. Решены задачи минимизации общей задержки пакетов сообщений и оптимизации времени и стоимости доставки пакетов.

Получен расчет основных качественных показателей системы Интернет-порталов. Получены аналитические выражения для расчета основных параметров качества данной системы. Разработана аналитическая модель обобщенной системы Интернет-порталов в виде замкнутой смешанной стохастической сети массового обслуживания с экспоненциальным распределением времен поступления заявок и обслуживания.

Все разработанные в диссертационной работе модели и методы направлены на повышение эффективности функционирования системы российских образовательных порталов.

Библиография Райнова, Ольга Дмитриевна, диссертация по теме Телекоммуникационные системы и компьютерные сети

1. Авен О.И. Турин H.H. Коган А.Я. Оценка качества и оптимизация вычислительных систем. М.: Наука, 1982 г. С. 464.

2. Альянах И.Н. Моделирование вычислительных систем. -Л.:Машиностроение. Ленингр. отд., 1988 г. С. 223.

3. Афонин A.A., Крейнес М.Г. Поиск Образовательных информационных ресурсов // Интернет-порталы. Содержание и технологии. Выпуск 1. М.: Просвещение. 2003 г. с.584-534.

4. Баженова И.Ю. Visual С++ 6.0. М.: Диалог-МИФИ, 1999 г.-С.416.

5. Барфилд Э., Уолтере Б. Программирование клиент-сервер в локальных вычислительных сетях. М.: Филинъ, 1997 г. С. 424.

6. Башарин Г.П., Бочаров П.П., Коган А.Я. Анализ очередей в вычислительных сетях. М.: Наука, 1989 г. С. 335.

7. Береговой В.И., Иванников А.Д., Тихонов А.Н. Стратегия создания и развития сети образовательных порталов. //Интернет-порталы. Содержание и технологии. Выпуск 1. М.: Просвещение. 2003 г. с. 19-63.

8. Блох А.Ш. Граф-схемы и их применение. Минск: Издательство «Вышэйшая школа», 1975 г. С.304.

9. Бочаров П.П., Печинкин A.B. Теория массового обслуживания.М.:РУДН, 1995 г. С.529.

10. Бройдо В.Л. Вычислительные системы, сети и телекоммуникации. Спб.: Питер, 2002 г. С.688.

11. Бэйкер P. Oracle 8i. Создание Web-приложений М.: ЛОРИ, 2001 г. С.723.

12. Велихов С. Справочник по HTML 4. М.: Оверлей, 2001 г. С416.

13. Вентцель Е. С. Теория вероятностей 7-е изд. стер. М: Высшая школа, 2001 г. С.575.

14. Волков Д. Как оценить рабочую станцию / Открытые системы,2, 1994 г., с. 44-48.

15. Волков Д., Французов Д., Новое поколение тестов SPEC. / Открытые системы, №4, 1996 г., с. 73-74.

16. Гермейер Ю.Б. Оптимизация и исследование операций / М.: Наука, 1971 г. С.383.

17. Генри Д. Java Server Pages. Библиотека профессионала. М.:Вильяме, 2002 г. С.464.

18. Гешвинде Э., Шенинг Г.Ю. Разработка WEB-приложений на PHP и PostgreSQL. М.: ДиаСофт, 2003 г. С.608.

19. Гнеденко Б.В., Коваленко И.Н. Введение в теорию массового обслуживания, 2-е изд., М.:Наука, 1987 г. С.336.

20. Денисов A.A., Колесников Д.Н. Теория больших систем управления. JI.: Энергоиздат, 1982 г. С.288 .

21. Елашкин М. Кто сильнее кит или слон? / СЮ №2(12), М., 2003 г. с.72-75.

22. Жожикашвили В.А., Вишневский В.М. Сети массового обслуживания. Теория и применение к сетям ЭВМ. М.: Радио и связь, 1988 г. С. 192.

23. Иванников А.Д., Тихонов А.Н. Основные положения концепции создания ситемы образовательных порталов. //Интернет-порталы. Содержание и технологии. Выпуск 1. М.: Просвещение. 2003 г. с. 8-17.

24. Камер Д. Компьютерные сети и Internet М.: Вильяме, 2002 г.1. С.640.

25. Кастаньетто Д. и др. Профессиональное PHP программирование. М: Символ Плюс, 2001 г. С.912.

26. Киллелиа П. Тюнинг WEB-сервера Спб.: Питер, 2003 г. С.528.

27. Клейнрок JI. Вычислительные системы с очередями: Пер. с англ. М.:Мир, 1979 г. С.600.

28. Клейнрок JI. Теория массового обслуживания: Пер. с англ. М.:Машиностроение, 1979 г. С.432.1. Литература

29. Кокс Д. Р., Смит У. JI. Теория очередей: Пер. с англ. М.: Мир, 1966 г. С.218.

30. Кулагин В.П. Система ресусрсных центров и развитие единого образовательного информационного пространства// Ресурсные центры сферы образования России. Москва 2004 г. с. 19-34.

31. Кулагин В.П., Тихонов А.Н. Ресурсные центры сферы образования-задачи, создания, состояние, переспективы развития//Телекоммуникации и информатизация образования. 2003 г. №5. с.36-56.

32. Кулагин В.П., Найханов В.В., Овезов Б.Б., Роберт И.В., Кольцова Г.В., Юрасов В.Г. Информационные технологии в сфере образования. М.: Янус-К, 2004 г. С.248.

33. Куракина О.Д. «Выбор маршрутизатора для подключения локальных сетей вузов к глобальным телекоммуникационным системам» //Четвертая международная студенческая школа-семинар «Новые информационные технологии», Крым, 1996 г., с.115

34. Куракина О.Д. «Построение моделей протокольных реализаций, используемых в глобальных сетях и их тестирование» // Научно-техническая конференция студентов, аспирантов и молодых специалистов, Москва, 1997 г., с.118.

35. Куракина О.Д. «Разработка моделей протоколов Internet и их тестирование на соответствие стандартам» // Пятая международная студенческая школа-семинар «Новые информационные технологии», Крым, 1997 г., с.322.

36. Лебедев А.Н., Чернявский Е.А. Вероятностные методы в вычислительной технике. М.: Высшая школа, 1986 г. С.312.

37. Матвеев В.Ф., Ушаков В.Г. Системы массового обслуживания. М.: Изд-во МГУ, 1984 г.С.240.

38. Мальцева СВ. Информационное моделирование WEB-ресурсов Интернет. М.: Глобус, 2003 г.С.216.1. Литература

39. Мельтцер К., Михальски Б. Разработка CGI-приложепий на Perl.M.: Вильяме, 2001 г. С.400.

40. Минзов А.С, Грачев В.В. Оценка эффективности системы дистанционного обучения / Дистанционное образование №3, М., 1999 г. с.37-41.

41. Райнова О.Д. «Разработка поисковой системы с использованием языка программирования Java» // Научно-техническая конференция студентов, аспирантов и молодых специалистов, Москва, 1998 г., с.72.

42. Райнова О.Д. «Разработка поисковой системы для WWW-сервера» // Шестая международная студенческая школа-семинар «Новые информационные технологии», Крым, 1998 г., с. 149-150.

43. Райнова О.Д. «Обзор существующих средств поиска информации в глобальных и корпоративных сетях» // «Информатика и машиностроение», Москва, 1999 г. № 1, с.25-27.

44. Райнова О.Д. «Анализ и принцип действия поисковых систем» // Седьмая международная студенческая школа-семинар «Новые информационные технологии», Крым, 1999 г., с. 185

45. Райнова О.Д. «Оптимальное индексирование сервера поисковыми машинами» // Восьмая международная студенческая школа-семинар «Новые информационные технологии», Крым, 2000 г., с.334.

46. Райнова О.Д. "Решение задачи достижения наилучшего гарантированного результата поиска" Научно-практический журнал по информационным технологиям в образовании «Открытое образование», Москва, 2006 г., №1, с. 40-49.

47. Райнова О.Д. «Оптимизация сети образовательного интернет-портала» // Журнал «Телекоммуникации и информатизация образования», Москва, № 3 (34), май-июнь, 2006 г., с. 129-134.

48. Тавридович С.А. Линейная сетевая модель Web-проекта. Задача об оптимальной структуре рекламы // Современные аспекты экономики. -СПб.:2002 г.-№4(17). с.36-40.

49. Тавридович С.А. Оптимизация Web-сайта Интернет-магазина // Современные аспекты экономики. СПб.: 2003 г. - № 16 (44). с.60-63.

50. Тавридович С.А. Решение задачи оптимизации Web-сайта Интернет-магазина с использованием генетического алгоритма // Современные аспекты экономики. СПб.: 2004 г. - № 1 (52). с. 133-139.

51. Тавридович С.А. Сетевая модель Web-проекта. Моделирование посещения пунктов уникальными пользователями // Современные аспекты экономики. СПб.: 2002 г. -№ 7 (20). с. 130-132.

52. Тавридович С. А. Сетевые транспортные задачи: Практикум / Балт. гос. техн. ун-т. СПб., 2002 г. с.54.

53. Тихонов А.Н., Кулагин В.П. Ресурсные центры сферы образования. Единое образовательное информационное пространство.//Вестник образования. 2003 г. №2. с.52-60.

54. Тихонов А.Н., Иванников А.Д., Гридина Е.Г., Куракина Н.И., Симонов A.B., Чиннова И.И. Комлексный анализ системы федеральных образовательных порталов. // Интернет-порталы. Содержание и технологии. Выпуск 2. М.:Просвещение. 2004 г. с. 192-226.

55. Тихонов А.Н., Иванников А.Д., Булгаков М.В., Гридина Е.Г и др., Федеральный горизонтальный портал "Российское образование"// Интернет-порталы. Содержание и технологии. Выпуск 2. М.:Просвещение. 2004 г. с. 10-56.

56. Олифер В. Г., Олифер H.A. Компьютерные сети. Принципы, технологии, протоколы.// 2-изд. СПб: Питер-пресс, 2002 г. С.864.

57. Павловский Ю. Н. Имитационные модели и системы. М:1. ФАЗИС, 2000 г. С.144.

58. Свами М., Тхуласираман К. Графы, сети и алгоритмы: Пер. с англ. М.: Мир, 1984 г. С.455.

59. Феррари Д. Оценка производительности вычислительных систем. М.: Мир, 1981 г. С.576.

60. Хилайер С, Мизик Д. Программирование Active Server Pages М.: Русская редакция. 2000 г. С.320.

61. Храмцов П.Б., Брик С.А. и др. Основы web-технологий. М.: ИНТУИТ.ру, 2003 г. С.512.

62. Чистяков В.П. Курс теории вероятностей 5-е изд. М.: Агар, 2000 г. С.255.

63. Шагурина Н. Web-службы: новая парадигма интеграции? / Сетевой журнал №2, М., 2003 г. с. 14-17.

64. Шэннон Р. Имитационное моделирование систем. М.: Мир, 1978 г. С.418.

65. Baskett F., Chandy К.М., Muntz R.R., Palacios F.G. Open, Closed and Mixed Networks of Queues with Different Classes of Customers//.!. Assoc. Comput. Mach. 1975. - Vol. 22, N 2. - P. 248 - 260.

66. Beiluer H.S. On the construction of computing system simulators.Experimental computer performance evaluation, North-Holland, 1981, P. 1-32.

67. Buzen J.P. Computational Algorithms of Closed Queuing Networks with Exponential Servers//Commun. ACM. 1973 - Vol. 16, N 9. -P. 527-531.

68. Chen H., Yao D. Fundamentals of Queueing Networks. Springer Verlag; 1st edition ,2001. 424 p.

69. Friedman H.P. Statistical methods in computer perfomance evaluation. Experimental computer performance evaluation, North-Holland, 1981, P.79-105.

70. Gross D. Harris C. Fundamentals of Queueing Theory. Wiley

71. Литература Interscience; 3rd edition, 1998. 439 P.

72. Mamrak S.A., Amer P.D. Statistical procurement methodologies.Experimental computer performance evaluation, North-Holland, 1981, P. 118-132.