автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Математическое и программное обеспечение семантического поиска в портально-сетевых комплексах учебного назначения

кандидата технических наук
Тюрин, Андрей Геннадиевич
город
Москва
год
2012
специальность ВАК РФ
05.13.11
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Математическое и программное обеспечение семантического поиска в портально-сетевых комплексах учебного назначения»

Автореферат диссертации по теме "Математическое и программное обеспечение семантического поиска в портально-сетевых комплексах учебного назначения"

На правах рукописи

ТЮРИН АНДРЕЙ ГЕННАДИЕВИЧ

МАТЕМАТИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ СЕМАНТИЧЕСКОГО ПОИСКА В ПОРТАЛЬНО-СЕТЕВЫХ КОМПЛЕКСАХ УЧЕБНОГО НАЗНАЧЕНИЯ

Специальность 05.13.11 Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

Автореферат

диссертации на соискание ученой степени кандидата технических наук

Москва 2012

005049171

005049171

Работа выполнена на кафедре Технических и информационных средств систем управления (ТИССУ) Московского государственного технического университета радиотехники, электроники и автоматики (МГТУ МИРЭА)

Научный руководитель доктор технических наук, профессор

Раев Вячеслав Константинович, профессор кафедры ТИССУ МГТУ МИРЭА

Официальные оппоненты: Цветков Виктор Яковлевич

доктор технических наук, доктор экономических наук, профессор, профессор кафедры экономики и предпринимательства МГУГиК (МИИГАиК)

Колосов Дмитрий Эдуардович

кандидат технических наук, ведущий научный сотрудник ИУО РАО

Ведущая организация Открытое акционерное общество «Институт

электронных управляющих машин им. И.С. Брука» (ИНЭУМ)

Защита состоится 27 декабря 2012 г. в 15 часов 00 минут на заседании диссертационного совета Д 212.131.05 при Московском государственном техническом университете радиотехники, электроники и автоматики (МГТУ МИРЭА) по адресу: г. Москва, пр. Вернадского, д.78.

С диссертацией можно ознакомиться в библиотеке МГТУ МИРЭА. Автореферат разослан « 20 » ноября 2012 г.

Отзывы на автореферат в двух экземплярах, заверенные печатью, просим направлять по адресу: 119454, г.Москва, пр. Вернадского, д. 78, МГТУ МИРЭА, Д 212.131.05

Ученый секретарь диссертационного ^^г——■

совета, к.т.н., доцент Е.Г. Андрианова

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность исследования. Совершенствование портально-сетевых комплексов в настоящее время идёт в основном по пути создания более эффективных алгоритмов и программ для их поисковых сервисов в условиях существенно интенсифицированных потоков данных. Семантический поиск с опорой на онтологические соглашения проектов является наиболее важной составляющей частью всего многообразного функционирования информационных систем и сетей в составе образовательного портально-сетевого комплекса, поскольку именно точность, пертинентность и когнитивность выдаваемой конечному пользователю информации главенствуют в числе многих других показателей информационного обеспечения.

Развитие единого информационно-образовательного пространства России предусматривает создание системы профильных образовательных порталов, объединенных интегрирующей и координирующей программно-аппаратной структурой - мега-порталом «Российское образование». В настоящей диссертации под термином «портально-сетевой комплекс» или «портально-сетевой консорциум» (ПСК) понимается совокупность профильных образовательных порталов, библиотек, блогов, репликаций и др., с автономной системой сопряжения и управления, образующих единое информационное пространство, созданных в поддержку той или иной образовательной сферы.

Рост темпов производства образовательной информации, в том числе, мультимедийной информации учебного назначения, подвергает

информационную инфраструктуру портальных комплексов повышенной нагрузке и порождает ряд наукоемких вопросов, которые ждут своего решения. Среди этих вопросов в диссертации отмечаются:

- несоответствие формально релевантной информации действительным потребностям её потребителя;

- недостаточная полнота комплекса образовательных услуг с учетом постоянно расширяющейся и обновляющейся дидактической тематики образовательного процесса;

слабая изученность энтропийных процессов в расслоенном информационном пространстве;

- отсутствие практических рекомендаций по семантическому поиску, управлению и сопровождению сетевого портального обустройства предметной области «Информатика» в системе непрерывного образования.

Диссертантом учтено и то обстоятельство, что математическое и программное обеспечение методов и технологий семантического поиска информации учебного назначения с учетом семантико-энтропийных характеристик многоуровневых портально-сетевых комплексов в открытой литературе практически отсутствует, и поэтому затруднена возможность применить готовые технические решения в этой области.

В связи с вышеизложенным, целью данной диссертационной работы является восполнение пробела в области математического и программного обеспечения семантического поиска в портально-сетевых комплексах учебного назначения. При этом анализируются возможности повышения эффективности применения сетевых портальных комплексов в образовательном процессе на основе рационального выбора критериев оценки базовых характеристик поиска, семантико-энтропийное регулирования его полноты и точности в условиях существенно интенсифицированных потоков данных.

Для достижения поставленной цели и внедрения в практику отечественной образовательной индустрии научных положений, выводов и рекомендаций диссертации в ней решаются следующие задачи:

• Разработка и исследование модель семантико-энтропийного регулирования характеристик управления сетевыми портальными консорциумами в системе непрерывного образования «Школа - Вуз -Дополнительное образование».

• Разработка модели прогноза значений энтропии в расслоенных архитектурах информационного пространства семантических образовательных сетей.

• Улучшение результативности поисковых сервисов работающих с использованием семантико-энтропийного анализа контента.

• Определение системы оценок и критериев для качественных показателей портальных комплексов учебного назначения,

• Разработка методики формирования тестовой коллекции терминов и дефиниций, определяющих основное тематическое содержание образовательного портала для проведения экспериментальных оценок качества семантического поиска.

• Разработка модели многомерной оценки семантико-энтропийных характеристик многоуровневых портальных систем на примере микропортальных комплексов, разрабатываемых в ЦНИТ МГТУ МИРЭА.

• Осуществление внедрения научных положений, выводов и рекомендаций диссертации в учебную практику МИРЭА и других научно-образовательных учреждений.

Объектом исследования диссертации являются сетевые портальные комплексы учебного назначения, а также входящие в состав этих комплексов сервисы, рассмотренные с привлечением семантических представлений в оценке качества управления файлами. Предмет исследования определён соответствующей предметной областью паспорта специальности 05.13.11 и перечисленными выше задачами диссертации.

Методы исследования. Научные положения диссертации сформированы с использованием теории групп и теории множеств, теории программирования, методов тензорного анализа и компьютерного моделирования, методов экспертных оценок, методических основ построения сетевых порталов.

Научная новизна результатов исследования заключается в том, что в диссертации впервые на основе концепции информационного морфизма, как фундаментального теоретического представления о системности информационных средств, разработаны и реализованы комплексные подходы к оценке характеристик семантического поиска в сетевых портальных комплексах, используемых в образовании. Разработана многомерная модель семантико-энтропийного регулирования характеристик и параметров управления портально-сетевыми комплексами. Даны прогнозные оценки вариаций энтропии методом скользящего среднего и посредством обучаемой нейронной сети. Разработана модель оценки релевантности и пертинентности откликов на запросы пользователей сетевых порталов, с использованием семантико-энтропийного анализа контента. Автором в процессе комплексных исследований проведенных в 2006-2012 гг. в области математического моделирования функционала портально-сетевых комплексов даны расширенные толкования этих фундаментальных понятий. Разработаны и применены на практике комплексные критерии полноты и точности отображения информации, учитывающие всю совокупность семантических аспектов оценок.

Практическая ценность работы состоит в том, что научные положения диссертации в части портально-сетевого обустройства вошли в разделы ряда отраслевых документов, регулирующих внедрение новых технических методов и средств в образовательные процессы. В том числе:

• Определены критерии для качественных показателей микро-портальных систем учебного назначения, позволяющая повысить полноту и релевантность результатов поиска в образовательных порталах.

• Разработана методика формирования тестовой коллекции терминов и дефиниций, определяющих основное тематическое содержание образовательного портала необходимое для организации онтологического регулирования поисковых операций в ПСК.

• Разработана многомерная модель оценки семантико-энтропийных характеристик многоуровневых портальных систем на примере портально-сетевого комплекса «Информатика», которая позволяет учесть результаты, полученные при разработках многоуровневых портальных консорциумов по ряду других направлений образования.

• На основе использования материалов диссертационной работы выпущено учебно-методическое пособие под грифом УМО «Интерфейсы информационных систем» для подготовки студентов и магистров высших учебных заведений, обучающихся в МГТУ МИРЭА по направлению 230200 «Информационные системы». Получено Свидетельство о государственной регистрации программы для ЭВМ № 2011612862 от 8 апреля 2011 г. «Система фильтрации образовательного контента».

Обоснованность и достоверность теоретических выводов и практических рекомендаций определяются корректностью математических выкладок, объективностью физических основ и теоретических предпосылок, лежащих в основе экспериментальной верификации теоретических положений, использованием методов компьютерного моделирования, положительным опытом применения апробированных критериев и оценок при проведении многолетних экспериментов по качеству поиска, точности, отображению и восприятию учебной информации студентами факультета «Информационные технологии» МГТУ МИРЭА.

Научные положения, выводы и рекомендации диссертационной работы докладывались и обсуждались на девяти научно-технических конференциях, в том числе на 10-й Международной юбилейной конференции С5ТВ-08. На основе рекомендаций диссертационной работы при участии диссертанта разработаны, одобрены и внедрены в практику Руководящие Технические Материалы (РТМ): «Руководящий технический материал (РТМ.) «Программно-методическое обеспечение образовательных технологий дополнительного развивающего образования детей и юношества в сфере информатики и НИТ»,

Выпуск 2011 года; в 6 частях и Руководящий технический материал (РТМ.) «Информационное обеспечение образовательных технологий средствами макромедиа под Онтонет/Экстранет управлением», Выпуск 2010г. (в четырех частях). При участии диссертанта в Центре Новых Информационных Технологий (ЦНИТ) МГТУ МИРЭА разработан и внедрен в учебный процесс портально-сетевой комплекс «Информатика» с суммарным ресурсом 7.72 Гб.

Результаты диссертации внедрены в учебный процесс МГТУ МИРЭА и Московского Городского Дворца Детского (Юношеского) Творчества (МГДЦ(Ю)Т) по следующим четырём направлениям:

• по направлениям подготовки «Информационные системы», «Информационные системы и технологии» для магистров, специалистов, бакалавров, прикладных бакалавров по выпускающей кафедре Технических и информационных средств систем управления (ТИССУ) МГТУ МИРЭА;

• в информационное обеспечение блока дисциплин «Информатика», «Надежность информационных систем», «Интерфейсы информационных систем» и др. по кафедре ТИССУ МГТУ МИРЭА для студентов традиционной формы обучения и студентов двухпрофильного обучения в системе элитного образования в МГТУ МИРЭА (по программам ассоциации инженерного образования РФ);

• по информационному обеспечению системы дополнительного образования студентов и школьников по информационным технологиям и информатике в развитие учебных дисциплин школьной программы и дисциплин первого курса высшей школы;

• в поддержку функционирования отделения повышения квалификации преподавателей ВШ РФ и СПО, НПО по программам МИНОБРНАУКИ РФ и сопутствующим им программам НТО.

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

Во Введении обоснована актуальность выбранной темы, сформулированы цель работы, а также задачи для её достижения. Изложена проблематика предметной области, определены направления исследований, результаты которых могут восполнить пробел в существующих технических решениях.

Первая глава «Методы, модели и технологии построения многоуровневых портально-сетевых консорциумов (ПСК)» посвящена подробному анализу состояния работ в области теории и практики построения

ПСК. В ней определены пробелы в существующих технических решениях, которые призвана восполнить данная диссертация. В частности, проанализированы современные архитектуры многоуровневых информационных систем в образовательной индустрии, базовые подсистемы вертикальных образовательных порталов, управление подсистемами порталов. Рассмотрены поисковые системы многоуровневых консорциумов вертикальных образовательных порталов, особенности и методика семантико-энтропийного регулирования информационного морфизма информационных систем.

В обзоре диссертантом показано, что в системном понимании морфизм представляет собой класс эквивалентности, взаимодействие. Чаще всего информационный морфизм трактуется как протяженный во времени процесс взаимозависимого изменения параметров информационного объекта и информационного пространства, его окружающего. Количественная оценка информационного морфизма может быть получена нахождением полного функционала взаимодействующих инфокоммуникационных систем при известных функциях изменения их параметров.

Вероятностная модель информационного морфизма М между двумя объектами О, и О, в образовательной информационной среде определяется

следующим образом: М(Уп = +к*К , ]' где " " относительное

количество информации в дуплексном обмене массивами элементарных семантических единиц (ЭСЕ) между О, и О; (самый общий случай информационного обмена между объектами О, и О,) в информационном пространстве; и - относительные в долях распределения информации в потоках в направлениях от О, к О, и от О, к О,, к - сложный коэффициент междолевого баланса. Этот сложный коэффициент, величина которого существенно влияет на показатель морфизма, в диссертации конфигурирован как е в степени числа, определяемого через биномиальные коэффициенты треугольника Паскаля.

Показателем упорядоченности в этой модели является информационная энтропия взаимодействия объектов, что является базисом семантико-энтропийных оценок.

Значительное внимание в Главе 1 уделено языковому/платформенному, управленческому и онтологическому регулированию в информационных системах. Отмечено, что главнейшую роль при разработке современных

приложений следует уделить разработке следующих трех уровней проектного соглашения:

1 Языковое/платформенное соглашение. Вся информация, связанная с языковыми соглашениями: информация о кодовой странице, классификации символов, правилах сравнения символов и их упорядоченности, формате денежной величины, чисел, даты и времени, а также языке сообщений, передается процессу во время запуска. Платформенное соглашение подразумевает совокупность правил, указаний для разработки текстовых форматов легко читаемых компьютером. Оно позволяет недвусмысленно представить данные, избегать платформенной зависимости и распространённых ошибок таких, как отсутствия возможности расширения, отсутствия международной и местной поддержки.

2 Управленческое соглашение. Под ним в работе понимается соглашение между иерархически связанными или не связанными агентами и иными модулями по поводу совместного решения управленческих дел. Это соглашение должно содержать все атрибуты системного подхода при формировании информационного ресурса. К ним относятся: метаописания (карточка ресурса), положение о главном рубрикаторе (включая описание информационных контейнеров), метаописания (карточка ресурса), регламентирование характеристик качества, сроки и порядок исполнения.

3 Онтологическое соглашение. Является системным подходом для формирования онтологии предметной области. При этом используется математический аппарат - необогащенные системы логических соотношений. Рассматривается представление различных элементов онтологии предметной области в модели - описания ситуаций, знаний, математических терминов и конструкций, а также вспомогательных терминов.

В качестве примера на Рис.1 приведена структура разработанного диссертантом трехуровневого проектного соглашения по предметной области «Информатика».

Первая глава диссертации завершается разделом «Постановка задачи», в котором на основе аналитического обзора данной главы выявлены пробелы в существующих технических решениях и сформулированы уточнённые задачи, отвечающие цели диссертации. Эти задачи перечислены на стр.5 данного автореферата.

Рис.1.Структура трехуровневого проектного соглашения по предметной области «Информатика»

В Главе 2, названной «Исследование многомерных семантико-энтропийных характеристик и возможности их применения к тематическим образовательным порталам», развивается понятие информационного морфизма посредтвом преобразования классической формулы энтропии для многослойного информационного пространства.

Вероятностная модель информационного морфизма М между двумя объектами О] и С^ в образовательной информационной среде представляется в виде, описанным выше в обозрении первой главы диссертации:

Ееь-о

М> = (V» + '

Чтобы вычислить энтропию объектов О, и О,, подсчитываем число

I" (А)

взаимодействий между ними 0 4 , которое зависит от виртуальной структуры взаимодействующих объектов. Энтропия информационного взаимодействия многомерного объекта О, с многомерного объекта О, определена следующим образом :

/Г (О,)

я°'(0,)= 108.4--'

где (} - категория структурированных (упорядоченных) подмножеств знаний, а б - категория хаотических (неупорядоченных) знаний. В многоуровневых образовательных порталах, обобщенную энтропию можно представить, как сумму проекций средних условных энтропий относительно исполнения целевого при учете условий действия отдельных влияющих на систему факторов.

Для реализации этого принципа используется известная формула А. Харкевича:

КГ.

1 } J

После адаптирующих преобразований с учетом многоуровневости ПСК, формула Харкевича получает следующий вид:

Ну ~ 1°§я

г ¡¡г

КК V '] У

где Н - информация (в нашем случае энтропия), Гу - информации, дублирующейся из ¡-го объектов, в объекте; Р - суммарное количество информации, дублирующееся у всех объектов; Р1 - суммарное количество дублирующейся информации ¡-го объекта у всех объектов; ^ - суммарное количество информации у объектов, дублирующихся в ]-ом объекте; п -количество слоев; е - номер различающегося по характеристикам слоя.

Приведенное выражение позволяет оценить энтропию взаимодействия многослойного информационного пространства. Оценку энтропии двухслойной информационной системы диссертант выполнил в инновационной разработке «Информационная система поддержки междисциплинарного учебного комплекса дополнительного образования сектора НИТ МГДЦ(Ю)Т «Информсреда в образовании»», первым слоем которой являлось ядро этой системы, а вторым слоем - окружение ядра.

В диссертации приведен алгоритм определения обобщенной энтропии взаимодействия информационных систем с многослойной архитектурой и определена роль энтропии в расслоенных информационных пространствах. Обобщенная энтропия взаимодействия в диссертации рассматривается как сумма проекций средних условных энтропий. Условные энтропии проецируются на

общую ось целевого критерия, и в результате использования метода конформных преобразований обеспечивают свертку числа осей измерений:

Я,(ЛГ) = -±р, 1=1 Р,-1

я2т= -±р, м 2 '°8„ Р,-г

¿=1 , Р,-,

Порядок (алгоритм) определения обобщенной энтропии взаимодействия (и/или обобщенной негэнтропии) многоуровневых информационных систем в работе представлен следующим образом: 1) Определение пределов и объемов исследуемой системы, ее элементов и их взаимосвязей, пространства состояний и его размерность. 2) Определение функциональных связей с окружающей информационной средой. 3) Оценка стабильности системы по времени и в результате воздействий. 4) Выявление и описание в виде вероятностных характеристик марковских процессов и процессов, относящихся к эргодическим системам. 5) Выявление и оценка конкуренции внутри и вне системы (на получение и обработку ресурсов). Исследование конфликтных ситуаций, в том числе в комплицированных формах. 6) Системный анализ полученной формулы или модели обобщенной энтропии. Уточняются, в частности, возможные пределы изменения возможных воздействующих факторов, дисперсия изменений и ее влияние на обобщенную энтропию взаимодействия системы, при этом стремясь удержать рост обобщенной энтропии взаимодействия или уменьшить ее значение. 7) Уменьшение обобщенной энтропии взаимодействия путем улучшения структуры ИС.

Анализ представленного алгоритма показывает, что величина обобщенной энтропии взаимодействия пригодна, как для оценки простых однослойных систем, так и систем с многослойной архитектурой, характерной для портальных консорциумов. В качестве примера рассматривается портал, в котором X] представляют плотности информации в пространственных ячейках ц . Самопроизвольная эволюция системы (например, в случае критической ситуации) сводится к конечному выравниванию плотности информации по всем ячейкам Х(г))=Х]=сопз1. В терминах теории расслоенных пространств легко достигается обобщение для полного пространства. В рассматриваемом случае - это множество вариаций,

база - множество распределений. Характеристикой расслоенности является число микросостояний К при объёмах V :

VI

/=1

Таким образом, разница между V, N относительна и определяется слоем, к которому они относятся. Вместо этого выражения, использующего параметры первого и второго слоев, получено общее выражение для микросостояний системы:

Т/(л-1) Дг(1-1) тгп _ ' _ _

V" ~ лг1-»

IIх? ГК"!

/=I

Абсолютная удельная энтропия, определенная по п-ому слою в общем

виде:

„„ 1п К" 1п К" Н — ■

у(п-1) Д/-И-1

Наконец, определена вероятность состояния W, определяемая как отношение числа микросостояний К, благоприятных данному макросостоянию, к полному числу возможных микросостояний Ь многоуровневой портальной системы:

К"

Видно, что при многократном применении оператора вероятности распределение стремится к асимптотическому вырождению, обосновывающему уменьшение энтропии взаимодействия информационной системы. В диссертации показано, как происходит это вырождение.

В работе представлена модель прогнозных значений энтропии в расслоенных архитектурах информационного пространства на основе метода скользящего среднего, использующего переход от начальных значений ряда микросостояний к их средним значениям на выбранном интервале времени. Модель дополнена построением прогноза значений энтропии с помощью обучаемой нейронной сети. Выявление тренда из случайной временной последовательности, отражающей наиболее важные тенденции в развитии информационного процесса, представляет существенный практический

интерес. Применение этой модели на практике отражено в разработке программного модуля расчета прогнозных значений энтропии многослойной информационной системы, структурная схема которого показана на Рис.2.

Рис.2. Структура модуля расчета прогнозных значений энтропии программного комплекса

Глава 3 посвящена разработке и исследованию программно-аппаратного комплекса оценки функционала тематических образовательных порталов. Значительное место отведено онтологическим вопросам семантического поиска данных и управления сетевым портальным комплексом поддержки предметной области по информатике в системе непрерывного образования. Рассмотрены следующие вопросы: 1) Реализация базового курса информатики в системе непрерывного образования "Школа - ВУЗ - Дополнительное образование" с информационной поддержкой многоуровневого образовательного консорциума. 2) Базовый стандарт основного общего образования по информатике и информационно-телекоммуникационным технологиям. 3) Вузовская базовая ступень (на примере специальности «Информационные системы и технологии»). 4) Ступень (подсистема) дополнительного образования в модели «школа-вуз».

Формы изучение информатики и информационно-коммутационных технологий на базовых уровнях образования с определением целей этого изучения вынесены в Приложение 1.

В диссертации приведены результаты и выводы по итогам исследований и проектирования микропорталов на примере информационной поддержки предметной области «Информатика» . В частности, сопоставительные расчеты многомерной векторной энтропии и показателей пертинентности и релевантности ИС в отношении трехуровневых «вики систем» контента «Информатика» показали, что рациональное конфигурирование массивов начальной информации из репозитария по информационным контейнерам, а затем соотнесение этих контейнеров к уровням и даже их дублирование по этим уровням является самым эффективным средством достижения наиболее благоприятных соотношений пертинентности и релевантности системы при заданном ограничении обобщенной многомерной энтропии. Так, в объеме практических решаемых в исследовании предпроектных задач по отношению к трехуровневой википедии «информатика» в случае удачно выполненного конфигурирования (всего до 80 контейнеров на 3500 W и HTML файлов репозитария) соотношение пертинентности к релевантности достигало 75% при ограничении многомерной обобщенной энтропии величиной 0,6.

В диссертации приведено подробное описание разработанного диссертантом программного модуля расчета производительности портально-сетевого консорциума (ПСК). Аппаратная часть на базе процессора Core i3 3.07 ГГц или выше (ОЗУ: 2 Гб) обеспечивает поддержку и возможность функционирования операционной системы и средств программного комплекса. Для корректной установки и функционирования программного комплекса на ПК присутствовала операционная система Windows 7 Professional. Так как одним из условий функционирования системы является работа в сети, то для ее корректной работы предусмотрено сетевое аппаратное обеспечение: сетевая карта с поддержкой протокола Ethernet и обеспечивающая скорость передачи данных 10/100 Мбит/с. и выше Приведен подробный типовой расчет производительности портально-сетевого комплекса. Описание ресурса и структуры микро-порталов, а также существенные фрагменты ПО вынесены в Приложения 2 и 3.

В работе диссертанта получило дальнейшее развитие понятий семантической релевантности и пертинентности. Поисковый образ запроса ПОЗ вместе с критерием соответствия КС составляет поисковое предписание:

ПП=П03+КС. ПСК в ответ на запрос, выполняя поисковое предписание, выдаёт определённую совокупность документов, отражающую соответствие информационной потребности документарной выдаче. Структура этого соответствия представлена на Рис.3. Отмечается что, соотношение пертинентности и синергетической релевантности в сопоставлении с результирующей энтропией информационного ресурса ПСК является генеральной характеристикой его синергетических достоинств. Установлено также, что окончательная формула расчета пертинентности Википедии выглядит точно также как и усеченная формула для релевантности семантически однородных Википедий.

пертииеитнпсть

Информационная потребность

Рис.3. Соотношение информационной потребности документной выдачи в ПСК

Полнота и точность выдачи являются зависимыми характеристиками ПСК. Выявлены ограничения на эти показатели у практически работающих систем. Если система нерационально сконструирована, то её полнота и точность могут быть как угодно малыми; здесь никакого ограничения нет. Если же искусственно сформировать такую систему, которая будет содержать только документы,

релевантные относительно всех запросов определённого типа, и которая будет грубо выдавать весь свой массив в ответ на каждый запрос, то мы обнаружим в этом случае стопроцентную полноту и точность: П = Т = 1. Но в реальной практике такое положение маловероятно. Более того, если в имеющейся информационной системе путём изменения условий её работы или критерия выдачи стараемся повысить один из этих показателей, то другой неизбежно падает. Если выдача ограничивается первым эшелоном, содержащим документы с наибольшим априорным показателем релевантности, то среди них действительно окажется достаточно много реально релевантных и достаточно мало фактически шумовых документов, т. е. точность Т будет высокой. Но в этом эшелоне не будет ряда документов с меньшим показателем релевантности, но реально полезных пользователю. Попытка получить эти документы, приняв в выдачу следующие эшелоны документов, приведёт к повышению полноты П, но при этом в выдачу попадёт много низко релевантных документов, которые пользователем будут отсеяны как шумовые, т. е. снизится показатель точности Т. Это положение в работе получило экспериментальную верификацию, результаты которой приведены на рис.4 а-г.

Рис 4. Зависимости между полнотой (П) и точностью (Т) выборки; а) в одномерных ПСК, б) в многомерных ПСК, в) в одномерных ПСК с онтологическим регулированием, г) в многомерных ПСК с онтологическим регулированием. 1 - контент не нормирован; 2 -контент умеренно нормирован; 3 -сверхнормированный контент

Для выявления зависимости между коэффициентами полноты и точности по пертинентности и релевантности в портальных консорциумах в работе предложено использование однопараметрической модели Раша. Приведены расчетные и экспериментальные результаты.

Образовательный ПСК по направлению подготовки «Информационные системы» в работе определен как центральное звено многоуровневого информационного портально-сетевого консорциума. Изначально этот ПСК спланирован таким образом, чтобы при весьма ограниченной ресурсной базе он обладал бы свойствами и возможностями как горизонтального, так и вертикального портала, что позволило бы на его базе конфигурировать минипорталы кафедр, микропорталы отдельных преподавателей и дисциплин и еще на одном следующем уровне - микропорталы и библиотеки многих и многих персональных пользователей с присутствием признаков технологий «вики» и «мультимедиа».

При реализации ПСК использована оболочка, разработанная в ГНИИ ИТТ «Информика» и апробированная при создании Федерального образовательного портала. Она использует следующие программные продукты: операционную систему FreeBSD 4.5 (UNIX) - популярный многоплатформенный свободно распространяемый продукт; Web сервер Apache 1.3; система управления реляционными базами данных MySQL; пакет PHP 5, который является набором PHP скриптов, исполняемых в адресном пространстве Web сервера (Apache), с помощью которых можно реализовывать стандартный набор сервисов информационного портала (новости, форумы, регистрация, публикация, статистика и т.д.). PHP 5 является свободно распространяемым программным продуктом. Адаптация пакета PHP 5 под конкретные задачи образовательного портала заключается в редактировании имеющихся и/или написании новых скриптов. PHP 5 может работать с различными реляционными СУБД, в частности с MySQL.

Разработанный портал, опубликованный в ОФАП, по направлению подготовки является типовым и может являться прототипом при создании порталов других специальностей и направлений с учетом их особенностей и профиля (гуманитарные, технические и т.д.).

В Заключении диссертации обобщены основные научные и практические результаты, отмечена их научная новизна и практическая значимость, приведен перечень основных научных результатов, полученных автором лично и выносимых им на защиту.

Основные результаты работы, выносимые на защиту:

1. Посредством исследования семантико-энтропийных характеристик многоуровневых портально-сетевых консорциумов (ПСК) определена роль энтропийных процессов в межслойном взаимодействии элементов в расслоенных архитектурах ПСК учебного назначения. Конфигурирована система критериев основных качественных показателей портальных комплексов учебного назначения, таких как пертинентность, релевантность, точность и полнота выдачи в эшелонах выдачи запрашиваемых документов.

2. С использованием метода скользящего среднего разработана модель прогноза значений энтропии в расслоенных архитектурах информационного пространства семантических образовательных сетей.

3. Создан программный модуль расчета производительности информационной системы. Программными методами обеспечена фильтрация паразитной информации в образовательном контенте ПСК.

4. Разработана и исследована модель семантико-энтропийного регулирования характеристик управления сетевым портальным консорциумом в системе непрерывного образования «Школа - Вуз -Дополнительное образование». Улучшена результативность поисковых сервисов работающих с использованием семантико-энтропийного анализа контента.

5. Предложена и применена методика формирования тестовой коллекции терминов и дефиниций, определяющих тезаурус образовательного портала с целью проведения экспериментальных оценок качества семантического поиска.

6. Определены и апробированы пути построения онтологического регулятора на примере микро-портальных комплексов Центра Новых Информационных Технологий МГТУ МИРЭА.

7. Проведен комплекс экспериментов с портапьно-сетевыми консорциумами по измерениям и улучшению значений коэффициентов полноты и точности выдачи запрашиваемых документов. Установлено, что чувствительность смещения отношения «полнота-точность» для различных значений поискового запроса существенно зависит от специфики ресурсного контента ПСК.

8. Осуществлено внедрение результатов диссертации в практические разработки Центра Новых Информационных Технологий МГТУ МИРЭА. Произведено внедрение научных положений диссертации в учебный процесс

кафедры ТИССУ по дисциплинам «Информатика» и «Интерфейсы информационных систем».

По теме диссертации опубликовано 10 печатных работ, в том числе 3 статьи в журналах из Перечня ВАК. Результаты работы доложены на 9 международных и российских конференциях. Подготовлены учебные и методические пособия, используемые студентами магистратуры, специапитета, бакалавриата и прикладного бакалавриата кафедры ТИССУ МГТУ МИРЭА в учебно-исследовательской работе, а так же в реализации НИРС, НТТМ и развивающего дополнительного образования студентов и школьников. Получено авторское свидетельство о государственной регистрации программы для ЭВМ № 2011612862 от 8 апреля 2011 г. «Система фильтрации образовательного контента».

Список публикаций по теме диссертации

1. Раев В.К., Тюрин А.Г. Семантический поиск информации в многоуровневых сетевых портальных консорциумах. ( № 66-В2012.) - М.: ВИНИТИ РАН №4,2012,14с.

2. Тюрин А.Г. Применение классической теории энтропии к управлению контентом многоуровневых образовательных порталов / Научно-методический журнал «Информатизация образования и науки» - №2[14], М., 2012-с. 124-129

3. Кошкин Д.Е., Тюрин А.Г. Кластеризация текстов для последующего применения в семантическом поиске образовательных порталов / Научно-практическая конференция «Современные информационные технологии в управлении и образовании» Т.З (НИИ «Восход») - М.: ООО «Издательство «Проспект», 2011 - с. 159-164

4. Мордвинов В.А., Тюрин А.Г. Выявление семантического поля слов. Труды XVIII Всероссийской научно-методической конференции «Телематика'2011», 20-23 июня 2011г. Санкт-Петербург, том 2, С. 233-235.

5. Тюрин А.Г. Система фильтрации образовательного контента / Свидетельство о государственной регистрации программы для ЭВМ № 2011612862 от 8 апреля 2011 г.

6. Тюрин А.Г. Регулирование энтропийных показателей контента в многоуровневых порталах учебного назначения / «Всероссийский журнал научных публикаций» - ноябрь-декабрь 2011, - М.: ООО «Эстет», 2011, ISSN 2079-7052-с. 29-33

7. Тюрин А.Г., Шемончук Д.С. Исследования методов повышения эффективности информационного поиска. / Искусственный интеллект: философия, методология, инновации. Материалы Четвертой Всероссийской конференции студентов, аспирантов и молодых ученых. Часть 1, г. Москва,

МИРЭА, 10-12 ноября 2010 г. Под ред. Д.И. Дубровского и Е.А. Никитиной - М.: «Радио и Связь», 2010.-с. 121-123

8. Казенников А.О., Трифонов Н.И., Тюрин А.Г. Исследования методов компьютерной лингвистики для задач повышения эффективности информационного поиска / Научно-методический журнал «Информатизация образования и науки» - №3[7], М., 2010 - с. 10-20

9. Тюрин А.Г. и др. Руководящий технический материал по информационному обеспечению образовательных технологий мобильными средствами аудио-видео поддержки и виртуализации-52 с. - ОФАП - МОСКВА, 2008/Рег.№11937.

10. Мордвинов В.А., Тюрин А.Г. Предметная область "информатика" в многоуровневом портальном строительстве информсреды непрерывного образования. - М: МИРЭА, 2008 - 14с. - Деп. в ВИНИТИ 29.01.08 № 57-В20

Подписано в печать: 19.11.2012 Объем: 1,0 п.л. Тираж: 100 экз. Заказ № 693 Отпечатано в типографии «Реглет» 119526, г. Москва, пр-т Вернадского, д. 39 (495) 363-78-90; www.reglet.ru

Оглавление автор диссертации — кандидата технических наук Тюрин, Андрей Геннадиевич

ГЛОССАРИЙ.

ВВЕДЕНИЕ.

ГЛАВА 1. МЕТОДЫ, МОДЕЛИ И ТЕХНОЛОГИИ ПОСТРОЕНИЯ МНОГОУРОВНЕВЫХ ПОРТАЛЬНО-СЕТЕВЫХ КОНСОРЦИУМОВ.

1.1. Анализ современных архитектур и технологий построения многоуровневых информационных систем в образовательной индустрии.

1.2. Базовые подсистемы вертикальных образовательных порталов. Управление подсистемами порталов.

1.3. Поисковые системы многоуровневых консорциумов вертикальных образовательных порталов.

1.4. Особенности и методика семантико-энтропийного регулирования информационного морфизма информационных систем на синергетической основе.

1.5. Языковое, управленческое о онтологическое регулирование ИС.

1.6. Постановка задачи.

ГЛАВА 2 ИССЛЕДОВАНИЕ МНОГОМЕРНЫХ СЕМАНТИКО-ЭНТРОПИЙНЫХ ХАРАКТЕРИСТИК И ВОЗМОЖНОСТИ ИХ ПРИМЕНЕНИЯ К ТЕМАТИЧЕСКИМ ОБРАЗОВАТЕЛЬНЫМ ПОРТАЛАМ.

2.1 Преобразование классической формулы энтропии в многослойном информационном пространстве.

2.2 Алгоритм определения обобщенной энтропии информационных систем с многослойной архитектурой.

2.3 Роль энтропии в расслоенных информационных пространствах.

2.4 Модель прогнозных значений энтропии на основе метода скользящего среднего.

2.5 Построение прогноза значений энтропии с помощью обучаемой нейронной сети.

2.6 Краткие выводы.

ГЛАВА 3. ПРОГРАММНО-АППАРАТНЫЙ КОМПЛЕКС ОЦЕНКИ ФУНКЦИОНАЛА ТЕМАТИЧЕСКОГО ОБРАЗОВАТЕЛЬНОГО ПОРТАЛА.

3.1. Программный модуль расчета прогнозных значений энтропии информационной системы.

3.2. Семантический поиск и управление сетевого портального обустройства поддержки предметной области по информатике в системе непрерывного образования.

3.2.1. Реализация базового курса информатики в системе непрерывного образования "Школа - ВУЗ - Дополнительное образование" с информационной поддержкой многоуровневого образовательного консорциума.

3.2.2. Базовый стандарт основного общего образования по информатике и информационно-телекоммуникационным технологиям.

3.2.3. Вузовская базовая ступень (на примере специальности «Информационные системы и технологии»).

3.2.4. Ступень (подсистема) дополнительного образования в модели «школа-вуз».

3.2.5. Некоторые результаты и выводы по итогам исследований и проектирования микропорталов на примере информационной поддержки предметной области «Информатика».

3.3. Разработка и описание программного модуля расчета производительности портально-сетевого консорциума (ПСК).

3.3.1 Предпосылки к выбору аппаратной платформы.

3.3.2 Соблюдение условий проведения расчета производительности портально-сетевого комплекса.

3.4. Критерии и эшелоны выдачи: семантическая релевантность и пертинентность.

3.4.1. Полнота и точность результатов поиска: соотношения и близость пертинентности и релевантности.

3.4.2. Переход к многомерной векторной энтропии в оценке информационного морфизма образовательных порталов.

3.4.3. Образовательный ПСК по направлению подготовки «Информационные системы» - центральное звено многоуровневого информационного портального консорциума.

3.5. Проведение измерений коэффициентов полноты и точности выдачи документов.

3.6. Краткие выводы.

Введение 2012 год, диссертация по информатике, вычислительной технике и управлению, Тюрин, Андрей Геннадиевич

С каждым годом объемы и разнообразие информации, представляемой в портально-сетевых комплексах, неуклонно растут. Под портально-сетевыми комплексами в работе понимается совокупность функционирующих совместно многоуровневых распределенных хранилищ информации портального, библиотечного и других типов и связывающих их и многочисленных конечных пользователей сетей. В таких комплексах сегодня размещены миллионы файлов, причем, наряду с современной актуальной информацией, имеется немало устаревших, не актуальных и даже ложных информационных ресурсов. Выделение из этого компьютерно-сетевого сообщества истинно ценного для образовательной индустрии и эффективно используемого ее участниками портально-сетевого обустройства приводит исследователей, проектировщиков и модераторов образовательных порталов и библиотек к формированию слитных, разветвленных многоуровневых портально-сетевых архитектур, определенных в ряде специальных публикаций ведущего в этой области научного учреждения ГНИИ ИТТ ИНФОРМИКА как информационные многоуровневые образовательные портальные консорциумы [2,4.8,64,67,92]. При этом такого рода консорциумы характеризуются единством и унификацией трех главенствующих проектных соглашений - единых для всех входящих в консорциум модулей, подсистем и сетевых сегментов, а именно:

• единое языковое/платформенное (кроссплатформенное) проектное соглашение;

• единое управленческое проектное соглашение;

• единое онтологическое проектное соглашение [3,4]

Все три соглашения как неделимое, единое и целое действуют в пределах всего жизненного цикла проекта информационного образовательного консорциума и самого консорциума как объекта проектирования и сопровождения в образовательных технологиях.

Именно с этих позиций в диссертации делается попытка выявить, упорядочить, представить и реализовать на практике в образовательной индустрии методы и средства управления семантическим поиском в портально-сетевых комплексах учебного назначения, или что то же самое, в портально-сетевых многоуровневых распределенных информационных консорциумах. Семантический поиск, и на его основе с опорой на объявленные онтологии (онтологическое соглашение проекта) является наиболее важной составляющей частью всего многообразного функционирования информационных систем и сетей в составе образовательного консорциума, поскольку именно точность, пертинентность и когнитивность выдаваемой конечному пользователю информации главенствуют в числе многих других показателей информационного обеспечения [3-9]. По данным открытых источников, а также данным почерпнутым из реальной проектной деятельности автора диссертации можно придти к выводу о том, что если в отношении моделирования, проектирования и сопровождения отдельно взятых образовательных порталов учебного назначения выполнены и опубликованы результаты многочисленных исследований и проектов (см. например, [18, 89], то в отношении объединенных компьютерно-сетевых обустройств по типу информационных образовательных консорциумов, такого рода исследования и проектные предложения разработаны не в полной мере. Восполнение этого пробела является одной из целей настоящей диссертации.

В современной образовательной среде одной из наиболее важных проблем является семантико-энтропийный анализ контента не только по отдельно взятому порталу, но и в совокупности консорциумов образовательных порталов [54,85]. Во многом эта проблема обусловлена нерациональной работой клиентов порталов, что связано с неэффективными процедурами поиска требуемой информации, которые предусматривают последовательный слабоуправляемый просмотр различных ресурсов, а также вполне естественной изначальной неподготовленностью клиентов к точному отождествлению информационного запроса с последующими образовательными потребностями. На сегодняшний день двуединую задачу поиска необходимой информации решают специальные поисковые системы, причем в образовательной индустрии поисковые алгоритмы и программы поиска кроме достижения абсолютной релевантности должны обеспечивать высокие пертинентность и когнитивность. Существует достаточно большое количество систем, осуществляющих такого рода поиск информации во всем пространстве образовательных ресурсов, и прежде всего в его русскоязычной части.

Каждая поисковая система реализует свой уникальный поисковый алгоритм, являющийся ноу-хау разработчиков. При этом алгоритмы и реализации разных поисковых систем, одновременно работающие в консорциуме, не должны конфликтовать друг с другом, в том числе и по онтологическим признакам, то есть не имеют право выдавать неадекватную информацию на схожие по смыслу запросы нескольких поисковых реализаций. Современные поисковые системы, в принципе, нацелены на реализацию такого рода непростую задачу. Они позволяют производить лексический разбор искомого текста, вести поиск по нескольким словоформам, реализовывать оценку по типажам метаописаний и онтологий, задавать и оптимизировать различные режимы поиска информации и т.д. Принципы работы различных поисковых систем во многом идентичны. В основе работы каждой из них лежит индексированный каталог или база данных, формируемые как продукт онтологического соглашения проекта. В них собрана информация об известных поисковым машинам страницах, и сведения о том, где происходит поиск.

Регулирование и упорядочение образовательного контента с опорой на онтологии, рассматриваемое в настоящей работе, способно привести к разгрузке портальной среды путем сокращения числа просматриваемых ресурсов и упорядочения поиска за счет их предварительного семантико-энтропийного анализа и ранжирования. Тем самым улучшается информационный морфизм как отдельно взятых образовательных порталов, так и всего образовательного консорциума в целом [21,22]. Такой подход в настоящей диссертации, в частности, реализуется созданием специализированных уточняющих алгоритмов математических моделей и программ поиска образовательных ресурсов информационной среде консорциума по заданным на онтологической основе признакам. Как показано в данной работе, в таких системах можно значительно повысить эффективность поиска, применяя специальные оптимизирующие алгоритмы классификации собираемых о ресурсах данных, позволяющие сократить число просматриваемых ресурсов, сделать поиск более целенаправленным. В качестве примера системы специализированных образовательных ресурсов в работе рассматривается распределенная многоуровневая система образовательных порталов в составе информационного образовательного консорциума.

Многоуровневые образовательные консорциумы, к настоящему времени, как правило, насчитывают значительное количество реальных порталов и сетевых соединений, действующих на территории России, хранящих и транслирующих специальную информацию, разрозненный поиск которой обычными способами приводит в ряде случаев к необходимости просматривать непомерно расширенное количество информационных ресурсов. Специализация, вытекающая из создания консорциумных архитектур, существенно гармонизирует эту проблему. Например, по сравнению с децентрализованным поиском, бесспорно преимущество централизованного поиска и обобщения найденной информации силами конечного пользователя из информационной среды многоуровневого расслоенного информационного образовательного многоуровневого консорциума («Федеральный горизонтальный портал Российское образование» «Вертикальный образовательный портал Инженерное образование <-> вспомогательные образовательные ресурсы федеральных отраслевых региональных порталов, сайтов библиотек <-* привязанных к образованию консистов, сайтов и порталов «Интуит.ру», «ВИКИПЕДИЯ», информационный сайт ГНИИ ИТТ «Информика» и др. сайты и портальное обустройство учреждения образования и его факультетов и отделений

Горизонтальный портал специальности, направления, специализаций портал кафедры, класса <-»• порталы и блоги преподавателей, ученых; микропорталы отдельных дисциплин <-> тендеры, зеркалирование, виртуальные туннели, репликации, персональные порталы, блоги и твиттеры массовых конечных пользователей (учащихся) в системе образования [53,60,69,70].

Централизованное представление информации в консорциуме, обобщенное на основе единого онтологического перечня, вовсе не означает абсолютной равнозначности различных уровней и отдельных модулей информационного обустройства. Так, в приведенном вьппе примере обустройства консорциума, очевидным является закрепление приоритетных положений за федеральным порталом «Российское образование» по сравнению с нижерасположенными и частными уровнями. Наряду с заметным сокращением числа обращений к контенту при поиске, подготовительные процедуры для поиска в рассматриваемой системе требуют предварительного сбора и обработки значительных объемов информации, что загружает поисковый сервер. Причем загрузка в значительной степени -зависит от установленных критериев и алгоритмов оценки -собираемой информации. Таким образом, в рамках заданной информационной системы, необходимо организовать процедуры сбора необходимых данных с входящих в нее порталов, провести классификацию порталов по этим данным и предоставить пользователю системы возможность обращения непосредственно к наиболее ценному порталу и его контенту.

Осложняет ситуацию и то обстоятельство, что математическое и программное обеспечение методов и технологий семантического поиска информации учебного назначения с учетом семантико-энтропийных характеристик многоуровневых портально-сетевых комплексов в открытой литературе практически отсутствует, в связи с чем затруднена возможность применить готовые технические решения в этой области.

В связи с вышеизложенным, целью диссертационной работы является разработка математического и программного обеспечения семантического поиска в портально-сетевых комплексах учебного назначения с учетом, отвечающих поставленной цели, следующих трёх предметных областей исследования:

• исследование семантико-энтропийных характеристик многоуровневых портально-сетевых комплексов учебного назначения, в частности исследование энтропийных характеристик в многоуровневых портально-сетевых комплексах;

• разработка и описание моделей, алгоритмов, программного обеспечения, методик и рекомендаций позволяющих осуществлять эффективный поиск, хранение и обработку учебной информации в среде портально-сетевых комплексов образовательного назначения создаваемых и сопровождаемых на единой, унифицированной онтологической основе на весь период их жизненного цикла (под семантико-энтропийным управлением);

• исследование влияния информационного морфизма на показатели пертинентности и релевантности портально-сетевых комплексов.

Перечень конкретных задач решаемых в диссертации будет дополнен, конкретизирован и уточнен по результатам аналитического обзора текущей проблематики (раздел 1.5 Главы 1).

Результаты, выводы и рекомендации, содержащиеся в диссертации и отраженные в опубликованных методических пособиях, во многом базируются на опыте практических разработок 2007-2012 годов, выполненных при участии автора в МГТУ МИРЭА, а также на опыте научно-преподавательской работы в Московском городском дворце детского (юношеского) творчества в тот же период. Эти результаты и научные положения диссертации используются:

• по направлению подготовки «Информационные системы» для магистров, специалистов, бакалавров, прикладных бакалавров по выпускающей кафедре Технических и информационных средств систем управления;

• в информационное обеспечение блока дисциплин «Информатика», «Введение в специальность» по кафедре ТИССУ МИРЭА для студентов традиционной формы обучения и студентов двухпрофильного обучения в системе элитного образования в МИРЭА (по программам ассоциации инженерного образования РФ);

• по информационному обеспечению системы дополнительного образования студентов и школьников по информационным технологиям и информатики в развитие учебных дисциплин школьной программы и дисциплин первого курса высшей школы;

• в поддержку функционирования отделения повышения квалификации преподавателей ВШ РФ и СПО, НПО по программам МИНОБРНАУКИ РФ и сопутствующим им программам НТО.

Структура диссертации состоит из Введения, трех глав основного текста, Заключения, Списка литературы (96 наименований) и трех Приложений, относящихся к теме диссертации. Основной текст диссертации предваряет терминологический глоссарий, содержащий 54 статьи. Общий объем работы составляет 122 страницы машинописного текста, включая 28 рисунков и 5 таблиц.

Заключение диссертация на тему "Математическое и программное обеспечение семантического поиска в портально-сетевых комплексах учебного назначения"

Результаты исследования докладывались на 10-й Международной юбилейной конференции С8ТВ-08 и на 9-ми внутрироссийских научно-технических конференциях. На основе выводов и рекомендаций диссертационной работы при участии диссертанта разработаны, одобрены и внедрены в практику Руководящие Технические Материалы (РТМ): «Руководящий технический материал (РТМ.) «Программно-методическое обеспечение образовательных технологий дополнительного развивающего образования детей и юношества в сфере информатики и НИТ», Выпуск 2011 года; в 6 частях и Руководящий технический материал (РТМ.) «Информационное обеспечение образовательных технологий средствами макромедиа под Онтонет/Экстранет управлением», Выпуск 2010г. (в четырех частях). При участии диссертанта в Центре Новых Информационных Технологий (ЦНИТ) МГТУ МИРЭА разработан и внедрен в учебный процесс портально-сетевой комплекс «Информатика» с суммарным ресурсом 7.72 Гб.

По теме диссертации опубликовано 20 печатных работ, в том числе три статьи в журналах из Перечня ВАК, выпущены учебные и методические пособия, используемые магистрами кафедры ТИССУ МГТУ МИРЭА в учебно-исследовательской работе и студентами этой кафедры в курсовом и дипломном проектировании. Получено свидетельство о государственной регистрации программы для ЭВМ № 2011612862 от 8 апреля 2011 г. «Система фильтрации образовательного контента».

ЗАКЛЮЧЕНИЕ

Совершенствование портально-сетевых комплексов в настоящее время идёт в основном по пути создания более эффективных алгоритмов и программ для их поисковых сервисов в условиях существенно интенсифицированных потоков данных. Семантический поиск с опорой на онтологические соглашения проектов является наиболее важной составляющей частью всего многообразного функционирования информационных систем и сетей в составе образовательного портально-сетевого комплекса, поскольку именно точность, пертинентность и когнитивность выдаваемой конечному пользователю информации главенствуют в числе многих других показателей информационного обеспечения.

Постоянный рост темпов производства образовательной информации, в том числе, мультимедийной информации учебного назначения, подвергает информационную инфраструктуру портальных комплексов повышенной нагрузке и порождает ряд проблем, которые ждут своего решения. Среди этих проблем в диссертации отмечено:

- несоответствие формально релевантной информации действительным потребностям её потребителя, недостаточная полнота комплекса образовательных услуг с учетом постоянно расширяющейся и обновляющейся дидактической тематики образовательного процесса, слабая изученность энтропийных процессов в расслоенном информационном пространстве, отсутствие практических рекомендаций по семантическому поиску, управлению и сопровождению сетевого портального обустройства предметной области «Информатика» в системе непрерывного образования.

В связи с этим определена цель данной диссертационной работы как восполнение пробела в области математического и программного обеспечения семантического поиска в портально-сетевых комплексах учебного назначения. При этом проанализированы возможности повышения эффективности применения сетевых портальных комплексов в образовательном процессе на основе рационального выбора критериев оценки базовых характеристик поиска, семантико-энтропийное регулирования его полноты и точности в условиях существенно интенсифицированных потоков данных. Объектом исследования диссертации явились сетевые портальные комплексы учебного назначения, а также входящие в состав этих комплексов сервисы, рассмотренные с привлечением семантических представлений в оценке качества управления файлами.

В процессе выполнения работы внедрены в практику отечественной образовательной индустрии научные положения, выводы и рекомендации, вытекающие из решения поставленных в работе основных задач.

Результаты диссертации внедрены в учебный процесс МГТУ МИРЭА и Московского Городского Дворца Детско-Юношеского Творчества (МГДД(Ю)Т по следующим четырём направлениям:

• по направлению подготовки «Информационные системы» для магистров, специалистов, бакалавров, прикладных бакалавров по выпускающей кафедре Технических и информационных средств систем управления (ТИССУ);

• в информационное обеспечение блока дисциплин «Информатика», «Введение в специальность» по кафедре ТИССУ МИРЭА для студентов традиционной формы обучения и студентов двухпрофильного обучения в системе элитного образования в МИРЭА (по программам ассоциации инженерного образования РФ);

• по информационному обеспечению системы дополнительного образования студентов и школьников по информационным технологиям и информатики в развитие учебных дисциплин школьной программы и дисциплин первого курса высшей школы;

• в поддержку функционирования отделения повышения квалификации преподавателей ВШ РФ и СПО, НПО по программам МИНОБРНАУКИ РФ и сопутствующим им программам НТО.

Библиография Тюрин, Андрей Геннадиевич, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Соловьев С.Ю. Служба тематических толковых словарей «Glossary Commander» Электронный ресурс.: Web-and-Press, 2007. - Режим доступа: www.glossary.ru.

2. Википедия. Свободная энциклопедия Электронный ресурс. Режим доступа: http://ru.wikipedia.org.

3. Афронин А.Ю., Бабешко В.Н., Булакина М.Б. и др. Образовательные Интернет-ресурсы / под ред. Тихонова А.Н., ГНИИ ИТТ «Информика». М.: Просвещение,2004. 287 с.

4. Финогеев А.Г. Синергетика информационных процессов в виртуальном образовательном пространстве // Научно-практический журнал «Открытое образование» 2003 №3, С. 47-54

5. Михайлов А.И., Черный А.И., Гиляревский Р.С. Основы информатики, М.:Наука, 1968г.

6. Мордвинов В.А., Петров К.А. Онтология информационных систем / М.: Отраслевой фонд алгоритмов и программ. Свидетельство о государственной регистрации № 50200500888. Свидетельство об отраслевой регистрации № 4895 от 06.08.2005,251с.

7. Синица Е.М., Бурцев М.С. Описание учебных ресурсов метаданные стандарты профили // Educational Technology & Society 9(1) 2006, ISSN 1436-4522.

8. Кросс П., Раими С. Применение репозитария Microsoft Электронный ресурс.: SQL Server Magazine Online/RE, 2000 №2 - Режим доступа: http://www.olap.ru/desc/microsoft/news/m001120689.asp.

9. Закон «Об информации, информатизации и защите информации», ст.2. Принят Государственной Думой РФ 25 января 1995 года

10. Швагер Дж. «Технический анализ Полный курс». Альпина, 2003, 768 с.

11. Хачатурова С.М. «Математические модели системного анализа». Электронное учебное пособие \ Под ред. Л.Г. Макаревича (http://ermak.cs.ru/mmsa/main/Proba.hml)

12. Beer S. «Diagnosing the System for Organisations». Wiley, Chichester, 1990

13. Красов A.B. Лекции по теории информационных процессов и систем. СПб, ЛЭТИ.

14. Странные аттракторы. В сб.: Математика. Новое в зарубежной науке, №22. Под.ред. Я.Г.Синая и Л.П.Шильникова. М., Мир, 1981, 253 с.17. http://www.cio-world.ru/print/infrastructure/29164/

15. Тюрин А.Г. Система фильтрации образовательного контента / Свидетельство о государственной регистрации программы для ЭВМ № 2011612862 от 8 апреля 2011 г.

16. Тюрин А.Г. Регулирование энтропийных показателей контента в многоуровневых порталах учебного назначения / «Всероссийский журнал научных публикаций» -ноябрь-декабрь 2011, М.: ООО «Эстет», 2011, ISSN 2079-7052 - с. 29-33

17. Тюрин А.Г. Применение классической теории энтропии к управлению контентом многоуровневых образовательных порталов / Научно-методический журнал «Информатизация образования и науки» №214., М., 2012 - с. 124-129

18. Федеральный портал «Российское образование» Электронный ресурс. Режим доступа: http://edu.ru.

19. Волкова В.Н., Денисов А.А. Основы теории систем и системного анализа: Учебник для студентов вузов, обучающихся по специальности «Системный анализ и управление». СПб.: СПбГТУ, 1997. - 510с.

20. CMS List Электронный ресурс. Режим доступа: http://cmslist.ru/.

21. Энциклопедия поисковых систем Электронный ресурс. Режим доступа: www.SearchEngines.ru.

22. Dragomirl, G., Ignat, I. Distributed Database Environment Testing / Automation, Quality and Testing, Robotics, 2006 IEEE International Conference, Volume: 2 Proceedings/ IEEE Près, 2006 -p.90-95.

23. Esakkirajan, S. Fundamentals of Relational Database Management Systems. Springer, 2007. -p.559-610.

24. Зыбарев Ю.М., Чернев С.П. Спецификация функциональной модели информационного портала сетями Петри Электронный журнал "Исследовано в России", статья №95 стр. 1057-1070, 2003г., http://zhurnal.ape.relarn.ru/articles/2003/095.pdf

25. Мордвинов В.А. Онтология моделирования и проектирования семантических информационных систем и порталов (справочное пособие), на правах рукописи, М.: МГДД(Ю)Т, 2005г., 240 с.

26. А.Д.Иванников, А.Н.Тихонов Основные положения концепции создания системы образовательных порталов

27. А.Н. Тихонов, А.Д. Иванников, Е.Г. Гридина, Н.И. Куракина, А.В. Симонов, И.И. Чиннова Комплексный анализ системы федеральных образовательных порталов

28. В.И.Береговой, А.Д.Иванников, А.Н.Тихонов Стратегия создания и развития сети образовательных порталов, М.: ГНИИТТ «Информика»

29. А.Н.Тихонов, В.Н.Васильев, Е.Г.Гридина, А.Д.Иванников, А.М.Кондаков, Г.А.Краснова, В.В.Радаев Интернет-порталы: содержание и технологии. Сборник научных статей. Выпуск 1. / Редкол.: А.Н. Тихонов (пред.) и др.; ГНИИ ИТТ

30. Информика". М.: Просвещение, 2003. - 720 е.: ил. Публикации 2, 4-6, 10 входят в книгу, адрес в интернет: http.7/ecsocman.edu.ru/db/msg/248975.html

31. Казенников А.О., Трифонов Н.И., Тюрин А.Г. Исследования методов компьютерной лингвистики для задач повышения эффективности информационного поиска / Научно-методический журнал «Информатизация образования и науки» №37., М., 2010 - с. 10-20

32. Ландэ Д.В. Посковые системы: поле боя семантика. // «Телеком» №4,2004

33. Дж. Мартин. Системный анализ передачи данных. Том 2. // Перевод с анг. М.: Мир, 1975-432 с.

34. Клещев A.C., Шалфеева Е.А. Каталог свойств онтологий. Принципы организации каталога: Препринт, 2007. Владивосток: ИАПУ ДВО РАН, 2007, 20 с

35. Маланин В.В., Суслонов В.М., Полянин А.Б. Информационные технологии в учебном процессе // Университетское управление. 2001. № 4(19). с. 18-21.

36. Ярных Ю.А. Системный подход к структуризации контента. Электронный ресурс. Режим доступа: http://www.akmeolog5.narod.ru/tez.doc, свободный.

37. Тюрин А.Г. и др. Руководящий технический материал по информационному обсеспечению образовательных технологий мобильными средствами аудио-видео поддержки и виртуализации-52 с. ОФАП - МОСКВА, 2008 / Рег.№ 11937.

38. Гришнкун В.В., Григорьев С. Г. Использование информационных и коммуникационных технологий в общем среднем образовании. Электронный ресурс.: Портал "Гуманитарное образование " / ФГУ ГНИИ ИТТ «Информика», 2007 Режим доступа: http://www.humanit

39. Бернштейн Э. С., Лахути Д. Г., Чернявский В. С. Вопросы теории поисковых систем — М., 1966. — 130 с.

40. Шемончук Д.С. Полнота и точность мультимедиа контента для существенно интенсифицированных мультимедиа систем. ОрелГТУ. Информационные системы и технологии" №3\53(564) 2009 г., с.35-42.

41. Заличев H.H. «Энтропия информации и сущность жизни» М.: Радиоэлектроника, 1995.- 192с.

42. Голицын Г.А., Левич А.П. «Принцип максимума информации и вариационные принципы в научном знании» М.: «Наука». 1991. - 336с.

43. Esakkirajan, S. Fundamentals of Relational Database Management Systems. Springer, 2007. - p.559-610.

44. Дейт, К Дж. Введение в системы баз данных: Пер. с англ. М. и др.: Вильяме, 2008.- 1328 стр.

45. ГОСТ Р ИСО/МЭК 7498-1-99. Взаимосвязь открытых систем. Базовая эталонная модель. Введ. 01.01.2000.

46. Олифер В.Г., Олифер Н. А. Компьютерные сети. Принципы, технологии, протоколы. Питер, 2007. - 960 стр.

47. Мордвинов В.А., Тюрин А.Г. Предметная область "Информатика" в многоуровневом портальном строительстве информ среды непрерывного образования^ № 57-В2008.) М.: ВИНИТИ, 2008, 14с.

48. Орлов А.И. Математика случайная. Вероятность и статистика основные факты. -М.: МЗ-Пресс, 2004. - 110 стр.

49. Дэвид Девитт, Джим Грэй Параллельные системы баз данных: будущее высоко эффективных систем баз данных. Журнал «Системы Управления Базами Данных». №2, 1995 г.

50. Мордвинов В.А Формализация семантического анализа информационных систем/ Аспирантские чтения, выпуск 10, МГДД(Ю)Т, МИРЭА, AMO, ФГУ ГНИИ TT «Информика» М.: 2008. 20 с.

51. Цветков В.Я. Информация и теория информации. М.:МИИГАиК, «Госинформобр». 2006. 123 с.

52. Цветков В.Я., Воинов А.И. Методология исследования объектов управления. Журнал "Современные наукоемкие технологии". №4, 2008 г.

53. Мордвинов В.А., Тюрин А.Г. Предметная область "информатика" в многоуровневом портальном строительстве информ среды непрерывного образования. М: МИРЭА, 2008 - 14с. - Деп. в ВИНИТИ 29.01.08 № 57-В2008

54. Тюрин А.Г. Микро-портал-википедия «Учащиеся. Информатика. Интернет». . М.: МГДД(Ю)Т, 2007.

55. Дементьев И.О., Мордвинов В.А., Сигов A.C., Тюрин А.Г. Анализ и формирование предметной области по информатике в системе непрерывного образования. 10-я Юбилейная международная выставка и конференция CSTB'08, М., 2008.

56. Ильин И.В., Тюрин А.Г. Анализ и формирование предметной области по информатике в системе непрерывного образования. Практико-ориентированная конференция «Преемственность среднего (полного) общего и высшего образования», МИРЭА, 2008.

57. Звездочкин Д.В., Трифонов Н.И., Тюрин А.Г. Шаблоны проектирования в программировании / Научно-практическая конференция «Современные информационные технологии в управлении и образовании» Т.1 (НИИ «Восход») -М., 2010 с. 160.166

58. Мордвинов В.А., Тюрин А.Г. Выявление семантического поля слов. Труды XVIII Всероссийской научно-методической конференции «Телематика'2011», 20-23 июня 2011г. Санкт-Петербург, том 2, С. 233-235.

59. Ковалев С.Н., Тюрин А.Г. Конфигурация персонального компьютера целевого назначения. Метод, указания по выполнению курсовой работы. М.: МИРЭА, 2011,32 с.

60. Вентцель Е. С. «Элементы динамического программирования» М.: Наука, 1961. — 176с.

61. Hartley R.V.L. Transmission of information. — Bell System Technical Journal 7. — 1928. —C. 535-63.

62. Э.Х.Лийв Инфодинамика. Обобенная энтропия и негэнтропия. Таллинн, 1998. -200 с.

63. Харкевич A.A. О ценности информации //Проблемы кибернетики. 1960. - вып. 4.

64. Бриллюэн JI. Научная неопределенность и информация. М., 1966.

65. Маслак A.A., Бакай Е.П. «Анализ качества тестов на основе модели Раша»: Материалы конференции ИТО-2005.

66. Мордвинов В.А., Юргаев Д.А., Храмов В.И. Моделирование оценки качества учебного процесса с использованием метода Раша. МОСКВА, 2008 - 57 НТК МИРЭА

67. Основы научной организации педагогического контроля в высшей школе. М. МИСиС, 1989. -167с.

68. Нейман Ю.М., Хлебников В.А. Введение в теорию моделирования и параметризации педагогических тестов Москва, 2000, 168 е., ISBN: 5-7042-1068-6

69. Цветков В.Я. ИНФОРМАТИЗАЦИЯ: Создание современных информационных технологий. Часть 2. Средства массового обслуживания и концентрации информации. М.: ГКНТ, ВНТИЦентр, 1990. - 103 с.

70. НетПик. Система статистики Электронный ресурс. Режим доступа: http://netpeak.ru/

71. Грешилов А. А., Стакун В. А., Стакун А. А. Математические методы построения прогнозов. — М.: Радио и связь, 1997.- 112 с. — ISBN 5-256-01352-1.

72. Раев В.К., Тюрин А.Г. Семантический поиск информации в многоуровневых сетевых портальных консорциумах. ( № 66-В2012.) М.: ВИНИТИ РАН №4, 2012, 14с.1. БЛАГОДАРНОСТИ