автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.10, диссертация на тему:Ситуационное управление процессом генерации электронных услуг на основе контекстно-зависимых эвристик
Автореферат диссертации по теме "Ситуационное управление процессом генерации электронных услуг на основе контекстно-зависимых эвристик"
ИШКИНА ЕВГЕНИЯ ГЕННАДИЕВНА
СИТУАЦИОННОЕ УПРАВЛЕНИЕ ПРОЦЕССОМ ГЕНЕРАЦИИ ЭЛЕКТРОННЫХ УСЛУГ НА ОСНОВЕ КОНТЕКСТНО-ЗАВИСИМЫХ ЭВРИСТИК
Специальность 05.13.10 Управление в социальных и экономических системах
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Астрахань 2012
005012923
На правах рукописи
ИШКИНА ЕВГЕНИЯ ГЕННАДИЕВНА
СИТУАЦИОННОЕ УПРАВЛЕНИЕ ПРОЦЕССОМ ГЕНЕРАЦИИ ЭЛЕКТРОННЫХ УСЛУГ НА ОСНОВЕ КОНТЕКСТНО-ЗАВИСИМЫХ ЭВРИСТИК
Специальность 05.13.10 Управление в социальных и экономических системах
АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук
Астрахань 2012
Работа выполнена в ФГБОУ ВПО « Астраханский государственный университет».
Научный руководитель: кандидат технических наук
Щербинина Оксана Владимировна
Официальные оппоненты: Жуков Дмитрий Олегович
доктор технических наук, профессор, Институт криптографии, связи и информатики Академии ФСБ РФ, профессор кафедры №721
Халилов Абдурахман Исмаилович
доктор технических наук, профессор, Дагестанский государственный университет, профессор кафедры дискретной математики и информатики
Ведущая организация: Костромской государственный
университет им. H.A. Некрасова
Защита состоится 30 марта 2012 г. в 14:00 ч. на заседании
диссертационного совета ДМ212.009.03 при Астраханском
государственном университете по адресу: 414056, г. Астрахань, ул. Татищева, 20а.
С диссертацией можно ознакомиться в библиотеке Астраханского государственного университета.
Автореферат разослан «28» февраля 2012 г.
Ученый секретарь диссертационного совета ДМ212.009.03, к.т.н.
Щербинина О.В.
J
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
Актуальность исследования. В настоящее время Интернет представляет собой постоянно развивающуюся сетевую инфраструктуру, позволяющую создавать, распространять, использовать и интегрировать информационные ресурсы. Сервис-ориентированная парадигма на сегодняшний день признана основной для Интернет, что подтверждается значительным объемом исследований в этой области и развитием соответствующих технологий за последние 10 лет. Сервисы представляют собой атомарные слабосвязанные компоненты, реализующие прикладные функции автоматизированных систем.
Для обеспечения интероперабельности гетерогенных ресурсов и сервисов Интернет требуются семантические технологии, единые стандарты и средства согласования данных. Анализ европейских исследовательских проектов позволяет сделать вывод, что количество доступных сервисов в скором времени будет исчисляться миллиардами.
В перечень десяти ключевых стратегических технологий 2012 года, по мнению Gartner, ведущей исследовательской и консалтинговой компании, специализирующейся на рынках информационных технологий, входят:
• Контекстно-зависимые вычисления (context-aware computing). В таких приложениях используется информация об окружении пользователя, его действиях, предпочтениях с целью улучшения качества его взаимодействия с системой путем предоставления ему персонализированного контента, продукта или услуги. Наибольший интерес такие приложения представляют для пользователей мобильных устройств. Количество смартфонов, по оценкам Gartner, к 2013 году возрастет втрое и составит 1,82 миллиарда. Все больше будет разрабатываться и потребляться сервисов для мобильных устройств.
• Интернет Вещей (internet of Things). Одним из катализаторов его развития является технология NFC (Near Field Communication), которая представляет интерес в сфере мобильных платежей, а также позволяет улучшить качество услуг в сфере общественного транспорта, авиаперевозок, торговли и здравоохранения.
• Новое поколение аналитических средств. В этой области Gartner прогнозирует смещение фокуса в сторону коллективного принятия решений, переход от анализа исторических данных с целью выяснения причин определенных фактов к анализу исторических данных в совокупности с данными, поступающими в режиме реального времени, для формирования прогнозов.
Таким образом, эти стратегические технологии отражают следующие тенденции развития Интернет: стремительный рост количества сервисов, доступных, прежде всего, пользователям мобильных устройств; необходимость их адаптации к требованиям конкретного пользователя и,
наконец, необходимость прогнозирования будущих потребностей потребителей сервисов.
Множество доступных сервисов может быть также расширено за счет комбинации функциональности уже существующих сервисов. В настоящее время для многих систем разрабатывается API (прикладной интерфейс программирования), который позволяет внешним системам использовать и интегрировать их функциональные возможности. Основным средством обеспечения взаимодействия являются веб-сервисы, реализуемые с использованием REST- и SOAP-подходов.
Несмотря на то, что компоновка сервисов становится все более актуальной, эта задача в настоящее время слабо автоматизирована. Для обеспечения лучшей ориентации пользователей в непрерывно растущем пространстве гетерогенных сервисов требуется реализация аналитических средств нового поколения, обеспечивающих проактивность, то есть поиск эффективных комбинаций сервисов, позволяющих решать типовые пользовательские задачи, с целью последующего повторного использования.
Однако на сегодняшний день отсутствует универсальная платформа для эффективного решения проблемы интеграции гетерогенных сервисов и проактивного поиска заранее не предусмотренных поставщиками сервисов вариантов их использования для решения типовых пользовательских задач. Возможности динамической адаптации существующих систем к контексту использования также достаточно ограничены.
Целью диссертационной работы является повышение релевантности и эффективности использования предоставляемых потребителям электронных услуг в различных социально-экономических системах за счет интеграции гетерогенных сервисов и проактивного анализа коллективного опыта их использования в различных ситуациях, инвариантного по отношению к предметной области.
Для достижения поставленной цели необходимо решить следующие задачи:
1. Провести анализ существующих подходов к решению задачи интеграции сервисов и их адаптивного предоставления потребителям;
2. Выбрать технологии для достижения поставленной цели.
3. Разработать модели проактивной интегрированной среды взаимодействия для сервис-ориентированных систем.
4. Разработать методы динамического построения единого хранилища гетерогенных сервисов и динамической генерации сервисов, соответствующих задаче пользователя;
5. Разработать программное обеспечение на основе созданных моделей и методов.
Методы исследования. В процессе работы использовались методы математического моделирования, онтологического моделирования, интеллектуального анализа данных (Data Mining), искусственного интеллекта, теории вероятностей, теории принятия решений.
Научная новизна. В диссертации разработаны и выносятся на защиту следующие основные положения:
1. На основе интеграции онтологии предложена модель единого хранилища сервисов и контекстно-зависимых эвристик, позволяющая унифицированным образом представить знания о сервисах и их композициях.
2. Разработан метод динамического наполнения единого хранилища сервисов за счет импорта базовых сервисов и интеллектуального поиска контекстно-зависимых эвристик.
3. Разработан метод динамической генерации композиций сервисов, позволяющий получить наиболее релевантный результат за счет использования комплексных семантических аннотаций базовых сервисов и их композиций.
Практическая значимость диссертационного исследования состоит в том, что на основе предложенных моделей и методов разработано программное обеспечение, осуществляющее автоматический поиск наилучших композиций гетерогенных сервисов, соответствующих комплексной задаче пользователя, на основе анализа опыта использования сервисов в различных ситуациях.
Результаты работы используются в инновационном проекте «Nice Future Campus» (Ницца, Франция), а также в учебном процессе в Астраханском государственном университете при изучении дисциплин «Технологии анализа данных», «Онтологии и мультиагентные системы», «Современные средства разработки приложений».
Апробация работы. Материалы, входящие в диссертацию, обсуждались на второй всероссийской научно-практической конференции «Информационная среда ВУЗа XXI века» (Петрозаводск, 2008), международной научной конференции «Электронная культура. Информационные технологии будущего и современное электронное обучение Modem IT & (Е-) Learning» (Астрахань, 2009), третьей международной конференции «Information Systems and Economic Intelligence» (Сусс, Тунис, 2010), шестой международной конференции «Internet and Web Applications and Services» (Синт Маартен, 2011), секции «Мобильная коммерция» седьмого ежегодного форума ECR (Москва, 2011).
Публикации. Основные положения диссертационной работы отражены в 7 опубликованных научных работах, в том числе в 3 статьях в ведущих рецензируемых научных журналах и изданиях, рекомендованных ВАК РФ для опубликования основных научных результатов диссертации.
Связь с проектами по проведению НИР. В основу диссертационного исследования положены работы, выполненные автором в рамках государственного контракта №02.740.11.0836 с Минобрнауки РФ по теме «Теоретические основы и разработка информационных технологий для интеллектуальных систем автоматизации управления и научных исследований с применением адаптивных мобильных сервисов,
мультимедиа-технологий, технологий геоинформационных систем и методов интеллектуального и многоагентного управления робототехническими комплексами» (11.06.2010-15.10.2012), а также государственного контракта №8117р/12773 с Фондом содействия развитию малых форм предприятий в научно-технической сфере по теме «Разработка учебно-исследовательских лабораторных комплексов в сфере высокоинтегрированных информационных систем с применением адаптивных мобильных сервисов и мультимедиа-технологий для опережающего и корпоративного обучения, повышения квалификации» (01.06.2010-31.12.2012).
Связь с международными академическими проектами. Результаты диссертационного исследования были использованы в международных проектах в рамках программы TEMPUS: JEP250702004 «Модернизация преподавания ИКТ в университетах Юга России» (MEICTSRU), 159025-TEMPUS-1-2009-1-FR-TEMPUS-JPCR «Сеть магистерских программ по информатике как второй компетенции в Европе, России и Центральной Азии» (ERAM1S) и 511135-TEMPUS-1-2010-1-ES-TEMPUS-JPCR «Настройка образовательных структур в России» (TUNING).
Структура и объем работы. Диссертационная работа состоит из введения, пяти глав, заключения, списка сокращений и условных обозначений, библиографического списка, приложений. Основная часть работы изложена на 113 страницах, содержит 18 рисунков, 12 формул. Библиографический список содержит 105 источников.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обоснована актуальность темы диссертации, сформулированы цель и задачи исследования, перечислены основные научные результаты диссертации, приведены практическая ценность и область применения результатов.
В первой главе представлены результаты анализа существующих подходов к решению задачи интеграции сервисов и их адаптивного предоставления потребителям.
Проведен обзор программных платформ или их прототипов, которые содержат аналитическую прослойку, детерминирующую процесс выбора сервисов с целью адаптации по определенным критериям. Рассмотренные платформы были классифицированы на группы в соответствии с их главной функцией: 1) персонализация сервисов, 2) поиск сервисов, соответствующих контексту (context-aware), 3) поиск сервисов, соответствующих комплексной задаче {goal-driven или task-driven), 4) проактивный поиск шаблонов (pattern-driven).
За редким исключением, эти четыре подхода реализованы отдельно. Задача поиска шаблонов композиций сервисов в рассмотренных прототипах решается независимо от контекста. Тем не менее, важной задачей на сегодняшний день является не только обнаружение устойчивых
шаблонных композиций в растущем массиве сервисов, то есть прогнозирование вариантов их использования, но и выявление факторов, определяющих уместность применения таких шаблонов в той или иной ситуации. Это необходимо для упорядочивания динамически меняющегося множества распределенных гетерогенных сервисов.
Таким образом, для достижения цели исследования необходимо сочетание всех четырех подходов. Для этого необходимо реализовать некоторую среду взаимодействия сервис-ориентированных систем, интегрирующую их сервисы и осуществляющую проактивный анализ их использования с целью повышения эффективности взаимодействия с потребителями сервисов.
Вторая глава посвящена исследованию существующих технологий, связанных с целью диссертационного исследования, и оценке ее достижимости.
Задача интеграции гетерогенных сервисов требует наличия средств их описания, позволяющих осуществлять автоматический вызов и композицию.
Существующие технологии описания сервисов были классифицированы по результатам анализа на две категории: первая позволяет описать операционный синтаксис сервиса, т.е. его название, имена параметров и соответствующие типы данных, а вторая -композиционную семантику сервиса путем добавления к нему специальных аннотаций, используемых для автоматического обнаружения, композиции и вызова сервисов.
На уровне операционного синтаксиса SOAP- и REST-сервисам может быть предоставлено метаописание с использованием языка WSDL 2.0.
Для описания композиционной семантики сервисов уже создано или находится в стадии разработки большое количество стандартов и технологий, из которых наиболее популярными на сегодняшний день являются OWL-S и WSMO.
В OWL-S отсутствует четкое разделение того, что необходимо пользователю, от того, что предоставляет сервис. Профиль сервиса в OWL-S используется для автоматического обнаружения. Более предпочтительными для достижения цели данного исследования являются онтология WSMO и соответствующий ей язык WSML, поскольку компонент целей WSMO определяет, что необходимо пользователю, а компонент веб-сервисов определяет, какие возможности сервис предоставляет. Описание операционного синтаксиса в WSMO основано на языке WSDL, поэтому именно он был выбран в качестве унифицированного средства описания SOAP- и REST-сервисов.
Композиционной семантики, которая может быть выражена средствами WSMO, недостаточно, поскольку она позволяет представить ситуационные аннотации только в виде предусловий. На самом деле они представляют собой различные типовые классы ситуаций использования сервиса, которые применяются для определения релевантности сервиса в
конкретной ситуации. Кроме того, как будет показано далее, ситуационные аннотации могут относиться к компонентам сценария (эвристики), что также невозможно выразить в WSMO. Поэтому требуется разработать дополнительный третий слой описания сервисов - слой ситуационной семантики.
Динамическая генерация сервиса для конечного потребителя требует наличия средств автоматической композиции сервисов. Для оценки выполнимости этой задачи был проведен анализ существующих методов автоматической композиции сервисов: основанных на потоках работ, (EFlow, PPM) и основанных на автоматическом планировании (методы ситуационного исчисления, методы, основанные на правилах, методы на основе иерархической сети задач).
В условиях динамического расширения пространства сервисов и изменения потребностей пользователей сценарии сервисов не могут быть жестко заданы на этапе проектирования, поэтому наилучшим образом подходят методы планирования. Было выявлено, что методы на основе иерархической сети задач демонстрируют лучшую производительность по сравнению с методами ситуационного исчисления и методами, основанными на правилах. Однако не существует готовой реализации метода на основе иерархической сети задач, совместимой с WSMO.
Для проактивной интегрированной информационной среды взаимодействия необходима реализация следующих функций: возможности автоматического обнаружения сервисов в соответствии с пользовательской целью, представления знаний о зависимости сервиса или его компонентов от ситуации, представления статистических данных об использовании сервисов для оценки их релевантности в конкретной ситуации. Ни одна из существующих моделей не удовлетворяет всем трем требованиям, однако для этого возможна комбинация трех моделей: интенционального графа, контекстуального графа и байесовской сети.
Для формального представления знаний в проактивной интегрированной информационной среде взаимодействия использованы онтологии, т.к. единая онтология обеспечивает совместное использование знаний в открытых и динамических распределенных системах, онтологии с хорошо определенной декларативной семантикой позволяют осуществлять логический вывод знаний на основе ситуационных аннотаций, и явным образом выраженные в онтологиях знания позволяют недостаточно выразительно описанным сервисам взаимодействовать друг с другом.
Таким образом, проведенное исследование показало, что существуют развитые технологии, которые позволяют считать поставленную цель диссертационного исследования достижимой, однако требуется разработка дополнительных моделей и методов на их основе.
Третья глава диссертации посвящена моделированию проактивной интегрированной среды взаимодействия для сервис-ориентированных социально-экономических систем, в частности, разработке формальной модели проактивной интегрированной среды взаимодействия,
унифицированной формальной модели сервиса и модели ситуаций использования сервисов.
Интегрированная среда взаимодействия для сервис-ориентированных систем — это инфраструктура, которая обеспечивает прозрачный доступ пользователей к информационным ресурсам, представляющим собой сервисы различных базовых сервис-ориентированных систем.
Адаптивная интегрированная среда взаимодействия для сервис-ориентированных систем - это интегрированная среда взаимодействия, которая собирает данные о ситуациях использования сервисов базовых систем конечными пользователями; далее по результатам анализа генерирует знания о типичных для сервисов классах ситуаций использования; а также выбирает сервисы, наилучшим образом соответствующие конкретной ситуации использования.
Под ситуацией использования сервиса понимается совокупность значений параметров, которые характеризуют момент вызова сервиса пользователем. Это могут быть характеристики пользователя (пол, возраст и т.д.), характеристики внешнего контекста (местоположение, время и т.д.). а также цель или совокупность целей, которые представляют собой причину вызова сервиса. Информация о ситуации использования может быть неполной в случае, если невозможно определить значения некоторых параметров.
Класс ситуаций использования сервиса — множество ситуаций, имеющих одинаковые значения для некоторого набора параметров, остальные параметры при этом могут принимать любые значения из соответствующего множества допустимых значений. Пример описания класса ситуаций: «французский турист на Красной площади в Москве», при этом возраст и время могут быть любыми.
Проактивная интегрированная среда взаимодействия для сервис-ориентированных систем — это адаптивная интегрированная среда взаимодействия, в задачи которой входит также управление «коллективным разумом» сервисов, а именно поиск композиций сервисов, соответствующих наиболее типичным комбинациям целей, и динамическая генерация сервиса для заданной ситуации на основе доступных фрагментов (исходных сервисов и обнаруженных композиций). Таким образом, проактивная интегрированная среда взаимодействия строит прогнозы относительно будущего поведения потребителей сервисов.
Такие композиции сервисов, которые соответствуют типовым высокоуровневым задачам пользователей, в диссертации именуются контекстно-зависимыми эвристиками, поскольку они представляют собой способы решения задач, не имеющие строгого обоснования, то есть не сформированные поставщиками сервисов, но, тем не менее, удовлетворяющие потребности пользователей в большинстве случаев.
Формально проактивная интегрированная среда взаимодействия для сервис-ориентированных систем (рис. 1) может быть определена как
<5, С,I, А.Ft.Fc.FM где:
-5: множество всех сервисов, доступных конечным пользователям, содержащее как сервисы, предоставляемые базовыми системами, так и, возможно, внешние сервисы;
- С: множество доступных источников информации о ситуациях использования сервисов (именуемых в дальнейшем виртуальными ситуационными датчиками), позволяющих получить значения параметров ситуаций, характеризующих пользовательские сессии;
журнал регистрации обращений пользователей к сервисам -хронологически упорядоченный набор записей о вызовах сервисов в совокупности с показаниями виртуальных контекстных датчиков и с метками пользовательских сессий;
- А: множество ситуационных аннотаций сервисов, где каждая аннотация представляет собой типичный класс ситуаций использования сервиса;
функция, позволяющая получить новые ситуационные аннотации сервисов или уточнить существующие путем анализа истории использования сервисов. Таким образом, А' - Р^А.Ь) - обновленное множество ситуационных аннотаций сервисов;
- Рс- функция, позволяющая преобразовать данные, поступающие непосредственно с виртуальных ситуационных датчиков, во внутренний формат среды взаимодействия;
- Рв- функция получения множества релевантных сервисов 5ц, £ 5 на основе ситуационных аннотаций сервисов (Л) и описания текущей ситуации использования (40. Таким образом, 5ч, = Ря(5,75,4^.
- /*$: механизм получения контекстно-зависимых эвристик на основе множества доступных сервисов 5 по результатам анализа журнала I. Таким образом, 5Г = - множество доступных контекстно-зависимых эвристик.
Рисунок 1. Проактивная интегрированная среда взаимодействия
Проактивная интегрированная среда взаимодействия осуществляет предварительную обработку записей журнала регистрации обращений пользователей к сервисам для выявления наиболее типичных классов ситуаций использования сервисов и последующего семантического аннотирования сервисов единого хранилища с использованием функции
Журнал содержит хронологически упорядоченный набор записей о вызовах сервисов в совокупности с показаниями виртуальных контекстных датчиков и позволяет восстановить пользовательские сессии. Элемент пользовательской сессии состоит из одного сервиса и соответствующего ему набора целей.
(5(х,С), й(х, с)) - элемент пользовательской сессии, где:
5(х, Г) — сервис, вызванный пользователем х в момент времени t.
Г) = {д^к, Г)} - актуальное множество целей пользователя х в момент времени Г, ¿¡¡(х, Г) - предикат первого порядка, использующий некоторый термин онтологии целей.
Для сессии определяются также параметры пользователя и контекста (местоположение, время, устройство и т.д.). Параметры пользователя хранятся персистентно в виде профилей, а параметры контекста всегда определяются динамически для каждой сессии. Для упрощения мы будет считать, что параметры контекста остаются неизменными в течение сессии.
£/(.г,С1Д2) = {и;(.г, 1\,Г2)}- вектор параметров пользователя в период Г-.], г1гГ2) - логическое выражение, основанное на некотором термине онтологии пользовательских профилей, [ГхДг] ~ временной интервал сессии.
{~1( Г2) = [ек - вектор параметров внешнего контекста в
период [ЛДг], - логическое выражение, основанное на
некотором термине онтологии контекстов.
Пользовательская сессия может быть представлена в виде множества: в(х,Т1,и) = {(.5(х,1),С(х,*).и(х,11,12)1Е(хЛ1,12))и 6 [Са,12] При этом должно выполняться условие:
35(хД1)ДУр€ -Д,Г1)(а5(х,р))л 35{х, t2)A\/q € (£2)12 + Д]<?))
Таким образом, Л представляет собой временной интервал, такой что, если в течение этого интервала отсутствуют вызовы сервисов пользователем, это считается разрывом двух сессий.
Ч'Ое, Г) = <ССт, Г), 11(х, С),Е(х, Г)) - {^¡(х, Г)} - пример ситуации использования сервиса с). и(х, 0 = I € и
аналогично для Е(_х, С). Таким, образом,
вШг^г) = {ОС*, 1 £ [С^]
Для формирования описания ситуации используются виртуальные датчики Ф(лг) = {сг,7} (рис. 2) - программные агенты, которые владеют информацией о сервисах, доступных для определения параметра ситуации, относящегося к Ог - термину онтологии целей, профилей пользователей или внешних контекстов, а также о ситуационных критериях, ограничивающих возможность использования сервисов <р1р - а^.
На вход агента поступает текущее описание ситуации 1грг(х, и на основании алгоритма упорядочивания
опрашиваемых сервисов формируется логическое выражение ^¡(х. О, основанное на терме о, — 0(ф,(х, 0) одной из ситуационных онтологий.
Датчики подразделяются на физические, которые соответствуют аппаратным компонентам, измеряющим параметры окружения, и логические, которые служат для сбора контекстной информации через внешние веб-сервисы или интерфейсы внешних приложений.
I
Текущее описание ситуации
111,'(х.О~Ч>1-/(х.О _
"а
9а
Виртуальный датчик для о,
...
Алгоритм упорядочивания опрашиваемых сервисов
Рисунок 2. Виртуальный датчик ситуационной информации
Сервис определен рекурсивно. Вначале представляется формальная модель атомарного сервиса, содержащая необходимую семантику для проактивной интегрированной среды взаимодействия: 5 =<4^,0,
где 5 - сервис с ситуационной аннотацией, помещаемый в единое хранилище; БА - базовый сервис, прошедший стадию интеграции, т.е. имеющий описание операционного синтаксиса и композиционной семантики; Ч' - ситуационное ограничение на использование сервиса 5; р -вероятность использования сервиса 5 при условии Ч7; С - цель, которой позволяет достичь сервис.
Помимо атомарных сервисов, единое хранилище может также содержать семантически описанные составные сервисы: 5 = (ЧС), где 5С — составной сервис, правила построения которого описаны ниже.
Элементарная конструкция для построения составного сервиса имеет вид: а = {Ч?,р,В,0 (рис. За), где 5 - атомарный или составной сервис, С может быть пустым множеством.
Л(СС,
|<а,5с))
где Н(з:) - оператор получения непустого множества элементов типа х.
Как видно из представленного определения, в работе рассматриваются только две конструкции для представления сценария: последовательность и ветвление. Это обусловлено тем, что в области динамической композиции веб-сервисов понятие цикла редко применимо.
В случае, если составляющая 5 элементарной конструкции а является составным сервисом, это может быть представлено графически так, как показано на рис. 36 (для упрощения показаны только начальная и конечная части 5). На рис. 36 Ч^ ... „ - промежуточные ситуационные ограничения,
б. ... Ст - промежуточные цели. Исходя из определений элементарных конструкций, представленных выше, можно утверждать, что т >71. В случае, если 71 > 1, должны выполняться следующие условия: 1) =0,
2) VI О(Ч^) с ОСЧ^), - множество возможных ситуаций,
соответствующих ограничениям У.
В некоторых случаях осуществляется дополнительная обработка графа в соответствии со следующими правилами: 1) VI С, = С. и %
а) Элементарная конструкция для б) Упрощенная модель составного составного сервиса сервиса в общем виде
Рисунок 3. Модель составного сервиса
Четвертая глава диссертации посвящена разработке методов для проактивной интегрированной среды взаимодействия: методов динамического построения единого хранилища гетерогенных сервисов и методов динамической ситуационной генерации сервисов.
Методы динамического построения единого хранилища гетерогенных сервисов
С использованием методов поиска ассоциативных правил (для анализа частоты вызова некоторого сервиса Л в совокупности с параметрами Ч*(л:,0 = (С(х,Г),и(рс,£),Е(х3£))) и логических рассуждений на основе онтологий (позволяющих вывести неявные знания, используя, главным образом, отношение включенности терминов), генерируются семантические ситуационные аннотации для заданного сервиса А (рис. 4).
Первым этапом данного метода является фильтрация пользовательских сессий и0(д-)г1Д2) с целью получения множества векторов:
0А = где VI Зх,С1(С2 (А,Ч»,,) е е(.г-Д:,Гг)
Затем выполняется поиск ассоциативных правил с использованием вариации классического алгоритма Арпоп. На входе алгоритма имеем набор транзакций Од и предметный набор 5" и С и и и Е (все доступные сервисы и параметры целей, пользовательских профилей и внешних контекстов).
В ходе выполнения алгоритма осуществляется поиск ассоциативных правил, содержащих только выражения с параметрами пользовательского профиля, контекста и целями (Ч^) в левой части и сервис А в правой части:
Ч'а (рис. 4). Таким образом, в значительной степени сокращается пространство поиска. На рис. 4 Бд соответствует компоненту цели множества а рА соответствует вероятности использования сервиса А при условии и вычисляется по формуле (1).
уКпчу
- ■2,1 иы ■ (1)
РА~ |вА|
^а = УЧ'д представляет собой предусловия для надлежащего использования сервиса А. Здесь Ч^ = <Од,и!,, Ед) - конъюнкция целей и логических выражений, основанных на термах ситуационных онтологий.
ФЧЕЬ®
Рисунок 4. Семантическая ситуационная аннотация для сервиса А
С использованием метода поиска ассоциативных правил Арпоп и метода поиска последовательных шаблонов АрпопА11 записи журнала регистрации вызовов сервисов, входящего в состав проактивной интегрированной среды взаимодействия, предварительно обрабатываются с целью получения двух типов условных зависимостей между сервисами: 1) Совместное использование двух сервисов в пользовательской сессии (рис. 5а). Эти зависимости будем в дальнейшем называть симметричными правилами; 2) Последовательный вызов двух сервисов в пользовательской сессии, когда данные, полученные на выходе первого сервиса, используются на входе второго (рис. 56). Такие зависимости будет в дальнейшем называть (асимметричными) эвристиками (шаблонами).
На рис. 5а и рис. 56 Ч'дз представляет собой описание ситуации, влияющее на заданную зависимость между сервисами,
а) Совместное использование б) Последовательный вызов
сервисов А и В в сессии сервисов А—>В в сессии
Рисунок 5. Условные зависимости между сервисами
Первый шаг состоит в поиске симметричных правил (рис. 5а). Он осуществляется путем применения алгоритма Арпоп со следующими входными параметрами:
-набор транзакций {ТОМи^з)). каждая из которых соответствует отдельной пользовательской сессии:
Ух,гг,и 9(я= ((5(х,0Жх,0)}д е [г^и], = {5(х,г)}
- предметный набор 5 - множество всех Доступных сервисов, в том числе и составных.
На выходе алгоритма Apriori на этом шаге получаем множество правил вида S,, -»Sm, где Sn,Sm £ S. Правила Sn-*Sm и Sm-*Sn объединяются в одно правило, поддержка которого больше. На следующем шаге выполняется поиск ситуационных зависимостей для найденных симметричных ассоциативных правил. На входе имеем:
- набор транзакций, каждая транзакция соответствует найденному правилу:
Т(х, tn,tm) = (S(x, tj,Пх, tn),S(x, tj,4>(x, t J):
Эх, Z.,t2 (S(x,tn),4>(x,tJ) E Q(x, tut2)A 6 0(x,tlttz)
Six, О Six.tJ vS(x,t„) -> Six, t J
- предметный набор 5 U G U U U E - все доступные сервисы и параметры целей, пользовательских профилей и внешних контекстов.
На выходе алгоритма получаем правила, содержащие толь.:о цели и логические выражения на основе параметров пользовательского профиля и контекста в левой части и (AF) в правой части для каждого симметричного правила А -* В. Подобное ограничение позволяет сократить размерность пространства поиска для алгоритма Apriori и тем самым повысить эффективность алгоритма. Графическое представление пары симметричных ассоциативных правил показано на рис. 5а.
Для формирования эвристик необходимо выявить последовательности сервисов, которые могут быть объединены в композицию. Композиции сервисов являются упорядоченными, т.е. асимметричными. Поиск таких зависимостей осуществляется с помощью алгоритма AprioriAll, который анализирует пользовательские сессии, использует обнаруженные симметричные правила и знания о синтаксической и семантической совместимости сервисов, полученные на основе метаданных сервисов, для сокращения размерности пространства поиска.
В пользовательской сессии два сервиса могут быть вызваны не последовательно, однако потоки данных с выхода одного и входа другого могут быть при этом сильно коррелированы. Анализ таких корреляций для правил, найденных на предыдущем этапе, позволяет получить правила, представленные графически на рис. 56. Затем эти правила интегрируются в единое хранилище сервисов.
Семантическая схожесть сервисов А и В заключается в схожести ситуаций их использования, а также семантической схожести их входных и выходных параметров и вычисляется по формуле (2):
l,J \Poul(A}UP0.,AB)\J m
где cp и с. - веса, такие что 0 < cpj сс < 1 и ср + сс — 1; оператор |Х| возвращает количество элементов множества; Р.п (^0 и Раиг(X) -множества входных и выходных параметров сервиса X соответственно;
- множество ограничений, накладываемых на ситуацию использования сервиса А'; Сх - цель, достигаемая по результатам выполнения X; S(GtJGz)
- функция определения схожести целей Gu G2, возвращающая значение от О до 1, вычисляемая при помощи рассуждений на основе онтологии целей
Как видно из формулы, значение варьируется от 0 до 1,
значение 1 означает, что сервисы А и В имеют одни и те же входные и выходные параметры, а также одинаковые ситуационные ограничения.
При интеллектуальном поиске новых сервисов (паттернов композиций) для принятия решения о добавления сервиса в единое хранилище используется оценка полезности сервиса, которая вычисляется по формуле (3).
/Ш = + (3)
где V(Á) - выполнимость композиции A; N(A) - новизна композиции X; Х(А) - неожиданность композиции X; сп и сх - веса, причем О < сп,сх < 1 и сп + сх = 1.
представляет собой бинарную функцию. Значение 1 означает валидность композиции, т.е. возможность автоматического выполнения сценария. Значение 0 означает, что несмотря на то, что композиция является синтаксически верной, автоматический вызов ее компонентов невозможен. В таком случае, как видно из формулы (3), полезность композиции будет равна 0.
Новизна композиции показывает, насколько она является уникальной в едином хранилище. Для вычисления новизны используется формула (4).
iV(A) = 1 - шахй(Д s) (4)
Неожиданность композиции вычисляется по формуле (5).
Х(Л)-г^ШШ- (5)
где fi(j4) - множество базовых сервисов, задействованных в композиции А; Т(А) - функция, возвращающая домен сервиса А, т.е. группу релевантных сервисов, формируемую в соответствии с функцией семантической схожести сервисов S; Г - функция вычисления корреляции между двумя доменами.
i
Гх(Т<, Т}) = е где п - количество уникальных пар операций
{(B.OlBe
^гг G £ Tj J, задействованных в композиции А.
Таким образом, очевидно, что если в композиции задействованы сервисы из относительно малого количества доменов, которые достаточно релевантны, это является менее неожиданным, чем если получена композиция, объединяющая сервисы из очень разнородных доменов.
Методы для ситуационной генерации сервисов
Процесс ситуационной генерации сервисов включает следующие этапы: формулировку пользовательского запроса в виде набора целей, поиск сервисов, соответствующих каждой группе целей и их кластеризацию, семантическую редукцию сервисов, генерацию плана выполнения целей, генерацию вызовов базовых сервисов.
Ввод пользовательского запроса осуществляется с использованием онтологии целей. Затрагиваемые при этом отношения между классами онтологии целей - иерархические и синонимические. Для обозначения иерархического отношения использован оператор Е, т.е. ВЕЛ истинно, если термин В является наследником (прямым или косвенным) термина А. Семантическая близость двух понятий онтологии Л и В в данной работе будет рассчитываться по формуле (6).
5UB) = 2xf'sUf, (6)
\СА)+Л'1я)
где LCSQA.B) - ближайший общий родитель А и В (Least Common Subsumer); Д'(А') - глубина вершины X.
Как видно из формулы, S{A,A) = 1, а также если LCS(.A,B) - корень таксономического дерева онтологии, то
Будем рассматривать Л и В в качестве синонимов, если S(A,B) > 1 — £ и обозначать это отношение как Л~В.
Пользователь может найти необходимые ему классы целей по их названиям. Результат этого этапа представлен в виде логического выражения на основе терминов-целей (7).
Л,с„ G,=v,дц. (7)
где д1} - термин онтологии целей, ViJi Ji Л/,
^h.hJiJi 8idi ^ 3i2h-
Для каждого термина-цели в онтологии могут быть заданы параметры, которые также являются ее классами. Пользователь при вводе запроса может задать значения этих параметров в виде терминов онтологии.
На следующем этапе для каждой группы параметризованных целей формируется ранжированный список сервисов.
Цель представляет собой шаблон сервиса. Для цели определен обязательный набор входных и выходных параметров:
J'out
где N - текстовое описание; -Pin(G) - множество входных параметров; Pout (G) - множество выходных параметров; PCOnd(G) - множество параметров, для которых могут задаваться пользовательские ограничения,
Будем считать, что сервис А =< P-n(.A),P0Ut(,A) > соответствует цели (шаблону) G тогда и только тогда, когда Pin(G) ^ Pin(A) и
P0ut (£) — fout (уО- С использованием данного правила для каждой группы С, осуществляется ПОИСК соответствующих сервисов Si = {.s^}. Множество сервисов кластеризуется с использованием функции вычисления семантической схожести между сервисами S. Каждому кластеру затем ставится в соответствие усредненная типичная ситуация использования сервисов данного кластера.
Пусть Ку •= - множество сервисов, попавших в один кластер, соответствующий набору целей Gt. Тогда
(8)
Для каждой группы целей G, набор кластеров {Ki;} сортируется по убыванию значения:
l^u^csw)!
где - текущая ситуация использования. Далее к каждому сервису первого кластера каждой группы применяется операция редукции. Если по результатам выполнения операции в кластере не останется ни одного сервиса, тогда она выполняется для второго кластера и т.д.
Пусть % = {ф(р} = !\vi>ip и V {Ф}ц} = A, 4>jq - описания двух ситуаций, т.е. накладываемых на них ограничений. Редукция Ч^ относительно вычисляется по формуле (9).
если Bp, q: (0(ф:р) = О(fy,)) Л (Л(ф1р) Л Д(^) = 0) = ■ % если Зр, q: 0(ф1р) = О(^) (9)
Vj - вел и Yp. q (0{xpip) = 0«-;,)) - (¿(V^) Л ) 5 б)
Результатом операции Ч^ - Ч1, является множество Ч^ = {tp}-q}, из которого удалены все элементы для которых Эр: О(tpip) = О(i>Jq). Ч^ используется для обозначения тождественно истинного выражения.
В случае, если Ч^ Ф Ч^ и Й^ДЧ^) = соответствующее ребро фафа удаляется. Вместе с этим удаляются все ребра, которые более не составляют часть пути от одной из исходной начальной вершины до одной из исходных конечных.
Если по результатам редукции ситуационная аннотация сервиса стала равной Ч*р, то сервис считается нередуцируемым относительно ситуации Ч^ и не может быть рекомендован к использованию.
Генерация плана выполнения цели выполняется с использованием метода иерархических сетей задач направления автоматического планирования искусственного интеллекта. Генерация вызовов базовых сервисов осуществляется с использованием операционной семантики сервисов. По мере наполнения единого хранилища составными сервисами,
отражающими коллективный опыт использования, будет уменьшаться среднее время обработки пользовательского запроса, т.к. будет возрастать вероятность нахождения уже готового сервиса в хранилище.
Пятая глава посвящена апробации разработанных моделей и методов. На их основе было разработано программное обеспечение, интегрирующее мобильные сервисы для студентов университета Ниццы Софии Антиполис, созданные в рамках проекта «Nice Future Campus» (Ницца, Франция).
Разработана многослойная архитектура проактивной интегрированной среды взаимодействия и представлена детальная схема функционирования каждого слоя (рис. 6). Благодаря модульности и многослойности архитектуры упрощается масштабирование программного продукта и его настройка для конкретной предметной области.
В базовой версии программного продукта реализована возможность импорта SOAP- и REST-сервисов. Также на примере SAWSDL продемонстрирована возможность интеграции сервисов, для которых описана семантика. Для интеграции семантических веб-сервисов реализован модуль согласования (медиации) данных. Данный процесс частично автоматизирован, однако его полная автоматизация является сложной задачей, которая в настоящее время не решена, поэтому был разработан соответствующий интерфейс для инженера онтологий (рис. 6а).
Для реализации модуля определения ситуации использован многоагентный подход (рис. 66). Для получения значений параметров ситуации используются формально описанные виртуальные датчики, процедура сбора данных с которых может зависеть от показаний других датчиков. Каждому датчику соответствует программный агент, осуществляется согласование данных и параллелизация опросов.
Для представления ситуационных аннотаций комплексных сервисов разработано расширение языка WSML, именуемое WSML+ (рис. 6в). Администратор хранилища с использованием специально разработанного инструмента имеет возможность добавлять композиции сервисов для решения рутинных задач, которые загружаются в единый реестр.
Результатом ситуационной генерации сервиса является его описание на языке WSML без использования дополнительных возможностей WSML+, поскольку сгенерированный сервис представляет собой простую последовательность базовых сервисов без ситуационных аннотаций (рис. 6г). Конечный пользователь получает список рекомендованных ему сервисов, соответствующих запросу, в порядке убывания релевантности.
Слой запуска сервисов представляет собой надстройку над слоем интеграции базовых сервисов. Запуск сервисов и взаимодействие с конечными приложениями осуществляется с использованием средств WSMX. Для интеграции используются настраиваемые адаптеры протоколов.
ГиятсрфеЯс иижхмчра ^ олплогмй J
Г* Иесомнгвческде | I Семантические . •
I *еб-<1!Т>«НСИ . I ►вб-С«р»НС1й '
1С'~ 1С 1)1" 1С~ 1Г_~ 1Х_Г
Г Сервис | Г Сдою I Гскрлис | Г Серим; | Гссрмк | Г Серы*
Иллуаггоыати'кскак еензнгячсскш аши*глциа еережч^в (ист«.фунгиконадьвые л нефункциональны«лараггернстихи)
1'оестр гсрииси» (№!&{(,)
а) Слой интеграции базовых сервисов
Принтах ми ¡ия. К1
б) Слой анализа взаимодействия
I Икхерфейс . г
| »ям»тис*ратор» г — Н хранилища 1 ( : Л
в) Слой управления единым хранилищем сервисов
I ФОРМАЛЮСМНИОС | оинсаняе »просе
| ФврЫИШГКЯШИМе 1 ОЛНПНКС е«»исл 1
■\ - г—
Поиск сервисов Кяасгериздт*
ППВЗЙору 1!ЙЯСЙ сервисов
X
Обкоиление хракн'мши
: / \ у
Ц Тесшроинне Г<
г >
(Чдукда»
«ране ов
\ л
1 '
/
1 енерешн*
шиша
\
Формадндомняос 1ЧП1СЯО« лчеушеЙ
г) Слой ситуационнои генерации сервисов Рисунок 6. Многослойная архитектура проактивной интегрированной среды взаимодействия
Проверка достижения цели исследования, заключающейся в повышении релевантности и эффективности использования предоставляемых потребителям электронных услуг, была выполнена путем вычисления метрик точности (Р) и полноты (Я) на основе собранных в ходе вычислительного эксперимента экспертных оценок релевантности.
Пусть 5SbIд - множество сервисов, выданных в результате обработки запроса, 5рел - множество сервисов хранилища и потенциальных композиций на их основе, оцененных экспертами как релевантные. Тогда точность и полнота вычисляются по формулам (10) и (11) соответственно.
р _ Ирел п55кд1 (10)
frj
]5ргл п (J п
Оценка точности и полноты была проведена для выделенных трех категорий запросов: 1) простой запрос: задана одна цель, отсутствуют ограничения; 2) запрос средней сложности: задана одна или две цели с ограничениями; 3) сложный запрос: задано не менее трех целей.
Суть вычислительного эксперимента заключалась в следующем. Была сформирована группа из 20 независимых экспертов, выбранных из команды разработчиков проекта «Nice Future Campus» и пилотной группы его пользователей. Перед каждым из них была поставлена задача формулировки 15 запросов: по 5 запросов каждой категории. В результате было получено 100 запросов каждой категории. Каждый эксперт для каждого своего запроса до начала его обработки должен был отметить сервисы или цепочки сервисов, которые, по его мнению, были релевантными. На основе выданных прототипом результатов и экспертных оценок были рассчитаны значения полноты и точности.
Как видно из результатов эксперимента, представленных в таблице 1, для запросов средней сложности было получено максимальное значение полноты. Это связано с тем, что чем более детальным является запрос, тем точнее можно построить композицию, однако при чрезмерном усложнении композиции может снизиться релевантность результатов. Последнее объясняется еще и тем, что в этом случае пользователю сложнее корректным образом сформулировать запрос.
Для сравнения, те же характеристики были рассчитаны при отключенном модуле определителя ситуаций, т.е. при поиске сервисов не были задействованы ситуационные аннотации сервисов. Результаты представлены в таблице 1.
Как видно из результатов эксперимента, поиск с учетом ситуационных аннотаций сервисов позволяет увеличить как полноту, так и точность для всех трех категорий запросов.
Таблица I. Результаты сравнительного эксперимента разных видов поиска
Сложность запроса Поиск с учетом ситуации Поиск без учета ситуации
Точность Полнота Точность Полнота
Простой запрос 73,9% 62,1% 66,3% 55,8%
Запрос средней сложности 76,2% 63,4% 53,2% 56,4%
Сложный запрос 74,8% 63,8% 51,0% 56,2%
Поскольку на сегодняшний день не существует реализаций контекстно-зависимых паттернов (эвристик), то невозможно провести сравнительную оценку по ключевым показателям. Поэтому была предложена следующая методика, позволяющая оценить эффективность использования найденных эвристик и их ситуационных аннотаций.
Пусть А - паттерн, С (Л) - цель, которой он позволяет достичь.
Л'5Ь1Д(Л) - автоматически вычисляемое количество появлений А в результатах обработки запросов.
А'ргл (А) - количество появлений А в результатах запросов, оцененных пользователями в качестве релевантных.
(А) - автоматически вычисляемое количество запросов, в которых хотя бы для одной из участвующих целей д было бы выполнено условие д С С (А) (на основе онтологии целей).
Тогда относительная релевантность выдачи паттерна А вычисляется по формуле (12).
Востребованность паттерна А можно оценить по формуле (13).
<13)
Всего в ходе проведения эксперимента было автоматически выявлено 6 паттернов, среднее арифметическое значений их относительной релевантности составило 71,4%, а среднее арифметическое значений востребованности - 46,3%.
Результаты демонстрируют востребованность и релевантность выдачи автоматически обнаруживаемых эвристик. В случае отсутствия надстройки для поиска паттернов, пользователю для решения аналогичной задачи пришлось бы отдельно искать нужные сервисы и самостоятельно выполнять согласование входных и выходных данных.
В заключении формулируются основные результаты, полученные в ходе выполнения диссертационной работы, и выделяются возможные направления дальнейших исследований.
ОСНОВНЫЕ РЕЗУЛЬТАТЫ ДИССЕРТАЦИОННОЙ РАБОТЫ
1. Проведен анализ существующих подходов к решению задачи адаптивного предоставления сервисов, стандартов описания сервисов, методов автоматической композиции сервисов, в результате сформированы требования к проактивной интегрированной среде взаимодействия, осуществляющей автоматический поиск наилучших композиций гетерогенных сервисов, соответствующих комплексной задаче пользователя, на основе анализа опыта предоставления сервисов в различных ситуациях.
2. Разработана модель единого хранилища сервисов, позволяющая унифицированным образом представить знания о гетерогенных базовых сервисах и их композициях. Модель отличается возможностью хранить семантические связи между сервисами, а также между сервисами и элементами ситуации в форме контекстно-зависимых эвристик. Модель основана на интеграции нескольких онтологии и позволяет осуществлять логический вывод для поиска фрагментов сервисов в конкретной ситуации использования.
3. Разработан метод динамического наполнения единого хранилища сервисов за счет импорта базовых сервисов и интеллектуального поиска устойчивых композиций сервисов. Уникальность метода заключается в том, что помимо композиций сервисов, он позволяет также определять факторы, влияющие на использование сервисов в определенной ситуации.
4. Разработан метод динамической генерации сервисов, позволяющий получить наиболее релевантный результат за счет использования комплексных семантических аннотаций базовых сервисов и их композиций.
5. На основе созданных моделей и методов разработано программное обеспечение, позволяющее улучшить релевантность и эффективность предоставляемых пользователям сервисов. Данное программное обеспечение апробировано в рамках проекта «Nice Future Campus» (Ницца, Франция).
ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ
Статьи в ведущих рецензируемых научных журналах н изданиях, включенных в список ВАК РФ
1. Ишкина Е.Г., Щербинина О.В. Архитектура адаптивного сервисно-ориентированного промежуточного программного обеспечения //Известия Волгоградского государственного технического университета: межвузовский сборник научных статей. Серия «Актуальные проблемы управления вычислительной техники и информатики в технических системах», выпуск 9, №11 (71). - Волгоград: ВолгГТУ, 2010. - с. 142-145. -ISSN 1990-5297.
2. Ишкина Е.Г. Поиск устойчивых ситуационных композиций сервисов // Научно-технический журнал «Прикаспийский журнал: управление и высокие технологии» №3 (15). - Астрахань: Издательский дом «Астраханский университет», 2011. - с. 12-19. - ISSN 2074-1707.
3. Ишкина Е.Г. Ситуационная генерация сервисов // Известия Волгоградского государственного технического университета: межвузовский сборник научных статей. Серия «Актуальные проблемы управления вычислительной техники и информатики в технических системах», выпуск 12, №11 (84). - Волгоград: ВолгГТУ, 2011. - с. 88-92. -ISSN 1990-5297.
Статьи в материалах международных, всероссийских конференций,в журналах
4. Miranda S., Ishkina Е. NFC Mobiquitous Ecosystem for information Services of the Future: Applications to M-tourism and M-learning // Материалы международной научной конференции «Электронная культура. Информационные технологии будущего и современное электронное обучение Modern IT & (Е-) Learning», Астрахань, 6-8 октября, 2009. - с. 2328.
5. Ishkina Е. Collective service intelligence management in mobiquitous systems // Proceedings of the Sixth International Conference on Internet and Web Applications and Services (ICIW 2011), Sint Maarten, The Netherlands Antilles, March 20-25, 2011. -c. 51-57. - ISBN 978-1-61208-004-8.
6. MirandaS., Pastorelly N„ Ishkina E., Torre D., ChaixL. Lessons inferred from NFC mobiquitous innovative information service prototyping at the University of Nice Sophia Antipolis // Ingénierie des Systèmes d'Information №4 Vol. 16, numéro spécial "SI mobiquitaires" / Cachan (France): Lavoisier, 201 l.-c. 15-48.-ISSN 1633-131.
7. Narni-Mancinelli G., Benouali H., Leitzelman M., Salvadore M., Ishkina E., Miranda S. MBDS2.0, plateforme générique de gestion de tags NFC et 2D pour des espaces culturels intelligents et communautaires 2.0 // Ingénierie des Systèmes d'Information №4 Vol. 16, numéro spécial "SI mobiquitaires" / Cachan (France): Lavoisier, 2011. - с. 49-62. - ISSN 1633-131.
Типография «АВАНТАЖ» И.П. Кацуба A.C. ИНН 301505370194 Юридический адрес: 414000, г. Астрахань, ул. Куликова, д. 77, корп. 2, кв. 63 Заказ №133 Тираж: 100 экз. Подписано в печать 24.02.2012 г.
Текст работы Ишкина, Евгения Геннадиевна, диссертация по теме Управление в социальных и экономических системах
61 12-5/2025
ФГБОУ ВПО «АСТРАХАНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ»
Ситуационное управление процессом генерации электронных услуг на основе контекстно-зависимых эвристик
Специальность: 05.13.10 - Управление в социальных и экономических системах
Диссертация на соискание степени кандидата технических наук
На правах рукописи
Ишкина Евгения Геннадиевна
Научный руководитель к.т.н. Щербинина О.В.
СОДЕРЖАНИЕ
ВВЕДЕНИЕ..................................................................................................................5
1. АНАЛИЗ ТЕКУЩЕГО СОСТОЯНИЯ ИССЛЕДУЕМОЙ ПРОБЛЕМЫ В МИРЕ..........................................................................................................................10
1.1. Анализ современных тенденций в разработке распределенных веб-ориентированных информационных систем......................................................10
1.1.1. Сервис-ориентированная архитектура..................................................10
1.1.2. Промежуточное программное обеспечение.........................................13
1.1.3. Контекстно-зависимые системы............................................................14
1.1.4. Задачеориентированные системы..........................................................16
1.1.5. Системы на основе онтологий...............................................................17
1.1.6. Системы рекомендаций..........................................................................18
1.1.7. Выводы.....................................................................................................19
1.2. Анализ существующих подходов к решению задачи адаптивного предоставления сервисов потребителям.............................................................21
1.2.1. Программные платформы для предоставления персонализированных сервисов..............................................................................................................22
1.2.2. Программные платформы для предоставления контекстно-зависимых сервисов..............................................................................................................23
1.2.3. Программные платформы для поиска сервисов, соответствующих комплексной пользовательской задаче...........................................................25
1.2.4. Программные платформы для поиска шаблонов композиций сервисов..............................................................................................................26
1.2.5. Выводы.....................................................................................................27
Выводы по первой главе.......................................................................................28
2. ИССЛЕДОВАНИЕ ТЕХНОЛОГИЙ СЕРВИС-ОРИЕНТИРОВАННЫХ СИСТЕМ....................................................................................................................29
2.1. Технологии описания сервисов....................................................................29
2.1.1. Технологии описания операционного синтаксиса сервисов..............29
2.1.1.1. SOAP..................................................................................................30
2.1.1.2. REST..................................................................................................31
2.1.1.3. Выводы..............................................................................................33
2.1.2. Технологии описания композиционной семантики............................33
2.1.2.1. OWL-S....'...........................................................................................34
2.1.2.2. WSMO...............................................................................................35
2.1.2.3. Другие подходы................................................................................37
2.1.2.4. Сравнительный анализ фреймворков семантических веб-сервисов..........................................................................................................39
2.1.2.5. Выводы..............................................................................................41
2.1.3. Выводы.....................................................................................................41
2.2. Методы автоматической композиции сервисов..........................................42
2.2.1. Выводы.....................................................................................................44
2.3. Методы представления динамических сценариев......................................44
2.3.1. Статистические методы..........................................................................45
2.3.2. Ситуационное управление.....................................................................45
2.3.3. Специальные виды графов.....................................................................45
2.3.4. Выводы.....................................................................................................46
Выводы по второй главе.......................................................................................46
3. МОДЕЛЬ ПРОАКТИВНОЙ ИНТЕГРИРОВАННОЙ СРЕДЫ ВЗАИМОДЕЙСТВИЯ...............................................................................................47
3.1. Формальное определение проактивной интегрированной среды взаимодействия......................................................................................................47
3.2. Архитектура верхнего уровня проактивной интегрированной среды взаимодействия......................................................................................................50
3.2.1. Слой интеграции базовых сервисов......................................................52
3.2.2. Слой управления единым хранилищем сервисов................................52
3.2.3. Слой ситуационной генерации сервисов..............................................54
3.2.4. Слой представления конечных сервисов..............................................55
3.2.5. Слой анализа взаимодействия...............................................................55
3.3. Контекстная модель единого хранилища гетерогенных сервисов...........56
3.4. Модель ситуаций использования сервисов.................................................59
3.4.1. Пример виртуального датчика и преобразования данных..................61
3.5. Формальная модель сервиса.........................................................................62
3.5.1. Пример описания сервиса......................................................................65
Выводы по третьей главе......................................................................................67
4. МЕТОДЫ ДЛЯ ПРОАКТИВНОЙ ИНТЕГРИРОВАННОЙ СРЕДЫ ВЗАИМОДЕЙСТВИЯ...............................................................................................69
4.1. Метод динамического построения единого хранилища гетерогенных сервисов..................................................................................................................69
4.1.1. Существующие алгоритмы интеллектуального анализа данных, применимые к задаче поиска контекстно-зависимых эвристик...................69
4.1.1.1. Поиск ассоциативных правил.........................................................69
4.1.1.2. Поиск последовательных шаблонов..............................................70
4.1.1.3. Вывод о выборе алгоритма для поиска контекстно-зависимых эвристик..........................................................................................................73
4.1.2. Генерация семантических аннотаций сервисов...................................73
4.1.3. Поиск эвристик на множестве сервисов и задач..................................75
4.1.4. Вычисление семантической схожести сервисов..................................77
4.1.5. Принятие решения о добавлении сервиса в единое хранилище........78
4.1.5.1. Оценка выполнимости композиции...............................................78
4.1.5.2. Оценка новизны композиции..........................................................79
4.1.5.3. Оценка неожиданности композиции..............................................79
4.2. Метод ситуационной генерации сервисов...................................................80
4.2.1. Формулировка пользовательского запроса в виде группы целей......80
4.2.2. Поиск сервисов для каждой группы целей...........................................81
4.2.3. Кластеризация сервисов, соответствующих каждой группе целей... 82
4.2.4. Семантическая редукция сервисов........................................................83
4.2.5. Генерация плана выполнения цели.......................................................84
4.2.6. Генерация вызовов базовых сервисов...................................................84
4.2.7. Выводы.....................................................................................................84
4.3. Частичное выполнение цели.........................................................................84
Выводы по четвертой главе..................................................................................85
5. ПРОВЕРКА АДЕКВАТНОСТИ РАЗРАБОТАННЫХ МОДЕЛЕЙ И МЕТОДОВ.................................................................................................................87
5.1. Детальная архитектура промежуточного программного обеспечения .... 87
5.1.1. Слой интеграции базовых сервисов......................................................87
5.1.2. Слой анализа взаимодействия...............................................................89
5.1.3. Слой управления единым хранилищем сервисов................................90
5.1.4. Слой ситуационной генерации сервисов..............................................91
5.1.5. Слой запуска сервисов............................................................................92
5.2. Описание разработанного приложения.......................................................92
5.3. Проведение эксперимента.............................................................................94
5.3.1. Используемые метрики...........................................................................94
5.3.2. Постановка вычислительного эксперимента.......................................94
5.3.3. Результаты эксперимента.......................................................................95
Выводы по пятой главе.........................................................................................97
ЗАКЛЮЧЕНИЕ.........................................................................................................98
БИБЛИОГРАФИЧЕСКИЙ СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ .... 100
ПРИЛОЖЕНИЕ 1. СПРАВКА ОБ ИСПОЛЬЗОВАНИИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ..................................................................................................Ш
ПРИЛОЖЕНИЕ 2. АКТ О ВНЕДРЕНИИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ В УЧЕБНЫЙ ПРОЦЕСС............................................................................................ИЗ
ВВЕДЕНИЕ
Актуальность темы исследования
В настоящее время Интернет представляет собой постоянно развивающуюся сетевую инфраструктуру, позволяющую создавать, распространять, использовать и интегрировать информационные ресурсы. Сервис-ориентированная парадигма на сегодняшний день признана основной для Интернет, что подтверждается значительным объемом исследований в этой области и развитием соответствующих технологий за последние 10 лет [30].
Для обеспечения интероперабельности гетерогенных ресурсов и сервисов Интернет требуются семантические технологии, единые стандарты и средства согласования данных [79]. Анализ европейских исследовательских проектов позволяет сделать вывод, что количество доступных сервисов в скором времени будет исчисляться миллиардами [80].
В перечень десяти ключевых стратегических технологий 2012 года, по мнению Gartner, ведущей исследовательской и консалтинговой компании, специализирующейся на рынках информационных технологий, входят [24] :
1) Контекстно-зависимые вычисления (context-aware Computing). В таких приложениях используется информация об окружении пользователя, его действиях, предпочтениях с целью улучшения качества его взаимодействия с системой путем предоставления ему персонализированного контента, продукта или услуги. Наибольший интерес такие приложения представляют для пользователей мобильных устройств. Количество смартфонов, по оценкам Gartner, к 2013 году возрастет втрое и составит 1,82 миллиарда [23]. Все больше будет разрабатываться и потребляться сервисов для мобильных устройств.
2) Интернет Вещей {Internet of Things). Одним из катализаторов его развития является технология NFC (Near Field Communication), которая представляет интерес в сфере мобильных платежей, а также позволяет улучшить качество услуг в сфере общественного транспорта, авиаперевозок, торговли и здравоохранения.
3) Новое поколение аналитических средств. В этой области Gartner прогнозирует смещение фокуса в сторону коллективного принятия решений, переход от анализа исторических данных с целью выяснения причин определенных фактов к анализу исторических данных в совокупности с данными, поступающими в режиме реального времени, для формирования прогнозов. [77]
Таким образом, эти стратегические технологии отражают следующие тенденции развития Интернет: стремительный рост количества сервисов, доступных, прежде всего, пользователям мобильных устройств; необходимость их адаптации к требованиям конкретного пользователя и, наконец, необходимость прогнозирования будущих потребностей потребителей сервисов.
Множество доступных сервисов может быть также расширено за счет комбинации функциональности уже существующих сервисов. В настоящее время для многих систем разрабатывается API {Application Programming Interface, Прикладной Интерфейс Программирования), который позволяет внешним системам использовать и интегрировать их функциональные возможности. Основным средством обеспечения взаимодействия являются веб-сервисы, реализуемые с использованием REST- и SOAP-подходов [58].
Несмотря на то, что компоновка сервисов становится все более актуальной, эта задача в настоящее время слабо автоматизирована. Для обеспечения лучшей ориентации пользователей в непрерывно растущем пространстве гетерогенных сервисов требуется реализация аналитических средств нового поколения, обеспечивающих проактивность, то есть поиск эффективных комбинаций сервисов, позволяющих решать типовые пользовательские задачи, с целью последующего повторного использования.
Однако на сегодняшний день отсутствует универсальная платформа для эффективного решения проблемы интеграции гетерогенных сервисов и проактивного поиска заранее не предусмотренных поставщиками сервисов
вариантов их использования для решения типовых пользовательских задач. Возможности динамической адаптации существующих систем к контексту использования также достаточно ограничены.
Целью диссертационной работы является повышение релевантности и эффективности использования предоставляемых потребителям электронных услуг в различных социально-экономических системах за счет интеграции гетерогенных сервисов и проактивного анализа коллективного опыта их использования в различных ситуациях, инвариантного по отношению к предметной области.
Для достижения поставленной цели необходимо решить следующие задачи:
1. Провести анализ существующих подходов к решению задачи интеграции сервисов и их адаптивного предоставления потребителям;
2. Выбрать технологии для достижения поставленной цели.
3. Разработать модели проактивной интегрированной среды взаимодействия для сервис-ориентированных систем.
4. Разработать методы динамического построения единого хранилища гетерогенных сервисов и динамической генерации сервисов, соответствующих задаче пользователя;
5. Разработать программное обеспечение на основе созданных моделей и методов.
Основные научные результаты диссертации
1. Разработана модель единого хранилища сервисов, позволяющая унифицированным образом представить знания о гетерогенных базовых сервисах и их композициях. Модель отличается возможностью хранить семантические связи между сервисами, а также между сервисами и элементами ситуации в форме контекстно-зависимых эвристик. Модель основана на интеграции нескольких онтологий и позволяет осуществлять логический вывод для поиска фрагментов сервисов в конкретной ситуации использования.
2. Разработан метод динамического наполнения единого хранилища сервисов за счет импорта базовых сервисов и интеллектуального поиска устойчивых композиций сервисов. Уникальность метода заключается в том, что помимо композиций сервисов, он позволяет также определять факторы, влияющие на использование сервисов в определенной ситуации.
3. Разработан метод динамической генерации сервисов, позволяющий получить наиболее релевантный результат за счет использования комплексных семантических аннотаций базовых сервисов и их композиций.
Практическая значимость диссертационного исследования состоит в том, что на основе предложенных моделей и методов разработано программное обеспечение, осуществляющее автоматический поиск наилучших композиций гетерогенных сервисов, соответствующих комплексной задаче пользователя, на основе анализа опыта использования сервисов в различных ситуациях.
Результаты работы используются в проекте Nice Future Campus (Ницца, Франция), а также в учебном процессе в Астраханском государственном университете при изучении дисциплин «Технологии анализа данных», «Онтологии и мультиагентные системы», «Современные средства разработки приложений».
Область применения результатов
Результаты исследований могут быть использованы в информационных системах на основе сервис-ориентированной архитектуры в различных социально-экономических областях. Цель применения этих результатов исследований заключается в стремлении повысить эффективность использования сервисов конечными потребителями. Для этого формируется дополнительный дополнительного слой между пользователями и информационной системой, который интегрирует сервисы одной или нескольких информационных систем и, возможно, внешние сервисы и предоставляет дополнительные аналитические возможности.
При этом можно выделить три категории систем, отличающиеся друг от
друга особенностями применения результатов исследования:
1) Системы, в которых эффективность взаимодействия с пользователями можеть быть улучшена путем проактивного поиска подходящих сценариев решения задач - эвристик. Примером может служить система конструирования новых технических решений, в которой на основе коллективного анализа деятельности разных инженеров могут быть получены оптимальные способы решения некоторых задач.
2) Системы, в которых эффективность взаимодействия с пользователями может быть улучшена путем проактивного поиска факторов, влияющих на использование тех или иных сервисов в тех или иных ситуациях, что позволило бы формировать персональные рекомендации. Примером может служить система сервисов электронного правительства.
3) Системы, в которых эффективность взаимодействия с пользователями может быть улучшена путем проактивного поиска подходящих сценариев решения задач и проактивного поиска факторов, влияющих на использование тех или иных сервисов в тех или иных ситуациях. Примером может служить система сервисов для туристов. Причем именно эта сфера является наиболее перспективной областью внедрения результатов исследования, т.к. именно в данной сфере наиболее широко разнообразие предлагаемых сервисов, данная сфера задействует ш
-
Похожие работы
- Математическое и программное обеспечение для формализации приоритетов пользователя с целью повышения эффективности использования сетевых сервисов
- Разработка методов и моделей построения сервис-ориентированной системы обеспечения инфомобильности
- Принципы и логические средства интеллектуального анализа социологических данных
- Методики выявления потенциально вредоносных файловых объектов на основе интеллектуального анализа данных
- Управление движением городского пассажирского транспорта на основе нечеткого ситуационного подхода
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность