автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Система управления содержанием WEB сайта

кандидата технических наук
Коршунов, Андрей Александрович
город
Москва
год
2004
специальность ВАК РФ
05.13.11
Диссертация по информатике, вычислительной технике и управлению на тему «Система управления содержанием WEB сайта»

Оглавление автор диссертации — кандидата технических наук Коршунов, Андрей Александрович

Специальность 05.13.11 - «Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей»

Диссертация на соискание ученой степени кандидата технических наук

Научный руководитель -доктор физико-математических наук профессор В. А. Васенин

Москва

Оглавление

Введение.

Раздел I Глобальная сеть Интернет и WEB среда.

1.1 Сеть Интернет.

1.2 WEB. Гипертекст как основа технологии. Развитие.

1.2.1 Гипертекст, HTML.

1.2.2 Протокол HTTP. URI.

1.2.2.1 OPTIONS.

1.2.2.2 GET.

1.2.2.3 HEAD.

1.2.2.4 POST.

1.2.2.5 PUT.

1.2.2.6 DELETE.

1.3 Развитие WEB среды.

1.3.1 CGI.

1.3.1.1 GET.

1.3.1.2 POST.

1.3.2 JAVASCRIPT.

1.4 Вывод.:.

Раздел П Управление содержанием в среде WEB.

II. 1 Проблемы управления содержанием в среде WEB.

II.2 Развитие систем управления содержанием.

И. 3 Основные задачи систем управления содержанием WEB.

И.3.1 Модель представления содержания.

II.3.1.1 Схема организации документов.

П.3.1.2 Форма представления материала.

11.3.2 Механизмы работы с содержанием.

11.3.3 Механизмы управления дизайном страниц.

11.3.4 Механизмы поддержки сообществ пользователей.

11.3.5 Механизмы поддержки бизнес - процессов и интеграции приложений.

И. 4 Вывод.

Раздел III Построение системы управления содержанием WWW.

III. 1 Описание предлагаемой модели системы.

III. 1.1 Модель представления содержания.

III. 1.1.1 Структурная составляющая.

III. 1.1.2 Манипуляционная составляющая.

III. 1.1.3 Целостная составляющая.

III. 1.2 Модель управления дизайном страниц.

111.2 Формальное описание модели.

111.3 Основные компоненты системы. Взаимосвязь между ними.

111.3.1 Подсистема для подготовки материалов и управления сайтом.

111.3.2 Подсистема визуализации материалов.

111.4 Программная реализация компонент системы.

111.4.1 Подсистема подготовки материалов.

111.4.1.1 Архитектура и программные средства, применяемые при разработке подсистемы.

111.4.1.2 Модули подсистемы, их реализация.

III.4.1.2.1 Основные реляционные таблицы данных.

Ш.4.1.2.2 Модули подсистемы.

111.4.1.2.2.1 Модуль управления сайтом.

111.4.1.2.2.2 Модуль управления материалами.

111.4.2 Подсистема отображения материалов.

III.4.2.1 Архитектура и программные средства, применяемые при разработке подсистемы.

III.4.2.2 Модули подсистемы, их реализация.

111.4.2.2.1 Модуль работы с базой данных.

111.4.2.2.2 Модуль работы с XML и XSLT.

111.4.2.2.3 Модуль работы с cookies.

111.4.2.2.4 Модуль работы с CGI параметрами.

111.4.2.2.5 Модуль вызова внешних функций.

III. 5 Результаты.

Раздел IV Практическое использование системы.

IV. 1 Сайт открытого исследовательского проекта по созданию системы управления содержанием WEB-сайта.

IV. 1.1 Структура сайта и формат представления материалов.

IV. 1.2 Функциональные возможности сайта.

IV.2 База данных томографических исследований.

IV.2.1 Реализация базы данных томографических исследований с использованием системы управления содержанием.

IV.2.1.1 Создание структуры сайта и структуры материалов сайта.

IV.2.1.2 Разработка структуры основного документа.

IV.2.1.3 Разработка XSLT шаблонов для отображения материала.

IV.2.1.4 Загрузка материалов в базу данных.

IV.2.1.5 Внесение дополнительной информации.

IV.2.2 Функциональные возможности системы.

IV.3 Сайт научных работ Н. Г. Четаева, его учеников и последователей.

IV.3.1 Использование системы управления содержанием при создании сайта.

IV.3.1.1 Подготовка данных и их загрузка в систему управления содержанием

IV.3.1.2 Разработка структуры сайта.

IV.3.2 Функциональные возможности системы.

IV.4 Система автоматизации бизнес-процессов.

IV.4.1 Разрабатываемая workflow-система.

IV.4.1.1 WEB интерфейс.

IV.4.1.2 Функциональные возможности сайта.

IV. 5 Выводы.

Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Коршунов, Андрей Александрович

Технологии на базе языка разметки HTML, протокола передачи гипертекстовых документов HTTP и стандарта идентификации ресурсов URI, которые называют WEB технологиями, появились немногим более 10 лет назад. Несмотря на относительно небольшой срок практического использования, эти технологии сегодня доминируют в глобальной сети Интернет. У многих людей понятие Интернет ассоциируется с инфраструктурой World Wide Web, которую называют Всемирной паутиной или, коротко, - WEB средой. Темпы развития Интернет в последнее десятилетие действительно в значительной степени связаны и определяются WWW, однако следует отметить, что далеко не все проблемы, возникшие еще на этапе создания и развития новых технологий, решены в настоящее время. Важнейшей в этом перечне является проблема управления содержанием WEB сайта Термин «содержание» в данном случае не затрагивает семантическую сторону информации, представляемой в WEB пространстве, а подразумевает информационное наполнение или собственно данные. Настоящая работа посвящена созданию системы управления содержанием WEB сайта. Подобные системы могут являться одним из вариантов решения важнейшей задачи на современном этапе эволюционного развития Всемирной паутины.

К сожалению, большинство проблем управления содержанием, размещаемым в WEB, является следствием применения протоколов, на которых базируется эта служба. С другой стороны, именно простота реализации и использования этих протоколов и технологий послужили причиной столь широкой популярности Всемирной паутины. С учетом этого обстоятельства необходимо искать компромисс между применением WEB технологий и растущими потребностями в области управления информацией.

В настоящее время существует несколько различных подходов к решению проблем управления содержанием в среде WEB. Реализация этих решений чаще всего проявляется в виде создания программных комплексов, называемых системами управления содержанием WEB сайта. Учитывая разнообразие и сложность задач, решаемых с помощью WEB технологий, каждая из таких систем занимает свою нишу и ориентирована на использование в том или ином секторе или сфере человеческой деятельности.

Созданная автором в ходе выполнения настоящей работы система управления содержанием WEB сайта не претендует на роль инструментария, позволяющего полностью решить проблемы управления информацией во всех возможных задачах и направлениях использования среды WEB. Основной упор при проектировании и разработке системы делался на возможность ее применения как эффективного средства построения корпоративного портала. Эта задача является частью проблемы создания интегрированной системы распределенных информационных ресурсов (ИСРИР) организации, ведомства или корпорации. Подобная система предусматривает различные модели и сценарии интеграции информационных ресурсов. Среди этих сценариев одним из важнейших является корпоративный портал. Цель настоящей работы заключается в разработке модели представления содержания и создании на базе этой модели системы управления содержанием WEB сайта, которая может использоваться как средство реализации такого сценария интеграции приложений.

Заключение диссертация на тему "Система управления содержанием WEB сайта"

IV.5 Выводы

В настоящем разделе приведены примеры использования созданной автором системы управления содержанием WWW сайта Разработанные сайты достаточно убедительно демонстрируют эффективность решения некоторого класса задач с применением WEB среды. Соответственно, автором предлагается использование системы управления содержанием для создания этих сайтов.

В первом случае (статический сайт, посвященный системе управления содержанием) главной задачей является предоставление пользователям оперативной информации о системе. Хорошо выбранный формат представления этой информации помогает удовлетворить большой круг запросов, связанный со способом ее визуализации и, как следствие, повторного использования. Язык XML, применяемый для представления материалов в системе управления содержанием позволяет решать эти проблемы.

Второй сайт служит примером небольшой информационной системы, предоставляющей конечным пользователям структурированный доступ к некоторым данным, которые возможно изначально не являлись строго структурированными. Характерной чертой подобных систем является то, что актуализация базы данных происходит в одном месте (одним человеком), а остальные пользователи имеют доступ только для чтения этих данных. Основной задачей в данном случае является предоставление пользователям " удобных механизмов поиска и предоставления информации, что с успехом и за достаточно короткий промежуток времени было реализовано с помощью системы управления содержанием WEB сайта Кроме этого, если по каким - либо причинам система управления содержанием не подходит для создания информационной системы (большое количество запросов к системе, большие объемы данных, некоторые вопросы производительности), система может использоваться для разработки тестовой версии проекта. Применение системы в этом случае позволит существенно сократить время создания такой версии проекта, поможет обнаружить различные «слабые» стороны проекта (недостаточная функциональность, производительность и т.п.), а также определить возможные варианты развития системы.

Сайт библиографических ссылок научных работ Н. Г. Четаева иллюстрирует возможность применения языка разметки XML для хранения библиографической информации. Кроме того, в данном примере происходит переход от формата ТЕХ (в частности BibTEX) к XML для хранения исходных данных. Использование для этих целей XML позволяет не только размещать документы на WEB сайте, но и производить дополнительные преобразования (например, в формат BiBTEX) для подготовки печатных изданий. Также на этом примере показана возможность создания с помощью системы управления содержанием небольших баз данных с широкими возможностями поиска

Сайт системы автоматизации бизнес-процессов показывает возможности системы управления содержанием для создания сайтов, в которых необходима достаточно сложная программная логика. В этом случае основная функциональность создаваемого приложения выносится «за пределы» системы управления содержанием, что позволяет разработчикам не ограничивать себя возможностями системы. Система управления содержанием отвечает за логику представления данных. Изменение внешнего вида сайта осуществляется без изменения программного кода, что способствует ускорению процесса создания системы.

Заключение

К основным результатам исследований и практических работ, выполненных автором по теме настоящей диссертации можно отнести следующие.

• Проведен анализ текущего состояния проблем, определяющих настоящее и будущее среды WEB, в первую очередь- с позиции управления информацией, которая определяет ее содержание. В ходе такого анализа выявлено, что в основе существующих в настоящее время проблем управления информацией лежат технологические особенности WEB протоколов и стандартов (HTTP, HTML). Именно функциональные возможности и простота применения этих протоколов является главным фактором, определяющим высокие темпы развития указанного сервиса С учетом изложенного сделан вывод о том, что для решения проблем управления информацией в среде WEB необходимо искать новые подходы и программные решения, которые кардинально не затрагивают ее технологической базы. Одним из таких подходов является создание систем управления содержанием.

• Рассмотрены существующие на сегодняшний день решения, связанные с реализацией подходов к управлению содержанием. Предложена общая схема анализа эффективности таких решений, на основании которой проведено сравнение основных из них. По его результатам сделан вывод, что важнейшей составляющей вновь создаваемых систем является модель представления содержания. От выбранной модели в значительной степени зависит функциональность системы и эффективность ее применения в тех или иных областях. Кроме того, сделан вывод о сложности построения универсальных систем управления WEB содержанием. Каждая из вновь создаваемых систем целесообразно ориентировать на решение определенного круга (класса) задач предметной области.

• Предложена модель представления содержания для вновь создаваемой системы. Отличием данной системы является ее практическая направленность на использование в качестве одного из инструментов построения корпоративного портала- механизма интеграции информационных ресурсов корпорации, организации или ведомства В качестве формы представления документов в системе выбран язык XML. Применение данного языка разметки позволяет избавиться от жестко фиксированных форматов данных в пользу определяемых разработчиками с учетом конкретной задачи. Использование в модели языка преобразований XSLT решает важную задачу повторного использования документов. Иерархическая структура организации материалов предоставляет возможность работать сразу с группой материалов как с одним документом. Предложено формальное описание модели.

На основании предложенной модели создана система управления содержанием WEB сайта Система представляет собой два программных модуля: модуль подготовки материалов и управления сайтом и модуль визуализации страниц по запросу пользователей. Первый модуль предназначен для организации процесса управления структурой сайта и манипуляций с размещаемыми на сайте документами. Модуль реализован с использованием языка PL/SQL. Второй модуль обеспечивает визуализацию запрошенной пользователем страницы. Модуль выполнен в виде CGI программы на языке С++. Вся информация, описывающая сайт, хранится в реляционной базе данных. Для этого разработана соответствующая схема базы данных.

С использованием созданной системы управления содержанием были реализованы и прошли практическую апробацию несколько сайтов. Эти сайты показывают функциональные возможности системы в различных предметных областях. Среди указанных сайтов особое место занимает система автоматизации бизнес-процессов. Данный проект иллюстрирует основную направленность созданной системы управления содержанием, как инструментария для реализации одного из основных сценариев интеграции приложений. Успешная реализация этого сайта позволяет сделать вывод о том, предложенная система управления сайтом способна решить поставленные перед ней задачи.

Не все задачи, возникшие в ходе построения системы управления содержанием WEB сайта, удалось решить в полной мере. Дня части из них были предложены компромиссные варианты решения, другие требуют дальнейшей работы над системой с привлечением методологии смежных областей. Среди задач, решение которых определяет перспективу развития системы, можно выделить следующие, о Построение подсистемы управления содержанием сайта с использованием самой системы.

Реализация подсистемы управления сайтом средствами системы управления содержанием позволит отказаться от существующей на сегодня зависимости от программных продуктов одного производителя в пользу переносимости и расширяемости системы. Кроме того, такое решение позволит более полно решить проблемы настройки сайта самим пользователями (кастомизация), что расширит области возможного применения системы, в том числе и как инструментария построения корпоративного портала о Расширение механизмов, обеспечивающих эффективное разграничение прав доступа

Механизм разграничения прав доступа, которые реализован в настоящее время в системе, отвечает необходимым требованиям информационной безопасности, выработанным при ее создании. В тоже время практическое использование системы управления содержанием показало потребность в расширении этого механизма, которое призвано сделать его более гибким и охватывающим большее число объектов системы, таких, как страницы, блоки, шаблоны, индексы и т.п. Реализация такого механизма также существенно расширит круг задач, для решения которых может применяться созданная система Кроме того, применение такой технологии, как PNIAM (Pluggable Non Interactive Authentication Modules) [58] позволит повысить общий уровень защищенности системы. Предложенная в диссертации система открыта к введению в систему нового модуля редактирования материалов. В настоящее время консорциумом W3C разрабатывается новый стандарт описания WEB форм- XForms. Одним из новшеств этого стандарта станет возможность редактирования XML документов. Однако работы по стандартизации еще продолжаются, а проблема требует своего решения. В этом случае видится логичным использовать технологию ProXForms, предложенную и разрабатываемую в МГУ в рамках работ по созданию инструментальных средств ИСРИР [59] [60].

Резюмируя изложенное выше, можно констатировать, что представленная в настоящей диссертационной работе система управления содержанием WEB сайта показала целесообразность и эффективность своего использования. Она удовлетворяет требованиями, которые были сформулированы при постановке задачи. Система управления содержанием WEB сайта может с успехом применяться при создании различных информационных серверов в среде WEB, ориентированных, в первую очередь, на интеграцию информационных ресурсов, и имеет все предпосылки для дальнейшего развития.

Библиография Коршунов, Андрей Александрович, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. L. Kleinrock, «1.formation Flow in Large Communication Nets», RLE Quarterly Progress Report, July 1961.

2. L. Roberts, «Multiple Computer Networks and Intercomputer Communication», ACM Gatlinburg Conf., October 1967.

3. V. G. Cerf and К E. Kahn, «А protocol for packet network interconnection» IEEE Trans. Comm. Tech., vol. COM-22, V 5, pp. 627-641, May 1974.

4. В. А. Васенин. Российские академические сети и Интернет (состояние, проблемы, решения). М.: Издательство РЭФИА, 1997. 174 с.

5. V. Bush, «As We May Think», Atlantic Monthly, July 1945.

6. Т. H. Nelson, «Computers, Creativity, and the Nature of the Written Word», January 1965.

7. Т. H. Nelson, «Getting it out of our system in Information Retrieval: A Critical Review», G. Schechter, ed. Thomson Books, Washington D.C., 1967,191-210

8. Т. B. Lee «Information Management: A Proposal», http://www.w3.org/Historv/1989/proposal.html

9. Т. B. Lee, К Cailliau «Proposal for a HyperText Project», http://www.w3.org/Proposal.html.

10. Universal Resource Identifiers in WWW, RFC 1630, http://www.ietf.org/rfc/rfcl630.txt

11. Hypertext Markup Language 2.0, RFC 1866, http://www.ietf.org/rfc/rfcl 866.txt

12. Спецификация языка HTML версии 4.01. W3C Recommendation от 24 декабря 1999 г., http://www.w3.org/TR/1999/REC-html401-19991224

13. И. Дуров Современное состояние языков и средств разметки документов // Jetinfo, 2000, № 1.

14. В. А. Садовничий, В. А. Васенин, А А Мокроусов, А В. Тутубалин. Российский Интернет в цифрах и фактах. М.: Изд-во МГУ, 1999. - 148 с.15. ftp://ftp.ripe.net/ripe/hostcount/Historv/OVERVIEW/

15. В. А. Васенин, С. А Афонин, А. А. Коршунов К созданию концепции интегрированной системы распределенных информационных ресурсов Московского государственного университета им. М. В. Ломоносова. М.: Издательство Московского университета, 2001. - 112 С.

16. S. Chawathe, Н. Garcia-Molina, J. Hammer, К. Ireland, Y. Papakonstantinou, J. Ullman, J. Widom. The TSIMMIS project: Integration of heterogeneous information sources. // Processing of IPS J Conference, pp. 7-18. Tokyo, Japan, October 1994.

17. Stefan Tai, Isabelle Rouvellou. Strategies for integration messaging and distributed object transactions. // IFIP/ACM International conference on distributed systems platforms. 2000, pp. 308-330.

18. А. Н. Бездушный, А. Б. Жижченко, М. В. Кулагин, В. А. Серебряков. Интегрированная система информационных ресурсов РАН и технология разработки цифровых библиотек. // «Программирование». 2000, № 4.

19. К. Вавилов, С. Щербина «Web-интеграция». // «Открытые Системы». 2001, № 1.

20. А. А. Коршунов. Корпоративный портал и роль системы управления содержанием. // Международный симпозиум по проблемам модульных систем и сетей ICSNET'2001, сборник трудов. Москва, 2001.

21. Andrpy A Korshunov. Corporate portal and role of content management system. Proceedings FDPW2001-2002, Petrozavodsk, 2002, p.p. 116-123.

22. А. А. Мамыкин. «Бизнес в Интернет. От разработки маркетинговой стратегии до ее реализации». // Конференция «Интернет-Маркетинг'99», Москва, 1999.34. http://www.reksoft.nl/products/dynasite/

23. А. Левенчук. «Управление знаниями в управлении проектами». // IV российская конференция по электронной коммерции, Москва, 2001.

24. E. F. Codd. Data Models in Database Management. ACM SIGMOD Record 11, №2 (February 1981).43. http://www.microsoft.com/com/tech/ActiveX.asp

25. Extensible Markup Language (XML) 1.0 W3C Recommendation 10-February-1998, http://www. w3 .org/TR/1998/REC-xml-19980210

26. XSL Transformations (XSLT) Version 1.0 W3C Recommendation 16 November 1999 http://www.w3.org/TR/xslt

27. Document Type Definition http://www.w3.Org/TR/2000/REC-xml-20001006#dt-doctvpe

28. Р. Сигнор, M. Стегман. Использование ODBC для доступа к базам данных: Пер. с англ. -М.: Издательство Бином; Научная книга, 1995. -384 с.

29. Document Object Model (DOM) Technical Reports http://www.w3.org/DOM/DOMTR

30. Namespaces in XML http://www.w3.org/TR/1999/REC-xml-names-19990114/

31. Simple API for XML http://www.saxproject.org/

32. XML Path Language (XPath) Version 1.0 W3C Recommendation 16 November 1999 http://www.w3 org/TR/xpath52. http://www.docbook.org53. http://www.iig.org/

33. А. С. Шундеев Интеграция информационных ресурсов • и workflow-системы. // Международная научно-методическая конференция «Новые информационные технологии в университетском образовании». Новосибирск, 2001. С. 168-170.

34. А. В. Галатенко. Реализация сервисов безопасности на основе встраиваемых модулей. Информационная безопасность. Инструментальные средства программирования. Микропроцессорные архитектуры. М.: НИИСИ РАН, 2003, с. 91106

35. Э. Е. Долгалев. Расширение возможностей редактирования WEB документов в Интернет и локальных сетях. // VI научная конференция молодых ученых и специалистов. Дубна, 2002.

36. Э. Е. Долгалев. Язык описания форм ProXForms как инструмент в задаче интеграции информационных ресурсов. // Международная научно-методическая конференция «Новые информационные технологии в университетском образовании». Кемерово, 2002.

37. А. Акопянц. «Communiware методология и инструмент создания динамичных интерактивных сайтов». // Конференция «Электронная коммерция '99», Санкт-Петербург, 1999.

38. М. Гринев. Системы управления полустуктурированными данными. // Открытые системы. 1999, № 5.

39. К. Дж. Дейт Введение в системы баз данных, М.:, Издательство Вильяме, 2001. -1072 с.

40. А. А Коршунов Система подготовки и управления информацией в Интернет. // Материалы Всероссийской конференции «Технологии информационного общества Интернет и информационное общество», Санкт-Петербург, 2000.

41. А. А Коршунов. Система управления содержанием корпоративного портала. // Международная научно-методическая конференция «Новые информационные технологии в университетском образовании». Новосибирск, 2001. С. 200-202.

42. Ю. А. Семенов. Протоколы Интернет. М.: Издательство Горячая линия-Телеком, 2001.-1100 с.

43. Д. Хопкрофт, Р. Мотвани, Д. Ульман Введение в теорию автоматов, языков и вычислений, М.:, Издательство Вильяме, 2002 . -528 с.

44. ISO 8879. Information Processing Text and Office Systems. Standard Generalized Markup Language SGML, 1986.69. http ://www. netcraft. com