автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.12, диссертация на тему:Научно-методические основы автоматизации проектирования информационной архитектуры Web-ресурсов Интернет

доктора технических наук
Мальцева, Светлана Валентиновна
город
Москва
год
2004
специальность ВАК РФ
05.13.12
Диссертация по информатике, вычислительной технике и управлению на тему «Научно-методические основы автоматизации проектирования информационной архитектуры Web-ресурсов Интернет»

Автореферат диссертации по теме "Научно-методические основы автоматизации проектирования информационной архитектуры Web-ресурсов Интернет"

На правах рукописи

Мальцева Светлана Валентиновна

НАУЧНО-МЕТОДИЧЕСКИЕ ОСНОВЫ АВТОМАТИЗАЦИИ ПРОЕКТИРОВАНИЯ ИНФОРМАЦИОННОЙ АРХИТЕКТУРЫ WEB-РЕСУРСОВ ИНТЕРНЕТ

Специальность 05.13.12 — Системы автоматизации проектирования

Автореферат

диссертации на соискание ученой степени доктора технических наук

Москва - 2004

Работа выполнена на кафедре «Вычислительная техника» Московского государственного института электроники и математики (технический университет)

Официальные оппоненты:

доктор технических наук, профессор Норенков Игорь Петрович доктор технических наук, профессор Бархоткин Вячеслав Александрович доктор технических наук, профессор Соловьев Александр Николаевич

Ведущая организация: Всероссийский институт научной и технической информации (ВИНИТИ) РАН

Зашрта состоится « 19 » октября 2004 г. в 14.00 часов на заседании диссертационного Совета Д 212.133.03 при Московском государственном институте электроники и математики (техническом университете)

по адресу: Москва, Б. Трехсвятительский пер., д. 1-3/12 стр.8.

С диссертацией можно ознакомиться в библиотеке МГИЭМ Автореферат диссертации разослан 16 сентября 2004 г.

Ученый секретарь

диссертационного Совета Д 212.133.03 кандидат физико-математических наук, доцент

Прокофьев И.В.

Общая характеристика работы

Актуальностьработы

Актуальность исследований в области автоматизации проектирования информационной архитектуры Web-ресурсов Интернет определяется, прежде всего, рядом существующих сегодня тенденций в развитии этого вида программно-информационных продуктов и сети Интернет, а именно:

- стремительным ростом ресурсов Интернет, среди которых Web-ресурсы представляют самый большой сегмент (по данным Руметрики количество уникальных документов в Интернет превышает 1 млрд., в российском сегменте Интернет - более 67 млн. документов);

- резким увеличением количества пользователей Интернет (примерно 560 млн. - в мире, в России - около 9 млн., к 2005 году по прогнозам исследовательской фирмы Computer Economics количество пользователей в мире превысит 830 млн.):

- расширением сферы и интенсивности использования информации Интернет при решении различных задач, в первую очередь, задач прогнозирования, планирования и управления;

- возросшей конкуренцией между ресурсами, особенно крупными, в области предоставления информации и информационного сервиса;

- усилением роли Web-ресурсов в рекламных и маркетинговых стратегиях их владельцев;

- перемещением некоторых бизнес-процессов в виртуальную среду, что связано с развитием Интернет-технологий;

- резким увеличением спроса на Web-проекты и, как следствие, развитием методов и средств автоматизации их проектирования и разработки.

Перечисленные тенденции повышают требования к качеству Web-ресурса, в первую очередь, с точки зрения содержащейся в нем информации: ее -достоверности, актуальности, соответствия информационным потребностям целевой аудитории, понятности, простоте и скорости доступа к ней. Анализ статистических данных, отражающих взаимодействие пользователей с Интернет-ресурсами, показывает, что большая их часть неудовлетворительна с точки зрения этих характеристик Основной причиной этого является малое внимание к вопросам проектирования информационной архитектуры Web-ресурсов, что связано с долго существовавшей традицией проектирования их только как удаленного пользовательского интерфейса.

Термин «информационная архитектура» был введен в обращение Ричардом Вурманом (Wurman) в 1976 году, им же были определены задачи информационного архитектора. Интерес к информационной архитектуре в 90-х годах прошлого столетия был связан, в основном, с интенсивным развитием информационных систем предприятий и организаций и информатизацией бизнесс-процессов. Сегодня имеется обширная литература по этому вопросу, а также широкий спектр программных средств для автоматизации проектирования информационных систем.

з

Концепция информационной архитектуры сайтов начала интенсивно разрабатываться несколько позднее, в конце девяностых годов двадцатого столетия, что совпадает с периодом интенсивного роста объема ресурсов Интернет. Особо значительное место занимают труды Л. Розенфельда (Rosenfield) и П. Морвиля (Morville), а также членов возглавляемой Розенфельдом Argus Associates и Argus Center for Information Architecture.

Значительная часть информации о работах в области информационной архитектуры сосредоточена в Интернет-ресурсах, как зарубежных, так и отечественных. Отечественные работы в этом направлении большей частью представлены в научно-технической периодике.

Наряду с публикациями, затрагивающими вопросы, связанные с информационной архитектурой Web-ресурсов, в отечественных и зарубежных источниках значительное место уделяется вопросам, связанным с ее проектированием и оценкой. Это работы по моделированию и автоматизированному проектированию гипертекстов, как основы сайтов, (работы В. П. Морозова, В.П Тихомирова, Е.Ю. Хрусталева, ФЛудинова, ДжТарретта), изучению восприятия человеком информации Web-ресурсов (работы А. Лебедева, Я. Перевалова, В. Головача, Я. Нильсена (Nielsen), П. Морвиля, Л. Розенфельда, Д. Нормана, У. Вудсона, Д. Коновера, рекомендации фирм Microsoft, Apple и других), оценке эффективности Web-ресурсов, управлению их эксплуатацией и развитием. В Интернет существует значительное количество сайтов и дискуссионных форумов, где обсуждаются вопросы проектирования сайтов, в том числе и вопросы их информационной архитектуры. Проектирование информационной архитектуры сегодня оценивается как центральная задача процесса создания Web-pecypca.

Несмотря на интенсивность работ в области информационной архитектуры Web-pecypc, сегодня многие вопросы в ней остаются нерешенными. Это касается как самого определения концепции информационной архитектуры, которую разные авторы определяют по-разному, так и методов ее проектирования. Высокая степень автоматизации проектирования Web-ресурсов достигается, в основном, на поздних этапах их жизненного цикла, а именно, на этапах реализации и эксплуатации, начальные этапы, связанные с анализом требований и разработкой информационной архитектуры автоматизированы в очень малой степени, в основном, на уровне отдельных задач.

Все это делает актуальной задачу систематизации и интеграции существующих работ в области информационной архитектуры, проектирования * гипертекстов, автоматизации разработки и управления Web-ресурсов, методов оценки сайтов на единой научно-методической основе. Это не только позволит создавать Web-ресурсы с прозрачной для пользователя структурой информации, четко ориентированные на целевую аудиторию и планомерно развивающиеся, но и улучшит за счет них качество информационной среды Интернет в целом и российского сегмента, в частности. За счет этого существенно улучшатся такие важные показатели работы информационно-поисковых систем, как релевантность, точность, полнота. Исследования и

результаты, полученные в данной области, могут быть использованы не только в проектировании Web-рурсев, но-и- в широкояг спектре задач; связанных с использованием информации Интернет в структуре информационного обеспечения различных задач и процессов.

Целью работы является повышение качества и эффективности отечественных электронных информационных ресурсов за счет разработки методов автоматизированного проектирования информационной архитектуры Web-ресурсов Интернет.

Достижение указанной цели предполагает решение следующих задач:

- анализ современного состояния проектирования Web-ресурсов;

-исследование состояния и развитие концепции информационной

архитектуры Web-pecypca;

- систематизация и разработка моделей Web-ресурсов и их компонент;

-исследование влияния характеристик информационной архитектуры на

эксплуатационные показатели Web-pecypca и обоснование критериев качества информационной архитектуры;

-разработка методов структурного анализа предметной области Web-pecypca;

-теоретическое исследование и разработка формализованных методов синтеза информационной архитектуры Web-pecypca;

-разработка алгоритмов и программных средств автоматизированного проектирования информационной архитектуры Web-ресурсов;

-исследование задач эксплуатации и модернизации Web-ресурсов и разработка научно-методических основ управления развитием Web-ресурсов и их модернизации на этапе эксплуатации.

Научная новизна работы состоит в следующем:

1. Развита концепция и разработана формализованная модель информационной архитектуры Web-pecypca и основных ее компонент с позиций проектирования.

2. Разработано формализованное описание предметной области Web-pecypca и информационных требований пользователей.

3. Разработана методика структурного анализа и декомпозиции предметной области Web-pecypca и синтеза на этой основе его информационной архитектуры.

4. Разработан формализованный метод компоновки основной структурной единицы гипертекста - страницы, использующий критерии эргономического проектирования Web-ресурсов, что позволяет учесть взаимное влияние информационной архитектуры и ее визуального отображения средствами информационного дизайна.

5. Предложены методы оценки, обеспечивающие методическое единство оценки информационной архитектуры Web-pecypca на всех этапах его жизненного цикла.

6. Предложена методика развития и модернизации Web-pecypca на основе

разработанных моделей информационной архитектуры и методов автоматизированного поиска информации:

7. Предложена инфологическая модель Web-pecypca, обеспечивающая преемственность результатов проектирования информационной архитектуры на всех этапах его жизненного цикла и ее реализация в составе хранилища данных.

8, Разработан комплекс методик автоматизированного проектирования информационной архитектуры Web-ресурсов Интернет, обеспечивающий использование ЭВМ на ранних этапах разработки.

Практическая ценностьработы заключается в том, что:

-разработаны программные средства, реализующие методику автоматизированного проектирования и модернизации информационной архитектуры Web-ресурсов Интернет;

-на основе проведенных исследований современного состояния проектирования Web-ресурсов Интернет, отобраны показатели, характеризующие качество ресурсов как информационных продуктов, и выработаны практические рекомендации по их использованию в задачах проектирования;

-на основе разработанной инфологаческой модели Web-pecypca создано программное обеспечение хранилища данных для хранения промежуточных и окончательных результатов проектирования информационной архитектуры;

-предложены методика и программные средства для проведения структурного анализа предметной области Web-ресурсов Интернет:

- разработаны программные средства компоновки страниц гипертекста на основе эргономических критериев.

Основным научным результатом диссертации является создание научно-методических основ автоматизированного проектирования Web-ресурсов Интернет на основе структурно-аналитического исследования информационного пространства. Полученный результат имеет важное значение для формирования национальных информационных ресурсов, повышения их качества и востребованности отечественной и зарубежной аудиторией Интернет. Разработанная методика нашла применение в практическом проектировании Интернет-ресурсов, научных исследованиях и учебном процессе.

Обобщение и развитие концепции информационной архитектуры Web-pecypca, как его основной составляющей, реализующей связь между конкретной областью глобального информационного пространства и Информационными интересами потребителей и владельцев ресурса, позволило создать формализованное представление информационной архитектуры Web-pecypca, обеспечивающее ее структурно и методологически однородное информационное представление для разных этапов проектирования.

Разработана методика структурно-логического проектирования информационной архитектуры, основанная на автоматизированных процедурах анализа и декомпозиции предметной области Web-pecypca и синтеза

б

структурных компонент ресурса.

Разработана формализованная модель предметной области 'еЬ-ресурса, использующая его представление в виде семантической сети понятий, что позволило разработать методику и алгоритмы анализа информационного пространства 'еЬ-ресурса и его декомпозиции на множество взаимосвязанных информационных элементов, основанные на методах автоматизированного лингвистического анализа электронных документов, методах автоматической классификации и технологиях интеллектуальной обработки информации.

На основе разработанного формализованного описания информационной архитектуры разработана методика оценки пользовательских характеристик проектируемого ' еЬ-ресурса, позволяющая проводить оценку показателей работы ресурса на ранних стадиях проектирования, что позволяет существенно улучшить качество пользовательского взаимодействия с информацией ресурса.

На основе анализа типовых схем распределения информации по страницам ресурсов и пользовательских характеристик ресурсов формализованы задачи и разработаны алгоритмы формирования информационного содержания страниц гипертекстовой структуры ресурса и информационной компоновки страниц гипертекста.

Разработаны методические принципы развития и модернизации информационной архитектуры ресурса на этапе его эксплуатации,

Основным практическим результатам работы является расширение и систематизация знаний о процессах информационного взаимодействия пользователей с сетью Интернет и объединение на единой методической основе широкого спектра отдельных работ, существующих в области автоматизации проектирования, сопровождения, эксплуатации и оценки 'еЬ-ресурсов.

Разработан комплекс методических, программных и информационных средств для автоматизированного проектирования, сопровождения и модернизации информационной архитектуры 'еЬ-ресурсов Интернет, реализующий методику структурно-логического проектирования и обеспечивающий создание эффективных, легко модернизируемых 'еЬ-ресурсов, что является важным условием их востребованности аудиторией Интернет и конкурентоспособности в глобальном информационном пространстве.

Использование разработанных в диссертации научно-методических принципов и программных средств в составе системы автоматизированного проектирования 'еЬ-ресурсов Интернет позволило сократить сроки их проектирования, а также улучшить пользовательские характеристики спроектированных ресурсов, повысить вероятность обнаружения ресурса поисковыми системами и улучшить значения формальной релевантности, присваиваемой ими ресурсам, что выражается в занимаемой ресурсом позиции в списке выдачи.

Результаты диссертационной работы внедрены и продолжают внедряться

в компании «E-soft» в рамках системы автоматизированного проектирования Web-ресурсов, а также при выполнении отдельных частных проектов. В настоящее время разработанная методика проектирования информационной архитектуры использована при проектировании и используется при сопровождении ряда проектов.

Частные результаты, полученные в диссертационной работе, использованы при выполнении НИР по договорам с Минпромнаукой для реализации задач проектирования Web-интерфейсов, анализа предметной области проектов, исследования и тематически ориентированного отбора Интернет-ресурсов.

В учебном процессе результаты работы реализованы в рамках программы переподготовки специалистов с высшим образованием по дистанционной форме обучения по программе «Дизайн и реклама в компьютерных сетях» в Центре дистанционного обучения МГИЭМ (http://dlc.miem.edu.ru). Также результаты, полученные в диссертации, используются при подготовке специалистов по вычислительной технике и Интернет-технологиям в МГИЭМ в виде конспекта лекций по курсу «Информационное системы». По результатам работы подготовлено учебное пособие для студентов специальностей «Прикладная информатика» и «Информационные системы» Института информационных технологий МГУ С,

Метой» исследования

Многоаспектность задач, связанных с проектированием и эксплуатацией Web-ресурсов, определила использование при выполнении работы нескольких методов и подходов. Проведение системного анализа Web-ресурсов, как класса сложных систем, проведено с привлечением теории иерархических многоуровневых систем. Методы лингвистического анализа и интеллектуального анализа текстов и документов использованы для решения задач, связанных с анализом и декомпозицией предметной области ресурсов Интернет. Значительная часть задач формализована и решена с использованием методов кластерного анализа. Методология структурно-логического проектирования использована как основа для разработки методики проектирования информационной архитектуры Web-ресурсов Интернет. Для формализации и решения задач компоновки страниц Web-ресурсов использованы методы теории графов.

Достоверность полученных результатов и выводов подтверждена экспериментальными исследованиями выполненных проектов Web pecype и отдельных разработанных алгоритмов, а также сравнением подученных результатов с данными проектов, разработанных по другим методикам.

Апробация работы Научные и практические результаты работы докладывались и обсуждались на международных, всероссийских, межвузовских конференциях: Международной научно-технической конференции «Датчики и преобразователи информации систем измерения, контроля и управления»,

(Крым, 1991 г.); Международной научно-технической конференции "Датчики и преобразователи информации систем измерения, контроля и управления", (Крым, 1992 г,); V международной конференции «Применение новых технологий в образовании» (Троицк, 1994 г.); Fist International Conference On Distance Education in Russia "Distance Learning and New Technologies In Education" (Москва, 1994 г.); Второй международной конференции «Индустрия сервиса в XXI веке», секция «Информационные технологии» (Москва, 2000 г.); Третьей межвузовской научно-практической конференции «Информационные технологии XXI века» (Москва, 2002 г.); VII-й Международной научно-практической конференции «Наука - индустрии сервиса», секция «Информационные технологии» (Москва, 2002 г.); Третьей Международной конференции «Индустрия сервиса в XXI веке», секция «Информационные технологии» (Москва, 2002 г.); XIII Международной конференции «Применение новых технологий в образованию) (Троицк, 2002 г.); Ш Международной научно-технической конференции «Информационные технологии и системы в образовании, науке, бизнесе» (Пенза, 2002 г.); П Всероссийской научно-технической конференции «Проблемы информатики в образовании, управлении, экономике и технике» (Пенза, 2002 г.); IV Международной научно-технической конференции «Электроника и информатика — 2002», (Зеленоград, 2002 г.); X Международной научно-технической конференции «Математические методы и информационные технологии в экономике, социологии и образовании» (Пенза, 2002 г.); Международном Форуме по проблемам науки, техники и образования (Москва,

2002 г.); IV-ой Межвузовской ежегодной научно-практической конференции «Информационные технологии XXI века» (Москва, 2003г.); VIII международной научно-практической конференции "Наука - индустрии сервиса", секция "Информационные технологии в сфере сервиса", (Москва,

2003 г.); XV научно-технической конференции «Датчики и преобразователи информации систем измерения, контроля и управления» (Крым, 2003 г.).

Публикациярезультатовработы

По результатам диссертации опубликовано 28 печатных работ, среди которых одна монография, одна брошюра, одно учебное пособие, один отчет по НИР, в котором автор являлся ответственным исполнителем. Результаты, полученные в диссертационной работе, отражены также в действующей программе дистанционного обучения, в которой непосредственно автором или при его участии разработано 9 электронных учебных курсов.

Назащиту выносятся:

Формализованная модель предметной области Web-pecypca Интернет, методика и алгоритмы ее построения и развития.

Формализованное представление информационной архитектуры Web-pecypca Интернет, методы и алгоритмы ее построения и использования по этапам жизненного цикла Web-pecypca.

Методы и алгоритмы автоматизированного проектирования информационной архитектуры Web-ресурсов Интернет.

Методика оценки характеристик проектов Web-ресурсов на основе формализованного представления информационной архитектуры.

Принципы и методы информационного сопровождения и модернизации Web-ресурсов Интернет на основе формализованных и информационных моделей.

Структура и объем работы

Диссертация состоит и введения, шести глав, заключения, изложенных на 365 листах машинописного текста, списка литературы из 154 наименований печатных работ и 59 Интернет-источников, приложения и содержит 34 рисунка, 15 таблиц. Общий объем работы составляет 488 страниц.

Основное содержание работы

Во введении обоснованы актуальность темы, цель и задачи исследования, в краткой форме дана общая характеристика работы, показана научная новизна и практическая значимость полученных результатов, содержится перечень задач, решаемых в диссертации, сформулированы основные положения, выносимые на защиту.

Первая глава «Концепция информационной архитектуры Web-pecypca и проблемы автоматизации ее проектирования» посвящена рассмотрению общей концепции информационной архитектуры Web-ресурсов Интернет, методов ее проектирования и ее влияния на эксплуатационные характеристики ресурсов.

Рассматриваются особенности Web-ресурсов Интернет как объектов проектирования, анализируются модели их жизненного цикла. Показано, что Web-ресурсы характеризуются коротким циклом разработки, высокой частотой изменения их информационного содержания и структуры, одновременным существованием работающей и разрабатываемой версии, что соответсвует спиральной модели жизненного цикла и делает необходимым использование методов автоматизации их разработки и модернизации.

Проводится анализ существующих представлений об архитектуре информации и ее компонентах, а также схем реализации этих представлений в общем процессе проектирования Web-ресурсов Интернет. На основе этого анализа формируется общая концепция информационной архитектуры Web-pecypca, которая используется для выработки требований к процессу его проектирования и реализации.

Основным процессом, который должен поддерживать Web-pecypc, является процесс потребления информации пользователями целевой аудитории. Подробное рассмотрение этого процесса позволяет отметить, что общая структура жизненного цикла продукта, включающая этапы разработки и выхода на рынок, развития и продажи, зрелости и ухода с рынка, справедлива не для конкретной информационной продукции, а для информационной

тематики, распространенность которой на рынке информации определяется тенденциями развития науки, производства и общества. Рассматривая тенденции развития информационной тематики, выделены макро- и микротематика. Макротематика связана с основными сферами человеческой деятельности, появление или исчезновение такой сферы деятельности происходит крайне редко, поэтому информационные ресурсы, посвященные макротематике, мало подвержены изменениям рынка. Микротематика связана с конкретными продуктами, явлениями, личностями, достижениями в какой-либо из макросфер. Уход микротематики приводит к существенному снижению потребления информации, связанной с ней, однако, она не исчезает и может быть востребована в рамках временных моделей информации.

Рассмотрение этих особенностей информации применительно к Web-ресурсам Интернет позволило выделить четыре условия стабильности информационного ресурса в Сети:

- рациональное сочетание макро- и микротематики информации;

- правильная оценка времени жизненного цикла, формы представления ресурса, создание новых форм;

- правильная оценка времени жизненного цикла конкретной микротематики с целью изменения формы ее представления или удаления из состава ресурса;

- разработка и включение в состав информационного ресурса новой микротематики.

Так как Web-pecypc является частью общей маркетинговой и рекламной системы предприятия или организации, являющейся его владельцем, то основной особенностью проектирования информационной архитектуры Web-ресурсов, как программно-информационных продуктов, является необходимость рассмотрения и моделирования не только внутренних процессов организации-владельца ресурса, но и внешних по отношению к ним информационных процессов, характерных для целевых сегментов пользовательской аудитории.

На общую методологию проектирования Web-ресурсов Интернет оказывают влияние их функциональные и эксплуатационные особенности, что определяет возможные подходы к реализации этой методологии:

• так как Web-ресурсы представляют собой элементы или составные части глобальной гипертекстовой информационной системы World Wide Web, то процесс их проектирования во многом аналогичен процессу проектирования информационных систем с централизованной или распределенной базой данных;

• использование их как средства информационного сервиса для определенной целевой аудитории пользователей, делает необходимым использовать при проектировании методы, применяемые для информатизации бизнес-процессов;

• рассмотрение процессов создания и функционирования Web-pecypca как части реализации общей бизнес-стратегии предприятия или организации,

определяет необходимость при его разработке учитывать рекомендации и методы, применяемые при разработке маркетинговых стратегий.

Представление об информационной архитектуре Web-ресурсов дает рассмотрение их как класса иерархических многоуровневых систем, состоящих из технической, программной, информационной, семиотической, административной и лингвистической подсистем, совместное

функционирование которых проявляется в виде процессов создания и потребления информации, причем эти системы отличаются от традиционных информационных систем высокой интенсивностью изменения формы и содержания визуального отображения хранящейся в них информации. Одновременно Web-pecypc сам представляет собой элемент сложной системы, которой является Интернет. Рассмотрены три основные аспекта описания Web-pecypca: построение иерархии абстрактных моделей, определение уровней иерархии сложности принятия решений, и формирование организационной иерархии.

С точки зрения различных уровней абстрагирования при декомпозиции Web-pecypca можно выделить системный, программный, организационный и информационный уровни. Модель Интернет-ресурса на определенном уровне является одновременно и описанием некоторой ее подсистемы, вычленяемой из исходной системы в соответствии с абстрактной декомпозицией. Анализ организационной иерархии существующих Интернет-ресурсов позволил определить трехуровневую модель, элементами которой являются информационные элементы, комплексы информационных элементов и проекты, Описание иерархии слоев сложности принятия решений связывается с рассмотрение программной подсистемы, к формированию которой возможно использовать два подхода; позадачный и операционный. Основой выделения отдельных слоев являются обобщенные информационные операции -некоторые совокупности действий, отличающиеся друг от друга сложностью их «выполнения» элементами программной подсистемы.

Показано, что информационная архитектура отражает, в первую очередь, информационный уровень в системной декомпозиции Web-pecypca, однако, она затрагивает и другие уровни, так как часто смысл информации определяет форму и программные средства ее представления. Уровни организационной иерархии и их взаимосвязь на информационном уровне соответствуют большинству существующих представлений об информационной архитектуре Web-ресурсов и ее неформальных определений.

Рассмотрены методы оценки и критерии качества информационной архитектуры, ее влияние на показатели функционирования Web-pecypca Показано, что отсутствуют методы, позволяющие оценивать влияние информационной архитектуры на эти показатели на ранних стадиях разработки.

В заключение проведен анализ существующих средств автоматизации разработки Web-ресурсов. Он показал, что они практически не затрагивают начальных этапов разработки, на которых формируется информационная архитектура. Это определило преобладание методологий типизации и

копирования, не позволяющих создавать оригинальные проекты, что снижает показатели эффективности использования ресурса. Отсутствуют формальное описание задач проектирования информационной архитектуры и методов ее оценки.

Во второй главе «Разработка формализованного описания информационной архитектуры Web-ресурсов Интернет и задан ее проектирования» рассматриваются принципы построения моделей Web-ресурсов Интернет и их компонент, формализованного представления предметной области Web-ресурсов и информационных требований пользователей, формализуется задача проектирования информационной архитектуры, определяются критерии ее оценки.

Предметная область Web-pecypca определяется как совокупность информации об объектах (процессах, явлениях) и их характеристиках, которая соответствует информационным потребностям или интересам определенной группы пользователей Интернет, составляет информационное содержание ресурса, представляется в виде специальных структур данных и используется пользователями для решения различных функциональных задач.

Выделены три группы пользователей Web-pecypca: посетители сайта, владельцы ресурса, администраторы ресурса, управляющие его функционированием и развитием. Множество посетителей сайта разделено на группы с различными информационными интересами.

Модель предметной области представлена в виде шестерки:

где Р = ¡1 =1,1} - множество функций \Veb-pecypca в информационных процессах пользователей;

Ъ ={ц | j=l,J} - множество задач обработки информации внешних источников в информационных процессах посетителей или администраторов сайта и задач представления информации его владельцев;

Рц={Рвк,| к' = 1,К'} - множество пользователей - владельцев ресурса;

Р» = {РаИ к"=1,К"} - множество пользователей-администраторов ресурса;

Рпр{р]к"' | к'"-1,К"} - множество пользователей-посетителей сайта по му сегменту целевой аудитории^ =

я

Р„=и Рщ - полное множество пользователей-посетителей сайта;

м

Р= {ри | к = 1, К } - полное множество пользователей \Veb-pecypca,

р= р,ир.ир„; _

О ={Ош|т = 1,М} - множество объектов, процессов, явлений, информация о которых предоставляется ШеЬ-ресурсом;

V = Vй у У'1",- множество данных предметной области;

| jeLю¡} - множество данных, необходимых для обеспечения информационных потребностей посетителей и администраторов ресурса, а также информационных целей владельцев ресурса; \?юк={у") | ]еЬ>ых} -множество данных, являющихся результатом взаимодействия пользователей с ресурсом; _

И. = {гу | у = - множество отношений между компонентами

{Б.гдо.у}.

Выделяются следующие виды отношений; Г1(Р,2), ^(Р.О), Гз(Р,Р), г&У) , г< (г,О), г7 (Н,У), г8(0,У).

Формализовано модель предметной области описывается с помощью множеств {РДР.О.УД } и булевых матриц смежности: ЕР=|фц;|,

т(о-т\, гр=\щк\, ЪО=\щт\, OV-Jov.il, которые

описывают соответствующие отношения К между компонентами предметной области. Элементы данных матриц равны I, если между соответствующими компонентами имеется взаимосвязь, и равны 0, в противном случае.

Показано, что в связи со сложностью точного определения множества Р определение множеств возможно только для корпоративных ресурсов, играющих роль удаленного интерфейса корпоративной информационной системы. Для открытых ресурсов целесообразно использовать сокращенный вариант модели предметной области

М'*=<Р,0,УД>,

где множество отношений Я включает следующие виды отношений: г'(0,У), г2(Р,0), г3(Р,У),г4(0,0).

Отношения г^Н), г2(Р,0), г3(Р,Р), г4(Р,У), г5(Н,Р), которые не могут быть учтены в этой модели, могут быть представлены отношениями г4(0,0) -отношение "объект-объект". Каждый кортеж этого отношения характеризует существующие связи между объектами, которые могут был. выявлены при анализе указанных неучтенных отношений.

Формализовано модель предметной области описывается с помощью множеств {Р,0,УД} и рулевых матриц смежности:

ОУ=|оЫ РО=|роа РУ=|рЫ ОСИ|оотш|

Рассмотрены методы определения конкретных значений компонент модели предметной области.

Модель предметной области представляет собой внутреннюю модель информационной архитектуры \Veb-pecypca, которая используется в задачах управления его информационным содержанием. Внешняя модель, которая является представлением организационной иерархии Web-pecypca на информационном уровне, создается на основе моделей информационных требований пользователей, которые отражают информационные потребности планируемой аудитории ресурса.

Модель спецификаций информационных требований представлена в виде: М1! =<аЯ]3>, где к - индекс пользователя, а и Р - структурные элементы

предметной области, Е> = {¿1 | 1 — 1,Ь}- полное множество структурных элементов. Я - отношение между элементами. Структурными элементами моделей являются элементы множеств О = {о т] ш = 1,М}, еЦ},

Множество отношений между объектами г (0,0) позволяет выделить пары структурных элементов <0 В^ 0>, где Яоб - отношения между объектами, информация о которых используется к-ой группой пользователей. Отношения г'(0,У) и г3(Р,У) позволяют выделить пары, объединенные отношением принадлежности информационных элементов объектам, Я«,,,, <0 Иои У>. На основании этого бинарные модели спецификаций Мг=<аКр> представляются в виде списка парных отношений между структурными элементами ^ е Б:

8к ={((1,114)},где бБ

Спецификации информационных требований пользователей определяются на основе множеств структурных элементов, которые присутствуют как в полной, так и в сокращенной модели предметной области, т.е. описание информационных требований пользователя инвариантно к используемой модели предметной области.

Внешняя модель информационной архитектуры представляется четверкой:

М3 = <БВ,0,1,Я>,

где Бв = {с!]! 11в= 1,1? } - множество информационных элементов;

0={<^ | } - множество комплексов информационных элементов, соответствующих страницам сайта; I - множество, состоящее из одного элемента, обозначающего начальный комплекс информационных элементов, 1еО; ___

К={гк | к=1,К } - множество отношений между компонентами {Г)8,0}.

Выделяются следующие виды отношений: гп(1)в,1)в), гв^Е^.С), ^(<2,0).

Формализовано внешняя модель описывается с помощью множеств {В®,СУД} и булевых матриц смежности: Б®!)® Н^пА Е>®0=[авящ1,00=^1,

Множество Я разделяется на два подмножества: Ян - подмножество отношений, реализуемых системой навигации (гиперссылками) , и Я14 подмножество отношений соседства.

Информационный элемент представляет собой один или несколько структурных элементов из множества Б = {<1 111 = 1,Ь }, связанных с одним и тем же объектом о; из множества О.

Отношения между комплексами информационных элементов являются производными от отношений между информационными элементами: они возникают, если определены отношения хотя бы для одной пары информационных элементов, принадлежащих к этим комплексам.

Обобщенная внешняя модель формируется в процессе последовательного объединения внешних моделей предметных областей пользователей в единую интегрированную модель.

Задача проектирования внешней информационной архитектуры представляется как задача определения отображения модели предметной области на внешнюю модель: при котором достигается

максимум интегральной оценки информативности информационной архитектуры; количество информационных элементов в одном комплексе не превышает некоторой заданной величины; структура связей между информационными элементами в составе одного комплекса не распадается на компоненты связности.

Интегральная оценка информативности информационной архитектуры

8°= строится на основе вектора весов информационных элементов §

»в Ч

= {&}Д = 1,ЬВ , который получается как объединение векторов весов для множества пользователей Р, и минимальных длин путей от начального комплекса до комплекса, содержащего информационный элемент в графе О,-

описывающем связи между комплексами информационных элементов. Требование ее максимизации при разработке информационной архитектуры соответствует требованию расположения наиболее важных с точки зрения пользователей информационных элементов на начальных страницах ресурса.

Показано, что на основе внешней модели возможно определение характеристик пользовательского взаимодействия с ресурсом на начальных стадиях проектирования, аналогичные оценкам, полученным с использованием макетирования.

На основе общей задачи проектирования информационной архитектуры определены составляющие ее частные задачи.

Третья глава «Построение модели предметной области Webpecypca на основе автоматизированныхпроцедурлингвистического анализа электронных документов» посвящена разработке модели предметной области проектируемого Web-pecypca на основе анализа электронных документов и Интернет-ресурсов, представляющих его содержание и назначение. Такими документами являются различные электронные тексты, Web-ресурсы, а также модели информационных процессов пользователей предполагаемой целевой аудитории и информационных процессов владельцев ресурса, связанных с продвижением продукции, услуг или идей.

Доказано, что центральной задачей определения предметной области для Web-ресурсов является определение множества объектов О и отношений на этом множестве. Задача выделения множества объектов интерпретируется как задача выделения обозначающих их терминов на множестве документов, отобранных для описания предметной области. Для решения этой задачи в работе используются методы автоматизированного лингвистического анализа

документов. Наряду с выделением множества объектов выделяется и множество связанной с ними входной и выходной информации V.

Проведен анализ методов и средств автоматизированного лингвистического анализа документов, лингвистических моделей документов, методов выделения терминов и установления связей между ними и показана возможность их использования для формирования формального описания предметной области Web-ресурсов. Рассмотрены особенности применения этих методов к документам, используемым в составе набора документов, характеризующих информационное пространство. Такими особенностями являются следующие:

- набор документов содержит только релевантные документы (отобранные экспертами);

- при отборе терминов могут использоваться разные критерии, в зависимости от функциональной концепции ресурса;

- отбор терминов чаще всего связан с задачей индексирования не отдельного документа, а всего набора документов.

Проведен анализ методов и средств автоматизированного лингвистического анализа документов, лингвистических моделей документов, методов выделения терминов и установления связей между ними и показана возможность их использования для формирования формального описания предметной

методов к документам, используемым в составе набора документов, характеризующих информационное пространство.

Предложены методы отбора терминов из множества терминоподобных слов, методы формирования многословных терминов на основе итерационной процедуры, использующей шаблоны терминоподобных словосочетаний с последующей проверкой их информационной ценности. Предложены методы оценки информативности терминов для описания семантики информационного назначения ресурса на основе определения их частотных и вероятностных характеристик.

Проведен анализ возможности установления связей между терминами в автоматическом режиме и формирования на этой основе отношений, соответствующих отношениям г4(0,0). Сформулированы правила, позволяющие идентифицировать связь между терминами на основе анализа места их нахождения в структуре документа. Приведены вероятностные оценки существования связей между терминами на основе частотных характеристик терминов.

На основе разработанных методов, правил и оценок предложена методика автоматизированного формирования терминологической семантической модели набора документов и формирования на ее основе множеств О и V модели предметной области Web-pecypca.

Методика основана на стратегии направленного формирования и постепенного сужения количества терминоподобных слов и комбинаций слов и включает следующие этапы.

1. Отбор ресурсов для представления предметной области проектируеемого ресурса.

Этот этап объединяет несколько направлений деятельности, связанной со сбором информации о тематике ресурса и включает решение следующих задач:

• Отбор экспертов, которые будут осуществлять формирование документально-информационной базы ресурса

• Создание функциональных моделей бизнес-процессов владельцев ресурса.

• Определение на основе этих моделей состава терминов для формирования запросов к поисковым системам для отбора ресурсов-аналогов.

• Анализ целевой аудитории ресурсов-аналогов и формирование на этой основе целевой аудитории проектируемого ресурса, Разделение целевой аудитории на группы.

• Создание функциональных моделей процессов пользователей по выделенным группам целевой аудитории.

• Определение на основе построенных моделей терминов для формирования запросов к поисковым системам для отбора новых ресурсов, сопутствующих или аналогичных проектируемому.

2. Лингвистический анализ ресурсов, выделение терминоподобных слов, оценка характеристик их информативности и важности для описания информационного пространства проектируемого ресурса.

Этот этап включает большую часть операций, которые могут быть выполнены с использованием ЭВМ, однако, в нем также целесообразно включать и коррекцию результатов, как промежуточных, так и окончательных, экспертом.

По всем документам набора выполняются следующие этапы:

• Определение типа документа и выполнение соответствующей этому типу очистки от служебных символов, символов разметки с выделением особых зон документа: заголовков, подрисуночных подписей, выделений шрифтом.

• Морфологический анализ документа с выполнением следующих дополнительных операций:

- исключение слов из стоп-листа;

- определение основы слова и словарной формы;

- определение частоты использования словарной формы в документе;

- выделение возможных наборов синонимов.

Затем для набора документов выполняется определение состава однословных терминов по набору документов с выделением синонимов на основе Для этого строится векторная модель набора документов, определяются дискриминирующие и весовые характеристики терминов, по ним в автоматизированном режиме отбираются информативные термины.

3. Формирование и отбор многословных терминов. Этот процесс представляет собой ряд итераций, на каждой из которых порядок термина увеличивается на 1. Используется методика формирования многословных

терминов на основе типовых грамматических конструкций с последующим определени весовых характеристик этих терминов в наборе документов. На основании вычисленных весов выделяются информативные термины.

4. Для окончательно сформированного в автоматизированном режиме множества однословных и многословных терминов проводится просмотр их состава экспертами с удалением или добавлением терминов.

5. Формирование связей между терминами. Исследование связей между терминами основывается на анализе их частотных характеристик, анализе совпадений составляющих их слов, анализе совместного использования терминов в особых структурных зонах документа

Сформированная семантическая модель является объединением следующих основных компонент:

- документов, являющихся информационной базой создаваемого ресурса, куда входят и виртуальные документы, представляющие собой списки терминов, добавленные экспертами;

- терминов, их морфологических и весовых характеристик, определяющих множество объектов предметной области создаваемого ресурса;

- связей между терминами, определяющих отношения между объектами модели предметной области.

Рассмотрены вопросы формирования множества V на основе семантической модели. Эта задача ставится как задача отбора информации, раскрывающей смысл терминов семантической модели, из набора документов семантической модели. Анализируются возможности использования для этого технологий добычи данных в текстах и гипертекстах.

В четвертой главе «Автоматизация формирования внешней модели ресурса на основе семантической модели» рассматриваются вопросы автоматизированного формирования внешней модели ресурса на основе модели предметной области и моделей информационных требований пользователей.

Предложена методика формирования множества информационных

Б 8

на основе использования терминов семантической модели и выделенных документальных описаний этих терминов.

Методика основана на формировании информационного элемента как совокупности терминов семантической модели и связанных с ними документальных описаний. Показано, что информационный элемент, как правило, объединяет в себе документальное описание не отдельного термина, а группы тесно связанных терминов. Информационные элементы как объекты синтеза на множестве терминов семантической модели обладают рядом особенностей: количество терминов в одном информационном элементе ограничивается небольшой величиной; термины, объединенные в один информационный элемент, должны быть тесно связаны; допускается возможность пересечения информационных элементов по входящим в них терминам (некоторая избыточность информации); состав информационных элементов должен охватывать все термины семантической модели, при этом сами информационные элементы должны достаточно четко различаться.

В зависимости от особенностей структуры связей между терминами семантической модели предложено два подхода к формированию групп терминов, представляющих информационные элементы, и соответствующих им текстовых фрагментов документальных источников1

• Кластеризация терминов семантической модели в соответствии с объединяющими их связями с последующим использованием терминов каждого информационного элемента как категорий для целевого аннотирования документов семантической модели ресурса с целью сбора информации, связанной с терминами информационного элемента.

• Формирование информационных элементов на основе классификации выделенных на множестве терминов семантической модели фрагментов документов

Первый подход используется в случае, когда граф, представляющий термины и связи между ними, достаточно четко разделяется на компоненты связности. Преимуществом этого подхода является возможность использовать группу терминов как сложный запрос для последующего расширения описания информационного элемента. Для решения задачи кластеризации терминов разработан эвристический алгоритм, представляющий собой модификацию алгоритма к средних. Для каждой из сформированных групп терминов затем проводится целевое аннотирование документов семантической модели с целью извлечения контекста, содержащего описание информационного элемента, включающего термины группы.

Второй подход применим в тесно связанной структуре терминов, когда трудно выделить компоненты связности. При его реализации производится разделение выделенных фрагментов документов на группы по составу и весовым характеристикам содержащихся в них терминов семантической модели. Разработан метод ускоренного аннотирования, а также эвристический алгоритм для решения задачи кластеризации множества выделенных структурных единиц.

Рассмотрены вопросы разделения множества информационных элементов на подмножества, соответствующие отдельным страницам сайта. Проведен анализ вариантов формирования страниц в соответствии с особенностями структуры связей между информационными элементами.

Сформулирована задача декомпозиции множества информационных элементов на группы страниц сайта. В качестве критерия используется максимум интегральной оценки информативности. Ограничения определяются необходимостью учета особенностей процесса потребления информации Интернет-ресурсов пользователями: ограничение количества информационных элементов на странице и размещение на странице семантически и/или перцептивно связанных информационных элементов:

Для решения задачи разработан эвристический алгоритм, основанный на использовании типовых схем формирования страниц и ограниченном переборе вариантов группирования информационных элементов.

Общая методика формирования внешней модели Web-pecypca складывается из следующих этапов'

1. Оценка структуры связей между терминами. Этот этап включает выделение компонент связности в графе связей между основными терминами G(To,To): Gi,...,Gk- При этом вначале определяется множество одиночных терминов Т01 и их количество, Noi, а затем без их учета определяются компоненты связности Gi.....Gk и среднее количество терминов в компоненте

СВЯЗНОСТИ, Nocp.

Если количество одиночных терминов Noi не равно 0, то для формирования информационных элементов на их основе используется формирование информационных элементов на основе классификации выделенных на множестве терминов семантической модели фрагментов документов (пункт 3).

Для каждой компоненты связности определяется подмножество основных терминов, входящих в нее, Тоь и подмножество множества документов, включающих эти термины, Dt

Для каждой из выделенных компонент связности Gk проводится дополнительное исследование структуры связей между терминами: определяется среднее количество входящих связей, и среднее количество исходящих связей,

Если в k-ой компоненте связности количество входящих пЛ связей приближается к 1, что делает такую структуру близкой к иерархической, в которой достаточно просто выделяются группы терминов, то для формирования на ее основе информационных элементов используется предварительная кластеризация терминов (пункт 2). Если среднее количество исходящих и входящих связей более 2, то структура связей между терминами является сложной, в ней трудно выделить группы и для нее целесообразно использовать выделенные фрагменты документов (пункт 3).

2. Выполняется разделение подмножества терминов на группы, для каждой из которых затем определяется соответствующий информационному элементу набор фрагментов из множества выделенных фрагментов для документов из подмножества Затем выполняется пункт 4.

3. Определяется подмножество множества выделенных фрагментов А для набора документов k-ой компоненты связности. Затем проводится разделение At на группы, соответствующие информационным элементам, в пространстве терминов Затем производится переход к пункту 4.

4. Множество сформированных информационных элементов дополняется обязательными (общепринятыми) информационными элементами.

5. Определяются веса информационных элементов, при этом всем обязательным информационным элементам присваивается вес, равный 1.

6. Формируется структура связей между информационными элементами Устанавливаются связи с обязательными информационными элементами.

7. Выделяются преобладающие виды связей между информационными элементами. Это предполагает определение количества связей между терминами по разным видам связей, которые затем используются для разделения информационных элементов на группы, соответствующие комплексам страниц.

8. Проводится разделение множества информационных элементов на группы, соответствующие комплексам страниц.

9. Определяются связи между страницами. Вычисляются оценки информативности полученной информационной архитектуры, а также коэффициент дублирования информации.

Существующие межстраничные связи между отдельными парами информационных элементов могут быть реализованы полностью или частично в системе ссылок, которые не только обеспечивают переход со страницы на страницу, но и непосредственно указывают на определенный информационный элемент. Существующие внутристраничные связи могут быть реализованы как внутристраничными ссылками, так и отношениями соседства. Реализация отношениями соседства особенно важна для семантических и перцептивных связей, так как в этом случае облегчается восприятие информации и ее усвоение. Для реализации связей отношениями соседства необходимо хотя бы примерно оценить размеры информационных элементов, что требует конкретизации формы их представления, т.е. определение характеристики, описывающих формы представления информационных элементов для пользователя. На этом этапе необходимо проведение работ по информационному дизайну.

В пятой главе «Принципы и методы размещения информации на страницах Web-pecypca» рассмотрены принципы и методы размещения информации на страницах Web-pecypca Задача размещения информации на страницах Web-ресурсов в контексте проектирования информационной архитектуры не предполагает создания окончательного проекта страницы с учетом его художественного оформления, включая композиционные и цветовые решения. Она состоит в определении последовательности представления информационных элементов на странице ресурса, их расположения относительно верхней части страницы и друг друга в соответствии с задачами представления информации.

Рассмотрены различные подходы, используемые к размещению информации на экране дисплея при создании программного обеспечения интерфейсов. Показано, что при создании Web-интерфейсов наиболее важно обеспечить два аспекта: удобство пользователей определенной целевой аудитории, и активизацию интереса, желания работать с Web-ресурсом, воспринимать его информацию, так как посещение пользователем ресурса является добровольным, а не обязательным.

Рассмотрены различные способы визуального представления и размещения информации в поле экрана. На основании их анализа выработаны рекомендации по созданию визуального отображения ресурса с точки зрения его информативности.

Проведена классификация информационных элементов архитектуры сайта по функциональному назначению, информативности и способу обработки электронной информации. Рассмотрено влияние на компоновку страниц сайта технических ограничений, таких как средняя скорость линий связи, наиболее

часто используемые браузеры и программное обеспечение, графические возможности мониторов. Показано, что конкретная реализация компоновки и художественного оформления требует учета соотношения объема информации к возможному времени ожидания загрузки страницы.

Рассмотрено соотношение информационного и художественного проектирования в общей структуре проектирования Web-ресурсов. Показано, что задачи информационного и художественного проектирования разделяются, прежде всего, из-за невозможности формализовать принципы художественного оформления, хотя на этапе проектирования информации в большинстве случаев продумывается форма представления отдельных информационных элементов. Показано, что в этом случае задача информационного проектирования сводится к наиболее рациональному варианту реализации существующих между информационными элементами семантических и перцептивных связей в виде отношений соседства на странице гипертекста при условии максимального заполнения информацией пространства страницы. Последнее направлено на минимизацию длины страницы, в том числе и ее нижней скрытой части, требующей использования полосы прокрутки.

Задача создания информационной компоновки страницы формализуется следующим образом. Обозначим: V ={vj | i = 1,п}- множество информационных элементов страницы; pj - прямоугольный блок, содержащий отдельный информационный элемент V; ; х;,у; - координаты его левой верхней вершины при размещении на экране, ai, Ь, - длины сторон. Тогда условие взаимного не пересечения п блоков и расположения их внутри полосы ширины L записывается в виде системы п(п-1)/2 неравенств:

-щ < i^-Xi<a, - bj < yj - у i < bä Xi + Zi <L, X; >0, У; >0, Xj + aj <L, Xj >0, yj >0,

Целевая функция, подлежащая минимизации по всем допустимым размещениям блоков ИЭ при указанных ограничениях:

П = maxi (у; + b,)

т.е. минимизируется длина страницы, заполненной информационными элементами.

Для решения задачи разработан эвристический алгоритм, основанный на использовании группы автоморфизмов графа, описывающего возможные связи между информационными элементами, и методе сужающихся окрестностей.

Рассмотрены методы оценки визуального варианта размещения информации на странице гипертекста Предложена методика оценки, использующая оценки эмоционального значения выводимой информации на базе "психосемантических шкал, применяемых для оценки интерфейсов

автоматизированных обучающих систем, которые, как показано в работе, с точки зрения задач обеспечения восприятия информации близки к 'М'еЬ-интерфейсам. Применяемые для этих систем оценки адаптированы к оценке страниц гипертекста, для которых характерно превышение области экрана, а также существование страниц, занимающих не всю область, а только ее часть.

В шестой главе «Автоматизация модернизации информационной архитектуры Web-ресурсов» анализируются принципы и методы интеграции задач проектирования и модернизации информационной архитектуры ^'еЬ-ресурсов на этапе эксплуатации. Рассмотрены особенности сопровождения ^ЪЬ-ресурсов, задачи их модернизации и реинжиниринга, типовые функции программных средств управления информационным содержанием ^ЪЬ-ресурсов.

Рассмотрены принципы информационного обеспечения принятия решений по модернизации информационной архитектуры ^еЬ--ресурса на основе разработанной семантической модели предметной области ^^еЬ-ресурса.

Отбор новых ресурсов для расширения предметной области ресурса производится на основе поиска новых документов, релевантных документам, включенным в семантическую модель. Стратегия отбора новых документов основывается на кластерной гипотезе о том, что схожие документы релевантны одним и тем же запросам. Реализация стратегии предполагает предварительную кластеризацию документов проекта на группы семантически близких документов и последующее формирование запросов для поиска новых документов из терминов, наиболее характерных для каждой группы. Новые документы, которые включаются в состав документов модели, присоединяются к одной из групп и изменяют весовые характеристики терминов модели или пространство терминов в целом. При этом возможно добавление или исключение отдельных терминов, а также изменение состава групп документов или появление новых групп. На основании этого изменяются множества О и V (объектов и данных об объектах) модели предметной области. Разработаны процедуры кластеризации и алгоритм формирования запросов для поиска и отбора новых ресурсов на основе семантической модели ресурса.

Приведено описание системы автоматизированного проектирования, сопровождения и модернизации ^^еЬ-ресурсов, разработанной в рамках диссертационной работы, схема функционирования которой приведена на рисунке 1.

Система включает подсистемы проектирования информационной архитектуры, анализа текстов и документов, моделирования информационных процессов, поиска и отбора новых информационных ресурсов, информационного мониторинга, управления информационным содержанием ресурсов, базы данных, авторизации, управления версиями и проектами, планирования и подготовки модернизации или реинжиниринга проекта.

Подсистема проектирования информационной архитектуры обеспечивает выполнение следующих функций, позволяющих проводить как первичное проектирование ресурса, так и модернизировать или перепроектировать ресурс:

Рисунок 1 - Схема проектирования, сопровождения и модернизации Web-pecypca

- Подцержка интерфейса пользователя для создания и модернизации модели этапа анализа и определения требований

- Подцержка интерфейса пользователя для создания и модернизации модели этапа проектирования

- Поддержка интерфейса пользователя для создания и модернизации модели этапа реализации

- Просмотр, выбор и адаптация к проекту типовых элементов сайтов

- Просмотр, выбор и адаптация к проекту аналогов (выполннных ранее проектов)

- Координация моделей проекта при внесении изменений

- Определение состава и содержания информационных элементов проекта в автоматизированном режиме

- Создание структуры страниц в автоматизированном режиме

- Создание вариантов компоновки страниц в автоматизированном режиме

- Оценка проекта на разных этапах

Информационная архитектура ресурса описывается инфологическими моделями «сущность-связь». Разработана типовая структура внутреннего хранилища данных ресурса (рисунок 2), основанного на реляционной модели данных. Выделена инвариантная часть хранилища данных, которая присутствует в информационной модели любого проекта сайта. Это позволяет ускорить разработку программного обеспечения новых проектов.

На каждом из этапов проектирования определяются части данных и метаданных хранилища данных: на этапе определения требований и анализа -семантическая модель ресурса и основанная на ней внутренняя модель; на этапе проектирования - внешняя модель ресурса; на этапе проектирования -метаданные, определяющие форму взаимодействия пользователей с данными хранилища Связи между данными внутренней и внешней моделей поддерживаются метаданными, обеспечивающими программную и информационную взаимосвязь моделей проекта.

Приведены данные о проектах, выполненных с использованием разработанных методов, и результаты исследования их характеристик. Использованы следующие характеристики проектов: тип и назначение проекта; заказчик; использованные программные средства; объем программногокода проекта; количество разработчиков; процентное соотношение типовых и оригинальных информационных элементов в структуре ресурса; количество страниц гипертекста; наличие активных страниц; наличие базы данных, интегрированной с Web ресурсом; процентное соотношение объема (в программном коде) ручного и автоматизированного проектирования при выполнении проекта; сроки проектирования; предполагаема частота обновления инфрмационного содержания ресурса; данные о проведенных с момента начала эксплуатации модернизациях ресурса.

Проведенный анализ затрат времени на проектирование показал, что при применении разработанной автором методики достигается снижение времени проектирования (в среднем в 1.5 раза), причем для крупных проектов (более 100 страниц) это снижение существеннее по сравнению с небольшими проектами, Соответственно времени разработки уменьшается и стоимость разработки, как за счет уменьшения состава разработчиков, так и за счет

Модели процессов

Нтернет-игточники

( Электронные I документа

Оперативная БД новых документов

ПО создания и

коррекции семантической модели

ПО отбора

новых документов

Внутренняя модель

Семантическая модель

Данные внутренней модели

Метаданные внутренней модели

Внешняя модель

Данные внешней модели

Метаданные внешней модели

И нформацнонны е менеджеры

Администраторы ресурса

ПО

генерации страниц сайта

ПО

обработки информации пользоателя

Пользователь

- информационные запросы

- активизация страниц

- установка параметров внешнего представления

ввод данных

ПО анализа ресурса и подготовки изменений внутренней модели

Оперативная БД информации пол ыовп гелей

Рисунок 2. Структура хранилища данных и поддерживающих его программных компонент

Оперативная БД статистики посещений

уменьшения времени оплачиваемой работы.

Оценка эксплуатационной эффективности проектов проводилась на основе программного обеспечения сбора статистики посещений по двум проектам, разным по назначению и тематике (сайт журнала «Микросистемная техника» - www.microsystems.ru и сайт компании Акватон - www.aquaton.ru), где использовались разработанные методы для улучшения информационной архитектуры. Также оценивалось обнаружение ресурса поисковыми системами (Yandex, Rambler, Google) и значения формальной релевантности, присваиваемой ресурсам, что выражается в занимаемой ресурсом позиции в списке выдачи.

Анализ результатов показал увеличение числа посетителей обоих сайтов (в среднем на 20%), а также улучшение позиции ресурсов в списках выдачи поисковых систем при запросах, связанных с основной тематикой сайтов.

В заключении сформулированы основные научные и практические результаты работы и перспективы развития исследований.

Основные результаты работы

Основным научным результатом работы является теоретическая разработка, обобщение и решение важной проблемы в области автоматизированного проектирования - создание методологических основ автоматизации проектирования информационной архитектуры Web-ресурсов Интернет, что будет способствовать развитию и повышению качества отечественных электронных информационных ресурсов, повышению их конкурентоспособности в глобальном информационном пространстве, а также их востребованности отечественной и зарубежной аудиторией Интернет.

В диссертационной работе получены следующие основные результаты.

1. Обобщена и развита концепция информационной архитектуры Web-ресурса, проведена системная декомпозиция Web-ресурсов как класса сложных систем, на основании которой разработана формализованная модель информационной архитектуры и ее компонент, определены критерии их выбора.

2. Разработана формализованная модель предметной области Web-ресурса, использующая его представление в виде семантической сети понятий, формируемых на основе анализа информационных задач владельцев ресурса, его целевой аудитории, конкурирующих ресурсов, информационных источников, релевантных тематике ресурса.

4. Разработана методика и алгоритмы анализа предметной области Web-ресурса и его декомпозиции на множество взаимосвязанных информационных элементов, основанные на методах автоматизированного лингвистического анализа электронных документов и методах автоматической классификации, используемых в технологиях интеллектуальной обработки информации.

5. Разработана методология структурно-логического проектирования информационной архитектуры, основанная на автоматизированных процедурах

анализа и декомпозиции предметной области Web-pecypca, синтеза основных структурных компонент ресурса и мифологическом моделировании Web-pecypca на всех этапах его жизненного цикла, включая этап эксплуатации.

6. Разработана методика и алгоритмы формирования информационного содержания страниц гипертекстовой структуры ресурса и системы навигации.

7. Формализована задача размещения информационных элементов на странице гипертекста, разработаны метод и алгоритм решения этой задачи и метод оценки качества размещения.

8. Разработана методика оценки пользовательских характеристик проектируемого Web-pecypca на основе предложенных в работе формализованных моделей, позволяющая проводить оценку показателей работы ресурса на ранних стадиях проектирования, что позволяет существенно улучшить качество пользовательского взаимодействия с информацией ресурса.

9. Разработаны методические принципы автоматизации модернизации информационной архитектуры ресурса на этапе его эксплуатации.

10. Разработан комплекс методических, программных и информационных средств для автоматизированного проектирования, сопровождения и модернизации информационной архитектуры Web-ресурсов Интернет, реализующий методологию структурно-логического проектирования.

11. Использование разработанных в диссертации научно-методических принципов и программных средств в составе системы автоматизированного проектирования Web-ресурсов Интернет позволило сократить сроки их проектирования и улучшить пользовательские характеристики спроектированных ресурсов.

Основные результаты диссертации изложены в следующих публикациях

1. Борисова (Мальцева) СВ., Сботова Т.Д. Диалоговая система имитационного моделирования., Автоматизация производства, №8, 1990, С18-20.

2. Борисова (Мальцева) СВ. Управление интерактивным поиском электронной информации. Труды Международной научно-технической конференции "Датчики и преобразователи информации систем измерения, контроля и управления", 1992, С 48-49

3. Борисова (Мальцева) СВ., Никитин В.В. Проектирование технологии обучения с применением ЭВМ. Материалы V международной конференции «Применение новых технологий в образовании» 30 июня-3 июля 1994, С 257-258.

4. Borisova (Мальцева) S.V. Electronic Access Systems For Integrate

Educational Medium . Proceedings of Fist International Conference On Distance Education in Russia "Distance Learning and New Technologies In Education" Moscow, 5-8 July, 1994, p234.

5. Смирнов Д.Ю., Мальцева СВ. Управление содержанием Интернет-ресурсов. Автоматизация и современные технологии. № 9, 2001, С..13-16.

6. Мальцева СВ. Информационная архитектура Web-ресурсов Интернет и проблемы ее проектирования. Автоматизация и современные технологии. № 7, 2002, С. 18-22.

7. Козлов А.В., Мальцева С В. Архитектура поисковых машин для Web-ресурсов Интернет. Автоматизация и современные технологии. № 8, 2001,С36-41.

8. Бунин О.В., Мальцева СВ. Реклама в Интернет: обзор технологий. Автоматизация и современные технологии. № 10, 2001, С. 19 -22.

9. Мальцева СВ. Метод размещения информации на страницах Web-ресурсов. Автоматизация и современные технологии. № 6, 2002, С. 24-27.

10. Мальцева СВ., Смирнов Д.Ю. Система автоматизированной разработки сайтов, подготовки и публикации информации в Интернет. Автоматизация и современные технологии. № 8, 2002, С.23-26.

11. Мальцева СВ. Маркетинг и реклама в Интернет. Приложение к журналу «Информационные технологии, №1,2002г. - 24с.

12. Мальцева СВ. Интернет-технологии информационного маркетинга и рекламы (Учебное пособие). - М., Институт информационного сервиса МГТС, 2002. - 136с.

13. Мальцева СВ. Дистанционное обучение в области Web-дизайна и Интернет-рекламы. Материалы ХШ Международной конференции «Применение новых технологий в образовании». - Троицк, 2002, С. 98-99.

14. Мальцева СВ., Смирнов Д.Ю, Автоматизация разработки и управления информационным наполнением Web-ресурсов. Информационные технологии и системы в образовании, науке, бизнесе. Сборник материалов III Международной научно-технической конференции. -Пенза, 2002г. С.68-70.

15. Мальцева СВ. Автоматизация проектирования Web-ресурсов Интернет. Труды IV Международной научно-технической конференции «Электроника и информатика- 2002», Зеленоград, МИЭТ, 19-21 ноября 2002 г.,т.2,С392.

16. Мальцева СВ. Моделирование информационной архитектуры Web-ресурсов Интернет. - Проблемы информатики в образовании, управлении, экономике и технике. Сборник материалов II Всероссийской научно-технической конференции. - Пенза, 2002., С. 73-75.

17. Мальцева СВ. Информационно-аналитическая система для анализа инновационной деятельности предприятия. - Математические методы и информационные технологии в экономике, социологии и

образовании Сборник статей X Международной научно- технической конференции. - Пенза, 2002.-С. 231-233.

18. Мальцева СВ. Информационное моделирование Web-ресурсов Интернет. - М.: Издательство «Глобус», 2003. - 216с.

19. Мальцева СВ. Использование Интернет-ресурсов в информационном обеспечении инвестиционно-инновационной деятельности. - Труды Международного Форума по проблемам науки, техники и образования. Том U Под редакцией: В.П. Савиных, В.В.Вишневского. - М.: Академия наук о Земле, 2002, С. 76-77.

20. Мальцева СВ., Макаров С.Л.. Применение информационного моделирования при разработке и модернизации Web-ресурсов Интернет -Информационные технологии XXI века. Сборник материалов IV-ой Межвузовской ежегодной научно-практической конференции. ИИТ МГУ сервиса, 2003, С. 21-23

21. Мальцева СВ., Проценко Д.С. Программный комплекс для создания типовых сервисов и компонент в составе Интернет-ресурсов. Информационные технологии XXI века. Сборник материалов IV-ой Межвузовской ежегодной научно-практической конференции. ИИТ МГУ сервиса, 2003, С 24-25

22. Бархоткин А.В., Мальцева СВ., Райнов А.Ю. Информационно-измерительная система для автоматического управления гидродинамическими течениями в быстрых термических процессах. -Сборник материалов XV научно-технической конференции «Датчики и преобразователи информации систем измерения, контроля и управления» Крым, Судак, 23-30 мая 2003 года.- С. 176-177.

23. Мальцева СВ., Киселев В.Е. Структурно-логическое моделирование Интернет-ресурсов Материалы VIII международной научно-практической конференции "Наука - индустрии сервиса" .Секции "Информационные технологии в сфере сервиса" - М., ИИТ ИГУС, 2003, С 46-48/

24. С.А. Митрофанов, СВ. Мальцева. Автоматизированное проектирование, экспертиза и мониторинг инновационной деятельности в научной сфере на основе Интернет-технологий. Автоматизация и современные технологии. № 12, 2003, С. 16-23.

25. Мальцева СВ., Смирнов Д.Ю. Веб-сайт для холдинга. Дочерние компании и бизнес, №1,2004 г. - С. 21-25

26. Проценко Д.С, Мальцева СВ. Программные средства информационного сопровождения Web - ресурсов Интернет. Материалы VIII международной научно-практической конференции "Наука -индустрии сервиса" .Секции "Информационные технологии в сфере сервиса" - М., ИИТ ИГУС, 2003, С. 46-48.

27. Козлов А.В., Мальцева СВ. Методы повышения эффективности автоматического индексирования документов. Автоматизация и современные технологии. № 6, 2004, С. 22-27

28. Исследование и решение проблем информационно-

аналитического и финансово-экономического обеспечения деятельности региональных инновационных предприятий в научно-технической сфере Отчет по НИР, 2002, Деп. в ВНИТИЦ. Per. номер 01-2003 15583, Инв. номер 02.2003 06681.

ИД №06117 от 23.10.2001

Подписано в печать 10.09.2004.

Формат 60x84/16. Бумага типографская № 2. Печать - ризография Усл. печ. л. 2,0 Тираж 100 экз. Заказ 670-04

Московский государственный институт электроники и математики 109028, Москва, Б.Трехсвятительский пер., 3/12.

Центр оперативнойполиграфии (095)916-88-04,916-89-25

цН 642 1

Оглавление автор диссертации — доктора технических наук Мальцева, Светлана Валентиновна

Введение.

Глава 1. Концепция информационной архитектуры \УеЬ-ресурса и проблемы автоматизации ее проектирования.

1.1 Особенности \^еЬ-ресурсов Интернет как объектов проектирования.

1.1.1 Жизненный цикл \УеЬ-ресурсов Интернет.

1.1.2 Принципы и методы проектирования \УеЬ-ресурсов как программно-информационных продуктов.

1.2. Анализ процесса потребления информации ресурсов Интернет.

1.2.1 Потребительские характеристики информации и информационных услуг.

1.2.2 Тематические особенности информационных ресурсов Интернет.

Щг 1.2.3 Особенности потребления информации, как особого вида товара.

1.2.4. Особенности целевой аудитории Интернет-ресурсов.

1.2.5 Цели присутствия в Сети.

1.2.6 Процесс потребления информации.

1.3 Определение информационной архитектуры \УеЬ-ресурсов Интернет.

1.3.1 Анализ принципов выделения структурных компонент \Veb-pecypca.

1.3.2 Системная декомпозиция \Veb-pecypcoB.

1.3.3 Методы оценки и критерии качества информационной архитектуры.

1.4 Средства автоматизации проектирования \УеЬ-ресурсов.

Выводы к главе 1.

Глава 2. Разработка формализованного описания информационной архитектуры \Veb-pecypcoB Интернет и задач ее проектирования. 2.1 Методы моделирования \УеЬ-ресурсов Интернет.

2.1.1 Модели гипертекстовых документов.

2.1.2 Моделирование взаимодействия с пользователем.

2.1.3 Моделирование пользовательской аудитории.

2.2 Разработка формализованной модели предметной области и модели внешнего представления Web-pecypca.„„„.

2.2.1 Формализованная модель предметных областей пользователей и ф спецификаций информационных требований пользователей.

2.2.2 Разработка внутренней модели информации Web-pecypca.

2.2.3 Разработка внешней модели информации Web-pecypca.

2.3 Оценка информационной архитектуры на основе информации внутренней и внешней моделей.

2.4 Задачи модернизации информационной архитектуры Web-pecypcoB.

Выводы к главе 2.

Глава 3. Построение модели предметной области Web-pecypca на основе автоматизированных процедур лингвистического анализа электронных документов.

3.1 Анализ методов лингвистического анализа документов. ф 3.1.1 Модели набора документов.

3.1.2 Методы выделения терминоподобных слов и терминов в наборе документов.

3.1.3 Выделение многословных терминов.

3.1.4 Особенности анализа содержания текстовых элементов файлов.

3.2 Формирование набора терминов в автоматизированном режиме.

3.2.1 Оценка веса терминов.

3.2.2 Выделение синонимов.

3.2.3 Идентификация связей между терминами.

3.3 Формальное описание семантической модели предметной области проектируемого Web-pecypca.

3.4 Методика автоматизированного формирования семантической модели предметной области Web-pecypca.

3.5 Особенности применения технологий извлечения информации при формировании множества информации об объектах модели предметной области.

3.5.1 Применение технологий text mining и Web mining.

3.5.2 Применение технологий контент-анализа.

3.5.3 Определение множества информации об объектах на основе ф предварительного аннотирования набора документов семантической модели.

Выводы к главе 3.

Глава 4. Автоматизация формирования внешней модели ресурса на основе семантической модели.

4.1 Методика формирования множества информационных элементов внешней модели ресурса.

4.1.1 Формирование множества информационных элементов на основе кластеризации терминов семантической модели.

4.1.2 Формирование множества информационных элементов на основе предварительного аннотирования набора ф документов семантической модели ресурса.

4.2 Определение весов информационных элементов и связей между ними.

4.3 Распределение информационных элементов по страницам сайта.

4.3.1 Виды связей между информационными элементами и их отображение в структуре сайта.

4.3.2 Декомпозиция множества информационных элементов на комплексы страниц сайта.

4.4 Методика формирования внешней модели Web-pecypca.

4.5. Методика оценки проекта информационной архитектуры на основе разработанных моделей.

Выводы к главе 4.

Глава 5. Принципы и методы размещения информации на страницах Ш Web-pecypca.

5.1 Принципы размещения информации на экране дисплея.

5.2 Элементы и принципы компоновки страниц Web-pecypcoB Интернет.

5.2.1 Информативность элементов страниц сайта.

5.2.2 Классификация элементов страницы по способу обработки электронной информации.

5.2.3 Типовые компоновки страниц сайтов. ф 5.2.4 Принципы художественного оформления страниц сайтов.

5.2.5 Влияние на компоновку страниц технических ограничений.

5.3 Метод и алгоритм размещения информации на странице

УеЬ-ресурса.

5.3.1 Постановка задачи размещения информации на странице.

5.3.2 Метод решения задачи размещения прямоугольных областей на полосе ограниченной ширины.

5.3.3 Программная реализация алгоритма размещения информационных элементов на странице гипертекста.

5.4 Методика оценки размещения информации на странице

Veb-pecypca. ф 5.4.1 Оценка размещения информации в поле экрана.

5.4.2 Оценка размещения информации на странице гипертекста.

Выводы к главе 5.

Глава 6. Автоматизация модернизации информационной архитектуры

Veb-pecypcoB.

6.1 Интеграция задач проектирования и модернизации информационной архитектуры \Veb-pecypcoB.

6.1.1 Особенности сопровождения \УеЬ-ресурсов на этапе эксплуатации.

6.1.2 Изменяемые компоненты информационной архитектуры ресурса.

6.1.3 Типовые функции программных средств управления информационным содержанием \УеЬ-ресурсов.

6.1.4 Состав задач модернизации информационной архитектуры. в 6.2 Использование семантической модели ресурса для определения состава и содержания его модернизации.

6.2.1 Особенности задач классификации документов при модернизации семантической модели \Veb-pecypca.

6.2.2 Классификация документов при модернизации ресурса.

6.2.2.1 Принципы поиска документов для расширения семантической модели. ф 6.2.2,2Кластеризация д£жументов.семантической модели ресурса.

6.2.2.3 Классификация при добавлении нового документа.

6.2.2.4 Удаление и изменение документов характеристического набора.

6.3 Автоматизация проектирования и управления модернизацией информационной архитектуры \Veb-pecypca на основе разработанных методов.

6.3.1 Информационное обеспечение принятия решений по модернизации и реинжинирингу информационной архитектуры \Veb-pecypca

6.3.2 Организация хранилища данных системы автоматизированного проектирования и модернизации \Veb-pecypcoB.

6.3.3 Структура системы автоматизированного проектирования и ф модернизации \¥еЬ-ресурсов.

6.3.4 Управление проектами \Veb-pecypcoB в системе.

6.4 Оценка эффективности методов и средств проектирования и модернизации информационной архитектуры \¥еЬ-ресурсов.

6.4.1 Характеристики выполненных проектов.

6.4.2 Оценка эффективности выполненных проектов.

Выводы к главе 6.

Введение 2004 год, диссертация по информатике, вычислительной технике и управлению, Мальцева, Светлана Валентиновна

Одной из основных особенностей конца XX столетия, определившей прогресс в третьем тысячелетии, является стремительный рост объема # информационных—ресурсов—Решающую—роль-в—этом—процессе играет сеть Интернет, и, в первую очередь, World Wide Web.

Сегодня Интернет - это конгломерат сетей, соединенных друг с другом, который обеспечивает пользователям разнообразные виды информационного сервиса: пересылку файлов и сообщений, удаленный доступ, сеансовый и интерактивный режим работы, бизнес-информацию, новости и т.д.

Количество пользователей Интернет на сегодняшний день составляет примерно 560 млн. По прогнозу исследовательской фирмы Computer Economics к 2005 г. в мире будет более 830 млн. пользователей Интернет.

Россия занимает 15-е место в мире по числу пользователей в Сети. Согласно статистическим данным, всего в России насчитывается 8 миллионов ф пользователей Интернет, из которых 4 миллиона 300 тысяч - постоянные. С 1998 по 2001 год российская аудитория сети Интернет увеличилась в пять раз, и в настоящий момент пользователями Сети хотят стать еще 36 миллионов россиян. Без преувеличения можно сказать, что сегодня информационные ресурсы Интернет используются практически во всех сферах человеческой деятельности, анализ их содержания, во многом, определяет принятие решений, как в научно-технической области, так и в бизнес-процессах.

Основная часть информационных ресурсов Интернет сосредоточена в WWW.

Компания Inktomi и NEC Research по результатам проведенного исследования Интернет выявили, что в сети содержится уже более 1 млрд. документов. В российском сегменте по исследованию Руметрики количество уникальных документов более 67 млн. ^ Web-pecypcbi представляют собой совокупность гипертекстовых документов, по сути, являясь огромной гипертекстовой базой данных. Наличие ссылок обеспечивает переход от одного документа к другому, что позволяет объединить в единую структуру большое количество связанных между собой документов.

Термин «гипертекст» был введен для описания документов, выражающих нелинейную структуру идей, в противоположность традиционной линейной структуре книг и речи, Тедом Нельсоном в 1965 году [176]. Сегодня существует множество определений этого термина [4, 29, 39, 76, 176],

В основе гипертекстовых документов World Wide Web - язык HTML (Hyper Text Markup Language) [4], разработанный Тимом Бернерс-Ли (Tim Berners-Lee), и стал популярным благодаря броузеру Mosaik, разработанному в NCSA. В 90-е годы прошлого века он широко распространился и расширился.

Возможность встраивать в гипертекстовые документы различные объекты позволила использовать для представления информации практически любые формы и средства, что сделало информационные ресурсы Интернет разнообразными и привлекательными для пользователей.

Сегодня можно отметить следующие тенденции развития Интернет, которые определяют актуальность исследований в этой области:

- расширение сферы и интенсивности использования информации Интернет при решении различных задач, в первую очередь, задач прогнозирования, планирования и управления;

- возросшая конкуренция между ресурсами, особенно крупными, в области предоставления информации и информационного сервиса;

- усиление роли Web-pecypcoB в рекламных и маркетинговых стратегиях их владельцев;

- перемещение некоторых бизнес-процессов в виртуальную среду, что связано с развитием Интернет-технологий;

- резкое увеличение спроса на Web-проекты.

Перерождение значительной части Интернет из информационной среды в рекламно-информационную и использование при создании Web-pecypcoB методов, применяемых в рекламе, привело, наряду с резким ростом количества ресурсов и пользователей Интернет, также к ряду негативных последствий: преимущественной концентрацией внимания пользователя на визуальных эффектах, а не на информационном содержании сайтов; недостоверной или непроверенной информацией; попытками оказывать влияние на вкусы, потребности и мотивацию пользователей с целью реализации собственных бизнес-стратегий. Все это, так же как и традиционная реклама, часто вызывает реакцик5оггорженияуаудитории^Последние годы отмечены повышенным интересом к оформлению сайтов и развитием исследований по оценке их привлекательности для пользователей. Огромные объемы информации, обрушивающиеся на пользователей Интернет, в условиях невысокой релевантности, обеспечиваемой большинством поисковых систем, породили стиль взаимодействия пользователя с Интернет-ресурсами, характеризующийся беглым просмотром страниц, игнорированием долго загружающихся элементов: анкет, систем регистрации, прямой рекламы. Сайты, содержащие большие объемы текстовой информации, признаются скучными большинством исследований пользовательского поведения в Сети и не могут рассчитывать на большое количество повторных посещений.

Изучение восприятия информации человеком при просмотре Web-страниц ведется с 1994 года. Наиболее известны результаты исследований Якоба Нильсена [79, 156], руководителя компании Nielsen Norman Group (http://www.nngroup.com), а до 1998 года - ведущего инженера и специалиста по Web-usability в Sun Microsystems, а также работы П. Морвиля, JI. Розенфельда [133], Д. Нормана [180], У. Вудсона, Д. Коновера [19], рекомендации фирм Microsoft [152], Apple [118] и других. Отечественные исследования в области пользовательского восприятия сайтов начали развиваться несколько позднее, чем за рубежом. Сегодня их результаты, большей частью, представлены в Интернет - источниках, (наиболее известны работы А. Лебедева (http://www.design.ru), Я. Перевалова (http://usabilyty.ru), В. Головача (http://www.usethics.ru)). Однако имеется значительное количество исследований, посвященных пользовательскому восприятию информации, представленной на экране компьютера, которые являются теоретической базой для разработки оценок пользовательского восприятия сайтов [5, 7, 28, 31, 40,41, 83, 89, 97 и др.]

Системы персонализации и кастомизации Web-ресурсов, получившие значительное развитие в последние годы [16, 123, 131, 160, 183, 188], нацелены на устранение дискомфорта пользователя Сети, однако они, по сути, ограничивают

Щинформационноепространство пользователя, поэтому часто сами по себе вызывают негативное отношение, как при скрытом, так и при открытом исследовании пользовательских интересов.

Согласно данным исследования аудитории мирового Интернета (The Internet Monitor), проведенного MASMI Research совместно с Pro Active International, свои персональные данные на сайтах оставляют 47% пользователей в Европе (в России этот показатель несколько выше - 52%).

Несмотря на отмеченные проблемы сегодняшней Сети, Web-pecypcbi Интернет представляют сегодня самое большое хранилище информации и являются прообразом единого информационного пространства [38].

Перед создателем информационного Web-pecypca стоит сложная задача — донести информацию до пользователя, сделав ее форму настолько привлекательной, чтобы пользователь осознал ее полезность и необходимость для себя. По сути, это задача рекламирования информационного продукта в условиях жесткой конкуренции с множеством других производителей.

В указанном аспекте дизайн большинства сайтов признается неудачным (до 90% - по высказываниям в Интернет). Повышение качества дизайна сайтов, улучшение пользовательских характеристик ресурсов связывают сегодня не с художественным оформлением, а с проработкой его информационного наполнения.

В значительной мере решение этой задачи сводится к поиску варианта декомпозиции информационного пространства создаваемого ресурса, поиску последовательности представления выделенных частей и определению формы их ♦ представления. Важность этих задач для Web-pecypcoB Интернет привела к выделению их в область самостоятельных исследований, а именно, к исследованиям информационной архитектуры Web-pecypcoB.

Термин «информационная архитектура» был введен в обращение Ричардом Вурманом [153] еще в 1976 году, им же были определены задачи информационного архитектора. Интерес к информационной архитектуре в 90-х ф щдахпрошлого^столетияЁЬ1л связан,восновном, . с интенсивным „развитием информационных систем предприятий и организаций и информатизацией бизнес-процессов.

Сегодня имеется обширная литература по этому вопросу [45, 79, 121, 168 и др.], а также широкий спектр программных средств для автоматизации проектирования информационных систем [52, 81, 84, 121, 141,148, 151].

Концепция информационной архитектуры сайтов начала интенсивно разрабатываться несколько позднее, в конце девяностых годов двадцатого столетия, что в первую очередь связано с интенсивным ростом объема ресурсов Интернет.

Особо значительное место занимают труды Л.Розенфельда и П.Морвиля щ [133,165], Дж.Дж.Гарретта [131], P.C. Хилца и М. Турофа [132], Е.И.Рейса [142], а также членов возглавляемой Розенфельдом Argus Associates [158] и Argus Center for Information Architecture. Большое значение для развития концепции ИА, имеет подготовленный ассоциацией Argus глоссарий по информационной архитектуре [159]. Имеется большое количество публикаций в периодических и Интернет-источниках [138, 149, 160,161,163,164, 167, 171,172, 183 и др.]

Наряду с публикациями, затрагивающими вопросы, связанные с информационной архитектурой Web-pecypcoB, в отечественных и зарубежных источниках значительное место уделяется вопросам, связанным с ее проектированием и оценкой. Это работы по моделированию и автоматизированному проектированию гипертекстов, как основы сайтов, (работы В.П. Морозова, В.П. Тихомирова, Е.Ю. Хрусталева, Ф.Чудинова, Дж.Гарретта), • упоминавшиеся выше работы по изучению восприятия человеком информации Web-pecypcoB (работы А. Лебедева, Я. Перевалова, В. Головача, Я. Нильсена , П. Морвиля, Л. Розенфельда, Д. Нормана, У. Вудсона, Д. Коновера, рекомендации фирм Microsoft, Apple и других), оценке эффективности Web-pecypcoB, управлению их эксплуатацией и развитием. В Интернет существует значительное количество сайтов и дискуссионных форумов, где обсуждаются вопросы проектирования сайтов, в том числе и вопросы их информационной архитектуры. ф Сегодня задаыалроектированиялнформационной архитектуры оценивается большинством авторов и разработчиков как центральная задача процесса создания сайта.

Показательно, что в глоссарии по информационной архитектуре [159] выделены понятия "маленький информационный архитектор" и "большой информационный архитектор". Если задачей первого является руководство процессом разработки обратной информационной архитектуры, что, по сути, сводится к задаче управления контентом в сложившейся архитектуре сайта, то задачу большого информационного архитектора составляет стратегическое управление проектом \Veb-pecypca. Появление больших информационных архитекторов знаменует перевод задач проектирования информационной ф архитектуры из задач второго плана (после художественного проектирования) на центральное место в проекте.

Несмотря на интенсивность работ в области информационной архитектуры сайтов, сегодня многие вопросы в ней остаются нерешенными.

В первую очередь, это касается самого определения концепции информационной архитектуры, которую разные авторы определяют по-разному. Сложность ее определения связана с тем, что современные \Veb-pecypcbi уже на являются просто гипертекстом, обеспечивающим взаимодействие с пользователем за счет активных компонент. Сегодня это сложные системы, включающие базу данных, подсистему интерфейса пользователя, ряд административных и прикладных подсистем, таких как подсистема управления информационным содержанием, авторизации, поисковая, персонализации, сбора ® и анализа статистики посещений и т.д. Имеются проекты, включающие средства проектирования, позволяющие производить модернизацию структуры сайта. Поэтому первой задачей, решаемой в диссертации является определение и формальное описание информационной архитектуры \Veb-pecypca, как сложной системы, и формализация задач ее проектирования.

Многообразие требований, предъявляемых к \Veb-pecypcy программноаппаратнойсредой,„пользовательской -аудиторией иеговладельцами или спонсорами, часто включает противоречивые группы требований, баланс которых является практически недостижимой задачей для проектировщика сайта. Существующие методики проектирования поэтому, в основном, ориентированы на какую-либо одну группу требований, например, обеспечение комфортной работы пользователя (эргономическое проектирование) или реализацию бизнес-стратегий владельцев ресурса.

Основными этапами любой методики проектирования информационной архитектуры сайта являются те же этапы, которые выделяются в процессе создания любого программного обеспечения: это анализ, разработка и внедрение, однако, методы проведения этих этапов различаются в зависимости от требований, которые предъявляются к ресурсу на этапе анализа, так что каждый из них может включать различный набор решаемых задач.

При решении задачи проектирования информационной архитектуры можно выделить две основные задачи:

1. Декомпозиция информационного пространства ресурса на множество семантически целостных информационных элементов;

2. Разбиение множества информационных элементов на подмножества, объединенные семантическими и перцептивными связями (синтез страниц сайта).

Дополнительными задачами являются задачи, связанные с созданием удобного интерфейса пользователя: организацию поиска информации, разработку навигационных элементов. Можно отметить, что эти задачи являются вторичными, так как после решения двух первых задач определяются все связи между компонентами сайта и при решении двух других задач вопрос стоит только о способе визуализации этих связей.

Сложностью решения задач проектирования информационной архитектуры является отсутствие четких критериев и методов оценки, как проекта в целом, так и его информационной архитектуры. Большинство существующих методов оценивают завершенный проект сайта на основе эмоционального восприятия его пользовательской аудиторией [124, 130, 135, 144, 163, 167, 173], что предполагает наличие—законченного—художественного оформленияОценка незавершенного проекта, что и представляет собой информационная архитектура, вызывает значительные трудности. Существующие для этого методики в большей степени ориентированы на оценку отдельных компонентов, нежели всего проекта в целом. Важность информационной архитектуры для последующих эксплуатационных характеристик Web-pecypca делает необходимой разработку методов ее оценки, позволяющих моделировать пользовательское поведение уже на этапе разработки.

Определение методов решения указанных задач проектирования и оценки информационной архитектуры является второй задачей, решаемой в диссертационной работе.

Высокие требования к актуальности информации Web-pecypcoB. конкуренция между ресурсами, рекламные и маркетинговые составляющие ресурсов, делают их главной особенностью, как программно-информационных продуктов, необходимость частой модернизации на этапе эксплуатации. Это делает необходимым интеграцию задач проектирования и эксплуатации в используемых методах поддержки их жизненного цикла. Поэтому третьей задачей, решаемой в диссертационной работе, является исследование задач эксплуатации и модернизации Web-pecypcoB и разработка научно-методических основ управления развитием Web-pecypcoB и их модернизации на этапе эксплуатации.

Четвертой задачей диссертации является разработка и применение методов, обеспечивающих автоматизированное проектирование и модернизацию информационной архитектуры Web-pecypcoB. Необходимость решения этой задачи определяется резким увеличением спроса на Web-ресурсы и необходимостью повышения их качества, что невозможно без применения формализованных методов для анализа и обоснования принимаемых решений.

Автоматизированное проектирование Web-pecypcoB определяется рядом технологий. К ним в первую очередь, относятся:

- технологии структурного анализа информационного пространства ф предметной области;.

- технологии баз данных для хранения, как информационного содержания Web-pecypca, так и метаданных проекта;

- технологии автоматизации программирования для реализации отдельных компонент информационной архитектуры в виде программного кода на соответствующих языках, в первую очередь, HTML и языках написания скриптов.

Конкретные реализации этих методов в виде отдельных методик и САПР поддерживают методологию прямого или обратного проектирования, которым соответствуют определения прямой и обратной информационной архитектуры. Наиболее распространены и являются исторически более ранними САПР, поддерживающие обратное проектирование, «выросшие» из задач управления Ц информационным наполнением ресурса на этапе эксплуатации. Однако, большинство новых систем ориентировано на методологии прямого проектирования, позволяющие обеспечить более высокие потребительские свойства ресурса как информационного продукта и упростить его последующую структурную модернизацию и расширение.

Несмотря на большое количество систем и отдельных программ, позволяющих автоматизировать как решение отдельных задач проектирования Web-pecypcoB, так и комплексное ведение проекта, можно отметить следующие проблемы проектирования Web-сайтов, отмечаемые большинством исследователей сети:

1. Высокая степень автоматизации проектирования Web-pecypcoB достигается, в основном на поздних этапах жизненного цикла продукта, а именно, ^ на этапах реализации и сопровождения (модернизации). Начальные этапы, связанные с анализом требований и разработкой информационной архитектуры автоматизированы в очень малой степени, в основном, на уровне отдельных подзадач.

2. Отсутствуют методы оценки информационной архитектуры \Veb-ресурсов, позволяющие получать комплексную оценку информационной архитектуры на основе оценок отдельных ее элементов и пригодные для использования,.как на ранних,так.и^на поздних этапах проектирования

3. Существующие методы проектирования \Veb-pecypcoB только декларативно опираются на моделирование интересов трех групп пользователей \УеЬ-ресурса: потребителей, владельцев и разработчиков. Ориентация ресурсов на широкий круг потребителей делает большинство методик малоэффективными для проектирования. По сути, моделирование подменяется работой эксперта в определенной предметной области или копированием сайтов конкурентов.

4. Используемые методики моделирования проекта Х^еЬ-ресурса моделируют только взаимосвязь его структурных компонент, практически игнорируя его свойства, как информационного продукта, отображающего часть глобального информационного пространства. Это не только делает их малопригодными для проектирования информационной архитектуры, где информационная целостность превалирует над структурной, но также не обеспечивает преемственности моделей различных этапов проектирования.

5. Существует конфликт между рекламно-презентационным аспектом \Veb-ресурсов и методологией прототипирования, в той или иной степени присутствующим в существующих методиках автоматизированного проектирования. Разрешением этого конфликта является создание и развитие методов, обеспечивающих поддержку проектирования оригинальных сайтов, а именно средств анализа информационного пространства \Veb-pecypca, компоновки информационной архитектуры, моделирования и оценки оригинальных проектов на начальных стадиях проектирования.

6. Мало проработаны вопросы формирования предметной области \Veb-ресурса, отсутствуют методики ее структурного анализа. Прямое перенесение методологии структурного анализа, используемого при проектировании информационных систем предприятий, оказывается невозможным из-за разности целей и пользовательской аудитории у \Veb-pecypcoB и ИС предприятий.

7. Мало исследованы вопросы взаимосвязи и взаимовлияния информационной архитектуры и художественного оформления \УеЬ-ресурсов. Существует тенденция к смещению акцентов проектирования в сторону информационной архитектуры.

8. В системах автоматизации проектирования \УеЬ-ресурсов преобладают методологии обратного проектирования, что не обеспечивает возможности автоматизации проектирования оригинальных сайтов, приводит к распространению технологий прототипирования, отрицательно сказывающихся на потребительских свойствах ресурса как информационного продукта, а также создает сложности при последующей его структурной модернизации и расширении.

Целью настоящего исследования является повышение качества и эффективности отечественных электронных информационных ресурсов за счет разработки методов автоматизированного проектирования информационной Ф архитектуры \УеЬ-ресурсов Интернет.

Достижение указанной цели предполагает решение следующих задач:

- анализ современного состояния проектирования \УеЬ-ресурсов;

- исследование состояния и развитие концепции информационной архитектуры \Veb-pecypca;

- систематизация и разработка моделей \УеЬ-ресурсов и их компонент;

- исследование влияния характеристик информационной архитектуры на эксплуатационные показатели \УеЬ-ресурса и обоснование критериев качества информационной архитектуры;

- разработка методов структурного анализа предметной области \Veb-ресурса;

- теоретическое исследование и разработка формализованных методов ^ синтеза информационной архитектуры Web-pecypca;

- разработка алгоритмов и программных средств автоматизированного проектирования информационной архитектуры ,\Л^еЬ-ресурсов;

- исследование задач эксплуатации и модернизации \Veb-pecypcoB и разработка научно-методических основ управления развитием \Veb-pecypcoB и их модернизации на этапе эксплуатации.

Структура и объем работы Диссертация состоит и введения, шести глав, заключения.

Первая глава посвящена рассмотрению общей концепции информационной архитектуры \Veb-pecypcoB Интернет, методов ее проектирования и ее влияния на эксплуатационные характеристики ресурсов.

Рассматриваются особенности \Veb-pecypcoB Интернет как объектов проектирования, анализируются модели их жизненного цикла, методы разработки средств автоматизации проектирования. Показано, что \УеЬ-ресурсы характеризуются коротким циклом разработки, высокой частотой изменения их информационного содержания и структуры, одновременным существованием работающей и разрабатываемой версии, что соответствует спиральной модели жизненного цикла и делает необходимым использование методов автоматизации их разработки и модернизации. Проведен анализ процессов потребления информации при взаимодействии пользователей с Интернет, на основании которого определены характеристики \Veb-pecypca как информационного продукта и средства информационного сервиса, учет которых необходим при его проектировании.

Проводится анализ существующих представлений об архитектуре информации и ее компонентах, а также схем реализации этих представлений в общем процессе проектирования \Veb-pecypcoB Интернет. Рассмотрены три основные аспекта описания \Veb-pecypca: построение иерархии абстрактных моделей, определение уровней иерархии сложности принятия решений, и формирование организационной иерархии. Показано, что информационная архитектура отражает, в первую очередь, информационный уровень в системной декомпозиции \Veb-pecypca, однако, она затрагивает и другие уровни, так как часто смысл информации определяет форму и программные средства ее представления.

Во второй главе рассматриваются принципы построения моделей \Veb-.ресуреовЛнтернет и их.компонент, формализованного представления предметной области \УеЬ-ресурсов и информационных требований пользователей, формализуется задача проектирования информационной архитектуры, определяются критерии ее оценки.

Предметная область \Veb-pecypca определяется как совокупность информации об объектах (процессах, явлениях) и их характеристиках, которая соответствует информационным потребностям или интересам определенной группы пользователей Интернет, составляет его информационное содержание, представляется в виде специальных структур данных и используется пользователями для решения различных функциональных задач.

Формализуется описание моделей предметных областей пользователей и информационных требований пользователей. Показано, что модель предметной области представляет собой внутреннюю модель информационной архитектуры \Veb-pecypca, которая используется в задачах управления его информационным содержанием. Внешняя модель, которая является представлением организационной иерархии \Veb-pecypca на информационном уровне, создается на основе моделей информационных требований пользователей, которые отражают информационные потребности планируемой аудитории ресурса.

На основе проведенной формализации определяются основные компоненты организационной иерархии \Veb-pecypca.

Задача проектирования внешней информационной архитектуры представляется как задача определения отображения модели предметной области на внешнюю модель при заданных ограничениях.

На основе общей задачи проектирования информационной архитектуры определены составляющие ее частные задачи.

Третья глава посвящена разработке модели предметной области проектируемого \Veb-pecypca на основе анализа электронных документов и

Интернет-ресурсов, представляющих его содержание и назначение. Такими документами являются различные электронные тексты, \Veb-pecypcbi, а также модели информационных процессов пользователей предполагаемой целевой Ш аудитории и информационных процессов владельцев ресурса, связанных с продвижением продукции, услуг или идей.

Показано, что центральной задачей определения предметной области для \Veb-pecypcoB является определение множества объектов и отношений на этом множестве. Задача выделения множества объектов интерпретируется как задача выделения терминов на множестве документов, отобранных для описания предметной области. Для решения этой задачи в работе используются методы автоматизированного лингвистического анализа документов. Наряду с выделением множества объектов выделяется и множество связанной с ними входной и выходной информации.

Проведен анализ методов и средств автоматизированного лингвистического Щ анализа документов, лингвистических моделей документов, методов выделения терминов и установления связей между ними и показана возможность их использования для формирования формального описания предметной области \Veb-pecypcoB. Рассмотрены особенности применения этих методов к документам, используемым в составе набора документов, характеризующих информационное пространство.

Предложены методы отбора терминов из множества терминоподобных слов, методы формирования многословных терминов на основе итерационной процедуры, использующей шаблоны терминоподобных словосочетаний с последующей проверкой их информационной ценности. Предложены методы оценки информативности терминов для описания семантики информационного назначения ресурса на основе определения их частотных и вероятностных ^ характеристик.

На основе разработанных методов, правил и оценок предложена методика автоматизированного формирования терминологической семантической модели набора документов и формирования на ее основе множеств объектов и связанной с ними информации модели предметной области \Veb-pecypca.

В четвертой главе рассматриваются вопросы автоматизированного формирования. внешне1^модели1ресурсанаоснове модели^предметной области и моделей информационных требований пользователей.

Предложена методика формирования множества информационных элементов на основе использования терминов семантической модели и выделенных документальных описаний этих терминов.

Методика основана на формировании информационного элемента как совокупности терминов семантической модели и связанных с ними документальных описаний. Показано, что информационный элемент, как правило, объединяет в себе документальное описание не отдельного термина, а группы тесно связанных терминов.

В зависимости от особенностей структуры связей между терминами семантической модели предложено два подхода к формированию групп терминов, представляющих информационные элементы, и соответствующих им текстовых фрагментов документальных источников:

- кластеризация терминов семантической модели в соответствии с объединяющими их связями с последующим использованием терминов каждого информационного элемента как категорий для целевого аннотирования документов семантической модели ресурса с целью сбора информации, связанной с терминами информационного элемента;

- формирование информационных элементов на основе классификации выделенных на множестве терминов семантической модели структурных единиц документов.

Рассмотрены вопросы разделения множества информационных элементов на подмножества, соответствующие отдельным страницам сайта. Проведен анализ вариантов формирования страниц в соответствии с особенностями структуры связей между информационными элементами. Сформулирована задача декомпозиции множества информационных элементов на группы страниц сайта.

Приведена общая схема решения задачи формирования внешней модели \Veb-ресурса и предложены методы ее реализации с использованием ЭВМ.

В пятой главе рассмотрены принципы и методы размещения информации Ф настраницахЖе1ьресурса.Показано,нто задачаразмещения информации на страницах \Veb-pecypcoB в контексте проектирования информационной архитектуры не предполагает создания окончательного проекта страницы с учетом его художественного оформления, включая композиционные и цветовые решения. Она состоит в определении последовательности представления информационных элементов на странице ресурса, их расположения относительно верхней части страницы и друг друга в соответствии с задачами представления информации.

Рассмотрены различные подходы, используемые к размещению информации на экране дисплея при создании программного обеспечения интерфейсов. Показано, что при создании \УеЬ-интерфейсов наиболее важно обеспечить два ф аспекта: удобство пользователей определенной целевой аудитории, и активизацию интереса, желания работать с \УеЬ-ресурсом, воспринимать его информацию, так как посещение пользователем ресурса является добровольным, а не обязательным.

Рассмотрены различные способы визуального представления и размещения информации в поле экрана. На основании их анализа выработаны рекомендации по созданию визуального отображения ресурса с точки зрения его информативности.

Проведена классификация информационных элементов архитектуры сайта по функциональному назначению, информативности и способу обработки электронной информации. Рассмотрено влияние на компоновку страниц сайта технических ограничений. Показано, что конкретная реализация компоновки и Ж художественного оформления требует учета соотношения объема информации к возможному времени ожидания загрузки страницы.

Рассмотрено соотношение информационного и художественного проектирования в общей структуре проектирования \УеЬ-ресурсов.

Формализована задача создания информационной компоновки страницы ДУеЬ-ресурса, предложен метод и алгоритм ее решения.

Рассмотрены методы оценки визуального варианта размещения информации на^страшще^ипертекста ^Предложена методикаоценки,лспользующая оценки эмоционального значения выводимой информации на базе психосемантических шкал.

В шестой главе рассматриваются принципы и методы автоматизации модернизации информационной архитектуры \Veb-pecypcoB на этапе эксплуатации. Рассмотрены особенности сопровождения \Veb-pecypcoB на этапе эксплуатации, задачи модернизации и реинжиниринга информационной архитектуры \Veb-pecypcoB, типовые функции программных средств управления информационным содержанием \Veb-pecypcoB. На основе анализа и классификации систем управления информационным содержанием \УеЬ-ресурсов выделена типовая структура и определены основные компоненты систем управления информационным содержанием, показана возможность реализации задач модернизации и реинжиниринга информационной архитектуры в составе систем управления информационным содержанием.

Рассмотрены принципы информационного обеспечения принятия решений по модернизации информационной архитектуры \Veb-pecypca на основе разработанной семантической модели предметной области \Veb-pecypca.

Приведены данные о системе автоматизированного проектирования и управления информационным содержанием \УеЬ-ресурсов, разработанной в рамках диссертационной работы, а также о \¥еЬ-проектах, выполненных с ее использованием, показывающие эффективность разработанных методов и программных средств.

Научная новизна работы состоит в следующем:

1. Развита концепция и разработана формализованная модель информационной архитектуры \Veb-pecypca и основных ее компонент с позиций проектирования.

2. Разработано формализованное описание предметной области \Veb-pecypca и информационных требований пользователей.

3. Разработана методика структурного анализа и декомпозиции предметной

Щ ^области^еЬ-ресурса и^интеза на этой основе его информационной архитектуры.

4. Разработан формализованный метод компоновки основной структурной единицы гипертекста - страницы, использующий критерии эргономического проектирования \Veb-pecypcoB, что позволяет учесть взаимное влияние информационной архитектуры и ее визуального отображения средствами информационного дизайна.

5. Предложены методы оценки, обеспечивающие методическое единство оценки информационной архитектуры \Veb-pecypca на всех этапах его жизненного цикла.

6. Предложена методика развития и модернизации \Veb-pecypca на основе разработанных моделей информационной архитектуры и методов

4} автоматизированного поиска информации

7. Предложена инфологическая модель \Veb-pecypca, обеспечивающая преемственность результатов проектирования информационной архитектуры на всех этапах его жизненного цикла, и ее реализация в составе хранилища данных.

8. Разработан комплекс методик автоматизированного проектирования информационной архитектуры \Veb-pecypcoB Интернет, обеспечивающий использование ЭВМ на ранних этапах разработки.

Практическая ценность работы заключается в том, что:

- разработаны программные средства, реализующие методику автоматизированного проектирования информационной архитектуры \Veb-ресурсов Интернет.

Ж - на основе проведенных исследований современного состояния проектирования \Veb-pecypcoB Интернет, отобраны показатели, характеризующие качество ресурсов как информационных продуктов, и выработаны практические рекомендации по их использованию в процессе проектирования;

- на основе разработанной инфологической модели \Veb-pecypca создано программное обеспечение хранилища данных для хранения промежуточных и окончательных результатов проектирования информационной архитектуры;

41 ^предложеныметодикаипрограммныесредствадляпроведения структурного анализа предметной области \Veb-pecypcoB Интернет:

-разработаны программные средства компоновки страниц гипертекста на основе эргономических критериев;

Основным научным результатом диссертации является создание научно-методических основ автоматизированного проектирования \Veb-pecypcoB Интернет на основе структурно-аналитического исследования информационного пространства. Полученный результат имеет важное значение для формирования национальных информационных ресурсов, повышения их качества и востребованности отечественной и зарубежной аудиторией Интернет. Разработанная методика нашла применение в практическом проектировании Интернет-ресурсов, научных исследованиях и учебном процессе.

Обобщение и развитие концепции информационной архитектуры \Veb-ресурса, как его основной составляющей, реализующей связь между конкретной областью глобального информационного пространства и информационными интересами потребителей и владельцев ресурса, позволило создать формализованное представление информационной архитектуры \Veb-pecypca, обеспечивающее ее структурно ¿^методологически однородное информационное представление для разных этапов проектирования.

Разработана методика структурно-логического проектирования информационной архитектуры, основанная на автоматизированных процедурах анализа и декомпозиции предметной области \Veb-pecypca и синтеза ^ структурных компонент ресурса.

Разработана формализованная модель предметной области \Veb-pecypca, использующая его представление в виде семантической сети понятий, что позволило разработать методику и алгоритмы анализа информационного пространства \Veb-pecypca и его декомпозиции на множество взаимосвязанных информационных элементов, основанные на методах автоматизированного лингвистического анализа электронных документов, методах автоматической Щ классификации и технологиях интеллектуальной обработки информации.

На основе разработанного формализованного описания информационной архитектуры разработана методика оценки пользовательских характеристик проектируемого \Veb-pecypca, позволяющая проводить оценку показателей работы ресурса на ранних стадиях проектирования, что позволяет существенно улучшить качество пользовательского взаимодействия с информацией ресурса.

На основе анализа типовых схем распределения информации по страницам ресурсов и пользовательских характеристик ресурсов формализованы задачи и разработаны алгоритмы формирования информационного содержания страниц гипертекстовой структуры ресурса и информационной компоновки страниц гипертекста.

Л Разработаны методические принципы развития и модернизации информационной архитектуры ресурса на этапе его эксплуатации.

Основным практическим результатом работы является расширение и систематизация знаний о процессах информационного взаимодействия пользователей с сетью Интернет и объединение на единой методической основе широкого спектра отдельных работ, существующих в области автоматизации проектирования, сопровождения, эксплуатации и оценки \УеЬ-ресурсов.

Разработан комплекс методических, программных и информационных средств для автоматизированного проектирования, сопровождения и модернизации информационной архитектуры \Veb-pecypcoB Интернет, реализующий методику структурно-логического проектирования и ^ обеспечивающий создание эффективных, легко модернизируемых \Veb-pecypcoB, что является важным условием их востребованности аудиторией Интернет и конкурентоспособности в глобальном информационном пространстве.

Использование разработанных в диссертации научно-методических принципов и программных средств в составе системы автоматизированного проектирования \¥еЬ-ресурсов Интернет позволило сократить сроки их

Ф проектирования^ атакже улучшить пользовательские . характеристики спроектированных ресурсов, повысить вероятность обнаружения ресурса поисковыми системами и улучшить значения формальной релевантности, присваиваемой ими ресурсам, что выражается в занимаемой ресурсом позиции в списке выдачи.

Результаты диссертационной работы внедрены и продолжают внедряться в компании «Е.бой» в рамках системы автоматизированного проектирования ресурсов, а также при выполнении отдельных частных проектов. В настоящее время разработанная методика проектирования информационной архитектуры использована при проектировании и используется при сопровождении ряда проектов.

Ц Частные результаты, полученные в диссертационной работе, использованы при выполнении НИР по договорам с Минпромнаукой для реализации задач проектирования \¥еЬ-интерфейсов, анализа предметной области проектов, исследования и тематически ориентированного отбора Интернет-ресурсов.

В учебном процессе результаты работы реализованы в рамках программы переподготовки специалистов с высшим образованием по дистанционной форме обучения по программе «Дизайн и реклама в компьютерных сетях» в Центре дистанционного обучения МГИЭМ (http://dlc.miem.edu.ru). Также результаты, полученные в диссертации, используются при подготовке специалистов по вычислительной технике и Интернет-технологиям в МГИЭМ в виде конспекта лекций по курсу «Информационные системы». По результатам работы подготовлено учебное пособие для студентов специальностей «Прикладная ^ информатика» и «Информационные системы» Института информационных технологий МГУ С.

На защиту выносятся:

Формализованная модель предметной области \Veb-pecypca Интернет,

Формализованное представление информационной архитектуры \Veb-ресурса Интернет, методы и алгоритмы ее построения и использования по этапам жизненного цикла \Veb-pecypca.

Методы и алгоритмы автоматизированного проектирования информационной архитектуры \УеЬ-ресурсов Интернет.

Методика оценки характеристик проектов \Veb-pecypcoB на основе формализованного представления информационной архитектуры.

Принципы и методы информационного сопровождения и модернизации \Veb-pecypcoB Интернет на основе формализованных и информационных моделей.

Заключение диссертация на тему "Научно-методические основы автоматизации проектирования информационной архитектуры Web-ресурсов Интернет"

Выводы к главе 6.

1. Анализ задач, связанных с сопровождением \Veb-pecypca на этапе эксплуатации, показал, что изменение информационных процессов владельцев и потребителей ресурсов, а также изменения глобального информационного пространства делают необходимым периодическую модернизацию ресурса, а в некоторых случаях его реинжиниринг.

2. Для сопровождения \Veb-pecypca необходимо осуществлять информационный мониторинг и аудит ресурса.

3. Разработанные методы и средства информационного моделирования информационной архитектуры \Veb-pecypca позволяют интегрировать программные средства информационного мониторинга с программным обеспечением \Veb-pecypca, что позволяет заложить в него возможности саморазвития собственного информационного пространства.

4. В составе задач сопровождения \Veb-pecypca особое значение приобретает информационное сопровождение, связанное с обновлением, расширением и изменением содержания включенных в состав ресурса баз данных, а также информационных элементов страниц на основе информации, извлекаемой из внешних по отношению к ресурсу источников. Реализация информационного сопровождения требует интеграции с ресурсом программного обеспечения управления его информационным содержанием, а также привлечения к сопровождению ресурса информационного менеджера, осуществляющего переработку-исходной информации ллзвлечение из нее необходимых для внесения в ресурс данных.

5. Изменения ресурса, вызываемые его информационным сопровождением, накапливаясь с течением времени, могут приводить к изменениям информационного пространства ресурса, что выражается в изменении его семантической модели, и, соответственно к необходимости его модернизации или реинжиниринга.

6. В состав программного обеспечения проектирования и сопровождения \Veb-pecypcoB необходимо включение средств управления, позволяющих поддерживать одновременное существование нескольких версий, а также работать с несколькими проектами.

7. Значительную часть ПО современных \Veb-pecypcoB составляют типовые компоненты, что связано с общностью процессов потребления информации и рекламных стратегий ее представления, поэтому в состав программного обеспечения систем автоматизированного проектирования информационной архитектуры \УеЬ-ресурсов необходимо включать средства управления проектами, позволяющие поддерживать одновременное проектирование и сопровождение нескольких версий проекта, а также работать с несколькими проектами на основе единой базы типовых компонент.

8. Анализ результатов разработанных методов и средств автоматизированного проектирования информационной архитектуры на примере разработки конкретных \Veb-pecypcoB показал их пригодность и эффективность, в особенности для больших проектов.

Заключение

Основным научным результатом работы является теоретическая разработка, обобщение" "и решение важной проблемы в области автоматизированного проектирования - создание методических основ автоматизации проектирования информационной архитектуры \УеЬ-ресурсов Интернет, что будет способствовать развитию и повышению качества отечественных электронных информационных ресурсов, повышению их конкурентоспособности в глобальном информационном пространстве, а также их востребованности отечественной и зарубежной аудиторией Интернет.

В диссертационной работе получены следующие основные результаты.

1. Обобщена и развита концепция информационной архитектуры \УеЬ-ресурса, проведена системная декомпозиция \УеЬ-ресурсов как класса сложных систем, на основании которой разработана формализованная модель информационной архитектуры и ее компонент, определены критерии их выбора.

2. Разработана формализованная модель предметной области \УеЬ-ресурса, использующая его представление в виде семантической сети понятий, формируемых на основе анализа информационных задач владельцев ресурса, его целевой аудитории, конкурирующих ресурсов, информационных источников, релевантных тематике ресурса.

4. Разработана методика и алгоритмы анализа предметной области \Veb-ресурса и его декомпозиции на множество взаимосвязанных информационных элементов, основанные на методах автоматизированного лингвистического анализа электронных документов и методах автоматической классификации, используемых в технологиях интеллектуальной обработки информации.

5. Разработана методология структурно-логического проектирования информационной архитектуры, основанная на автоматизированных процедурах анализа и декомпозиции предметной области \Veb-pecypca, синтеза основных структурных компонент ресурса и инфологическом моделировании \Veb-pecypca на всех этапах его жизненного цикла, включая этап эксплуатации.

5. Разработана методика и алгоритмы формирования информационного содержания страниц гипертекстовой структуры ресурса и системы навигации.

6. Формализована задача размещения информационных элементов на Ф страницегиперхекста,разрабатаны .метод и алгоритм решения этой задачи и метод оценки качества размещения.

7. Разработана методика оценки пользовательских характеристик проектируемого \Veb-pecypca на основе предложенных в работе формализованных моделей, позволяющая проводить оценку показателей работы ресурса на ранних стадиях проектирования, что позволяет существенно улучшить качество пользовательского взаимодействия с информацией ресурса.

8. Разработаны методические принципы автоматизации модернизации информационной архитектуры ресурса на этапе его эксплуатации.

9. Разработан комплекс методических, программных и информационных средств для автоматизированного проектирования, сопровождения и модернизации информационной архитектуры \Veb-pecypcoB Интернет, реализующий методологию структурно-логического проектирования.

10. Использование разработанных в диссертации научно-методических принципов и программных средств в составе системы автоматизированного проектирования \УеЬ-ресурсов Интернет позволило сократить сроки их проектирования и улучшить пользовательские характеристики спроектированных ресурсов.

Библиография Мальцева, Светлана Валентиновна, диссертация по теме Системы автоматизации проектирования (по отраслям)

1. Аветисян Р.Д. О некоторых моделях информационного поиска. НТИ, Серия 2, Информационные процессы и системы, 1996, №4.

2. Аветисян Р.Д. Разработка и исследование механизмов динамическоговзаимодействия стратегий поиска информации. Москва, 1996. Диссертация на соискание ученой степени кандидата наук.

3. Айвазян С. А., Бухштабер В. М., Юнюков И. С., Мешалкин JI. Д. Прикладная статистика: Классификация и снижение размерности. — М.: Финансы и статистика, 1989.

4. Айзенменгер Р. Справочник HTML 3.2/4.0.

5. Андреев B.H. Психологические аспекты представления информации на экране дисплея в автоматизированных обучающих системах. — Диссертация на соискание ученой степени к.п.н., С.-П6.Д988.

6. Арестова O.H., Бабанин JI.H., Войскунский А.Е. Коммуникация в компьютерных сетях: психологические детерминанты и последствия./УВестник МГУ. Серия XIV. Психология, 1996, №4, с. 14-20

7. Бабаева Ю.Д., Войскунский А.Е. Психологические последствия информации//Психологический журнал. 1998, т.19, №1, С.89-100

8. Бархударов С.Г. и др. Русский язык. Учебник для общеобразовательных учреждений М.: Просвещение, 2003 - 208с.

9. Богданова E.JI. Информационный маркетинг. Учебное пособие. — СПб: «Альфа», 2000.- 174с.

10. Ю.Бокарев Тимофей. "Поисковые каталоги и системы как средство Интернет-рекламы". Профессиональный журнал о рекламе и маркетинге "Yes", №5, 1999.

11. Н.Борисова C.B., Сботова Т.Д. Диалоговая система имитационного моделирования. Автоматизация производства, №8, 1990, стр. 18-20.

12. Борисова C.B., Никитин В.В. Проектирование технологии обучения с применением ЭВМ. Материала V международной конференции «Применение новых технологий в образовании» 30 июня-3 июля 1994, С. 257-258.

13. З.Борисова C.B. Управление интерактивным поиском электроннойинформации. Труды Международной научно-технической конференции

14. Датчики и преобразователи информации систем измерения, контроля и управления", 1992 , С. 48-49

15. Бочаров Л.П., Леченкин А.В Леориятзероятностей^Математическаястатистика. М.: Гардарика, 1998.

16. Бунин О.В., Мальцева C.B. Реклама в Интернет: обзор технологий. Автоматизация и современные технологии. № 10, 2001.- С. 19-22.

17. Бунин О.В. Персонализация ресурса Интернет путем формирования психологического портрета посетителя. — Труды Международной студенческой школы-семинара «Новые информационные технологии», Судак, 2001.

18. П.Бухштаб Ю.А. Разработка принципов организации поиска мультимедийной информации (98-01-00441), ИПМ РАН, Москва.

19. Валовая М.Д. Азы древнейшего ремесла или тринадцать бесед о рекламе и маркетинге. М.: Нива XXI век, 1994.

20. Вудсон У., Коновер Д. Справочник по инженерной психологии для инженеров и художников-конструкторов. Под редакцией к.т.н. В.Ф. Венда. М:, "Мир", 1968.

21. Гик Дж., ван. Прикладная общая теория систем. — М.: Мир, 1981.21 .Гайдамакин H.A. Автоматизированные информационные системы, базы и банки данных. Вводный курс. Учебное пособие. М.:Гелиос, АРВ, 2002.

22. Голенский С.П., Веремьев A.B., Деграве Д.В. Осуществление доступа из глобальной сети к гипертекстовым массивам, находящимся в реляционной базе данных. Телематика'97, секция С: Информационные ресурсы компьютерных сетей.

23. Дейт К.Дж. Введение в системы баз данных.: пер с англ. 6-е изд. -К.: Диалектика, 1998

24. А.М. Дубров, B.C. Мхитарян, Л.И. Трошин. Многомерные статистические методы: Учебник. М.: Финансы и статистика, 2000

25. Дудихин В.В., Дудихина О.В. Конкурентная разведка в Интернет. Советы аналитика. М.: ДМК Пресс, 2002.

26. Дьяконов В.П. «Математическая система Maple V R3/R4/R5» «СОЛОН»1. Москва 1998.

27. Дюк В.А., Самойленко А. Д. Data Mining. Учебный курс (+CD ROM). — СПб: Питер, 2001.-368с.-28.3енкин A.A. Порождения нового-знания в человеко-машинных системах, основанных на когнитивной компьютерной графике (98-01-00339), ВЦ РАН, Москва.

28. Информационно-поисковые языки. ГОСТ 7.74-96. Межгосударственный стандарт.

29. Каймин В.А., Трубников В.А. Психолого-педагогические требования к качеству учебных программ. Вопросы психологии. 1987,№1 - С.52-54

30. Карабегов A.B., Тер-Микаэлян Т.М. Введение в язык SDL. М.: Радио и связь, 1993.-184с.

31. Киселев М., Соломатин Е. Средства добычи знаний в бизнесе и финансах. — Открытые системы, № 4, 1997, С.41—44.

32. Ковалев А„ Курдюмов И. и др. Управление проектом по созданию интернет-сайта. М.: Альпина Паблишер, 2001.

33. Козлов A.B., Мальцева C.B. Автоматическое индексирование в гипертекстах. Информационные технологии в сфере сервиса. Сборник тезисов VII-й Международной научно-практической конференции «Наука - индустрии сервиса». - М.:, 2002., С.22-24.

34. Козлов A.B., Мальцева C.B. Архитектура поисковых машин для Web-ресурсов Интернет. Автоматизация и современные технологии, №8, 2001. с.36-41.

35. Козлов A.B., Мальцева C.B. Методы повышения эффективности автоматического индексирования документов. Автоматизация и современные технологии, № 6, 2004, стр. 22-27.

36. Козлов В.А. Открытые информационные системы. М.: Финансы и статистика, 1999 . - 224с.

37. Корнеев В.В., Гареев А.Ф., Васютин C.B., Райх В.В. Базы данных. Интеллектуальная обработка информации^- М.^«Нолидж», 2000. -352 с.

38. Коутс Р., Влеймник И. Интерфейс «Человек-компьютер». /Пер. с англ. -М.: Мир,1990 501с.

39. Кофка К. Восприятие: введение в гештальттеорию. //Хрестоматия по ощущению и восприятию ./Под ред. Гиппенрейтер Ю.Б. и Михайловой М.Т. — М.: Изд. МГУ,1975.- 112с.

40. Кочаловский М.Р. Энциклопедия технологий баз данных. М.: Финансы и статистика, 2002. - 800 с.

41. Кречетов Н. Продукты для интеллектуального анализа данных. — Рынок программных средств, № 14-15, 1997, С. 32-39.

42. Круг С., Блэк Р. Веб-дизайн: Книга Стива Круга или «не заставляйте меня думать!». СПб.:Символ-Плюс, 2001.- 195 с.

43. Кульба В.В., Ковалевский С.С., Косяченко С.А., Сиротюк В.О. теоретические основы проектирования оптимальных структур распределенных баз данных. Серия «Информатизация России на пороге XXI века». М.: СИНТЕГ, 1999, 660 с.

44. КурошА.Г. "Курс высшей алгебры", Москва, "Наука", 1968

45. Леонтьев А.Н. Потребности, мотивы, эмоции. М.1971.

46. Липаев В.В. Системное проектирование сложных программных средств для информационных систем. Серия «Информатизация России на пороге XXI века» М. СИНТЕГ, 1999,224с.

47. Липаев В.В. Управление разработкой программных средств. Методы, стандарты, технология. — М.: Финансы и статистика, 1988.

48. ЛипскийВ. Комбинаторика для программистов. М.: Мир, 1988.

49. Майкевич Н.В. Исследование анализа интернет-ресурсов и реализация на этой основе мульти-агентной системы поиска информации. Переславль-Залесский, 1999. Диссертация на соискание ученой степени кандидата наук.

50. Маклаков C.B. BPwin и ERwin. CASE средства разработки информационных систем. - M.: ДИАЛОГ-МИФИ,2000.

51. Мальцева C.B. Автоматизация проектирования Web-pecypcoB Интернет. Труды-1У-^4еждународнойнаучно-технической -Конференции .«Электроника и информатика 2002», Зеленоград, МИЭТ, 19-21 ноября 2002 г., т.2, С.392.

52. Мальцева C.B. Дизайн и реклама информационных продуктов и услуг. Сборник тезисов докладов Второй международной конференции «Индустрия сервиса в XXI веке, М.:, 2000, С. 103-104.

53. Мальцева C.B. Дистанционное обучение в области Web-дизайна и Интернет-рекламы. Материалы XIII Международной конференции «Применение новых технологий в образовании». Троицк, 2002, С. 98-99

54. Мальцева C.B. Интернет-технологии информационного маркетинга и рекламы (Учебное пособие). М., Институт информационного сервиса МГУС, 2002.-136с.

55. Мальцева C.B. Информационная архитектура Web-pecypcoB Интернет и проблемы ее проектирования. Автоматизация и современные технологии. № 7 , 2002, С. 18-22.

56. Мальцева C.B. Информационное моделирование Web-pecypcoB Интернет. М.:Издательство «Глобус», 2003. - 216с.

57. Мальцева C.B. Маркетинг и реклама в Интернет. Приложение к журналу

58. Информационные технологии", №1, 2002. 24с.

59. Мальцева C.B. Организация сервисов пользователей в Интернет-ресурсах. Информационные технологии в XXI веке. Сборник тезисов Третьей Международной «Индустрии сервиса в XXI веке». — М.:, 2002, стр. 29-31.

60. Мальцева C.B. Персонализация Web-pecypcoB Интернет. Сборник тезисов Третьей межвузовской научно-практической конференции «Информационные технологии XXI века». М.:, 2002, С.42-45.

61. Мальцева C.B., Смирнов Д.Ю. Веб-сайт для холдинга. Дочерние компании и бизнес, №1, 2004 г. - с. 21-25.

62. Мальцева C.B., Смирнов Д.Ю. Система автоматизированной разработки сайтов,-подштовки-и- публикации . информации—в-Интернет. Автоматизация и современные технологии. № 8, 2002.

63. Марка Д. А., МакГоуэн К. Методология структурного анализа и проектирования. М., «Мета Технология», 1993

64. Маслоу А. Маслоу о менеджменте/ Пер. с англ. СПб.: Питер,2003416с.

65. Международные стандарты, поддерживающие жизненный цикл программных средств. М., МП «Экономика», 1996.

66. Мещеряков Е.В., Хомоненко А.Д. Публикация баз данных в Интернете. — СПб.: БХВ-Петербург, 2001

67. Морозов В.П., Тихомиров В.П., Хрусталев Е.Ю. Гипертексты в экономике. Информационная технология моделирования: Учебное пособие. М.: Финансы и статистика, 1997.-256с.

68. Некрестьянов И.С. Тематико-ориентированные методы информационного поиска. Санкт-Петербург, 2000. Диссертация на соискание ученой степени кандидата наук.

69. Нильсен Я., Тахир М. Веб-дизайн. Книга Якоба Нильсена. СПб., Символ-Плюс, 2001.

70. Новоженов Ю.В. Объектно-ориентированные технологии разработки сложных программных систем. М., 1996.

71. Павлов В.В. Автоматизация обработки документов в учреждении. — СПб.: Изд-во СПбГТУ, 2000.

72. Панащук С.А. Разработка информационных систем с использованием CASE-системы Silverun. СУБД, 1995, №3.

73. Панкратов Ф.Г., Баженов Ю.К., Серегина Т.М., Шахурдин В.Г. Рекламная деятельность. Учебник для студентов высших учебных заведений. М.: Информационно-внедренческий центр «Маркетинг», 2001.- 364 с.

74. Петренко В.Ф. Введение в экспериментальную психосемантику: исследование форм репрезентации в обыденном сознании М.: Изд. МГУ, 1983 -176с.

75. Петров JQ.K. JAM — инструментальное-средство-разработки приложений винформационных системах архитектуры «клиент/сервер», построенных на базе РСУБД.- СУБД, 1995, №3

76. Поиск и распространение информации. Термины и определения. ГОСТ 7.73-96. Межгосударственный стандарт.

77. Попов В.М., Маршавин P.A., Ляпунов С.И. Глобальный бизнес и информационные технологии, М.: Финансы и статистика, 2001.

78. Поспелов .Г.С. , Ириков В.А. Программно-целевое проектирование и управление (введение). -М.: Советское радио, 1976.

79. Предметный поиск в традиционных и нетрадиционных информационно-поисковых системах. Вып. 14, СПб.

80. Пронина Е.Е. Психологическая экспертиза рекламы. Теория и методика психотехнического анализа рекламы. М.: РИП-холдинг, 2000.

81. Романовский И.В. Алгоритмы решения экстремальных задач. М„ «Наука», 1977.

82. Росситер ДЖ., Перен Л. Реклама и продвижение товаров: Пер. с англ.-СПб.: Издательство «Питер», 2000.

83. Саймон А.Р., Стратегические технологии баз данных: менеджмент на 2000 год. Пер. с англ. — М.: Финансы и статистика, 1999,- 479 с.

84. Селютин В.А. Машинное конструирование электронных устройств. М., «Советское радио», 1997 - 384с.

85. Слейнауэр С., Экштейн Р. Справочник веб-мастера. СПб.:Символ-Плюс, 2001.-609 с.

86. Смирнов Д.Ю., Мальцева C.B. Управление содержанием Интернет-ресурсов. Автоматизация и современные технологии. № 9, 2001. с.13-16.

87. Смит П., Бэрри К., Пулфорд А. Коммуникации стратегического маркетинга. Учебное пособие. Пер. с англ. Под ред. проф. Л.Ф. Никулина.

88. М.-ЮНИТИ-ДАНА, 2001.- 415с.

89. Соколов E.H., Измайлов Ч.А., Загородная B.JI. Многомерное шкалирование знаковых конфигураций (перцептивное пространство знаковых конфигураций) / Измерение психических характеристик человека-оператора, Саратов, 1986, С. 140-153.

90. Спирли Эрик. Корпоративные хранилища данных. Планирование, разработка, реализация. Том 1.: Пер. с англ. М., Издательский дом «Вильяме», 2001.- 400с.

91. Тарлонов З.К. Методы и принципы лингвистического анализа. Учебное пособие для студентов университетов и пединститутов, 1995 192 с.

92. Тиори Т., Фрай Дж. Проектирование структур баз данных: В 2-х кн. Пер. с англ. М.: Мир, 1985. - 287с.

93. Успенский И.В. Интернет как инструмент маркетинга.- СПб.: БХВ -Санкт-Петербург, 1999.

94. Уткин Э.А., Кочеткова А.И. Рекламное дело. — М.: Ассоциация авторов и издателей «Тандем». Издательство ЭКМОС, 1997.

95. Уэллс У., Бернет Дж, Мориарти С. Реклама: принципы и практика. Пер. с англ. СПб.: Издательство «Питер», 1999.

96. Файзуллин А.З. Разработка и исследование генетических методов размещения двумерных геометрических объектов. Диссертация на соискание ученой степени к.т.н. - Таганрог, 1996г.

97. Феофанов О. Реклама. Новые технологии в России. — СПб.: Издательство «Питер». 2000 384с.

98. Фольмут Х.-Й. Инструменты контроллинга от А до Я: Пер. с нем./Под ред. и с предисл. M.JI. Лукашевича и E.H. Тихоненковой. М.: Финансы и статистика. 1998 - 288с.

99. Хэллер Дэвид, Хэллер Дороти. Мультимедийные презентации в бизнесе. Под ред. В.Р.Гинзбурга. K.:BHV, 1997 -272с.

100. Черемных C.B., Семенов И.О., Ручин B.C. структурный анализ систем: IDEF-технологии. — М.: Финансы и статистика, 2001. 208 с.

101. Цаленко М.Ш. Моделирование семантики в базах данных. М.: Наука. Гл. ред. физ-мат. лит., 1989. - 288 с.

102. Цикритизис Д., Лоховски Ф. Модели данных. — М.: Финансы и статистика, 1985. 344с.

103. Шарма В., Шарма Р. Разработка Web-серверов для электронной коммерции. Комплексный подход.: Пер. с англ. Уч. пос. — М.: Издательский дом «Вильяме», 2001. 400с.

104. Шлеер С., Меллор С. Объектно-ориентированный анализ: моделирование мира в состояниях. Киев, «Диалектика», 1993.

105. Энджел Д., Блэкуэлл Р., Ниниард П. Поведение потребителей. С.-Пб.: Издательство «Питер» 2000.

106. Ядов В.А. Стратегия социологического исследования. Описание, объяснение, понимание социальной реальности. — М. Академкнига, Добросвет, 2003 г.

107. Якубайтис Э.А. Информационные сети и системы. Справочная книга. — М.: Финансы и статистика, 1996.- 368 с.

108. Яргер Р., Риз Дж., Кинг Т. MySQL и mSQL. Базы данных для небольших предприятий и Интернета. СПб.:Символ-Плюс, 2000.

109. Allen R.B., Obry P., Littman M. An interface for navigating clustered document sets returned by queries. In Proceedings of the ACM Conference on Organizational Computing Systems. Pp 166-171, 1993.

110. Apple Web Design Guide, December, 1996 Revision, © Apple Computer,1.c.

111. Arestova O., Babanin L., Voiskounsky A. Psychological research of computer mediated communication in Russia // Behaviour & Information Technology. 1999. Vol 18(2), pp.141-147.

112. Baezo-Yates R., Ribeiro-Neto B. Modern Informational Retrieval. ACM Press Addison Wesley, 1999.

113. Barker R. CASE-Method. Entity-Relationship Modelling. Copyright Oracle Corporation UK Limited. Addison-Wesley Publishing Co., 1990.

114. Borisova S.V. Electronic Access Systems For Integrate Educational Medium . Proceedings of Fist International Conference On Distance Education in Russia "Distance Learning and New Technologies In Education" Moscow, 5-8 July, 1994, p234..r

115. Chun T.Y. World Wide Web Robots: An Overview. Online&CD-ROM Review, 1999, Vol. 23,No3.

116. Constantine Mary, Lockwood Lucy. Software for Use: A Practical Guide to the Models and Methods of Usage-Centered Design. New York: Addison-Wesley, 1999.

117. Cook, Nancy J. Varieties of Knowledge Elicitation Techniques," International Journal of Human-Computer Studies, 41, 1994, pp. 801-849.

118. Croft. W. B. Organizing and searching large files of documents. Ph.D. Thesis. University of Cambridge, October 1978.

119. DATARUN Concepts. Computer Systems Advisers Research Ltd., 1994

120. Duda Richard O.,. Hart Peter E. and Stork David G. Pattern Classification (2nd ed.) John Wiley&Sons, Inc. 1998. (http://cmp.felk.cvut.cz)

121. Evaluating the intelligence in dialog systems // International Journal of Man-Machine Studies. 1988,28,№2-3 - pp. 139-173.

122. Garrett J.J. The Elements of User Experience: User-Centered Design for the Web, AIGA New Riders

123. Hiltz R.S. & Turoff M. To Network Nation. Human Communication via Computer. Reading, Mass: Addison-Wesley,1978.

124. Information Architecture for the World Wide Web Louis Rosenfeld, Peter Morville O'Reilly ¿¿Associates; ISBN: 1565922824, 1st edition, March, 1998.

125. Katz J, Aspden Ph. Motives, Hurdles, Dropouts. // Communications of the ACM, 1997,Vol 40(4), pp. 98-102.

126. Keeker, Kevin. Improving Web-Site Usability and Appeal Guidelines Compiled by MSN Usability Research, July 24, 1997.

127. Knowledge Discovery Through Data Mining: What Is Knowledge Discovery? — Tandem Computers Inc., 1996.

128. Manning, Harley and McCartny, John C. Why most Web-sites fail. The Forrester Report, Sept., 1998.

129. Mayhew, Deborah J. The Usability Engineering Lifecycle: A Practitioner's Handbook For User Interface Design. San Francisco: Morgan Kaufmann, 1999.

130. Nelson, T.N. A file structure for the complex, the changing and the indeterminate// in: ACM 20th National Conference Proceedings, Clevelend, Ohio, 1965.

131. Nielsen Jakob, Usability Engineering. Boston, AP Professional, 1993

132. PVCS Tracker. Use's Guide.

133. Reiss Eric L. Practical Information Architecture: A Hands-On Approach to Structuring Successful Websites Addison Wesley Pub. Co; ISBN:0201725908; 1st edition (Desember 15,2000).

134. Rijsbergen C. J. van, Information Retrieval, Butterworths, London, 2nd ed.,1979.

135. Rubin, Jeffrey. Handbook of Usability Testing: How to Plan, Design and Conduct Effective Tests. New York: John Wiley & Sons, 1994.

136. Salton G. Automatic Text Processing The Analysis Transformation and Retrieval of Information by Computer. Addison-Wesley: Reading, MA, 1989, pp275-309.

137. Salton G., Singhal A., Mitra M., Buckley C. Automatic text decomposition and summarization. Informational Processing&Management, 33(2), 1997, pp 193-208.

138. Sanjay Madria, Sourav S. Bhowmick. "Research issues in Web Data Mining." Data Warehousing and Knowledge Discovery, 1999, pp. 303-312.

139. SE Companion Installation and Administration Manual. SECA Inc., 1995.

140. Smith, Sharon. A Method for Evaluating the Organization of Content of Web Site. Common Ground, 8,No.2, May, 1998, pp.30-33.

141. Tham Yoke Chun. World Wide Web Robots: An Overview. Online & CD

142. ROM Review, 1999, Vol. 23, No.3.

143. Westmount I-CASE User Mannel. Westmount Technology B.V., Netherlands, 1994.

144. Wiegers, Karl E. Software Requirements, Microsoft Press, 1999.

145. Wurman, Richard Saul; Bradford, Peter; eds. Information Architects. Zurich, Switzerland: Graphis Press, 1996 ISBN:3-85709-458-3.

146. Jittp;//www,arton.ru Сайт компании Артон-консалтинг213. http:^ooks.kulichki.ru/data/base/basl/index.htm Учебное пособие «Основы проектирования реляционных баз данных»