автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.16, диссертация на тему:Исследование и разработка систем извлечения распределенной полнотекстовой информации для корпоративных вычислительных сетей
Оглавление автор диссертации — кандидата технических наук Морохин, Дмитрий Витальевич
СПИСОК УСЛОВНЫХ ОБОЗНАЧЕНИЙ.
ВВЕДЕНИЕ.
ГЛАВА I. АНАЛИЗ МЕТОДОВ ПОВЫШЕНИЯ ЭФФЕКТИВНОСТИ СИСТЕМ ОБРАБОТКИ ДОКУМЕНТОВ.
1.1. Основные характеристики систем извлечения информации.
1.2. Формализованное описание системы извлечения информации.
1.3. Структурные особенности систем поиска документов.
1.4. Способы повышения производительности информационно-поисковых систем.
1.4.1. Методы увеличения полноты поиска.
1.4.2. Методы улучшения точности поиска.
1.5. Задачи исследований в процессе выполнения диссертационной работы.
Выводы к главе 1.
Глава II. ИССЛЕДОВАНИЕ АЛГОРИТМОВ И ОПЕРАЦИЙ ОБРАБОТКИ ДОКУМЕНТАЛЬНОЙ ИНФОРМАЦИИ.
2.1. Алгоритмы функционирования системы извлечения информации.
2.1.1. Алгоритм построения служебных таблиц.
2.1.2. Алгоритм обработки запроса.
2.2. Структуры представления документальных БД в памяти ЭВМ.
2.2.1. Множество индексных таблиц.
2.2.2. Множество запросов.
2.2.3. Количественная оценка исходного множества данных.
2.3. Формальное представление операций над данными СИИ.
2.4. Оценка способов повышения эффективности алгоритмов извлечения информации на основных этапах.
2.4.1. Кластерные методы.
2.4.2. Повышение качества обработки запроса.
Выводы к главе 2.
Глава III. РАЗРАБОТКА ПРИНЦИПОВ ОРГАНИЗАЦИИ СИСТЕМЫ ПОИСКА ДОКУМЕНТОВ.
3.1. Модифицированный метод организации данных.
3.1.1. Модифицированный алгоритм кластеризации.
3.1.2. Повышение точности поиска.
3.1.3. Алгоритм построения индексных таблиц.
3.2. Метод классификации запросов.
3.3. Оценка эффективности модифицированного метода организации данных.
3.3.1. Определение эффективности алгоритма обработки запроса.
3.3.2. Определение эффективности алгоритма кластеризации.
3.4. Сравнительный анализ методов подготовки данных и обработки запросов.
Выводы к главе 3.
Глава IV. МОДЕЛИРОВАНИЕ СИСТЕМЫ ОБРАБОТКИ ДОКУМЕНТАЛЬНОЙ И ЕЕ АДАПТАЦИЯ ДЛЯ ГЛОБАЛЬНЫХ ВЫЧИСЛИТЕЛЬНЫХ СЕТЕЙ.
4.1. Описание системы моделирования.
4.2. Функциональные возможности системы моделирования.
4.2.1. Подсистема построения словаря терминов.
4.2.2. Подсистема построения индекса и кластеризации.
4.2.3. Подсистема поиска по запросу.
4.3. Результаты исследования имитационной модели.
4.4. Адаптация системы извлечения информации для применения в глобальных вычислительных сетях.
4.4.1. Структура информационного массива.
4.4.2. Алгоритмы операций.
4.4.3. Анализ операций над базой метаданных.
4.4.4. Синтез интеллектуального модуля памяти.
Выводы к главе 4.
Введение 1999 год, диссертация по информатике, вычислительной технике и управлению, Морохин, Дмитрий Витальевич
Среди различных задач обработки информации, связанных с использованием ЭВМ, существует особый класс, для которого термин «информация» принимает непосредственный смысл зарегистрированных сведений или данных. Обрабатываемыми элементами в этом случае могут быть документы и книги, звуковая и графическая информация и т.п. Именно это более ограниченное представление об информации привело к созданию информационно-поисковых систем (ИПС), занимающихся процессами сбора, анализа, классификации, хранения, поиска, передачи и распространения информации.
В связи с тем, что в настоящее время термин «информационно-поисковая система» имеет широкий смысл (от понятий систем с поиском по справочникам до понятий информационных порталов, в которых совмещены различные поисковые механизмы и множество сервисных функций) [2,6,10,13,15,16,27,41,55, 57,69,71,86,91,92,98,100,103], в диссертации используется термин «система извлечения информации» (СИИ), под которой понимается система, выполняющая поиск информации с помощью предварительно сформированного аппарата (например, индекса).
Несмотря на применение ЭВМ в течение длительного времени для хранения и обработки информации, а также для ее поиска, существующие системы не всегда полностью удовлетворяют требованиям пользователей. С одной стороны, это обусловлено широким распространением вычислительной техники, и, как следствие, понижением среднего уровня технической грамотности пользователей. Другая причина - в несовершенстве используемых аппаратных средств и программных решений. Вопросу повышения эффективности СИИ было посвящено множество работ [2,4,6,9,10,15,18,21,24,26,34,41,42,43,45,49,54,57,60, 67,74,85,97,98,100,102]. Однако авторы большинства современных публикаций рассматривали эти вопросы в основном только на уровне усовершенствования параметров простейших методов, не используя потенциально более эффективные методы, предложенные еще в 80-х годах [34,54,58,59,67,74,95,101,103].
Одним из результатов развития вычислительной техники в настоящее время стало формирование глобальной информационной среды из десятков миллионов компьютеров. В условиях быстрого расширения сферы применения компьютеров, роста количества пользователей-непрограммистов становится все более важным развитие доступных и эффективных методов и средств извлечения данных из распределенных хранилищ информации. По мере роста количества документов, доступных для поиска в вычислительных сетях различной сложности, растет и область применения СИИ
5,13,14,19,20,23,24,25,30,35,46,55,58,60,64,66,69,72,74,80,86,93,95,96].
Проблемы организации систем извлечения информации определяются конфигурацией вычислительных систем. Для глобальных сетей характерна обработка массивов информации объемом в сотни и тысячи терабайт. Кроме преимуществ, выражающихся в доступности огромного количества данных, это обстоятельство определяет и недостатки. Можно выделить три основных класса таких недостатков, вызванных большой загрузкой систем поиска и требованием обработки запросов пользователей в реальном масштабе времени. Во-первых, вызывает большие сложности применение высокоэффективных алгоритмов организации данных и вспомогательных структур СИИ, имеющих, как правило, относительно высокую трудоемкость; во-вторых, затруднительно практическое использование качественных, но трудоемких методов поиска информации; в-третьих, практически не применяется группировка запросов по классам, которая могла бы повысить универсальность поисковой системы.
Кроме того, в большинстве существующих систем производится обработка не полных текстов документов, а только заголовков и специально составляемых аннотаций документов.
В связи с повсеместным внедрением интранет технологий задача извлечения информации возникает также в сетях корпоративного типа и в локальных сетях. Под сетью корпоративного типа в работе понимается совокупность локальных сетей, имеющих суммарный объем не более Ю10 байт. Классификация вычислительных сетей по объему приведена в [56,66,82,94,98]. Существующие системы извлечения информации для таких сетей ничем не отличаются от систем, работающих в глобальных сетях, однако, в корпоративных сетях объем информации на один-два порядка меньше, что дает возможность при сохранении времени на поиск использовать более эффективные методы организации данных, обработки запросов и поиска информации.
Любая система извлечения информации должна обеспечивать поиск информации, релевантной (соответствующей) информационным потребностям пользователя. В связи с этим, выделяются следующие области использования систем извлечения информации [86]:
- поиск информации в глобальных сетях;
- работа с системами документооборота крупных предприятий и фирм;
- обеспечение эффективной обработки различного рода данных на уровне рабочих групп;
- поиск документов на персональном компьютере.
Существующие поисковые системы разного уровня имеют типовую структуру [85] и отличаются только объемами обрабатываемой информации, а также требованиями пользователей к получаемым данным.
В современных условиях при повышении требований к эффективности СИИ, особенно работающих в реальном масштабе времени, становится очевидной необходимость создания адаптивного программно-аппаратного обеспечения систем, работа которого будет зависеть от объема рабочей информации. Например, при уменьшении объема рабочей информации, а, следовательно, и объема рабочих файлов, появляется возможность более полной обработки данных и улучшения основных параметров системы поиска, что невозможно в более масштабных системах, в связи с большой загруженностью обрабатывающей части системы, а также проблемой старения информации.
В диссертации анализируются существующие программно-аппаратные решения организации систем извлечения информации; исследуются способы повышения эффективности обработки информации и взаимодействия системы с пользователем; исследуются алгоритмы извлечения информации на всех эта9 пах, в частности, на этапах формирования индексных таблиц и поиска данных с целью их систематизации и оценки возможности реализации; исследуются возможности эффективной аппаратной поддержки операций извлечения информации.
Заключение диссертация на тему "Исследование и разработка систем извлечения распределенной полнотекстовой информации для корпоративных вычислительных сетей"
Основные результаты диссертационной работы заключаются в следующем.
1) Проведено исследование методов и алгоритмов, используемых в существующих системах извлечения информации и на его основе разработан модифицированный метод организации данных, применение которого дает возможность использовать кластерную организацию информации для крупных вычислительных сетей за счет сокращения ресурсов на выполнение операций подготовки данных.
2) Проведен анализ алгоритмов этапа подготовки данных и разработан метод увеличения полноты поиска на данном этапе за счет изменения набора ключевых терминов, отличающийся снижением требований к объему памяти
3) На основе исследования этапа поиска информации в системах извлечения информации предложен способ анализа полнотекстовых запросов, использующих многовариантную обработку запросов и обеспечивающий повышение полноты и точности поиска.
4) На основе анализа задачи обработки информации в корпоративных сетях и определения операционного базиса в элементарных операциях проведен расчет основной трудоемкости операций и алгоритмов подготовки данных и обработки запросов.
5) На базе исследования алгоритмов формирования индексных таблиц и поиска данных проведена оценка способов повышения эффективности извлечения информации в корпоративных сетях.
6) Проведено имитационное моделирование основных этапов извлечения информации подтвердившее основные теоретические результаты;
7) Предложен принцип организации системы аппаратной поддержки основных операций извлечения информации, позволяющий повысить производительность СИИ за счет переноса значительной части операций обработки в специализированную память и расширить область применения разработанных методов.
114
Результаты исследований докладывались на конференциях:
- ежегодных научно-технических конференциях профессорско-преподавательского состава МарГТУ, Йошкар-Ола, 1997, 1998 гг.;
- ежегодной НТК студентов и аспирантов вузов России «Радиоэлектроника и электротехника в народном хозяйстве», Москва, 1998, 1999 гг.;
- постоянно действующей Всероссийской научной конференции «Вторые Вавиловские чтения»,- Йошкар-Ола, 1997 г.;
- V Международной конференции по информационным сетям и системам, ГУТ,- Санкт-Петербург, 1998 г.;
- 4-й всероссийской научно-технической конференции студентов, молодых ученых и специалистов "Новые информационные технологии в научных исследованиях и в образовании", - Рязань, РГРА, 1999 г.
ЗАКЛЮЧЕНИЕ
Библиография Морохин, Дмитрий Витальевич, диссертация по теме Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
1. Антонюк Б.Д. Информационные системы в управлении,- М.: Радио и связь, 1986,- 240 с.
2. Апреснян Ю.Д. Идеи и методы современной структурной лингвистики,- М.: Радио и связь, 1966,- 221 с.
3. Белоногов Г.Г., Кузнецов Б.А. Языковые средства автоматизированных информационных систем,- М.: Наука, 1983,- 288 с.
4. Базы данных: достижения и перспективы на пороге 21-го столетия/ Под ред. Зильбершатца А., Стоунбрейкера М., Ульмана Дж./ СУБД,- 1996 -№3,- С. 103-117.
5. Баллоу М.С. Поиск текста в больших массивах документов./ Computer Wold.-М- №33, 1994,- С.23-28.
6. Виноград Т. Программа, понимающая естественный язык,- М.: Мир, 1976.-295 с.
7. Волченская Т.В., Князьков B.C. и др. Аппаратная поддержка информационно-поисковых операций/ Тезисы к док. ШМ Всесоюз. НТК «Системы БД и БЗ» сек.2. «Общесистемные программные средства СУБД и СУБЗ»,- Калинин, 1989,- С.37-60.
8. Волченская Т.В., Князьков B.C. и др. Информационно-поисковая система с реляционной моделью БД/ Тезисы к док. ШМ Всесоюз. НТК «Системы
9. БД и БЗ» сек.2. «Общесистемные программные средства СУБД и СУБЗ», Калинин, 1989,-С. 61-75.
10. Гладкий A.B. Синтаксические структуры естественного языка в автоматизированных системах обучения,- М.: Наука, 1985,- 143 с.
11. Гладкий A.B., Мельчук И.А. Элементы математической лингвистики. -М.: Наука, 1969,- 192 с.
12. Горелов И.Н. Разговор с компьютером: Психо-лингвистический аспект проблемы,- М.: Наука, Гл. ред. физ.-мат. лит., 1987,- 256 с.
13. Гэффин А. "Пауки" воюют с хаосом и беспорядком./Сети, 1996,- №8.
14. Девони К. Механизмы поиска в intranet набирают обороты./ Сети, 1996,- №7.
15. Дейт К.Дж. Введение в системы баз данных. М., 1980.
16. Денинг В., Эссиг Г., Маас С. Диалоговые системы <человек-ЭВМ>. Адаптация к требованиям пользователя./Пер. с англ.- М.: Мир, 1984,- 112 с. 17.
17. Диалоговые системы в управлении, проектировании, обучении: Темат. сб.- М.: Изд-во Моск. энергет. ин-та, 1980,- 94 с.
18. Дракин В.И., Попов Э.В., Преображенский А.Б. Общение конечных пользователей с системами обработки данных,- М.: Радио и связь, 1988,- 288 с.
19. Ефимов Е.И. Решатели интеллектуальных задач,- М.: Наука, Главная редакция физико-математической лит-ры, 1982,- 320 с.
20. Зиглер К. Методы проектирования программных систем./ Пер. с англ.-М.: Мир, 1985.-328 с.
21. Искусственный интеллект в 3-х кн. Кн.2. Модели и методы: Справочник/Под ред. Поспелова Д.А,- М.: Радио и связь, 1990,-304 с.
22. Искусственный интеллект в 3-х кн. Кн.З. Программные и аппаратные средства/ Под ред. Захарова В.Н., Хорошевского В.Ф.- М.: Радио и связь, 1990.-368 с.
23. Калиниченко JI.A. Методы и средства интеграции неоднородных баз данных.- М.: Наука, 1983,- 242 с.
24. Калиниченко JI.A., Рывкин В.М. Машины баз данных и знаний.-М.:Наука. Гл. ред. физ.-мат. лит., 1990,- 226 с.
25. Карташева Е. Интеллектуальные поисковые системы Excalibur./ Сети.-1997,-№6.
26. Клейнен Дж. Статистические методы в имитационном моделировании: Пер. с англ.- вып.1,- М.: Статистика, 1978,- 221 с.
27. Кнут Д. Искусство программирования для ЭВМ. Т.З. Сортировка и поиск,- М.: Мир, 1978.
28. Когаловский М.Р. Технология баз данных на персональных ЭВМ,- М.: Финансы и статистика, 1992,- 224 с.
29. Кохонен Т. Ассоциативная память: Пер. с англ.- М.: Мир, 1980,239с.
30. Кузнецов О.П., Адельсон-Вельский Г.М. Дискретная математика для инженера,- 2-е изд. перераб. и доп.- М.: Энергоатомиздат,1988,- 480с.
31. Ладыженский Г.М. Системы управления базами данных коротко о главном/ СУБД, 1995. №3,- С.128-136.
32. Ланкастер Ф.У. Информационно-поисковые системы.: Пер. с англ.-М.: Мир, 1972,-534 с.
33. Леннон, Дж., Маурер, Г. Системы гипермедиа: введение /Программирование,- № 2, 1995,- С. 48-60.
34. Ливчак A.B. Полнота языков запросов.// Программирование, 1993,-№2. С. 31-42.
35. Логический подход к искусственному интеллекту: от классической логики к логическому программированию: Пер. с франц. / Тейз А., Грибомон П., Луи Ж. и др. М.: Мир, 1990. - 432 с.
36. Мальковский М.Г. Диалог с системой искусственного интеллекта.-М.: Изд-во МГУ, 1985,- 213 с.
37. Машинный фонд русского языка: Идеи и суждения,- М.: Наука, 1986.240 с.
38. Мейер Д. Теория реляционных баз данных,- М.: Мир, 1971,- 364 с.
39. Меткалф Б. AltaVista и ее продукты для Internet./ Сети., 1997,- №1.
40. Моделирование языковой деятельности в интеллектуальных системах./ Под ред. А.Е. Кибрика и A.C. Нариньяни. С предисл. А.П. Ершова. М.: Наука. Гл. ред. физ.-мат. лит., 1987. - 280 с.
41. Морохин Д.В., Костромина Н.В. Организация локальной системы поиска документов/ Тезисы докладов ежегодной научно-технической конференции студентов и аспирантов вузов России,- Москва, МЭИ, 1999,- С.311-312.
42. Морохин Д.В., Костромина Н.В. Оценка сложности задачи обработки баз данных документов. Марийск. политехи, институт,- Йошкар-Ола, 1999,- 10 с. Библиогр.: 2 назв.- Рус,- Деп. в ВИНИТИ 13.04.99, N 1171-В99.
43. Морохин Д.В. Методы повышения эффективности обработки распределенных документальных баз данных в корпоративных сетях Марийск. политехи. иститут,- Йошкар-Ола, 1999,- 15 с. Библиогр.: 1 назв.- Рус,- Деп. в ВИНИТИ 13.04.99, N 1172-В99.
44. Морохин Д.В. Применение методов искусственного интеллекта в человеко-машинных системах/ Материалы третьего международного симпозиума "Экология человека" Казань,- КГУ, 1997,- С. 129-130.
45. Морохин Д.В. Применение методов обработки знаний в системах подготовки документов/ Материалы научно-технической конференции, посвященной 65-летию МарГТУ,- Йошкар-Ола, МарГТУ, 1997,- С.95-96.
46. Морохин Д.В. Применение методов поиска текстовой информации. /Материалы Всероссийской постоянно действующей научной конференции «Вавиловские чтения»,- Йошкар-Ола, 1997,- С.89-90.
47. Морохин Д.В., Костромина Н.В. Структура системы подготовки документов./ Труды V Международной конференции по информационным сетям и системам,- ГУТ,- Санкт-Петербург, 1998,- С.375-379.
48. Морохин Д.В. Формальное представление операций обработки полнотекстовых документов./ Тр. науч. конф. по итогам науч.-исслед. работ МарГТУ. Секция 9. Подсекция 9.3 Вычислительные машины, системы комплексы и сети,- Йошкар-Ола, 1998,- С.23-27
49. Нагао М., Катаяма Т., Усмура С. Структуры и базы данных,- М.: Мир, 1986,- 198 с.
50. Налимов В.В. Вероятностная модель языка. М.: Мысль, 1979.
51. Налимов В.В. Теория эксперимента,- М.: Наука, Гл. ред. физ.-мат. лит., 1971. -208 с.
52. Никитин П.И. Автоматизированные системы обработки и поиска документальной информации: -М.: Статистика, 1977,- 136с.
53. Новиков Б.А. Системы хранения БД и знаний/ Программирование.-1993.-N2. -С.3-30.
54. Норенков И.П., Трудоношин В.А. Телекоммуникационные технологии и сети,- М.: Изд-во МГТУ им Н.Э. Баумана, 1998,- 232с.
55. Озкарахан Э. Машины баз данных и управление базами данных.: Пер. с англ.- М.: Мир, 1989,- 696 с.
56. Осуга С. Обработка знаний./ Пер. с япон,- М.: Мир, 1989,- 293 с.
57. Попов И.И. Оценка и оптимизация информационных систем М.: МИФИ, 1981.
58. Поспелов Г.С., Поспелов Д.А. Искусственный интеллект прикладные системы,- М.: Знание, 1985,- 48 с.
59. Поспелов Д.А. Логико-лингвистические модели в системах управления,- М.: Энергоатомиздат, 1981.-231 с.
60. Поспелов Д.А. Разработка формальной модели естественного языка / Под ред. A.C. Нариньяни,- Новосибирск: ВУ СО АН СССР, 1981.
61. Прангишвили И.В. Проблемы расширения возможности восприятия зрительных, слуховых и мыслительных образов./ Приборы и системы управления,-№ 8, 1995.-С.5-11.
62. Прангишвили И.В. Проблемы управления сложными крупномасштабными процессами./ Приборы и системы управления,- № 6, 1996,- С.1-6.
63. Представление и использование знаний.: Пер. с япон./ Под ред. X. Уэно, М. Исидзука,- М.: Мир, 1989,- 220с.
64. Проничева JI.B. Сервер-технология для локальных вычислительных сетей и распределенных бах данных/ ИВ,- ТЗР, 1992.- №3/4,- С. 3-11.
65. Решетников В.Н. Алгебраическая теория информационного поиска. Программирование.- №3, 1979,- с.68-73.
66. Ричардсон Р. Найди то, не знаю что./ LAN.- № 3, 1998.
67. Сахаров A.A. Концепции построения и реализации информационных систем, ориентированных на анализ данных/ СУБД,- N4, 1996,- С.55-70.
68. Свириденко С.С. Современные информационные технологии,- М.: Радио и связь, 1989,- 302 с.
69. Сервер Oracle: текущее состояние/ Сиколенко В.В.// СУБД,- 19971.
70. Симоне Дж. ЭВМ пятого поколения: компьютеры 90-х годов: Пер. с англ.- М.: Финансы и статистика. 1985,- 173 с.
71. Советов Б.Я., Яковлев С.А., Моделирование систем: учебник для вузов по спец. «Автоматизированные системы обработки информации и упр.». -2-изд. Перераб. и доп.- М.: Высш. шк., 1998,- 319 с.
72. Солтон. Дж. Динамические библиотечно-информационные системы. Пер. с англ.- М.: Мир, 1979,- 559с.
73. Тиори Т., Фрай Дж. Проектирование структур баз данных. / В 2-х томах,- М.: Мир, 1985. Т.2.- 287 с.
74. Тыугу Э.Х. Концептуальное программирование,- М.: Наука, 1984.256 с.
75. Тюрин Ю.Н., Макаров А.А . Анализ данных на компьютере/ Под ред. В.Э.Фигурнова.- М.: ИНФРА-М, Финансы и статистика, 1995 384с.
76. Ульман Дж. Основы систем баз данных,- М.: Финансы и статистика, 1983.- 334 с.
77. Уэлдон JI.-Дж. Администрирование баз данных,- М.: Финансы и статистика, 1984,- 207 с.
78. Фокс Дж. Программное обеспечение и его разработка: Пер. с англ -М.: Мир, 1985.- 368 с.
79. Хелд Г. Иголка в стоге сена./ LAN.- 1998,- № 2.
80. Хершбергер С. Что такое интрасеть / Мир Internet, № 3,1998,- С.42-50.
81. Хомский Н. Аспекты теории синтаксиса./ Пер. с англ. Под ред. и с предисл. В.А. Звегинцева,- М.: Изд-во Моск. ун-та, 1972.
82. Хомский Н. Язык и мышление./ Пер. с англ. Б.Ю. Городецкого. Под ред. В.В. Раскина. С предисл. В.А. Звегинцева.- М.: Изд-во Моск. ун-та, 1972.
83. Храмцов П. Информационно-поисковые системы Internet/ Открытые системы,- 1996,- № 3(17).- С.46-49.
84. Храмцов П. Моделирование и анализ работы информационно-поисковых систем Internet./ Открытые Системы,- 1996. № 6.
85. Хубка В. Теория технических систем,- М.: Мир, 1987,- 208 с.
86. Цикритзис Д., Лоховски Ф. Модели данных,- М.: Финансы и статистика, 1988,- 344 с.
87. Четвериков В.Н., Ревунков Г.И., Самохвалов Э.Н. Базы и банки данных,- М.: Высшая школа, 1987,- 248 с.
88. Чибисов А. Поисковые возможности Excalibur RetrievalWare./ Открытые Системы, 1996. № 5.
89. Шлесинджер Л. Вызывая все поисковые механизмы./Сети, 1997,- №6.
90. Шэннон Р.Ю. Имитационное моделирование систем искусство и наука,- М.: Мир, 1978.- 418 с.
91. ЭВМ пятого поколения: Концепции, проблемы, перспективы/ Под ред. Мотоока Т.; Пер. с англ. М.: Финансы и статистика, 1984.- 110 с.
92. Якубайтис Э.А. Архитектура вычислительных сетей,- М.: Статистика, 1980.-279 с.
93. Bartschi M. An Owerview of Information Retrieval Subjects. IEEE Computer, #5, 1985.
94. Buckley C. Implementation of the SMART Information Retrieval System. Technical Report 85-686, Cornell University (1985).
95. Furnas G.W., Landauer Т.К., Gomez L.M., Dumais S.T. Statistical Semantic: Analysis of the Potential Performance of Key-Word Information Systems. Bell System Technical Journal, 1983, 62(6), 1753-1806.
96. Kahle В., Medlar A. An Information System for Corporate Users: Wide Area Information Servers. Technical Report TMC-199, Thinking Machines, Inc., April 1991.
97. Koster M. ALL WEB: Archie-like Indexing in the Web. Computer Networks and ISDN Systems, 27(2), 1994, p.175-182.
98. Norault T., McGill M., Koll M.B. A Performance Evaluation of Similarly Measures, Document Term Weighting Schemes and Representations in Boolean Environment, Information Retrieval Search. R.N. Oddy et all., eds, Butterworth, London, 1981, p.57-76.
99. Yu C. T., Salton G., Lam K. Term Weighting in Information Retrieval Using the Term Precession Model. Communication ACM, V.29, 1982, p.152-170.
100. Yu С. T., Salton G. Effective Information Retrieval Using Term Accuracy. Communication ACM, Y.20, #3, p. 135-142.
101. Yuwono В., Lee D. Search and Ranking Algorithms for Locating Resources on WWW. In Proceedings of the Forth International Conference on the World Wide Web, New York, November, 1995.7 V f.X 1Л*.'' <'
102. Профессор, д.т.н. Лебедев E.K. J Доцент, к.т.н. Мясников В.И. Доцент, к.т.н. Власов A.A.подписьподпись
-
Похожие работы
- Математическое и программное обеспечение полнотекстового поиска в базах данных на основе концептуального моделирования
- Разработка технологии, математических моделей и программных средств организации смешанного поиска в базах полнотекстовых документов
- Исследование и разработка методов и моделей поиска адекватной информации в полнотекстовых базах данных
- Автоматизированная система смысловой обработки текстов при создании электронных фондов библиотеки
- Разработка метода автоматического формирования рубрикатора полнотекстовых документов
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность