автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.17, диссертация на тему:Разработка модели и метода структурирования текста с целью его идентификации
Оглавление автор диссертации — кандидата технических наук Панкратова, Анна Зурабовна
Введение.
Глава I. Автоматизация анализа структуры текста: обзор современного состояния
1.1. Текст и перспективы его автоматического анализа.
1.2. Лексика как структурное образование.
1.3. Синтаксические модели предложения.
1.4.Анализ структурной организации текста.
1. 5 . Постановка задачи.
Выводы.
Глава II. Разработка модели и метода структурирования текста.
2.1. Системность языка и текста.
2.2.Ранговые распределения в тексте и системах различной природы.
2.3. Модель структуры текста.
Выводы.
Глава III.Идентификация текстов по "информационному портрету"
3.1.Понятие стиля литературного произведения и возможности его изучения.
3.2. Метод изучения стиля, основанный на применении автором сочетаний грамматических форм.
3.3. Информационный портрет текста и возможность его атрибуции.
3.4. Построение информационного портрета.
3.5. Сравнение информационных "портретов" и идентификация текстов.
Выводы.
Введение 2002 год, диссертация по информатике, вычислительной технике и управлению, Панкратова, Анна Зурабовна
Диссертация посвящена разработке модели структурирования текста, знание которой необходимо для построения эффективных алгоритмов его автоматической обработки.
Классические методы статистической обработки текста с целью выяснения его структуры, которые сводятся чаще всего к оценке рангового закона распределения (закона Ципфа), подверглись в последние годы существенной критике, поскольку, в сущности, они носят эмпирический характер.
Согласно новой парадигме, которая сложилась в последние годы, текст предполагается рассматривать как некоторую целостность, но в литературе отсутствуют какие-либо результаты в этом направлении, поэтому данная работа является актуальной.
В данной работе модель текста представлена в виде системы, количественный состав компонентов (языковых единиц) которой вычисляется априорно на основании закона "золотого деления".
Результаты расчета с высокой точностью совпали с результатами соответствующей обработки текстов.
Разработана новая методика идентификации текстов, основанная на описании структурных связей между языковыми единицами посредством введения взаимной информации.
Таким образом, разработанный автором новый метод идентификации текста может быть рекомендован как инструмент для его анализа как более эффективного, по сравнению с известными.
Актуальность.
Новые информационные технологии связаны с созданием и обработкой большого количества разнородных текстов. Необходимость обработки все увеличивающегося количества текстов требует разработки новых и модификации уже известных методов их анализа.
Эффективность решения задачи обработки текстов зависит от решения проблемы автоматизации их анализа. С другой стороны, автоматизация анализа текста подчиняется глобальным практическим задачам, связанным с обнаружением механизма построения текста и выявлением его характерных свойств.
Использование математических методов при решении подобных задач обеспечивает получение объективных результатов, расширяет число применяемых методов и приемов при исследовании текстов, а также дает возможность решения таких задач, сама постановка которых без применения данных методов может быть нереальной.
Одной из наиболее актуальных задач квантитативного языкознания является необходимость создания теории, которая позволила бы описать и объяснить закономерности организации связного текста.
В последние годы были получены новые результаты, выявившие некоторые закономерности построения текста, построены математические модели этой организации. Большую роль в этих исследованиях сыграли работы Ю.К. Орлова, Ю.А. Шрейдера, М.В. Арапова, Е.Н.
Ефимовой, Б. В. Сухотина, Б. И. Кудрина, Ю.К. Крылова Р.Ю. Кобрина и др. [66, 5, 6, 92, 46, 45, 4.2], которые показали, что в природе существует закон, который управляет механизмом формирования структуры текстов. Но механизм формирования этой структуры до конца не выявлен.
Широкое распространение получил статистический метод анализа структуры текста, который, в частности, сводится к оценке рангового закона распределения. Устойчивость таких законов распределения как гиперболического (Н - распределения) и закона Ципфа по отношению к объектам различной природы является свидетельством о наличии в природе закона, который управляет механизмом формирования структуры текста.
Классическая теория вероятностей не исследует причины формирования определенного вида закона распределения, а закон распределения не раскрывает онтологической природы текста и является только внешним проявлением пока неизвестной его внутренней структуры. Поэтому произошла смена парадигмы изменение представления о природе и свойствах текста. Согласно новой парадигме текст рассматривается как некоторая целостность, но в литературе отсутствуют какие-либо результаты исследований в этом направлении.
Поэтому, предлагаемый в диссертации метод построения модели структурирования текста и разработка соответствующего алгоритма его обработки является актуальным.
Цель работы.
Целью работы является построение модели и разработка алгоритма для изучения структуры текста как одной из разновидности сложных систем, а также разработка методики идентификации текстов и описания стиля литературных произведений.
Задачи работы.
Достижение намеченной цели требует решения следующих задач:
• Построение модели структурирования текста как некоторой целостности и ее сравнение с уже существующими моделями;
• Разработка алгоритма и проверка его эффективности при исследования различных текстов и словарей;
• Построение "информационного портрета" текста и идентификация текстов различных авторов.
Методы исследований.
Методологической основой данной работы является системный анализ. В качестве математического аппарата использованы элементы теории вероятностей, математической статистики и элементы теории информации.
Научная новизна работы состоит в следующих результатах:
• Разработана новая модель структурирования текста как некоторой целостности, достоверность которой подтверждается в результате анализа рангового закона распределения;
• Введено новое информационное описание структурных связей между языковыми единицами в тексте;
• Разработана методика идентификации текстов на основе сравнения "информационных портретов";
Обоснованность и достоверность результатов обеспечена доказательствами сформулированных в работе положений и представленными результатами статистической обработки текстов.
Практическая ценность заключается в возможности применения предложенной модели как нового инструмента при анализе структуры текста в целях поиска информации, исключении ошибок при переводе и передаче информации, а также возможности идентификации текстов и построении частотных словарей в целях изучения лексики текстов, написанных на различных языках.
Реализация результатов работы.
Разработанные в рамках диссертационной работы алгоритм анализа структуры текста и методика идентификации текстов на основе сравнения информационных "портретов" используются в учебном процессе НГЛУ им. Н.А. Добролюбова.
Апробация результатов работы. Основные положения и результаты работы представлялись и докладывались на следующих научных конференциях:
• VI-ой Международной конференции "Математика. Компьютер. Образование" (Пущино, 1999);
• Международной конференции "Математика. Образование. Экология. Тендерные проблемы" (Воронеж, 2000);
• Международной конференции "НТИ-2000. Информационные технологии и телекоммуникации" (Москва, ВИНИТИ, 2000);
• Научно-технической конференции факультета Информационных систем и технологий ФИСТ-2 000 (Н. Новгород, НГТУ, 2000);
• Всероссийской научно-технической конференции "Информационные системы и технологии ИСТ-2 001 (Н. Новгород, 2001).
• Всероссийском научно-практическом семинаре "Проблемы прикладной лингвистики" (Пенза, 2001). Публикации.
По теме диссертационного исследования опубликовано 10 работ.
Структура и объем работы.
Диссертация состоит из введения, трех глав и заключения, библиографического списка, 7 приложений, содержит 132 страницы машинописного текста, 2 6 рисунков и 9 таблиц.
Заключение диссертация на тему "Разработка модели и метода структурирования текста с целью его идентификации"
Выводы:
1.Разработан алгоритм статистической обработки текста, позволяющий построить "информационный портрет" его структуры.
2.Разработана методика идентификации текстов.
3.Проведено сравнение "портретов" различных авторов.
4.Проведено сравнение "портретов" текстов, принадлежащих различным стилям.
Заключение
1. Разработана новая модель структурирования текста, позволяющая априорно вычислить вероятности появления языковых единиц (букв, слов, классов слов). Справедливость модели подтверждается в результате анализа рангового закона распределения вероятностей языковых единиц.
2. Введено новое описание структурных связей с помощью взаимной информации, позволяющее описать статистическую зависимость между языковыми единицами, в частности, словами, находящимися на заданном расстоянии в тексте. Все возможные связи изображаются в виде матрицы, элементами которой являются величины взаимной информации между языковыми единицами, названной в работе "информационным портретом".
3. Разработан алгоритм статистической обработки текста, являющийся инвариантным по отношению к языку, породившему текст и позволяющий построить "информационный портрет" его структуры.
4. Разработана методика идентификации текстов на основе сравнения "информационных портретов", позволяющая выделить некоторые индивидуальные особенности языка автора.
5. Проведена идентификация текстов различных авторов по разработанной методике, а также сравнение текстов, принадлежащих различным стилям. Результаты идентификации текстов подтверждают гипотезу о том, что особенности языка автора проявляются в характере связей между грамматическими классами слов и различиями в величине взаимной информации между ними.
Библиография Панкратова, Анна Зурабовна, диссертация по теме Теоретические основы информатики
1. Александрова Г.П., Белоногов Г.Г., Новоселов А. П., Стогов Е.И. Система автоматического синтаксического анализа русских текстов//Научно-техническая информация. Сер.2. №3. 1975. С.30-35.
2. Алексеев П.М. О квантитативной типологии текста: Актуальные проблемы квантитативной лингвистики//Уч.зап. ТГУ. Вып. 591. 1981. С.13-24.
3. Андрющенко В.М. Концепция и архитектура машинного фонда русского языка//Маш.фонд.рус.яз: Идеи и суждения. М.: Наука, 1986. - с.26-44.
4. Арапов М.В. Квантитативная лингвистика. М. : Наука, 1988. - 184 с.
5. Арапов М.В., Ефимова Е.Н., Шрейдер Ю.А. О смысле ранговых распределений//Научно-техническая информация. Сер.2. 1975. №1, с.9-20.
6. Арапов М.В., Ефимова Е.Н., Шрейдер Ю.А. Ранговые распределения в языке и тексте//Научно-техническая информация. Сер.2. 1975. № 2. с.3-7
7. Арапов М.В. Системный анализ лексической структуры текстов//Системные исследования. М.: Наука, 1981, с.372-403.
8. Афоничкин А. И. К проблеме анализа информации в автоматизированных информационных системах// Научно-техническая информация. Сер.2. 1983. № 10. С.23-24 .
9. Барт Р. Лингвистика текста. Новое в зарубежной лингвистике. Вып. VIII. Лингвистика текста. М. : Прогресс, 1978, с. 442-449.
10. Бектаев К.В., Лукьяненков К.Ф. О законах распределения единиц письменной речи. Статистика речи и автоматический анализ текста. Л.:1974.
11. Бектаев К.Б., Пиотровский Р.Г. Математические методы в языкознании. 4.2. Алма-Ата, 1973. -334 с.
12. Беляева JT.H. Применение ЭВМ в лингвистических исследованиях и лингводидактике. JI. : 1986. - 83 с.
13. Бенвенист Э. Общая лингвистика. М.: 1974.
14. Берзон В. Б, Блехман М.С, Пиотровский Р. Г. Связи, единицы и единства сверхфразового уровня языка. //Уч. зап. ТГУ. Вып. 689. 1984, с.16-34.
15. Берзон В. Б. Автоматическое смысловое свертывание на основе анализа сверхфразовых связей текста//Статистика речи и автоматический анализ текста. JI. : Наука, 1974. - с.147-162.
16. Берзон В.Б., Блехман М.С., Захаров А.А. , Певзнер Б.Р. Реализация на ЭВМ системы, анализирующей синтаксические сферхфразовые связи//Научно-техническая информация. Сер.2. № 9. 1984. С.25-30.
17. Бондаренко Г. В. К изучению текста как иерархической структуры суперсинтаксических единиц//Научно-техническая информация. Сер.2. № 8. 1975. с.19-23.
18. Бородкин Л.М., Милов JI.B. Некоторые аспекты применения количественных методов и ЭВМ в изучении нарративных источников. Количественные методы в советской и американской историографии. -М.: 1983.
19. Бородкин JI.M., Милов JI.B., Морозова JI.E. К вопросу о формальном анализе авторских особенностей стиля в произведениях Древней Руси. Математические методы в историко-экономических и историко-культурных исследованиях. М.: 1977.
20. Брагина JI.M. Методика количественного анализа философских трактатов эпохи Возрождения. Математические методы в историко-экономических и историко-культурных исследованиях. М.: 1977.
21. Виноградов В.В. Лингвистические основы научной критики текста//Вопросы языкознания, №2.1958. с.З-24 .
22. Волова В.Н. , Денисов А.А. Основы теории систем и системного анализа. СПб.: Изд-во СПбГТУ, 1997. -510 с.
23. Гальперин И. Р. К проблеме зависимости предложения от контекста//Вопросы языкознания.1977. № 1. С. 4855 .
24. Гальперин И. Р. Текст как объект лингвистического исследования. М.: Наука, 1981. - 140 с.
25. Грязнухина Т.А. Анализ предложных связей в научном тексте. Киев: Наук.думка, 1985. - 146 с.
26. Деопик Д.В. Опыт количественного анализа древней восточной летописи "Чуньцю". Математические методы в историко-экономических и историко-культурных исследованиях. М.: 1977.
27. Добрускина Э.М., Берзон В.Е. Синтаксические сферхфразовые связи и их инженерно-лингвистическое моделирование.Ч.1-Кишинев: Штиинца, 1984. 160 с.
28. Добрускина Э.М., Берзон В.Е. Синтаксические сферхфразовые связи и их инженерно-лингвистическое моделирование.Ч.2-Кишинев: Штиинца, 1986. 178 с.
29. Дресслер В. Синтаксис текста//Новое в зарубежной лингвистике. Вып. VIII. Лингвистика текста. М.: Прогресс, 1978, с. 111-127.
30. Ермоленко Г. В. Анонимные произведения и ихавторы. Минск, 1988.
31. Ефимов А. И. Стилистика художественной речи. Изд-е 2-е, М.: 1961.
32. Закономерности структурной организации научно-реферативного текста//Отв. ред. В.И. Перебейнос. Киев: Наук.думка, 1982. - 322 с.
33. Зиндер JI.P., Строева Т. В. К вопросу о применении статистики в языкознании//Вопросы языкознания. №6. 1968. с.120-123.
34. Ингве В. Синтаксис и проблема многозначности//Маш. Перевод. -М.: 1957, с.280-305.
35. Иорданская Л.И. О некоторых свойствах правильной синтаксической структуры//Вопросы языкознания. №41.1963. с.102-112.
36. Искусственный интеллект. В 3-х кн. Кн.1. Системы общения: Справочник. /Под ред. Э.В.Попова. —М. : Наука, 1990.
37. Искусственный интеллект. В 3-х кн. Кн.2. Модели и методы: Справочник. /Под ред. Д.А.Поспелова. — М.: Наука, 1990.
38. Искусственный интеллект. (В 3-х кн.) Кн. 3. Экспертные системы: Справочник / Под ред. Э. В. Попова. М.: 1990.
39. Итоги науки и техники. Информатика. Том 7. М., 1983 .
40. Клосс Б.М. О статистических методах исследования текстов исторических источников. Математические методы в историко-экономических и историко-культурных исследованиях. М.: 1977,с.326-334 .
41. Кобрин Р.Ю., Пескова Н.И. О соотношении информационно-поискового тезауруса и классификатора технико-экономической информации//Научно-техническая информация. Сер.2. № 7. 1982. С.1-5.
42. Колшанский Г. В. Коммуникативная функция и структура языка. М.: Наука, 1984. - 175 с.
43. Костомарова Н.Н. Синтаксический анализ в ЭСАИТ//Вопр. Инф. теории и практики. 197 7. - №3.
44. Крылов Ю.К. Стационарная модель порождения связного текста //Квантитативная лингвистика и автоматический анализ текстов, Уч. зап. ТГУ. Вып.774. 1987. с.81-101.
45. Кудрин Б.И. Онтология и гносеология ценозов и их структурная устойчивость// Математическое описание ценозов и закономерности техники. Философия и становление техники. Серия "Ценологические исследования". Вып.1-2. 1996. с. 9-27.
46. Лебедев А.Н. Закономерности повторения слов в речи// Психологический журнал. т.4. №5. 1983. с. 11-22 .
47. Леонтьева Н.И. Анализ и синтез русских эллиптических предложений//Научно-техническая информация. Сер.2. № 11. 19 65.с.46-48.
48. Лингвистический энциклопедический словарь. М.: 1990 .
49. Ляпунов А. А. В чем состоит системный подход к изучению реальных объектов сложной природы//Системные исследования. М. : Наука. 1972. с. 5-12.
50. Ляпунов А.А. Проблемы теоретической и прикладной кибернетики. М.: Наука, 1980. - 335 с.
51. Мандельброт Б. Теория информации и психолингвистика. Теория частот слов//Математические методы в социальных науках.- М.: Прогресс, 1973. с.57-63.
52. Мартыненко Г.Я. Основы стилеметрии. JI.: ЛГУ,1988. - 174 с.
53. Марусенко М.А. Атрибуция 'анонимных и псевдонимных литературных произведений методами распознавания образов. Л.: ЛГУ,1990, 168 с.
54. Материалы к частотному словарю языка Пушкина. -М.: АН СССР, Ин-т русского языка, 1963.
55. Москальская О.И. Семантика текста//Вопросы языкознания. № 6. 1980. с.32-42.
56. Надеев А.Т. Основы системного анализа. Учебное пособие. Нижний Новгород: Изд-во Волго-Вятского кадрового центра, 1993. - 136 с.
57. Надеев А.Т. Систематика. Книга 3. Системы структур. Нижний Новгород: Изд-во Волго-Вятской академии государственной службы, 1998. - 206 с.
58. Негуляев Г.А., Покрас Ю.Л., Колесников Л.И. Автоматизированный отбор лексики для информационно-поисковых тезаурусов//Научно-техническая информация. Сер.2. № 9. 1973. с.16-24.
59. Новиков А.И. Семантика текста и ее формализация. М.: Наука, 1983, 224 с.
60. Новиков А.И., Якушкин Б.В. Алгоритм индексирования текстов именными ключевыми словами по методу семантической фильтрации//Научно-техническая информация. Сер.2. 1972.
61. Новиков А.И., Ярославцева Е.И. Семантические расстояния в языке и тексте. М. : Наука, 1990. -136 с.
62. Обухова Н.В. О специфике распределения многозначности лексических единиц в китайском языке.//Уч. зап. ТГУ. Вып. 745. 1986. с. 119-128.
63. Одинцов В.В. Стилистика текста, М. , Наука, 1980,264 с.
64. Орлов Ю. К. Обобщенный закон Ципфа-Мандельброта и частотные структуры информационных единиц различных уровней. // Вычислительная лингвистика. М., Наука, 1976.
65. Орлова J1.B. Структура сверхфразового единства в научных текстах. Киев: Наук. Думка, 1988. - 153 с.
66. Палек Б. Кросс-референция; к вопросу о гиперсинтаксисе. Новое в зарубежной лингвистике. Вып. VIII. Лингвистика текста. М.: Прогресс, 1978,с. 243-258.
67. Перебейнос В.И. Определение беспредложных глагольных связей в научно-реферативном тексте//Автоматизация анализа научного текста. -Киев: Наук.думка, 1984. с.99-153.
68. Перебейнос В.И., Братыщенко Л.Г., Грязнухина Т.А. и др. Система автоматической обработки текста в рамках Машинного фонда русского языка//Вторая Всесоюзная конференция по проблеме машинного фонда рус.яз: тезисы докладов. М.: 1987, с.125-127.
69. Пиотровский Р.Г. Текст, машина, человек. Л.: 1975. 32 6 с.
70. Пиотровский Р.Г., Билан В.Н., Воркун М.Н., Бобков А.К. Методы автоматического анализа и синтеза текста. Минск, Вышэйшая школа, 1985. - 222 с.
71. Полонская О.Р. Логико-смысловые конекторы английского языка как формальные показатели связности текста//Научно-техническая информация. Сер.2. № 6. 1986.с.19-22.
72. Прим Р.К. Кратчайшие связывающие сети и некоторые обобщения. Кибернетический сборник. Т.2. М: 1961, с.95-107.
73. Пфютце М. Грамматика и лингвистика текста //Новое в зарубежной лингвистике. Вып. VIII. Лингвистикатекста. М.: Прогресс, 1978, с. 218-242
74. Пшеничная Л.Э. Релевантность научного документа информационному запросу в аспекте соотношения заглавия и полного текста//Научно-техническая информация. Сер.2. № 11. 1985.с.14-17.
75. Ревзин И. И. Современная структурная лингвистика. Проблемы и методы. М.: Наука, 1977. - 262 с.
76. Ревзин И. И. Структура языка как моделирующей системы. М.: Наука, 197 8. - 287 с.
77. Руднев В. П. Словарь культуры XX в. Ключевые понятия и тексты. М.: Аграф, 1997. - 384 с.
78. Свами М., Тхуласираман К. Графы, сети и алгоритмы.
79. Севбо И.П. Графическое представление синтаксических структур и стилистическая диагностика. К.: Наук. Думка, 1981. 192 с.
80. Севбо И. П. Структура связного текста и автоматизация реферирования. М. : Наука, 1969. -135 с.
81. Севбо И.П., Алешкина С.М. Исследование зависимости между длиной фразы и количеством уровней в графе//Структурная и математическая лингвистика. Вып. 2. 1974. с. 106-115.
82. Севбо И.П., Петунин Ю.И. Исследование синтаксических структур статистическими методами//Научно-техническая информация. Сер.2. № 2. 1976. с. 17-36.
83. Серкова Н.И. О некоторых вопросах функциональной перспективы предложения в терминах "сверхфразовых единств"//Вопросы языкознания. № 3.1967. с.92-100.
84. Сильницкий Г.Г. Семантические типы ситуаций и семантические классы глаголов//Проблемы структурной лингвистики. М.: 1973. с.373-391.
85. Скороходько Э. Ф. Лингвистические проблемы обработки текстов в автоматизированных ИПС //Вопросы информационной теории и практики. N25.1. М: 1974.
86. Скороходько Э.Ф. Семантические сети и автоматическая обработка текста. Киев, Наукова думка, 1983. 218 с.
87. Современная информатика: наука, технология, деятельность/Р.С. Гиляревский, Г.З. Залаев, И.И. Родионов, В.А. Цветкова. Под. Ред. Ю.М. Арского. -М.: ВИНИТИ, 1998. 220 с.
88. Современный русский язык. Ч. 2. Синтаксис. Учебник для вузов/Под ред. Д.Э. Розенталя. М: Высш. шк, 1979. - 256 с.
89. Степанов Ю.С. В трехмерном пространстве языка: семиотические проблемы лингвистики, философии, искусства. М.: 1985.
90. Сухотин Б.В. Исследование грамматики числовыми методами. М.: Наука, 1990. -176 с.
91. Трубников Б.А., И. А. Румынский. Простейший вывод закона Ципфа-Крылова для слов и возможность его "эволюционной интерпретации". //Доклады АН СССР, т.321, № 2, 1991с.270-275.
92. Трубников Б.А. Конкуренция в природе и обществе// Природа, № 11, 1993, с.3-13.
93. Тулдава Ю.А. О теоретико-методологических основах квантитативно-системного анализа лексики//Уч. зап. ТГУ. Вып. 619. 1982.с.
94. Тулдава Ю.А. О частотном спектре лексики текста//Уч. зап. ТГУ. Вып. 745. 1986. С.139-162.
95. Тюхтин B.C. Отражение. Системы, кибернетика. М. : Наука, 1972, 256 с.
96. Фрумкина P.M. Статистические методы изучения лексики. М.: Наука, 1964.
97. Фукс В. По всем правилам искусства (Точные методы в исследованиях литературы, музыки и изобразительного искусства). Искусство и ЭВМ. М.: 1975.
98. Хайтун С.Д. Наукометрия. Состояния и перспективы. -М.: 1983. 191 с.
99. Харвег Р. Стилистика и грамматика текста//Новое в зарубежной лингвистике. Вып. 9. Лингвостилистика. М.: Прогресс, 1980. - с.212-226
100. Хомский Н. Логические основы лингвистической теории//Новое в лингвистике. Вып.IV, М.: Прогресс. 1963, с.465-576.
101. Хомский Н. О понятии "правило грамматики"// Новое в лингвистике. Вып.IV, М. : Прогресс, 1963, с. 3465 .
102. Хьетсо Г., Густавссон С., Б. Бекман, С. Гил. Кто написал "Тихий Дон"? М.: Книга, 1989. - 186 с.
103. Частотный словарь русского языка. М: Русский язык, 1977. - 256 с.10 6 Черемсина М.И. Сравнительные конструкции русского языка. Новосибирск: Наука. Сибирское отделение., 1976. - 152 с.
104. Шайкевич А.Я. Дистрибутивно-статистический анализ в семантике//Принципы и методы семантических исследований. М.: Наука, 1976. - с.353-376.
105. Шрейдер Ю.А. Проблемы передачи информации, М.: 19 67, т.З, вып.1, с.57-63.
106. Шрейдер Ю.А. Ранговые распределения как системное свойство// Математическое описание ценозов и закономерности техники. Философия и становление техники. Сер. "Ценологические исследования". Вып.1-2. с. 1996. С.33-42.
107. Шрейдер Ю.А. Свойства проективности языка//Научнотехническая информация. №8. 1964. с.38-41
108. Шрейдер Ю.А., Шаров А.А. Системы и модели. М. : Радио и связь, 1982, 152 с.
109. Штейнфельдт Э.А. Частотный словарь современного русского литературного языка. -Талин: 1963.
110. Hockett Ch. Grammar for the Hearer Structure of Language. Mathematical Aspects. New York, 1961.
111. Nistor E., Roman Е/ Constructing Automatical Abstracts from Karnal-sentences//Cah. Ling. Theor.et.appl. 1971, - 8. - №8. - p.249-256.
112. Zipf G.K. Human behavior and the principle of least effort. Cambridge: Addison-Wesly Press, 1949.1. Работы автора:
113. Ломакина Л.С., Панкратова А.З. Анализ некоторых моделей лингвистических явлений //Математика. Компьютер. Образование. Вып.6. Часть I. Сборник научных трудов. Под ред. Г.Ю. Ризниченко. М.: Прогресс-Традиция, 1999. С.102-105.
114. Панкратова А.З. Сетевое моделирование как метод исследования некоторых лингвистических явлений// Исследования молодых ученых: Сборник статей аспирантов. Часть III. Мн. : Изд-во МГЛУ, 1999. С.59-61.
115. Ломакина Л.С., Панкратова А.З. Оптимизационные методы лингвистической дешифровки. // Системыобработки информации и управления. Межвуз. сб. Вып.6. Н. Новгород, 2000. С.74-78.
116. Ломакин Д.В., Ломакина Л.С., Панкратова А.З. Вероятностно-информационная модель для исследования структуры текста// Научно-техническая конференция факультета информационных систем и технологий. ФИСТ-2000. Н. Новгород, НГТУ, 2000. С. 113-114.
117. Ломакин Д.В., Панкратова А.З. Модель структурирования текста //Всероссийская научно-техническая конференция, посвященная 65-летию факультета информационных систем и технологий. ФИСТ-2001. Н. Новгород, НГТУ, 2001.С.177.
118. Панкратова А.З. Идентификация текста на основе информационной модели его структуры // Всероссийский научно-практический семинар
119. Проблемы прикладной лингвистики". Пенза, Приволжский дом знаний, 2001. С.40-41.
-
Похожие работы
- Автоматическая идентификация и распознавание структурированных документов
- Программное обеспечение для многоуровневого структурирования контента информационного пространства по системной модели
- Исследование путей и возможностей создания автоматизированной системы идентификации объектов
- Идентификация линейного динамического объекта в условиях действия возмущений на основе его представления в виде комбинации типовых звеньев
- Алгоритм и методика определения параметров многомерной линейной динамической модели тягового энергопотребления участка железной дороги
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность