автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Машинно-ориентированные логические методы представления смысла текста на естественном языке

кандидата физико-математических наук
Батура, Татьяна Викторовна
город
Новосибирск
год
2006
специальность ВАК РФ
05.13.11
Диссертация по информатике, вычислительной технике и управлению на тему «Машинно-ориентированные логические методы представления смысла текста на естественном языке»

Оглавление автор диссертации — кандидата физико-математических наук Батура, Татьяна Викторовна

ВВЕДЕНИЕ.

1. МЕТОДЫ ПРЕДСТАВЛЕНИЯ СМЫСЛА ТЕКСТА

НА ЕСТЕСТВЕННОМ ЯЗЫКЕ.

1.1. Основа теоретических представлений.

1.2. Лексические функции И.А. Мельчука.

1.3. Теоретико-множественные модели языков.

1.4. Классификация инструментальных систем для описания структур естественного языка.

1.5. Общие принципы систем обработки текстов.

1.6. Система ДИАЛИНГ.

1.7. DSTO Fact Extractor System.

1.8. Системы, основанные на памяти с параллельным доступом к информации.

1.9. Выводы.

2. ГРАММАТИЧЕСКИЕ И СИНТАКСИЧЕСКИЕ ПРЕДИКАТЫ.

2.1. Грамматические предикаты.

2.1.1. Имя существительное.

2.1.2. Имя прилагательное.

2.1.3. Имя числительное.

2.1.4. Местоимение.

2.1.5. Глагол.

2.1.6. Причастие.

2.1.7. Деепричастие.

2.1.8. Наречие.

2.1.9. Предлог.

2.1.10. Союз.

2.1.11. Частица.

2.2. Синтаксические предикаты.

2.3. Выводы.

3. СТРУКТУРЫ ДАННЫХ, АССОЦИИРОВАННЫЕ С ТЕКСТАМИ.

3.1. Структуры и потоки.

3.1.1. Структуры, соответствующие предложениям на естественном языке.

3.1.2. Сопоставление текста и потоков.

3.2. Общие принципы организации памяти с параллельным доступом к информации.

3.2.1. Пространство памяти и универсальные последовательности.

3.2.2. Память с параллельным доступом к сегментам многомерных массивов.

3.2.3. Применение в лингвистике памяти с параллельным доступом.

3.3. Выводы. 4. ИССЛЕДОВАНИЕ СТРУКТУРЫ ИНФОРМАЦИИ В ТОЛКОВОМ СЛОВАРЕ С.И. ОЖЕГОВА.

4.1. Структура словарных статей в словаре Ожегова.

4.2. Связь между набором словарных статей словаря Ожегова и текстом на естественном языке.

4.3. Применение деревообразного представления предложений в поисковых системах.

4.3.1. Представление предложений с помощью деревьев с пометками.

А 4.3.2. Системы составляющих.

4.3.3. Деревья подчинения.

4.3.4. Конструкции языка REFAL.

4.3.5. Обработка поисковых запросов на естественном языке.

4.4. Выводы.

• 5. ФОРМИРОВАНИЕ РЕЧИ У ЧЕЛОВЕКА.

5.1. Данные и гипотезы антропологии.

5.2. Психология развития и формирования речи у ребенка.

5.2.1. Когнитивное (познавательное) развитие.

5.2.2. Возникновение грамматики языка.

5.3. Формальные модели базовых конструкций языка.

5.3.1. Периодизация освоения языка ребенком.

5.3.2. Применение конструкции конечного форсинга.

5.4. Выводы.

Введение 2006 год, диссертация по информатике, вычислительной технике и управлению, Батура, Татьяна Викторовна

Теория языка как структуры, соответствующая классификация и методы обработки формальных и естественных языков начали разрабатываться в математике, а позднее и в информатике, еще с 30-х годов. Однако прямое применение существующего аппарата описания формальных языков к естественному языку невозможно из-за того, что это объект принципиально другой природы. В частности, в отличие от формального языка, естественный язык не следует задуманной и последовательно реализованной концепции. Он развивается с течением времени под воздействием многих внешних и внутренних сил, становится тем, что он из себя представляет, и усваивается в сообществе через использование в коммуникации, а не благодаря правилам. Кроме того, чисто грамматическое описание естественного языка не достаточно для использования, поскольку естественный язык не является просто вещью в себе, он необходимо соотносится со структурами знания, используемыми его носителями. В результате описание грамматики естественного языка как некоторого класса формальной грамматики оказывается затруднено, что все же не отменяет полезность классификации формальных грамматик для компьютерной лингвистики.

С другой стороны, для того чтобы допускать возможность реальной компьютерной реализации, лингвистическая теория должна обладать высокой степенью формализации и полноты. Поэтому общей чертой для всех теорий, используемых в компьютерной лингвистике, является их генеративность в том смысле, что исследование естественного языка ведется через построение полностью явных (explicit) описаний и определение общей структуры (framework) пространства этого описания [42]. Кроме того, реализация лингвистической теории через инструментальную систему для описания структур естественного языка зависит также от методов программирования, использованных для ее написания. Таким образом, развитие компьютерной лингвистики стимулируется, с одной стороны, развитием теоретических средств описания естественного языка, а с другой - прогрессом технологий программирования, в первую очередь, в области искусственного интеллекта (ИИ).

Если понятие инструментального средства рассмотреть в контексте классического различия, проводимого в лингвистике между языковой компетенцией и использованием языка его носителем, то можно отметить, что, во-первых, это инструментальное средство должно обладать возможностью представлять знание о языке, во-вторых, в нем должно быть организовано использование этого знания, для того чтобы понимать и/или генерировать конкретный текст на естественном языке. Иными словами, идеальная инструментальная система обработки естественного языка должна основываться на идеальной лингвистической теории, т. е. обладать средствами представления лингвистических структур, структур представления знаний, а также на алгоритмах для обработки таких структур. Она, в частности, должна поддерживать возможность представления сложных средств выражения, свойственных естественному языку, таких как лексические омонимия и полисемия (несколько значений, соответствующих одному слову), синонимия (несколько слов имеют близко связанные значения), привязка к контексту речи (с помощью анафорических местоимений) и к контексту ситуации (экзофорические или дейктические указатели), эллипсис (как синтаксический, так и семантический), фигуры речи (использование слов не в их прямом значении) и т. д. Традиционной проблемой является также описание взаимосвязи между грамматическими структурами и содержанием предложения, при этом содержание представлено либо как логическая формула, либо как структура, записанная на некотором языке представления знаний.

Совокупная сложность вышеописанных феноменов существенно выше существующих на данном этапе теоретических построений для их описания, обладающих требуемой степенью полноты и формализации. Иными словами, не существует ни идеальной теории для компьютерной лингвистики, ни идеальных средств ее реализации. По этой причине невозможно создать идеальную инструментальную систему для обработки естественного языка, что приводит к изобилию существующих систем. Чаще всего набор средств представления инструментальной системы (а также полнота этого набора) определяется теоретической моделью, лежащей в ее основе. В соответствии с двумя источниками развития компьютерной лингвистики естественно выделять два вида теоретических основ инструментальных систем: из лингвистики и искусственного интеллекта. В этой связи утверждается, что описание должно быть трехчастным: лингвистические теории, средства ИИ и описание конкретных систем, использующих изложенные концепции. Однако одной из тенденций последних десяти-пятнадцати лет является то, что теория в области компьютерной лингвистики и ИИ и практическая реализация этой теории в значительной степени переплетены, поэтому четкого разделения по этим признакам провести не удается. В частности, в [55] обсуждаются проблемы, связанные с разделением труда между лингвистической теорией и формальными средствами ее реализации.

Более удачной кажется отраженная в таблице 1 структура уровней абстракции описания в компьютерной лингвистике (схема основана на идеях из [44]). При движении от верхних к нижним уровням этой схемы происходит переход от описания конкретных лингвистических проблем к механизмам, на которых основывается такое описание. Так конкретный язык описывается на основе системы правил используемой для этого грамматической теории, набор категорий и методология которой задаются ее грамматической моделью, которая строится на основе грамматического формализма (т. е. математического аппарата, использующегося для описания феноменов естественного языка). В свою очередь, последнему ставится в соответствие декларативная и процедурная семантика вычислительного формализма, т. е. языка программирования, на котором реализуется грамматический формализм. Поскольку семантика языка программирования не полностью определяет способ его реализации, эта шкала завершается уровнем компьютерной реализации вычислительного формализма.

Таблица 1.

Уровень Комментарий

Реализация грамматики Конкретные правила и словарь для конкретного языка

Грамматическая теория Смысл<->Текст, Government and Binding или HPSG

Грамматическая модель В Смысл<-> Текст: уровни СемП, ГСинтП, ПСинтП ., наличие правил преобразования структур и фильтров

Грамматический формализм Д -грамматики, атрибутно-значная логика или ATN

Вычислительный формализм Реализация DCG на Прологе, ЯЗЛИ в системе Этап-2, TULIPS

Компьютерная реализация Реализация виртуальной машины, унификации, рекурсии и т.п.

Структура уровней абстракции описания лингвистических проблем

Хотя эта схема отличается чрезмерной дробностью, так как при анализе конкретных средств компьютерной лингвистики иногда бывает трудно провести грань между теорией и моделью, моделью и грамматическим формализмом и т. д., все же позиционирование того или иного подхода относительно этой шкалы помогает уяснению целей его разработки. Очень условно можно считать, что данный обзор начинается с введения в грамматические модели, затем следует описание грамматических формализмов и грамматических теорий (дополнительные грамматические модели, например, категориальные грамматики, вводятся по мере необходимости). В качестве иллюстрации того или иного подхода в тексте данного обзора приводятся ссылки на компьютерные реализации и реализации грамматик.

Целью работы является разработка методов, позволяющих проводить разносторонний анализ текстов и отдельных предложений на естественном языке, в том числе, позволяющих осуществлять представление смысла текстов и предложений.

В работе приведен обзор существующих теоретических методов отображения семантики текстов и формализации структур естественных языков - подход И.А. Мельчука,

С. Маркуса. Кратко рассмотрены уже существующие инструментальные средства для обработки текстов на естественном языке: система ДИАЛИНГ, DSTO Fact Extractor System. Приведена классификация инструментальных систем для описания структур естественного языка и основные компоненты, из которых состоят системы анализа текстов. В работу включен обзор систем, использующих память с параллельным доступом к информации.

В работе изложены способы сопоставления предикатов и формул узкого исчисления предикатов словам и предложениям на естественном языке. Предикаты можно получать сопоставлением частям речи с учетом соответствующих грамматических признаков и, в некоторых случаях, в зависимости от принадлежности к той или иной смысловой группе. Такие предикаты мы назвали грамматическими. Предикаты можно ассоциировать с членами предложения. Их мы назвали синтаксическими. Синтаксические предикаты могут быть одноместными и двухместными, для неоднородных и однородных членов предложения. В формулах отражена взаимосвязь между разными группами предикатов.

В третьей главе диссертации рассмотрены структуры данных и потоки, которые удобны для представления предикатов и конечных моделей, сопоставляемых предложениям на естественном языке. Они легко могут быть реализованы средствами языка С++.

Предложенные методы реализованы на компьютере группой студентов. За основу была взята система ДИАЛИНГ. Но выяснилось, что программа [69, 72, 75, 77] работает медленно. Поэтому мы обратились к следующим вопросам.

1. Как происходит освоение речи человеком, и насколько это применимо к компьютеру? а) с одной стороны, это естественнонаучный вопрос. Здесь могут быть использованы данные и гипотезы антропологии, психологии и т. д.; б) с другой стороны, это вопрос об эффективности при реализации на компьютере. Например, чтобы понять, является ли данное слово словоформой исходного, эффективнее проверить слова на совпадение, чем выяснить, какие у слова род, падеж и т. д.

2. Какова структура словарных статей в толковых словарях, и можно ли ими эффективно воспользоваться при компьютерной обработке текстов? Речь идет именно о «человеческих» толковых словарях, а не о специализированных компьютерных, наподобие толково-комбинаторного словаря, составленного академиком Апресяном. Подобные словари слишком трудоемкие, а как следствие неполные и дорогостоящие.

Помимо этого, была рассмотрена возможность применения общих принципов организации памяти с параллельным доступом к обработке лингвистической информации.

В работе предпринята попытка анализа структуры словарных статей словаря С.И. Ожегова. Рассмотрена взаимосвязь между набором словарных статей толкового еловаря и текстом на естественном языке. На основе анализа предложен механизм представления предложений в виде деревьев с пометками. Рассмотрены уже существующие и наиболее используемые в лингвистике способы описания синтаксической структуры предложения - с помощью систем составляющих и с помощью деревьев синтаксического подчинения.

Предложены конструкции, представляющие собой модификацию конструкций языка символьных преобразований REFAL, которые применимы для формирования дере-вообразного представления предложений на естественном языке и схем «вопрос-ответ», и описан алгоритм использования их в поисковых системах.

Были рассмотрены данные и гипотезы антропологии на основе работы Б.Ф. Поршнева «О начале человеческой истории», упоминается подход Пиаже к формированию речи у детей, рассмотрены подходы Хомского, Брауна и Брэйна к возникновению грамматики в речи ребенка.

Рассмотрены основные этапы формирования речи у человека на ранней стадии развития, и, как результат, предложена формализованная модель конструкций языка, называемых базовыми. Применение конструкции конечного форсинга предложено в качестве метода разбиения текста на фрагменты, соответствующие различным эпизодам.

Практическая ценность. Результаты работы могут быть применены в автоматизированных системах акцепции информации из текстов на естественном языке, интеллектуальных системах поиска информации в сети, при построении систем автоматического резюмирования, электронных переводчиков и словарей. Предполагается использование результатов работы в системах безопасности, работающих с банковской информацией. К вопросу о размещении данных в памяти с параллельным доступом и некоторым другим вопросам проявила интерес корпорация IBM. Она выделила грант на поддержку данной работы.

Апробация работы. Результаты работы были представлены на IV Международной конференции по вычислительным наукам, проходившей в Польше в Кракове, докладывались на конференциях-конкурсах «Технологии Microsoft в информатике и программировании», проходивших в Новосибирске в 2004 - 2006 годах и на международных научных студенческих конференциях «Студент и научно-технический прогресс» в 2003 - 2006 годах, также в Институте систем информатики, Институте математики СО РАН и Новосибирском государственном университете, а также на встречах с иностранными специалистами: американскими, французскими и корейскими.

По теме диссертации опубликовано 14 работ.

Структура и объем работы. Диссертационная работа состоит из введения, пяти

Заключение диссертация на тему "Машинно-ориентированные логические методы представления смысла текста на естественном языке"

Результаты работы были представлены на IV Международной конференции по вычислительным наукам, проходившей в Польше в Кракове, докладывались на конференциях-конкурсах «Технологии Microsoft в информатике и программировании», проходивших в Новосибирске в 2004 - 2006 годах и на международных научных студенческих конференциях «Студент и научно-технический прогресс», в 2003 - 2006 годах, также в Институте систем информатики, Институте математики СО РАН и Новосибирском государственном университете, а также на встречах с иностранными специалистами: американскими, французскими и корейскими.

По теме диссертации опубликовано 14 работ.

ЗАКЛЮЧЕНИЕ

В диссертационной работе были проведены комплексные теоретические исследования и разработаны методы для анализа текстов и отдельных предложений на естественном языке. В работе приведен обзор существующих теоретических методов отображения семантики текстов и формализации структур естественных языков — подход И.А. Мельчука, С. Маркуса. Кратко рассмотрены уже существующие инструментальные средства для обработки текстов на естественном языке: система ДИАЛИНГ, DSTO Fact Extractor System. Приведена классификация инструментальных систем для описания структур естественного языка и основные компоненты, из которых состоят системы анализа текстов. В работу включен обзор систем, использующих память с параллельным доступом к информации.

В работе изложены способы сопоставления предикатов и формул узкого исчисления предикатов словам и предложениям на естественном языке. Предикаты можно получать сопоставлением частям речи с учетом соответствующих грамматических признаков и, в некоторых случаях, в зависимости от принадлежности к той или иной смысловой группе. Такие предикаты мы назвали грамматическими. Предикаты можно ассоциировать с членами предложения. Их мы назвали синтаксическими. Синтаксические предикаты могут быть одноместными и двухместными, для неоднородных и однородных членов предложения. В формулах отражена взаимосвязь между разными группами предикатов.

Еще один способ введения предикатов основан на сопоставлении структурам, которые, в свою очередь, сопоставлены предложениям на естественном языке. Также рассмотрена возможность сопоставления текста и потоков.

Предложенные методы реализованы на компьютере группой студентов. За основу была взята система ДИАЛИНГ [72]. Но выяснилось, что программа работает медленно. Поэтому мы обратились к следующим вопросам:

1. Как происходит освоение речи человеком, и насколько это применимо к компьютеру? а) с одной стороны, это естественнонаучный вопрос. Здесь могут быть использованы данные и гипотезы антропологии, психологии и т. д.; б) с другой стороны, это вопрос об эффективности при реализации на компьютере. Например, чтобы понять, является ли данное слово словоформой исходного, эффективнее проверить слова на совпадение, чем выяснить, какие у слова род, падеж и т. д.

2. Какова структура словарных статей в толковых словарях, и можно ли ими эффективно воспользоваться при компьютерной обработке текстов? Речь идет именно о «человеческих» толковых словарях, а не о специализированных компьютерных, наподобие толково-комбинаторного словаря, составленного академиком Апресяном. Подобные словари слишком трудоемкие, а как следствие неполные и дорогостоящие.

Помимо этого, была рассмотрена возможность применения общих принципов организации памяти с параллельным доступом к обработке текстов на естественном языке.

В работе предпринята попытка анализа структуры словарных статей словаря С.И. Ожегова. Рассмотрена взаимосвязь между набором словарных статей толкового словаря и текстом на естественном языке. На основе анализа предложен механизм представления предложений в виде деревьев с пометками. Рассмотрены уже существующие и наиболее используемые в лингвистике способы описания синтаксической структуры предложения - с помощью систем составляющих и с помощью деревьев синтаксического подчинения. Предложена модификация REFAL-подобных конструкций при формировании де-ревообразного представления предложений на естественном языке.

Были рассмотрены данные и гипотезы антропологии на основе работы Б.Ф. Поршнева «О начале человеческой истории», упоминается подход Пиаже к формированию речи у детей, рассмотрены подходы Ноама Хомского, Роджера Брауна, Брэйна к возникновению грамматики в речи ребенка. В данной главе получены базовые конструкции языка - конструкции, возникающие первыми при формировании у ребенка грамматики языка. Предложены формальные модели этих конструкций: модель периодизации освоения языка ребенком и применение конструкции конечного форсинга в обработке текстов на естественном языке.

Данная работа может оказаться полезной при создании поисковых систем: в случаях, когда по запросу из документа нужно извлечь необходимую информацию или по заданному запросу из большого количества документов извлекать релевантные, т. е. соответствующие данному запросу документы. На основе этой работы возможно создание системы, способной реконструировать содержание и выделять имеющиеся в тексте знания, которые могут быть представлены пользователю в виде компактных отчетов (схем, рефератов) или направлены в базу знаний.

Работа может быть полезной в построении теории смысла текстов, что является предметом исследований, прежде всего в лингвистике, а также в области математической логики.

Было разработано также техническое задание, не вошедшее в текст диссертации, на разработку системы разнообразного статистического анализа текстов. В настоящее время система уже реализована. В качестве данных для исследования были взяты тексты из художественной литературы и из словарных статей толкового словаря, предложения из устной речи, имеющие различное строение.

Для анализа предложений и текстов система использует функции программы ДИАЛИНГ синтаксического и морфологического разборов. С ее помощью может быть осуществлен поиск нужного слова в тексте или предложении, вычислена частота встречаемости этого слова, определена лексическая сочетаемость, возможен поиск предложения с заданной структурой по всему тексту, а также определение валентности слова и нахождение его актантов. Эта программа позволяет производить параллельно синтаксический и морфологический разборы, что является существенным при обработке текстов не только на синтаксическом, но и на семантическом уровнях.

Создан также прототип программной системы сопоставления грамматических предикатов словам. Она также использует систему ДИАЛИНГ.

Библиография Батура, Татьяна Викторовна, диссертация по теме Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей

1. Апресян Ю.Д. Экспериментальное исследование семантики русского глагола. М.: Наука, 1967.-251 с.

2. Апресян Ю.Д., Богуславский И.М., Иомдин Л.Л. и др. Лингвистический процессор для сложных информационных систем. -М.: Наука, 1992. -256 с.

3. Ахо А., Ульман Дж., Хопкрофт Дж. Построение и анализ вычислительных алгоритмов. -М.: Мир, 1979.-535 с.

4. Братцев С.Г., Мурзин Ф.А., Нартов Б.К., Пунтус А.А. Конфликт сложных систем. Модели и управление. М.: Изд. Московского Авиационного института, 1995. - 120 с.

5. Виноград Т. Программа, понимающая естественный язык. М.: Мир, 1976. - 296 с.

6. Вудс В.А. Сетевые грамматики для анализа естественных языков // Кибернетический сборник. Новая серия. Вып. 13. -М.: Мир, 1978. С. 120 - 158.

7. Гершензон Л.М., Панкратов Д.В. Описание синтаксического анализа в системе Диа-линг. Техн. документация по системе ДИАЛИНГ. М., 1999. - 234 с.

8. Гладкий А.В. Синтаксические структуры естественного языка в автоматизированных системах общения. М.: Наука, 1985. - 142 с.

9. Гладкий Ф.В. Формальные грамматики и языки. М.: Наука, 1978. - 368 с.

10. Рабин М.О. Разрешимость теорий второго порядка и автоматы над бесконечными деревьями // Кибернетический сборник. Новая серия. Вып. 8. М.: Мир, 1971. - С. 72 -116.

11. Крайг Г., Бокум Д. Психология развития. СПб.: Питер, 2004. - 940 с.

12. Кудряшова И.М. О семантическом словаре в системе ФРАП // Сб. научн. трудов. Вып. 271. -М.: МГПИИЯ им. М. Тореза, 1986. 8 с.

13. Кулагина О.С. Исследования по машинному переводу. М.: Наука, 1979. - 127 с.

14. Лейкина Б.М. К моделированию механизма контекстуального выявления значения речевых единиц // Представление знаний и моделирование процесса понимания. Новосибирск, 1980.-С. 17-30.

15. Лекомцев 10. К. Введение в формальный язык лингвистики. М., 1983. С. 7 23.

16. Леонтьева Н.Н. ПОЛИТЕКСТ: информационный анализ политических текстов // Сб. НТИ, сер. 2. 1995. - N4. - С. 20 - 24.

17. Маркус С. Логический аспект лингвистических оппозиций // Проблемы структурной лингвистики. АН СССР, 1983. С. 47 - 74.

18. Маркус С. Теоретико-множественные модели языков. М.: Наука, 1970. - 332 с.

19. Мать и дитя: от беременности до трех лет, или Мы ждем ребенка / Под ред. Савельевой Г.М. и Таболина В.А. М.: РИПОЛ КЛАССИК, 2003. - 736 с.

20. Мельчук И.А. Опыт теории лингвистических моделей типа «Смысл Текст». М., 1974.-315 с.

21. Попов Э.В. Общение с ЭВМ на естественном языке. М.: Наука, 1982. - 360 с.

22. Поршнев Б.Ф. О начале человеческой истории (проблемы палеопсихологии). М.: Мысль, 1974.-487 с.

23. Потиха З.А. Как сделаны слова в русском языке. Ленинград: Просвещение, 1974. -125 с.

24. Ревзин И. И. Некоторые вопросы теории моделей языка И Научно-техническая информация. 1964. - № 8. - С. 42 - 46.

25. Розенталь Д.Э., Теленкова М.А. Справочник лингвистических терминов. Пособие для учителя. М.: Просвещение, 1972. - 495 с.

26. Сакс Дж.Е. Теория насыщенных моделей. М.: Мир, 1976. - 192 с.

27. Словарь русского языка / Сост. Ожегов С.И. М.: Гос. изд-во иностр. и национальных словарей, 1953. - 848 с.

28. Современный русский язык: Учеб. для филол. спец. высших учебных заведений / Под ред. Белошапковой В.А. -М.: Азбуковник, 1997. 928 с.

29. Современный русский язык: Учеб. для филол. спец. высших учебных заведений / Под ред. Розенталя Д.Э. М.: Изд. МГУ, 1971. - 636 с.

30. Сокирко А.В. Реализация первичного семантического анализа в системе ДИАЛИНГ // Тр. Международного семинара «Диалог'2000» по компьютерной лингвистике и ее приложениям. Протвино, 2000. - 7 с.

31. Сокирко А.В. Семантические словари в автоматической обработке текста // Канд. дисс., МГПИИЯ, Москва, 2000. - 108 с.

32. Средства компьютерного представления лингвистической информации http://www.ksu.ru/eng/sciei)ce/iUc/vol000/002

33. Хомский Н. Синтаксические структуры // Новое в лингвистике. М.: ИЛ, 1962. - Вып. 11.-С. 412-527.

34. Языки и автоматы / Под ред. Маслова А.Н. и Стоцкого Э.Д. М.: Мир, 1975. - 360 с.

35. Alpern В. and Carter L. Towards a model for portable parallel performance: exposing the*memory hierarchy // Portability and Performance for Parallel Processing, John Wiley &1. Sons, 1994.-P. 21 -41.

36. Bakalash R., Kaufman A., Pacheco R., Pfister H. An Extended Volume Visualization System for Arbitrary Parallel Projection // Proc. of the 1992 Eurographics Workshop on Graphics Hardware. Cambridge, UK, 1992. - 7 p.

37. Barton G.E., Berwick R.C, Ristard E.S. Computational Complexity and Natural Language. -Cambridge, MA: MIT Press, 1987. 29 p.

38. Barwise J., Robinson A. Completing Theories by Forcing // Annals of Mathematical Logic. -Yale University, Vol.2, No. 2,1970. P. 119 - 142.

39. Chase G., Das J. and Davis S. Towards Developing Effective Fact Extractors // Defence Science and Technology Organisation. / PO Box 1500. Australia, June 2005. - 67 p.

40. Das J., Chase G. & Davis S. Fact Extractor System Processing Engine, DSTO-TR-1396 // Defence Science and Technology Organisation, 2003. 67 p.

41. Gazdar G., Klein E., Pullum G., Sag I. Generalized Phrase Structure Grammar. Oxford: Basil Blackwell, 1985. - 267 p.

42. Kuzmanov G., Gaydadjiev G. and Vassiliadis S. Visual Data Rectangular Memory // IEEE Transactions on Multimedia, 2005. 9 p.

43. Language Technology Lab http://www.dfki.de/lt/index.html

44. Lee D. Scrambled Storage for Parallel Memory Systems // Proc. IEEE International Symposium on Computer Architecture. Honolulu, HI, USA, 1988. - P. 232 - 239.

45. Linguistic Data Consortium Web Site: http://www.ldc.upenn.edu

46. Mckworth A.K. Constraint satisfaction // Encyclopedia of Artificial Intelligence (2nd edition), Shapiro S.C., (ed.). John Wiley, 1992. - P. 285 - 293.

47. Murzin F.A. Syntactic properties of the REFAL language // Int. J. Computer Math. 1985. -N17.-P. 123- 139.

48. Murzin F.A., Sluev V.A. A Memory Organization for Parallel Computers // New Generation Computing J. Vol. 6,No. 1, 1988.-P. 3 18.

49. Park J.W. An efficient buffer memory system for subarray access // IEEE Transactions on

50. Parallel and Distributed Systems, 12(3), March 2001. P. 316 - 335.

51. Partee B.H., Meulen A., Wall R. Mathematical Methods in Linguistics. Dordrecht: Kluwer, 1990.-692 p.

52. Retman B.&R. Do You Speak English? Warszawa: Wiedza Powszechna, 1977. - 160 p.

53. Sampson R. Context-free parsing and the adequacy of context-free grammars // Parsing Natural Language. King M., (ed.). Academic Press, 1983. - P. 151-189.

54. Saraswat V.A. Concurrent Constraint Programming // Proc. of 17th POPL. ACM Press, 1990.-P. 232-245.

55. Shieber S. Separating linguistic analyses from linguistic theories //Natural Language Parsing and Linguistic Theories, U. Reyle and C. Rohrer (eds.). Reidel: Dordrecht, 1988. - P. 33 -68.

56. Simmons R.F., Yu Y.H. The acquisition and use of context dependent grammars for English //Computational Linguistics. 1992. 18:4.-P. 391-418.

57. Van Voorhis D.C., Morrin Т.Н. Memory Systems for Image Processing // IEEE Trans, on Computers. 1978. - Vol. C. 27, No. 2. - P. 113 - 125.

58. Van Voorhis D.C., Morrin Т.Н. Memory Systems for Image Processing // Working Paper 15/3 45 /IBM System Communication Division. Los Catos, CA, August 1975.

59. Van Voorhis D.C., Morrin Т.Н. United States Patent N3, 995,253, November 30, 1976.

60. Van Voorhis D.C., Morrin Т.Н. United States Patent N3, 996, 559, December 7,1976.

61. Van Voorhis D.C., Morrin Т.Н. United States Patent N3, 938, 102, February 10, 1976.

62. Vanne J., Aho E., Kuusilinna K. and Hamalainen T. Enhanced Configurable Parallel Memory Architecture // Proc. of the Euromicro Sympos. on Digital System Design, 2002. P. 28 -35.

63. Vitter J., Shriver E. Algorithms for parallel memory I: Two-level memories. Algorithmica, 1994.-P. 110-147.

64. Vitter J., Shriver E. Algorithms for parallel memory II: Hierarchical multilevel memories. -Algorithmica, 1994.-P. 148-169.

65. Yngve V.H. A model and hypothesis for languge structure // Proc. Amer. Phil. Soc., 104. -I960.-N5.-P. 444-466.

66. ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

67. Batura Т., Murzin F. Logical Methods for Representing Meaning of Natural Language Texts

68. Lect. Notes. Сотр. Science. 2004. - Vol. 3038. - P. 545 - 551.

69. Батура T.B., Еркаева O.H., Мурзин Ф.А. К вопросу об анализе текстов на естественном языке // Новые информационные технологии в науке и образовании. Новосибирск,2003.-С.7-58.

70. Батура Т. В., Мурзин Ф. А. Логические методы представления смысла текста на естественном языке // Новые информационные технологии в науке и образовании. Новосибирск, 2003.-С. 59-111.

71. Батура Т.В., Корда О.В., Мурзин Ф.А. Исследовательская система для анализа текстов на естественном языке // Методы и инструменты конструирования и оптимизации программ. Новосибирск, 2005.-С. 7-21.

72. Батура Т.В. Представление смысла текста на естественном языке и его лексический анализ // Технологии Microsoft в информатике и программировании. Новосибирск,2004. С. 88 - 90.

73. Батура Т.В. Логический анализ представления смысла текста на естественном языке // Технологии Microsoft в информатике и программировании. Новосибирск, 2005. - С. 99- 100.

74. Батура Т.В., Корда О.В., Позименко А.А. Экспериментальная исследовательская система для анализа текстов на естественном языке // Технологии Microsoft в информатике и программировании. Новосибирск, 2005. - С. 101-102.

75. Батура Т.В. Методы логического анализа и представление смысла текста на естественном языке // Технологии Microsoft в информатике и программировании. Новосибирск, 2006.-С. 155- 157.

76. Батура Т.В. Исследовательская система анализа текстов на естественном языке // Технологии Microsoft в информатике и программировании. Новосибирск, 2006. - С. 158 -159.

77. Батура Т.В., Позименко А.А. Система анализа текстов на естественном языке // Материалы XLI междунар. научной студенческой конф. «Студент и научно-технический прогресс»: Информационные технологии. Новосибирск, 2003. - С. 101 - 102.

78. Батура Т.В. Анализ смысла текста на естественном языке // Материалы XLII международной научной студенческой конференции «Студент и научно-технический прогресс», секция «Инструментальные и прикладные программные системы». Новосибирск, 2004.-С. 195- 197.

79. Батура Т.В., Корда О.В. Программные средства для анализа текста на естественном языке // Материалы XLII междунар. научной студенческой конф. «Студент и научно-технический прогресс»: Физика. Новосибирск, 2004. - С. 194 - 195.

80. Батура Т.В. Применение деревообразного представления текстов в поисковых системах // Материалы XLIV междунар. научной студенческой конф. «Студент и научно-технический прогресс»: Информационные технологии. Новосибирск, 2006. - С. 159 — 160.