автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.01, диссертация на тему:Развитие технологии анализа деловых текстов путем учета эмоциональных оценок

кандидата экономических наук
Шарова, Татьяна Викторовна
город
Екатеринбург
год
2006
специальность ВАК РФ
05.13.01
Автореферат по информатике, вычислительной технике и управлению на тему «Развитие технологии анализа деловых текстов путем учета эмоциональных оценок»

Автореферат диссертации по теме "Развитие технологии анализа деловых текстов путем учета эмоциональных оценок"

На правах копией

□ОЗОБТЭЗЬ

Шарова Татьяна Внмороина

УДК 519 6

РАЗВИТИЕ ТЕХНОЛОГИИ ДИАЛИЗА ДЕЛОВЫХ ТЕКСТОВ ПУТЕМ УЧЕТА ЭМОЦИОНАЛЬНЫХ ОЦЕНОК

(на примерах применения в банковском и строительном секторах экономики)

Специальность 05 13 01 - Системный аналич управтение и обработка информации

Диссертация в виде научного доктада на соискание ученой степени кандидата экономических наук

Научный руководитель действительный член РАГН доктор технических на\к профессор Гольдштейн Сергеи Лю тигович

Ркатерннбург 2006

003067936

Работа выполнена в Уральском Межакалемическом Союзе

Официальные оппоненты - действительный чтен РАЕН проф лэн

Кчюев Юрий Борисович - действительный член МАНПО, проф д э н Внуковский Николай Иванович

Защита состоится 15 января 2007 г в 13 00 на заседании Диссертационной) Совеы Д02 017 PCO ММС 0191 по адресу 620077, г Екатеринбург, ул Володарского 4 НИИЦВЕТМЕТ/УМС

С диссертацией в виде научного доклада можно ознакомиться в НП «УМС» Диссертация в виде научного доклада разослана 15 декабря 2006 г

Ученый секретарь

диссертационного совета проф к ф-м н

В И Рогович

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность исследования

Для эффективного управления органи нацией необходима самая разнообразная информация Она служит фундаментом для формирования тюбых документов (докладов, отчетов, служебных записок предложений и т п ), которые лежат в основе управления Любые действия руководителей исполнителей, клиентов/потребите пей опираются на информацию Il s\чепие отечественного и зарубежного опыта показало, что важны не тотько синтаксис и семантика документа, но и эмоциональное восприятие Такая оценка имеет под собой наработанную психолого-лингвистическую базу При этом областью приложения служат, как правило, тексты вербатыю-г\млппирпо! о и mim Работа же с деловыми текстами ограничиваем cían мртым набором средин компьютерной подготовки документов с использованием юридической и финансовой поддержек

Проблемы анализа текстов относятся к нескопьким научно-техническим дисциплинам теории сложных систем, психолого-лингвистическим пачкам, разработке и использованию программных продуктов и т п Исследования по анапизу сложных систем отражены в работах как зарубежных ученых G Good R Makcole, M N Rabin и др, так и отечественных H П Бусленко, В В Дружинин, Д С Конгоров, H H Моисеев, Д А После юн ГС 1 loci к юн и ip Психолою-лингвистическому направлению анализа текстов посвящены рабош зарубежных G В Mangaim, R К Rich и др и отечественных АН Алексеева, ЮА Асеева, РМ Габитовой, А А Харламнова и др авторов При анапизе текстов используют компьютерные программы, связанные с анализом текстов и вычислительной лингвистикой, разработанные как зарубежными M Bai low, M Scott, J J Paijmans, R J С Watt и др , так и отечественными В П Бетянин Л M Делицын, С В Логичев, В П Сысуев, В И Шалак и др специалистами

Однако в этих трудах и разработках технология анализа деювых текстов представтена пока еще весьма фрагментарно В юле время имейся социальный заказ на подобные работы Поэюму 1ема тиссеркщионною исследования актуальна

Авторские разработки по этой тематике были скоординированы следующими программами

- Программа развития Свердловской области на период до 2015 года

- Прогноз социально-экономического развития города Екатеринбурга и основные направления бюджетной и налоговой полишки на период ю 201

- Концепция развития ОАО «Банк «Екатеринбург» на 2006-2008 гг

- План развития ЗАО «Нова Строй», г Екатеринбург, на 2005-2010 гг

Объект исследования - технология анализа документов

Предмет исследования - развитие технологии анализа деловых текстов путем

учета эмоциональных оценок

Цель - развитая технология анализа документов

Задачи:

- анализ проблематики с выходом па прототипы,

- развитие и структуризация понятийного аппарата технологии анализа текстов,

- развитие технологии анализа текстов,

- развитие подсистемы подготовки документов,

- апробация развитой технологии анализа текстов и подготовки доку мен гов

Методы исследования- экономико-математического моделирования, системного подхода, менеджмента, теории управления, теории экономической эффективности, компьютерного анализа текстов Научная новизна*

- на основе литературно-аналитического обзора предложен пакет прототипов по средствам подготовки деловых текстов, по типологии основных понятий, по моделям анализа и подготовки текстов,

- предложены иерархические тезаурусы основных понятии по технологии анализа текстов и коммуникациям,

- получены пакеты алгоритмических, кортежных и функционально-структурных моделей технологии анализа текстов,

- проведен фоносемантический и фоноколористический анализы экономического текста, позволившие развить прототипный метод,

- развита подсистема подготовки документов путем учета эмоциональных оценок

Практическая значимость: результаты разработок использованы на 2-\ предприятиях, о чем имеются акты внедрения

Апробация работы: основные положения и полученные результаты докладывались на Научно-практической конференции с международным участием «Экономическая культура в условиях развития рыночной экономики отечественная практика и опыт международного сотрудничества», 2006 г, г Екатеринбург, X отчетной конференции молодых ученых ГОУ ВПО УГТУ-УПИ, 2006 г , г Екатеринбург, заседаниях топ-менеджеров ЗАО «Нова-Строй», 2005-2006 гг, г Екатеринбург, совещаниях руководитепей структурных подразделений ОАО «Банк «Екатеринбург», 2006 г , г Екатеринбург Публикации: По материалам диссертации имеется 8 публикаций в научных изданиях

Структура диссертационного исследования включает в себя введение, 5 глав глава 1 — проблематика технологии анализа тексюв е \чеюм эмоциональных оценок (литературно-аналитический обзор), глава 2 - развитие и структуризация понятийного аппарата техночогии анализа текстов, глава 3 -развитие технологии анализа текстов, глава 4 - пример анализа экономического текста, глава 5 - развитие подсистемы подготовки документов путем учета эмоциональных оценок, заключение и список* основных публикаций по теме диссертации

ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ

ГЛАВА 1. ПРОБЛЕМАТИКА ТЕХНОЛОГИИ АНАЛИЗА ТЕКСТОВ С УЧЕТОМ ЭМОЦИОНАЛЬНЫХ ОЦЕНОК (ЛИТЕРАТУРНО-АНАЛИТИЧЕСКИЙ ОБЗОР) 1.1 Поиск информации

По ключевым словам просмотрено 130 библиографических источников в тч 45 зарубежных, а также отобрано 86 адресов Internet Оценены по июта релевантность и пертинентность этой информации

1.2 Аналоги и выход на прототип

В результате литературно-аналитического обзора выявлены основные аналоги (таблица 1)

Таблица 1

Аналоги, отражающие основные аспекты технологии анализа текстов_

№ Наименование Аналоги

' 1 Средства подготовки документов 1 1 Текстовые процессоры MS Word AbiWord, Kword Openoffice org writer Polvedit Text Tlnnkfiee oftkc wiitc

1 2 Системы документооборота Directum documentum 1 фр ч - юк\muiюиборш БОСС-рефер1_нт DocsVision Mlectotlke 1 anDocs Дето-предприятие Company Media/ottice media Hummingbird enterprise Naudoc

1 3 Юридическая поддержка Консутьтант плюс Гарант, Бтиц-договор

1 4 Даталогическая поддержка Архстройконсатт (строительство) Банк XXI - век (банковская)

1 5 Финансовая поддержка «Универсатьная бухгатгерия» R-st\ II 1С Бухгалтерия LFADFR classic ИН Ж Анатитик Audit Expert, Onvision Альт - Финансы АБФИ - предприятие

2 Типология понятий и дефиниция 2 1 Коммуникации Словари энциклопедии монографии

2 2 Теория текста

2 3 Контент-анали 1

3 Методы анализа текстов 3 1 Вербально-описательные ВААЛ-2000 Программа Я Л Либермана для анализа поэтических текстов

3 2 Лингвистические Морфологический анализатор Monoconc АОТ Fresh Eye, Lingsoft ,

3 3 Математические Tecktit, Hermit Crab Лингвоанализатор

4 Модели функционирования технологии анализа текстов 4 1 Функционально-структурные SADT-ногации кортежные модети

4 2 Алгоритмические Язык блок-схем

1.3 Критика прототипов и гипотезы о предполагаемых решениях

Недостатки прототипов и гипотезы о предпоаагаемых решениях представлены в таблице 2

Таблица 2

_Недостатки прототипов и гипотезы о предполагаемых решениях_

Ранг прототипа

Прототип

Наименование п рототи па/анал о га

Недостатки

Предполагаемое решение

I

Система и технология подготовки документов

Ограниченная функциональность

Развитие системы подготовки юкчменюв л счет ввода блоков «Компьютерная оценка»

«Оценка восприятия» «Модификация» _«Компьютерный подсказчик»_

Типотогии понятий и дефиниций «Коммуникация»

по В С Мичалевичу Контент анализ по Ю А Асееву В А Владыкину Дж Б Мангейму Р К Ричу Теория текста из словаря по кибернетике 1989 г лингвистического •энциклопедического словаря 1990 по С А Рейсеру

Фрагментарность

Инвариантная часть тезауруса по терминам «Комм\никация» «Кон ген г шти» и

V I ШрИЯ I I

Методы анализа текстов по змониональным оценкам по В И Шалаку Я Л Либерману

Модели функционирования технологии анализа текстов

Недостаточная адаптированность

к деловым и научным текстам

Ограниченная функциональное

Мо шфиклиия

Модель преобразования информации в эмоционально-информационный куб ф\гнкционально-стр\кпрные модели

KOpieAHI.il. И ,П[ОрН!\!11'К(.К1К МО К Ш

Глава 2. РАЗВИТИЕ И СТРУКТУРИЗАЦИЯ ПОНЯТИИНОГО

АППАРАТА

2Л Постановка задачи

Одной из опорных точек в области работы с инфосырьем мог\т бьпь технологии анализа текстов При этом список ключевых слов данного вида анализа включает в себя термины текст, текстология, теория текста, критика текста, текстовый анализ, лингвистика, семиотика, синтаксис, семантика, прагматика герменевтика, экзегетика контенг-анализ риторика китенка и I 1 Единого взгляда на этот конпомераг понятий пег ни и тпокиии Сформпрнна икь несколько отдельных теоретических аспектов философский ттератчрныи филологический и т п Привлекаются разные парадигмы гуманитарная техническая

естественно-научная Практические аспекты отличаются объектами приложения (художественная литература религиозные тексты научные фу и.1 и 11) субъектами (автор текста, редактор, издатель, читатель) и методиками анализа (от вербально-описательных до строгих математических) Актуальность наведения хотя бы субпорядка в этой области очевидна 2 2 Создание тезаурусов-предпосылок

Разработан пакет фрагментов иерархических тезаурусов по нескольким основным понятиям коммуникация, теория текста, герменевтика, контентный анализ, риторика, семиотика, кинесика, математическая лингвистика (примеры на рис 1-5)

О Иронии

Рис 1 Фрагмент иерархии понятий по термину «Коммуникация» по В С Михатевичу (1-аспекты 2-типы, 1 1-технический, 1 2-семантический 1 3 - прагматическим 2 - человек / четовек 2 2 - четовек/ЭВМ 2 3-ЭВМ/ЭВМ)

„ Уровни

Рис 2 Фрагмент тезауруса понятий к термину «Теория текста»

(1 - лингвистика, 1 1 - внешняя лингвистика, 1 1 1 - язык в связи с историей народа и цивилизации 1 1 2 - язык в связи с политикой, I 1 3 - язык в связи с литературой, 1 1 4 - язык в связи с его географическим распространением и тд,12 - внутренняя лингвистика (языкознание) I 2 1 - устройство языка 1 2 2 - структура языка 1 3 - интерпингвистика 111-международный язык как средство межязыкового нее ¡едования 2 - с1р\кт\ра км и 2 I графическое деление текста 2 I I - рубрикация 22 - смыстовля оркшшацич к кем 2 2 I информационная 2 2 2 - логическая 2 2 3 - психологическая 2 2 4 - эстетическая 3 -герменевтика (толкование) текста 3 1 - традиционная классическая герменевтика 3 11-синтаксический анализ 3 1 2 - семантический анализ 3 1 3 - прагматический анализ 3 2-современная литературная герменевтика 3 2 1 - анализ внутренней логики единой констр>кции

текста. 3 2 1 — анализ значения текста 3 2 3 - контент-анализ текста 4- грамматика текс га 4 1-словообразование 41 1 - слово как отдетьпая единица 4 I 2 - с твообра «тле и.пая ии км I 413 — способы словообразования 42 - морфою! ия 42 1 мирфо пи им |шм 42^ чорфозогия грамматических изменений слова 4 2 3 - морфочшия I рамма! ически\ характеристик слова, 43 - синтаксис 43 1 - синтагматика слова 4 3 2 - синтаксис словосочетания 4 3 3 - синтагматика предложения, 4 3 4 - синтаксис форм слова)

Рис 3 Тезаурус понятий по термину «Контентный анализ» (1 - тнпотогия текстов для анализа 2 - задачи анализа, 3 - методы анализа 1 1 - по жанру I 2 -по способу фиксации информации 1 3 - по целевому назначению 1 4 - по чисзу авторов 2 1-изелечение информации 2 2 - анализ информации 23 - разносторонний аначиз прешсга (проблемы ситуации), 3 1 - традиционные методы 3 2 - контекстные методы 1 1 I - на\ чиые 112 - художественные 113 - общественно-политические 114 - информационно-документальные, I 2 I - письменные 1 2 2 - устные 12 3 - фонетические (рассчитанные па слуховое восприятие), 124 - аудиовизуальные 13 1 - естественно функционирующие (це ей внешние по отношению к исследованию) 13 2 - «целевые» документы (полученные исследоватеie\i, согзасно исследовательской программе), 1 4 1 - один автор / составитель) 1 4 2 - два и бозее авторов / составителей), 2 1 1 - извчечение открытой для понимания информации 2 12 - извлечение суггестивной (внушенной) информации, 2 2 1 - реферирование 2 2 2 -экспертиза 23 1 - интегральный аначиз 2 3 2 - ситуационный .шиш 2 33 пробивший анализ 31 I - статистический ана 1из 312- пни вис шчсскии ли ш ' 3| 3 мирфоmi пчч i пи анализ, 3 2 1 - информационный анализ 3 2 2 - структурный (темопичсскии) ана ш' 3 2 > пробпемно-мотивационный анализ 3 2 4 -контент-анапиз)

Уровни О

(1 - коммуниканты 2 - тексты 3 - диалог в парадигмах 1 1 - неживой природы 1 2 -живой природы 2 1 - по жанру 2 2 - по способу фиксации информации 2 3 - по целевому назначению 2 4 - по авторству 3 1 - системной, 3 2 - естественно-научной 3 3 - в

гуманитарной, 3 4- бытовой 1 1 I - первой природы 1 1 2 - второй природы 12 1 с первой сигнальной системой, 1 2 2 - со второй сигнапыюй системой (речью) 2 11-научные 2 1 2 - художественные 2 1 3 - техническая, 2 1 4 - общественно-политическая 2 1 5 - документально-информационная 2 1 6 - бытовые 2 2 1 - письменные 2 2 2 - устные

2 3 1 - по типу 2 3 2 - по виду 2 4 1 - ранг 2 4 2 - котичество 3 1 1 - в сис гечотогии 3 1 2 - в системотехнике 3 2 1 - в математике 3 2 2 - в информатике > 2 > » фи - пи '24 н химии 3 2 5 —в астрономии—3-2-6-в науках о зечте 3 2 7 - в био ioi ии 32 8 к >ко ioi ии

3 2 9 - в экономике 3 2 10 - в медицине 3 3 1 - в фичософии 3 3 2 - в психотогни 3 3 3 в социо ioi ии 3 3 4 - в истории 3 3 5 - в культурологии 3 3 6 - в политологии 3 3 7 - р юриспруденции 3 3 8 - в теории текста 3 4 1 - дом 3 4 2 - работа 3 4 3 - общество)

Глава 3. РАЗВИТИЕ ТЕХНОЛОГИИ АНАЛИЗА ТЕКСТОВ

3.1 Кортежная модель функционирования и развития технологии анализа

текстов (ФР TAT)

Кортежная модель задачи ФР TAT в SADT-формализма может быть представлена в виде

ФР TAT = (С, Р, МУ, МР, П, R), ( 1)

где С — инфосырье, Р - инфопродукт, МУ - механизм } правления, МР -механизм реализации, П - технологический передел

Для поставленной задачи

С = (Cl, С2, СЗ, R1), (2)

где С1 - анализируемый текст, С2 - задача анализа, СЗ - задача развития систем и подсистем,

МУ = (Tl, Т2, ТЗ, Т4, R2), (3)

где требования к качеству Т1 - решения задачи анализа текста, Т2 -

технологии анализа текста, ТЗ - развития подсистем, Т4 - анализа совместимости (понимаемой по Г В Ложкину 1980 г),

МР = (И1, И2, R3), (4)

где И1 - исполнители, И2 - инструментарий поддержки 1ея1етьност исполнителей,

П = <П1,П2, R4), (5)

где технологические переделы П1 - анализа текстов, оценки качества анализа текстов, оценки технологии анализа текстов, П2 - развития технологии анализа текстов, R, R1-R4 - матрицы связи

3 2 Функционально-структурные модели

Создан пакет функционально-структурных моделей в нотации BPWin, фрагменты которого представлены на рис 5-8

14 п и [ \MIIOR щи 11*114 та, РпиЮч1\0 шил и\ич>\п\1

(ПчОЦ (. I I XI \ 141'и, м | . .

I ,1!1 МЛ1М1 МП N 1 1

Кпггч I ^_I ■. (| : ч щ_____.11 щ и м IIIX

Печь ново!. клч^тво Т \Т пц ре тьтатов Т4 Заинтересованные ница-потьзоватеть ТАТ

Обеспечить функционирование и развитие ТАТ

Кй ■ т 1X1 и Обеспечить ф\ нкционирование ира?витие М \lBhR

А-0 ! ТАТ [

Рис 5 5АОТ-нотация задачи ФР ТАТ уровня АО

IV 1) А1 АННСК РАТЬ 08 « 2006 Р \URM4i ШШ |)\П ,1 (1М1 \|

ГТОШ ЫЛ 0^ 2006 га АН |

йртммр\прп |

1 ЖШ. 1 714^67X9 10 РПШГЛТНЛ 1 но 1

мте Т111Р Цчссгеч иьфлнк'тонироваш'е и рпвнтис Г\Т |М1 \В! и

-----

Рис 6 БАОТ-нотация задачи ФР Г А 1 уровня А1-А2

NODE

TITLE Обеспечить фуикционирование TAT

NUMBER

Рис 7 S M) I-нотация задачи ФР 1Л1 уровня А11-Л 14

USfD AT AUTHOR DAT С 08 04 2006 PRO IECT 1 RrV 15 05 2006 NOTF.S 1 "> "5 4 5 f, 7 К 0 1(1 WORKING READER DA ГЕ CONTEXT cu AO

DRAFT R Г COMMENDED

PlIRI 1ГЛТ1ПМ

NODi

\2

riTLl

Обеспечш ь развитие TAT

NUM1SI l<

Рис 8 SAD l-шпация задачи ФР ГА1 уровня А21-А24

При этом технологию анализа текстов предложено развить за счет введения блоков модификация, эмоциональная оценка, подсказчик

ГЛАВА 4. ОПЫТ АНАЛИЗА ЭКОНОМ И ЧБХКО! О Т1 КС I Л С ПРИМЕНЕНИЕМ ПРОГРАММЫ «ВААЛ-2000»

Учитывая повышенный интерес к проблеме системной интеграции, в качестве примера для анализа был выбран текст, относящийся к экономической интеграции Для проведения анализа использовали компьютерную психолингвистическую программу лексического и контент-анализа текстов «ВААЛ-2000», ориентированную на прогноз воздействия гуманитарного текста на массовую аудиторию с выявлением личностно-психологических качеств автора текста по А П Журавлеву Объектом приложения служила книга С Г Важенина и др, Интеграционные процессы инсшты кп кмции перспективы - Екатеринбург Ин-т экономики УрО РАН, 2004, - 89 с 4Л Первичное некомпьютеризнрованное восприятие текста

В анализируемом тексте рассматриваются теоретические основы экономической природы территориальной и производственной интеграции и институционной структуры данного явления, выявляются основные тенденции интеграционного взаимодействия как региональных социально-экономических систем, так и предпринимательских сообществ Предлагается обзор наиболее перспективных в настоящее время организационно-экономических технопогий и инструментов активизации региональных интеграционных процессии

Текст состоит из введения, пяти глав и заключения Его первичные экспертные оценки, полученные в некомпьютеризированном варианте приведены в таблице 3

Таблица 3

Субъективная первичная оценка восприятия экономического текста

Объект оценки Оценки от 0 до 1 по признакам

интереса/ важности непонятности/

необычности затрудненности восприятия

1 2 3 4

Введение 06 0 8 11 X

1 2 3 4

Гтава 1 06 06 0 8

Глава 2 05 06 08

Глава 3 0 7 0 X ч 0

Глава 4 Об 06 0 7

Гтава 5 06 0,5 0,7

Закпючение 07 06 0 5

Видно, что субъективные впечатления от текста противоречивы

4.2 Алгоритм компьютеризированного анализа текста.

Алгорита (рис 9) отражает работу прототипа (блоки 1-13, 17-22) и предлагаемую нами его модификацию (блоки 14-16)

Испотнитечь Т В Шарова

Заказчик УМС

Итерация 0 1 2 3(4)5 6 7 8 9 10

Начало цикла по текстам

Информация о тексте авторах намерениях критериях

12

По критерию непротиворечивости двух оценок

Ислотьзование ВААЛ 2000

13 1

Итоги 1

Начало цик!а по разбивке

К КС ы

оценка I фоносемантическая оценка 2 фонокоюристическая

см. рис. 10 текст: а неленив. 5 глав.

разделы глав, заключение

M однф акация программы ВААЛ 2000 нее использование

~Г7 Р

П г

L к<

J п<

Конец цикла по текстам

20

Коней цикла по разбивке

22

Результаты, Отчет.

( )1Ш I

с

Рис.9 Алгоритм анализа текста

4.3 Результаты анализа по ВААЛ-2000

Анализ выполнен по всей книге по главам, по разделам, по абзацам. Весь текст, как единое целое, получил опенки от BAAJ1-2000, приведенные на рисунке 10.

K^jl-ISHÎ: La я s naci luû lipan T П44

яоСфдо

- fiytKSi

li '- Т-Чк H H*+J

Lluuiuiç

i JJUV."

-Э0. 1 -45 , -31

y

-51 , 1. 0,1

ПЛОХОЙ ■inir» K№

»tpSJ^JtvS!

могучий

KCu.<lW'l IlojBinaWi Йий-трол aKTJtfciiiat

Й^СИз! pMOf*H4('

и, ч

31. * ЛЯГХ4,

Г>. г.

20,0 С. гь>Лий

05.2

. ^ЩЩЙШ т««иА

Tf'V

-^.^яймммм Щ кицы*

iCAfJlHTwJIlliLBI

-5з, гДриДДИИ

-11. г{■

J

А. ft

ДЙНУ.ЧЙ tc,Ki:î !»|КЖа»с9>>[ »¡¡ечиГг^х^-ч ПЛОХОГО, UK-f-T^rf., ¿KP-JXOtL-. УГЛСПЛТОГО, ЭЛСГО. СВЦТЛОГС,

erJtîWËCTBLniWvtl, ГНХК^ГО, CHSlbknZb, ХС/Ю£([СчС, ги>;сго,

ТГУСЯКССГО, xnroi-o. KWtWbMCJl4>r HKCiJtWtt, .адиИШМЙГО, тДЛЕкЯОГС, IIACOJ3HW>г<?

^ li'/КЛ -I ! !»/■ M (V.KV.IK .J ïf.KL Тч1

Рис.10 Экранная форма программы ВААЛ-2000 для текста в полном объеме (фоноколористическая оценка внизу жрана слева направо: желтый, синий, коричневый)

t6

Общая фоносемантическая оценка (рис 10) положительное восприятие -270 баллов, отрицательное - 611, фоноколористическая оценка желтый - 1, синий - 1, коричневый - 1

Видно, что фоносемантическая оценка в целом отрицательна Дтя интерпретации же фоноколористической оценки учли исходные посылки методики Я Л Либермана, суть которой в истолковании цветов типа желтый, синий, зеленый - интерес/удивление, коричневый, фиолетовый - \том перше' отвращение Тогда фоноко юристическая оценка суммарно ик I I I с положительна, что противоречит фоносемантической оценке

Для уточнения противоречий/совпадений (п/с) фоноколористических и фоносемантических оценок экспериментальный материал проанализирован нами с разбивкой текста по разделам, абзацам Пример результатов анапиза всей книги с разбивкой по главам приведен в таблице 4 Общая картина, сведенная в таблицу 5, подтверждает вывод, полученный по оценке текста в целом, а именно фоносемантическая и фоноколористическая оценки противоречивы

I 10 пни 4

Оценка глав книги

№ ОЦЕНКА Итог

павы фоносеманти ческая фоноколористическая

книги + - Д цвет доля цвета Д

ВВ 50 118 -68 ж 0,45

с 1,00 0 45 п

к 1,00

1 102 325 -223 ж 1,00

с 1 00 1 20 п

к 0,80

2 119 360 -241 с 1,00 0 00 п

к 1,00

3 282 236 46 ж 1,00

с 1 00 1 00 с

к 1 00

4 82 254 - 172 ж Г 1 00

с 1 00 1 00 н

к 1,00

5 104 254 - 150 ж 0 75

с 1,00 0 75 п

к 1 00

ЗК 78 175 -97 ж 0 75 п

с 1,00 0 95

к 0 80

цвета жетгый - ж, синий - с, коричневый - к, зеленый, совпадения =1/7 = 0 14

f do IHUd 5

Анализ совпадения (с) фоносемантической и фоноколористической оценок _фрагментов текста_

Фрагменты текста с,%

по главам 14

по раздетам и абзацам глав 28

по отдельным абзацам <62

4.4 Модификация алгоритма

Модификация прототипа 3 (блок 16 на рис 9) связана с допопшк и.ноп

обработкой (рис 11), например, по правилам

If Л< 0 then Л* а, (1)

If А> 0 then А* Д (2)

If А - 0 and а = 0 then А = 0, (3)

If А> 0 and 0 then А - 0, (4)

где а - доля коричнево-фиолетовых цветов, Р - доля желто-зеленых цветов

Ачгоритм работы прототипа после его модификации представтен на рис 11

Исполнитеть Т В Шарова

Заказчик УМС

Итерация 0 1 2 3 4 5 6 9 10

С

Начало 16

_L

3

Начало цикла по развитию программы BAAJI-2000

р

Например, по моделям (1-4)

По критерию непротиворечивости двух оценок

Дополнит обработка

Прсилн п ин крир

10 11

Итоги 2

Информация о критериях

I р )фнн I

Рис И Алгоритм модификации про1рачмы BAAJ1-2000

4 5 Результаты модифицированных оценок

Материал по модифицированным оценкам представлен на рис 12-19 Видно, что противоречия в оценках сняты максимумы в оценке «удивление» совпадают с минимумами в оценке «утомтение» Таким образом нос ie модификации программа BAAJI-2000, ориентированная первично на художественные тексты, оказалась пригодной для анализа научного экономического текста

Pitt 12 OlltHM ti-Htu. VK14 IMIItt - PIIL П OllUII Ii , |\ IllHIUlllc \i.imiuiml \) 110 p IUL I IM (ll„) вне 11.Н11Я Mimpni I IM III ........

19

40

150

120

90-

Л п!\

- выделенные предпосылки технологии анализа деловых текстов,

- получен пакет из апоритмическнх п ф> пмшопл п>по-с I р\ к 1 \ рт ^ моделей технопогии анализа текстов

На основе предложений разработаны рекомендации персона 1у генерирующему документы, апробированные на 2-х предприятиях с положительным эффектом ЗАО «Нова-строй» - сфоитетьный сек юр экономики, ОАО «Банк «Екатеринбург» - кредитно-финансовым сек юр экономики

В результате создан задел для дальнейших исследований и разработок в области анализа документов

Пубчнкации по теме исследования

1 Филющенко J1 И , Шарова (Московских) Т В Правовые проблемы подбора кадров //Сб научных статей «Инновационные процессы экономика и управчение» Екатеринбург УГТУ. 2000, с 507-513

2 Гольдштейн С Л Московских В А Шарова Т В Состояние проб юмы сиысмиоп интеграции в жилищном ыроитечьстве и up*, i ui icmoc решение Ike i инк M |\. УПИ Серия строительство и образование - Ькагеринб\р| 1 OV ВПО >1 li-УПИ 2005 с 98-104

3 Moskovskikh V A Goldshtein S L Sharova T V Frolova E D Hierarchical thesaurus of terms m the field of system integration in house building (for top-managers purposes) //Сб научных трудов международной научно-практической конференции «Экономическая культура в условиях развития рыночной экономики отечественная практика и оныг сотрудничества», вып 8 ,-Екатеринбург ГОУ ВПО УГТУ УПИ 2005 с 215-217

4 Sharova Т V Algorithmic modeling activity on opening the settlement accounts in the bank // International scientific and practical conference "Economic culture under the conditions of development of market economy home practice and experience of intelnational cooperation", вып 9, - Екатеринбург ГОУ ВПО УГТУ УПИ, 2006, с 67-70

5 Гольдштейн С J1, Московских В А, Шарова Т В Информационная основа Российского рынка гражданского строительства'/Сб научных трудов международной научно-практической конференции «Экономическая кучьтура в условиях развития рыночной экономики отечественная праюика и оныг coip\ цшчсыва» пмн 9

-Екатеринбург ГОУ ВПО УГТУ-УПИ с 232-235

6 Гольдштейн С Л , Шарова Т В Технология анализа гексюв imiojioi ия поия1ий ./Со научных трудов X отчетной конференции молодых ученых ГОУ ВПО УГ 1У-УПИ ч 1 - Екатеринбург ГОУ ВПО УГТУ-УПИ, 2006 с 153-158

7 Шарова ТВ, Гочьдшгейн С Л Московских В А Модечи функционирования и развития технологии анализа текстов // Сб научных трудов «Современные техночогии и бизнес», вып 1,-Челябинск ЧНЦ РАЕН 2006 с 96-106

8 Гольдштейн СЛ, Шарова ТВ Развитие технологии анализа текстов n\ie\i \чыа эмоциональных оценок в печати

Подписано в печать О ? Об Формат 60x84 /]6

Бумага типографская Плоская печать Уел печ л {, 62

Уч-изд л 1Ъ5 Тираж Заказ 6/2

Ризография НИЧ ГОУ ВПО УГТУ - УПИ 620002, Екатеринбург, ул Мира, 19

о 1 _