автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.12, диссертация на тему:Автоматизация проектирования средств диагностики и обучения решению задач словообразования
Автореферат диссертации по теме "Автоматизация проектирования средств диагностики и обучения решению задач словообразования"
у - _ t IIa пранах рукописи
■ - fW ь: ¡7
Порпгпша (Ipi)iia Eurem.cnim
АВТОМАТИЗАЦИЯ ПРОЕКТИРОВАНИЯ СРЕДСТВ ДИАГНОСТИКИ И ОБУЧЕНИЯ РЕШЕНИЮ ЗАДАМ СЛОВООБРАЗОВАНИЯ
Специальность 03.13.12 - Системы аптома гшацин проектпровяшш
05.13.10 - Упрямлснпс п социальных и экономических системах
АВТОРЕФЕРАТ
диссертации »я соискание ученой степени кандидата технических пяук
Воронеж- 191)7
Работа выполнена и Iíoji::>¡c;kckoii инупрепк щит нчиичссюм ' университете
Научный pj ководтель: злслухепш.ш uva н п. пауки 1'Ф,
д-р теми наук, проф. Лышппч Я.К.
Научный консультант: д-р ф» t. наук, проф. lípcion Л.Л.
Официальные оппонешы: академик РЛЕП,
д-р чехи, паук, проф. Чапцепа 7iC.II.
Kii'i и'*«, наук, доц. НпсмурштС.А!.
Ведущая организации: Игслсдшмюльский itemp проблем
качееша ии.иотот-" снсциилнсгог (г. IVIociciia)
Защита диссертации состоится 19 декабря 1997 г. в коиференн-залс на заседании диссертационного соне га Д (¡63.fi!.1)2 при Воронежском государственно'.! техническом унннсрснгсгс но адресу: 394026, г. Воронеж, Московским нросиет, 14
С диссертацией мо;кно ошаколштьел и библиотеке Воронежского государственного техническою ушшереннма.
Автореферат разослан
Ученый секретарь диссертационного concia
/р.-
Лмюпич Я.Е.
ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ
А;пу:и;;.;:осг;. темы. Повышение эффективности и качества проведения прикладных, научных исследований напрямую связано с автоматизацией проектирования инструментальных средств для ' реализации данных исследований. Применение новых технологий как основного средства эффективного управления в со/шальной образовательной системе определяет необходимость наличия инструментов познания, активно ' вовлекающих обучаемых в процесс формирования знаний.
Прикладные научные исследования в облает русского словообразования характеризуются тем, что обычные способы сбора и' обработки информации не обеспечивают необходимой быстроты, полноты и качества ее переработки. Наличие большого объема нетворческой, рутинной работы значительно тормозит исследовательский процесс, не позволяя исследователю в полной мере, реализовать свои возможности. Отсутствие диагностического инструментария, позволяющего количественно оГюшггь степень приближения получаемых результатов к реальности, также не способствует повышению эффекшвностн и качества исследований. • •
В последние два-трн десятилетия возрос интерес к вопросам словообразования,, что непосредственно сг.язано с интенсификацией изучения русского языка, играющего определяющую роль в функционировании социальных систем. Но, несмотря на непрерывное расширение и углубление проблематики, связанной с изучением словообразования, совершенствование методов и принципов анализа, привлечение для исследования новых материалов, на сегодняшний день наука находится только в начале сложного пути к познанию системы русского словообразования. В связи с этим представляется актуальной научная задача автоматизированного проектирования исследовательской, диагностической, образовательной деятельности и управления обучением п области словообразования.
Таким образом, актуальность диссертационной работы определяется необходимостью разработки математического, алгоритмического » программного обеспечения автоматизированного проектирования средств. диагностики н обучения решению задач словообразования, управления в образовательной системе.
Работа выполнена в соответствии с межвузовской научно-технической программой 12.11 "Перспективные ниформгьиоиные технологии в образовании", в рамках одного из основных направлений Воронежского государственного технического университета "Системы автоматизированного проектирования и автоматизация производства".
Пель и задачи исследования Целью диссертационной работы является разработка моделей, алгоритмов и программных средств, обеспечивающих Автоматизацию проектирования средств диагностик!', и управления обучением 'решению задач в орласти словообразования. Для достижения указанной цели в • работе решались следующие основные задачи:
формирование структуры модели словообразовательного процесса (на примере русского словообразования) как объекта проектирования;
.■ алгоритмизация проектирования словообразовательного процесса; - .. создание математической модели средств диагностики словообразования; " разраоотка и программная реализация алгоритмов автоматизации [форктиррсания диагностических средств и управления обучением;
организация вычислительного эксперимента на базе реализованных, алгоритмов, подтверждающего возможность применения диагностических средств в процессе автоматизации проектирования средств управления обучением в области рловообразования; ' .
апробация, совокупности спроектированных диагностических средств и инструментария игйчедования словообразования как автоматизированной системы д^ашостики и обучения решению задач словообразования.
Методы исследования основываются на вероятностно - статистических методах теории информации, теории управления и автоматизированного проектирования, методах системного анализа.
Научная новизна: Основные результаты диссертации, выносимые па защиту п имеющие научную новизну, заключаются в следующем:
сформирована структура модели автоматизированного проектирования средств диагностики и проведения исследований в области словообразования, позволяющая поэтапное приближение к решению проблемы полной форматизации словообразовательного процесса;
предлагается подход к формированию технологии образовательной деятельности в области обучения решению задач русского словообразования, основанный на методе лингвистического эксперимента и позволяющий обучаемому самому конструировать знания, что способствует эффективному управлению образовательным процессом; . . <
разработана математическая модель средств диагностирования словообразовательного процесса, отличающаяся применением вероятностно-статистических методов теории информации для реализации количественной диагностики и изучения тенденции словообразования;
'разработаны алгоритмы автоматизированного проектирования средств диагностики задач словообразования, отличающиеся универсальностью по
отношению к чтлпам рпнения проблемы полной ферма;;« юцич словообра зовате пьнаго процесса;
разработана модель актомажзиронаиного проектирования средств диагностики н управления обучением в области словообразования русского языка, характеризующаяся обратной связью н возможностью'своего пополнении по мере накопления и анализа информации, а также большой степенью универсальности по отношению к применению в исследованиях по словообразованию других языков,
заключается в следующем; в результате проведенных исследований создан программный комплекс автоматизированного проектирования средств диагностики и управления процессом обучения решению задач словообразования, имеющий гибкую модульную структуру, предоставляющий инструментарий для проведения практических исследований в области словообразования русского языка и изучения словообразовательного нр^шёеса, характеризующийся простым и удобным интерфейсом, рассчитанным на неквалифицированного пользователя, не отвлекающим от самого процесса исследований; • . ,
разработанная система позволяет повысить эффективность- проведения исследовательских работ за счет использования средств вычислительной техники, устранения наиболее трудоемкой и нетворческой части исследовательско!» деятельности по сбору н накоплению информации;
разработанная система позволяет повысить эффективность управления в образовательном процессе за счет использования метола лингвистического эксперимента, легшего в основу создания инструментария для обучения.
Реализг'иия__результатов_рзботъг Разработанная система
автоматизированного проектирования средств диагностики и упр;,!!леш'* обучением решению задач словообразования используется при проведении исследовательских работ в лаборатории компьютерной лингвистики ВГУ", внедрена в учебный процесс на кафедре современного русского языка филологического факультета ВГУ, внедрена в учебный процесс Воронежского института повышения квалификации учителей.
Апробация работа. Основные положения .диссертационной работы докладывались и обсуждались на следующих конференциях, совещаниях и семинарах: Всероссийской научно-методической конференции "Ко.упыотерттс технологии в высшем образовании" (Санкт-Петербург, 1994), Республиканской научно-практической конференции "Черноземьс-94" (Воронеж, 1991), Межвузовской научно-методической конференции "Фуидаменталыте и специальные дисциплины в системе образовательно-профессиональной
подготовки филологов и журналистов" (Ростов, 1994), 2-й Международной конференции по квантитативной лингвистике "С)шНсо-94" (Москва, 1994), Всероссийской научно-практической конференции по новым информационным технологиям в р.бразовании "Черноземье-95", Международной конференции : "Лингвистика. на' исходе 20 века" (Москва, 1995), Всероссийской научной конференции "Русский язык: прошлое, настоящее, будущее" (Саратов, 1996), Всероссийской научно-практической конференции "Новые информационные . технологии п образовании" (Воронеж, 1997), Всероссийском совещании-семинаре ,'. "Математической .обеспечение информационных технологий в технике, образовании и медицине" (Воронеж, 1997), Республиканской электронной научной' конференции '"Современные проблемы информатизации" .(Воронеж, 1997), на научных конференциях профессорско-преподавательского состава ВГУ п вгр.. ; '-
' Публикации. Основные результаты работы опубликованы в 12 печатных . работах, перечень ^о^орых приведен в конце автореферата. , " .
Структура и объем работы. Диссертация состоит из введения, четырех глав •и заключения ця 103 е., списка литературы (84 наименования) на 8 е., • приложений на 35 е., содержит 21 рисунок, 7 таблиц.
ОСНОВНОЕ СОДЕРЖАНИЕ РАБОТЫ
Во введении обосновывается актуальность работы, дается ее краткая характеристика, формулируются цель и задачи исследования, представляются' основные научные результаты, выносимые на защиту.
В- перрон; главе проведен анализ теоретических и экспериментальных разработок в'области словообразования как объекта проектирования. Отмечено, что потребность создания*« использования средств исследования и обучения решению' • задач словообразования обуславливается отсутствием четких н
■ однозначных . формулировок правил, порождения русского слова и необходимостью фиксации таких правил. В качестве мотива проектировочной деятельности выступает целостное представление о русском слове как объекте
' изучения, о; наличии определенных закономерностей, которым подчиняется
■ процесс словообразования,- что делает возможным попытку его формализации и обобщение. К таким закономерностям относится морфемная структура слова, регулярный характер ¿присоединения приставок н. суффиксов, обязательное наличие корня и окончания.
Целью проектировочной деятельности является создание комплекса инструментальных средств исследования и диагностирования словообразовательного процесса, позволяющих дать ответ на вопрос, по каким
правилам формируется русское слово, нтакже применение отн.ч сроден» в облает обучен»« решению залам словообразования. Рез}лыаюм нроектировочюй деятельности должна ста и, система правил, объясняющая почему созданное нз его составляющих (морфем) слово является русским словом, а также набор средств обучения решению задач русского словообразования с применением метода лингвистического эксперимента. Метод лингвистического эксперимента основан на том, что правила и закономерности выявляются путем наблюдения над так называемым отрицательным материалом, а не даются в готовом виде для запоминания. Под отрицательным материалом понимается последовательность морфем, не являющаяся словом.
Базой для синтеза отрицательного материала' является инвентарь морфем. Синтез происходит по выбранной исследователем формуле. Наполнение составляющих формулы происходит либо с помощью полного перебора, либо случайным образом (по выбору). Можно задавать направление синтеза путем-фиксации отдельных составляющих выбранной формулы, либо сужением базового набора.
Любая отрицательная последовательность морфем заключает в себе проблему, почему она не является словом. Анализ отрицательного материала приводит к формулировке правила в виде запрета ил сочетаемость. Программная реализация запретов приводит к созданию языковых фильтров. Последовательность морфем, пропущенная первым фильтром, является положительным материалом с точки зрения данного фильтра, но с точки зрения осмысленности этих последовательностей, они могут откоситься как к положительному, гак и к отрицательному материалу, причем отрицательный материал преобладает. Анализ отрицательного материала пторой ступени приводит к формулировке нового правила (системы правил) и созданию новою фильтра. Процесс (в идеале) продолжается до тех пор, пока созданная таким образом иерархия фильтров не начнет порождать только осмысленные последовательности морфем.
Отмечено, что для того чтобы количественно оценить степень расхождения модели с реальностью, необходимы средства диагностирования, Диагностический инструментарий является внешним по отношению к модели словообразования. Использование диагностик!! уместно на этапе. создания фильтра очередного уровня.
Исходя из необходимости повышения эффективности проведения, исследований в области словообразования, необходимости формализации этапов и изучения тенденции словообразовательного процесса, потребности а
инструменте познания для ' повышения эффективности обучения, сформулированы цель и задачи исследования.
Вторая глава посвящена разработке модели для автоматизированного проектирования средств диагностики задач словообразсваьия.
Ранее были изложены закономерности процесса порождения русского слова. Количество продуктивных корней (не заимствованных из других языков) не превышает 3000, суффиксов и приставок не более 500, а окончаний (для словарных форм) не более 50. Слово не содержит более 7 ±2 морфем (рассматриваются только слова с одним корнем). Таким образом, предельная формула русского слова: ПЗ-П2-П1-К-С1-С2-СЗ-С4-С5-Ф, где П - приставка, К -корень, С - суффикс, Ф - .окончание (флексия).
Выявление правил построения слова .ставит две взаимосвязанные задачи: формализации и программного подтверждения правит и фиксации новых правил.
Известно, "что во всяком языке. накоплена информация, создающая в чередовании звуков »/-букв определенный сложный порядок/. Такой же порядок, очевидным образом, существует и при чередовании более крупных языковых единиц -. морфем, что и приводит к порождению осмысленного слова. При . произвольном соединении морфем процесс носят хаотический характер. .Появление порядка 1 результат ограничений и условий, накладываемых на процесс порождения слова. Математ ическое подтверждение возрастания порядка можно найти, применив энтропийную модель для дискретного источника информации.
Выявим'гот смысл, который приобретает известная формула вычисления энтропии Н= Д в применении к диагностике словообразования.
В случае подстановки в формулу слова морфем безо всяких ограничений' можно.вести речь об энтропии нескольких дискретных источников, и формула для ее вычисления примет вид
Н(пзп2н,кс,с2сзс4с5сбф) = Н(п3)+ Н(п2)+ Н(н,) + Н(к) + Н(с,) +... +Н(с6)+Н(ф) (1) Если при этом Предположить равную вероятность употребления каждой морфемы «ри генерации слова, мы полупим максимальную энтропию,.
~ Первым шагом к уменьшению энтропии становится предположение о том, что каждая морфема характеризуется собственной вероятностью появления. Кроме того, разным /типам формул соответствуют разные вероятности встречаемости в текстах. С учетом этого, полагаем
■ Нформ Нформ (
.(2)
где р^. '-вероятность употребления формулы выбранного вида.
Следуют"» ¡наг п процессе увеличения порядка - применение языковых фильтров. Так как теперь мы имеем дело с запретом на сочетаемость на стыках, приходится иметь дело с энтроппей зависимых источников. Поскольку разработанные на данный момент фильтры затрГг-нвают сочетаемость стыков корень-суффикс, суффикс-суффикс, суффикс-окончание я корень-окончание, приведем формулы для эти* сочетаний.
5 - Сочетаемость корень -окончание (К-Ф).
Н(КФ) « Н(К)+1!к(Ф) = -2>(<-,)log,р{к;)-X)t/>(</>, /*,)log¡АФ,!К\ (3)
I-.I . I г!
где к:- корневая морфема, а ^ - флективная морфема; соответственно ¡¡(к,)' вероятность употребления ¡-ой корневой морфемы, а /Ч</>,/*,)- вероятность появления j-ro окончания из флективного набора при употреблении i-on корневой морфемы, г - количество корневых морфем, е - количество окончаний и наборе. '
2. Сочетаемость корень суффикс (К-С) Н(КС) = Н(К)+Нк(С) = -¿>('*,)1оЫ*,Г- ¿Ж»¿/'(с, /'(<--,/к,). (4)
.-1 . I -I /-1
где к - корневая морфема, а су - флективная морфема;'соответственно ¡¡{к,)-вероятность употребления ¡-он корневой морфемы, a plCj/k,) -вероятность появления j-ro суффикса из суффиксального набора при употреблении i-ой-корневой морфемы; г - количество корневых морфем, s- количество суффиксов в • наборе.
Следует отметить, что вышеупомянутые случаи сочетаемости 1 и 2 схожи тем, что здесь мы ограничиваемся только лишь зависимостью от корня. Но если исследовать стыки суффикс-суффикс или суффикс-окончание, то текущее состояние исследуемой цепочки полностью определяется предыдущим состоянием. Так, например, появление того или иного окончания или суффикс;? после корня будет зависеть от выбранного корня. Это будет означать, что для тех окончаний или суффиксов, которые не попали в активный набор, яеролтнесть' появления станет нулевой. Точно гак же, вероятность появления конкретного суффикса будет определяться тем суффиксом, который стоит в предыдущей позиции формулы: Если в формуле слова суффиксальные позиции не пусты, то активный набор окончаний определится в зависимости or того суффикса, который- находится в последней суффиксальной позиции, и только у тех окончаний, которые попадут в этот набор, вероятность будет отлична о г нулевой.
3. Сочетаемость суффикс-суффикс и суффикс-окончание. Алгоритм ENTROPY.
пход: набор активных суффиксов, полученных в результате анализа стыка корень-суффикс; количество суффиксов в исследуемой формуле (счетчик)
к
последовательность денстонн: Начальную энтропию (Н) считать равной О, для каждого суффикса иг» активного набора
1. проверить-:
если счетчик =1, H = H + вероятность употребления данного суффикса * I !(СФ) Н(СФ)=Н(С)+Нс(Ф>=-/Olugrftf, / О- (5)
' 1*1 M Г1
где с,-; суффиксальная морфема, а ф! - флективная морфема; соответственно р(с,)~ вероятность , употребления i-oti суффиксальной морфемы, ¡>(ф, !<-',)• вероятность появления j-ro окончания на флективного набора при употреблении ! i-ой суффиксальной морфемы; s - количество суффиксальных морфем, е -количество окончаний в наборе.
2. если счетчик > 1, получить активный набор для данного суффикса (active^set);
уменьшить счетчик на 1 (count - count-1),
H = H + вероятность употребления данного суффикса * Н(С) + F.NTROI'Yi • cctive_set, count),
, ; где Н(С) = - £/>(с, )1°алнО. причем вероятности употребления суффиксальных
; ' морфем будут отличны от нуля лишь для тех из них, которые входят в активный набор. В этом и проявляется зависимость от предыдущего состояния системы. Теперь можно говорить об алгоритме вычислении энтропии для формул вида К-{С}и.,л-Ф (обозначим через Н).
1. Н=0; •
2. для каждого 'корня из имеющегося инвентаря корневых морфем найти активный набор суффиксов (first_active_set);
H=H(C)c4first »dive ж** вероятность употребления данной корневой морфемы+ENTROPY(i, first_active_set).
3.Н(К{С}м..<-Ф)=Н»/,^, (6) .Рассмотрим,'как для различных бесприставочных формул вычисляется полная энтропия при отсутствии каких-либо зависимостей, то есть в нашем случае - без процесса фильтрации. .
Н(КО) = Н(К)+г* Н(С), , (7)
где г - количество корневых морфем в имеющемся инвентаре, а Н(К) и Н(С)
вычисляются поформуле вычисления лггропин.
H(K{C}i-,..бО) = Н(К) + ¿s"1 * Н(С)> У *Н(Ф), (8)
г л с | - количео ро суффиксальных позиций в формуле, а Н(Ф) вычисляется по формуле вычисления энтропии.
С нсполмопаиием полученного инструментария Пыла рассмотрена конкретная задача автоматизированного проектирования диагностических средоп на базе словаря тпорчестна А.В. Кольцова (порядка 16 ООО слов).' проведенный вычислительный эксперимент позволил подтвердить возможности применения энтропийной модели для диагностики словообразовательного процесса
Если рассматривать процесс порождения слова во времени, то мы имеем дело с источником, у которого вероятность выбора одного знака сообщения зависит ог того, какие знаки были выбрани источником до этого, причем такая связь распространяется на ограниченное число предыдущих знаков. Для описания функционирования такого источника целесообразно использовать цепи Маркова.
Для описания последовательности состояний при порождении слова по любой возможном формуле задается формачьная грамматика, которая содержит правила порождения русского слова из морфем но заданной формуле. ^
й = (Ы, Р, Г), где Т = {П|,..., п,,, Кк..., к,, с,,... с„; ф|,..., Ф1} - множество терминальных элементов (здесь » 1.. р - набор приставок из используемого инвентаря морфем, р ' их количество; соответственно {к,},, | г - набор корневых морфем; {с„,|т > * - набор суффиксальных морфем; (ф„)„ « ». г - флективный набор ); N = {Пг, К, Сг, Ф, П,, П2, П,, С,, С2, С,, С4, С5, С6} - множество нетерминальных элементов (здесь Пг - префиксальная группа; К - корень ; О, -суф(|>иксалькая группа; Ф - окончание, {С,}) • 1 г, - суффиксы в соответствующих позициях формулы ; {П;}; » | 1 - приставки в соответствующих позициях формулы); Я = {СЛОВО}; Р - множество правил вывода:
1) СЛОВО-» П,КС,Ф 13) К ~>(к|,...,к,)
2) С., -» С,С3С,С,С,Сб 14) С1 ~> (С1,..., с,)
3) Сг ->С,С2С,С.,С, 15)Сг-»(с1.....с.)
4) С, ->С,С2С,С4 16)С,-»(с......с.)
5) Сг ~>С1С2С, 17)С»-»(с,.....с,)
6) Сг ->С>С1 18) С) ->(С|,..,, с.)
7) Сг С| 19) С* -+(с,.„, с.)
8) Сг 20) Ф -» (ф,.....ф,)
9) П, -> П,П2П, 21) П| ~> (П|,..., пр)
10) П, -> ГШ 22) П2 ........пг)
11)П, ->П| 2Э)ГЬ->(п,.....пр)
12)Г1, ->
Если для процесса словообразования задать направление его течения
Пз^-ГЬ ч-К -»С| С2С'з кС4 С5 С„ _ Ф, то можно будет констатировать переход словообразовательной цепочки из одного состояния в другое:
стык корень - окончание Н(КФ) =
■ * > / стык суффикс - окончат«? ' ЩСФ)=-^р^)"£1р(ф1/с1)\о&/>(ф,/счХ (Ю)
. £ГЬ'Ксуффикр : суффлкс ; ' Н(СС)= '^цр(с,/сч), (П)
Ч»! • I
г ?
стк.корень -префикс . Н(КП) = Ч>1ое/'(1 >К)- С2)
_ • * . ■ ,«! ..1
' * Г
стык префикс-.префикс , Н(ГШ) - -2>('|,)£>(«, /«,)1ч5/>(»,(13)
где р - количество приставок в префиксальном наборе, f - количество окончаний во флективном наборе, ф; - 1-ая флексия, соответственно п, - ¡-ая приставка.
Таким образом, . предлагается 'модель описания поведения словообразоваптнон системы как объекта проектирования, способная служить инструментом • диагностирования при исследовании тенденции ■ словообразовательного протеса.
: ' В третьей главе предлагается структура алгоритмического обеспечения средств днагностнюГ и управления обучением решению задач словообразования как совокупность , средств собственно диагностики, предназначенных исключительно для исследовательского процесса и средств диагностики и обучения, функциональное назначение которых - обучение решению задач словообразования и- использование их как инструмента моделирования и нсследойагшя словообразовательного процесса, инструмента для поиска и выявления закономерностей, накопления количественной информации (рис.1). Рассматривается структура'' программного комплекса в виде подсистем моделирования словообразования, настройки базовь1х морфемных наборов, и моделирования словообразовательных сетей. Приводится практическая реализация ' возможностей программного комплекса, реализация пользовательского интерфейса.
Блок управления обучением
т
■О-
НБН
Блок средств ЛП
ГС ! СС
у 1 ,
1 в • 1
1
фильтры
Блок формирования результатов
ОС
-> ВИ1 -—> ВИ2
Блок диагностики
д
Рис.]
НБН - процедуры настройки базовых наборов;
ЗФ - процедуры задания п фиксации формулы;
ФИО - процедуры формирования процесса обучения;
I С - процедуры генерации слова;
ЛП - автоматизированное проектирование;
СС - процедуры моделирования словообразовательных сетей;
В - процедуры визуализации;
ОС - процедуры обслуживания статистики;
В111 - процедуры формирования выходной информации с полным
объяснением процесса порождения слова (по желанию пользователя);
о ■ ■ С'
ВИ2 - процедуры формирования выходной информации;
Д - процедуры диагностики;
(1) - управляющие установки процесса обучения;
(2) - материал для анализа;
(3) - принятие решения; .. -пользователь.
Четвертин глина поср.'.'и'енз применению автоматизированной системы для проектирования средств диагноежки и управления обучением решению задач
словообразования в научно-иоследоиазольской н иедатгнческон практике. Рассматриваются „вопросы эффективности применения автоматизированной системы (АС) в исследовательской работе с точки зрения меры степени достижения цели и реального вклада в исследовательский процесс. Полагая главной целью исследований (в идеале) полную формализацию словообразовательного процесса, в качестве подцелей можно рассматривать поэтапное приближение к достижению пели путем пополнения системы фильтров и диагностирования процесса фильтрации При этом информация рассматривалась .как ресурс исследоиатсльского процесса, ' поэтому эффективность представляла собой комплексное понятие, включающее в себя
<бао6ооо
12000000
40£>00<!0
3 4 5
ф рагмент
- полная энтропия
•экспериментальная | энтропия 1
2 3
типы* ф ормул
Рис.2
качество информации, ее соответствие потребностям процесса исследований, трудоемкость обработки и получения информация как отраже/;-; производительности труда исследователя, доступность системы для пользователя.
Проектирование задачи автоматизация и диагностики словообразовательного процесса имело своей особенностью то, что все три этапа - предпроектного анализа, концептуального и логического проектирования -были взаимосвязаны и неразделимы с исслсд^гательским процессом, что способствовало соответствию информации процессу исследований и обеспечивало ее качество. АС полностью взяла па себя функции по выполнению рутинной, нетворческой работы по накоплению информации, а именно генерации лингвистического материала но заданным установкам, давая исследователю возможность сосредоточиться на наблюдении, анализе и принятии решен«», исходя из .генерированной АС информации. Кроме того, на АС легла вся нагрузка по отсечению информационного шума, то есть огромного числа" проектных решений, которые попадаю™ в результате применения фильтрации г, разряд отрицательного материала. Эффективность фильтрации демонстрируется на графике соотношения вычисления полной энтропии для каждого вида возможных формул И экспериментальной энтропии, полученной с-применением фильтров (рис.2).
Результаты применения средстз диагностика могут не только влиять на процесс принятия управленческих решений, но и играть роль при анализе полученного материала. Учитывая, что исследователем является специалист в области филологии, не владеющий математическим аппаратом, создание диагностического инструмента, разработка самих методов диагностик]! предоставляют ему готовую возможность количественного оценивания направления процесса исследований в области слокЬобразовашш, когда он может, используя эти оценки, дать им адекватное толкование в терминах лингвистической проблемы.
Дается оценка возможностей применения АС в управлении обучением. Учитывая, что в процессе обучения происходит взаимодействие обучаемых с обучающей технологией, предлагается рассматривать ее, как инструмент познания, а не в качестве обучающей среды. Как инструмент познания она активно вовлекает обучаемого в процесс формирования знаний, используя з качестве методологической основы метод лингвистического эксперимента. Можно говорить о том, что применяется конструктивистская модель обучения, г. которой обучаемые активно действуют и сами конструируют свои зн-дипч, при этом АС как инструмент познания помогает упорядочить деистам обучаемого в процессе организации и представления своих знаний. Управление процессом
и
. познания происходит путем привлечения диагностически* (для оценивания) и справочных средств, содержащих «»формацию,'уже полненную л результате проведенных исследований, а также путем задания управляющих установок.
Показывается, что разработанный инструментарий в значительной степени обладает свойствами универсальности как сродство диагностики исследуемого объекта. Универсальность обеспечивается широкими ношпжностями системы в области настройки на объект . исследования - сетей пенный язык, словообразовательная система которого подлежи! моделированию Пополнение инструментального', комплекса модулем выбора языка, обеспечивающего настройку системы на конкретный естественный язь/к, позволит под сличим углом зрения рассмотреть словообразовательные системы близко- й далыюродственных языков и заложить основы для создания сопоставительного словообразования , как минимум, индоевропейских языков и получить новое знание в области дивергенции словообразовательны* систем данных языков.
Основные результаты работы состоят и следующем:
1. Проведен анализ теоретических и экспериментальных разработок в области словообразования (на примере русского языка) и выявлена необходимость автоматизации проектирования средств диагностики и управления обучением
. решению задач словообразования, которые позволяют исключить нетворческую и трудоемкую часть исследовательской деятельности но сбору и накоплению информации за счет использования возможностей вычислительной техники.
2. Сформирована структура модели проведения исследований в области словообразования, позволяющая реализовать поэтапное приближение к решению проблемы полной формализации словообразовательного процесса.
3. Реячизоаан" подход к управлению образовательной деятельностью в области русского словообразования, основанный на методе лингвистического эксперимента, позволяющий обучаемому самому конструировать знания, что
. способствует наиболее полному их усвоению и развитию творческого, активного начала у обучаемого.
4. Разработана математическая модель средств диагностирования словообразовательного процесса, основанная на применении вероятностно-стятастическн* методов -теории информации (энтропийная модель для дискретного источника ин<{юрмаци»[), позволяющая количественно оценивать степень приближения словообразовательной модели к реальности и изучать тенденции словообразовательного процесса.
5. Разработаны алгоритмы автоматизированного проектирования средств диагностики задач словообразования; проведен вычислительный эксперимент,
подтверди niuHîi возможность применения разработанных средств диагностирования и алгоритмов их реализации.
6. Сформирована модель автоматизированного проектирования' средств диагностики и управления обучением решению задач словообразования, характеризующаяся обратной связью и возможностью своего пополнения но мере накопления и анализа информации, а также большой степенью универсальности по отношению к применению в исследованиях и, словообразованию других языков.
7. Создан программный комплекс автоматизированного проектирования средств диагностики и управления обучением решению задач словообразования, имеющий гибкую модульную структуру, с простым интерфейсом, рассчитанным на неквалифицированного пользователя, предназначенный для проведения практически.-: исследований в области словообразования русского языка и ' изучения словообразовательного процесса. Программный комплекс ■ автоматизированного проектирования средств диагностики и управления обучением решению задач словообразования используется при проведении исследовательских работ в лаборатории компьютерной лингвистики. ВГУ, внедрен в учебный процесс на кафедре современного русского языка филологического факультета ВГУ, внедрен в учебный процесс 'Воронежского института повышения квалификации учителей.
Основные положенно диссертации изложены в следующих работах:
1. Воронина И.Е., Кретов АЛ. Автоматизация когнитивных процессов на примере словообразования // Компьютеризация в медицине. Воронеж: ВГТУ, 1991. С. 104-109.
2.Воронина U.E., Кретов A.A. Автоматизация npoiictèa экспликации языковых знаний па примере словообразования // Тез. докл. Всероссийской научно-методической конференции "Компьютерные технологии в> высшем образовании". Санкт-Петербург, 1994. С. F8.
3.Кретов A.A., Воронина U.E. Метод лннгвистшггского эксперимента :: образовательно-профессиональной подготовкео филологов И Тез. докл. межвузовской научно-методической конференции "Фундаментальные и специальные дисциплины в системе университетской образователыш-нрофессионапыюн подготовки филологов и журналистов". Ростов, 1994. С.53-55.
4.Кретов A.A., Воронина И.Е. Лингвистическое обоснование программного синтеза слова (на материале русского языка) // Тез. докл. 2-й Международной конференции по квантитативной лингвистике "Quaüco-94". Москва, 1994. С.187- 188.
5.Крепов А: А., Воронина И.Ii. Автоматизация процесса обучения слрвообрнзованико // Тез. докл. научно-практической конференции "Черноземье 94и.Воронеж, 1994. С. 77.
' ) б.Вороннна И.Е, Крезов A.A. Проблемы прикладной филологии п научно-исследовательском учебном процессе // Тез. докл. научно-практической конференции "Черноземье 94". Воронеж, 19У4. С. 34.
• ; 7.Кретов A.A.,. Воронина ' И.Е. Русское слопо Как самоподобная рекурсивная структура // Тез. докл. Международной конференции "Лингвистика на исходе 20 века"'. Москва, 1995, Т. 1. С. 269-271. .
в.Кретов A.A., Воронина И.Ё. Использование программы синтеза русских ,слов в , обучения словообразованию '//" Тез. докл. Всероссийской научно' практической конференции по новым информационным технологиям в обраЬовашш "Черноземье-95", 1995. С. 122-123. '
, 9. Воронина И.Е., Крегов A.A. Лингвистические аспеюы компьютерного синтеза русского слова // Материалы Всероссийской научной конференции "Русский язык: прошлое, настоящее, будущее". Саратов, Сыктывкар, 1996. С. 81.90. ; Г .
.•• 10 Воронина И.Е. Проблема автоматизации диагностики задач словообразования Л Тйз. дохл. 2 Республиканской электронной научной Конференции " Современные проблемы информатизации", Воронеж, 1997. С. 86. 1 i 41 .Воронина И.Е. Компьютерное моделирование словообразовательного процесса // Тез. докл. Всероссийского совещания-семинара "Математическое обеспечение информационных технологий в технике, образовании и медицине", Воронеж, 1997. С. 15.
: . 12.Воронина И.Е. Автоматизация и диагностика задач Словообразования на примере русского языка // Тез. докл. 3 Всероссийской научно-практической . конференции "Новые информационные технологии в образовании". Воронеж, 1997. С. 85-96.
'7й
Заказ am f>. У/. 109? я Тир. iCЮ ?хз. Лаборатория оперативной попиграфии РГУ.
-
Похожие работы
- Структурный анализ и компьютерное моделирование лингвистической среды информационных ресурсов
- Методы и средства обучения автоматизированному проектированию в машиностроении
- Разработка моделей и алгоритмов синтеза схем для тренажерного комплекса, обучающего проектированию систем автоматизации
- Использование естественного языка при автоматизации слабо структурируемых процессов в проектировании технических, программных и информационных систем
- Автоматизация проектирования образовательного процесса в области САПР с использованием методов экспертного оценивания
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность