автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Математическое и программное обеспечение процесса распознавания первичной информации об успеваемости в информационной системе вуза

кандидата технических наук
Грушин, Алексей Валерьевич
город
Москва
год
2009
специальность ВАК РФ
05.13.11
Автореферат по информатике, вычислительной технике и управлению на тему «Математическое и программное обеспечение процесса распознавания первичной информации об успеваемости в информационной системе вуза»

Автореферат диссертации по теме "Математическое и программное обеспечение процесса распознавания первичной информации об успеваемости в информационной системе вуза"

На правах рукописи

Грушин Алексей Валерьевич

МАТЕМАТИЧЕСКОЕ И ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ПРОЦЕССА РАСПОЗНАВАНИЯ ПЕРВИЧНОЙ ИНФОРМАЦИИ ОБ УСПЕВАЕМОСТИ В ИНФОРМАЦИОННОЙ СИСТЕМЕ ВУЗА

Специальность 05.13.11 Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей (технические науки)

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

МОСКВА 2009

Работа выполнена в Государственном образовательном учреждении высшего профессионального образования "Московский государственный институт радиотехники электроники и автоматики (технический университет)

Научный руководитель: кандидат технических наук, доцент

Григорьев Виктор Карлович

Официальные оппоненты: доктор технических наук, профессор

Петров Андрей Борисович

кандидат технических наук Зотов Сергей Михайлович

Ведущая организация: Институт электронных управляющих

машин (ИНЭУМ)

Защита диссертации состоится «21» декабря 2009 г. в 14 часов 00 минут на заседании диссертационного совета Д 212.131.05 при Московском государственном институте радиотехники, электроники и автоматики (техническом университете) по адресу: 119454, Москва, проспект Вернадского, д. 78.

С диссертацией можно ознакомиться в библиотеке МИРЭА.

Автореферат разослан «20» ноября 2009 г.

Ученый секретарь диссертационного Совета к.т.н., доцент

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ Актуальность работы

Доминирующей тенденцией дальнейшего развития современной цивилизации является переход от постиндустриального к информационному обществу, в котором объектами и результатами труда большей части населения станут информационные ресурсы и научные знания. Одной из характерных особенностей современного этапа научно-технического прогресса и становления "информационного общества" является широкое использование автоматизированных информационных систем. Большинство из них являются диалоговыми, т.е. взаимодействуют с пользователем посредством человеко-машинного интерфейса. Задача разработчиков интерфейсов - максимально приблизить интерфейс к предметной области, потому что от того, насколько качественно организовано человеко-машинное взаимодействие, напрямую зависит эффективность информационной системы (ИС).

Одним из активно развивающихся направлений информационных систем является класс систем автоматизации учебного процесса вузов. Их разработкой занимаются как зарубежные (SAP), так и отечественные (1С) фирмы. Однако вузы - это уникальные учреждения с множеством индивидуальных особенностей. Общее решение, как правило, избыточно и сложно настраивается при устоявшемся принципе ведения документооборота. Технические вузы, выпускающие специалистов в этой области, часто сами решают свои проблемы автоматизации, внедряя собственные разработки, чем дополнительно повышают качество выпускаемых специалистов и работников высших квалификаций, привлекая их к проектированию и разработке информационных систем.

Анализ информационных потоков вуза позволяет выбрать подразделения вуза, для которых применение quick решений наиболее эффективно. Самыми значительными информационными потоками в учебной деятельности вуза являются потоки информации о студентах, о книгах в библиотеках, об учебных дисциплинах, о преподавателях. Именно в месте взаимодействия и пересечения этих потоков происходит рождение большого объема новой информации. Выделим здесь информацию об успеваемости студента. Процесс, который порождает эту информацию, имеет название «Сессия», а службой, где фиксируется эта информация, является деканат. Учет успеваемости в вузах, как правило, производится на уровне групп, поэтому используются документы по учету групповой успеваемости.

Информация об успеваемости студентов является наиболее объемной среди всех видов информации, обрабатываемых деканатом, потому что она является прямым произведением числа студентов и числа контрольных мероприятий для каждого учебного семестра. Поэтому первичный ввод

информации об успеваемости в информационную систему - один из важнейших участков автоматизации.

Табл. 1. Результаты анализа систем автоматизации учебного процесса с точки зрения

первичного ввода информации об успеваемости

Название фирмы/вуза Мониторинг учебного процесса Автоматизация первичного ввода информации об успеваемости

1С и Комкон:ВУЗ + -

Система управления обучением Oracle + -

Abbyy FineReader - Универсальные шаблоны

РЭА им.Плеханова + с 2006 года

МГТУ им. Баумана + Электронный документооборот

Московский государственный индустриальный университет + -

Уральская государственная юридическая академия + -

Новосибирский государственный университет + -

Петрозаводский государственный университет - -

Архангельский государственный технический университет + с 2006 года

Результаты, представленные в Табл.1, показывают, что организация первичного ввода информации об успеваемости автоматизирована наименьшим образом.

Базовый принцип работающих информационных систем гласит: «Информация должна попадать в систему в месте ее возникновения без промежуточных звеньев». Помимо существенного замедления работы, именно в момент первичного ручного ввода информации из большого числа однотипных документов с данными об успеваемости, вероятность ошибок, вызванных человеческим фактором, наиболее высока.

Поэтому исследование процесса первичного ввода информации об успеваемости, а также создание решения, которое позволило бы снизить человеческий фактор, обеспечив автоматизированный и непосредственный ввод результатов успеваемости в информационную систему, является актуальной задачей, требующей как теоретических исследований, так и практической реализации. От эффективности этого процесса зависит качество всей разрабатываемой системы.

Цель диссертационной работы состоит в повышении эффективности мониторинга успеваемости студентов вуза.

Для достижения поставленной цели в диссертации необходимо провести следующие исследования и решить следующие задачи:

Для достижения поставленной цели в диссертации необходимо провести следующие исследования и решить следующие задачи:

- рассмотреть и классифицировать типы первичной информации об успеваемости;

- построить формальную модель первичного ввода информации, исследовать методы первичного ввода информации об успеваемости, выделить элементы, позволяющие повысить качество ввода информации;

- проанализировать и экспериментально исследовать применимость различных методов компьютерного распознавания статических образов к задачам мониторинга успеваемости;

- разработать метод распознавания первичной информации групповой успеваемости, а также на его основе построить и экспериментально исследовать алгоритм распознавания информации групповой успеваемости, устойчивый для различных устройств ввода-вывода;

- разработать и реализовать систему мониторинга успеваемости студентов вуза (СМУСВ) на основе предложенного алгоритма;

- исследовать эффективность процесса распознавания первичной информации об успеваемости в информационной системе вуза. Объектом исследования является мониторинг успеваемости студентов - процесс переноса в информационную систему результатов сдачи студентами контрольных мероприятий учебного плана, а также определение эффективности человеко-машинного взаимодействия при мониторинге успеваемости.

Основные методы исследования

Для решения поставленных задач в работе проводится анализ и экспериментальное исследование существующих методов компьютерного распознавания образов (Поспелов Д.А., БарабашЮ.Л, Васильев В.И, Горелик А.Л., Скрипкин В.А., Дуда Р., ХартП., Кузин Л.Т., Перегудов Ф.И., Тарасенко Ф.П., Темников Ф.Е., ТуДж., ГонсалесР., УинстонП., Фу К., ЦыпкинЯ.З.), стандартов штрихкодирования, методов моделирования диалоговых интерфейсов (Довгялло A.M., Кульба В.В, Кузнецов H.A., Ковалевский С.С., Григорьев В.К.), а также методов оценок эффективности работы ИУС. Используются преобразования линейной алгебры, математическая статистика и теория объектно-ориентированного программирования.

Научная новизна работы состоит в следующем: - развит метод распознавания «Сравнение с прототипом» посредством быстрого поиска прототипа на основе штрихкодирования для задачи распознавания информации о групповой успеваемости;

- предложен алгоритм двухэтапного распознавания информации групповой успеваемости, предназначенный для широкого класса устройств печати и сканирования;

- построена методика по исследованию эффективности предложенного алгоритма.

Предложенные методы и алгоритмы зарегистрированы в Государственном Отраслевом фонде алгоритмов и программ - ОФАП. Номер отраслевой регистрации 4192 от 27.12.2004 г., номер Государственной регистрации 50200500011 от 14.01.2005 г.

Практическая ценность состоит в разработке программного обеспечения для первичного ввода информации групповой успеваемости на основе предложенного алгоритма двухэтапного распознавания и его использования при разработке СМУСВ, в повышении эффективности ввода первичной информации об успеваемости в 3 раза по сравнению с учетом вручную. Указанные решения реализованы и внедрены в системах управления учебным процессом в Московском Государственном институте радиотехники, электроники, и автоматики (МИРЭА), а также, в Воронежской государственной технологической академии, о чем свидетельствуют акты об использовании.

Апробация работы

Основные результаты работы доложены на научно-практической конференции студентов и молодых ученых, Dortmund, Germany, 2006 год, на конференции «Информационные технологии в науке, технике и образовании», Абхазия, Пицунда, 2007 год; на научно-практических конференциях "Современные электронные технологии в образовании" ФГУП НИИ "Восход" в 2005, 2006 гг., на научно-практических конференциях МИРЭА в 2006-2009 гг. Данная работа демонстрировалась на выставках "HannoverMesse" 2007, 2009 Germany, Hannover и "НТТМ-2006" Россия, Москва, ВВЦ.

Публикации

Результаты теоретических и прикладных исследований опубликованы в 11 научных статьях, из них две в журналах из списка ВАКа. По теме диссертации получены 2 свидетельства о регистрации программ для ЭВМ в "Государственном фонде алгоритмов и программ РФ".

Структура и объем диссертации

Диссертация состоит из введения, четырех глав, заключения, списка литературы (117 наименований) и 2 приложений. Объем основного текста составляет 131 страница, 8 таблиц и 23 рисунка.

СОДЕРЖАНИЕ РАБОТЫ

Во введении обоснована актуальность выполненного исследования, сформулированы цели, задачи диссертационной работы, научная новизна и практическая ценность работы.

Первая глава посвящена обзору и анализу существующих систем, осуществляющих поддержку мониторинга учебного процесса. Рассматриваются их функции, область покрытия из всего круга задач деканата вуза. Среди наименее автоматизированных - первичный учет информации об успеваемости. Особенность данной информации в том, что ее появление имеет сильно неравномерный пиковый характер, связанный с сессионным периодом. Необходимость быстрой обработки этой информации обусловлена тем, что решение деканата о прохождении студентом последующих этапов сессии зависит от анализа текущего состояния его успеваемости по данным журнала учета успеваемости, причем промежуток времени между этапами составляет от 1 до 5 дней.

На Рис.1 представлена схема движения информации об успеваемости в вузе. На каждой из стадий движения необходима защита документа от несанкционированных изменений. На стадии (2) - это контроль списка студентов и списка допущенных к сдаче дисциплины. На стадии (3) - это контроль личности преподавателя, поставившего оценку. На стадии (4) - это сохранность поставленных оценок от момента проставления преподавателем до момента их учета в деканате.

Все процессы подтверждаются документами, которые должны опираться на существующие Государственные стандарты (ГОСТ Р 51141-98).

Для работы полностью электронного документооборота необходима ИС вуза, распространенная на всех рабочих местах с поддержкой сертифицированной части по цифровой подписи. Организация подобной ИС -крайне сложное и дорогостоящее мероприятие.

Полностью же бумажный документооборот является чрезвычайно «времязатратным», с высокой вероятностью ошибок, вызванных человеческим фактором. Ставится задача предложить удобный способ представления и хранения информации об успеваемости, как удовлетво-

У^ет деканатом "X, [успеваемости студентов\ / посредством ввода в "5 I машину (Точи /'.,. . Хвоэникновенип ошибок / при учете)

Рис.1. Алгоритм движения учебной информации в вузе

ряющий всем критериям документооборота, так и применимый для использования электронного учета с целью снизить уровень ошибок на стадии (5) Рис. 1.

В итоге дается обоснование актуальности на основе представления документов, оснащенных элементами для машинной обработки с целью возможности машинного считывания информации.

Во второй главе на основе модели диалоговых систем (Куль-ба В.В, Кузнецов H.A., Ковалевский С.С.) строится модель представления документа с информацией о групповой успеваемости. Как было сказано в главе 1, требуется получить модель документа, удовлетворяющую всем критериям документооборота и применимую для электронного учета.

Существую т три основных принципа представления рукописной информации для машинного считывания посредством сканирования:

1) четкое и аккуратное написание печатных букв/цифр в специально

отведенные поля формы;

2) использование кодового штампа (по аналогии с почтовыми индексами);

3) пометка любым значком одного или нескольких полей для выбора.

На основе текстово-графических спецификаций существующих документов была построена модель документа информации групповой успеваемости на примере зачетно-экзаменационной ведомости с учетом выбранного метода представления информации:

Mo = F(Header, SL, RL, ES, EN), где (1)

Header - заголовок зачетно-экзаменационной ведомости, SL - список студентов группы, RL - список оценок и дат их проставления (рукописный текст), ES - список подписей преподавателя (рукописный текст), EN -ФИО преподавателя (рукописный текст).

Из (1) видно, что все информационные поля заполняются преподавателем в виде рукописного текста, и для выполнения автоматического ввода информации пришлое!, бы осуществлять его распознавание. Данное решение крайне сложно в реализации и обладает низкой надежностью.

Анализ вышеуказанных методов хранения информации показал, что применительно к процессу мониторинга групповой успеваемости наиболее целесообразно использовать третий метод, т.к. требуется обеспечить минимальную дополнительную нагрузку на преподавателей вместе с максимальными скоростью и надежностью процесса распознавания.

0R„

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ИНСТИТУТ РАДИОТЕХНИКИ. ЭЛЕКТРОНИКИ И АВТОМАТИКИ (ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)

I но jíiOiuiijiMiic Мотиматичссхий ималн^ (Экзамен) I

ВС

а фдкч.п.пп ВМС г;у»п.п Bh-MH> ¡

I -.„^ч о _

■ 2(Ю7/2(Н'оvi. гол симссгр |Эк31.мека-горр■ v• ■ —

~ __«itmf i>M>t,>tt,tt1M>t,ttttM|-

EN

\.'mm

Ф И.О. сплгети "han" é* Т С

Шифр I Дата

Лорнаьон К Н

Диронкннй А.В ЛЛг^шНштт

обкшзуд w.:

j,i>í малкмиом обра&як

> ? .. Г

£1¿

Sir*

y'

R |_' Экцпмемйюр

Дскаи

• • в Ц» J • »t mi'L » ■ » m e1

RAL_ES"

LJJ, 1-LJl J- JZ l.LlCJrilHLJ-J .'."'IIÍ! П [j.^

Ё

1«, Tío III I л

В— KMM KMD

Рис.2. Визуальная интерпретация модели модифицированного документа группового учета успеваемости

На основе вышесказанного, в модель были введены поля для машинной обработки. Была построена новая модель ведомости (2), которая представляет собой расширение (1). Ее визуализация представлена на Рис.2. Md=F(Header,OP,BC,SL,RL,RAL,ES,EN,KMD,KMM), где (2) ВС - штрих-код, RAL - поле оценок для машинной обработки, KMD -день проведения контрольного мероприятия (КМ), поле для машинной обработки, КММ - месяц проведения КМ, поле для машинной обработки, ОР - опорная полоса.

Машинная обработка результатов групповой успеваемости базируется на компьютерном распознавании информации элементов ВС, RAL, KMD и КММ. Позиционирование изображения производится на основе ОР.

Далее рассматривается классификация алгоритмов распознавания образов, основанная на модели представления знаний, предложенной академиком РАН Поспеловым Д.А, которая отражает специфику способа представления знаний о предметной области. Он выделяет:

- интенсиональное представление - в виде схемы связей между атрибутами (признаками);

- экстенсиональное представление - с помощью конкретных фактов (объекты, примеры).

Ставилась задача построить наиболее надежный и простой в реализации метод, устойчивый для работы на широком классе печатающих и ска-

3101059800529031

нирующих устройств. Был построен алгоритм, основанный на модифицированном методе «Сравнение с прототипом». Для быстрого поиска прототипа было предложено использовать нггрихкодирование.

Определим понятие прототипа документа: Pr = F(Struct, SEM, SL, UP, KM), где:

Struct - Статическая часть, - разметка страницы. Она одинакова для любого прототи- f па. Величины W,, Ww, Wh и С постоянны (Рис.3). V

SEM - Номер семестра, SL - Список студентов, UP - Дисциплина учебного плана, КМ - Контрольное мероприятие учебного плана

В момент выпуска документа по учету групповой успеваемости происходит сохранение в БД параметров SEM, SL, UP и КМ, а в штрихкоде документа указывается ссылка на сохраненные параметры.

Анализ стандартов штрихкодирования показал, что наиболее целесообразным для этой задачи является использование стандарта Code-128C. Данный стандарт поддерживает числа с разным числом разрядов, одновременно с этим является достаточно информационноемким.

После сканирования изображения проводится проверка на минимально допустимое разрешение.

Производится поиск опорной полосы, расположенной в правом верхнем углу документа, и по ее положению осуществляется поворот и сдвиг изображения.

Считывается штрихкод. Алгоритм разработан в соответствии со спецификацией по стандарту Code-128C.

По данным штрихкода из базы данных загружается информация (SEM, SL, UP и КМ), и по ней производится генерация прототипа документа.

Производится наложение прототипа (Рис.4) на отсканированное

изображение и оценка степени совпадения

w.

Рис.3. Параметры границ информационных областей документа

путем анализа

Рис.4. Наложение прототипа на изображение

интегрального приграничного шума. В случае если наложение произведено успешно, выполняется считывание информации из областей по координатам О, Ш прототипа следующим образом:

Схема 1. Алгоритм распознавания документов с информацией об успеваемос! и с использованием метода «Сравнение с прототипом»

Intensity'"' = X

зг=й' х=С>

Data''' = Signum

Intensity

E Ed)

*K,

(3)

(4)

-процент интенсивности верхнего порога шума.

Если Оаш!' = 1, область считается заполненной. Иначе - пустой.

Алгоритм представлен на схеме 1.

Экспериментальные исследования алгоритма на массиве из 120 документов и одном типе оборудования показали 117 верно распознанных. Однако в ходе экспериментальных исследований на различных типах оборудования выяснилось, что, помимо поворота и смещения, возможны такие искажения изображения, которые компенсировать описанным выше способом невозможно.

Были обнаружены и идентифицированы два основных вида искажений:

1. линейные геометрические искажения;

2. нелинейные геометрические искажения: «сжатие-растяжение» отдельных участков изображения (Рис.5).

Чаще всего они встречались в виде комбинаций двух этих видов. Причиной, скорее всего, являются погрешности механических компонентов принтеров и сканеров.

Выявление указанных видов искажений потребовало существенной модификации алгоритма, чтобы сделать его устойчивым к указанным видам искажений. Алгоритм был дополнен принципом голосования. Опорная полоса заменена реперными метками по углам документа.

В момент выпуска документа по учету групповой успеваемости происходит сохранение в БД параметров SEM, SL, UP и КМ, а в штрих-коде документа указывается ссылка на сохраненные параметры (аналогично версии алгоритма по методу сравнения с прототипом).

После сканирования изображения проводится проверка на минимально допустимое разрешение, коррекция баланса белого, а также проверка на отношение пропорций изображения (A4 или А4+). При необходимости производится приведение к формату A4.

Выполняется поиск реперных меток, расположенных во всех четырех углах документа, осуществляется построение функций преобразования по следующим формулам:

Пусть XI, Х2, ХЗ, Х4 - найденная координата «X» опорной метки соответствующего номера.

Yl, Y2, Y3, Y4 -найденная координата «Y» опорной метки соответствующего номера.

(Xmo, Ymo) -координата искомой точки на прототипе.

Рис.5. Выявленные виды искажений

XloYlo Х2з «о

\ /

\ /

\ /

\ /

\ /

f'MjVHoi /

• \

/ \

/ \

/ \

/ \

/ \

/

X4QYJC

<1 V Х2 Y2

dXI Ч \ (Km / У V

<Ю / Д «П dY4 Ч

<3Y3 m X4Y4

Рис.6. Преобразование координат

dXL, dXR - Значение коэффициентов деформации по левой и правой стороне изображения.

dYT, dYB - Значение коэффициентов деформации по верхней и нижней стороне изображения.

Определим коэффициенты деформации документа: dXL = ((ХЗ - XI) / CY1 - Y3)) * Ymo;

dXR = ((Х4 - Х2) / (Y4 - Y2)) * Ymo; (5)

dYT = ((Y2 - Yl) / (Х2 - XI)) * Xmo;

dYB = ((Y4 - Y3) / (X4 - ХЗ)) * Xmo.

Исходя из (5) получаем общие коэффициенты:

dx = dXL * (Х2 - Хшо) + dXR * (Xmo - X1); (6)

dy = dYT * (Y4 - Ymo) + dYB * (Ymo - Y2).

Отсюда получаем формулу (6) преобразования координат прототипа в координаты отсканированного изображения (рис.6):

Xm = Xmo + dx; (7)

Ym = Ymo + dy.

Мы можем рассматривать искажения по вертикали и горизонтали (7) независимо друг от друга благодаря тому, что погрешность их влияния друг на друга имеет более высокий порядок малости.

По данным пггрихкода из базы данных загружается информация (SEM, SL, UP и КМ), и по ней производится генерация прототипа документа с использованием преобразований (6) и (7).

Выполняется наложение преобразованного прототипа (рис.8 а,б) на отсканированное изображение. Т.к. на протяжении всех исследований нелинейная составляющая искаже-

W.

ния оказывалась меньше, чем

было предложено использовать уточнение по е-окрестности. Вокруг каждой границы информационной области определяется интервал (рис.8 б), и в промежутке, его включающем, проводятся сканирующие линии параллельно аналитически рассчитанной границе информационной области. Вдоль сканирующих линий производится расчет интегральной интенсивности по черному цвету.

В случае, если в заданном интервале обнаружена точка максимума интенсивности (рис.7), производится уточнение прототипа. Если точку максимума обнаружить не удалось, либо она находится вне заданного интер-

вала - координата прототипа остается расчетной. Подобные случаи возможны, если в информационных областях либо в непосредственной близости_от_них_присутствуют_посторонние_записи.

I4 У Ч исло чер 4ых точек в 1 :оответству> 1 ощей строке (и 1 1 к л и столб це) 1 ,

Р асс читанные знач гния с Д( пусками

ИТ эгов ые знач зния координат после к зррекции

В ысотг ■ (или ш ирина) области оценок X

Рис.7. Процесс уточнения прототипа по анализу интегральной интенсивности После уточнения всех границ аналитически построенного прототи-

па,

получаем

^.^иыванле

уточненный

прототип

(рис.8 в).

1 Згиуъум:» т^ормаи^л * 1 БД о Грутл, I Дчцтлине, тигр Ш и Сгисочюм | составе документа.

; Производится пестреете линеино \ прзобс^эмньою г*ютотипа &осуме«та ; по на£Д5нн=м «ординатам оперных ! меток

Нал"'Аймие гогтучем-аго «иаалкпного» прототипа, керрешля по ргалгнь.м

гр«-ицамс ислолаго^ашсм суммирования снте^сиенэсяей по аамирутоиди лн^ям. £с.и найдежая по уточнено юординато уладюастся в устаювлгнные диапазон -г*юиз водится уЮ'^вЧ'в

ТТолу^иё результатов путем расчета сумьычерньк то1-« каждой области с'учетом допустимого уровня шума

Проверю полученных результатов на иоррекиось посоотъетстеио данному •ыпу КМ, а тв« я®, значажю даты

Передача ¡-ифослвции игггерфейсной части для гроверши

кодоекции пользователем

Схема 2. Алгоритм распознавания документов с информацией об успеваемости с использованием метода голосования

Далее считывание результатов производится по формулам (3), (4). Алгоритм представлен на схеме 2. Экспериментальные исследования на массиве из 1250 документов показали верное распознавание всех 1250 штук без ошибок.

- В третьей главе описывается разработка и исследование СМУСВ, основанной на предложенном алгоритме двухэтапного распознавания информации групповой успеваемости.

Для ускорения адаптации пользователей к новому продукту, при создании СМУСВ соблюдались следующие принципы:

- система должна поддерживать все производственные процессы в том виде, в котором они существуют в настоящее время;

- система не должна заставлять участников технологического процесса выполнять дополнительные функции;

- выполнение каждой функции с помощью системы должно занимать меньше времени и усилий, чем с помощью существующих инструментов.

Описывается реализация предложенных методов на основе функциональных схем с использованием формата ЮЕЕ-0; структура базы данных проектируется с использованием стандарта ШЕЕ-1х (Рис.6).

Рис.6. Фрагмент модели базы данных (ГОЕР-1х) Важной особенностью разрабатываемой системы, наряду с выполнением первого принципа, является возможность модификации бизнес-процессов деканата, а также расширение функциональных спецификаций и

развитие системы. Эти возможности обеспечиваются организацией базы данных, ее нормированностью (3-я нормальная форма Кодда), независимостью от системы, подробным анализом сущностей, используемых в системе, и строгим контролем принадлежности этих сущностей к бизнес-процессам деканата. Система имеет пятислойную структуру и реализована в клиент-серверной технологии (рис.10).

Декан

Злместите/ъ декан л

Мет одис!

<2.

Секретарь

Слой преобразования на основе разграничения полномочий

--

Журнал

Сессия

наоота с учебным планом

Движете студентов

Л

Отчеты

Служебные функщп

Интерфейсный слой взаимодействия между системой и базой данных

Сервер системы, базлдлнных

Рис 10. Струкгурная схема СМУСВ

СМУСВ внедрена на всех факультетах МИРЭА, о чем свидетельст- , иуют акгы о внедрении. Эффективность процесса мониторинга групповой успеваемости студентов повысилась более чем в 3 раза в результате автоматизации. Исчезли очереди студентов в деканаты в период сессий.

В четвертой главе строится методика оценки эффективности разработанной СМУСВ.

Одним из важнейших показателей успешной автоматизации учебно-производственного процесса вуза является фактическое повышение эффективности этого процесса. Поэтому построение методики оценки эффективности работы СМУСВ является актуальной задачей.

Методика оценки эффективности функционирования СМУСВ реализуется посредством применения двух компонентов:

1. система сбора и объединения временнбй статистики;

2. система анализа статистики по ряду показателей.

Строится система сбора и объединения статистики, состоящая из центрального сервера лаборатории, осуществляющего периодический сбор

статистики с серверов СМУСВ каждого факультета и протокола обмена. Работа компоненты СМУСВ по сбору статистики состоит в записи в специальную таблицу БД событий и их параметров, порождаемых работой пользователей в реальном времени, по началу и окончанию сеанса работ),i пользователей, началу и окончанию сканирования документа групповой успеваемости, окончанию распознавания результатов, коррекции пользователем распознанных данных и сохранению результатов в базе данных.

Система анализа статистики производит сортировку полученных массивов данных, отбор по интересующим параметрам, фильтрацию краевых значений и интеграцию для получения средних показателей.

Для определения характеристик эффективности СМУСВ введем коэффициент эффективности:

V — ^Bpi-unio / — ^ смусв/ г„~

/Т ~ /N > 1де

/ 1 СЮ'СВ / ' 4 Вручаю

ТВрут)Ю - время, затрачиваемое на выполнение задачи вручную, -

время, затрачиваемое на выполнение задачи с использованием СМУСВ. Nсмусв ' число обработанных документов в единицу времени с использованием СМУСВ, NB „ - число обработанных документов в единицу времени при ручной работе.

Далее рассматривается применение методики для документов групповой .успеваемости студентов (ДГУС).

Обозначим следующие хронометрируемые события:

- начало (TIS) и окончание (TIE) работы интерфейса приема документов

групповой успеваемости студентов. Из этого определяется среднее время сеанса работы пользователей по приему ДГУС;

- начало (TSS) и окончание сканирования (TES). Определяется быстро-

действие сканера;

- окончание сканирования (TES) и окончание распознавания (TER),

(ошибка при распознавании (TRE)). Вычисляется скорость работы алгоритма распознавания оценок и результат распознавания;

- окончание сканирования (TES) - сохранение ДГУС в БД (TSR). Это

наиболее значимый промежуток времени для определения удобства интерфейса. Фиксируются общее число оценок, которые необходимо распознать, число распознанных оценок. Отмечаются инструменты, посредством которых пользователь осуществляет коррекцию оценок (с помощью мыши, либо с клавиатуры). В зависимости от используе-

мого инструмента и числа исправлений определяется среднее время на исправление одного результата, сравнение эффективности различных инструментов, а также различных их модификаций. Вычислим среднее время приема одного ДГУС:

ВиШте =

]Г(Щ -те^;

, где 1 - множество принятых ДГУС. (8)

Вычислим производительность приема ДГУС в час:

ВиШуНоиг = ^

(9)

где ] - множество сеансов работы с интерфейсом приема ДГУС, к -множество принятых ДГУС.

Вычислим среднее число ошибок при приеме ДГУС в %:

ЕтРегсеШ =

I

ИМ

Т!3) I

*100%,

(10)

где ] - множество сеансов работы с интерфейсом приема ДГУС, к -множество принятых ДГУС, 1 - множество ДГУС с ошибками.

48«

п

5 X 40%

2 з

х I 35% ¡5 30%

> Ь

§ Ю 25% „ О. 20%

2 ю л о

15%

I Я Ю%

± СО 5 О)

О. 5%

0%

17 и менее 17-23 24-30 31-40 41 и более

Среднее время обработки одного документа (сек)

Диаграмма 1. Статистические данные по распределению времени обработки документов групповой успеваемости за период в 2.5 года.

Стандартно исключаем 3% краевых значений. Основное преимущество автоматического сбора статистики состоит в том, что он производится в естественных условиях работы пользователей, не оказывая никакого влияния на их работу, не отнимает дополнительного времени и обладает высокой точностью. В конце главы приводятся результат ы оценки эффективности СМУСВ с использованием предложенной методики (Диаграмма 1).

В заключении приведено краткое резюме диссертационной работы и перечислены основные задачи, решенные в процессе исследования.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

- Развит метод распознавания «Сравнение с прототипом» посредством быстрого поиска прототипа на основе штрихкодирования и адаптирован для задачи распознавания информации о групповой успеваемости.

- Построен алгоритм двухэтапного распознавания информации групповой успеваемости, предназначенный для широкого класса устройств печати и сканирования.

- Разработана методика по исследованию эффективности предложенного алгоритма.

- Разработана ИУС мониторинга учебного процесса вуза (СМУСВ). зарегистрированная в Фонде алгоритмов и программ РФ.

- Система внедрена на всех факультетах МИРЭА, а также, в ВГ'ТА, о чем свидетельствуют акты об использовании.

- Эффективность первичного ввода групповой успеваемости многократно повысилась в результате автоматизации.

ПУБЛИКАЦИИ ПО ТЕМЕ ДИССЕРТАЦИИ

1. В.К.Григорьев, А.В.Грушин «Методика автоматизированной обработки зачетно-экзаменационных ведомостей в полнофункциональной ИУС Деканат», М: Известия высших учебных заведений. Электроника №6 2008 г. стр. 71-78 (список ВАК).

2. В.К.Григорьев, А.В.Грушин, А.А.Антонов «Оценка эффективное) и применения штрихкодовой технологии в ИУС Деканат МИРЭА», М: Известия высших учебных заведений. Электроника №5 2009 г. стр. 77-84 (список ВАК).

3. В.К.Григорьев, А.В.Грушин, А.А.Антонов Регистрация отраслевою фонда алгоритмов и программ. Программно-инструментальный комплекс МИРЭА «Деканат». Номер отраслевой регистрации 4192 ш

27.12.2004, номео государственной регистрации 50200500011 от

14.01.2005.

4. А.В.Грушин Уточненный алгоритм распознавания результатов ведомостей системы «Деканат» версии 2.0 Издание 6-й научно-практической конференции НИИ «Восход». Москва 2006 год. Стр. 213219.

5. А.В.Г'рушин «Инструментально-программная поддержка массовых операций в системе «Деканат» (практическая автоматизация бизнес-процессов деканата)» Издание 53-й научно-технической конференции МИРЭА часть 4, стр.72-78. Москва 2004 год.

6. A.A. Антонов, A.B. Грушин Базовые подсистемы программно-инструментального комплекса МИРЭА «Деканат». Издание 5-й научно-практической конференции НИИ «Восход». Москва 2005 год. стр.287-293.

7. В.К.Григорьев, A.A.Антонов, А.В.Г'рушин, Д.С.Зорин «Информационно-Управляющая Система «Мирэа-Деканат» Основные Принципы и Методы Реализации. Издание 54-й научно-технической конференции МИРЭА часть 1, стр. 115-121 Москва 2005 год.

8. А.В.Грушин, А.М.Семенов «Методика и инструментальные средства для оценки эффективности работы системы «Деканат» по мониторингу успеваемости» Издание 55-й научно-технической конференции МИРЭА часть 4, стр.37-41, Москва 2006 год.

9. В.К.Григорьев, О.А.Аксенов, А.А.Антонов, А.В.Грушин Методика определения качества обучающей компоненты информационно-управляющей системы в процессе ее опытной эксплуатации // Международный журнал «Образовательные технологии и общество» Том 10. Номер 3. М.: Июль 2007 г. стр. 329-335.

10.В.К.Григорьев, A.B. Грушин «Полнофункциональная ИУС «Деканат» МИРЭА, базирующаяся на пприх-кодовой технологии». Журнал «Известия вузов Электроника», принята к публикации.

11.В.К.Григорьев., А.А.Антонов, А.В.Грушин, «Модель автоматической обработки опросов и ее реализация в виде программно-аппаратного комплекса». 56-я Научно-техническая конференция МИРЭА. Сборник трудов.Ч. 1. Информационные технологии и системы. Вычислительная техника. - М., 2007, стр. 7-10.

12.А.В.Грушин Программный модуль сбора статистики ИУС «Деканат» по оценке эффективности работы системы Сборник трудов 8-й научно-практической конференции «Современные информационные технологии в управлении и образовании», НИИ «Восход», Москва 2009 год, стр.52-55.

Подписано в печать 25.11.2009. Формат 60x84 1/16. Усл. печ. л. 1,16. Усл. кр.-отт. 4,64. Уч.-изд. л. 1,25. Тираж 100 экз. Заказ 702

Государственное образовательное учреждение высшего профессионального образования "Московский государственный институт радиотехники, электроники и автоматики (технический университет)" 119454, Москва, пр. Вернадского, 78

s«] „ " С-

// i / /

X ¿5?

2009258485