автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.05, диссертация на тему:Оптимальное расположение букв узбекского алфавита на устройствах ввода информации в средствах вычислительной техники

кандидата технических наук
Ирисбаева, Махмуда Мусаевна
город
Ташкент
год
1994
специальность ВАК РФ
05.13.05
Автореферат по информатике, вычислительной технике и управлению на тему «Оптимальное расположение букв узбекского алфавита на устройствах ввода информации в средствах вычислительной техники»

Автореферат диссертации по теме "Оптимальное расположение букв узбекского алфавита на устройствах ввода информации в средствах вычислительной техники"

МИНИСТЕРСТВО ВЫСШЕГО И СРЕДНЕГО СПЕЦИАЛЬНОГО ОБРАЗОВАНИЯ РЕСПУБЛИКИ УЗБЕКИСТАН

р |Ш1КЩСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ имени ЛБУ РАЙХАНА БЕРУНИ

1 5 АВГ 1994

На правах рукописи

ИРИСБАЕВА Махмуда Мусаевна

ОПТИМАЛЬНОЕ РАСПОЛОЖЕНИЕ БУКВ УЗБЕКСКС « АЛФАВИТА НА УСТРОЙСТВАХ ВВОДА ИНФОРМАЦИИ В СРЕДСТВАХ ВЫЧИСЛИТЕЛЬНОЙ ТЕХНИКИ

Специальность: 05.13.05 - Элементы и устройства вычислительной техники и систем управления

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

ТАШКЕНТ - 1994

Работа выполнена в Ташкентском государственном техническом университете имени Абу Райхана Беруни

Научный руководитель: Доктор технических наук

Нуритдинов Шамсутдин Нуритдинович

Официальные оппоненты: Доктор технических наук,

профессор Умаров Бадиридцин Умарович

Кандидат технических наук,

доцент Ибрагимходжаев Сабир Артыкович

Ведущая организация - Узбекский институт исследований и повышения 1

лификации в области стандартизации, метролог] сертификации продукции

заседании специализированного совета К 067.07.29 при Ташкент государственном техническом университете имени Абу Райхана Беруни адресу: 700095, г.Ташкент, ул.Университетская, 2.

С диссертацией можно ознакомиться в библиотеке Ташкенте: государственного технического университета имени Абу Райхана Беру

Автореферат разослан "_" _ 1994 г.

Ученый секретарь специализированного совета

Заяшта состоится ".

1994г. в

часов

дсктср технических наук

- 3 -

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы. В соответствии с принятым законом о Государственном языке Узбекистана к числу приоритетных проблем государственного масштаба, подлежащих безотлагательному решению совместными усилиями ученых и специалистов в области вычислительной техники, математики и языкознания следует отнести:

1. Оптимальное расположение букв узбекского алфавита на клавиатуре компьютера (печатающей машинки) и его утверждение на уровне государственного стандарта, обязательного для неуклонного исполнения отечественными и зарубежными изготовителями ЭВМ, оргтехники и др. для нужд республики.

2. Проблемы создания принципиально нового конструктивно-технического решения типа организации клавиатуры ЭВМ и оргтехники, рассчитанной на одновременную реализацию уникальной для Узбекистана пятиграфичной системы расположения клавиш для реализации необходимого в республике узбекского, русского, латинского, греческого (для формул в математических и технических текстах) и староузбекского алфавита на основе арабской графики.

3. Применение методов компьютерного фонетического анализа к решению проблемы совершенствования существующей узбекской письменности на основе выбранной графики путем исследования закономерностей фонем с последующим выходом на адекватную систему и с учетом областных наречий.

4. Реализация перспективных унифицированных и гибких систем подготовки и распространения в виде компьютерной продукции текстовой и графической информации в сфере образования, науки, культуры (включая все средства массовой информации) и др.отраслях народного хозяйства, снабженных автоматизированными терминологическими словарями, системами автоматизированного перевода, базами энциклопедических знаний и др.

5. Создание синтезаторов и анализаторов узбекской речи как прогрессивных способов хранения, переработки и передачи словесной (вербальной) информации в среде традиционных элементов грамотности.

Вышеперечисленные проблемы выдвигает насущную необходимость модификации и усовершенствования существующих и разработки комплекса новых организационно-технических средств для совершенствования процессов ввода информации в ЭВМ.

Работа выполнялась в соответствии с планом НИР МВиССО РУз (М госрегистрации 113/91).

Цель диссертационной работы состоит в совершенствовании про цессов подготовки текстов на государственном языке с помощь средств вычислительной техники и достигается путем оптимальног расположения букв узбекского алфавита на устройствах ввода инфор мации.

Задачи исследования.

1. Анализ современного состояния изученности вопросов сове{ шенствования процессов и устройств ввода текстовой информации.

2. Изучение особенностей процессов и средств ввода текстов! информации на Государственном языке в устройствах подготовки да ных на ЭВМ.

3. Математическая формулировка задачи оптимального располо* ния букв национального алфавита на клавиатуре ЭВМ.

4. Разработка методов и алгоритмов решения задачи размете* букв на клавиатуре и их сопоставительный анализ в сравнении с > вестными алгоритмами.

5. Выработка рекомендаций по оптимизации и отандартиза] процессов ввода текстовой информации в ЭВМ.

6. Исследование эффективности разработанных вариантов клав

тур.

Методы исследования. Для достижения поставленной цели прш чены методы статистического и системного анализа, методы и аи ритмы целочисленного программирования, методы топологичес) конструирования.

Автор защищзет предложенный критерий оптимальности, резулв ты статистического анализа вводимой текстовой информации, мето/ алгоритмы решения рассматриваемой задачи размещения, варианты тимального расположения букв узбекского алфавита в устройся ввода информации ЭВМ.

Научная новиана полученных результатов заключается в еле,

щем:

- сформулированы критерий оптимальности и задача оптимального расположения букв, представляющие минимизацию суммарного времени на подготовку среднестатистического текста;

- показана, что математически задача сводится к задаче топологического проектирования при геометрических ограничениях, соответствующих конфигурации буквенного фрагмента клавиатур^;

- статистическими исследованиями на ЭВМ определены элементы матрицы связности применительно к рассматриваемой задаче и установлена неразреженность этой матрицы по сравнению с аналогичными в обычных задачах конструирования модулей РЭА и ЭВА;

- осуществлена декомпозиция общей задачи оптимизации на две подзадачи, для каждой из которых обоснован выбор частного критерия оптимальности;

- предложены алгоритмы интегрирование- последовательного и кольцевого синтеза оптимальной клавиатуры.

Практическая ценность работы определяется тем, что:

- разработаны варианты оптимального расположения букв узбекского алфавита на устройствах ручного ввода (клавиатура ЭВМ и оргтехники);

- созданы программные средства, обеспечивающие статистическую обработку файлов и решение задачи оптимального расположения клавиш;

- экспериментально показана эффективность разработанных вариантов расположения букв на клавиатуре.

Реализация результатов работы. Результаты диссертационной работы распоряжением N 12-05 PC Узгосстандарта от 27.07.92 утверждены и с 1 сентября 1992 года введены в действие в качестве стандарта Республики Узбекистан.

Апробация работы. Основные положения диссертационной работы докладывались:

- в Республиканской научно-технической конференции "Проблемы написания, издания и перевода научно-технической литературы на узбекский язык" (Ташкент, 1991 год);

- в Региональной научно-технической конференции "Моделирование и управление в технических системах" (Ташкент, 1991 г.);

- в Республиканской научно-технической конференции "Проблемы выработки электрической энергии и вопросы энерготехнологии в машиностроении и других отраслях народного хозяйства Республики Узбе-

кистан" (Ташкент, 1991 год);

- на Второй Международной конференции "Системный анализ, моделирование и управление сложными процессами и объектами на базе ЭВМ" (Ташкент, 1992 год);

- в Республиканской научно-технических конференции "Проблемы выработки электрической энергии и вопросы энерготехнологии в машиностроении и других отраслях народного хозяйства Республики Узбекистан" (Ташкент, 1992 год);

- на Третьей Международной конференции "Системный анализ, моделирование и управление сложными процессами и объектами на базе ЭВМ" (Ташкент, 1993 год);

- на ежегодных научно-технических конференциях ТашГТУ (Ташкент, 1991-1994 г.).

Публикации. По теме диссертационной работы опубликовано 11 научных работ, в том числе получены два утверждения с Госстандарта Республики Узбекистан.

Структура диссертации. Диссертационная работа состоит из трех глав, заключения, списка цитированной литературы и приложений.

СОДЕРЖАНИЕ РАБОТЫ

В первой главе произведен аналитический обзор существующих типов клавиатур и способов расположения клавиш и символов в них, существующих алгоритмов оптимального размещения конструктивных модулей различного уровня на коммутационном пространстве в производстве электронно-вычислительных средств, обзор истории и специфических особенностей узбекской письменности.

Вторая глава посвящэна классификации клавиатур, обоснованию критериев оптимальности клавиатуры, сбору и разработке процедуры обработки статистических данных и выявлению необходимых количественных характеристик статистического материала в виде текстовых файлов.

Предложены классификации клавиатур по типу пользователя, по предназначению и области притязания, по критериям качества, по конструктивным особенностям.

Неограничивая пользователя использовать новые возможности электронных терминалов, в то же время, согласно принципу унифици-

рованности, мы обязаны наложить определенные ограничения стандартности способа расположения клавиш на клавиатуре любого устройства подготовки текстов. Таким образом, в решаемой нами задаче, ориентированной на выдачу конкретных и в то же время всеобщих рекомендаций, перечень критериев значительно сокращается, остается наиболее традиционные. При этом мы не исключаем частные постановки задачи оптимизации клавиатуры, отдельные такие задачи поставлены и решены и в рамках настоящей работы.

По аналогичным соображениям, считаем целесообразным осуществить декомпозицию задачи синтеза оптимальной клавиатуры для ЭВМ на синтез отдельных фрагментов, включающих буквы, цифры и символы арифметические и знаки препинания, которые имеются в обычной печатающей машинке,- эта одна подсистема, а в других (в свою очередь они могут быть разбиты на несколько подсистем) находятся клавиши с новыми символами и др., а также псевдографические

символы) и специальные клавиши, свойственные для современных ЭВМ.

Дальнейшее упрощение постановки задачи может бьггь достигнуто не в ущерб глобальному критерию выделением группы буквенных клавиш. К тому же такой раздельный подход настолько традиционен, что в противном случае можно даже ожидать ухудшения в смысле глобального критерия, за счет психологических факторов.

Выбор в качестве критерия таких показателей, как "минимальное количество ошибок", "минимальное время ввода текста" и "снижение утомляемости", по сути сводится к их ранжированию в порядке значимости, поскольку они жестко взаимосвязана Так, количество ошибок, допущенных при первом наборе, сказывается на общих временных затратах через этап корректировки текста с целью исправления ошибок. Упомянутые выше два критерия, каждый в отдельности, могут охарактеризовать производительность работы оператора и, естественно, показатель "количество ошибок" несет определенную информацию и о качестве текста, даже при фиксированном времени первого набора. Привлечение в качестве критерия утомляемости оправдано для оптимизации длительных режимов работы с текстовыми редакторами, что связано с деятельностью профессиональных пользователей.

Математическую формулировку задачи оптимизации расположения букв в соответствии с принятым основным критерием при допущении о равномерной скорости передвижения пальцев от одной клавиши к дру-

гой можно представить в виде:

ЙСп.л,..., £ Щ, {ц * Шм ,

где: П - количество символов;

значение позиции на клавиатуре, занимаемое клавишей для 1-го символа; - расстояние между 1-ой и 1-ой позициями на клавиатуре;

^и - среднестатистическая частота появления в тексте пары с 1-м и ^ми символами;

^7 - среднестатистическая частота появления в тексте пары последовательности ^го и 1-го символов.

Такая запись отражает общность расстояний как для пары (и), так и для пары (

Мотто записать целевую функцию ъ более обири виде:

К(п1>п^...,пп) = §1 Щ, е0- ' теп,

При этом считается, что диагональные элементы матрицы Ь рав ны нулю = О , ¿= 1, ... , П ) •

Совокупность ограничений включает требование дискретност значений позиции клавиш. Таким образом, главным критерием дл достижения оптимизации размещения букв национального алфавита не обходимо принять минимизацию времени для подготовки среднеста тистического текста, фи этом в малозначимых по основному критери ситуациях решение необходимо подбирать исходя из легкости заломи нания, эстетических и психологических соображений.

Изучение графолого-статистических особенностей современнс узбекской письменности может быть осуществлено двумя путями:

1. Наличие достаточно полных словарей узбекского языка в вщ файлов данных позволяет получить предварительное представление вероятностных частотах участия отдельных букв или их комбинаций текстах. Однако для того, чтобы качественно осуществить статист! ческий анализ необходимо скорректировать эти сведения с учетом кс личественных показателей повторяемости слов в различных текста) Кроме того, словари обычно содержат слова без указания всех морфе логических форм и грамматических значений. Если даже исходные слс

вари содержат аффиксивные варианты и можно формально к процедуре обработки добавить всевозможные флексии, все равно необходим частотный спектр их появления в реальных текстах.

2. Анализом достаточно большого количества текстовой информации. Этот путь требует более широкого массива текстовых данных по сравнению с изложенным выше детерминированным методом. Кроме того, возможность в данном случае получения помимо морфологических» буквенных статистических характеристик, также данных о более широких - синтаксических статистик, делает требования к объему выборки еще более жесткими.

Преимущество второго варианта статистического анализа состоит в том, что адекватность получаемых статистических моделей может быть гарантирована представительностью выборки.

С учетом числа всевозможных сочетаний общее количество букв в выборке (следует отметить, что общее количество букв при этом принимается равным числу парных последовательных комбинаций букв) должно удовлетворять условию:

N>384x35x35-470400

Подсчет объема буквенной выборки в процессе сбора данных показал, что объем 0.5 Мб буквенной информации содержится приблизительно в текстовом файле с объемом 700 ООО знаков.

Естественно для решения задачи расположения букв на клавиатуре в соответствии с сформулированным критерием оптимальности, необходим достаточно большой объем информации, который поддается учету только с помощью средств вычислительной техники. Кроме того эти данные должны отражать по форме и содержанию современный текстовый материал узбекской письменности.

Исходя из специфических особенностей задачи, связанных с языковедческими проблемами, для реализации предложенного алгоритма необходимо иметь статистическую информацию о современной узбекской письменности. О этой целью подготовлены статистические данные с общим объемом свыше 700 тысяч байт, включающие тексты из различных областей:

1) исторические очерки (общий объем файлов 53730 б);

2) литература по теологии (общий объем файлов 43975 б);

3) научно-популярная литература (общий объем файлов 107581 б);

4) художественная литература (поэзия) (общий объем файлов

115900 б);

5) художественная литература (проза) (общий объем файлов 168107 б);

6) техническая литература (общий объем файлов 245986 б);

7) документы делопроизводства (общий объем файлов 23817 б).

Стремление решить задачу методологически корректным образом

обнаруживает некоторые нюансы организации вычислений при статистической обработке данных на ЭВМ. Основной вопрос, решаемой при алгоритмизации эадачи, состоит в конструировании блока распознования символов и подсчета значений парных и одиночных частот появления букв и их комбинаций в выбранном тексте. Время обработки глобального файла объемом 0,7 И5 с помощью программы на базе предложенного алгоритма на ГОВЫ IBM PC/AT 286 (тактовая частота 16 Мгц) составили 25 минут.

Особенности, свойственные задаче оптимального расположения букв узбекского алфавита на клавиатуре компьютера и другой оргтехники, обуславливают нормализацию статистических значений в определенной последовательности. С этой целью количество наблюдаемых свойств (частота встреч отдельных букв и их парных сочетаний ) делится на общее количество букв в текстовом файле и умножается на квадрат количества букв в алфавите

Результаты показали, что наиболее часто встречающиеся последовательности парных сочетаний следующие (в первую очередь это сочетания с. участием букв "а" и "и"): сочетания с участием буквы "а": сочетания с участием буквы "и":

та - 10.8 ат - 15.5

Среди прочих сочетаний только лишь последовательность "нг" встречается со значением частоты *-13 в верхней части отсортированной таблицы.

Полученные результаты могут быть использованы для решения

га - 21.7 ад - 10

ди - 16.6 иб - 11.7

ли - 14.6 ил - 16. 6

ни - 24.3 ин - 22. 4

ри - 19. 4 ир - 11.6

ти - 11.9 иш - 12

да - .'23 ал - 11.2

ла - 36.1 ам - 10.6

ма - 16 ан - 29. 06

ра - 12.9 ар - 30. 06

следующих прикладных задач.- оптимизации оргтехники, совершенствования узбекской графики, анализа фонетики узбекского языка и др.

Вопросы алгоритмизации процедур оптимизации расположения букв на клавиатуре рассматриваются в третьей главе реферируемой диссертационной работы. В ней излагаются предложенные алгоритмы синтеза оптимальной клавиатуры и результаты сопоставительного анализа их с известными; подучено решение поставленной задачи, оформленное в виде стандарта Республики Узбекистан и приводятся результаты испытаний; осуществлена оценка эффективности разработок.

С математической точки зрения задача относится к типу задач целочисленного программирования, которые требуют решения с использованием методов статистической оптимизации, так как общее количество возможных вариантов компановок связано факториальной зависимостью с количеством символов на клавиатуре и решение задачи традиционными методами, например, методом перебора невозможно выполнить даже с помощью современных ЭВМ .

Анализ целевой функции показывает, что одиночные частоты появления букв в тексте в обшем случае не влияют на вид оптимального расположения на клавиатуре. Однако, при замене расстояний " " некоторым средним их значением суммы элементов строки или столбца матрицы парных частот могут быть заменены на частоты одиночного появления. Исходя из этого нами предложен алгоритм кольцевого синтеза фрагментов клавиатуры в соответствии с которым выделение элементов в группы клавиш с приблизительно одинаковым расстоянием от принятого центра производится по расположению их в убывающем ряде одиночных частот, а выбор конкретной позиции элементов в группе осуществляется путем минимизации значения подкритерия (критерий, записанный для синтезируемого фрагмента с учетом комбинаций клавиш, расположенных внутри рассматриваемого радиуса).

Алгоритм решения задачи включает в себе несколько этапов. На первом этапе получено решение по оптимальному расположению букв узбекского алфавита исходя из конструкции наиболее распространенных клавиатур пишущих машинок и ПЭВМ и требований стандарта касательно структуры размещения шрифтовых знаков, геометрии и размеров блоков клавиш. Тридцать три буквы узбекского алфавита располагаются в трех рядах (с количеством клавиш от 10 до 12 снизу вверх), а две наименее часто используемые буквы располагаются на клавишах

в сочетании дай.

символами (знаками) препинания и специальных функ-

В центре среднего ряда с минимальным смещением в левую сторону расположены буквы "а" и "и", существенно выделяющиеся по частоте от остальных Ссоответственно более 151 и 131). Первую группу, наиболее близко расположенных к ним клавиш, занимает буквы "н"."р" и "л" (от 67. до 7% от всех букв).

Анализ взаимных сочетаний показал, что наибольшее расстояние среди них должно принадлежать парам "ин" и "ил", что учтено расположением их в I и III рядах, а буква "р" располагается после буквы "а" В полученной конфигурации в следующее кольцо попадают клавиши.'расположенные справа от букв "н" и "л", их занимают соответственно буквы "о" и "д". На следующем шаге выделяется группа из

4-х клавиш, которые должны занимать буквы "т"."г"."м"."у". По взаимоотношению о буквой "и" буквы "г" и "т" распологаюгся слева, а

буквы "м" и "у" справа от синтезированного ядра Аналогичным обра-

зом располагаются буквы "к" и "б" •*ш",*Х',"с",иу","й","е" и группа из букв "э","в","ч'

группа из " "ж"."п

МПМ f<vll

букв

г

Последняя шестерка букв и две верхние крайние позиции особого влияния на значения критерия не имеют, поэтому их расположение выбрано соответственно фрагментам алфавита (фрагмент левых "ф","х","ц", "ч" против часовой стрелки. правый фрагмент "э","ю"."я" по часовой). На специальные клавиш выведены буквы "ъ" и "ь" как наименее часто употребляемые на узбекском языке.

Обпщй вид клавиатуры с буквенными символами представлен на рис. ...

г

л

I Ъ I

1_I

г

|ё1Ф1з\ш1г1н1д|у|к;|ж1э1у

л.

п——1——1——I——I——1——i——I-1-1-i-г

|х|в|г|к|и|а|р|б|й|п|ю|

1 I 1 ! 1 I 1 I 1 I 1 ■ 1 I 1 I 1 I 1 I 1 I '

|ц|ч|с1т|л[о1м|е|х;|я[

|-1_I_I_I_I_I_I I_I_I

ь I

с

Рис.-; Общий вид клавиатуры (РСТ Уз 586-92).

Разработаны также два варианта по критерию легкости запоминания, первый из которых в основе своей синтезирован из фрагментов алфавита, а второй в различных модификациях реализует морфологические принципы группировки.

Проведен сравнительный анализ результатов предложенного алгоритма с наиболее распространенными алгоритмами размещения. В рамках диссертационной работы нами в качестве сравнительных алгоритмов выбраны алгоритмы последовательного и итерационного размещения типовых конструктивных элементов на коммутационном пространстве. Согласно итерационному алгоритму осуществляется перебор и парная перестановка букв, приводящая к максимальному уменьшению целевой функции. Шсле этого организуется поиск и перестановка следующей пары букв и т. д. Процесс заканчивается получением такого варианта расположения букв на клавиатуре, для которого дальнейшее улучшение за счет парных перестановок букв невозможно.

Для последовательного алгоритма выбор элемента произведен по критерию максимальной связанности с размешанными элементами.

Выбор позиции осуществлен по двум принципам:

а) заполнение монтажного пространства от центра по ортогональной спирали;

б) заполнение монтажного пространства от центра по диагональной спирали.

Результаты показывают, что из рассмотренных двух подходов к решению задачи размещения букв узбекского алфавита на клавиатуре последовательным методом более оптимальным является вариант размещения по принципу а). Машинные расчеты показали, что суммарная длина связей для двух рассмотренных вариантов равнялась соответственно

a) SUMI-16.741. 431 мм; б) SUM2-16. 976. 006 мм.

В диссертационной работе при решении задачи итерационным методом в качестве первоначального размещения рассмотрены 7 вариантов. Все они были улучшены по показателю критерия минимума суммарной взвешанной длины связей (МСД).

Наилучший результат получен для варианта, где в качестве первоначального размещения букв принято размещение букв на основе Стандарта Республики Узбекистан 586-92, для которого исходный критерий МСД равен SUM-16. 065. 685 мм. После 22 перестановок размеще-

ние было улучшено и значение критерия достигло ЗШ-15.003.906 мм.

Ддя проведения испытательных работ были сформированы 3 группы испытателей под условными названиями:"профессионалы","любители" и "начинающие".

Следует отметить, что для каждого варианта клавиатуры были разработаны соответствующие драйверы клавиатуры, экрана и принтера.

В качестве показателя эффективности клавиатуры выбиралось общее время подготовки тестового текста, как модели среднестатистического текста Оно вычислялось как:

, = * ^исп: П О

где: х,, - бремя ввода тестового текста;

■¿исп - среднее время, затраченное на исправление одной ошибки ввода;

П - количество ошибок при вводе тестового текста

Данные испытаний показывают, что во-первых, в целом предложенные варианты расположения букв узбекского алфавита на клавиатуре обладает существенным преимуществом по сравнению с существующей клавиатурой с добавлением букв г.^.у,^, во-вторых клавиатура, где буквы расположены в соответствии с разработанными нами стандартами, несмотря на сравнительно большее значение критерия оптимальности, дает лучшие показатели, а это подтверждает правильность выбранного комплекса критериев, в-третьих, наблюдается закономерный разброс в показателях в зависимости от категории пользователя и от специфики текста.

Выразим относительную эффективность вариантов расположения

букв на клавиатуре в виде отношения времени подготовки тестовых

текстов: л,п

/V испып.

П =

испыт

О п<г)

где Ц испит, и И цспилг. значения показателя в соответствующих вариантах.

При достаточной адекватности принятых критериев оптимальности и точности решения оптимизационной задачи к реальным условиям эксплуатации клавиатуры можно считать, что

/? ислыт.

(3<2) испит,

о'1' где Н

пы>

и /т значения критериев оптимальности

в соответствующих вариантах.

Г^г ~ геометрический коэффициент эффективности. ОСНОВНЫЕ РЕЗУЛЬТАТЫ РАБОТЫ

В диссертационной работе впервые осуществлена постановка и решена задача создания клавиатуры для средств подготовки печатной текстовой информации (средств ЭВМ и оргтехники), удобной с точки зрения набора текстов на Государственном узбекском языке.

В процессе решении получены следующие частные результаты:

1. По результатам анализа существующих типов клавиатур предложены их классификации. Выявлены наиболее значимые критерии качества, которые были учтены при совершенствовании современных кла-виэтр.

2. Осуществлена формулировка критерия оптимальности и задачи оптимизации расположения букв, представляющие минимизацию суммарного расстояния на подготовку среднестатистического текста. Математически задача сводится к нахождению решения целочисленным программированием при геометрических ограничениях, соответствующих конфигурации буквенного фрагмента клавиатуры.

3. Оценен объем статистических данных, обеспечивающий достоверность выводов об особенностьях вводимой информации. Объем текстовых данных, отражающих по форме и содержанию современный текстовый материал узбекской письменности, должен быть порядка 0,7 Ш.

4. Осуществлена выборка текстовых файлов, разделенные на семь групп по характерным тематическим признакам. Проведен статистический и лингвистический анализ узбекского литературного языка, выраженного в алфавите существующей графики, позволивший установить значения элементов матрицы частот парных комбинаций букв.

5. Предложены алгоритмы интегрированно-последовательного решения задачи размещения и кольцевого синтеза оптимальной клавиатуры. Сущность кольцевого алгоритма заключается в выделении элементов в

с после душей детализацией фрагментов клавиатуры путей минимизации значения подкритерия или исходя из требований легкости запоминания.

Произведен сопоставительный анализ разработанного алгоритма с суадэствуюцими алгоритмами размещения и оценена его эффективность путем специально поставленных машинных экспериментов для тестовых и реальных условий.

6. Предложен критерий интегральной эффективности клавиатуры и исследована его связь с частными критериями (геометрическим, психофизиологическим и др.).

7. Осуществлен синтез оптимального расположения букв узбекского алфавита на клавиатурах ЭВМ и в других средствах оргтехники, утвержденный в качестве Стандарта Республики Узбекистан и введенный в действие с 1-го сентября 1992 года

Опытными испытаниями экспериментально оценена эффективность разработанных вариантов распололения букв на клавиатуре.

Пэ теме диссертации опубликованы следующие работы:

1. Гуломов ЕМ., Нуритдинов ЕЕ , Ирисбаева Ы.М.. ЭДсоблаш техникаси, риёзиёт, тилшунослик со^асидаги мутахассислар ва олим-лар ^амкорлигида жумздфият ми^есида биринчи навОатда хдл 1^ишниши лоз им будган муаммолар // Узбек гилида илмий-гехникавий адабиёт-ларни ёзиш ва нашр к^диш муамшларига багишланган жумхурият ил-мий-техникавий анжуманида кщинган маърузалар баёни. - Тошкент, 10-12 июнь 1991 йад. - Бет 6.

2. Нуритдинов Е Е, Ирисбаева М. М.. Вопросы оптимального расположения литер на клавиатуре для подготовки текста на узбекском языке // Тезисы докладов региональной научно-технической конференции "Моделирование и управление в технических системах". - Ташкент, 20-23 мая 1991 года. - С.199-200.

3. Гулямов Е М., Нуртдииов Е Н., Ирисбаева и. и. Клавиатура ЭВМ и другой оргтехники с оптимальным расположением букв узбекского алфавита // Тезисы докладов Второй Международной конференции "Системный анализ, моделирование и управление сложными процессами и объектами на базе ЭВ1Г. - Ташкент, 16-17 декабря 1992г. - С. 83.

4. Гулямов Е М,, Нурупдинов Е Е , Ирисбаева Ы. М., Мирсаатов А. М., Ульянов Е А. Средства вычислительной техники. Расположение букв узбекского алфавита на клавиатуре. Стандарт Республики Узбе-

кистан. РСТ Уз. 586-92.

5. Гулямов Ш. Ы., Нуритдшюв Е Е , Ирисбаева М. М. , Ыирсаатов А. М., Ульянов К А. Машины пишущие. Расположение букв узбекского алфавита на клавиатуре. Стандарт Республики Узбекистан РСТ УЗ. 587-92.

6. Гуломов Е М., Курт данов Ш. Н., Ирисбаева Ы. М. Э)^ ва таш-килий техника учун узбек алифбоси ^арфлари энг кулай жойлаштирил-ган клавиатура // Электр энергиясини ишлаб чик^риш ва машинасозлик саноатида з^амда хал^ хужалигининг бо[ща со^аларида энерготехнология масалалари буйича Республика илмий-техникавий анжуманида ^и-линган маърузалар баени. - Тошкент, 16-17 декабрь 1992 йил.

- Бет 18.

7. йриобпова И. М. ЭДМ ва талкилий техника учун узбек алифбоси ^арфлари энг ну лай юйлалггириш алгоритми / Ешларнинг илмий изла-нишлари ва ишлаб чи^ариш истшфоли. Илмий макрлалар туплами. -ТошДТУ, 1993 йил. - Бет 11.

8. Ирисбаева М. М. Э^М ва ташкилий техника учун узбек алифбоси з^арфлари энг ну лай жойлаштирилган клавиатура, кодлар жадвалини ишлаб чищп / Ешларнинг илмий изланишлари ва ишлаб чи^ариш истикроли. Илмий макрлалар туплаыи. - ТошЯГУ, 1993 йил. - Бет 12.

9. Ирисбаева М. М. Оптимальное расположение букв узбекского алфавита на клавиатуре / Труды Республиканской научно-технической конференции "Проблемы выработки электрической энергии и вопросы энергтехнологии в машиностроении и других отраслях народного хозяйства Республики Узбекистан". - Ташкент, 16-17 декабря 1992 года. - С. 70.

10. Цуритдинов Ш. Е , Ирисбаева Б. К , Шэумаров К М. "Системный синтез клавиатуры ЭВМ и другой оргтехники для букв узбекского алфавита // Тезисы докладов Третьей Международной конференции "Системный анализ, моделирование и управление сложными процессами и объектами на базе ЭВМ". - Ташкент, 8-10 ноября 1993 года -С. 119.

11. Нуритдинов ЕЕ, Ирисбаева М. М. , К. Назаров, Шэумаров Б.М. Статистический и лингвистический анализ узбекской письменности, выраженной в алфавите существующей графики / Деп. в справочно-информационном фонде ШЛИ ГКНГ РУз 15.04.94 г. Рег. N 2013-РУэ.

/ яг

ДООВЛАШ ТЕХНИКАСИ ВОСИТАЛАРИДАГИ АХБОРОТНИ КИРИГИШ ^УРИЛМАЛАРИДА УЗБЕК АЛИФБОСИ ЦРФШИНК ОПТИМАЛ ЖОЙЛАШГИРИШ

Ирисбоева Махмуда Ыусаевна

Диссертацион ивда биринчи маротаба давлат узбек тилидаги матнларни териш нук^гаи назаридан ну лай булгаа босма матнли ахбо-чай&раат ва ташилий техника воситалари) учув уаювиагу-рани яратиш масаласи куйидтан ва х;ал ^илинган. Хуоусан, мавжуд клавиатуралар тур лари тазушл ^илиниб, уларнинг таснифлари таклиф к?шшган. Оптиыаллик мезони ва урта статистик матнни тайёрлашда утиладиган умумий масофани минималлашгиришдан иборат х;арфлар жой-лашувини оптималлаштириш масаласи ифодаланган. Математик жи^атдан мае ала клавиатура з^арфий (^исмининг шаклига мое геометрик чеклов-ларни здесобга олиб, бутун сонли дастурлаш усули билан ечиыни то-пишга келтирилади. Киритилаетган ахборотнинг хусуеиятлари эвдида хулосаларнинг ишончлилигини таъминлайдиган статистик маълумотлар ^аяыи ба^оланган. Ыавзуга хос аломатларга кура еттита гурузд'а булинган матнли файллар танланган. фрфлар жуфти учраши матрицаси элементлари щйЫатларини аншушш имконини берган торий графикадаги узбек алифбоси х;арфларида ифодаланган узбек адабий тили статистик ва лингвистик тазушл ^илинди. Оптимал клавиатуранинг интеграллаш-ган бос^чли ва доиравий синтез алгоритмлари таклиф этилди. Доира-вий алгоритм клавишларни гурузуьарга уларнинг якка з^олда учрашининг камайиши тартибида ажратишдан иборат. Гуру^ларда элементлар кушим-ча мезон ^ийматларини минималлаштириш йули билан ёки осон зелаб ирлиш талабларига кура жойлаштирилади. Ишлаб чщилган алгоритмни мавжуд жойлаштириш алгоритмлари билан ^иёсий та^лили утказилиб, унинг самарадорлиги махе ус руйилган машина тажрибалари асосида ба^оланди. Узбекистан Республикаси Давлат Стандарти даражасида тасдицланган ва 1 сентябрь 1992 йилдан кучга кирган ва Ооща ташкилий техник воситалар клавиатураларида узбек алифбоси з^арфда-рининг оптимал жойлащуви топилди. Клавиатурада ^арфлар мэйлашуви-нинг яратилган вариантлари самарадорлиги синов тажрибаларида аншуюнди.

- 19 -

THE OPTIMAL ALLOCATION OF UZBEK ALPHABET LETTERS FOR INFORMATION UNPUT DEVICES OF COMPUTERS.

Resume

Irisbaeva Makhmuda Musaevna

At this dissertation work for the first time the problem of a creation of a uzbek letters allocation for computer keyboard is formulated and solved. The considered letter allocation is convenient for a preparation of text information on State uzbek language. Types of existing keyboards were classified during its analysis. The formulation of an optimality criterion and a task of an optimisation of letter allocation is solved for a minimization of summary distance during a midstatistical text preparation. Mathematically this task is leaded to a searching of solution of an integer programming with geometrical limitations, that is conformed for letter fragment of computer keyboard. The volume of statistics Is defined for a providing of authentity of conclusions about per-culiarittes cf inlet information. The text files selection is separated to seven groups by thematical features. The statistical and linguistic analysis of uzbek literature language at an existing graphics allowed to determine the values of elements of matrix of paired letters combination frequency. Algorithms for an integrated serial solution of task of an allocation and a cycle synthesis of an optimal letter allocation is offered. The cycle algorithm solves an allocation task by an extraction of elements to groups of keys to decreasing single frequency range. The detai-lization of keyboard fragments is done by a minimization of a subcriterion value or. with consideration of memorization lightness. The designed algorithm is compared with existing algorithms of letter allocation and the its officacy is estimated by special computer experiments for testing and real conditions. The synthesis of an optimal allocation of uzbek alphabet letters for keyboards of computers and other computational technique. This designed letter allocation is confirmed as the standard of Uzbekistan republic and actioned from 1 September 1992 y. The officacy of designed variants cf letter allocation for keyboard is estimated during experiments.