автореферат диссертации по транспортному, горному и строительному машиностроению, 05.05.01, диссертация на тему:Технология автоматизированной компоновки текстов математических формул в процессе выпуска сложных изданий
Автореферат диссертации по теме "Технология автоматизированной компоновки текстов математических формул в процессе выпуска сложных изданий"
УКРАЇНСЬКА АКАДЕМІЯ ДРУКАРСТВА
~ г &
У\о -
V ^ „
^ ^ ^ Ріпецький Роман Йосипович
УДК 655.28:681
ТЕХНОЛОГІЯ АВТОМАТИЗОВАНОГО КОМПОНУВАННЯ ТЕКСТІВ МАТЕМАТИЧНИХ ФОРМУЛ В ПРОЦЕСІ ВИПУСКУ СКЛАДНИХ ВИДАНЬ
05.05.01 - машини і процеси поліграфічного виробництва
Автореферат дисертації на здобуття наукового ступеня кандидата технічних наук
Львів - 2000
Дисертацією є рукопис.
Робота виконана в Українській академії друкарства Міністерства освіти
і науки України
Науковий керівник: доктор технічних наук, доцент
Провідна установа: Національний технічний університет України «Київський політехнічний інститут», видавничо-поліграфічний факультет, кафедра машин-автоматів поліграфічного виробництва.
Захист відбудеться «ЗО » я 2000 р. о годині
на засіданні спеціалізованої вченої ради Д 35.101.01 в Українській академії друкарства (79020, м. Львів, вул. Підголоско, 19).
З дисертацією можна ознайомитися у бібліотеці Української академії друкарства (79020, м. Львів, вул. Підвальна,
Сеньківський Всеволод Миколайович,
Українська академія друкарства, завідувач кафедри
Офіційні опоненти: доктор технічних наук, с.н.с.
Русин Богдан Павлович,
Фізико-механічний інститут НАН України, завідувач відділу
кандидат технічних наук, доцент Миклушка Ігор Зеновійович, Українська академія друкарства, завідувач кафедри
17).
Автореферат розісланий «/гУ»
2000 р.
Вчений секретар спеціалізованої вченої ради
ЗАГАЛЬНА ХАРАКТЕРИСТИКА РОБОТИ
Актуальність теми. Незважаючи на значне збільшення кількості видавництв, в останні роки спостерігається тенденція до постійного зменшення тиражів книжкової продукції, стан книговидавництва не відповідає потребам суспільства. Значно скоротився випуск науково-технічної літератури. Причиною такого становища, крім економічних факторів, є недосконалість технології випуску складних видань, яка особливо відчутно проявляється при обробці текстів, що містять математичні формули.
За останні роки в Україні активно запроваджуються технології комп’ютерного опрацювання тексту, які в перспективі повинні забезпечити випуск друкованої продукції, витісняючи поступово з ринку програмне забезпечення іноземних фірм. Основу новітніх технологій становитимуть системи комп’ютерної підготовки видань (СКПВ) - інформаційно-програмні комплекси для кодування і комп’ютерного формування текстів різної складності.
У вітчизняній поліграфії склалися передумови для успішного впровадження таких систем. Однак проблема автоматизованого випуску складних видань на сьогоднішній день до кінця не вирішена, оскільки власних розробок в цьому напрямі практично немає, а найбільш поширені програмні пакети іноземних фірм вимагають значних, зусиль та затрат часу на кодування математичних виразів. Тому задачі подальшого розвитку СКПВ та розробки засобів автоматизованого компонування текстів математичних формул, орієнтованих на випуск науково-технічних видань, є своєчасними та актуальними.
Зв’язок роботи з науковими програмами, планами та темами. Науковий напрям дисертаційної роботи є складовою частиною держбюджетної тематики кафедри прикладної математики Української академії друкарства в області створення моделей та алгоритмів комп’ютерного опрацювання текстової і графічної інформації і відповідає Державній програмі розвитку книговидання і преси У країни.
Мета і задачі дослідження. Розробка засобів та методів комп’ютерного опрацювання математичних виразів — основи
технології автоматизованого компонування текстів математичних формул в процесі випуску складних видань.
Для реалізації поставленої мети у відповідності з темою в роботі розв’язано наступні задачі:
- розробка метамови опису структури математичної формули довільної складності;
- розробка способу кодування математичних формул;
- створення системи алгоритмів і програм автоматизованого компонування текстів математичних формул;
- розробка схеми технологічного процесу автоматизованого компонування текстів математичних формул;
- розробка алгоритму верстання сторінок видань, що містять математичні формули;
- оцінка надійності програмного забезпечення підсистеми компонування математичних формул.
Наукова новизна одержаних результатів:
- розроблено спосіб та метамову опису математичних формул;
- розроблено методи автоматизованого компонування математичних формул на основі їх багаторівневого стратифікованого опису;
- розроблено ієрархічну систему алгоритмів опрацювання закодованих формул, яка містить процедури організації блоків, розрахунку кеглів та присвоєння шрифтів, структурування та просторового розміщення згідно існуючих поліграфічних вимог;
- встановлено, що аргументом функції надійності програмного забезпечення є кількість інформації, яка проходить через систему за час опрацювання видання в комп’ютері;
- розроблено метод визначення ймовірності появи місця програмного збою, значення якої прийнято за критерій надійності підсистеми компонування математичних формул.
Практичне значення одержаних результатів. Розроблені методи, моделі і програмне забезпечення дозволяють здійснювати
з
комп’ютерне опрацювання математичних формул довільної складності. Результати дослідження використовуються в навчальному процесі при проведенні занять з дисциплін «Комп’ютерні видавничі технології», «Основи комп’ютерного опрацювання текстової інформації» в Українській академії друкарства, в науково-дослідних роботах кафедри прикладної математики Української академії друкарства; при проведенні занять з дисципліни «Інформаційні системи автоматизованої обробки інформації» в Коломийському коледжі комп'ютерних наук.
Особистий внесок здобувана. Розроблено: стратифіковане представлення математичної формули; метамову для опису формул; алгоритми та програми комп’ютерного формування математичних виразів; схему технологічного процесу автоматизованого компонування математичних формул. Обґрунтовано математичну модель процесу комп’ютерного верстання сторінок, що містять математичні формули. Визначено ймовірність появи місця програмного збою, значення якої є критерієм надійності підсистеми компонування математичних формул.
Апробація результатів дисертації. Основні результати дисертаційної роботи доповідались на міжнародній конференції «Комп’ютерні технології друкарства: алгоритми, сигнали,
системи», (м. Львів, 1996, 1998); на міжнародній науково-практичній конференції «Квалілогія книги», (м. Львів, 1996); на звітних науково-технічних конференціях професорсько-викладацького складу, наукових працівників і аспірантів Української академії друкарства (м. Львів, 1997-1999).
Публікації. За матеріалами дисертації опубліковано 7 наукових праць, в тому числі 6 статей в наукових журналах та збірниках наукових праць, одна публікація у збірнику тез конференції.
Структура та обсяг дисертації. Дисертація складається зі вступу, чотирьох розділів, загальних висновків, списку літератури та додатків. Матеріал викладений на 111 сторінках машинописного тексту, містить 11 рисунків та 10 таблиць; у бібліографії наведено 134 найменувань літературних джерел на 13 сторінках і 2 додатки на 27 сторінках.
ОСНОВНИЙ ЗМІСТ РОБОТИ
У вступі обґрунтовано актуальність роботи, сформульовано мсту та задачі дослідження, наведено основні положення, які виносяться на захист, описано короткий зміст дисертації.
В першому розділі аналізується проблема комп’ютерної підготовки науково-технічних видань, що містять математичні формули. Відзначено, що формульне складання відноситься до найскладніших операцій опрацювання тексту і має свої особливості, які вимагають чіткої взаємної координації елементів формул та точного співвіднесення їх розмірів.
З появою в поліграфії СКПВ постали задачі розробки алгоритмів та програм для комп’ютерного опрацювання текстів, в тому числі математичних формул. Щоб алгоритмічно перетворити формальну структуру математичної формули у програму керування автоматом необхідно задати кожному символу формули його декартові координати місця розміщення формули на сторінці, гарнітуронакрєслення та кегель.
З точки зору складності опрацювання математичні формули поділено на п’ять груп. До першої віднесено однорядкові формули, що містять верхні та нижні індекси. Другу групу складають дворядкові формули, куди входять прості чисельник і знаменник. В третю групу включено трирядкові формули, які містять дріб в чисельнику або дріб в знаменнику. Четверта група -це багаторядкові формули, які містять верхні і нижні індекси, приставні крупнокегельні знаки як в чисельнику, так і в знаменнику. Найбільш складні формули віднесено до додаткової п’ятої групи.
Здійснено огляд програмних пакетів іноземних фірм для підготовки текстів математичних формул. Серед них найбільш розповсюджені: програма MS Word, в якій влаштований
формульний редактор MS Equation; програмне середовище ТЕХ Д.Кнута у різних його модифікаціях; програма верстання Ventura, в якій функціонує формульний редактор з мовою програмування EQN.
В результаті аналізу програмні пакети для підготовки текстів математичних формул поділено на дві групи:
- пакети типу WORD, що забезпечують підготовку формул в режимі просторового автоматизованого розміщення їх елементів;
- пакети типу ТЕХ, в яких кодування і автоматичне відтворення тексту формули здійснюється на основі попереднього формалізованого опису її структури.
Для приведених систем характерна висока трудомісткість набору формул, яка в роботі оцінюється коефіцієнтом клавіатурного процесу та інтегральним показником ефективності.
На даний час теоретичні дослідження, на основі яких можна було б створити ефективні моделі та алгоритми процесів компонування математичних формул, проводяться недостатньо інтенсивно та не мають практичного виходу. Саме тому розробка технології випуску складних видань, основою якої є вітчизняні програмні пакети автоматизованого компонування математичних формул, є актуальною.
У другому розділі на основі проведеної класифікації математичних формул розкрита їх структура і запропоновано методи структурно-семантичного аналізу, які визначають взаємне розміщення у формулі окремих фрагментів. Такі фрагменти зведені до рівня текстових, що дозволило подати їх у вигляді ієрархічної структури. Тоді структурна модель математичної формули виступає як сукупність вкладених один в одного блоків з текстових фрагментів.
Розроблено формалізований спосіб віднесення видань до певної групи складності згідно видавничої класифікації. Загальну кількість одиниць складності у виданні можна оцінити наступним виразом:
П Ші
К = ї ZEij , (1)
і=1/=1
де Eij - 7-й елемент складності, що повторюється j разів.
Тоді показник середньої складності видання S = 5
де N - загальна кількість видавничих аркушів.
При підготовці текстової інформації використовується відповідне шрифтове забезпечення, яке містить букви, цифри, математичні символи, спеціальні знаки. Певний набір знаків, який забезпечує випуск тих чи інших типів видань, комплектується у
вигляді шрифтової гарнітури. Основний комплект знаків текстових гарнітур включає знаки українського (раніше російського) та латинського алфавітів, цифри, спеціальні знаки. Шрифтове забезпечення складного набору додатково містить: знаки грецькі, готичні, індекси, знаки астрономічні та математичні, знаки структурних формул і т. п.
Множину споріднених між собою знаків шрифтової гарнітури назвемо алфавітом. З огляду на це текстова гарнітура складається із п’яти алфавітів: українського, російського,
латинського, цифрового та алфавіту спеціальних знаків. Позначимо їх умовно буквами V, Н, Ь, С, X. Враховуючи сказане, гарнітуру також можна вважати алфавітом, що об’єднує окремі складові алфавіти.
В результаті літературна гарнітура запишеться наступним виразом:
ш = ииіі\лцсих. (2)
На основі аналізу семантичної та структурної будови формули розроблено схему її стратифікованого представлення. Вводиться поняття ієрархічного інформаційного рівня математичної формули, в ролі якого виступає її логічно і структурно завершена частина: символ, слово, рядок, формульний фрагмент. Проаналізовано та узагальнено вимоги до локальних перетворень елементів на кожному з рівнів.
Для опрацювання в СКПВ математична формула попередньо поділяється на формульні фрагменти, описується як лінійна послідовність символів, після чого кодується. Лінійний зашіс математичної формули під час кодування доповнюється командами, які забезпечують можливість розпізнавання структури формули («початок блоку», «кінець блоку», «охоплення зліва», «охоплення справа») і суті окремих її частин («чисельник», «знаменник», «кінець дробу», «початок індексу», «кінець індексу», а також форматування символів - кегель і шрифт. Характерні команди ідентифікації математичної формули наведені в табл. 1.
Таблиця 1
Характерні команди ідентифікації математичної формули
Позначення команди Зміст команди
[МФ] Початок формули в загальному масиві тексту (формула розташована в окремому рядку)
[МР] Початок формули в загальному масиві тексту (формула розташована разом з основним текстом видання)
т Кінець формули
ко Кегель шрифту основного тексту видання
шо Гарнітуронакреслення шрифту основного тексту видання
Структурна формалізація математичної формули, в якій кожна конструкція задається своєю командою, матиме наступний вигляд:
<Математична формула> ::= [МФ] <ФФ> [@] | [МФ] {<фф>} [@] І [МР] <ФФ> [@] І [МР] {<ФФ>} [@].
На основі нормальної нотації Бекуса створена метамова опису математичних формул (табл. 2). В результаті запис математичної формули подається як лінійна послідовність команд та формульних фрагментів.
Запропонована в роботі метамова дозволяє не тільки розпізнавати та відділяти окремі команди та текстові фрагменти, але й встановлювати призначення цих команд для їх виконання. Формалізація опису та використання складових компонент забезпечили досягнення однозначності інформації в процесі перетворення, тобто інваріантності суті та форми математичної формули.
Багаторівневий опис структури цілого видання, в якому математична формула виступає як окремий компонент зі своєю інформаційною структурою, та функціональна схема потоків даних відображають загальну сукупність задач та множину перетворень, які здійснюються над формулою.
Для розв’язання цих задач створена підсистема компонування математичних формул (КМФ), побудована за
модульним ієрархічним принципом. Кожний з модулів підсистеми орієнтований на розв’язання специфічної задачі.
Вхідна інформація для підсистеми поділяється на дві підмножини: текст формули; вхідне поле даних, яке кодується перед викликом підсистеми.
Вихідною інформацією є розширений масив ознак кожного символу (РМС), який в подальшому використовується для просторового розміщення формули і містить: код символу; координата х, .у; висоту//; ширину W; кегель К\ шрифт/*"; № блоку; допоміжне поле.
У третьому розділі наведено алгоритми підсистеми компонування математичних формул, які реалізовано у вигляді багаторівневої ієрархічної структури на базі головної програми (диспетчера) та підпорядкованих їй функціональних процедур різних рівнів.
Таблиця 2
Фрагменти метамови опису математичних формул
№ Вираз Назва ЧФ Вид часткового формату
1 основа*““1 Степінь [СТ] <вираз1> [*]
2 основа 1И_раЗІ Індекс [ІН] <вираз1> [*]
3 “'р у/ виразі Корінь [КОР] <вираз1> [ПОК] <вираз2> Г*І
4 yj виразі Квадратний корінь [KOPJ <вираз1> [*]
5 ьнрааз | виразі імраз2 Визначений інтеграл [ІНТ] <вираз1> [НМ] <вираз2> [ВМ] <виразЗ> [*]
б іирлзЗ У, виразі жирлз Z Сума (ряд) [СУМ] <вираз 1 > [НМ] <вираз2> [ВМ] <виразЗ> [*]
7 вира зЗ виразі Добуток [ДОБ] <вираз1> [НМ] <вираз2> [ВМ] <виразЗ> [*]
8 lim виразі іьрдз2 Границя [ГР] <вираз!> [НМ] <вираз2> [*]
Проаналізовано та узагальнено теоретичні і технологічні вимоги до локальних перетворень формули на кожному з рівнів. Створено ієрархічну систему алгоритмів та програм формування блоків математичних формул, в яких поєднується стратифікований спосіб подання структури формули зі специфічними лінгвістичними конструкціями її змісту.
Головна програма забезпечує послідовне включення в роботу функціональних модулів наступного рівня на основі аналізу інформації від інших підсистем СКГГВ, структури формули та її внутрішніх команд, а також певних ознак і результатів роботи окремих модулів підсистеми. В її обов’язки входить аналіз результатів і діагностичних повідомлень підпорядкованих модулів, вироблення на їх основі управляючих дій. Формується загальна діагностика результатів опрацювання математичної формули, яка передається диспетчеру програмного забезпечення всієї системи. Основні модулі підсистеми КМФ реалізують такі функції: модуль 1 - вибирає з видання формульний текст за його ознаками (початок [МР] або [МФ] і кінець формули [@]) для подальшого опрацювання;
модуль 2 - реалізує синтаксичний аналіз команд
формульного тексту, які вносяться під час розмічення і кодування формули, а також здійснює перекодування команд у внутрішнє представлення, зручне для їх опрацювання;
модуль 3 - встановлює формальну відповідність тексту формули її структурі на наявність чн відсутність помилок, пов’язаних з оформленням блоків;
модуль 4 - основний модуль КМФ - задає цикл опрацювання перекодованого тексту математичної формули і тим самим здатний створювати ієрархічні конструкції. Якщо зустрічається команда, то управління передається відповідній процедурі, інакше здійснюється формування фрагменту формули.
Поліграфічні процедури: 1п - шрифтове оформлення
символів математичної формули, 2п - встановлення для символів гарнітуронакреслення та кегля шрифту.
В описі алгоритмів використовуються наступні масиви та змінні: РМС - розширений масив ознак символів; ДОФ - довжина перекодованого тексту формули - кількість символів, які містяться у формулі (на вході); ЛПБ - кількість команд «початок блоку»; ЛКБ - кількість команд «кінець блоку»; МВБ - масив номерів
відкритих блоків; МОВБ - масив ознак відкритих блоків; МСБ -масив номерів сформованих блоків; STEK - глибина вкладеності блоку, що формується; ЛДВ - лічильник відкритих дужок; ЛДЗ -лічильник закритих дужок; ШПС — гарнітуронакреслення шрифту поточного символу; ШО — гарнітуронакреслення шрифту основного тексту видання; КПС - кегель поточного символу; КО
— кегель шрифту основного тексту віщання.
Систему алгоритмів підтримує масив відкритих блоків МВБ, з допомогою якого його можна визначити порядковий номер блоку, порядок його вкладеності, кількість відкритих блоків. Безпосередньо кількість відкритих блоків записується в змінну STEK.
Так, наприклад, при структурі дробу Q 4~ Ь v = а~Ь 1 а + с
У с + d b + d с - d
одержимо наступний варіант розмічення для кодування:
7 = [ЧС] [ЧС] а + b [ЗН] а - b [*] [ЗН] [ЧС] c + d [З Щс-d [*] [*] + [ЧС] а + с [ЗН] b + d [*].
Дальше аналізуються внутрішні команди формули і обчислюється кількість команд «початок блоку» - «кінець блоку». Введемо умовні позначення: НБВ — номер блоку, що
відкривається, НБЗ — номер блоку, що закривається. Тоді порядок формування блоків матиме такий вигляд:
НБВ1 НБВ2 . ..НБ32 НБВЗ...НБЗЗ НБ31...НБВ4 ...НБ34
Значення ознак, масивів і змінних, одержаних в результаті роботи алгоритму, наведені в таблиці 3.
Для виділеного рядка таблиці числові значення розшифровуються наступним чином: відкрито 3 блоки (ЛПБ); один блок закрився (ЛКБ); закрився блок №2 (НБЗ); відкриті блоки №1 і №3 (МВБ); сформований блок №2 (МСБ); відкритих 2 блоки (STEK); блоки №1 і №3 - дроби (МОВБ).
Запропоновано алгоритм верстання сторінок, що містять математичні формули. Алгоритм розглядає математичну формулу
як деякий блок прямокутної форми, який потрібно помістити в певне місце тексту. У цьому випадку елементами верстання, крім фрагментів звичайного тексту, стають математичні формули.
Таблиця З
Значення змінних та масивів структурних частин дробового виразу
№ СТ.Ч ЛПБ ЛКБ НБЗ МВБ МСБ Б ТЕК МОВБ
1 У= 0 0 0 0 0 0 0
2 чс 1 0 0 1 0 1 1
3 чс 2 0 0 1,2 0 2 1,1
4 а+Ь 2 0 0 1,2 0 2 1,1
5 зн 2 0 0 1,2 0 2 1,1
6 а-Ь 2 0 0 1,2 0 2 1,1
7 кд 2 1 2 1 2 1 1
8 ЗН 2 1 2 1 2 1 1
9 чс . "3 ■ 1 • -2-К їда* ''
1 с+сі 3 1 2 1,3 2 2 1,1
1 ЗН 3 1 2 1,3 2 2 1,1
1 с-сі 3 1 2 1,3 2 2 1,1
1 КД 3 2 3 1 2,3 1 1
1 КД 3 3 1 0 2,3,1 0 0
1 + 3 3 1 0 2,3,1 0 0
1 ЧС 4 3 1 4 2,3,1 1 1
1 а+с 4 3 1 4 2,3,1 1 1
1 ЗН 4 3 1 4 2,3,1 1 1
1 Ь-й 4 3 1 4 2,3,1 1 1
2 КД 4 4 4 0 2,3,1,4 0 0
Найчастіше при верстанні сторінки останній блок викликає переповнення формату7. Її наслідком може бути два варіанти вирішення: розмістити блок формули на даній сторінці (тобто втягнути його в межі сторінки); перенести формулу на наступну сторінку - здійснити витягнення блоку. Тоді алгоритм верстання сторінки доповнюється задачею зміни об’єму тексту, який верстається, за рахунок зміни величини проміжків між словами.
При цьому об’єм матеріалу для втягнення (ІУТ) або витягнення (ИТ) визначається рівностями:
Ш=ІВі-Н, (3)
1 = 1
к-1
Ш = Я- 15,, (4)
і = 1
де В,- - висота і - го блоку формули; Н - вертикальний формат сторінки; к - кількість блоків, які використовуються при верстанні сторінки.
Вираз (3) характеризує нижню частину блоку, яка виходить за межі сторінки. Розмір його верхньої частини, яка вмістилась на сторінці, визначається рівністю (4).
Математична модель процесу на певному етапі формування сторінки дозволяє прийняти тільки формальне рішення про необхідність втягнення або витягнення останнього блоку. Звичайно виникають більш складні ситуації, що вимагають взаємного жорсткого розміщення блоків.
Створена система алгоритмів опрацювання закодованих формул може бути складовою частиною алгоритмів опрацювання складних видань.
У четвертому розділі досліджено процеси тестування та надійності програмного забезпечення з використанням інформаційно-ймовірнісного підходу. Розроблені методи комплексної (структурної, інформаційної, алгоритмічної і технологічної) перевірки програм СКПВ, знаходження і виявлення в них помилок Отримано вираз для розрахунку часу повного виявлення помилок.
Для налагодження програм розроблені методи впорядкованого і невпорядкованого тестування. До програм СКПВ застосований метод динамічного тестування (детермінований і стохастичний). Налагодження структури здійснюється на тестових виданнях невеликого об'єму з перевіркою логіки взаємодії програмних підсистем ієрархічної схеми та включенням модулів кожного з рівнів в загальний процес підготовки видання. Тестування маршрутів реалізовано на прикладі алгоритму
визначення довжини багаторядкової формули. В загальному випадку така формула розглядається як багаторівнева ієрархічна структура, яку доцільно подати дробовими виразами різної степені вкладеності. Довжина кожного блоку визначається кількістю символів, а оскільки рядки формули знаходяться на різних рівнях, то її довжина не може бути порахована простим сумуванням довжин блоків. Алгоритм визначення довжини формули подано у вигляді блок-схеми, на основі якої створено управляючий граф та схему маршрутів. Управляючий граф алгоритму дозволив визначити повну ймовірність правильного функціонування програми:
Мк /V/£
Р=І.Гі=І.УіП(І-2у), (5)
7=1 /=1
де М¡с - кількість маршрутів; Уі - ймовірність реалізації і - го маршруту; - ймовірність помилки в у-ії дузі графа, що
входить в /-й маршрут.
Однією з визначальних складових СКПВ є програмне забезпечення, функціонування якого зумовлює майже всі показники роботи системи. Саме тому дослідження проблем надійності програмних комплексів має як теоретичне, так і практичне значення. Програмне забезпечення як самостійна система чи компонента системи вищого рівня складніше від чисто технічних систем. Функціонування програм в сукупності з технічними засобами не може служити підставою ідентичності підходу до аналізу і вивчення цих складових, тим паче механічного перенесення критеріїв і методів визначення надійності технічних компонент на програмне забезпечення. Програма не руйнується, її збої і відкази мають специфічний характер. Таким чином, програмне забезпечення - це особливий продукт, який вимагає спеціальних підходів для вибору критеріїв і способів оцінки стабільної роботи. Одночасно приймається до уваги, що технічні засоби, в сукупності з якими взаємодіють програми, мають власну надійність, яку треба враховувати.
Розроблено метод визначення надійності програм, який ґрунтується на твердженні, що збої чи відкази в програмах виникають внаслідок появи певних помилкових комбінацій кодів у
формульному тексті, не передбачених алгоритмами. Отримана загальна формула для визначення ймовірності виникнення програмного збою в деякій кількості інформації:
Рк=~ 1
Жт)
пц ту
І І р(и>2і)1°9ір(и>2і)+
Ь=іу=і
Лг -1 т^. +1 +1
+ 212 р(іі,2])Іод1р([1,г])
к = 1 ¡’ = /И£ 7 =/я^.
(6)
де /(2, Т) - середня кількість текстової інформації; р(їі - умовна ймовірність передачі знаку
В додатках подано фрагменти програм підсистеми компонування математичних формул, довідки про підтвердження практичної цінності розроблених засобів.
ВИСНОВКИ
В дисертації розв’язана актуальна наукова задача розробки моделей та алгоритмів автоматизованого компонування текстів математичних формул для систем комп’ютерної підготовки складних видань.
Основні результати роботи:
1. Проаналізовано особливості процесу компонування математичних формул з використанням програмних пакетів. Виконано порівняльну оцінку систем за критерієм ефективності клавіатурного процесу та встановлено напрями вдосконалення процесів компонування математичних формул.
2. Запропоновано структурний метод стратифікованого опису математичних формул, що ґрунтується на основних засадах математичної лінгвістики. Розроблено метамову для опису математичних формул, в якій моделі конструкцій подані в нормальній нотації Бекуса.
3. Розроблено систему алгоритмів компонування математичних формул, яка забезпечує синтаксичний аналіз тексту формули та
перевірку її структури, розрахунку кеглів і присвоєння шрифтів, визначення границь дробових та індексних виразів.
4. Розроблено математичну модель процесу верстання сторінок, що містять формули, в основі якої — утворення простих і складених блоків та сумування їх вертикальних розмірів. Сформульовано і математично обгрунтовано вимоги для прийняття рішення про втягненім чи витягнення блоку.
5. Запропоновано метод визначення рівня налагодження та ступеня надійності програми на основі кількості її результативних пусків. Розроблено методику тестування та одержано вираз для визначення ймовірності появи будь-якого місця збою в деякій кількості текстової інформації.
6. Розроблені моделі та алгоритми автоматизованого компонування текстів математичних формул можуть знайти застосування при використанні програмних пакетів підготовки до випуску складних видань.
СПИСОК ОПУБЛІКОВАНИХ ПРАЦЬ ЗА ТЕМОЮ ДИСЕРТАЦІЇ
1. Ріпецькнй Р., Сеньківський В. Комп’ютерне просторове моделювання складних математичних формул // Збірник наукових праць «Комп’ютерні технології друкарства». - Львів: УАД. - 1998. - С. 20-22.
2. Ріпецький Р.И. Метамова описання математичних формул // Науково-технічний збірник «Наукові записки». - Львів: УАД. -1999.-С. 75-77.
3. Ріпецький Р.Й., Сеньківський В.М. Моделювання процесу комп’ютерного верстання сторінок складних видань з використанням коефіцієнтів пріоритетності // Звітна наук.-техн. конф. - Львів: УАД. - 1999. - Вип.4. - С. 126.
4. Сеньківський В., Драбик І., Ріпецький Р. Інформаційне середовище систем комп’ютерної підготовки видань та його основні характеристики // Поліграфія і видавнича справа. -Львів: УАД. - 1997. - № 33. - С. 52-57.
5. Сеньківський В., Піх І., Ріпецький Р. До проблеми використання комп’ютерних технологій підготування віщань // Квалілогія книги. - Львів: УАД. - 1998. - С. 28-29.
6. Сеньківський В.М., Ріпецький Р.Й. Алгоритми моделювання текстів математичних формул // Міжнар. конф. «Комп’ютерні технології друкарства: алгоритми, сигнали, системи». - Львів: УАД. - 1996. - С.31-32.
7. Р.Ріпецький, В.Сеньківський. Методи тестування та
налагодження прграмного забезпечення комп’ютерного моделювання математичних формул // Збірник наукових праць “Комп’ютерні технології друкарства”. - Львів: УАД. - 1999. -Вип.З. - С. 13-22.
АНОТАЦІЇ
Ріпецький Р.Й. Технологія автоматизованого компонування текстів математичних формул в процесі випуску складних видань. - Рукопис.
Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.05.01. - машини і процеси поліграфічного виробництва - Українська академія друкарства, Львів, 2000.
В роботі розв’язана задача комп’ютерного компонування математичних формул при підготовці науково-технічних видань. На відміну від звичайного тексту математична формула має складну структуру, що визначає особливості її кодування.
Запропоновано структурний метод опису математичних формул, що ґрунтується на основних засадах математичної лінгвістики. Представлено ієрархічні рівні формул різної складності, розроблено металінгвістичну мову опису математичних формул, в який моделі конструкцій подані з використанням нормальної нотації Бекуса.
Розроблено систему алгоритмів поліграфічного опрацювання математичних формул, яка містить аналіз тексту формули та перевірку її структури, розрахунок кеглів та присвоєння шрифтів, визначення границь дробових та індексних виразів. На базі системи алгоритмів реалізовано динамічну модель компонування математичних формул та перевірено її ефективність.
Розроблено математичну модель процесу верстання сторінок тексту, що містять математичні формули, в основі якої утворення простих і складених блоків та сумування їх вертикальних розмірів.
Запропоновано методи підвищення надійності програмного забезпечення за результатами тестування та визначення рівня налагодженості системи.
Ключові слова: технологія, складні видання,
компонування формул, надійність програм.
Рипецкий Р.И. Технология автоматизированной компоновки текстов математических формул в процессе выпуска сложных изданий. - Рукопись.
Диссертация на соискание ученой степени кандидата технических наук по специальности 05.05.01 - машины и процессы полиграфического производства. - Украинская академия печати, Львов, 2000.
Диссертация посвящена вопросам разработки средств и методов компьютерной обработки математических выражений -основы технологии автоматизированной компоновки текстов математических формул в процессе выпуска сложных изданий.
В первом разделе проанализированы современные технологии компьютерной обработки текстов математических формул. Рассмотрены особенности подготовки математических формул с использованием программных пакетов иностранных фирм. Произведена оценка трудоемкости набора формул с использованием таких пакетов на основе коэффициента
клавиатурного процесса и интегрального показателя
эффективности. Выполнена классификация математических
формул.
Второй раздел посвящен вопросам проектирования информационного обеспечения подсистемы компоновки математических формул. Описано шрифтовое обеспечение
сложного набора, введено понятие алфавита системы.
На основе семантического и структурного строения формул разработана схема их стратифицированного представления. Сложная формула разбивается на отдельные фрагменты и кодируется как линейная последовательность символов. Созданы
определенные классы конструкции, представленные в нормальной нотации Бэкуса. Предложен ассортимент команд идентификации математической формулы.
Разработан метаязык описания математических формул, который позволяет распознавать отдельные команды и формульные фрагменты, а также устанавливать их предназначение для последующего пространственного расположения. Для решения этих задач создана подсистема компоновки математических формул, построенная по иерархическому модульному принципу.
В третьем разделе приведена разработанная система алгоритмов, состоящая из четырех основных модулей и нескольких полиграфических процедур. Модули распознают формулу в общем тексте издания, выполняют синтаксический анализ имеющихся в ней команд и перекодирование входной информации во внутреннее представление подсистемы. Устанавливается формальное соответствие текста формулы ее структуре, осуществляется пространственная компоновка ее фрагментов. Динамика функционирования алгоритма показана на примере обработки сложного математического выражения.
Предложен алгоритм верстки страниц изданий, содержащих математические формулы. Приведены соотношения, характеризующие состояние страницы, формульный блок в которой не помещается в формат; дана методика расчета параметров вгонки и выгонки текста.
Разработанные алгоритмы и программы автоматизированной компоновки текстов математических формул могут найти применение в технологических процессах выпуска сложной научно-технической литературы.
Четвертый раздел содержит методы оценки надежности программного обеспечения подсистемы компоновки математических формул, отладки и тестирования программ. Разработана методика тестирования программ. Определение надежности программ базируется на количественно -информационном характере программных ошибок и сбоев. В результате получено выражение для определения вероятности возникновения программного сбоя в некотором количестве текстовой информации. Рассмотрена схема передачи текстовой информации в каналах связи с препятствиями, выявлена мера искажения входной информации.
Ключевые слова: технология, сложные издания,
компоновка формул, надежность программ.
Ripetsky R.J. Technology of Automated Arrangement of Matematical Formulae Texts in the Process of Complicated Publication Publishing.
Theses for competition of scientific degree for technical sci-enccs candidate. Speciality 05.05.01. - Printing presses and processes.
- Ukrainian Academy of Printing, Lviv, 2000.
The paper has solved out the task of mathematical formulae arrangement while preparing scientific technical publications. In contrast to the usual text. A mathematical formula has a complicated structure that defines its coding peculiarities.
A structural discription of mathematical formulae that is based on the main principles of mathematical linguistics has been suggested. Hi с paper has presented the hierachical levels of various complication formulae and has worked out a metalinguistic language of mathematical formulae discription where construction models are presented with the usage of Bekus notation.
The paper has worked out the algorythm system of mathematical formulae printing treatment. The system contains the analysis of the text of the formula and its structure control, the account of type size, the definition the limits of fraction and index expressions. The dynamic model of mathematical formulae arrangement and its effectireness has been realized on the basis of algorythms.
The paper has worked out the mathematical model of text page make - up process that contains mathematical formulae that are based on creating simple and composed blocks and summing their vertical sizes. Methods of increasing software supply realiability resulting from testing and determination of the system adjustment level have been suggested.
Key - words: technology, complicated publications, formula arrangement, programme reliability.
-
Похожие работы
- Автоматизированный синтез компоновок металлорежущих станков
- Методология построения автоматизированной информационной системы принятия проектных решений по компоновке промышленных объектов
- Повышение качества компоновок станков на основе использования экспертных знаний
- Алгоритмы и комплекс программ построения математической модели компоновки промышленных объектов
- Исследование и разработка методов компоновки конструктивно-функциональных узлов ЭВА