автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.11, диссертация на тему:Разработка пакета программ для обработки изображений применительно к задаче автоматического анализа флюорограмм

кандидата технических наук
Ким Зи Гун
город
Москва
год
1992
специальность ВАК РФ
05.13.11
Автореферат по информатике, вычислительной технике и управлению на тему «Разработка пакета программ для обработки изображений применительно к задаче автоматического анализа флюорограмм»

Автореферат диссертации по теме "Разработка пакета программ для обработки изображений применительно к задаче автоматического анализа флюорограмм"

РОССИЙСКАЯ АКАДЕМИЯ НАУК ВЫЧИСЛИТЕЛЬНЫЙ ЦЕНТР

на правах рукописи

КИМ ГИ ЗУН

РАЗРАБОТКА ПАКЕТА ПРОГРАММ ДЛЯ ОБРАБОТКИ ИЗОБРАЖЕНИЙ ПРИМЕНИТЕЛЬНО К ЗАДАЧЕ АВТОМАТИЧЕСКОГО АНАЛИЗА ФЛЮОРОГРАММ

Специальность 05.13.II - математическое и программное обеспечение вычислительных машин, комплексов, систем и сетей

АВТОРЕФЕРАТ диссертации на соискание ученой степени кандидата технических наук

МОСКВА - 1992

-Л > '

Работа выполнена в Вычислительной центре Российской Акадешш наук.

Научный руководитель: кандидат технических наук старший научный сотрудник М.В.Кулагин

Официальные оппоненты: доктор технических наук, доцент А.Н.Тошлин

кандидат физико-математических наук, ст.научный сотрудник Вс.В.Шакин

Ведущая организация - НИИ системных исследований Российской Акадешш наук

Защита состоится ¿¿■¿с^^ 1992 г.

в ХЗ часов на заседании специализированного Совета K002.32.0I Вычислительного центра Российской Академии наук по адресу 117967, Москва, ГСП-1, ул. Вавилова, 40.

С диссертацией ыожно ознакомиться в библиотеке Института

Автореферат разослан " " 1992 г.

Ученый секретарь специализированного Совета, доктор

физико-ыатеиатических наук

К.В.Рудаков

Общая характеристика работы.

Актуальность теш. С развитием вычислительной техники, ростом производительности ЭВМ и возможностей программного обеспечения расширяется область практического использования цифровой обработки информации. Развитие методов обработки изображений, а главное, их практическое использование до недавнего времени сдерживалось, с одной стороны, относительно низкой производительностью широко доступных персональных ЭВМ и, с другой стороны, сравнительно сложным доступом к системам высокой производительности для обработки информации в реальном времени.

Сегодня ситуация меняется довольно быстро и разработки, которые до еще недавно представляли интерес лишь чисто в теоретическом плане, сегодня находят применение уже на практике. Одним из примеров такого использования ЭВМ является применение математических методов обработки в медицине. В области медицинской диагностики существует ряд задач, которые принципиально можно успешно решать с помощью современных ЭВМ:

1) Определить, здоров ли пациент, исходя из заданного набора признаков заболевания;

2) Установить конкретный диагноз и рекомендовать врачу назначение лечения;

3) Определить эффект назначенного лечения.

Тем не менее, широкое использование математических методов в медицине находится еще в начальной стадии, применение

- г -

ЭВМ б этой области требует не только реализации тех или иных вычислительных алгоритмов, но опыта практического врача. Поэтому сформулировать новые принципы и определить место вычислительной математики в медицине можно только опираясь: на практику совместной работы математиков и врачей, в условиях работы над задачами, имеющими реальное практическое значение.

Одним из таких приложений является разработка и реализация методов обработки и анализа рентгенологических изображений, которые в настоящее время находят все более широкое распространение. Преаде всего это связано с тем, что улучшение качества рентгеновского изображения за счет цифровой обработки позволяет получить дополнительную информацию о.со-остоянии пациента без дополнительного лучевого воздействия.

Обычно визуальная оценка рентгенорадиологического изображения субъективна и зависит от многих факторов: физико-технических условий съемки, качества обработки экспонированной пленки, опыта врача, индивидуальных способностей зрительно воспринимать рентгенографическую картину заболевания и т. д.

По данным работы Г.И. Дзюбы и Т.А. Передриенко (Москва, 1980) в СССР ежегодно проводилось более 100 млн. флюорографических обследований. Поэтому создание системы автоматизированной обработки и анализа рентгенорадиологических изображений является одной из наиболее важных задач в современной медицине.

Решение этой задачи в настоящее время стимулируется

тем, что развитие персональных систем привело к созданию высокопроизводительных рабочих станций ориентированных на интенсивное использование изображений и обладающих в силу этого специализированными аппаратными средствми, предназначенными специально для манипуляций с различными видами изображений. Стандартное программное обеспечение, предназначенное для работы с изображениями, реализует множество рутинных операций, связанных с отображением, хранением, передачей и преобразованием изображений. Производительность настольных систем выросла, как минимум, на порядок и обеспечивает выполнение программ спектрального анализа, геометрических пребразований и других, требующих высокого быстродействия, в реальном, с точки зрения врача-рентгенолога, масштабе времени. Чрезвычайно важным является и то обстоятельство, что массовое внедрение вычислительных сетей общего пользование стимулировало разработку и внедрение множества стандартов, которые в конечном итоге были объединены в стандарты "открытых систем". Такие системы обеспечивают максимальную мобильность программного обеспечения и делают разработчика прикладных систем в значительной степени независимым от аппаратуры какого-то одного производителя. В результате появляется возможность широкого использования богатейшего набора программных и аппаратных изделий, разрабатываемых различными коллективами и производителями в конкретных работах и, в частности, в системах, предназначенных для улучшения качества рентгенорадологических изображений.

Проблема улучшения качества рентгеновских изображений на

сегодняшний день становится всилу вышесказанного актуальной еще более, в том смысле, что имеются вполне адэкватные средства, обеспечивающие создание широкоиспользуемых удобных и эффективных систем.

Основная цель исследования. Целью исследования в диссертации является разработка математического и программного обеспечения Для систем улучшения качества рентгенографических изображений внутренних органов человека, ориентированных для применения на персональных системах, как индивидуальных, так и функционирующих в составе открытых вычислительных систем. Автоматическая обработка и анализ рентгеновского изображения должны обеспечивать оценку состояния пациента и возможность включения в состав системы средств, обеспечивающих выдачу рекомендаций лечащему врачу. С этой точки зрения в рамках диссертационной работы реализовывались средства для решения следующих задач:

I) Оценка, выбор алгоритмов и разработка программ преобразования рентгеновского изображения:

а) направленной фильтрации;

б) адаптивной фильтрации для подавления импульсных помех;

в) улучшение качества изображения путем исправления гистограммы;

г) выделения некоторых характерных объектов и анализ их качественных и количественных характеристик.

2) Реализация экспериментальной программной системы для применения в реальной практике.

В качестве экспериментального материала для проведения работы использовались реальные флюорографические снимки, закодированные в виде яркостных матриц (512x512x8), записанные на магнитном носителе.

Метода исследования. В качестве основных методов, реали-зованых в системе использованы, как стандартные цифровые методы гармонического анализа (двумерное преобразование Фурье, двумерная свертка, фильтрация), так и ряд специально разработанных методов, основанных на специфике обрабатываемых изображения и требований к результатам обработки.

Научная новизна. Практически впервые в нашей стране реализован программный комплекс, обеспечивающий обработку рент-генорадиологических избражений в интерактивном режиме и позволяющий проводить их исследования врачем рентгенологом. Комплекс выполнен с учетом требований мобильности программного обеспечения и может эксплуатироваться как на IBM совместимых персональных ЭВМ, так и на современных графических рабочих станциях в операционной среде ОС UNIX. Комплекс может быть использован в неоднородных вычислителных сетях и ориентирован на возможность применения как распределенной, так и дистанционной обработки. Программный комплекс выполнен с учетом требований к разработке открытых систем и допускает интегрирование в своем составе любых новых программ, что обеспечивает его развитие и расширение возможностей.

Практическая ценность. Реализован программный комплекс, не только решающий в ряд основных задач по улучшению качества и анализу рентгеновских изображений, но и предпринята

успешная попытка создания мобильного программного продукта, который может быть применен на аппаратуре, имеющей принципиально различную архитектуру и различную производительность. Четкая структурированность комплекса однозначно определяет место и функции совокупности стандартов на различного рода программные интерфейсы и позволяет легко адаптировать комплекс в различных моделях открытых систем, таких как MUSIC или NAS. Вместе с тем, комплекс допускает применение относительно дешевых и широко используемых персональных ЭВМ, что может сделать его исключительно ценным программным продуктом, даже для рядового врача рентгенолога.

Результаты работы могут быть применены в Институте радиологии РАМН, в Институте сердечно-сосудистой хирургии им. Вишневского, в ИМБП АМН, поликлинике ВДВ УД РАН и других медицинских учреждениях, при условии их оснащения персональными ЭВМ класса IBM PC/AT и средствами ввода рентгеновских изображений.

Объем диссертационной работы. Диссертация состоит из введения, четырех глав и заключения, содержит НО страниц текста, 17 рисунков, 2 таблицы и приложения. Список используемой литературы содержит 94 наименования.

Краткое содержание работы.

Во введении определяются цели и задачи исследования, обосновывается актуальность исследований в области обработки ретгеновского изображения и улучшения его качества, обсужда-

ются практические аспекты использования результатов исследований.

В первой главе приводится аналитический обзор работ по исследуемой проблеме улучшения качества рентгеновских изображений и методов его анализа с целью диагностики паталоги-ческих образований посредством математической обработки рентгенорадиологических образов внутренних органов человека. Глава состоит из трех разделов. В первом разделе рассматриваются общие характеристики рентгенорадиологических изображений и особенности, отличающие их от других видов изображений, требующие специфических методов исследования и обработки. Второй раздел посвящен рассмотрению ряда методов обработки и преобрэзоания изображений используемых исследователями для улучшения качества и их оценке с точки зрения эффективности анализа рентгенорадиологических образов при поиске паталогических образований. В третьем разделе рассмотрены экспериментальные результаты работ ряда исследовательских коллективов по улучшению качества изображений, а также ряд математических методов, применяемых для анализа из-бражений на практике.

Вторая глава посвящена методам цифровой обработки изображений и методам их отображения на экране монитора, позволяющих врачу-радиологу визуально легко и быстро обнаруживать интересующие его объекты (воздушную кисту, туберкулезную каверну или распадающийся рак).

В первом разделе второй главы описываются методы подавления шумов в исходных изображениях. Шумы, которые имеются

в изображениях имеют различную природу. Шумы образуются в процессе передачи изображений через системы связи, при химической обработке фотоматериала, при оцифровке изображений и вследствие ряда других факторов. Удаление шумов является одной из первых задач, которую приходится решать при улучшении качества изображений. Одним из наиболее эффективных методов подавления шумов является медианная фильтрация. Суть которой заключается в следующем. Для всех элементов изображения 1 выбирается размер окна и вычисляется медианное значение яркости в данном окне. После чего центральному элементу окна присваивается это значение. Очевидно, что медианная фильтрация будет подавлять тонкие кривые, которые воспринимаются как высокочастотный шум. Это приводит к размыванию (сглаживанию) границ контуров в изображении. Чтобы избежать такого эффекта, каждый раз для всех элементов в окне определяется их принадлежность к границе. Если в данном окне имеются элементы такого типа, то медианная операция в таком окне не выполняется. В результате применения медианного фильтра на изображении удается визуально обнаружить некоторые, ранее трудно различимые из-за наличия шумов, объекты.

Во втором разделе рассмотрены алгоритмы, которые используются для увеличения контраста изображения. Большинство методов повышения контрастности изображения основаны на высокочастотной фильтрации. Известен алгоритм, получивший название "спрямление посредством сглаживания" (СПС). Рассмотрим применение этого алгоритма при обработке рентгеновских изображений. Исходное изображение сглаживается с помощью одного

из сглаживающих окон:

"12 1" 2 4 2 12 1

г - раз путем последовательного умножения всех элементов изображения на соответствующие коэфициенты:

1

У а / ;

г.1 г--п, к-1

где К - сглаживающий параметр, к - сглаживаемый элемент изображения, ап - (п,1)-й элемент сглаживающего окна А, п = -1,0,1; 1 = -1,0,1; г = 2,2,.. .N-1 ; к=2,3,.. .М-1.

Процедура повторяется Я раз, затем сглаженное изображение вычитается из исходного С раз. Краевым элементам результирующего изображения присваиваются соответствующие значения исходного изображения. В результате осуществляется высокочастотная фильтрация исходного изображения методом. Коэффициент пропускания для т -й и т -й компоненты двумерного спектра Фурье после 5 сглаживаний и С спрямлений имеет вид:

т о л = (1- [СОБСТС т,/ N) соэ(% т_/ И)] ) ,

, , Ь , О 1 £ J

где Тт 3 с - коэффициент пропускания т^-й, тг~й частотной компоненты спектра. Как видно из частотной характеристики фильтра, обработка изображений с помощью метода СПС позволяет подавить низкочастотный фон и выделить высокочастотные

А =

1 1 1 1 1 1 1 1 1

А = — 10

1 1 1 1 2 1 1 1 1

А = — 16

9

1

1

п=-1

составляющие. Изменяя параметры 5 и С, можно получить различные фильтры с широким диапазоном пропускания и различной степенью контраста.

В результате СПС фильтрации по одному направлению (по строке или по столбцу) возможно возникновение разрывов контурных линий с направлениями, близкими к нормали к направлению фильтрации. Для того, чтобы исключить возможность возникновения подобных разрывов, применяется двунаправленная фильтрация. Изображение сглаживается с параметром по горизонтальному направлению, а затем с параметром Бг - по вертикальному. Затем результат вычитается из исходного изображения С раз. Изменением параметров , Бг и С можно получить изображение с необходимым контрастом.

Частотная характеристика такого фильтра имеет вид:

Тт т Б Б с = СС0Э(и т,/ ??)] 1 [СОЭ(1С тг/ М) ] ,

где и £>2 - параметры сглаживания по строке и столбцу соответственно. Очевидно, что при > 5г происходит увеличение контраста линий в горизонтальном направлении и в вертикальном направлении в противном случае.

В диссертации сравнивается этот алгоритм с другими алгоритмами (в частности, Прэтт) и практически обосновывается выбор параметров ,Бг и С при обработке конкретных рентгеновских изображений. Естественно, что выбор конкретных значений параметров зависит в первую очередь от характеристик исследуемого экземпляра рентгенограммы и их оптимальное значение должно быть подобрано рентгенологом в процессе иссле-

дования рентгенограммы. В работе даются рекомендации по подбору этих значений. Реализованные в ходе работы над диссертацией программы позволяют врачу выбирать значения этих параметров и оперативно изменять из в процессе анализа изображения.

Применение высокочастотного фильтра для изображений, имеющих разрывный характер, например, в случаях- сегментации, приводит к появлению ложных контурных линий нп границах иод-изображений. Для устранения разрывов уровня яркости па границах подызображений необходимо применение низкочастотной фильтрации.

Третья глава посвящена разработке процедур для автоматического анализа рентгеновского изображения. В начале глэеы обсуждаются проблемы, связанные с задачей автоматического поиска признаков различных заболеваний. К сожалению, несмотря на успехи в области обработки изображений, в вычислительной технике и наличии большого количества различных алгоритмов для распознавания зрительных образов, качество анализа флюорограмм зависит в решающей степени от опыта врача. Аппаратно-программные средства, которые используются на этом этапе, служат главным образом, для автоматизации поиска вероятных аномальных фрагментов изображения и вычисления объективных параметров таких элементов. Наиболее сложной задачей медицинской диагностики является определение места па-талогического изменения внутренних органов человека. Методы, используемые описываемые в данной главе, существенно облегчают эту задачу.

При автоматическом анализе флюорограмм грудной клетки с целью поиска легочных паталогий важной задачей является уда- > ление изображения ребер. Надо отметить, что рентгенорадиоло-гические изображения существенно отличаются от других видов изображений тем, что в них присутствует информация о всех объектах как переднего, так и последущих планов, в то время как других типах изображений информация об объектах, находящихся на "втором плане" и закрытых объектами переднего плана отсутствует. Поэтому задача удаления изображения ребер на рентгенограмме принципиально имеет решение.

Однако, поскольку тени ребер на рентгенограмме наложены на изображения внутренних органов человека, имеющих довольно сложную - структуру эта задача не может иметь простого численного решения. Она осложняется еще и тем, что в результате предварительной обработки изображения некоторых отрезков ребер могут оказаться удаленными.

. На начальном этапе восстановления находится множество точек - кандидатов в границы объектов, присутствующих в данном изображении. Поиск этих точек осуществляется путем анализа соотношений оптической плотности вдоль линий вертикальных срезов рентгенограммы.

Алгоритм восстановления границ ребер основан на использовании геометрических характеристик ребер.

После нахождения границ ребер производится выделение составляющей изображения ребер в исходном изображении. Полученное выделенное изображение ребер затем вычитается из исходного.

Четвертая глава диссертации посвящена вопросам создания программной системы, реализующей совокупность рассмотренных выше алгоритмов. Проблема программной реализации системы сегодня распадается на две части: первая часть состоит собственно в создании программ обработки; вторая - выборе программной среды, архитектуры всей системы, конструировании пользовательского интерфейса и т.п. На сегодняшний день вторая часть кажется нам даже более ответственной, поэтому в главе именно ей уделено наибольшее внимание.

Проблема выбора программной среды имеет большое значение всилу целого ряда причин. Сегодня персональные системы проходят стадию бурного развития и расширения их возможностей." На смену маломощным IBM совместимым персональным ЭВМ приходят 32-х разрядные рабочие станции с существенно более высокими рабочими характеристиками и обладающие широкими возможностями по обработке информации различного вида. Емкости оперативной памяти рабочих станций достигают сотен мегабайт, а внешняя память десятков гигабайт. Производительность рабочих станций также минимум на порядок выше чем у ПЭВМ, а скорость визулизации достигает сотен тысяч 3-х мерных векторов в секунду. Если при этом еще учесть, что их стоимость непрерывно уменьшается и для отдельных станций уже приближается к стомости ПЭВМ, становится совершенно очевидно, что все современные разработки, предназначенные для длительной эксплуатации, должны быть ориентированы на использование рабочих станций в качестве основной аппаратной базы.

Первоначально система, обсуждаемая в данной работе была

реализована в MS DOS. Основные соображения в пользу этого выбора очевидны. IBM PC является массовой ПЭВМ и стандартом "де-факто" для настольных систем нижнего уровня производительности. В этих машинах в той или иной степени присутствуют все необходимые средства, для хранения обработки и визуализации изображений. Существенно, что использование IBM, PC не требует от пользователя (в данном случае, врача) профес-иональной подготовки в области информатики. Это все хорошо известно и не нувдается в особых доказательствах. Однако обработка изображений является специфической областью, характерной тем, что для анализа тонкой структуры зрительных образов требуется значительная вычислительная мощность, да и для хранения таких изображений необходим значительный объем как внешней, так и оперативной памяти в ЭВМ. Даже наиболее мощные ПЭВМ ряда IBM ГС уже не в состоянии удовлетворить возрастающим потребностям систем обработки изображений.

Именно это обстоятельство и заставило нас рассмотреть возможность реализации данной системы на рабочей станции с 32-х разрядным процессором. Основными соображениями в пользу такого выбора, кроме высоких технических характеристик рабочих станций явилось то, что программная среда, используемая практически на всех рабочих станциях является хорошо стандартизованным продуктом и всилу этого разработка прикладных программных систем в такой среде гарантирует возможность установки системы на рабочей станции любого производителя, как сейчас, так и в обозримом будущем. Существенно, что вне зависимости от того, какая рабочая станция используется, все

программные интерфейсы, через которые прикладная система связана с операционной средой (интерфейс пользователя, графический интерфейс и т.п.) могут быть выбраны едиными. Это означает, что рабочие станции, имеющиеся сейчас в продаже, можно рассматривать, как единый ряд совместимых ЭВМ с широким спектром характеристик, из которого конечный пользователь может выбрать любую машину в зависимости от потребностей и своих финансовых возможностей. Более того, такой подход не исключает возможности использования и IBM PC в системах самого низкого уровня производительности.

Стандарты, объединенные в рамках концепции открытых систем специфицируют различные типы интерфейсов для связи прикладной системы с операционной средой. Для определения структуры всех связей разрабатываемой системы была выбрана модель открытой системы NAS (Network Application Support), фирмы Digital Equipment Corporation [The NAS Handbook, Second edition, Digital Equipment Corporation, 19911.

В соответствии с этой моделью, все связи прикладной системы определяются следующими группами интерфейсов:

1. Пользовательский интерфейс.

2. Интерфейс доступа к данным.

3. Системный интерфейс.

4. Интерфейс прикладных программ.

Пользовательский интерфейс специфицирует взаимодействие конечного пользователя системы (врача) с прикладной системой. Пользователь должен иметь возможность управления прикладной системой и получать результаты обработки в виде изо-

Сражений и чисел на графическом терминале. В рамках открытых систем эти функции обеспечиваются с помощью системы X Windows. Управляющая информация формируется с помощью меню в X Windows. Отображение графической информации производится либо с помощью входящей в X Windows библиотеки X Lib, если выходные изображения представлены целочисленными матрицами, либо с помощью стандартных графических пакетов GKS и PHIGS, в случае, если результаты обработки являются действительными числами.

Интерфейс доступа к данным используется для стандартизации взаимодействия с системами доступа к данным. Эти системы включают подсистемы локального и удаленного доступа к данным через сеть и подсистему обслуживания печати. Доступ к локальным и удаленным базам данных определяется стандартом SQL (ISO 9075-1989, ANSI ХЗ.135-89). Через этот и интерфейс возможен доступ к стандартным СУБД таким, как oracle, Informlcs и т.п. Расширение ANSI X3.I68 спецификации SQL позволяет обращаться к базам данных из языков порграммирова-ния Ada, С, cobol, Fortran, Pascal и pl/1. Доступ к файловым системам обеспечивается различными стандартами. Одним из них является ansi irds (ansi ХЗ.138-88).

Интерфейс доступа к системе определяет общие правила обращения прикладных программ к операционной системе. Этот тип доступа определяется стандартом POSIX (Portable Operating System Interface). POSIX - это группа стандартов, разработанных Институтом Инженеров по Электротехнике и Радиоэлектронике (ieee). Системный интерфейс: стандарт posix.1 -

ansi/IEEE Standard Ю03.1, iso IS9945-1 определяет интерфейс между мобильной прикладной прграммой и операционной системой, модель которой исторически сложилась на основе системы UNIX. Интерфейс состоит из функций, которые чаще всего включаются как системные обращения к ядру и библиотечных функций. Кроме стандарта 1003.1 в эту группу входит еще семнадцать стандартом, определяющих различные аспекты взаимодействия между прикладной программой и операционной системой. Рабочая группа posix Международной организации по стандартизации (ISO) JTC1/SC22/WG15 приняла часть стандартов POSIX в качестве международных. Эти стандарты приняты и многими национальными организациями.

Интерфейс прикладных программ определяет способы доступа к.прикладным программам и обеспечивает общие способы доставки сообщений (и команд) другим прикладным программам в случае организации распределенной обработки по нескольким узлам вычислительной сети, вне зависимости от того, локальный это узел, удаленный или виртуальный.

В качестве рабочей станции, на которой была реализована вторая очерередь системы, была выбрана станция БЕСТА-88, разработанная в НИИ Системных исследований РАН. Система реализована полностью на языке С в операционной системе UNIX.

ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ

В работе получены следующие основные 'результаты:

1. Разработан и реализован программный пакет для цифровой обработки рентгеновского изображения, для "персональной ЭВМ IBM PC и рабочей станции БЕСТА-88, при этом:

а) реализован метод адаптивной фильтрации изображений на основе алгоритма медианно-максимальных мод;

б) реализованы'методы высокочастотной и низкочастотной и направленной фильтрации изображений;

г) исследованы и реализованы программы поиска паталоги-ческих образований.

2. Для алгоритмов направленной фильтрации реализованы процедуры определения эффективного значения параметров s1, s2 и с.

3. Для обработки изображений на ПЭВМ разработаны и реализованы сокращенные варианты алгоритмов, позволяющие существенно сократить время обработки.

4. Разработаны и реализованы алгоритмы решения задач количественного и структурного анализа рентгеновского изображения .

5. Проведен анализ функционирования пакета в операционной среде и определены функции компонент международного стандарта открытых систем, с целью реализации мобильной версии пакета для выполнения на рабочих станциях различного типа и организации распределенной обработки в вычислительных сетях.

Заказ № 648

Тираж 70 акэ.

Ртп. в ИЗМИРАН г.Троицк'