автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.09, диссертация на тему:Разработка и исследование метода нормализации клинических данных

кандидата технических наук
Клавдиев, Дмитрий Владимирович
город
Санкт-Петербург
год
2000
специальность ВАК РФ
05.13.09
цена
450 рублей
Диссертация по информатике, вычислительной технике и управлению на тему «Разработка и исследование метода нормализации клинических данных»

Автореферат диссертации по теме "Разработка и исследование метода нормализации клинических данных"

На правах рукописи

РГБ ОД

2 2 т ш

КЛАВДИЕВ Дмитрий Владимирович

РАЗРАБОТКА И ИССЛЕДОВАНИЕ МЕТОДА НОРМАЛИЗАЦИИ КЛИНИЧЕСКИХ ДАННЫХ (ПРИМЕНЕНИЕ К НЕЙРООФТАЛЬМОЛОГИИ)

Специальность: 05.13.09 - управление в биологических и медицинских системах

АВТОРЕФЕРАТ Диссертации на соискание ученой степени кандидата технических наук

Санкт-Петербург 2000

Работа выполнена в Санкт-Петербургском государственном техническом университете

Научный руководитель:

Доктор технических наук, профессор Н.О. Вильчевский

Официальные оппоненты:

доктор технических наук, профессор Д.А. Уголев

доктор физико-математических наук, профессор Г.Л. Шевляков

Ведущая организация:

Российский научно-исследовательский нейрохирургический институт имени профессора А.Л. Поленова.

Защита состоится 26 --т сл <р 2000 года в ^_на заседании

диссертационного совета Д 063.38.18 в Санкт-Петербургском государственном техническом университете по адресу: 195251 Санкт-Петербург, Политехническая ул., 29, корпус, аудитория Л £

С диссертацией можно ознакомится в библиотеке Санкт-Петербургского государственного технического университета.

Автореферат разослан ^^ п 2000 года

Ученый секретарь диссертационного совета Д 063.38.18

доктор биологических наук

Актуальность темы.

Актуальность рассмотренной в диссертационной работе темы слагается из актуальности двух решаемых в работе взаимосвязанных задач - задачи формальной оценки эффективности применяемых методов лечения отдельных нейроофтольмологических заболеваний и построения программных средств экспресс - прогноза исхода предполагаемого курса лечения по входным характеристикам пациента и задачи такого преобразования входных данных, которое позволило бы корректно применять для их обработки реализованные внутри стандартных пакетов прикладных программ (SPSS, STATIST1CA и другие) методы математической статистики.

Под последним в работе понимается следующее. Большинство стандартных статистических методов анализа экспериментальных данных дает гарантированно правильные результаты при условии, что обрабатываемый материал представляет собой выборку из генеральной совокупности, распределенной по нормальному закону. В то же время часто статистические данные, особенно в области медико-биологических исследований, не позволяют с достаточной степенью уверенности принять гипотезу о нормальности их распределения. В этих условиях применение ряда статистических процедур становится, зачастую, лишь эвристическим приемом, не имеющим под собой достаточной теоретической базы. В работе разрабатывается процедура нормализации данных, представляющая собой относительно несложное преобразование исходных данных к данным, распределенных по закону, близкому к нормальному.

Актуальность темы диссертации следует из того, что в случае, когда решение задачи нормализации данных оказывается успешным, задача обработки статистических данных имеет гарантированно правильное, теоретически обоснованное решения.

Цель работы.

Разработать процедуры преобразования статистических данных к данным, с функцией распределения близкой к нормальной. Разработать программные средства формальной оценки эффективности методов лечения отдельных нейроофтольмологических заболеваний и программные средства прогноза исходов лечения больных с диагнозом "частичная атрофия зрительного нерва" по результатам клинического обследования пациента.

Основные задачи работы.

1. Разработать средства нормализации данных, с функцией распределения, отличной от нормальной.

2. Разработать программные средства сбора и хранения данных о нейроофтольмологических больных.

3. Провести оценку эффективности применения метода элек-

тростимуляции при лечении частичной атрофии зрительного нерва различной этиологии.

4. Разработать программные средства прогноза исхода лечения частичной атрофии зрительного нерва по исходным характеристикам пациентов.

Структура работы.

Диссертационная работа состоит из введения и четырех глав. Объем работы составляет 107 страниц машинописного текста, 33 рисунка и 31 таблицу. В списке литературы - 60 наименований работ отечественных и зарубежных авторов.

Глава 1 содержит описание созданных автором работы инструментальных средств сбора и хранения данных и предварительный анализ собранных данных.

Глава 2 посвящена теоретическим вопросам нормализации данных. Рассматриваются случаи, когда преобразуемые данные распределены ненормально и не равномерно, но с известной функцией распределения, случаи, неизвестна функция распределения, но известен ее вид, и случаи, когда информация о структуре функции распределения отсутствует.

Глава 3 посвящена алгоритмам нормализации и некоторым задачам факторного исследования данных нейроофтольмологии. Здесь рассмотрены процедуры нормализации данных, приведены примеры построений приближенного вида функций преобразования, сделана оценка объемов выборок, необходимых для построения функции восстановления. Рассмотрены вопросы нормализации многомерных исходных данных и их факторизации. Проведена факторизация данных клинических обследований.

Глава 4 посвящена применению методов нормализации и решению задач дискриминации нейроофтольмологических данных. Рассмотрены теоретические основы дискриминации, вопросы нормализации при проведении дискриминантного анализа. Приведены примеры дискриминации нормальных выборок и нормализации данных для дискриминантного анализа. Рассмотрен вопрос применения аппарата дискриминантного анализа для построения прогноза результатов лечения нейроофтальмологических больных. Проведена проверка качества дискриминации. Дано описание программных средств построения прогноза исхода лечения частичной атрофии зрительного нерва.

Научная новизна работы.

Разработан метод преобразования произвольно распределенных данных к данным, с функцией распределения, близкой к нормальной. Построены характеристики точности аппроксимации при нормализации данных.

Практическая значимость работы.

Проведена оценка эффективности применения метода лечебной электростимуляции зрительного нерва к больным с частичной атрофией зрительного нерва. Созданы программные средства построения экспресс - прогноза исхода лечения больных с диагнозом "Частичная атрофия зрительного нерва" по исходным данным о пациенте.

Апробация работы.

Результаты работы были представлены на международной на-учно-пракгической конференции «METROMED-95», на Всероссийской научно-практической конференции «Актуальные проблемы современной офтальмологии» 1995, на международной конференции International Workshop оп Nondestructive Testing and Computer Simulation in Science and Engineering 1997, на международной конференции International Workshop "Brain Stroke" 1997, на международной конференции «Mathtools-97» и на международной конференции Internationa! Workshop on Nondestructive Testing and Computer Simulation in Science and Engineering 1999.

Основные результаты работы изложены в десяти публикациях.

Содержание работы.

Во введении обоснован выбор темы диссертации. Проведен обзор литературы по теме диссертационной работы. Обращается внимание на то, что многие исследователи, при обработке медико - биологических статистических данных используют методы математической статистики, предполагающие справедливость гипотезы о нормальности распределения исходных данных, как это показано в работах Афифи и Эйзена, Андерсона, Кенделла и Стюарта и других. Особенно это характерно для работ, связанных с применением дискриминантно-го анализа (Линд, Флор Генри, Колез) и факторного анализа |Ким, Чой-Квон, Кастро, деПабло, Торо, Валдес). Однако большая часть авторов или не проверяет справедливость этой гипотезы, или не упоминает о проведении проверки. Приводится краткий обзор тестов на нормальность, предложенных Гири (1945 г.), Кацем, Кифером и Вольфовицем (1955 г.), Шапиро и Уилком (1965г.). В ряде работ обсуждаются способы преобразования данных, в том числе к нормально распределенным, в частности, Кендапл и Стюарт (1962 г.) показали, что нормализация возможна, если известна функция распределения данных, признав при этом, что на практике при обработке экспериментальных данных это обеспечивается не всегда. Методы нормализации, разработанные в диссертации, основаны на результатах, связанных с ранговыми статистиками: работы Немана, Фрезера, Гаека и Шидака, Тейла и других.

Первая глава посвящена описанию разработанных автором диссертации программных средств для сбора и хранения нейрооф-тальмологических данных и предварительному анализу данных, пред-

назначавшихся для работы в рамках практической реализации разрабатываемого в диссертации метода.

Тематика диссертационной работы ориентирована на проблемы нейроофтальмологии, которыми в Российской Федерации занимаются в госпитале им. Бурденко в Москве, Институте нейрохирургии им. Поленова в Санкт-Петербурге, клинике нейрохирургии Военно-медицинской академии и ряде других.

Практические аспекты диссертации обусловлены необходимостью оценки эффективности одного из методов лечения'частичной атрофии зрительного нерва - метода, предложенного Шандуриной А.Н., участие в исследовании которого принимали Хилько В.А, Гайдар Б.В., Данилов A.B.

На начальных этапах работы с применением GUHA-метода (П. Гаек, Т. Гавранек, 1984) был сформулирован ряд гипотез, некоторые из которых исследуются в диссертации с помощьй аппарата факторного и дискриминантного анализа.

Структура разработанной базы данных представлена в виде таблицы, включающей в себя наборы так называемых:

а) статических данных - пол, возраст, длительность заболевания и тому подобной информации,

б) управляемых данных - применение (или не применение) электростимуляции, операция (проводилась - не проводилась), и т.д.,

в) динамических данных - запись значений показателей, которые изменялись в результате проводимого лечения; к этой группе отнесены физиологические показатели состояния органа зрения, измеренные в три момента времени - до начала лечения, непосредственно после его окончания и через значительный промежуток времени после лечения (отдаленные последствия лечения).

Написанная программа, позволяет визуализировать процесс сбора и редактирования данных клинического обследования пациентов (т.е., представлять их в привычном для физиолога виде) при их накоплении (см. рис. 1).

Рисунок 1 Диалоговое окно программы сбора и храниения нейроофтальмологических данных.

С помощью этой программы специалистами Военно-медицинской академии отобрана информация о 428 больных частичной атрофией зрительного нерва, находившихся в период с 1988 по 1999 годы на стационарном или амбулаторном лечении в клинике нейрохирургии BMA. Данные собирались с целью оценки эффективности различных методов лечения атрофии зрительного нерва и построения алгоритма прогноза результативности комплексного лечения зрения.

В этой же главе дано описание проведенной предварительной обработки данных.

Далее, во второй части главы, проводится предварительный анализ собранных данных, указывается на ненормальность распределений основных показателей, предназначенных для статистической обработки. На приведенной в качестве примера на рисунке 2. гистограмме, видно, что распределение показателей (здесь - «острота зрения») далеко от нормального. Оправданное, с точки зрения физиологов, цензурирование данных не приводят их к нормально распределенным. Так, если выбросить из рассмотрения пик в районе нуля на приведенной на рисунке 2 гистограмме, что соответствовало бы отдельному анализу группы больных полностью, или почти полностью потерявших зрение, распределение показателя в оставшейся выборке также не нормально (рисунок 3.).

,iv

р Гистограммаостр&т&30вйи>llvieiiwt-

Гжпотран««7остроты ariawt tTiäWiijewMi 'гйимГ*

Ж

't*3S:

Fl

ц

Ei

.....- .....

i ffа. rr^.j-t;

Рисунок 2 Гистограмма величины остроты зрения до начала лечения.

diät".........

Г:г . С-Г . О.» ;

Рисунок 3 Распределение остроты зрения с выброшенным пиком в районе нуля.

В той же главе проведено выделение однородных групп пациентов. Так в сотрудничестве с экспертами - медикам были выделены три наиболее представительные однородные с точки зрения физиологов группы:

1.С диагнозом опто-хиазмапьный арахноидит (ОХА) неоперирован-ные.

2. С диагнозом ОХА оперированные.

3. С диагнозом аденома гипофиза оперированные.

Все дальнейшие статистические исследования на реальных данных проведены именно для этих групп.

Вторая глава посвящена методу нормализации эксперимен-

тальных данных и обсуждению задачи аппроксимации соответствующей функции преобразования.

Предлагаемый метод нормализации данных, основан на то, что, если случайная величина .х(ю) распределена в соответствии с непрерывным законом распределения то случайная величина

1 1 Г3

г(ю) = Ф^-(^(л(ю))), где Ф0(г)=-р= имеет нормальное рас-

пределение с нулевым средним и единичной дисперсией. Также существует обратное преобразование х(ю)=/;'"1(ф0(г(а))))

Если необходимо в процессе преобразования сохранять математическое ожидание ц и дисперсию с2 исходной случайной величины, то, очевидно, преобразование имеет вид

г(а>)=ц + аФ;1(р(х(<о)))

Таким образом, преобразование заключается в суперпозиции двух преобразований:

• Преобразование случайной величины *(со), распределенной по закону Р(х) в случайную величину у(ю), равномерно распределенную на интервале [0,1]

• Преобразование случайной величины >-(со), равномерно распределенной на интервале [0,1], в случайную величину г(ю), имеющую нормальное распределение с нулевым средним и единичной дисперсией.

Прямое преобразование Обратное преобразование

X У ^ 2 2 Ф0(г1 ^ У р-'(у) ^ X

^ £/(0,1) N(0,1) N(0,1) Щ 0,1) Р

Если известна априорная информация о функции распределения набора экспериментальных данных, то проблема нормализации этого набора решается элементарным образом, в противном случае естественно использовать тот факт, что эмпирическая функция распределения ^(х) при достаточно большом объеме выборки близка к истиной (теоретической) функции распределения.

Под задачей построения преобразования исходной случайной величины в случайную величину, равномерно распределенную на [0,1], понимается стандартная постановка задачи аппроксимации функции Р(х).

Рассматривая упорядоченную по возрастанию исходную выборку объема N: {х(1)};( = 1,2,...,Л/;*(|) <х[М) (вариационный ряд) и вариационный ряд для преобразованной выборки |_у()) имеем соответственно:

м[л>]= I ^Г'-О-^))"^«!^) (1)

То есть (1) является средним значением /-й порядковой статистики выборки из V случайных величин х(со); а (2) - средним значением 7-й порядковой статистики выборки из N случайных величин, распределенных по равномерному закону.

Переход от случайных величин (ю) к случайным величинам

гапк(х)

у, =—^ 4 можно понимать как некоторую аппроксимацию зависимости у(со) = ^(х((о)). При этом имеет место следующее очевидное соотношение:

>'(,)(«) =№(0(®)) - М^(хсо(ш)]) (3)

Следовательно, точность аппроксимации определяется величиной погрешности

= * -зАг. (4)

В последующих разделах второй главы исследуется поведение величины этой погрешности и показывается, что при достаточно большом количестве исходных данных эта погрешность становится пренебрежимо малой.

Средние характеристики разброса.

Для погрешности получены следующие соотношения:

Математическое ожидание:

М(е,) = 0. (5)

Дисперсия:

/(АГ + 1-0 (Лг + 2)(ЛГ + 1)2

Таким образом, в первом приближении можно считать, что

, ¡¡(N + 1-1) 1 , . / _ ¡/(N + 1-0 1 ,7.

-2 1—-=<у( со)--<2 —----, (7)

V (Л^ + 1)2 >/57+2 Л" + 1 V (ЛГ+1) л/^ + 2

Т.е., при больших объемах выборки N дисперсия отклонения самого значения порядковой статистики от ее среднего значения (нормированный ранг) стремится к нулю.

Интегральная характеристика точности - суммарный разброс составляет:

£ = М

Я*-

(8)

6(ЛГ + 1)

то есть в качестве грубой оценки можно полагать:

/

1

|3(Лг + 1)'<У,"л' + 1 ^3(^ + 1) что также подтверждает возможность с определенной степенью точности заменить у, на то есть перейти к нормированным ран-

1

(9)

У+1

гам.

Вероятностные характеристики разброса.

Вероятность того, что величина разброса для /-ой порядковой статистики превосходит заданную величину у, составляет

>Ъ)(Ю)~

ЛГ + 1

>у, 0<у(])(ю) ¿1

и приближенно равна

КХ-1Х"-')

V »-I

(10)

V 1-1

где

Далее рассматриваются различные области для значений /, для которых получены более простые выражения для Рк(',у)- Показано, что вероятность того, что разброс превышает заданную величину, уменьшается с увеличением количества измерений.

Посчитана обобщенная оценка - вероятность того, что максимальное рассогласование превосходит заданную величину у:

/

/>Д>0 = Рг1тах

N + 1

>У', >\ >0;>- <1

Отметим, что если бы вместо величины

N+1

в этом выра-

жении стояла бы величина

У,

г

, то величина вероятности Ря (у) оп-

ределялась бы теоремой Колмогорова о рассогласовании эмпирической и теоретической функций распределения.

Предварительно рассматриваются вероятности осуществления односторонних событий, и для них доказывается соотношения:

Теорема 1

К{у)=Pr |max --—I > j; У] > О;у, < y,+1;yN < 1 j =

таь,)] т , ! ул + 1 к \v"i+1

= § I J

где Е\А\ обозначает целую часть числа А. Теорема 2

Ъ(у) = Рг jmin <-у> ^>0;y,<y,+];jv<iJ=^(>') <12>

Формулы, полученные в приведенных выше теоремах, являются достаточно громоздкими, поэтому в диссертации выведены более простые асимптотические формулы:

^л-(>')-(2+(Лг + 1).у)ехр(-2(ЛГ +l)(y+jhr)2) (13)

Р; (у) < (2 + (N+ 1)д/) ехр(-2(JV +1)(у + jhrf) (14)

В работе приведена так же оценка для двустороннего критерия:

РК(у) < 2(2 + (N + -((2 + (N 4-l)y)e{-m^f))j (15)

Таким образом, показано, что с увеличением объема исходной выборки, рассогласование между истинным значением преобразованных к равномерному распределению данных и их средним значением (нормированным рангом) стремится к нулю. Это дает основание заменять, вообще говоря, неизвестные значения /•'(х,) на достаточно просто определяемые нормированные ранги.

В третьей главе рассматриваются задачи определения по выборке факторной структуры наборов случайных величин X,.(i = l..L), нелинейно зависящих от коррелированных нормальных случайных величин:

г „ л

i = l..L (16)

где /(и) - некоторые, априорно неизвестные монотонные функции, а и] - нормальные независимые между собой случайные величины, имеющие нулевое среднее и единичную дисперсию.

Целью исследования в третьей главе является построение процедуры определения вида функций (и) и структуры коэффициентов

«V

Для изучения способа построения искомой функции даны следующие определения:

Определение 3.1 Будем называть функцию /(и) функцией порчи

распределения G(u), если случайная величина v(co) имеет вид v(o) = /(m(cö)), где ы(о)распределена по закону G(u).

Определение 3.2 Будем называть функцию g(v) функцией восстановления распределения G(u), если случайная величина и(со) распределена по закону G(u) и имеет вид м(ю) = g(v(ro)).

Очевидно, что функции порчи и восстановления связаны соотношением g(u) = f'\u)

Как это уже обсуждалось в первой главе, всегда можно сделать переход от равномерно распределенных на участке [o,i] данных к нормально распределенным, или, говоря терминами данного определения, квантильная функция гауссова распределения является функцией восстановления нормального распределения для равномерно распределенных данных. Поэтому в третьей главе рассматривается в основном функция восстановления равномерного распределения для произвольно распределенных величин. Согласно лемме, приведенной в первой главе, такой функцией будет функция распределения f(x).

В случае, когда f(x) принадлежит параметризованному классу функций:F(x)еF(x,a, ,а2,...ак) , задачей аппроксимации функции распределения является определение по имеющейся выборке конкретных значений параметров {а[,аг,...ак}.

Для решения этой задачи предложена следующая процедура.

1. Строится вариационный ряд для имеющейся выборки х, , i = \...N

{*(,)}> i-\-N

2. Вводится набор нормированных рангов:

Ш, i = l...N

3. Вводятся величины невязок:

4. Значения параметров {а°,а°2,...а°кОпределяются из решения задачи минимизации взвешенной суммы квадратов невязок, при этом весовые коэффициенты выбираются обратно пропорциональными величинам дисперсии соответствующих порядковых статистик

min (17)

«1 >«2 >"ak

5. В качестве аппроксимации искомой функции восстановления принимается:

Подобное построение алгоритма следует из факта, что невязки т], имеют нулевое математическое ожидание (5) и зависящую от ранга измерения дисперсию (6). Заметим, что:

• В алгоритме, описанном выше, фактически предлагается вместо неизвестных значений использовать априорно известные их средние значения.

• При большом объеме исходных данных погрешность от такой замены, как показано в главе 2, стремится к нулю.

• Введение в задачу минимизации весовых коэффициентов имеет целью снизить вес слагаемых, соответствующих расположенных ближе к центру порядковых статистик, которые имеют существенно больший разброс относительно среднего.

• Предположение о том, что известна параметрическая структура искомой функции восстановления, может быть заменено предположением, что известен набор базисных функций, по которым разлагается в сходящийся ряд функция восстановления:

= (18)

*=0

• Во многих случаях в качестве базисных функций можно выбирать степенные зависимости и искать аппроксимацию в виде полиномиальной регрессионной модели:

¡г=1

где х есть среднее значение имеющейся выборки, а степень полинома может быть, например, установлена эмпирически.

Далее в третьей главе приводятся примеры построения функции восстановления. Для аппроксимации функции восстановления автор воспользовался аппаратом полиномиальной регрессии (19), приняв в качестве функции ошибки взвешенную формулу наименьших квадратов (17).

На рисунке 4 изображена гистограмма выборки 10000 измерений случайной величины с «неизвестной» функцией распределения.

Очевидно, что это распределение не нормально и неравномерно. На рисунке 5 представлена гистограмма той же самой выборки, подвергнутой преобразованию аппроксимированной функции восстановления. На рисунке 7 можно увидеть, что истинная функция восстановления 1п(у) (нижняя кривая) практически совпадает с аппроксими-к

рованной вида ^аДх-Зс/ (верхняя кривая) на всем участке аппрок-

ы

симации [1, 2.1828]. На рисунке 6 представлена гистограмма все той

же выборки, преобразованной к нормальному закону распределения.

Применение функции восстановления в ряде случаев необходимо осуществлять в реальном времени. Поэтому задачу построения и последующего применения функции восстановления можно представлять как двухэтапную задачу: на первом этапе которой, имея относительно небольшой объем исходных данных, осуществляется аппроксимация функции восстановления, а на втором, в соответствии с этой функцией вновь полученные результаты измерений сразу же преобра-

11

. . ...... .

Рисунок 4 Гистограмма исходной случайной выборки с «неизвестным» распределением

. Гистограмма восстатотнной еыеорнв "

Рисунок 5 Та же выборка, восстановленная к равномерному распределению

Рисунок 6 Та же выборка, восстановленная к нормальному распределению

Рисунок 7 Истинная и аппроксимированная функция восстановления совпадают

Рисунок 6. Зависимость качества восстановления от объема

выборки

Поэтому далее в главе рассматривается задача определения необходимого объема выборки для построения функции восстановления данных к равномерным (и, следовательно, к нормальным). В качестве меры качества построенной функции принимается степень достоверности соответствия преобразованных данных равномерному распределению по критерию х2-

Проведенные численные эксперименты показывают, что график зависимости степени достоверности р от размера выборки имеет вид, подобный приведенному на рисунке 6: при малых объемах выборки находится в районе нуля, затем, достаточно, быстро растет, останавливаясь на уровне порядка 75%, после чего возрастает уже гораздо медленнее. В экспериментах в качестве генеральной совокупности использовался массив данных, содержащий 10000 элементов. «Исходный» набор X формировался из этого случайно сгенерированного равномерно распределенного массива с функцией «порчи»: ех.

Затем от набора X случайным образом отделялась часть данных - выборка - и на ее основе строилась функция восстановления /"'(*), которая и применялась к остальному набору данных .

Экспериментально удалось установить, что для достаточно больших объемов выборки использование 10-30% ее представителей для воссоздания функции восстановления является достаточным.

Алгоритмы нормализации случайных выборок, рассмотренные выше, могут быть непосредственно использованы при обработке зависимых между собой данных, распределение которых отлично от нормального. Полагая, что структура данных имеет вид (16), можно построить функции восстановления для каждой из компонент X,, то есть преобразовать их в набор случайных величин 2,, имеющих распределения, близкие к нормальному с нулевым средним и единичной дисперсией. Тогда структура их зависимости будет полностью описываться ковариационной матрицей. Материалы четвертого и пятого параграфов посвящены.применению аппарата факторного анализа для обработки нейроофтальмологических данных.

Результаты факторного анализа подтвердили сделанные физиологами предположения. В частности, оказалось, что периферические границы поля зрения при оптохиазмальном арахноидите могут быть оценены одним показателем- суммой измерений по всем меридианам, аналогично оцениваются абсолютная и относительная центральные скотомы. Остаточная дисперсии при переходе к этим главным факторам составляет 17%. В случае аденомы гипофиза периферические границы поля зрения описываются двумя параметрами - верхней и нижней частью поля зрения, а остаточная дисперсия равна 21%.

Четвертая глава диссертации посвящена применению методов нормализации и решению задач дискриминации нейрофтольмоло-гических данных.

Рассматриваются задачи, связанные с применением метода

нормализации для целей дискриминантного анализа данных. Основная проблема заключается в том, что стандартные процедуры линейного дискриминантного анализа предполагают нормальность распределения классифицируемых данных, в то время, как реальные данные, полученные в результате клинических обследований пациентов, как правило, нормальными не являются. Поэтому представляется оправданным предварительное преобразование исходных данных, приближающих их функцию распределения к нормальной. Приведен алгоритм построения функции, осуществляющей такое преобразование, и исследованы некоторые особенности аппроксимации этой функции. Кроме того приведены конкретные результаты проведенного дискриминантного анализа (как с использованием нормализации, так и без нормализации) клинических данных. Дискриминация осуществлялась с целью разработать метод прогноза исхода лечения по результатам клинического обследования пациентов.

Первая часть главы посвящена экспериментальному исследованию построения преобразования данных, предназначенных для обработки дискриминантным анализом. Эксперименты проводились на каноническом примере Фишера, приведенном в большинстве руководств по математической статистике. Исходно нормальные данные были подвергнуты нелинейному преобразованию, что, как и следовало ожидать, заметно снизило качество распознавания. Затем учитывались различные ограничения: предполагалось, что функция восстановления известна с точностью до параметров, что известен базис функций известны базисные функции, по которому она может быть разложена в сходящийся ряд, и т.д. Во всех случаях автору удавалось с достаточно высокой точностью реконструировать исходные данные и повысить точность дискриминации почти до исходного уровня. Но даже в наихудшем случае, построения полиномиальной регрессии поклассовое преобразование данных позволило улучшить дискриминацию на 2%.

Вторая часть четвертой главы посвящена решению практической задачи нейроофтальмологии. Первая задача состояла в построении формального критерия выздоравливаемости пациента по имеющимся данным клинического обследования как до, так и после лечения. Для решения этой задачи из базы данных была случайным образом отобрана обучающая последовательность, для которой врач, с помощью программы сбора данных, указал результат лечения. Использование стандартных процедур дискриминантного анализа позволило построить решающее правило с высоким качеством классификации - на исходной выборке 90% пациентов были классифицированы правильно. Контрольная выборка из десяти случайно выбранных элементов базы данных не выявила ошибок распознавания.

Далее данные подвергались дискриминации с целью построить алгоритм прогноза результата лечения по данным, имеющимся до его начала. Прогноз строился на заранее определенных из физиологических соображений однородных группах пациентов. В дискриминантную

модель вошли динамические данные до начала лечения, оказавшаяся значимой часть статических данных и те управляемые данные, которые не были отобраны физиологами как доминирующие. Во всех трех группах пациентов удалось построить достаточно качественный алгоритм распознавания исхода лечения. Проверка этого алгоритма на контрольной группе пациентов показала устойчивость полученного результата.

Проведеный анализ влияния статических факторов на исход лечения позволил получить интересные и практически важные результаты. Так, неожиданным оказалась зависимость исхода лечения от пола пациента для оперированных по поводу оптохиазмального арахноидита. Оказалось, женщины почти в два раза чаща мужчин восстанавливают зрение после такой операции.

Рассмотрена возможность применения дискриминантного анализа на базе агрегированных показателей. Оказалось, что и в этом случае распознаваемость исходов лечения оказалась достаточно высокой, а факторы, как это обсуждалось в третьей главе, имеют четкую физиологическую интерпретацию.

На основании полученных в четвертом параграфе результатов дискриминантного анализа в сотрудничестве с клиницистами ЗМедА создан программный инструмент врача-нейроофтальмолога, позволяющий получить экспресс-прогноз результативности лечения нейро-офтальмологических пациентов до начала терапевтических или хирургических процедур. В алгоритм прогноза входит учет всех управляющих факторов, поэтому врач может оценить прогноз в зависимости от планируемого метода лечения и подкорректировать терапию заранее.

Выводы.

Диссертационная работа посвящена разработке и исследованию метода преобразования экспериментальных данных к данным с распределением, близким к нормальному и решению некоторых локальных медицинских проблем.

Разработана процедура построения функции восстановления данных.

Получены оценки погрешности аппроксимации функции восстановления.

Построена факторная модель для случайных величин, нелинейно зависящих от коррелированных нормально распределенных величин.

Показана эффективность использования функции восстановления для задач обработки данных методами дискриминантного анализа.

Разработана дружественная для офтальмолога программа сбора, хранения и визуализации нейроофтальмологических статистических данных.

На основе решения задачи прогнозирования результата лечения больных частичной атрофией зрительных нервов, создан программ-

ный инструмент врача-нейроофтальмолога, позволяющий получить

экспресс-прогноз результативности лечения до начала терапевтических или хирургических процедур.

Список работ, опубликованных по теме диссертации.

1. Н. Вильчевский, В. Клавдиев, Д. Клавдиев, Обработка медицинской статистики GUHA-методом., мат. международной науч.-практ.

. конференции "METROMED-95", СПбГТУ, Санкт-Петербург, Россия, 1995 г.

2. А. Данилов, В. Клавдиев, Д. Клавдиев, Усовершенствование математических аспектов рентгенографического метода локализации внутриглазных инородных тел., мат. международной науч.-практ. конференции "METROMED-95", СПбГТУ, Санкт-Петербург, Россия, 1995 г.

3.- А. Данилов, Б. Гайдар, Д. Клавдиев, Эффективность электростимуляции для пациентов с заболеваниями зрительного нерва и хиазмы., Материалы Российской конференции офтальмологов «Актуальные проблемы современной офтальмологии», Саратов, Россия, 1996 г.

4. N. Vilchevsky, D. Klavdiev, Gauss interpretation of rank tests and its application in neuroophthalmology data processing, Materials of International Workshop NDTCS-97, St. Petersburg, Russia, 1997

5. А. Данилов, Д. КЛавдиев, Использование компьютерной базы данных для выделения ведущих лечебных воздействий при поражении хиазмы и зрительных нервов., матер, международного симпозиума «Ишемия мозга» ВмедА, каф. нейрохирургии. 1997 г.

6. Н. Вильчевский, Г. Долгов, В. Клавдиев, Д. Клавдиев, Обработка медицинской статистики GUHA-методом., труды СПбГТУ, т. 461, Санкт-Петербург, Россия, 1997 г.

7. Д. Клавдиев. Автоматизация процесса принятия решений в медицине., матер, международного симпозиума «Ишемия мозга» ВмедА, каф. нейрохирургии. 1997 г.

8. V. Klavdiev, D. Klavdiev, S. Koskin, Yu. Shelepin, The code for reliable testing of contrast sensitivity., materials of International Workshop "NDTCS-97", SPbSTU, St. Petersburg, Russia, 1997

9. H. Вильчевский, Б. Гайдар, Д. Клавдиев, И. Малахов, Математическая модель нейроонкологического пациента, базирующаяся на морфологических изменениях головного мозга., мат. международной конф. "Mathtools-97", Санкт-Петербург, Россия, 1997 г.

10. N. Vilchevsky, V. Klavdiev and D. Klavdiev, The normalization of samples. Materials of International Workshop NDTCS-99, Alexander I. Melker, Editor, Proceeding of SPIE, vol. 4046, 2000

Оглавление автор диссертации — кандидата технических наук Клавдиев, Дмитрий Владимирович

ОГЛАВЛЕНИЕ.

ВВЕДЕНИЕ.

1. ОПИСАНИЕ ОБРАБАТЫВАЕМЫХ ДАННЫХ.

1.1. Структура данных и инструментальные средства их накопления.

1.2. Анализ характера данных.

2. НОРМАЛИЗАЦИЯ СЛУЧАЙНЫХ ВЫБОРОК.

2.1 Введение.

2.2 Нормализация случайной выборки при известной функции распределения.

2.3 Нормализация случайной выборки при отсутствии информации о функции распределёния.

2.4 Характеристики точности аппроксимации.

2.4.1 Дисперсия отклонений.

2.4.2. Интегральная характеристика точности.

2.4.3. Распределение максимального рассогласования.

Выводы.

3. АЛГОРИТМ НОРМАЛИЗАЦИИ ВЫБОРОК И ФАКТОРНЫЙ АНАЛИЗ НЕЙРООФТАЛЬМОЛОГИЧЕСКИХ ДАННЫХ.

3.1. Нормальная модель непрерывных данных.

3.1.1. Определения и обозначения.

3.1.2. Аппроксимация функции восстановления.

3.2. Примеры построения приближенного вида функции преобразования.

3.3. Определение объема выборки, необходимой для построения функции восстановления.

3.4. Нормализация многомерных исходных данных и их

ФАКТОРИЗАЦИЯ.

3.4.1. Нормализация случайных выборок.

3.4.2. Факторизация преобразованных (восстановленных) выборок.

3.5. факторизация данных клинических обследований. выводы.

4. ПРИМЕНЕНИЕ МЕТОДОВ НОРМАЛИЗАЦИИ И РЕШЕНИЕ ЗАДАЧ ДИСКРИМИНАЦИИ НЕЙРОФТОЛЬМОЛОГИЧЕСКИХ ДАННЫХ.

4.1 .Теоретические основы дискриминации.

4.2. Нормализация при проведении дискриминантного анализа

4.2.1. Пример дискриминации нормальных выборок.

4.2.2. Применение нормализации данных для дискриминантного анализа.

4.2.2.1. Нормализация при известной функции распределения.

4.2.2.2. Нормализация при априорной информации о структуре функции распределения.

4.2.2.3. Нормализация при отсутствии предположений о виде функции распределения. выводы.

4.3. Применение дискриминантного анализа для прогноза результата лечения нейроофтальмологических больных.

4.3.1. Предварительная обработка данных.

4.3.2. Применение дискриминантного анализа для определения исходов лечения.

4.3.3. Дискриминация нормализованных данных.

4.3.3. Применение дискриминантного анализа для прогноза результата лечения.

4.3.4. Применение для дискриминации агрегированных данных.

Введение 2000 год, диссертация по информатике, вычислительной технике и управлению, Клавдиев, Дмитрий Владимирович

Настоящая диссертационная работа посвящена разработке и исследованию метода нормализации статистических данных. Проблема создания процедуры такого преобразования возникла в связи с тем, что большинство стандартных статистических методов анализа экспериментальных данных (дисперсионный анализ, факторный анализ, метод наименьших квадратов и т.п.) дают гарантировано правильные ответы при условии, что обрабатываемый экспериментальный материал представляет собой выборку из генеральной совокупности, распределенной по нормальному закону. В то же время конкретные статистические данные, особенно в областях медико-биологических исследований, не позволяют с достаточно большой степенью уверенности принять гипотезу о нормальности их распределения. В результате применение ряда статистических процедур, зачастую, становится лишь эвристическим приемом, не имеющим под собой достаточной теоретической базы.

В работе предлагается в качестве начального этапа обработки статистического материала применять процедуру нормализации, представляющую собой достаточно простое преобразование исходных данных, априорно не являющихся нормальными, в совокупность данных, распределенных по нормальному, или близкому к нормальному, закону.

Побудительным мотивом для выполнения работы были как практические задачи оценки эффективности некоторых методов лечения частичной атрофии зрительных нервов, так и задачи создания инструментария для построения прогноза результата лечения, т.е., по сути дела, решения часто возникающих на практике проблем обработки медицинской статистики.

Теоретические аспекты данной работы близки к результатам, связанным с ранговыми статистиками [12, 21, 24, 42]. Действительно, переход к ранговым статистикам, как будет показано далее, с точностью до нормировки совпадает с преобразованием исходных данных к равномерно распределенным. Авторы всех этих публикаций исследуют вопросы применения ранговых статистик для различных целей статистической обработки. В работах Немана [24], Фрезера [42], Гаека и Шидака [12] дано общее изложение ранговых критериев. Исследования, касающиеся ранговых критериев приведены также в работе Тейла [58]. Проблеме проверки экспериментальных данных на соответствие нормальному закону распределения уделили внимание многие ученые. Так Гири [43] разработал и исследовал критерий эксцесса, основанный на отношении выборочного среднего отклонения к стандартному, табулированному в Biometrical Tables (Таблицы воспроизведены в Таблицах математической статистики [3]). В работе [45] рассматривается распределения Dn и

W2 для проверки нормальности, когда параметры оцениваются по выборке посредством предельные распределения в таком случае свободны от параметров, но не получены в явном виде. Шапиро и Уилком [56] построен критерий для проверки нормальности, основанный на регрессии порядковых статистик на их ожидаемые значения. В этих публикациях, однако, не затрагиваются вопросы, связанные с определением вида преобразований к равномерному закону. Так же не ставится задача преобразования к нормально распределенным данным.

Кендалл и Стюарт в своем фундаментальном труде [20] обсудили различные способы нормализации распределений, но указали на то, что необходимая для построения любого из рассмотренных преобразований функция распределения исходной случайной величины, в эксперименте, как правило, оказывается неизвестной.

Подробное изложение вопросов, касающихся полиномиальной регрессии, приведены в [1, 2, 21, 22, 27, 28, 31]. Тейлу [58] принадлежат некоторые заключения о полиномиальной регрессионной модели.

Общие сведенье о методе наименьших квадратов приведены в [13, 26, 50] и многих других монографиях. В [13, 26], кроме того, описан способ его применения при неравноточных измерениях, необходимый для предложенного в этой работе преобразования.

Проблеме статистической обработки медицинских данных посвятили свое внимание большое количество авторов монографий и научных статей. Так например, в работе [49] рассмотрен вопрос применения дискриминантно-го анализа для распознавания вызванных потенциалов от различных видов раздражителей (общие вопросы дискриминантного анализа - в работах [1, 2, 22, 32, 46]), в статье [53] дискриминантный анализ используется для построения правил автоматической диагностики заболеваний глаз у операторов персональных компьютеров, в работах [36, 51] аппарат дискриминантного анализа используется для построения эффективного диагностического правила для выявления шизофрении по характеру движений глазного яблока. Описание использования дискриминантного анализа для обработки медицинских данных можно найти также в работах [38, 39, 41, 44, 52].

Довольно большое количество научных публикаций последних лет посвящено проведению факторного анализа, вопрос, общую теорию которого можно почерпнуть из [1, 2, 18, 22, 25, 32], медико-биологических данных [39, 41, 47, 55, 57]. В частности, в статье [57] факторный анализ используется для определения ведущих побудительных мотивов для использования презервативов. В статье [37] исследовались факторы, влияющие на отношение к тестированию на ВИЧ. В работах не описано распределение исходных данных, однако, в этом случае, вероятно, можно принять гипотезу об их нормальности, поскольку речь идет в сущности о данных социологических опросов. В статье [47] авторы успешно применяют факторный анализ для определения факторов риска острого инсульта головного мозга. В работе [39] математический аппарат факторного анализа применяется для оценки валидности краткой формы шкалы оценки тяжести остеоартрита (А1М32-5Р).

Однако, ни анализа распределения исходного статистического материала, ни тем более предварительная нормализация его в этих работах не осуществлялось. Подобное несоответствие исходных данных предположению о нормальности распределений может привести к отсутствию гарантий теоретической обоснованности результатов исследований.

Таким образом, анализ литературных материалов за последние годы показывает, что тематика настоящей диссертационной работы исследователями практически не затронута.

Известно, что при построении любого алгоритма очень важную (или -определяющую) [11, 17] роль играет структура обрабатываемых данных, поэтому в первой главе рассматриваются характеристики анализируемого статистического материала и разработанные автором способы накопления и хранения данных клинического обследования пациентов клиники нейрохирургии Военно-медицинской Академии.

Вторая глава работы посвящена описанию способа нормализации данных и оценке погрешности, возникающей при применении такого преобразования.

В третьей главе диссертации рассмотрены вопросы практического применения метода для построения нормальной агрегированной модели данных.

Четвертая глава диссертации содержит результаты тестирования метода нормализации на каноническом примере и обработки реальных данных медицинской статистики. Там же описан разработанный автором инструментарий практикующего специалиста в области нейроофтальмологии, призванный оказать ему помощь в построении прогноза результата лечения.

Заключение диссертация на тему "Разработка и исследование метода нормализации клинических данных"

Выводы.

Построен алгоритм преобразования данных для обработки их дис-криминантным анализом. Исследованы на примере несколько ситуаций с различным количеством информации о функции восстановления.

Проведено исследование реальных данных с целью построения формального критерия выздоравливаемости. Получен устойчивый результат, протестированный как на обучающей последовательности, так и на контрольной группе.

Для однородных групп пациентов получены алгоритмы прогнозирования результата лечения по исходным данным - физиологическим показателям и части статических параметров.

Доказана зависимость результата лечения от пола пациента при частичной атрофии зрительного нерва в результате оптохиазмального арахноидита.

Создан программный продукт для рассчета прогноза исхода лечения по статическим, управляемым и динамическим данным до начала лечения

Библиография Клавдиев, Дмитрий Владимирович, диссертация по теме Управление в биологических и медицинских системах (включая применения вычислительной техники)

1. Андерсон Т., Введение в многомерный статистический анализ, (перев. сангл.), М„ ФИЗМАТГИЗ, 1963.-500 с

2. Афифи, Эйзен Статистический анализ. Подход с использованием ЭВМ,1. М., «Мир», 1982.-488 с.

3. Большое Л.Н., Смирнов Н.В., Таблицы математической статистики, М.,1. Наука", 1983,-416 с.

4. Боровиков В.П., Боровиков И.П., STATISTICA® Статистический анализи обработка данных в среде Windows®, М., Инф. Изд. Доп. "Филинъ", 1997,-608 с.

5. Боровков A.A., Математическая статистика. Оценка параметров,проверка гипотез, М., «Наука», 1984, -472 с.6. ван дер Ваден Б.Л., Математическая статистика, М., Иностр. литерат.,1960,-434 с.

6. Вильчевский Н., Гайдар Б., Клавдиев Д., Малахов И., Математическаямодель нейроонкологического пациента, базирующаяся на морфологических изменениях головного мозга. // Матер, международной конф. "Mathtools-97", Санкт-Петербург, Россия, 1997 г. с. 64

7. Вильчевский Н., Долгов Г., Клавдиев В., Клавдиев Д., Обработкамедицинской статистики GUHA-методом. //труды СПбГТУ, т. 461, Санкт-Петербург, Россия, 1997 г. с. 116-119

8. Вильчевский Н., Клавдиев В., Клавдиев Д., Обработка медицинскойстатистики GUHA-методом. // Матер, международной науч.-практ. конференции "METROMED-95", СПбГТУ, Санкт-Петербург, Россия, 1995 г.-с. 177-180

9. Вильчевский Н.О., Шевляков Г.Л., Применение полиномов Бернштейна в задачах адаптивного оценивания, // Матер. V Всесоюзной школы-семинара по непараметрическим и робастным методам статистики. Часть 1, 1985, Томск, с. 44-48

10. Вирт Н., Алгоритмы + структуры данных = программы. М., «Мир», 1984,-360 с.

11. Гаек Я., Шидак 3., Теория ранговых критериев (перев. с англ.), М., "Наука", 1971,-376 с.

12. Гайдаев П.А., Способ наименьших квадратов, М., ВИА, 1959, -269 с.

13. Данилов А., Клавдиев Д., Использование компьютерной базы данных для выделения ведущих лечебных воздействий при поражении хиазмы и зрительных нервов. // матер, международного симпозиума «Ишемия мозга» ВМедА, каф. нейрохирургии. 1997 г. с. 260

14. ДейкстраЭ., Дисциплина программирования. М., «Мир», 1978,-275 с.

15. Дубров A.M., Обработка статистических данных методом главных компонент., М., "Статистика", 1978, 135 с.

16. Кендалл М.Д., Ранговые корреляции, М., "Статистика", 1975, 212 с.

17. Кендалл М.Д., Стюарт А., Многомерный статистический анализ и временные ряды, М., "Наука", 1976, 736 с.

18. Кендалл М.Д., Стюарт А., Статистические выводы и связи, М., "Наука", 1973,-899 с.

19. Кендалл М.Д., Стюарт А., Теория распределений, М., "Наука", 1966, -588 с.

20. Клавдиев Д., Автоматизация процесса принятия решений в медицине. // Матер, международного симпозиума «Ишемия мозга» ВМедА, каф. нейрохирургии. 1997 г., с. 231

21. Леман Э., Проверка статистических гипотез, М., "Наука", 1964,-498 с.25.—Лоули Д., Максвелл А., Факторный анализ как статистический метод, М., "Мир", 1967,-144 с.

22. Лоусон Ч., Хенсон Р., Численное решение задач метода наименьших квадратов, М., «Наука», 1986, 230 с.

23. Лысенков А.Н., Математические методы планирования многофакторных медико-биологических экспериментов, М., «Медицина», 1979, 320 с.

24. Немчинов B.C., Полиномы Чебышева и математическая статистика, М., ТСХА, 1946 г.,-139 с.

25. Ольвер Ф. Асимптотические и специальные функции, М., «Наука», 1971,-528 с.

26. Смирнов Н.В., Теория вероятностей и матеатической статистики. Избранные труды, М., "Наука", 1970 г., 290 с.

27. Смирнов Н.В., Дунин-Барковский И.В., Курс теории вероятностей и математической статистики, М., "Наука", 1965 г., -511 с.

28. Смирнов Н.В., Приближение законов распределения случайных величин по эмпирическим данным, Усп. матем. наук 10, 1944 г., 145 с.

29. Такач. Л., Комбинаторные методы в теории случайных процессов, М., Мир, 1971,-264 с.

30. Тюрин Ю.Н., Макаров А.Т., Анализ данных на компьютере, М., ИНФРА-М Финансы и статистика 1995 г., 384 с.

31. Эрдейи А., Асимптотические разложения, М., ГИФМЛ, 1962 г. , 127 с.

32. Arolt V, Teichert НМ, Steege D, Lencer R, Heide W., Distinguishing schizophrenic patients from healthy controls by quantitative measurement of eye movement parameters. // Biol Psychiatry 1998 Sep 15;44(6):448-58

33. Boshamer CB, Bruce KE., A scale to measure attitudes about HIV-antibody testing: development and psychometric validation. // AIDS Educ Prev 1999 Oct; 11(5):400-13

34. Broadway DC, Drance SM, Parfitt CM, Mikelberg FS., The ability of scanning laser ophthalmoscopy to identify various glaucomatous optic disk appearances. // Am J Ophthalmol 199ft May;1?5(5)^93-B04

35. Fraser D.A.S., Nonparametric Methods in Statistics. // Wiley, New York, 1957

36. Geary R.G., Testing for normality // Biometrica, 1947; 34, 209.

37. Herranz Marin MT, Jimenez-Alonso J, Delgado Rodriguez M, Omar M, Rivera Civico F, Martin Armada M, Siles MJ., Clinical and biological markers of secondary uveitis: results of a discriminant analysis. II Med Clin (Bare) 1997 Dec 6;109(20):786-91

38. Kac M. Kiefer J. and Wolfowitz J., On test of normality and other test of goodness of fit based on distance methods. //Ann. Math. Statist., 1955; 26,189

39. Kendall M.G., Discrimination and classification // Proc. Symp. Multiv. Analysis, Academic Press, New York 1965

40. Kim JS, Choi-Kwon S., Risk factors for stroke in different levels of cerebral arterial disuse. // Eur Neurol 1999;42(3): 150-6

41. Klavdiev V., Klavdiev' D., Koskin S., Shelepin Yu., The code for reliable testing of contrast sensitivity. // materials of International Workshop "NDTCS-97", SPbSTU, St. KMersburg, Russia, 1997:H7

42. Lind JC, Flor-Henry P, Koles ZJ., Discriminant analysis and equivalent source localization of the EEG relatec. cognitive functions. // Brain To-pogr 1999 Summer; 11 (4):265-78

43. Lloyd E.N., Least-squares estimation of location and scale parameters using order statistics. // Biometrica, 1952; 39, 8851.—Matsushima E, Kojima T, Ohta K, Obayashi S, Nakajima K, Kakuma T,

44. Ando H, Ando K, Toru M., Exploratory eye movement dysfunctions in patients with schizophrenia: possibility as a discriminator for schizophrenia. // J Psychiatr Res 1998 Sep-Oct;32(5):289-95

45. Meyers JE, Volbrecht M, Kaster-Bundgaard J., Driving is more than pedal pushing.//Appl Neuropsychol 1999;6(3): 154-64

46. Mocci F, Serra A., Specialist assessments and Law Decree 626/94 on operators employed at VDT/PCs. // Med Lav 1998 Nov-Dec;89(6):524-32

47. Plackett R.L., Linear estimations from cencored data. // Ann. Math. Stat., 1958; 29, 131

48. Ren XS, Kazis L, Meenan RF., Short-form Arthritis Impact Measurement Scales 2: tests of reliability and validity among patients with osteoarthritis. //Arthritis Care Res 1999 Jun;12(3):163-71

49. Theil H., A rank-invariant method of linear and polinomial regression analysis. // Indag. Math, 1950; 12, 86 and 173

50. Vilchevsky N., Klavdiev D., Gauss interpretation of rank tests and its application in neuroophthalmology data processing. // Materials of International Workshop NDTCS-97, St. Petersburg, Russia, 1997:H4

51. Vilchevsky N., Klavdiev V., Klavdiev D., The normalization of samples. Materials of International Workshop NDTCS-99, Alexander I. Melker, Editor, Proceeding of SPIE, vol. 4046, 2000:264-856.