автореферат диссертации по информатике, вычислительной технике и управлению, 05.13.18, диссертация на тему:Компьютерный анализ координированных замен аминокислот в семействах гомологичных белковых последовательностей
Оглавление автор диссертации — кандидата биологических наук Афонников, Дмитрий Аркадьевич
Введение.
Глава 1. Обзор литературы.
1.1. Особенности структурно-функциональной организации и эволюции глобулярных белков.
1.1.1. Особенности структурно-функциональной организации белков.
Мембранные и белки поверхности клетки.
1.1.2. Укладка белковой последовательности в нативную структуру.
1.1.3. Типы взаимодействий аминокислотных остатков.
1.1.4. Влияние аминокислотных замен на стабильность и функцию белка.
1.1.5. Особенности эволюции изофункционального белкового семейства.
1.1.6. Модели эволюции белковых последовательностей.
1.2. Координированные замены аминокислотных остатков в белках.
1.2.1. Понятие координированных замен аминокислотных остатков.
1.2.2. Экспериментальные свидетельства кооперативного эффекта замен остатков
1.3. Компьютерные методы выявления и анализа координированных замен аминокислот.
1.3.1. Методы выявления координированных замен. Выбор меры зависимости аминокислотных остатков.
1.3.2. Проблема учета эволюционной зависимости последовательностей.
1.3.3. Применение различных мер зависимости аминокислотных замен.
1.3.4. Проблема опосредованных корреляций.
1.3.5. Эффективность корреляционного анализа при исследовании последовательностей белковых семейств.
1.4. Анализ эволюционного постоянства интегральных физико-химических характеристик белков.
Введение 2002 год, диссертация по информатике, вычислительной технике и управлению, Афонников, Дмитрий Аркадьевич
Актуальность проблемы
Исследование наборов гомологичных последовательностей изофункциональных белков является одним из важнейших методов анализа в молекулярной биологии. При этом предполагается, что в ходе эволюции функция и пространственная структура белков остаются практически постоянными (Chothia and Lesk, 1986). Это означает, что физико-химические характеристики белка, обусловливающие специфическую укладку полипептидной цепи и функциональные особенности белка, в ходе эволюции, также должны поддерживаться на постоянном уровне. Выявление подобных консервативных характеристик при анализе гомологичных последовательностей может существенно расширить наши знания о функции, структуре и эволюции исследуемых белков.
Согласно существующим представлениям, возможны три механизма консервативности таких характеристик (Лим и Птицин, 1970). Первый механизм обусловлен инвариантностью функционально важных позиций белка. Это означает, что любые мутации в таких позициях белка приводят к нарушению его функции. При анализе гомологичных белков аминокислотные замены в таких позициях белка не наблюдаются. Второй механизм обусловлен консервативными заменами аминокислот в позициях белка. Эти замены происходят таким образом, что физико-химические свойства остатка существенно не меняются (например, замена изолейцина на лейцин в гидрофобном ядре глобулы). Согласно третьему механизму, дополнительный вклад в консервативность могут вносить координированные замены аминокислотных остатков. Это замены в парах или группах позиций белка, которые фиксируются зависимым образом (Лим и Птицин, 1970, Shindyalov et al., 1994). В частности, эти замены могут иметь компенсаторную природу, обусловленную близостью остатков в белковой глобуле. В последнее время методы выявления и анализа таких замен интенсивно развиваются. Информация, полученная в ходе анализа парных координированных замен, позволяет получать важные данные о структуре и функции белка (Nagl et al., 1999), предсказывать взаимные контакты остатков (Fariselli and Casadio, 1999; Pazos et al., 1997a), улучшать распознавание типов укладки полипептидных цепей (Olmea et al., 1999). Информация о консервативных интегральных характеристиках может быть использована для распознавания активных сайтов белков (Eisenhaber et al, 1999).
Отметим, что консервативные характеристики белка, обусловленные координированными заменами, могут быть выявлены с помощью анализа зависимых замен аминокислот, однако до настоящего времени такой подход не был реализован. Таким образом, развитие новых методов анализа координированных замен остатков и использования их для выявления консервативных интегральных характеристик белка является актуальной задачей. Ее актуальность обусловлена еще и тем, что число новых секвенированных белковых последовательностей в настоящее время стремительно растет. Для анализа этого массива данных необходима разработка новых подходов и пакетов программ, которые бы позволяли проводить анализ парных координированных замен, использовать полученную информацию для выявления интегральных характеристик белков. Важной составляющей является также доступность подобных программ широкому кругу исследователей в области анализа структуры, функции и эволюции белков.
Цели исследования
Первой целью работы были разработка метода анализа координированных замен аминокислотных остатков в последовательностях белковых семейств и создание пакета программ для такого анализа.
Второй целью работы явилось применение разработанных методик и программ в изучении координированных замен аминокислотных остатков в ряде белковых семейств, а также в последовательностях пептидов и белков, полученных в результате искусственной селекции.
Задачи исследования
В ходе работы предполагалось выполнить следующие задачи:
• разработать метод выявления координированных замен в парах позиций белка;
• разработать метод выявления интегральных физико-химических характеристик белка, для которых вклад координированных замен в постоянство (или вариабельность) является значимым;
• создать пакет программ, позволяющий выявлять пары и группы позиций белка, в которых замены аминокислот фиксируются зависимым образом, оценивать значимость вклада координированных замен аминокислот в постоянство (вариабельность) интегральных физико-химических характеристик белка;
• исследовать влияние координированных замен на постоянство интегральных физико-химических характеристик, связанных с различными свойствами аминокислот на примере АТФ-связывающей петли каталитического домена протеинкиназ;
• провести анализ координированных замен аминокислот в ДНК-связывающих доменах класса "гомеодомен" и выявить интегральные физико-химические характеристик гомеодоменов, постоянство которых имеет значимый вклад координированных замен остатков;
• исследовать координированные замены аминокислот в последовательностях мотива "цинковый палец", полученных с помощью экспериментов по искусственной селекции;
• провести массовый анализ координированных замен во множественных выравниваниях последовательностей, полученных методами искусственной селекции, разработать интерфейс пользователя для доступа к результатам этого анализа.
Методы исследования
Анализ координированных замен аминокислот, оценка вклада координированных замен в постоянство интегральных характеристик белка проводились оригинальным методом с помощью пакета программ CRASP (Afonnikov et al., 2001). Множественное выравнивание аминокислотных последовательностей гомеодоменов были взяты из базы данных Pfam (Sonnhammer, E.L. et al., 1998). Множественное выравнивание последовательностей каталитических доменов протеинкиназ было взято из работы Хэнке И Куинн (Hanks and Quinn, 1991; http://www.sdsc.edu/kinases/pkhome.html). Множественные выравнивания последовательностей цинковых пальцев взяты из работы Чу и Клюга (Choo and Klug, 1994). Множественные выравнивания последовательностей, полученных методами искусственной селекции, взяты из базы данных ASPD (Valuev et al, 2001). Построение филогенетических деревьев выполнялось программой CLUSTALW (Thompson et al., 1994). Визуализация и анализ пространственных структур белков производились программой WebLab Viewer, Molecular Simulations, Inc., http://www.msi.com. Анализ контактов в АТФ-связывающей петле протеинкиназ производился программой LPC (Sobolev et al., 1999; http://bioinfo.weizmann.ac.il:8500/oca-bin/lpccsu).
Научная новизна работы
Разработанный метод выявления зависимости аминокислотных замен в позициях белка на основе анализа корреляций величин физико-химических свойств аминокислот является оригинальным. Впервые для оценки парных зависимостей величин физико-химических свойств остатков использованы оценки частных коэффициентов корреляции, позволяющие учесть влияние опосредованных взаимодействий.
Пакет программ анализа координированных замен CRASP является единственной программой для такого анализа, доступной через Интернет.
В работе впервые проведен анализ координированных замен остатков в АТФ-связывающей петле каталитических доменов протеинкиназ и показано, что координированные замены остатков дают значимый вклад в постоянство суммарных величин шкал гидрофобности, изоэлектрической точки и вероятности встраивания в (3-структуру.
Анализ координированных замен остатков в гомеодоменах проведен на материале, превосходящем по объему материал предыдущих исследований. Исследование координированных замен проведено с помощью оригинальной методики, что позволило впервые выявить ряд интегральных физико-химических характеристик гомеодоменов, постоянство которых обусловлено координированными заменами остатков.
Впервые проведен анализ координированных замен и ДНК-связывающих доменах "цинковый палец". Оценен вклад координированных замен в постоянство суммарного заряда остатков, формирующих контакты с большой бороздкой ДНК.
Впервые проведен массовый анализ координированных замен в пептидах и белках, полученных методами искусственной селекции. Впервые показано, что в их последовательностях координированные замены имеют преимущественно компенсаторный характер по величинам объема боковых групп и изоэлектрической точки аминокислот, и антикомпенсаторный - по величинам гидрофобности и полярности.
Теоретическая и практическая ценность работы
В ходе работы на основе оригинальных методик создан пакет программ анализа координированных замен аминокислотных остатков CRASP, не имеющий аналогов в мире и доступный пользователям через Интернет. Результаты исследования координированных замен каталитических доменов протеинкиназ, ДНК-связывающих доменов класса "гомеодомен" и "цинковый палец" проливают свет на особенности их эволюции и структурно-функциональной организации. Результаты массового анализа координированных замен остатков в пептидах и белках, полученных с помощью искусственной селекции, вошли в базу данных ASPD и доступны широкому кругу исследователей через Интернет.
Апробация работы
Материалы работы были представлены на отчетных сессиях Института цитологии и генетики 1997 и 2000 года. Результаты работы были представлены на следующих научных конференциях:
Международная конференция "Современные концепции эволюционной генетики",
Новосибирск, 1997. German conference on Bioinformatics GCB'97, Kloster Irsee, Germany, 1997. 1st International Conference on Bioinformatics of Genome Regulation and Structure,
Novosibirsk, Russia, Novosibirsk, 1998. International Symposium: Protein Structure, Stability, and Folding. Fundamental and Medical
Aspects, Moscow, 1998. International school on theoretical biophysics, Moscow, 1998.
Третий Сибирский конгресс по прикладной и индустриальной математике (ИНПРИМ
1998), Новосибирск, 1998. Второй съезд биофизиков России, Москва, 1999.
Четвертый Сибирский конгресс по прикладной и индустриальной математике
ИНПРИМ-2000), Новосибирск, 2000. 2nd International Conference on Bioinformatics of Genome Regulation and Structure, Novosibirsk, 2000.
Международная конференция, посвященная 90-летию со дня рождения Алексея
Андреевича Ляпунова, Новосибирск, 2001. 3d International Conference on Bioinformatics of Genome Regulation and Structure,
Novosibirsk, 2002. Ш съезд биохимического общества, Санкт-Петербург, 2002.
Структура работы
Работа состоит из введения, трех глав, заключения, выводов, двух приложений и списка литературы.
Заключение диссертация на тему "Компьютерный анализ координированных замен аминокислот в семействах гомологичных белковых последовательностей"
Выводы
1.Предложен новый подход к анализу координированных замен аминокислотных остатков в семействах гомологичных белковых последовательностей. Этот подход реализован в виде пакета программ С RASP (http://wwwmgs.bionet.nsc.ru/mgs/programs/crasp/), который позволяет: выявлять парные зависимости величин физико-химических характеристик аминокислот в позициях множественного выравнивания; выявлять группы зависимых позиций белка; оценивать значимость вклада координированных замен аминокислотных остатков в постоянство или вариабельность интегральных физико-химических характеристик белка.
2.Проведен анализ координированных замен остатков в АТФ-связывающей петле протеинкиназ (позиции 43-62). Показано, что вклад координированных замен в постоянство интегральных характеристик является значимым для свойств, отражающих гидрофобность остатков, изоэлектрическую точку аминокислот и вероятность встраивания в ^-структуру.
3.Проанализированы парные зависимости величин изоэлектрической точки и объема боковых групп аминокислот в ДНК-связывающих доменах класса «гомеодомен». Выявлены консервативные интегральные характеристики, связанные с величинами изоэлектрической точки в группах позиций {R15, R18, Е19, N23, R30, Q33, S36, Е37} и {F8, Y25, L13, К17, Е42, К52}, величинами объема боковых групп в позициях {Е42, Е44, А54} и {Q12, Y25, L38, Q50}, постоянство которых обусловлено координированными заменами остатков.
4.Проведено исследование последовательностей ДНК-связывающих доменов "цинковый палец С2Н2", полученных с помощью эксперимента по искусственной селекции. Показано, что координированные замены вносят значимый вклад в постоянство суммарной величины изоэлектрической точки аминокислот для остатков, формирующих контакты с ДНК в районе большой бороздки (позиции -1,1, 2, 3 и 6).
5.Создана электронная коллекция результатов анализа корреляций аминокислотных замен в позициях множественных выравниваний последовательностей пептидов и белков, полученных с помощью экспериментов по искусственной селекции.
6.Показано, что в результате отбора в экспериментах по искусственной селекции координированные замены остатков являются преимущественно компенсаторными по величинам изоэлектрической точки и объема боковых групп аминокислот и антикомпенсаторными по величинам гидрофобности и полярности.
Заключение
В настоящей работе предложен подход для оценки парных зависимостей аминокислотных замен в последовательностях белковых семейств. Этот подход основан на вычислении оценок частных коэффициентов корреляции величин физико-химических свойств остатков в столбцах выравнивания. Для учета эволюционной зависимости последовательностей предложено использовать метод взвешивания Фельзенштейна (Felsenstein, 1985). Анализ численных моделей показал адекватность предложенных подходов и преимущество по отношению к обычным коэффициентам корреляции и вычислению оценок без учета эволюционной зависимости белков.
На основе предложенных методик разработан пакет программ С RASP, доступный широкому кругу пользователей через Интернет. Этот пакет программ позволяет выявлять пары и группы позиций белка, замены в которых происходят зависимым образом. Существует также возможность оценки вклада координированных замен в постоянство (вариабельгность) интегральных физико-химических характеристик белка.
С помощью данного пакета программ проанализированы последовательности белковых семейств протеинкиназ, гомеодоменов, а также последовательности, полученные в результате искусственной селекции. Полученные результаты показали, что предложенные методы и пакеты программ позволяют выявлять зависимые замены остатков в белках, интегральные характеристики белка, постоянство которых обусловлено координированными заменами остатков.
Библиография Афонников, Дмитрий Аркадьевич, диссертация по теме Математическое моделирование, численные методы и комплексы программ
1. Андерсон Т. (1963) Введение в многомерный статистический анализ. М.:1. Физматгиз.
2. Кендалл, М., Стьюарт, А. (1971) Статистические выводы и связи. М: Наука, 1971.
3. Кимура, М. (1985) Молекулярная эволюция: теория нейтральности. М. Мир, 1985.
4. Колчанов, Н.А. (1988) Теоретическое исследование закономерностей структурнофункциональной организации и эволюции генетических макромолекул. Дисс. Д-ра биол. наук, Новосибирск, Институт Цитологии и Генетики, 1988, 542 с.
5. Лим, В.И. и Птицин, О.Б. (1970) О постоянстве объема гидрофобного ядра вмолекулах миоглобинов и гемоглобинов. Мол. Биол., 4, 372-382.
6. Мецлер, Д. (1980) Биохимия. М.: Мир, 1980.
7. Уайт, А., Хендлер, Ф., Смит, Э., Хилл, Р., Леман, И. Основы биохимии, т.1. М.:1. Мир, 1981., с. 102-105.
8. Хуанг, К. (1966) Статистическая механика. М. Мир, 1966.
9. Шульц, Г., Ширмер, Р. (1984) Принципы структурной организации белков. М. :1. Мир, 1982.
10. Alexandrov N., Go N. (1998) On the number of structural families in the protein universe.
11. Proc. of the 1st Int. Conference on Bioinformatics of Genome Regulation and Structure (BGRS)
12. Alexandrov, N.N. and Go, N. (1994) Biological meaning, statistical significance, andclassification of local spatial similarities in nonhomologous proteins. Protein Sci., 3, 866-875.
13. Altshuh,D., Lesk,A.M., Bloomer,A.C. and Klug,A. (1987) Correlation of co-ordinatedamino acid substitutions with function in viruses related to tobacco mosaic virus. J. Mol. Biol, 193, 693-707.
14. Altshuh,D., Vernet,T., Berti,P., Moras,D. and Nagai,K. (1988) Coordinated amino acidchanges in homologoud protein families. Prot. Eng., 2,193-199.
15. Altshul,S.F„ Carroll,R.J. and Lipman,D.J. (1989) Weights for data related by a tree. J.1. Mol. Biol, 207, 647-653.
16. Anderson,D.E., Becktel,WJ., Dahlquist,F.W. (1990) pH-induced denaturation ofproteins: a single salt bridge contributes 3-5 kcal/mol to the free energy of folding of T4 lysozyme. Biochemistry, 29, 2403-2408.
17. Anfinsen,C.B. (1973) Principles that govern the folding of protein chains. Science, 181,223.230.
18. Atchley,W.R., Wollenberg,K.R„ Fitch,W.M., Terhalle,W, Dress,A.W. (2000)
19. Correlations among amino acid sites in bHLH protein domains: an information theoretic analysis. Mol. Biol. Evol. 17, 164-78.
20. Axe,D.D, Foster,N.W. and Fersht,A.R. (1996) Active bamase variants with completelyrandom hydrophobic cores. Proc. Natl. Acad. Sci. USA, 93, 5590-5594.
21. Ayala,F.J. (1997) Vagaries of molecular clock. Proc. Natl. Acad. Sci. USA, 94, 77767783.
22. Ayala,FJ., Barrio,E. and Kwiatowski,J. (1997) Molecular clock or erratic evolution? Atale of two genes. Proc. Natl. Acad. Sci. USA, 93, 11729-11734.
23. Baldwin,E.P., Hajiseyedjavadi,0., Baase,W.A. and Matthews,B.W. (1993) The role ofbackbone flexibility in the accommodation of variants that repack the core of T4 lysozyme. Science, 262, 1715-1718.
24. Baldwin,E.P., Xu,J., Hajiseyedjavadi,0., Baase,W.A. and Matthews,B.W. (1996)
25. Thermodynamic and structural compensation in "size-switch" core repacking variants of bacteriophage T4 lysozyme. J. Mol. Biol., 259, 542-559.
26. Barbas CF 3rd.(1993) Recent advances in phage display. Curr Opin Biotechnol, 4, 5265230.
27. Barlow D J. and Thornton J.M. (1983) Ion pairs in proteins. J. Mol. Biol. 168, 867-885.
28. Bashford,D., Chothia,C. and Lesk,A.M. (1987) Determinants of a protein fold. Uniquefeatures of the globin amino acid sequences. J. Mol. Biol., 196, 199-216.
29. Benner,S.A. (1992) Patterns of divergence in homologous proteins as indicators of tertiaryand quarternary structure. Adv. EnzymeRegulat., 28, 219-236.
30. Benner,S.A. and Gerloff,D. (1991) Patterns of divergence in homologous proteins asindicators of secondary and tertiary structures: the catalytic domain of protein kinases. Advan. Enzyme Regulat., 31, 121-181.
31. Benner,S.A., Cohen,M.A., Gerloff,D.L. (1994b) Amino acid substitution duringfunctionally constrained divergent evolution. Prot. Eng., 7, 1323-1332.
32. Billeter,M., Qian,Y., Ottig,G., Muller,M., Gehring,W., Wuthrich,K. (1993) Determinationof the Nuclear magnetic resonance solution structure of an Antennapedia homeodomain-DNA complex. J. Mol. Biol, 234, 1084-1097.
33. Braxton S. (1996) In Protein Engineering: Principles and Practice, Cleland J. & Craik C.
34. Eds.; Wiley-Liss, New York, NY; Chapter 11.
35. Bryngelson, J.D. and Wolynes, P.G. (1987) Spin glasses and statistical mechanics ofprotein folding. Proc. Natl Acad. Sci. USA, 84, 7524-7528.
36. Bryngelson, J.D., Onuchic, J.N., Socci, N.D. and Wolynes, P.G. (1995) Funnels,pathways, and the energy landscape of protein folding: a synthesis. Proteins, 21, 167195.
37. Burglin,T.R. (1994) A comprehensive classification of homeobox genes, in Guidebook tothe homeobox genes, Duboule D. Ed. A Sambrook & Tooze Publication at Oxford University Press, 1994. pp. 27-71.
38. Carter,P.J., Winter,G., Wilkinson,A.J. and Fersht,A. (1984) The use of double mutants todetect structural changes in the active site of the tyrosyl-tRNA synthetase (Bacillus stearothermophilus). Cell, 38, 835-840.
39. Chelvanayagam,G., Eggenschwiler,A., Knecht,L., Gonnet.,G. and Benner,S. (1997) Ananalysis of simultaneous variation in protein structures. Prot. Eng., 10, 307-316.
40. Choo,Y. and Klug,A. (1994) Toward a code for the interactions of zinc fingers with DNA:selection of randomized fingers displayed on phage. Proc. Natl Acad. Sci. USA, 91, 11163-11167.
41. Chothia C. (1984) Principles that determine the structure of proteins. Ann. Rev. Biochem.,53,537-572.
42. Chothia C. (1992) Proteins. One thousand families for the molecular biologist. Nature,357, 543-544.
43. Chothia,C. and Gerstein,M. (1997) How far can sequence diverge? Nature, 385, 579-581.
44. Chothia,C. and Lesk,A.M. (1986) The relation between divergence of sequence andstructure in proteins. EMBO J., 5, 823-826.
45. Chou, P.Y. and Fasman, G.D. (1978) Prediction of the secondary structure of proteinsfrom their amino acid sequence. J Adv. Enzymol, 47,45-148.
46. Clarke,N.D. (1995) Covariation of residues in homeodomain sequence family. Prot. Sci.,4, 2269-2278.
47. Clarke,N.D., Kissinger,C.R., Desjarlais,J., Gilliland,G.L„ Pabo,C.O. (1994) Structuralstudies of engrailed homeodomain. Prot. Sci., 3, 1779-1787.191
48. Cohen, F.E. (1999) Protein misfolding and Prion diseases. J. Mol Biol., 293, 313-320.
49. Cohen,F.E. and Prusiner,S.B. (1999) Pathological conformations of prion proteins. Annu.
50. Rev. Biochem., 67, 793-819.
51. Cordes,M.H., Walsh,N.P., McKnight,C.J., Sauer,R.T. (1999) Evolution of a protein foldin vitro. Science, 284, 325-328.
52. Cox,D.R. (1962) Further results on tests of separate families of hypotheses. J. Roy. Stat.1. Soc. B, 24, 406-424.
53. Creighton, Т.Е., Darby, N.J., Kemmink, J. (1996) The roles of partly folded intermediatesin protein folding. FASEB J., 10,110-118.
54. Daopin,S., Alber,T. Baase, W.A., Wozniak,J.A. and Matthews,B.W. (1991) Structuraland thermodynamic analysis of the packing of two alpha-helices in bacteriophage T4 lysozyme. J. Mol. Biol., 221, 647-667.
55. Day,A. (1996) The Source of Stability in Proteins.http://sanda. cryst. bbk. ac. uk/PPS2/projects/day/TDayDiss/
56. Dayhoff, M.O., Hunt, L.T., and Hurst-Calderone, S. (1978a) Composition of proteins. In
57. Atlas of Protein Sequence and Structure", Vol.5, Suppl.3 (Dayhoff, M.O., ed.), National Biomedical Research Foundation, Washington, D.C., p.363 (1978)
58. Desjarlias, J.R., Berg, J.M. (1992) Redesigning the DNA-binding specificity of a zincfinger protein: f data base- guided approach. Proteins, 12, 101-104; Proteins, 13, 272 (Erratum).
59. Dill, K.A., Bromberg, S., Yue, K., Fiebig, K.M., Yee, D.P., Thomas, P.D., Chan, H.S.
60. Principles of protein folding a perspective from simple exact models. Prot. Sci., 4, 561-602.
61. Dill,K.A. (1990) Dominant forces in protein folding.Biochemistry, 29, 7133-7155.
62. Dill,K.A. (1997) Additivity principles in biochemistry. J. Biol Chem., Ill, 701-704.
63. Dill,K.A. and Chan,H.S. (1997) From Levinthal to pathways to funnels. Nat. Struct. Biol.,4, 10-19.
64. Dobson,C.M., Sali,A. and Karplus,M. (1998) Protein folding: a perspective from theoryand experiment. Angew. Chem. Int. Ed., 37, 868-893.
65. Dolgikh, D.A., Gilmanshin R.I., Brazhnikov E.V., Bychkova V.E., Semisotnov G.V.,
66. Venyaminov S.Yu., Ptitsyn O.B. (1981) Alpha-Lactalbumin: compact state with fluctuating tertiary structure? FEBS Lett, 136, 311-315.
67. Durbin,R., Eddy,S.R., Krogh,A., Mitchison,G. (1998) Biological sequence analysis.
68. Cambridge University Press, Cambridge, UK.192
69. Efron, В. (1979) Bootstrap methods: Another Look at the Jackknife, Annals of Statistics,7, 1-26.
70. Eisenberg D, Schwarz E, Komaromy M, Wall R. (1984) Analysis of membrane andsurface protein sequences with the hydrophobic moment plot. JMol Biol., 179, 125-42.
71. Eisenhaber,B., Bork,P. and Eisenhaber,F. (1999) Prediction of potential GPI-modificationsites in proprotein sequences. J. Mol Biol, 292, 741-758.
72. Eisenhaber,B., Bork,P., Eisenhaber F. (1998) Sequence properties of GPI-anchoredproteins near the omega-site: constraints for the polypeptide binding site of the putative transamidase. Protein Eng, 11, 1155-1161.
73. Ellis, R.J. (1997) Molecular chaperones: avoiding the crowd. Curr. Biol., 7, R531-R533.
74. Ellis, R.J. and Hartl, F.U. (1999) Principles of protein folding in the cellular environment.
75. Curr. Opin. Struct. Biol, 9, 102-110.
76. Elrod-Erickson, M., Rould, M., Nekludova, L., Pabo, C.O. (1996) Zif268 protein-DNAcomplex refined at 1.6 A: a model system for understanding zinc finger-DNA interactions. Structure, 4, 1171-1180.
77. Fairall, L., Schwabe, J.W.R., Chapman, L., Finch, J.T. and Rhodes, D. (1993) The crystalstructure of a two zinc-finger peptide reveals an extension to the rules for zinc finger/DNA recognition. Nature, 366, 483-487.
78. Fariselli,P. and Casadio,R. (1999) A neural network based predictor of residue contacts inproteins. Prot. Eng., 12, 15-21.
79. Felsenstein,J. (1973) Maximum-likelihood estimation of evolutionary trees fromcontinuous characters. Am. J. Hum. Genet., 25,471-492.
80. Felsenstein,J. (1981) Evolutionary trees from DNA sequences: a maximum likelihoodapproach. J. Mol Evol., 17, 368-376.
81. Felsenstein,J. (1985) Phylogenies and the comparative method. Am. Nat., 125,1-15.
82. Felsenstein,J. (1993) PHYLIP (phylogeny inference package) version 3.5. University of1. Washington, Seattle.
83. Fersht AR. (1974) Catalysis, binding and enzyme-substrate complementarity. Proc R Socbond В Biol Sci., 187, 397-407.
84. Fersht AR. (1987) Dissection of the structure and activity of the tyrosyl-tRNA synthetaseby site-directed mutagenesis. Biochemistry, 26, 8031-8037.
85. Fitch W.M. (1971) Rate of change of concomitantly variable codons. J Mol Evol, 1, 8496.
86. Fitch, W.M., Ayala, FJ. (1994) Molecular clocks are not as bad as you think. Soc Gen1. Physiol Ser., 49, 3-12.
87. Fitch,W.M. and Markowitz,E. (1970) An improved method for determining codonvariability in a gene and its application to the rate of fixation of mutations in evolution. Biochem. Genet., 4,579-593.
88. Freemont,P. (1993) Max in complex affair. Nature, 363, 20-21.
89. Funahashi, J., Takano K., Ogasahara K., Yamagata Y., Yutani K. (1996) The structure,stability and folding process of amyloidogenic mutant human lysozyme. J. Biochem., 54, 497-505.
90. Gobel,U., Sander,C., Schneider,R. and Valencia,А. (Г994) Correlated mutations andresidue contacts in proteins. Prot. Struct. Funct. Genet., 18, 309-317.
91. Gassner,N.C., Baase,W.A. and Matthews,B.W. (1996) A test of the "jigsaw puzzle"model for protein folding by multiple methionine substitutions within the core of T4 lysozyme. Proc. Natl. Acad. Sci. USA, 93, 12155-12158.
92. Gerstein,M., Sonnhammer,E.L. and Chothia,C. (1994) Volume changes in proteinevolution. J. Mol. Biol., 236, 1076-1078.
93. Gillespie,J.H. (1984) Molecular evolution over the mutational landscape. Evolution, 38,1116-1129.
94. Giraud,B.G., Lapedes,A. and Liu,L.C. (1998) Analysis of correlations between sites inmodels of protein sequences. Phys. Rev. E, 58, 6312-6322.
95. Goda S., Takano K., Yamagata Y., Nagata R., Akutsu H., Maki S., Namba K., and Yutani
96. K. (2000) Amyloid protofilament formation of hen egg lysozyme in highly concentrated ethanol solution. Protein Sci, 9, 369-375.
97. Goldman,N. (1993) Statistical tests of models of DNA substitution. J. Mol Evol., 36,182.198.
98. Gonnet,G.H., Cohen,M.A. and Benner,S.A. (1992) Exhaustive matching of the entireprotein sequence database. Science, 256, 1433-1445.
99. Green,S.M. and Shortle,D. (1993) Patterns of nonadditivity between pairs of stabilitymutations in staphylococcal nuclease, Biochemistry, 32, 10131-10139.
100. Green,S.M., Meeker,A.K. and Shortle,D. (1992) Contributions of the polar, unchargedamino acids to the stability of staphylococcal nuclease: evidence, for mutational effects on the free energy of the denatured state. Biochemistry, 31, 5717-5728.
101. Gregoret,L.M. and Sauer,R.T. (1993) Additivity of mutant effects assessed by binomialmutagenesis. Proc. Natl Acad. Sci. USA, 90, 4246-4250.
102. Gu, H„ Yi, Q., Bray,S.T., Riddle,D.S., Shiau,A.K. and Baker,D. (1995) A phage displaysystem for studying the sequence determinants of protein folding Protein Sci., 4, 11081117.
103. Hanks, S. and Quinn, A.M. (1991). Protein kinase catalytic domain sequence database:1.entification of conserved features of primary structure and classification of family members. Meth. Enzymol, 200, 38-62.
104. Hanks, S.K., Hunter, T. (1995) The eukaryotic protein kinase superfamily: kinasecatalytic) domain structure and classification. FASEB J., 9, 576-596.
105. Hartl, F.U. (1996) Molecular chaperones in cellular protein folding. Nature, 381, 571580.
106. Henikoff,S., HenikoffJ.G. (1992) Amino acid substitution matrices from protein blocks.
107. Proc. Natl. Acafi. Sci. USA, 89, 10915-10919.
108. Hogue, C.W.V., Ohkawa, H. and Bryant, S.H. (1996) WWW-Entrez and the molecularmodelling database. Trends Вiochem. Sci., 21, 226-229.
109. Holm L, Sander C. (1996) Mapping the protein universe. Science, 273, 595-603.
110. Holm, L. and Sander, C. (1993) Protein structure comparison by alignment of distancematrices. J. Mol. Biol., 233, 123-138.
111. Horovitz A., Serrano L., Avron В., Bycroft M. & Fersht A. (1990), Strength and cooperativity of contributions of surface salt bridges to protein stability. J. Mol. Biol. 216,1031-44.
112. Horovitz,A. (1987) Non-additivity in protein-protein interactions. J. Mol. Biol., 196, 733735.
113. Houbaviy, H.B., Usheva, A., Shenk, T. and Burley, S.K. (1996) Cocrystal structure of
114. YY1 bound to the adeno-associated virus P5 initiator. Proc.Natl.Acad.Sci USA, 93, 13577-13582.
115. Huelsenbeck,J.P. and Rannala,B. (1997) Phylogenetic methods come of age: testinghypothesis in an evolutionary context. Science, 276, 227-232.
116. Hurley,J.H., Baase,W.A. and Matthews,B.W. (1992) Design and structural analysis ofalternative hydrophobic core packing arrangements in bacteriophage T4 lysozyme. J. Mol. Biol., 224, 1143-1159.
117. Jacobs,G. (1992) Determination of the base recognition positions of zinc fingers fromsequence analysis. EMBOJ., 11, 4507-4517.
118. Jamieson, A.C., Kim, S.-H. and Wells, J.A. (1994) In vitro selection of zinc fingers withaltered DNA-binding specificity. Biochemistry, 33, 5689-5695.195
119. Jamieson,A.C., Kim,S.-H. and Wells,J.A. (1994) In vitro selection of zinc fingers withaltered DNA-binding specificity. Biochemistry, 33, 5689-5695.
120. Jones,D.T., Taylor,W.R. and Thornton,J.M. (1992) The rapid generation of mutation datamatrices from protein sequences. CABIOS, 8, 275-282.
121. Jones,D.T., Taylor,W.R., Thornton,J.M. (1994) A mutation data matrix fortransmembrane proteins. FEBSLett., 339, 269-275.
122. Kaneko,K., Zulianello,L., Scott,M., Cooper,C.M., Wallace,A.C., James,T.L., Cohen,F.E.,
123. Prusiner,S.B. (1997) Evidence for protein X binding to a discontinuous epitope on the cellular prion protein during scrapie prion propagation. Proc. Natl. Acad. Sci. USA, 94, 10069-10074.
124. Kapp, O.H., Moens, L., Vanfleteren, J., Trotman, C.N., Suzuki, Т., Vinogradov, S.N.1995) Alignment of 700 globin sequences: extent of amino acid substitution and its correlation with variation in volume. Protein Sci., 4,2179-2190.
125. Kappen,C., Schughart,K., Ruddle,F.H. (1993) Early evolutionary origin of majorhomeodomain sequence classes. Genomics, 18, 54-70.
126. Kauzmann,W. (1959) Some factors in the interpretation of protein denaturation. Adv.1. Protein Chem., 14, 1-63.
127. Kendall,M.G. and Stuart,A. (1967) The advanced theory of statistics. Vol. 2. Inferenceand relationship. 2nd edition. Charles Griffin & Co Ltd., London.
128. Kim,D.E., Gu,H. and Baker,D. (1998) The sequences of small proteins are not extensivelyoptimized for rapid folding by natural selection Proc. Natl. Acad. Sci. USA, 95, 49824986.
129. Kimura,M. (1991) Recent development of the neutral theory viewed from the Wrightiantradition of theoretical population genetics. Proc. Natl. Acad. Sci. USA, 88, 5969-5973.
130. Kishino,H., Miyata,T. and Hasegawa,M. (1990) Maximum likelihood inference of proteinphylogeny and the origin of chloroplasts. J. Mol. Evol., 31, 151-160.
131. Kissinger C.R., Liu В., Martin-Blanco E., Romberg T.B. and Pabo C.O. (1990) Crystalstructure of an engrailed homeodomain-DNA complex at 2.8 A resolution: a framework for understanding homeodomain-DNA interactions. Cell, 63, 579-590.
132. Klemm,J., Rould,M., Aurora,R., Herr,W., Pabo,C. (1994) Crystal structure of the Oct-1
133. POU domain bound to octamer site: DNA recognition with tetheres DNA binding modules. Cell, 77, 21-32.
134. Klug, A. (1999) Zinc finger peptides for the regulation of gene expression. J Mol Biol.,293,215-218.
135. Klug, A., Schwabe, J.W.R. (1995) Zinc fingers. FASEB J., 9, 597-604.
136. Korber,B.T.M., Farber,R.M., Wolpert,D.H. and Lapedes,A.S. (1993) Covariation ofmutations in the V3 loop of human immunodeficiency virus type 1 envelope protein: an information theoretic analysis. Proc. Natl. Acad. Sci USA, 90, 7176-7180.
137. Koshi,J.M. and Goldstein,R.A. (1995) Context-dependent optimal substitution matricesderived using bayesian statistics and phylogenetic trees. Prot. Eng., 8, 641-645.
138. Koshi,J.M. and Goldstein,R.A. (1997) Mutation matrices and physical-chemicalproperties: correlations and implications. Prot. Struct., Funct, Genet., 27,336-344.
139. Koshi,J.M., Mindell, D.P. and Goldstein,R.A. (1998) Beyond mutation matrices: physicalchemistry based evolutionary models. In RECOMB-98, New York, pp. 140-145.
140. Koshi,J.M., Mindell, D.P. and Goldstein,R.A. (1999) Using physical-chemistry-basedsubstitution models in phylogenetic analyses of HIV-1 subtypes. Mol. Biol. Evol., 16, 173-179.
141. Kreisberg,R., Buchner,V. and Arad,D. (1995) Paired natural cysteine mutation mapping:aid to constraining models of protein tertiary structure. Protein Sci. 4, 2405-2410.
142. Kuznetsov IB, Morozov PS, Matushkin YG. (1997) Prion proteins: evolution andpreservation of secondary structure. FEBS Lett., 412, 429-32.
143. Lapedes,A.S., Giraud,B.G., Liu,L.C., Stormo,G.D. (1997) Correlated mutations in proteinsequences: phylogenetic and structural effects. Proc. of the AMS/SIAM Conference on statistic in Molecular Biology, Seattle, WA.
144. Laskowski R A (2001). PDBsum: summaries and analyses of PDB structures. Nucleic1. Acids Res., 29, 221-222.
145. Leopold, P.E., Montal, M. and Onuchic, J.N. (1992) Protein folding funnels: a kineticapproach to sequence-structure relationship. Proc. Natl. Acad. Sci. USA, 89, 87218725.
146. Lesk,A.M. and Chothia,C. (1980) How different amino acid sequences determine similarprotein structures: the structure and evolutionary dynamics of the globins. J. Mol. Biol., 136, 223-268.
147. Levinthal, C. (1968) Are there pathways for protein folding? J. Chim. Phys., 65, 44-45.
148. Lim,W.A. and Sauer,R.T. (1989) Alternative packing arrangements in the hydrophobiccore of X repressor. Nature, 339, 31-36.
149. Lim,W.A. and Sauer,R.T. (1991) The role of internal packing interactions in determiningthe structure and stability of a protein. J. Mol. Biol., 219, 359-376.
150. Lim,W.A., FarruggioJD.C. and Sauer,R.T. (1992) Stmctural and energetic consequencesof disruptive mutations in protein core. Biochemistry, 31, 4324-4333.
151. Lins,L. And Brasseur,R. (1995) The hydrophobic effect in protein folding. FASEB J., 9,535.540.
152. Malcolm,B.A., Wilson,K.P, Matthews,B.W., Kirsch,J.F. and Wilson,A.C. (1990)
153. Ancestral lyzocymes reconstructed, neutrality tested, and thermostability linked to hydrocarbon packing. Nature, 345, 86-89.
154. Mateu,M.G. and Fersht,A.R. (1999) Mutually compensatory mutations during evolutionof the tetramerization domain of tumor supressor p53 lead to impaired hetero-oligomerization. Proc. Natl. Acad. Sci. USA, 96, 3595-3599.
155. Matthews,B.W. (1993) Structural and genetic analysis of protein stability. Annu. Rev.1. Biochem., 62, 139-60.
156. Matthews,B.W. (1996) Structural and genetic analysis of the folding and function of T4lysozyme. FASEB J., 10, 35-41.
157. Matthews,C.R. (1993) Pathways of protein folding. Annu. Rev. Biochem., 62, 653-683.
158. McGinnis,W., Levine,M.S., Hafen,E., Kuroiwa,A. and Gehring,W.J. (1984) A conserved
159. DNA sequence in homeotic genes of the Drosophila Antennapedia and bithorax complexes. Nature, 308, 428-433.
160. McLachlan,A.D. (1971) Tests for comparing related amino acid sequences. Cytochrome сand cytochrome c551. J.Mol.Biol., 61, 409-424.
161. Meeker,A.K., Garsia-Moreno,B.E. and Shortle,D. Contributions of the ionizable aminoacids to the stability of staphylococcal nuclease. Biochemistry, 35, 6443-6449.
162. Metropolis,N., Rosenbluth,A.W., Rosenbluth,M.N., Teller,A.H. and Teller,E. (1953)
163. Equation of state calculations for fast computing machines. J. Chem. Phys., 21, 219236.
164. Milla,M.E., Brown,B.M., Waldburger,C.D. and Sauer,R.T. (1994) Protein stability effectsof a complete set of alanine substitutions in Arc repressor. Nature Struct. Biol., 1, 518523.
165. Miller, J., McLachlan, A.D., Klug, A. (1985) Repititive zinc-binding domains in theprotein transcription factor ША from Xenopus oocytes. EMBO J., 4, 1609-1614.
166. Miyamoto,M.M. and Fitch,W.M. (1995) Testing the covarion hypothesis of molecularevolution. Mol. Biol. Evol, 12, 503-513.
167. Miyazawa,S. and Jernigan,R.L. (1993) A new substitution matrix for protein sequencesearches based on contact frequencies in protein structures, Protein Eng., 6, 267-278.198
168. Murzin A. G., Brenner S. E., Hubbard Т., Chothia C. (1995). SCOP: a structuralclassification of proteins database for the investigation of sequences and structures. J. Mol Biol. 247, 536-540.
169. Muse, S. (1995) Evolutionary analyses of DNA sequences subject to constraints ofsecondary structure. Genetics, 139, 1429-1439.
170. Nagl,S.B., Freeman,J., Smith,T.F. (1999) Evolutionary constraint networks in ligandbinding domains: an information-theoretic approach. Рас. Symp. Biocomput., 90-101.
171. Nakai, K., Kidera, A., and Kanehisa, M. (1988) Cluster analysis of amino acid indices forprediction of protein structure and function. Protein Eng., 2, 93-100.
172. Neher,E. (1994) How frequent are correlated changes in families of protein sequences?
173. Proc. Natl Acad. Sci USA, 91, 98-102.
174. Orengo CA, Michie AD, Jones S, Jones DT, Swindells MB, Thornton JM (1997) CATH-a hierarchic classification of protein domain structures. Structure 1997 Aug 15;5(8):1093-108
175. Orengo, C.A., Jones, D.T. and Thornton, J.M. (1994) Protein superfamilies and domainsuperfolds. Nature, 372, 631-634.
176. Ortiz,A.R., Kolinski,A. and Skolnick,J. (1998) Fold assembly of small proteins using
177. Monte Carlo simulations driven by restraints derived from multiple sequence alignment. J. Mol Biol, 277,419-448.
178. Overington JP, Zhu ZY, Sali A, Johnson MS, Sowdhamini R, Louie GV, Blundell TL1993) Molecular recognition in protein families: a database of aligned three-dimensional structures of related proteins. Biochem Soc Trans 21, 597-604.
179. Overington,J. (1992) Structural constraints on residue substitution. Genetic Engineering,vol. 14, ed. Setlow,J.K., Plenum press, NY, 231-249.
180. Overington,J., Donnelly,D., Johnson,M.S., Sali,A., Blundell,T.L (1992) Environmentspecific amino acid substitution tables: tertiary templates and prediction of protein folds. Prot. Sci., 1, 216-226.
181. Pace,C.N., Shirley,B.A., McNutt,M. And Gajiwala,K. (1996) Forces contributing to theconformational stability of proteins. FASEB J., 10, 75-83.
182. Pagel, M. (1994) Detecting correlated evolution on phylogenies: general method for thecomparative analysis of discrete characters. Proc. R. Soc. bond. B, 255, 37-45.
183. Pascarella,S. and Argos,P. (1992). A data bank merging related protein structures andsequences. Prot. Eng., 5, 121-137.
184. Pavletich, N.P., Pabo, C.O. (1991) Zinc finger-DNA recognition: crystal structure of a
185. Zif268-DNA complex at 2.1 A. Science, 261, 1701-1707.
186. Pazos,F., Helmer-Citterich,M., Ausiello,G. and Valencia,A. (1997a) Correlated mutationscontain information about protein-protein interaction. J. Mol. Biol., 271, 511-523.
187. Pazos,F., 01mea,0. and Valencia,A. (1997b) A graphical interface for correlatedmutations and other protein structure prediction methods. CABIOS, 13, 319-321.
188. Pepys MB, Hawkins PN, Booth DR, Vigushin DM, Tennent GA, Soutar AK, Totty N,
189. Nguyen O, Blake CC, Terry С J, et al (1993) Human lysozyme gene mutations cause hereditary systemic amyloidosis. Nature, 362, 553-7.
190. Pollock, D.D., Taylor, W.R., Goldman, N. (1999) Coevolving protein residues: maximumlikelihood identification and relationship to structure. J Mol Biol 287, 187-198.
191. Pollock,D.D. and Taylor,W.R. (1997) Effectiveness of correlation analysis in identifyingprotein residues undergoing correlated evolution. Prot. Eng., 10, 647-657.
192. Ponnuswamy, P.K., Prabhakaran, M., and Manavalan, P. (1980) Hydrophobic packingand spatial arrangement of amino acid residues in globular proteins. Biochim. Biophys. Acta, 623, 301-316.
193. Prusiner, S.B., Scott, M.R. (1997) Genetics of prions. Annu. Rev. Genet. 31, 139-75.
194. Prusiner, S.B., Scott, M.R., DeArmond, SJ., Cohen F.E. (1997) Prion protein biology.1. Cell, 93, 337-348.
195. Ptitsyn O.B. (1995) Molten globule and protein folding. Adv. Protein Chem., 47, 83-229.
196. Ptitsyn,O.B. (1998) Protein folding and protein evolution: common folding nucleus indifferent subfamilies of c-type cytochromes? J. Mol. Biol., 278,655-666.
197. Ptitsyn,O.B. and Volkenstein,M.V. (1986) Protein structures and neutral theory ofevolution. J. Biomol. Struct. Dynam., 4, 137-156.
198. Qian,Y., Billeter,M., Ottig,G., Muller,M., Gehring,W., Wuthrich,K. (1989) The structureof the Antennapedia homeodomain determined by NMR spectroscopy in solution: comparison with procaryotic repressors. Cell, 59, 573-580.
199. Qian,Y.Q., Furukubo-Tokunaga,K., Resendez-Perez,D., Muller,M., Gehring,W.J.,
200. Wuthrich,K. (1994) Nuclear magnetic resonance solution structure of the fushi tarazuhomeodomain from Drosophila and comparison with the Antennapedia homeodomain. J. Mol. Biol., 238, 333-345.
201. Qu,C.-X., Lai,L.-H., Xu,X.-J., and Tang,Y.-Q. (1993) Phyletic relationships of proteinstructures based on spatial preference of residues. J. Mol. Evol., 36, 67-78.
202. Rebar, E.J. and Pabo, C.O. (1994) Zinc finger phage: affinity selection of fingers withnew DNA-binding specificities. Science, 263, 671-673.
203. Rebar, E.J., Greisman, H.A., Pabo, C.O. (1996) Phage display methods for selecting zincfinger proteins with novel DNA-binding specificities. Methods Enzymol., 267, 129149.
204. Roberts RW, Ja WW. (1999) In vitro selection of nucleic acids and proteins: What are welearning? Curr Opin Struct Biol, 9,521 -529.
205. Saitou N, Nei M. (1987) The neighbor-joining method: a new method for reconstructingphylogenetic trees. Mol Biol Evol., 4,406-425.
206. Sander,C. and Schneider,R. (1991) Database of homology-derived protein structures andthe structural meaning of sequence alignment. Proteins, 9, 56-68.
207. Sander,C. and Schneider,R. (1993) The HSSP database of protein structure-sequencealignments. Nucleic Acids Res., 21, 3105-3109.
208. Sauer,R.T., Milla,M.E., Waldburger,C.D., Brown,B.M., Schildbach,J.F. (1996) Sequencedeterminants of folding and stability for the P22 Arc repressor dimer. FASEB J., 10, 42-48.
209. Scott,M.P. and Weiner,A.J. (1984) Structural relationships among genes that controldevelopment: sequence homology between Antennapedia, Ultrabithorax and fushi tarazu loci in Drozophila. Proc. Natl. Acad. Sci. USA, 81, 4115-4119.
210. Selkoe, D.J. (1996) Amyloid P-Protein and the Genetics of Alzheimer's Disease J. Biol.1. Chem. 271, 18295-18298.
211. Selvin,S. (1998) F distribution. In Armitage,P. and Colton,T. (eds.), Encyclopedia of
212. Biostatistics , vol 2., Chichester: John Wiley & Sons, 1469-1472.
213. Shakhnovich,E., Abkevich,V. and Ptitsyn,0. (1996) Conserved residues and themechanism of protein folding. Nature, 379, 96-98.
214. Shindyalov,I.N., Kolchanov,N.A. and Sander,C. (1994) Can three-dimensional contacts inprotein structures be predicted by analysis of correlated mutations? Prot. Eng., 7, 349358.
215. Shortle,D. (1996) The denaturated state (the other half of the folding equation) and its rolein protein stability. FASEB J., 10, 27-34.201
216. ShortleJD., Stites,W.E. and Meeker A.K. (1990) Contributions of the large hydrophobicamino acids to the stability of staphylococcal nuclease. Biochemistry, 29, 8033-8041.
217. Smith GP. (1985) Filamentous fusion phage: novel expression vectors that display clonedantigens on the virion surface. Science, 228,1315-1317.
218. Sneath P.H.A., Sokal R.R. Numerical Taxonomy. The principles and practice ofnumerical classification. San Francisco: W.H. Freeman and Co, 1973.
219. Sobolev, V., Sorokine, A., Prilusky, J., Abola, E.E., Edelman, M. (1999) Automatedanalysis of interatomic contacts in proteins. Bioinformatics, 15, 327-332.
220. Sonnhammer,E.L., Eddy,S.R„ Birney,E., Bateman,A. and Durbin,R. (1998) Pfam:multiple sequence alignments and HMM-profiles of protein domains, Nucleic Acids Res., 26, 320-322.
221. Sosnick,T.R. and Trewhella,J. (1992) Denaturated state of ribonuclease A have compactdimensions and residual secondary structure. Biochemistry, 31, 8329-8325.
222. Spolar,R.S and Record,M.T. (1994) Coupling of local folding to site-specific binding ofproteins to DNA. Science, 263, 777-784.
223. Tanford,C. (1968) Protein denaturation. Adv.Protein Chem. 23, 121-282.
224. Tanford,C. (1970) Protein denaturation. Part C. Theoretical models for proteindenaturation. Adv.Protein Chem. 24, 1-95.
225. Taylor, S.S., Knighton, D.R., Zheng, J., Ten Eyck, L.F., Sowadski, J.M. (1992) Structuralframework for the protein kinase family. Annu Rev Cell Biol., 8, 429-462.
226. Taylor, W.R. and Orengo, C.A. (1989) Protein structure alignment. J. Mol. Biol., 208,208.229.
227. Taylor,W.R. (1986) The classification of amino acid conservation. J. Theor. Biol., 119,205.218.
228. Taylor,W.R. and Hatrick,K. (1994) Compensating changes in protein multiple sequencealignment. Prot. Eng., 7, 341-348.
229. Telling, G.C., Scott, M., Mastrianni, J., Gabizon, R., Torchia, M., Cohen F.E.,
230. DeArmond, S.J. and Prusiner, S.B. (1995) Prion propagation in mice expressing human and chimeric PrP transgenes implicates the interaction of cellular PrP with another protein. Cell, 83, 79-90.
231. Thomas,D.J., Casari,G. and Sander,C. (1996) The prediction of protein contacts frommultiple sequence alignments. Protein Eng., 9, 941-948.
232. Thompson,J.D., Higgins,D.G. and Gibson,T.J. (1994) Clustal W: Improving thesensitivity of progressive multiple sequence alignment through sequence weighting,202position specific gap-penalties and weight matrix choice. Nucl. Acids Res., 22, 46734680.
233. Thompson,J.D., Higgins,D.G., and Gibson,T.J. (1994) Improved sensitivity of profilesearches through the use of sequence weights and gap excision. CABIOS, 10, 19-29.
234. Tomii, K. and Kanehisa, M. (1996) Analysis of amino acid indices and mutation matricesfor sequence comparison and structure prediction of proteins. Protein Eng., 9, 27-36.
235. Tourasse,N. and Gouy,M. (1997) Evolutionary distances between nucleotide sequencesbased on the distribution of substitution rates among sites as estimated by parsimony. Mol. Biol. Evol., 14, 287-298.
236. Uzzel,T. and Corbin,K.W. (1971) Fitting discrete probability distributions to evolutionaryevents. Science, 172, 1089-1096.
237. Valuev, Y.P., Afonnikov, D.A., Ponomarenko, M.P., Milanesi, L., Kolchanov, N.A.2002) ASPD (Artificially Selected Proteins/Peptides Database): a database of proteins and peptides evolved in vitro, Nucl. Acids Res., 30, 200-202.
238. Vernet,T., Tessier,D.C., Khouri,H.E. (1992) Correlation of co-ordinated amino acidchanges at the two-domain interface of cystein proteases with protein stability. J. Mol. Biol., 224, 501-509.
239. Vershon,A.K., Bowie,J.U., Karplus,T.M., Sauer,R.T. (1986) Isolation and analysis of arcrepressor mutants: evidence for an unusual mechanism of DNA binding. Proteins, 1, 302-311.
240. Vingron,M. and Argos,P. (1989) A fast and sensitive multiple sequence alignmentalgorithm. CABIOS, 5, 115-121.218. von Hippel, P.H., Berg, O.G. (1986) On the specificity of DNA-protein interactions. Proc
241. Natl Acad Sci USA., 83, 1608-1612.
242. Wako,H. and Blundell,T.A. (1994a) Use of amino acid environment-dependentsubstitution tables and conformation propensities in structure prediction from aligned sequences of homologous proteins. II. Secondary structures. J. Mol. Biol, 238, 693708.
243. Wang, Z-X. (1996) How many fold types of protein are there in nature? Proteins, 26, 186191.
244. Wetlaufer, D.B. (1973) Nucleation, rapid folding, and globular interchain regions inproteins. Proc. Natl. Acad. Sci. USA, 70, 697-701.
245. White A., Handler P., Smith E.L., Hill R.L., Lehman I.R. (1978) Principles of1. Biochemistry. 1978
246. White,A., Handler,P., Smith,E.L., Hill,R.L. and Lehman,I.R. (1978) Principles of
247. Biochemistry, vol. I., McGraw-Hill, Inc.
248. Wilkinson AJ, Fersht AR, Blow DM, Carter P, Winter G. (1984) A large increase inenzyme-substrate affinity by protein engineering. Nature, 307, 187-188.
249. Wingender,E. (1993) Gene Regulation in Eukaryotes. VCH Weinheim, New York, Basel,1. Cambridge.
250. Wingender,E. (1997) Classification of eukaryotic transcription factors. Mol Biol (Mosk),31,584-600.
251. Wolberger,C., Vershon,A., Liu,В., Johnson,A., Pabo,C. (1991) Crystal structure of a
252. MAToc2 homeodomain operator complex suggests a general model for homeodomain-DNA interaction. Cell, 67, 517-528.
253. Wolfe, S.A., Greisman, H.A., Ramm, E.I., Pabo, C.O. (1999) Analysis of zinc fingersoptimized via phage display: evaluation the utility of recognition code. J.Mol.Biol., 285,1917-1934.
254. Xu, Z., Horwich, A.L., Sigler, P.B. (1997) The crystal structure of the asymmetric GroEL
255. GroES (ADP)t chaperonin complex. Nature, 388, 741-750.
256. Yang,Z., Kumar,S. and Nei,M. (1995) A new method of inference of ancestral nucleotideand amino acid sequences. Genetics, 141, 1641-1650.
257. Yanofsky,C., Horn,V., Thorpe,D. (1964) Protein structure relationships revealed bymutation analysis. Science, 146,1593-1594.
258. Zhang, C-T. (1997) Relations of the numbers of protein sequences, families and folds.1. Prot. Eng., 10, 757-761.
259. Zheng, J., Knighton, D.R., Xuong, N.H., Taylor, S.S., Sowadski, J.M., Ten Eyck, L.F.1993) Crystal structures of the myristylated catalytic subunit of cAMP-dependent protein kinase reveal open and closed conformations. Protein Sci., 2,1559-1573.
260. Zukerkandl,E. and Pauling,L. (1965) in Evolving Genes and Proteins, eds. Bryson,V. and
261. Vogel,H.J. Academic, NY, pp. 97-166.
-
Похожие работы
- Банки данных и алгоритмы выравнивания и классификации нуклеотидных и аминокислотных последовательностей
- Применение метода информационного разложения символьных последовательностей для изучения генетических текстов
- Компьютерный анализ вторичной структуры глобулярных белков
- Массовый поиск аттенюаторной регуляции в геномах протеобактерий
- Компьютерный анализ пространственной структуры бета-структурных доменов глобулярных белков
-
- Системный анализ, управление и обработка информации (по отраслям)
- Теория систем, теория автоматического регулирования и управления, системный анализ
- Элементы и устройства вычислительной техники и систем управления
- Автоматизация и управление технологическими процессами и производствами (по отраслям)
- Автоматизация технологических процессов и производств (в том числе по отраслям)
- Управление в биологических и медицинских системах (включая применения вычислительной техники)
- Управление в социальных и экономических системах
- Математическое и программное обеспечение вычислительных машин, комплексов и компьютерных сетей
- Системы автоматизации проектирования (по отраслям)
- Телекоммуникационные системы и компьютерные сети
- Системы обработки информации и управления
- Вычислительные машины и системы
- Применение вычислительной техники, математического моделирования и математических методов в научных исследованиях (по отраслям наук)
- Теоретические основы информатики
- Математическое моделирование, численные методы и комплексы программ
- Методы и системы защиты информации, информационная безопасность