DNATagger, colors for codons

N.M. Scherer, D.M. Basso
2008 Genetics and Molecular Research  
Danksagung An dieser Stelle möchte ich all jenen danken, die durch ihre fachliche und persönliche Unterstützung zum Gelingen dieser Arbeit beigetragen haben. Ich bedanke mich bei Prof. Arndt von Haeseler, der mich herzlich in seiner Arbeitsgruppe aufgenommen hat, und mir die Gelegenheit gegeben hat, mein Promotionsvorhaben in Deutschland zu realisieren. Darüber hinaus danke ich Prof. Martin Lercher für die Bereitschaft die Begutachtung zuübernehmen, und Prof. William Martin für die
more » ... ernahme des Korreferats. Für die freundliche Hilfe und das Verständnis möchte ich mich ganz herzlich bei Claudia Kiometzis, Anja Walge und Angelika Simons bedanken, ohne die ich alle amtlichen Anforderungen nichtüberstanden hätte. Mein ganz besonderer Dank gilt an die Bioinformatiker für die gemütliche Stimmung und lustige "procrastination" in den richtigen und falschen Momenten. Jutta, Mireille (gehört auch dazu) und Jule! Dieser Dank geht ebenfalls an die neuen Bioinformatiker der Gruppe Sabine und Gabriel, die mich aus der Ferne unterstützt haben. Insbesondere danke ich Anja und Eike, und auch der Familie Dentz, die mich immer wieder in Ihrem Trautem Heim willkommen heißen. Vor allem danke ich allen meinen Freunden in Deutschland für die wunderschöne Zeit zusammen. Volleyballer, UniChor, Bioinformatiker und Co, und alle die dazu gekommen sind. Ihr habt meine vier Jahre in Düsseldorf viel angenehmer gemacht. Ich vermisse Euch! iii Agradecimentos Esta teseé dedicada a minha imensa família, com todos seus ramos e folhas, seus frutos e seus anexos, todas as pessoas que eu amo, que são muitas! O espaço desta página não será suficiente para citar cada nome em particular. Essa imensa família tem muitos nomes: Miranda, Scherer, Klassmann, Daudt, e anexa também os laços que vão além do sangue e da lei: entre tantas outras. Acima de tudo, agradeço aos meus pais o investimento financeiro e emocional na minha formação acadêmica e humana, a melhor irmã do mundo e, principalmente, o amor mais puro e sincero que pode existir. Além da família, há aquelas pessoas que no decorrer dessa caminhada contribuíram de diferentes formas. Agradeço aos professores Loreta, Sandro e Salzano, que me apresentaramàs PRs há dez anos, quando tudo começou. Agradeçoàs professoras Maria Luiza Campos e Ana Lucia Bazzan, que abriram as portas de seus laboratórios para mim e ofereceram a oportunidade de lecionar em suas disciplinas de bioinformática. Ao Daniel, meu colaborador preferido, agradeço a criatividade e parceria na criação do DNATagger. Agradeçoà Deya eà Rosvi as "terapias de grupo para doutorandas na Alemanha" e os exemplos de persistência. Agradeço ao meu melhor amigo, Nelson, os sábios conselhos e carinhosos xingamentos.À Karen agradeço o puxão de orelha no final da tese. Ao pessoal da Fiocruz, do NCE e aos biofísicos do IBCCF, o acolhimento e o companheirismo, mesmo que em encontros tão esporádicos.À mulherada (e aos meninos) do Verdinho, os deliciosos momentos de procrastinação e as aulas de cultivo de cáctus. E a todos os amigos que compartilharam dos meus anseios e minhas descobertas, agradeço a inspiração, as palavras de carinho e a torcida organizada. iv Não menos importanteé o meu agradecimento ao governo brasileiro, que, através da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), financiou a maior parte deste trabalho. Agradeço enormemente ao meu tio Bob a dedicada correção desta tese. Aprendi, nesses meses de intensa troca de e-mails, muito mais do que qualquer curso de inglês poderia me ensinar. Nossas discussões sobre o uso adequado de termos e expressões foram enriquecedoras. Foram incontáveis mensagens recheadas de carinho, com a paciência que só um padrinho pode ter com sua afilhada cheia de questionamentos. Mais uma vez, thank you very much!!!! Este trabalho nunca teria encontrado um fim se não fosse a persistência de três pessoas especiais: minha Alma-Gêmea, meu Anjo da Guarda, e o meu melhor Marido.À eles agradeço o apoio incondicional, a presença constante (mesmo que por telefone e internet), os puxões de orelha, as palavras de consolo, a torcida, as lágrimas, as risadas, os abraços, o carinho, a paciência, o companheirismo e o amor. Obrigada Rosvita, Mainá e Diego! v Abstract Pathogenesis-related proteins (PR) are expressed by plants in response to pathogenic attack, conferring enhanced resistance to subsequent infection. Seventeen protein families have already been associated with this class. They include enzymes like glycoside-hydrolases (glucanases and chitinases), oxidoreductases (peroxidases, oxalate oxidases and superoxide dismutase), proteinases and proteinase inhibitors, antimicrobial peptides (defensins, thionins and lipid-transfer proteins) and other proteins with unknown function. Most of these families are multigene families, presenting from just a few to more than a hundred copies in one single genome. In some families, only a few genes have been demonstrated to be pathogenesis-related. The main objective of this thesis was to investigate and characterize all PR-families from an evolutionary point of view, using the genetic data available in public databases, to gain insights into the question of how a protein becomes "pathogenesis-related". At the core of this project stands the configuration of a methodological framework for bioinformatic analysis that is adequate for the specific characteristics of these datasets, giving preference to free and open source software. The first goal was to assemble a representative dataset for each PR-family, and further employ it to characterize other members of these families and to search the databases for homologous sequences. To achieve this, a set of bioinformatic resources was employed sequentially, while the intermediate datasets were constantly evaluated. In the next step, the curated datasets were used to estimate the phylogeny of each family, and subsequently to infer the strength of natural selection acting on these proteins. As a result, amino acid sites predicted to be under positive selection were identified in five PR-families. The present thesis also explores and discusses the diversity of plant chitinases and chitin-binding proteins, since they belong to four distinct PR-families, namely PR-3, PR-4, PR-8 and PR-11. In this survey, the classifications of different chitinase classes are revisited and phylogenetic analysis is employed to clarify the evolutionary relationship between family members. vi Zusammenfassung An der Pathogenese beteiligte Proteine (PR) werden von Pflanzen als Abwehrreaktion gegen angreifende Pathogene exprimiert und verleihen der Pflanze darüber hinaus bei späteren Infektionen eine erhöhte Resistenz. Siebzehn Proteinfamilien werden bereits mit dieser Klasse von Proteinen assoziiert. Dazu gehören Enzyme wie Glycosid-Hydrolasen (Glucanasen und Chitinasen), Oxidoreduktasen (Peroxidasen, Oxalatoxidasen und Superoxiddismutasen), Proteinasen, Proteinase-Inhibitoren, antimikrobiellen Peptide (Defensine, Thionine und Lipid-Transfer-Proteine) und andere Proteine mit unbekannter Funktion. Die meisten PRs gehören zu Multigenfamilien, die in einigen wenigen bis zu mehreren hundert verschiedenen Varianten in einem einzigen Genom vorhanden sein können. In manchen Familien, wurden nur wenige Gene als an der Pathogenese beteiligt identifiziert. Das Hauptziel dieser Arbeit ist, alle PR-Familien von einem evolutivem Standpunkt aus zu untersuchen und zu charakterisieren. Die verfügbaren genetischen Daten aus offentlichen Datenbanken sollen Anhaltspunkte liefern, wie ein Protein zu einem an der Pathogenese beteiligtem Protein wird. Im Mittelpunkt dieses Projektes steht die Konfiguration eines, auf die spezifischen Eigenschaften der Daten angepassten, methodischen Arbeitsablaufs für die bioinformatischen Analysen, wobei Freie und Open Source Software bevorzugt wird. Der erste Aspekt der Arbeit ist die Erstellung eines repräsentativen Datensatzes für jede PR-Familie. Das Verfahren wird zur Charakterisierung anderer Mitglieder dieser Familien verwendet. Weiterhin werden die Datenbanken nach homologen Sequenzen durchsucht. Zu diesem Zweck wird eine Reihe von aufeinander aufbauenden bioinformatischen Methoden eingesetzt und Teilergebnisse kontinuierlich evaluiert. Im nächsten Schritt werden ausgewählte Datensätze verwendet, um die Phylogenie jeder Familie abzuleiten und anschließend die Einwirkung der natürlichen Selektion auf diese Proteine zu untersuchen. Als Ergebnis wurden fünf PR-Familien mit positiver Selektion identifiziert. Die vorliegende Arbeit untersucht und diskutiert im weiteren die Vielfalt der pflanzlichen Chitinasen und Chitin-bindenden Proteine, da diese zu vier verschiedenen PR-Familien, nämlich PR-3, PR-4, PR-8 und PR-11, gehören. In dieser Arbeit wurde die Einteilung der verschiedenen Klassen von Chitinasenüberprüft. Phylogenetische Analysen wurde eingesetzt, um die evolutionären Beziehungen zwischen den Familienmitgliedern zu ermitteln. vii Patterns of molecular evolution in pathogenesis-related proteins. Genet. Mol. Biol., 28(4):645-653.
doi:10.4238/vol7-3x-meeting003 fatcat:3erb3dubpjgzjnogoyjctwsla4