Mining EST databases to resolve evolutionary events in major crop species

Jessica A Schlueter, Phillip Dixon, Cheryl Granger, David Grant, Lynn Clark, Jeff J Doyle, Randy C Shoemaker
2004 Genome  
Using plant EST collections, we obtained 1392 potential gene duplicates across 8 plant species: Zea mays, Oryza sativa, Sorghum bicolor, Hordeum vulgare, Solanum tuberosum, Lycopersicon esculentum, Medicago truncatula, and Glycine max. We estimated the synonymous and nonsynonymous distances between each gene pair and identified two to three mixtures of normal distributions corresponding to one to three rounds of genome duplication in each species. Within the Poaceae, we found a conserved
more » ... a conserved duplication event among all four species that occurred approximately 50-60 million years ago (Mya); an event that probably occurred before the major radiation of the grasses. In the Solanaceae, we found evidence for a conserved duplication event approximately 50-52 Mya. A duplication in soybean occurred approximately 44 Mya and a duplication in Medicago about 58 Mya. Comparing synonymous and nonsynonymous distances allowed us to determine that most duplicate gene pairs are under purifying, negative selection. We calculated Pearson's correlation coefficients to provide us with a measure of how gene expression patterns have changed between duplicate pairs, and compared this across evolutionary distances. This analysis showed that some duplicates seemed to retain expression patterns between pairs, whereas others showed uncorrelated expression. Résumé : En examinant les banques d'EST pour des espèces végétales, les auteurs ont identifié 1392 gènes potentiellement dupliqués au sein de 8 espèces : Zea mays, Oryza sativa, Sorghum bicolor, Hordeum vulgare, Solanum tuberosum, Lycopersicon esculentum, Medicago truncatula et Glycine max. Les auteurs ont estimé les distances synonymes et nonsynonymes entre chaque paire et ils ont identifié deux à trois mélanges de distributions normales, celles-ci correspondant à une à trois rondes de duplication au sein de chaque espèce. Au sein des graminées, les auteurs ont identifié un événement de duplication conservé chez les quatre espèces et qui se serait produit il y a environ 50-60 millions d'années. Cet événement aurait vraisemblablement eu lieu avant la principale diversification des graminées. Chez les solanacées, des évidences d'une duplication conservée s'étant produite il y a environ 50-52 millions d'années ont été trouvées. Chez le soja, une duplication se serait produite il y a environ 44 millions d'années et, chez Medicago il y a environ 58 millions d'années. La comparaison des distances synonymes et non-synonymes a permis de déterminer que la plupart des duplications géniques subissaient une sélection négative purificatrice. Les coefficients de corrélation de Pearson ont été calculés afin de mesurer comment l'expression génique a changé entre membres d'une paire et au cours de l'évolution. Cette analyse a révélé que, pour certaines duplications, les niveaux d'expression génique semblent avoir été conservés alors que chez d'autres l'expression n'est plus corrélée. Mots clés : évolution du génome, polyploïdie, duplication du génome, étiquette de gène exprimé. [Traduit par la Rédaction] Schlueter et al. 876
doi:10.1139/g04-047 pmid:15499401 fatcat:7cfixky2hfbshpwrpmyhct3mty