Comparative genomic analysis of sequences sampled from a small region on soybean (Glycine max) molecular linkage group G

Dawn Foster-Hartnett, Joann Mudge, Dana Larsen, Dariush Danesh, Huihuang Yan, Roxanne Denny, Silvia Peñuela, Nevin D Young
2002 Genome  
Eight DNA markers spanning an interval of approximately 10 centimorgans (cM) on soybean (Glycine max) molecular linkage group G (MLG-G) were used to identify bacterial artificial chromosome (BAC) clones. Twenty-eight BAC clones in eight distinct contiguous groups (contigs) were isolated from this genome region, along with 59 BAC clones on 17 contigs homoeologous to those on MLG-G. BAC clones in four of the MLG-G contigs were also digested to produce subclones and detailed physical maps. All of
more » ... he BAC-ends were sequenced, as were the subclones, to estimate proportions in different sequence categories, compare similarities among homoeologs, and explore microsynteny with Arabidopsis. Homoeologous BAC contigs were enriched in repetitive sequences compared with those on MLG-G or the soybean genome as a whole. Fingerprint and cross-hybridization comparisons between MLG-G and homoeologous contigs revealed cases of highly similar physical organization between soybean duplicates, as did DNA sequence comparisons. Twenty-seven out of 78 total sequences on soybean MLG-G showed significant similarity to Arabidopsis. The homologs mapped to six compact genome segments in Arabidopsis, with the longest containing seven homologs spanning two million base pairs. These results extend previous observations of large-scale duplication and selective gene loss in Arabidopsis, suggesting that networks of conserved synteny between Arabidopsis and other angiosperm families can stretch over long physical distances. Résumé : Huit marqueurs moléculaires délimitant un intervalle génétique d'environ 10 centimorgans (cM) sur le groupe de liaison G (MLG-G) du soja ont été employés afin d'identifier des clones BAC (« bacterial artificial chromosome »). Vingt-huit clones BAC provenant de cette région ont été isolés et formaient huit contigs différents. De plus, 59 clones BAC provenant de régions homéologues à cet intervalle du MLG-G ont été obtenus et formaient 17 contigs. Des clones provenant de quatre des contigs du MLG-G ont été digérés pour produire des sous-clones et des cartes physiques détaillées. Toutes les extrémités des clones BAC ont été séquencées, de même que les sous-clones, afin d'estimer les proportions de différents types de séquences, de mesurer la similarité entre régions homéologues et d'explorer la microsynténie avec Arabidopsis. Les contigs BAC homoéologues étaient plus riches en séquences répétitives que les régions correspondantes du MLG-G et le génome du soja dans son ensemble. L'analyse des empreintes génétiques et des hybridations croisées entre le MLG-G et les contigs homéologues ont mis en évidence des régions dupliquées dont l'organisation physique et la séquence étaient très semblables. Vingt-sept des 78 séquences du MLG-G du soja ont montré une similarité significative avec le génome d'Arabidopsis. Les homologies étaient localisées au sein de six segments génomiques compacts chez Arabidopsis, le plus grand s'étendant sur deux millions de paires de bases et comptant sept homologues. Ces résultats s'ajoutent à d'autres observations suggérant une duplication importante chez Arabidopsis suivie de délétions géniques sélectives. Cela suggère que des réseaux de synténie conservée entre Arabidopsis et d'autres familles d'angiospermes peuvent exister sur des grandes distances phylogénétiques.
doi:10.1139/g02-027 pmid:12175066 fatcat:4i5zqcb2kvgybdcu2m56xxdv4m