Équilibre entre sélection et polymorphismes trans-spécifiques

Guo et ses collègues ont comparé la variation du génome entier des deux espèces pour identifier les PST. En raison du grand nombre de gènes comparés, ils ont utilisé une série d’étapes de filtrage rigoureuses pour réduire les faux positifs. (De tels faux positifs, dans lesquels les PST ont été générés par d’autres processus évolutifs plutôt que par la sélection équilibrante, induiraient en erreur notre compréhension de l’étendue et de l’importance de la sélection équilibrante dans l’évolution du génome). Pour éviter d’interpréter à tort la variation entre les copies de gènes (paralogues) comme des polymorphismes à un seul locus, ils se sont concentrés sur 16 014 paires de gènes conservés, orthologues et à copie unique, qui contenaient 1,1 et 0,45 million de SNP bi-alléliques chez A. thaliana et C. rubella, respectivement. Parmi ces sites polymorphes, 8535 SNP présentaient des paires de SNP partagés (shSNP) entre les espèces. Comme les alignements dans les régions codantes sont plus fiables que ceux dans les séquences non codantes, les auteurs n’ont retenu qu’environ un tiers des shSNP de haute qualité trouvés dans les régions codantes, affectant 433 gènes.

Ces shSNP pourraient refléter des processus évolutifs neutres, tels qu’un tri incomplet des lignées des polymorphismes ancestraux, ou une mutation récurrente au lieu d’une sélection équilibrante. Pour comprendre le potentiel des facteurs neutres pour maintenir les polymorphismes partagés, Guo et ses collègues ont déduit l’histoire démographique d’A. thaliana et de C. rubella en utilisant des simulations coalescentes. Des réductions historiques de la taille des populations (goulots d’étranglement) ont été détectées chez les deux espèces après la divergence de leur ancêtre commun. En outre, ces analyses indiquent que des flux génétiques anciens ont eu lieu entre les ancêtres de ces deux espèces. Sur la base de la théorie de la coalescence neutre et des paramètres démographiques estimés, la probabilité d’un tri incomplet des lignées (c’est-à-dire que deux allèles d’A. thaliana et de C. rubella n’aient pas coalescé dans l’intervalle depuis la spéciation) est de l’ordre de 10-9. Cela implique que < 1 shSNP serait conservé dans les régions génomiques alignées sous l’effet de la dérive génétique seule. Cette probabilité estimée s’applique toujours avec l’autofécondation et la structure de la population au sein des espèces, et il est peu probable qu’elle soit influencée par le flux génétique ancestral. Par conséquent, l’existence des shSNP ne peut pas être expliquée par la dérive génétique seule, et ils sont probablement maintenus par une sélection équilibrante.

En cas de neutralité, les haplotypes portant le polymorphisme ancestral peuvent être fragmentés à la suite d’une recombinaison, et il est difficile d’identifier les allèles non recombinants pour les espèces qui ont divergé il y a longtemps. En revanche, la sélection équilibrée peut supprimer la recombinaison autour de sites sélectionnés, et de courts segments ancestraux qui abritent de multiples variantes liées peuvent persister jusqu’à ce que toutes les lignées se rejoignent dans leur ancêtre commun. Dans ce contexte, les anciens polymorphismes équilibrés peuvent être regroupés par type allélique plutôt que par espèce (Fig. 1a et b), ce qui indique une sélection équilibrante. Sur la base d’un taux de recombinaison de 3,6 cM/Mb pour A. thaliana et C. rubella, Guo et ses collègues estiment que les anciens segments à évolution neutre ne seraient longs que de quelques paires de bases. Par conséquent, ils ont balayé des fenêtres coulissantes de 100 pb sur les 433 gènes candidats identifiés pour trouver des régions de séquence qui sont regroupées par allèles plutôt que par espèces (Fig. 1b). Pour réduire le risque de faux positifs, un certain nombre d’étapes de filtrage ont été appliquées.

Fig. 1
figure1

Origin and identification of trans-specific polymorphisms at a single-copy locus. a Time runs from top to bottom, and variation within a species is enclosed by flanking black lines. Avant le début de la spéciation, deux allèles ségrègent au sein de l’espèce ancestrale (lignes violettes), et chaque copie donne naissance à une paire d’allèles descendants (deux bleus ou deux rouges). Au fur et à mesure de la spéciation, ces allèles descendants sont hérités dans les espèces filles, et finalement un polymorphisme allélique moderne existe entre les individus. (Comme c’est le cas dans les analyses de coalescence, seules les lignées représentées dans notre échantillon moderne sont représentées). b Phylogénie des allèles montrant les relations entre les allèles modernes séquencés d’un gène à copie unique. Dans le clade bleu, les allèles d’Arabidopsis thaliana sont plus étroitement liés aux allèles bleus de Capsella rubella qu’aux allèles rouges d’A. thaliana en raison du polymorphisme trans-spécifique. Figure adaptée de Wu et al.

Guo et ses collègues ont ensuite identifié les haplotypes de cinq gènes en tant que PST candidats sous sélection équilibrée à long terme. Ces cinq gènes sont en copie unique chez les deux espèces, et des études de simulation ont confirmé que ce schéma serait très improbable dans le cadre d’une évolution neutre, ce qui suggère que ces cinq PST sont maintenus par une sélection équilibrante. La sélection équilibrante a également été soutenue par une diversité nucléotidique élevée et un polymorphisme de fréquence intermédiaire dans ces régions, comme prévu pour les anciens polymorphismes équilibrés. Les cinq gènes candidats sont associés à différents processus biologiques et biochimiques, y compris la réponse au stress biotique et abiotique.

Enfin, Guo et ses collègues ont examiné les rôles de ces cinq gènes candidats dans l’adaptation à des habitats divergents. Ils se sont concentrés sur A. thaliana en raison des nombreuses informations sur la variation génétique, géographique et écologique de cette espèce. Pour éviter toute confusion avec la divergence génétique historique, ils ont considéré quatre gènes indépendants de l’histoire de la population et corrélés à la divergence écologique, suggérant une adaptation locale. La modélisation de la niche environnementale a confirmé que deux groupes alléliques des quatre gènes occupaient des niches significativement différentes, et les analyses d’expression ont détecté des niveaux d’expression différents entre les groupes d’haplotype dans l’un des quatre gènes. Pris ensemble, ces résultats indiquent que les gènes soumis à une sélection équilibrée peuvent avoir contribué à l’adaptation chez A. thaliana.