Ausgleichende Selektion und trans-spezifische Polymorphismen

Guo und Kollegen verglichen die Gesamtgenomvariation der beiden Arten, um TSPs zu identifizieren. Aufgrund der großen Anzahl der verglichenen Gene verwendeten sie eine Reihe strenger Filterschritte, um falsch-positive Ergebnisse zu reduzieren. (Solche falsch positiven Ergebnisse, bei denen TSPs durch andere evolutionäre Prozesse und nicht durch ausgleichende Selektion entstanden sind, würden unser Verständnis des Ausmaßes und der Bedeutung der ausgleichenden Selektion in der Genomevolution verfälschen). Um zu vermeiden, dass Variationen zwischen Genkopien (Paraloge) als Polymorphismen an einem einzigen Locus fehlinterpretiert werden, konzentrierten sich die Forscher auf 16.014 konservierte, orthologe Genpaare mit nur einer Kopie, die 1,1 bzw. 0,45 Millionen bi-allelische SNPs in A. thaliana und C. rubella enthielten. Unter diesen polymorphen Stellen wiesen 8535 SNPs gemeinsame SNP-Paare (shSNP) zwischen den Arten auf. Da Alignments in kodierenden Regionen zuverlässiger sind als solche in nicht-kodierenden Sequenzen, behielten die Autoren nur etwa ein Drittel der hochwertigen shSNPs bei, die in kodierenden Regionen gefunden wurden und 433 Gene betrafen.

Diese shSNPs könnten neutrale evolutionäre Prozesse widerspiegeln, wie z. B. eine unvollständige Sortierung von Polymorphismen der Vorfahren oder wiederkehrende Mutationen anstelle einer ausgleichenden Selektion. Um das Potenzial neutraler Faktoren für die Aufrechterhaltung gemeinsamer Polymorphismen zu verstehen, leiteten Guo und Kollegen die demografische Geschichte von A. thaliana und C. rubella mithilfe von Koaleszenzsimulationen ab. Bei beiden Arten wurden nach der Divergenz von ihrem gemeinsamen Vorfahren historische Verkleinerungen der Populationen (Flaschenhälse) festgestellt. Darüber hinaus deuten diese Analysen darauf hin, dass zwischen den Vorfahren dieser beiden Arten ein alter Genfluss stattgefunden hat. Auf der Grundlage der neutralen Koaleszenztheorie und der geschätzten demografischen Parameter liegt die Wahrscheinlichkeit einer unvollständigen Sortierung der Abstammungslinien (d. h., dass zwei Allele von A. thaliana und C. rubella im Zeitraum seit der Speziation nicht zusammengewachsen sind) in der Größenordnung von 10-9. Dies bedeutet, dass < 1 shSNP in den angeglichenen genomischen Regionen allein durch genetische Drift erhalten bleiben würde. Diese geschätzte Wahrscheinlichkeit gilt auch bei Selbstbefruchtung und Populationsstruktur innerhalb der Arten und wird wahrscheinlich nicht durch den Genfluss der Vorfahren beeinflusst. Daher kann die Existenz von shSNPs nicht allein durch genetische Drift erklärt werden, und sie werden wahrscheinlich durch ausgleichende Selektion aufrechterhalten.

Unter Neutralität können Haplotypen, die den angestammten Polymorphismus tragen, als Ergebnis von Rekombination aufgebrochen werden, und es ist schwierig, nicht rekombinante Allele für Arten zu identifizieren, die sich vor langer Zeit auseinanderentwickelt haben. Im Gegensatz dazu kann eine ausgleichende Selektion die Rekombination an ausgewählten Stellen unterdrücken, und kurze Vorgängersegmente, die mehrere verknüpfte Varianten beherbergen, können bestehen bleiben, bis alle Linien zu ihrem gemeinsamen Vorfahren zusammenwachsen. In diesem Zusammenhang können alte ausgeglichene Polymorphismen eher nach Allel-Typ als nach Spezies geclustert sein (Abb. 1a und b), was auf eine ausgleichende Selektion hinweist. Ausgehend von einer Rekombinationsrate von 3,6 cM/Mb für A. thaliana und C. rubella schätzen Guo und Kollegen, dass alte, sich neutral entwickelnde Segmente nur einige Basenpaare lang sein würden. Daher scannten sie gleitende 100-Bp-Fenster über die 433 identifizierten Kandidatengene, um Sequenzregionen zu finden, die nach Allelen und nicht nach Arten geclustert sind (Abb. 1b). Um die Wahrscheinlichkeit falsch positiver Ergebnisse zu verringern, wurde eine Reihe von Filterschritten angewandt.

Abb. 1
Abb. 1

Herkunft und Identifizierung von trans-spezifischen Polymorphismen an einem Single-Copy-Locus. a Die Zeit läuft von oben nach unten, und die Variation innerhalb einer Art wird durch flankierende schwarze Linien eingeschlossen. Vor dem Beginn der Speziation segregieren zwei Allele innerhalb der angestammten Art (violette Linien), und jede Kopie führt zu einem Paar von Nachkommenallelen (zwei blaue oder zwei rote). Im weiteren Verlauf der Speziation werden diese Nachkommen-Allele an die Tochterarten vererbt, so dass schließlich ein moderner allelischer Polymorphismus zwischen den Individuen besteht. (Wie bei Koaleszenz-Analysen üblich, werden nur Linien gezeigt, die in unserer modernen Stichprobe vertreten sind.) b Eine Allel-Phylogenie, die die Beziehungen der modernen, sequenzierten Allele an einem Single-Copy-Gen zeigt. In der blauen Klade sind die Allele von Arabidopsis thaliana aufgrund von trans-spezifischem Polymorphismus enger mit den blauen Allelen von Capsella rubella verwandt als mit den roten Allelen von A. thaliana. Abbildung angepasst von Wu et al.

Guo und Kollegen identifizierten dann Haplotypen von fünf Genen als TSP-Kandidaten unter langfristiger ausgleichender Selektion. Diese fünf Gene liegen bei beiden Arten nur in einer Kopie vor, und Simulationsstudien bestätigten, dass dieses Muster bei neutraler Evolution sehr unwahrscheinlich wäre, was darauf hindeutet, dass diese fünf TSPs durch ausgleichende Selektion erhalten werden. Die ausgleichende Selektion wurde auch durch die hohe Nukleotiddiversität und den Polymorphismus mit mittlerer Frequenz in diesen Regionen unterstützt, wie es für alte ausgleichende Polymorphismen erwartet wird. Die fünf Kandidatengene werden mit verschiedenen biologischen und biochemischen Prozessen in Verbindung gebracht, einschließlich der Reaktion auf biotischen und abiotischen Stress.

Schließlich untersuchten Guo und Kollegen die Rolle dieser fünf Kandidatengene bei der Anpassung an unterschiedliche Lebensräume. Sie konzentrierten sich dabei auf A. thaliana, da sie umfangreiche Informationen über die genetische, geografische und ökologische Variation dieser Art haben. Um eine Verwechslung mit historischer genetischer Divergenz zu vermeiden, berücksichtigten sie vier Gene, die unabhängig von der Populationsgeschichte sind und mit ökologischer Divergenz korrelieren, was auf eine lokale Anpassung schließen lässt. Die Modellierung von Umweltnischen bestätigte, dass zwei Allelgruppen der vier Gene signifikant unterschiedliche Nischen besetzen, und Expressionsanalysen ergaben unterschiedliche Expressionsniveaus zwischen den Haplotypengruppen in einem der vier Gene. Zusammengenommen deuten diese Ergebnisse darauf hin, dass Gene, die einer ausgleichenden Selektion unterliegen, zur Anpassung in A. thaliana beigetragen haben könnten.