Bilanciare la selezione e i polimorfismi trans-specifici

Guo e colleghi hanno confrontato la variazione dell’intero genoma delle due specie per identificare i TSP. A causa del gran numero di geni confrontati, hanno usato una serie di passaggi di filtraggio rigorosi per ridurre i falsi positivi. (Tali falsi positivi, in cui i TSP sono stati generati da altri processi evolutivi piuttosto che dalla selezione di bilanciamento, avrebbero fuorviato la nostra comprensione della portata e dell’importanza della selezione di bilanciamento nell’evoluzione del genoma). Per evitare di interpretare erroneamente la variazione tra le copie del gene (paralogs) come polimorfismi in un singolo locus, si sono concentrati su 16.014 coppie di geni conservati, ortologhi, a copia singola, che contenevano 1,1 e 0,45 milioni di SNPs bi-allelici in A. thaliana e C. rubella, rispettivamente. Tra questi siti polimorfici, 8535 SNPs hanno mostrato coppie di SNPs condivisi (shSNP) tra le specie. Poiché gli allineamenti nelle regioni codificanti sono più affidabili di quelli nelle sequenze non codificanti, gli autori hanno mantenuto solo circa un terzo degli shSNP di alta qualità trovati nelle regioni codificanti, interessando 433 geni.

Questi shSNP potrebbero riflettere processi evolutivi neutri, come l’ordinamento incompleto del lignaggio dei polimorfismi ancestrali, o mutazioni ricorrenti invece della selezione equilibrante. Per capire il potenziale di fattori neutri per mantenere polimorfismi condivisi, Guo e colleghi hanno dedotto la storia demografica di A. thaliana e C. rubella usando simulazioni di coalescenza. Riduzioni storiche delle dimensioni della popolazione (colli di bottiglia) sono state rilevate in entrambe le specie dopo la divergenza dal loro antenato comune. Inoltre, queste analisi indicano che un antico flusso genico si è verificato tra gli antenati di queste due specie. Sulla base della teoria della coalescenza neutra e dei parametri demografici stimati, la probabilità di un ordinamento incompleto del lignaggio (cioè, che due alleli di A. thaliana e C. rubella non si siano coalizzati nell’intervallo dalla speciazione) è dell’ordine di 10-9. Ciò implica che < 1 shSNP verrebbe mantenuto nelle regioni genomiche allineate sotto la sola deriva genetica. Questa probabilità stimata si applica ancora con il selfing e la struttura della popolazione all’interno delle specie, ed è improbabile che sia influenzata dal flusso genico ancestrale. Pertanto, l’esistenza degli shSNP non può essere spiegata solo dalla deriva genetica, e sono probabilmente mantenuti dalla selezione di bilanciamento.

In condizioni di neutralità, gli aplotipi che portano il polimorfismo ancestrale possono essere frammentati come risultato della ricombinazione, ed è difficile identificare gli alleli non ricombinanti per le specie che si sono differenziate molto tempo fa. Al contrario, la selezione bilanciata può sopprimere la ricombinazione intorno ai siti selezionati, e brevi segmenti ancestrali che ospitano più varianti collegate potrebbero persistere fino a quando tutti i lignaggi si fondono al loro antenato comune. In questo contesto, gli antichi polimorfismi bilanciati possono essere raggruppati per tipo allelico piuttosto che per specie (Fig. 1a e b), un’indicazione della selezione equilibrante. Sulla base di un tasso di ricombinazione di 3,6 cM/Mb per A. thaliana e C. rubella, Guo e colleghi stimano che i vecchi segmenti in evoluzione neutrale sarebbero solo diverse coppie di basi di lunghezza. Pertanto, hanno scansionato finestre scorrevoli di 100 bp attraverso i 433 geni candidati identificati per trovare regioni di sequenza che sono raggruppate per alleli piuttosto che per specie (Fig. 1b). Per ridurre la possibilità di falsi positivi, sono stati applicati diversi passaggi di filtraggio.

Fig. 1
figura1

Origine e identificazione di polimorfismi trans-specifici in un locus a copia singola. a Il tempo scorre dall’alto verso il basso, e la variazione all’interno di una specie è racchiusa dalle linee nere laterali. Prima dell’inizio della speciazione, due alleli segregano all’interno della specie ancestrale (linee viola), e ogni copia dà origine a una coppia di alleli discendenti (due blu o due rossi). Man mano che la speciazione procede, questi alleli discendenti vengono ereditati nelle specie figlie, e alla fine il polimorfismo allelico moderno esiste tra gli individui. (Come è tipico nelle analisi coalescenti, sono mostrati solo i lignaggi che sono rappresentati nel nostro campione moderno). b Una filogenesi allelica che mostra le relazioni degli alleli moderni, sequenziati a un gene a copia singola. Nel clade blu, gli alleli di Arabidopsis thaliana sono più strettamente correlati agli alleli blu di Capsella rubella che agli alleli rossi di A. thaliana a causa del polimorfismo trans-specifico. Figura adattata da Wu et al.

Guo e colleghi hanno poi identificato gli aplotipi di cinque geni come candidati TSP sotto selezione equilibrante a lungo termine. Questi cinque geni sono a copia singola in entrambe le specie, e gli studi di simulazione hanno confermato che questo modello sarebbe molto improbabile sotto evoluzione neutrale, suggerendo che questi cinque TSP sono mantenuti dalla selezione di bilanciamento. La selezione bilanciata è stata anche supportata da un’alta diversità nucleotidica e da un polimorfismo di frequenza intermedia in queste regioni, come ci si aspetta per antichi polimorfismi bilanciati. I cinque geni candidati sono associati a diversi processi biologici e biochimici, compresa la risposta allo stress biotico e abiotico.

Infine, Guo e colleghi hanno esaminato i ruoli di questi cinque geni candidati nell’adattamento agli habitat divergenti. Si sono concentrati su A. thaliana a causa delle ampie informazioni sulla variazione genetica, geografica ed ecologica di questa specie. Per evitare confusioni con la divergenza genetica storica, hanno considerato quattro geni che erano indipendenti dalla storia della popolazione e che correlavano con la divergenza ecologica, suggerendo un adattamento locale. La modellazione della nicchia ambientale ha confermato che due gruppi allelici dei quattro geni occupavano nicchie significativamente diverse, e le analisi di espressione hanno rilevato diversi livelli di espressione tra gruppi di aplotipi in uno dei quattro geni. Presi insieme, questi risultati indicano che i geni sotto selezione equilibrante possono aver contribuito all’adattamento in A. thaliana.