Afbalancering af udvælgelse og trans-specifikke polymorfismer

Guo og kolleger sammenlignede helgenom-variation af de to arter for at identificere TSP’er. På grund af det store antal sammenlignede gener brugte de en række strenge filtreringstrin for at reducere falsk positive resultater. (Sådanne falske positiver, hvor TSP’er blev genereret af andre evolutionære processer snarere end af balancerende selektion, ville vildlede vores forståelse af omfanget og betydningen af balancerende selektion i genomets evolution). For at undgå at fejlfortolke variation mellem genkopier (paraloger) som polymorfismer på et enkelt locus fokuserede de på 16.014 konserverede, ortologe, enkeltkopiske genpar, som indeholdt 1,1 og 0,45 millioner bi-alleliske SNP’er i henholdsvis A. thaliana og C. rubella. Blandt disse polymorfe steder viste 8535 SNP’er parvis delte SNP’er (shSNP) mellem arter. Da alignments i kodningsregioner er mere pålidelige end dem i ikke-kodningssekvenser, beholdt forfatterne kun omkring en tredjedel af de shSNP’er af høj kvalitet, der blev fundet i kodningsregioner, hvilket påvirker 433 gener.

Disse shSNP’er kan afspejle neutrale evolutionære processer, såsom ufuldstændig lineage sortering af forfædres polymorfismer, eller tilbagevendende mutation i stedet for balancerende selektion. For at forstå potentialet for neutrale faktorer til at opretholde delte polymorfismer, udledte Guo og kolleger den demografiske historie af A. thaliana og C. rubella ved hjælp af koalescenssimuleringer. Historiske reduktioner i populationsstørrelsen (flaskehalse) blev påvist hos begge arter efter divergens fra deres fælles forfader. Desuden viser disse analyser, at der har fundet en gammel genstrøm sted mellem forfædrene til disse to arter. På grundlag af neutral koalescensteori og estimerede demografiske parametre er sandsynligheden for ufuldstændig sortering af slægten (dvs. at to A. thaliana- og C. rubella-alleler ikke er vokset sammen i intervallet siden artsdannelsen) i størrelsesordenen 10-9. Dette indebærer, at < 1 shSNP ville blive bevaret i tilpassede genomiske regioner under genetisk drift alene. Denne anslåede sandsynlighed gælder stadig med selfing og populationsstruktur inden for arterne, og det er usandsynligt, at den påvirkes af forfædrenes genstrømme. Derfor kan eksistensen af shSNP’er ikke forklares ved genetisk drift alene, og de opretholdes sandsynligvis af balancerende selektion.

Under neutralitet kan haplotyper, der bærer den forfædres polymorfisme, blive opsplittet som følge af rekombination, og det er vanskeligt at identificere ikke-rekombinante alleler for arter, der har divergeret for længe siden. I modsætning hertil kan balancerende selektion undertrykke rekombination omkring udvalgte steder, og korte forfædresegmenter, der rummer flere sammenkædede varianter, kan bestå, indtil alle slægter er samlet til deres fælles forfader. I denne sammenhæng kan gamle balancerede polymorfismer være grupperet efter alleltype snarere end efter art (fig. 1a og b), hvilket er et tegn på balancerende selektion. På grundlag af en rekombinationshastighed på 3,6 cM/Mb for A. thaliana og C. rubella anslår Guo og kolleger, at gamle, neutralt udviklende segmenter kun ville være flere basepar lange. Derfor scannede de 100-bp glidende vinduer på tværs af de 433 identificerede kandidatgener for at finde sekvensregioner, der er grupperet af alleler snarere end arter (Fig. 1b). For at reducere chancen for falske positiver blev der anvendt en række filtreringstrin.

Figur 1
Figur1

Origin og identifikation af trans-specifikke polymorfismer på et enkeltkopi-lokus. a Tiden løber fra top til bund, og variation inden for en art er omsluttet af flankerende sorte linjer. Før artsdannelsen begynder, segregeres to alleler inden for forfædrenes art (lilla linjer), og hver kopi giver anledning til et par efterkommere af alleler (to blå eller to røde). Efterhånden som artsdannelsen skrider frem, nedarves disse afkomsalleler i datterarterne, og til sidst findes der moderne allelisk polymorfi blandt individerne. (Som det er typisk i koalescensanalyser, er kun slægter, der er repræsenteret i vores moderne prøve, vist.) b En allelfylogeni, der viser relationerne mellem moderne, sekventerede alleler på et enkeltkopi gen. I den blå klade er Arabidopsis thaliana-alleler tættere beslægtet med blå alleler hos Capsella rubella end med røde alleler hos A. thaliana på grund af trans-specifik polymorfi. Figur tilpasset fra Wu et al.

Guo og kolleger identificerede derefter haplotyper fra fem gener som kandidat-TSP’er under langvarig balancerende udvælgelse. Disse fem gener er enkeltkopierede i begge arter, og simuleringsundersøgelser bekræftede, at dette mønster ville være meget usandsynligt under neutral evolution, hvilket tyder på, at disse fem TSP’er opretholdes af balancerende udvælgelse. Balancerende udvælgelse blev også understøttet af høj nukleotiddiversitet og polymorfisme med mellemliggende frekvens i disse regioner, som forventet for gamle balancerede polymorfismer. De fem kandidatgener er forbundet med forskellige biologiske og biokemiske processer, herunder respons på biotisk og abiotisk stress.

Slutteligt undersøgte Guo og kolleger disse fem kandidatgeners rolle i tilpasningen til divergerende habitater. De fokuserede på A. thaliana på grund af de omfattende oplysninger om den genetiske, geografiske og økologiske variation i denne art. For at undgå forveksling med historisk genetisk divergens overvejede de fire gener, der var uafhængige af populationshistorien, og som korrelerede med økologisk divergens, hvilket tyder på lokal tilpasning. Miljømæssig nichemodellering bekræftede, at to allelgrupper af de fire gener besatte signifikant forskellige nicher, og ekspressionsanalyser påviste forskellige ekspressionsniveauer mellem haplotypegrupper i et af de fire gener. Samlet set tyder disse resultater på, at gener under balancerende udvælgelse kan have bidraget til tilpasning i A. thaliana.