Balancing selection and trans-specific polymorphisms

Guo a jeho kolegové porovnávali celogenomovou variabilitu dvou druhů, aby identifikovali TSP. Vzhledem k velkému počtu porovnávaných genů použili řadu přísných filtračních kroků k omezení falešně pozitivních výsledků. (Takové falešně pozitivní výsledky, kdy TSP vznikly spíše jinými evolučními procesy než vyrovnávací selekcí, by zkreslily naše chápání rozsahu a významu vyrovnávací selekce v evoluci genomu). Aby se vyhnuli chybné interpretaci variability mezi kopiemi genů (paralogy) jako polymorfismů na jednom lokusu, zaměřili se na 16 014 konzervovaných, ortologických párů genů s jednou kopií, které obsahovaly 1,1 a 0,45 milionu bi-alelních SNP u A. thaliana a C. rubella. Mezi těmito polymorfními místy vykazovalo 8535 SNP páry sdílených SNP (shSNP) mezi druhy. Protože zarovnání v kódujících oblastech jsou spolehlivější než zarovnání v nekódujících sekvencích, autoři zachovali pouze asi třetinu vysoce kvalitních shSNP nalezených v kódujících oblastech, které se týkaly 433 genů.

Tyto shSNP mohou odrážet neutrální evoluční procesy, jako je neúplné liniové třídění polymorfismů předků nebo opakované mutace namísto vyrovnávací selekce. Aby pochopili potenciál neutrálních faktorů pro udržení sdílených polymorfismů, odvodili Guo a jeho kolegové demografickou historii A. thaliana a C. rubella pomocí koalescenčních simulací. U obou druhů bylo po divergenci od společného předka zjištěno historické zmenšení velikosti populace (úzká hrdla). Tyto analýzy navíc naznačují, že mezi předky těchto dvou druhů docházelo k dávnému toku genů. Na základě neutrální teorie koalescence a odhadovaných demografických parametrů se pravděpodobnost neúplného třídění linií (tj. že v intervalu od speciace nedošlo ke koalescenci dvou alel A. thaliana a C. rubella) pohybuje v řádu 10-9 . To znamená, že < 1 shSNP by se zachoval v zarovnaných genomických oblastech pouze na základě genetického driftu. Tato odhadovaná pravděpodobnost stále platí při samoplození a populační struktuře v rámci druhu a je nepravděpodobné, že by byla ovlivněna genovým tokem předků. Existenci shSNP tedy nelze vysvětlit pouze genetickým driftem a pravděpodobně se udržují vyvažující selekcí.

Při neutralitě se mohou haplotypy nesoucí ancestrální polymorfismus rozpadnout v důsledku rekombinace a je obtížné identifikovat nerekombinantní alely u druhů, které se dávno rozdělily. Naproti tomu vyvažující selekce může potlačit rekombinaci v okolí vybraných míst a krátké ancestrální segmenty, které nesou více propojených variant, mohou přetrvat, dokud všechny linie nesplynou se svým společným předkem. V tomto kontextu mohou být dávné balancované polymorfismy seskupeny spíše podle typu alely než podle druhu (obr. 1a a b), což je známkou vyvažující selekce. Na základě rychlosti rekombinace 3,6 cM/Mb pro A. thaliana a C. rubella Guo a kolegové odhadují, že staré, neutrálně se vyvíjející segmenty budou mít délku jen několik párů bází. Proto prohledali 100bp posuvná okna napříč 433 identifikovanými kandidátními geny, aby našli sekvenční oblasti, které jsou seskupeny spíše podle alel než podle druhů (obr. 1b). Aby se snížila pravděpodobnost falešně pozitivních výsledků, byla použita řada filtračních kroků.

Obr. 1
obr. 1

Původ a identifikace trans-specifických polymorfismů na jednokopírovacím lokusu. a Čas běží shora dolů a variace v rámci druhu je ohraničena lemujícími černými čarami. Před začátkem speciace se v rámci předka segregují dvě alely (fialové čáry) a každá kopie dává vzniknout dvojici potomků (dvě modré nebo dvě červené). Jak speciace pokračuje, tyto potomní alely se dědí v dceřiných druzích a nakonec mezi jedinci existuje moderní alelický polymorfismus. (Jak je typické pro koalescentní analýzy, jsou zobrazeny pouze linie, které jsou zastoupeny v našem moderním vzorku. b Fylogeneze alel zobrazující vztahy moderních, sekvenovaných alel u jednoho genu s jednou kopií. V modrém kladu jsou alely Arabidopsis thaliana příbuznější modrým alelám u Capsella rubella než červeným alelám u A. thaliana kvůli trans-specifickému polymorfismu. Obrázek převzat z Wu et al.

Guo a kolegové pak identifikovali haplotypy z pěti genů jako kandidáty na TSP v rámci dlouhodobé vyrovnávací selekce. Těchto pět genů se u obou druhů vyskytuje v jedné kopii a simulační studie potvrdily, že tento vzorec by byl při neutrální evoluci velmi nepravděpodobný, což naznačuje, že těchto pět TSP je udržováno vyvažující selekcí. Vyvažující selekce byla také podpořena vysokou nukleotidovou diverzitou a polymorfismem se střední frekvencí v těchto oblastech, jak se očekává u starobylých vyvážených polymorfismů. Pět kandidátních genů je spojeno s různými biologickými a biochemickými procesy, včetně reakce na biotický a abiotický stres.

Nakonec Guo a jeho kolegové zkoumali roli těchto pěti kandidátních genů v adaptaci na odlišná stanoviště. Zaměřili se na A. thaliana kvůli rozsáhlým informacím o genetické, geografické a ekologické variabilitě tohoto druhu. Aby se vyhnuli záměně s historickou genetickou divergencí, vzali v úvahu čtyři geny, které byly nezávislé na populační historii a které korelovaly s ekologickou divergencí, což naznačuje lokální adaptaci. Modelování environmentální niky potvrdilo, že dvě alelické skupiny těchto čtyř genů zaujímají významně odlišné niky, a analýzy exprese zjistily rozdílné úrovně exprese mezi haplotypovými skupinami u jednoho ze čtyř genů. Souhrnně tyto výsledky naznačují, že geny podléhající vyvažující selekci mohly přispět k adaptaci u A. thaliana.