Balanceando seleção e polimorfismos transespecíficos
Guo e colegas compararam variação de genoma inteiro das duas espécies para identificar as TSPs. Devido ao grande número de genes comparados, eles usaram uma série de etapas de filtragem rigorosa para reduzir os falsos positivos. (Esses falsos positivos, nos quais as TSPs foram geradas por outros processos evolutivos em vez de por meio do equilíbrio da seleção, iriam enganar nossa compreensão da extensão e importância do equilíbrio da seleção na evolução do genoma). Para evitar a má interpretação da variação entre cópias de genes (parálogos) como polimorfismos em um único locus, eles se concentraram em 16.014 pares de genes conservados, ortológicos, de cópia única, que continham 1,1 e 0,45 milhões de SNPs bi-alélicos em A. thaliana e C. rubella, respectivamente. Entre estes locais polimórficos, 8535 SNPs mostraram pares de SNPs compartilhados (shSNP) entre espécies. Como os alinhamentos em regiões codificadas são mais confiáveis do que aqueles em sequências não codificadas, os autores retiveram apenas cerca de um terço dos shSNPs de alta qualidade encontrados em regiões codificadas, afetando 433 genes.
Estes shSNPs podem refletir processos evolutivos neutros, como a classificação incompleta de linhagens de polimorfismos ancestrais, ou mutação recorrente em vez de seleção de equilíbrio. Para entender o potencial de fatores neutros para manter os polimorfismos compartilhados, Guo e colegas inferiram a história demográfica de A. thaliana e C. rubella usando simulações coalescentes. Reduções históricas no tamanho da população (gargalos) foram detectadas em ambas as espécies após divergência de seus ancestrais comuns. Além disso, estas análises indicam que o antigo fluxo gênico ocorreu entre os ancestrais destas duas espécies. Com base na teoria da coalescência neutra e nos parâmetros demográficos estimados, a probabilidade de uma classificação incompleta da linhagem (ou seja, que dois alelos A. thaliana e C. rubella não tenham coalescido no intervalo desde a especiação) é da ordem de 10-9. Isto implica que < 1 shSNP seria retido em regiões genômicas alinhadas apenas sob deriva genética. Esta probabilidade estimada ainda se aplica com a estrutura de autogestão e população dentro das espécies, e é improvável que seja influenciada pelo fluxo gênico ancestral. Portanto, a existência de shSNPs não pode ser explicada apenas pela deriva genética, e elas provavelmente são mantidas pelo equilíbrio da seleção.
Acima da neutralidade, haplótipos portadores do polimorfismo ancestral podem ser quebrados como resultado da recombinação, e é difícil identificar alelos não recombinantes para espécies que divergiram há muito tempo. Por outro lado, a seleção de equilíbrio pode suprimir a recombinação em torno de locais selecionados, e segmentos ancestrais curtos que abrigam múltiplas variantes ligadas podem persistir até que todas as linhagens se coalescem com seus ancestrais comuns. Neste contexto, os antigos polimorfismos equilibrados podem ser agrupados por tipo alélico e não por espécie (Fig. 1a e b), uma indicação de seleção de equilíbrio. Com base numa taxa de recombinação de 3,6 cM/Mb para A. thaliana e C. rubella, Guo e colegas estimam que segmentos antigos, em evolução neutra, seriam apenas vários pares de bases de comprimento. Portanto, eles escanearam janelas deslizantes de 100-bp através dos 433 genes candidatos identificados para encontrar regiões de seqüência que são agrupadas por alelos ao invés de espécies (Fig. 1b). Para reduzir a chance de falsos positivos, um número de etapas de filtragem foi aplicado.
Guo e colegas então identificaram haplótipos de cinco genes como candidatos TSPs sob seleção de equilíbrio a longo prazo. Estes cinco genes são cópias únicas em ambas as espécies, e estudos de simulação confirmaram que este padrão seria muito improvável sob evolução neutra, sugerindo que estes cinco TSPs são mantidos por seleção de equilíbrio. O balanceamento da seleção também foi apoiado pela alta diversidade de nucleotídeos e polimorfismos de freqüência intermediária nestas regiões, como esperado para os antigos polimorfismos balanceados. Os cinco genes candidatos estão associados a diferentes processos biológicos e bioquímicos, incluindo resposta ao stress biótico e abiótico.
Finalmente, Guo e colegas examinaram os papéis destes cinco genes candidatos na adaptação a habitats divergentes. Eles se concentraram em A. thaliana devido à extensa informação sobre a variação genética, geográfica e ecológica desta espécie. Para não confundir com a divergência genética histórica, eles consideraram quatro genes que eram independentes da história da população e que estavam correlacionados com a divergência ecológica, sugerindo uma adaptação local. A modelagem de nicho ambiental confirmou que dois grupos alélicos dos quatro genes ocupavam nichos significativamente diferentes, e as análises de expressão detectaram diferentes níveis de expressão entre os grupos haplótipos em um dos quatro genes. Em conjunto, esses resultados indicam que genes em seleção de equilíbrio podem ter contribuído para a adaptação em A. thaliana.