Equilibrar la selección y los polimorfismos transespecíficos

Guo y sus colegas compararon la variación de todo el genoma de las dos especies para identificar los TSP. Debido al gran número de genes comparados, utilizaron una serie de rigurosos pasos de filtrado para reducir los falsos positivos. (Tales falsos positivos, en los que los TSP se generaron por otros procesos evolutivos en lugar de por la selección de equilibrio, podrían confundir nuestra comprensión del alcance y la importancia de la selección de equilibrio en la evolución del genoma). Para evitar interpretar erróneamente la variación entre copias de genes (paralogos) como polimorfismos en un solo locus, se centraron en 16.014 pares de genes conservados, ortólogos y de una sola copia, que contenían 1,1 y 0,45 millones de SNPs bialélicos en A. thaliana y C. rubella, respectivamente. Entre estos sitios polimórficos, 8535 SNPs mostraron pares de SNPs compartidos (shSNP) entre especies. Dado que los alineamientos en las regiones codificantes son más fiables que los de las secuencias no codificantes, los autores retuvieron sólo un tercio de los shSNP de alta calidad encontrados en las regiones codificantes, que afectaban a 433 genes.

Estos shSNP podrían reflejar procesos evolutivos neutros, como una ordenación incompleta del linaje de los polimorfismos ancestrales, o una mutación recurrente en lugar de una selección equilibrada. Para entender el potencial de los factores neutrales para mantener los polimorfismos compartidos, Guo y sus colegas dedujeron la historia demográfica de A. thaliana y C. rubella utilizando simulaciones coalescentes. Se detectaron reducciones históricas del tamaño de la población (cuellos de botella) en ambas especies tras la divergencia de su ancestro común. Además, estos análisis indican que hubo un antiguo flujo de genes entre los ancestros de estas dos especies. Sobre la base de la teoría de la coalescencia neutra y los parámetros demográficos estimados, la probabilidad de una ordenación incompleta del linaje (es decir, que dos alelos de A. thaliana y C. rubella no se hayan unido en el intervalo desde la especiación) es del orden de 10-9. Esto implica que < 1 shSNP sería retenido en regiones genómicas alineadas bajo la deriva genética solamente. Esta probabilidad estimada sigue siendo válida con la autofagia y la estructura de la población dentro de las especies, y es poco probable que esté influenciada por el flujo genético ancestral. Por lo tanto, la existencia de los shSNP no puede explicarse sólo por la deriva genética, y probablemente se mantienen por la selección de equilibrio.

Bajo la neutralidad, los haplotipos que llevan el polimorfismo ancestral pueden romperse como resultado de la recombinación, y es difícil identificar los alelos no recombinantes para las especies que divergieron hace mucho tiempo. Por el contrario, la selección equilibrada puede suprimir la recombinación alrededor de los sitios seleccionados, y los segmentos ancestrales cortos que albergan múltiples variantes vinculadas podrían persistir hasta que todos los linajes se unan a su ancestro común. En este contexto, los antiguos polimorfismos equilibrados pueden agruparse por tipo alélico en lugar de por especie (Fig. 1a y b), un indicio de selección equilibradora. Sobre la base de una tasa de recombinación de 3,6 cM/Mb para A. thaliana y C. rubella, Guo y sus colegas estiman que los segmentos antiguos de evolución neutra tendrían sólo varios pares de bases de longitud. Por lo tanto, exploraron ventanas deslizantes de 100 pb a través de los 433 genes candidatos identificados para encontrar regiones de secuencias que se agrupan por alelos en lugar de por especies (Fig. 1b). Para reducir la posibilidad de falsos positivos, se aplicó una serie de pasos de filtrado.

Fig. 1
figure1

Origen e identificación de polimorfismos transespecíficos en un locus de una sola copia. a El tiempo corre de arriba a abajo, y la variación dentro de una especie está encerrada por líneas negras flanqueantes. Antes del inicio de la especiación, se segregan dos alelos dentro de la especie ancestral (líneas moradas), y cada copia da lugar a un par de alelos descendientes (dos azules o dos rojos). A medida que avanza la especiación, estos alelos descendientes se heredan en las especies hijas, y finalmente existe un polimorfismo alélico moderno entre los individuos. (Como es típico en los análisis coalescentes, sólo se muestran los linajes que están representados en nuestra muestra moderna). b Una filogenia alélica que muestra las relaciones de los alelos modernos secuenciados en un gen de una sola copia. En el clado azul, los alelos de Arabidopsis thaliana están más relacionados con los alelos azules de Capsella rubella que con los alelos rojos de A. thaliana debido al polimorfismo transespecífico. Figura adaptada de Wu et al.

Guo y sus colegas identificaron entonces los haplotipos de cinco genes como TSPs candidatos bajo la selección de equilibrio a largo plazo. Estos cinco genes tienen una sola copia en ambas especies, y los estudios de simulación confirmaron que este patrón sería muy improbable bajo una evolución neutra, lo que sugiere que estos cinco TSP se mantienen por selección de equilibrio. La selección equilibrada también se vio apoyada por la alta diversidad de nucleótidos y el polimorfismo de frecuencia intermedia en estas regiones, como se espera para los antiguos polimorfismos equilibrados. Los cinco genes candidatos están asociados a diferentes procesos biológicos y bioquímicos, incluida la respuesta al estrés biótico y abiótico.

Por último, Guo y sus colegas examinaron las funciones de estos cinco genes candidatos en la adaptación a hábitats divergentes. Se centraron en A. thaliana debido a la amplia información sobre la variación genética, geográfica y ecológica de esta especie. Para evitar la confusión con la divergencia genética histórica, consideraron cuatro genes que eran independientes de la historia de la población y que se correlacionaban con la divergencia ecológica, sugiriendo una adaptación local. La modelización del nicho ambiental confirmó que dos grupos alélicos de los cuatro genes ocupaban nichos significativamente diferentes, y los análisis de expresión detectaron diferentes niveles de expresión entre los grupos de haplotipos en uno de los cuatro genes. En conjunto, estos resultados indican que los genes sometidos a una selección equilibrada pueden haber contribuido a la adaptación en A. thaliana.