Frontiers in Genetics
- Introdução
- Materiais e Métodos
- Recolha de dados e controle de qualidade
- Estrutura da população
- Seleção de AIMs
- Classificação do grupo com MIE mínimo
- Ancestry Inference With Optimal AIMs
- Resultados
- Estrutura populacional das populações de referência
- Classificação de grupo usando AIMs
- Estimativa precisa da proporção de ancestralidade usando AIMs
- Estimativa da Proporção de Antecedentes para o Conjunto de Dados do Teste
- Discussão
- Contribuições dos autores
- Funding
- Conflito de interesses
- Material Suplementar
- Pés
Introdução
Polimorfismo de nucleótido único (SNP) e insertion-deletion (InDel) são amplamente utilizados para inferência de ancestralidade humana e atribuição de população (Bauchet et al, 2007; Tian et al., 2009; Sun et al., 2016). Os marcadores informativos de ancestralidade (AIMs) são marcadores genéticos de diferenças de frequência entre populações (Shriver et al., 2003). Múltiplas estatísticas têm sido usadas para obter os AIMs, incluindo estatísticas F (FST), diferenças de frequência alélica absoluta (δ), medida informativa para atribuição (In), e pontuação de carga de componentes principais (Rosenberg et al., 2003; Zhang et al., 2009; Ding et al., 2011; vonHoldt et al., 2016; Barbosa et al., 2017; Peterson et al., 2017). Ao invés de usar marcadores de genoma inteiro, os MIE foram considerados suficientemente precisos para inferência de ancestralidade para o tamanho populacional limitado. Consequentemente, isto constitui uma forma econômica de triagem e análise de milhares de amostras. Santos et al. (2016) relataram que 192 AIMs selecionados a partir de ∼370 K SNP dados podem ser usados para estimar com precisão as proporções de ancestralidade de três grandes populações no Brasil. Li et al. (2016) desenvolveram um painel de 74 AIMs para inferir as proporções de ancestralidade de 500 indivíduos de 11 populações. Devido à alta resolução dos AIMs, um painel de 23 AIMs gerado por Zeng et al. (2016) distinguiu quatro grandes populações americanas, e atribuiu corretamente a ancestralidade para nove populações adicionais (Zeng et al., 2016).
Para a genética da população animal, os AIMs foram aplicados com sucesso para identificar raças de diferentes variedades e avaliar composições genéticas em populações híbridas (Dimauro et al., 2015; Bouchemousse et al., 2016). Bertolini et al. (2017) constataram que 96 AIMs tiveram bom desempenho na discriminação de seis raças de gado leiteiro. Em outro estudo, 63 AIMs selecionados de 427 canídeos foram utilizados para avaliar a mistura genética em coiotes (Monzon et al., 2014). Recentemente, 74 AIMs foram usados para calcular proporções de ancestralidade em ovelhas cruzadas (Awassi com duas raças nativas na Etiópia), e verificou-se que diferentes níveis de admixture de Awassi afetaram significativamente os traços de crescimento de cordeiros e reprodução de ovelhas (Getachew et al., 2017).
Os porcos (Sus scrofa) divergiram em javalis europeus e asiáticos durante o meio do Pleistoceno (1,2-0,8 milhões de anos atrás) (Larson et al., 2005; Frantz et al., 2013). A domesticação de suínos na China ocorreu ∼9,000 anos atrás (Larson et al., 2005). Foi documentado que os suínos domésticos chineses foram divididos em seis tipos de acordo com a região de habitação e características fenotípicas (I-Norte da China, II-Bacia do Changjiang, III-Centro da China, IV-Sul da China, V-Sudoeste, e VI-Plateau) (Li et al., 2004; Fang et al., 2005). Em um estudo recente, Yang et al. (2017). rastrearam os ancestrais de várias raças chinesas e identificaram dois grandes ancestrais distintos, que são de origem oriental da China (por exemplo, Meishan e JinHua) e sul da China (por exemplo, Luchuan e Bamaxiang). Além disso, também foi relatada a introgressão genómica de raças comerciais europeias para porcos indígenas chineses (Ai et al., 2013; Bosse et al., 2014; Zhu et al., 2017), tornando as composições genéticas dos porcos chineses modernos ainda mais complicadas.
Embora tenha sido amplamente aplicado em outros animais, e seja de grande importância em cenários de aplicação específicos, incluindo a vigilância do mercado e a proteção dos recursos genéticos, não existe atualmente nenhum estudo que trate especificamente do problema do uso eficiente de AIMs para distinguir raças de porcos ou para estimar proporções de ancestralidade. Aqui, usando dados do chip SNP do porco ∼60 K, procuramos o número ideal de AIMs para distinguir porcos de origem oriental da China, sul da China ou europeia. Com base em 129 AIMs selecionados, estimamos proporções de ancestralidade das origens acima para outros porcos chineses. Sugerimos que AIMs selecionados a partir de populações de referência não-misturadas poderiam ser usados para estimar com precisão as proporções de ancestralidade em populações híbridas. Nossos resultados fornecem um exemplo útil de utilização de AIMs para classificação de raça e estimativa de ancestralidade em suínos.
Materiais e Métodos
Recolha de dados e controle de qualidade
Dados de genotipagem de 2.113 amostras foram recuperados do Repositório Digital Dryad1. Apenas amostras de raças asiáticas e europeias foram utilizadas neste estudo (um total de 1.157 amostras de 71 populações, detalhes na Tabela Complementar S1). Amostras e SNPs foram excluídas se os seguintes critérios fossem cumpridos: (1) um indivíduo continha mais de 10% de genótipos ausentes; (2) SNPs com uma taxa de chamada inferior a 95%; (3) SNPs com uma frequência alélica menor que 0,05; (4) SNPs localizados em cromossomos sexuais; e (5) SNPs não eram bialleicos. Os genótipos em falta foram posteriormente imputados usando BEAGLE (versão 3.3.2) (Browning and Browning, 2007). Finalmente, 45.562 SNPs e 1.155 amostras permaneceram. As 1.155 amostras foram então divididas em dois conjuntos de dados. Para o conjunto de referência, foram escolhidas 186 amostras de 10 populações representativas dos três principais grupos de ancestrais: Porco do Leste da China (ECHP), porco do Sul da China (SCHP), e porco comercial europeu (EUCP). As 10 populações foram seleccionadas com base no facto de não haver uma mistura óbvia entre populações pertencentes ao grupo ECHP ou SCHP, de acordo com um relatório de Yang et al. (2017). Este conjunto de dados está resumido na Tabela 1. O conjunto de dados do teste continha as 969 amostras restantes de 61 populações (detalhes na Tabela Complementar S2). Considerando a conveniência da aplicação prática, os dados genotípicos do conjunto de dados do teste foram extraídos diretamente dos dados brutos sem fase ou imputação.
Tábua 1. A informação das raças de suínos no conjunto de referência.
Estrutura da população
Análise de componentes primitivos (PCA) foi realizada em ∼60 Dados do chip K usando SMARTPCA (versão 6.1.4) no conjunto de referência (Patterson et al., 2006). Para confirmar o estado não misturado, o ADMIXTURE não supervisionado (versão 1.23) (Alexander et al., 2009) foi utilizado para calcular as proporções de ancestralidade das amostras do conjunto de referência com o número de ancestralidade (K) definido de K = 3 a K = 15. O modelo ChromoPainter v2 (Lawson et al., 2012) linked também foi escolhido para explorar similaridade/dissimilaridade para indivíduos do conjunto de referência. Em detalhes, o arquivo de mapa recombinação foi gerado usando o script makeuniformrecfile.pl fornecido por fineSTRUCTURE (versão 2.1.1) (Lawson et al., 2012). Utilizando um perfil oculto do modelo Markov, o ChromoPainter v2 infere haplótipos de “doador” e “receptor” para criar uma matriz de co-análise. Inicialmente, 20 etapas de expectativa-maximização foram usadas para estimar a mutação e a taxa de mudança em 1/5 de membros da amostra aleatória de todos os indivíduos com todos os autossomos considerados. As taxas de mutação e de troca inferidas para cada cromossomo foram então calculadas como média. Posteriormente, com a estimativa da mutação, taxa de mudança e outros valores padrão, o ChromoPainter v2 foi novamente usado para gerar a matriz de co-ansiedade para todos os indivíduos. Finalmente, o algoritmo MCMC implementado em fineSTRUCTURE foi empregado para agrupar hierarquicamente os indivíduos com um burn-in e tempo de execução de 1.000.000 e 6.000.000 iterações, respectivamente.
Seleção de AIMs
Todas as 186 amostras do conjunto de dados de referência foram usadas para calcular FST e In. Os SNPs candidatos foram selecionados a partir do seletor do algoritmo AIMs que foi implementado no AIMs_generator.py do pipeline ANTseq2. Especificamente, excluímos primeiramente os SNPs em desequilíbrio de desequilíbrio de alta ligação (LD) selecionando apenas um SNP em uma região LD forte (r2 > 0.3) e dentro de uma distância de 500 kb. Dentro de cada grupo, os SNPs que apresentavam frequências heterogêneas entre as populações foram ainda excluídos com base em um teste de qui-quadrado (Galanter et al., 2012). Em segundo lugar, FST e In foram calculados para cada um dos três grupos pareados: ECHP vs. EUCP, SCHP vs. EUCP, e ECHP vs. SCHP (Rosenberg et al., 2003).
Classificação do grupo com MIE mínimo
Usando o conjunto de dados de referência, primeiramente comparamos o poder discriminatório dos MIE selecionados por FST ou In. A classificação binária para os três grupos pareados foi realizada separadamente. Para cada grupo emparelhado, começamos selecionando os dois primeiros até os 30 primeiros AIMs, com um incremento de um AIM. As amostras no grupo pareado correspondente foram divididas aleatoriamente em duas proporções: 75% para treinamento, 25% para testes, e esta operação foi repetida 50 vezes. GridSearchCV implementado no pacote Scikit-learn (versão 0.18) foi então utilizado para determinar os parâmetros ótimos para um classificador de máquina vetorial de suporte (SVM) (Da Mota et al., 2014). Os parâmetros para SVM estão resumidos na Tabela Suplementar S3. Para o modelo com parâmetros ótimos, a precisão da classificação foi avaliada pela média do coeficiente de correlação de Matthews (MMCC) para 50 repetições, como segue:
onde TNi e FNi são o número de verdadeiros negativos e falsos negativos, e TPi e FPi são o número de verdadeiros positivos e falsos positivos, para cada execução.
Para determinar o número mínimo de AIMs para distinguir ECHP, SCHP, e EUCP simultaneamente, uma abordagem multiclasse de umvs.-restante SVM foi utilizado no conjunto de dados de referência (Hong e Cho, 2008). Da mesma forma, começámos por seleccionar os dois primeiros a 200 MVA de cada um dos grupos emparelhados, com um incremento de um MVA, resultando em 199 conjuntos de MVA no total. Em cada conjunto, os OBJs selecionados dos três grupos pareados foram fundidos e os OBJs duplicados foram removidos (Tabela Suplementar S4). Como o MMCC não foi projetado para avaliar a precisão da classificação multiclasse, a matriz de confusão, a estatística kappa de Cohen e a taxa de erro balanceada foram utilizadas para avaliar a precisão da classificação. A maior taxa de erro de Cohen, mas a menor taxa de erro balanceada indicou uma classificação mais precisa. Utilizamos novamente GridSearchCV para estimar os melhores parâmetros para SVM umvs.-rest, cujos parâmetros estão resumidos na Tabela Suplementar S3. Também geramos conjuntos aleatórios de SNP de igual número de todo o genoma para comparação de poder discriminatório com os AIMs selecionados.
Ancestry Inference With Optimal AIMs
AIMs têm sido amplamente utilizados para estimar proporções de ancestralidade em populações híbridas, mesmo nos casos em que foram selecionados a partir de populações não-misturadas. Com base em MIE selecionados, para estimar proporções de ancestralidade de possíveis populações de suínos misturados, empregamos uma estratégia semelhante à utilizada em um estudo anterior de Pardo-Seco et al. (2014). Inicialmente, geramos indivíduos pseudo-amisturados através da seleção aleatória de genótipos de MIE selecionados a partir de amostras do conjunto de dados de referência, com proporções iguais. Portanto, as proporções de ancestralidade esperadas desses indivíduos pseudo-amisturados foram de 1/3 (∼0.3333) de cada grupo (ECHP, SCHP, e EUCP). Para cada um dos 199 conjuntos AIM gerados a partir dos acima mencionados, foram realizadas 1.000 simulações. ADMIXTURE supervisionado (K = 3) foi usado para estimar as proporções de ancestralidade. Os desempenhos foram avaliados pela média e pelo coeficiente de variação (CV) das proporções de ancestralidade estimadas. O CV das proporções de ancestralidade estimadas em relação ao número de AIMs foi ajustado pelo programa Curve Expert 1.43. O número ótimo de AIMs foi determinado pela seleção da inclinação do limiar tangente da curva cujo desempenho estável foi observado além daquele ponto. Para adicionar uma validação adicional, simulamos indivíduos pseudo-amisturados com proporções de ancestralidade aleatórias usando o número ótimo determinado de OBJs. As proporções de ancestralidade do ECHP, SCHP e EUCP foram atribuídas aleatoriamente com uma proporção mínima definida para 10%.
Na base dos AIMs selecionados no último passo, fizemos a inferência de ancestralidade para os 969 indivíduos no conjunto de dados do teste por ADMIXTURE supervisionado. O desempenho foi avaliado pelo coeficiente de correlação de Pearson entre os SNPs do genoma e o número ótimo de AIMs.
Resultados
Estrutura populacional das populações de referência
Populações no conjunto de referência deveriam ser menos misturadas. Observamos que ECHP, SCHP, e EUCP estavam bem separados em um gráfico componente principal (Figura 1A). A distribuição FST para todo o genoma (Figura 1B) mostrou maior diferenciação tanto entre ECHP vs. EUCP (média = 0,2197, 95% CI 0,0006-0,7267) e SCHP vs. EUCP (média = 0,2153, 95% CI 0,0005-0,7570), enquanto a diferenciação entre ECHP vs. SCHP (média = 0,0588, 95% CI 0-0,3342) foi visivelmente menos pronunciada. Usando ADMIXTURE, todas as raças foram bem divididas em grupos antecipados (Figura 1C) quando K = 3, de acordo com o estudo anterior de Yang et al. (2017). Quando K = 10, 10 populações puderam ser separadas claramente, consistente com nossa expectativa de que as 10 populações foram menos misturadas (Figura Complementar S1).
Figura 1. Estrutura da população de 10 raças no conjunto de dados de referência. (A) Análise de componentes principais (PCA) de ∼60 Dados do chip K. (B) A distribuição FST para todo o genoma para os três grupos pareados: ECHP vs. EUCP, SCHP vs. EUCP e ECHP vs. SCHP. A linha vertical vermelha representa a média da distribuição de FST. As linhas verticais tracejadas representam 2,5 e 97,5% do percentil da distribuição de FST. (C) Aglomeração ADMIXTURE de ∼60 Dados do chip K quando K = 3-12. CNBX, China_Bamaxiang; CNCJ, China_Congjiangxiang; CNLU, China_Luchuan; CNDH, China_Guangdongdahuabai; CNJH, China_Jinhua; CNEH, China_Erhualian; CNMS, China_Meishan; DUR2, Duroc2; PIT1, Pietrain1; LDR1, Landrace1. Os códigos de cores para aparelhos grandes são os seguintes, verde: Porco da China Oriental (ECHP); vermelho: Porco do Sul da China (SCHP); azul: Porco comercial europeu (EUCP).
Para maior quantificação, foram utilizados os programas ChromoPainter v2 e fineSTRUCTURE para verificar a relação entre estas raças considerando LD. Como mostrado no mapa de cio coancestry (Figura 2), os indivíduos de cada grupo exibiram um padrão homogêneo, e aqueles do mesmo grupo compartilharam mais pedaços genéticos do que os de outros grupos. Em particular, o EUCP tinha um grau insignificante de coancestry com indivíduos de raças indígenas chinesas. A amostra do ECHP e do SCHP mostrou um grau mais elevado de coancestry, mas os indivíduos do mesmo grupo ainda tinham tendência a agrupar-se mais do que entre grupos. Em resumo, os resultados sugerem que as amostras do conjunto de dados de referência apresentaram um nível insignificante de mistura.
Figure 2. fineSTRUCTURE analysis in the reference dataet. O heatmap mostra o número de pedaços genéticos compartilhados copiados de um genoma doador (coluna) para um genoma receptor (linha). CNBX, China_Bamaxiang; CNCJ, China_Congjiangxiang; CNLU, China_Luchuan; CNDH, China_Guangdongdahuabai; CNJH, China_Jinhua; CNEH, China_Erhualian; CNMS, China_Meishan; DUR2, Duroc2; PIT1, Pietrain1; LDR1, Landrace1. Os códigos de cores são os seguintes, verde: Porco da China Oriental (ECHP); vermelho: Porco do Sul da China (SCHP); azul: Porco comercial europeu (EUCP).
Classificação de grupo usando AIMs
Para construir um conjunto eficaz de AIMs, primeiramente comparamos o desempenho das estatísticas FST e In statistics. Para um grupo pareado de ECHP vs. EUCP e SCHP vs. EUCP, um mínimo de dois OBJECTIVOS foi considerado suficiente para resultar numa separação perfeita (MMCC = 1), quer seleccionando a FST superior ou por cima em estatística (Figura Complementar S2). Contudo, para separar ECHP vs. SCHP, pelo menos quatro AIMs foram requeridos usando FST, ou pelo menos cinco foram requeridos usando In. Para os AIMs selecionados por FST ou In, descobrimos que os AIMs informativos selecionados por In foram em grande parte sobrepostos aos AIMs selecionados por FST, indicando que FST é pelo menos tão informativo quanto In. Portanto, as análises seguintes foram baseadas apenas em AIMs selecionados por FST.
Next, tentamos identificar o número de AIMs que poderiam ser usados para separar ECHP, SCHP e EUCP simultaneamente usando uma abordagem multiclasse. Como descrito em Materiais e Métodos, os primeiros classificados de dois a 200 AIMs foram seleccionados sequencialmente do ECHP vs. EUCP, SCHP vs. EUCP e ECHP vs. SCHP, respectivamente, resultando em 199 conjuntos de AIMs de número crescente (Tabela Suplementar S4). Os AIMs em cada conjunto foram fundidos e deduzidos. Por exemplo, para o maior conjunto, 171 dos 200 MCAI foram partilhados entre o ECHP vs. EUCP e o SCHP vs. EUCP (Figura Suplementar S3), 12 dos 200 MCAI foram partilhados entre o SCHP vs. EUCP e ECHP vs. SCHP, e 14 dos 200 MCAI foram partilhados entre o ECHP vs. EUCP e ECHP vs. SCHP. Todos os 199 conjuntos de MVA foram alimentados a um classificador SVM de um Vs.-rest. Como mostra a Figura 3 e a Tabela Complementar S5, sete MCAI foram suficientes para separar completamente o ECHP, SCHP e EUCP com o kappa do Cohen = 1 e taxa de erro equilibrada = 0. As informações detalhadas de sete MCAI foram resumidas na Tabela 2 e na Tabela Complementar S7.
Figura 3. Matrizes de confusão para o classificador SVM de um Vs.-rest. (A) O desempenho de quatro AIMs. (B) O desempenho de sete AIMs. (C) O desempenho de quatro marcadores aleatórios que são amostrados a partir de dados do genoma inteiro. (D) O desempenho de sete marcadores aleatórios.
Tabela 2. Os valores FST pareados para os 129 AIMs.
Estimativa precisa da proporção de ancestralidade usando AIMs
AIMs selecionados de populações não-misturadas foram relatados para serem aplicados com sucesso para estimar proporções de ancestralidade em populações misturadas (Lee et al., 2012; Maples et al., 2013). Para validar a praticabilidade em nosso estudo, realizamos a simulação de dados. Se o estudo for prático, devemos observar uma alta consistência entre as proporções de ancestralidade simuladas e estimadas. Para cada conjunto AIM, o ADMIXTURE supervisionado foi usado para calcular proporções de ancestralidade em 1.000 simulações. Para cada simulação, o genótipo de 60 amostras selecionadas do ECHP, SCHP e EUCP foram misturadas aleatoriamente para cada OBJECTIVO.
Como mostrado nas Figuras 4A,B, quando 80 ou menos OBJECTIVOS foram incluídos, grandes diferenças entre a média do valor estimado e esperado (∼0.3333) foram observadas. Por exemplo, os sete OBJs funcionaram perfeitamente para classificação não foram suficientes para inferir as proporções ancestrais com precisão: ECHP (média = 0,2994, coeficiente de variação (CV) = 0,8450), SCHP (média = 0,3909, CV = 0,7783) e EUCP (média = 0,3097, CV = 0,9895). Entretanto, ao incluir os principais 82 AIMs ou mais, as proporções estimadas convergiram gradualmente para os valores esperados (Figura 4A). A mesma tendência para o gráfico CV em que o CV diminuiu à medida que o número de OBJs aumentou (Figura 4B).
Figura 4. Inferência de adstringência em indivíduos simulados a partir dos 199 conjuntos AIM. Em cada conjunto, 1.000 simulações foram realizadas por um script python e os ancestrais foram inferidos por ADMIXTURE supervisionado. As linhas verticais tracejadas representam quatro conjuntos de AIM: sete AIM,82 AIMs, 129 AIMs e 403 AIMs. (A) A média das proporções dos antepassados para os três grupos: ECHP (verde), SCHP (vermelho) e EUCP (azul). A linha horizontal preta representa o valor esperado (∼0.3333) de cada ascendência. (B) O coeficiente de variação (CV) das proporções de ancestralidade para os três grupos.
A fim de determinar o conjunto óptimo de AIM, ajustamos as curvas CV na Figura 4B com uma função logarítmica recíproca (Figura suplementar S4) para AIMs entre 82 e 403. Como a tangente à curva se aproxima infinitamente de zero, determinamos um limiar arbitrário de -0,0004, que corresponde ao conjunto de 129 AIMs, considerando tanto a estabilidade do valor CV quanto o custo de genotipagem para SNPs (Tabela Suplementar S6). O conjunto de 129 AIMs teve bom desempenho na inferência de ancestralidade para amostras simuladas (Figura 5), o que resultou em ECHP: média = 0,3310, desvio padrão (std) = 0,0772; SCHP: média = 0,3356, std = 0,0751; e EUCP: média = 0,3334, std = 0,0394. Observamos também que o desempenho do conjunto de 129 AIMs mostrou diferença muito limitada em relação ao conjunto de 403 AIMs, sugerindo que o conjunto de 129 AIMs foi ótimo (Tabela Complementar S6).
Figura 5. Inferência de ascendência em indivíduos simulados a partir de 129 AIMs. A linha horizontal preta representa o valor esperado (∼0.3333) de cada ascendência. Os códigos de cor são os seguintes: verde: ECHP; vermelho: SCHP; azul: EUCP.
Considerando a praticabilidade do conjunto de 129 AIMs, nós simulamos em seguida indivíduos com proporções de ancestralidade aleatórias desiguais usando os mesmos AIMs. primeiro produzimos 10 proporções de ancestralidade aleatórias para cada três grupos, e depois fizemos 1.000 simulações em cada três proporções de ancestralidade. Para cada simulação, foram gerados 60 pseudo-indivíduos misturados. Como mostrado na Tabela 3, os 129 AIMs funcionaram muito bem, mesmo para amostras de proporções de ancestralidade aleatórias.
Tábua 3. Simulação de proporções de ancestralidade aleatória usando os 129 AIMs.
Como previsto, usando os 129 AIMs (Tabela 2 e Tabela Complementar S7), PCA demonstrou que 10 populações foram claramente divididas em três grupos correspondentes (Figura Complementar S5). Curiosamente, em comparação com a Figura 1A, a subestrutura dentro das populações de cada grupo foi menos óbvia.
Estimativa da Proporção de Antecedentes para o Conjunto de Dados do Teste
Foi relatado que algumas raças de suínos asiáticos foram misturadas com raças domésticas européias, e especialmente com raças comerciais. Por exemplo, oito raças asiáticas (raça local coreana (KPKO), raça local tailandesa (THCD), China Lichahei (CNLC), China Sutai (CNST), China Kele (CNKL), China Guanling (CNGU), China Leanhua (CNLA), e China Minzhu (CNMZ)) foram relatadas como tendo sido introduzidas por pelo menos 20% de ancestrais europeus (Yang et al., 2017). A fim de identificar simetricamente e quantificar a introgressão, utilizamos os 129 AIMs selecionados para estimar as composições ancestrais de outras 969 amostras de 61 populações que são possivelmente misturadas pelo menos até certo ponto.
Overall, usando a ADMIXTURE supervisionada, encontramos uma forte correlação (Figura 6) entre as proporções ancestrais calculadas por 129 AIMs e as calculadas por todos os dados do chip ∼60 K a nível individual. O gráfico Bland-Altman também mostrou acordos sobre a proporção de ancestralidade estimada entre os dados de todo o genoma e 129 AIMs (Figura 7). Para as raças que eram conhecidas por serem introgressadas pelo EUCP, obtivemos resultados razoáveis. Como mostrado na Figura 8 e na Tabela Suplementar S8, a estimativa da média de três proporções de ascendência na população CNMZ usando 129 AIMs (ECHP:0.5325, SCHP:0.2456, EUCP:0.2219) foi semelhante à estimativa da média de três proporções de ascendência na população CNMZ usando dados de ∼60 K SNP (ECHP:0.6457, SCHP:0.1291, EUCP:0.2252). O cruzamento LargeWhite-Meishan (CSLM), que foi documentado como uma geração F1 de LargeWhite × MeiShan, a nossa estimativa da proporção de ancestralidade dos 129 AIMs (ECHP:0.4992, SCHP:0.0455, EUCP:0.4553) foi consistente com a expectativa, e semelhante ao resultado dos dados do ∼60 K SNP (ECHP:0.5128, SCHP:0.0020, EUCP:0.4852). Em outro caso, o Russia Minisibs (RUMS), que foi reportado possuir aproximadamente metade dos ancestrais europeus, também obtivemos um alto nível de ancestralidade EUCP usando 129 AIMs (ECHP:0.1428, SCHP:0.4780, EUCP:0.3791) ou ∼60 K dados SNP (ECHP:0, SCHP:0.5349, EUCP:0.4651).
Figura 6. Correlação de Pearson entre ancestrais estimada por 129 AIMs e dados do chip ∼60 K. (A) Correlação para os antepassados ECHP. (B) Correlação para a ancestralidade do SCHP. (C) Correlação para a ancestralidade do EUCP.
Figura 7. Lotes de Bland-Altman mostrando a diferença entre a inferência de ancestralidade individual. O eixo x representa (A) ECHP, (B) SCHP, e (C) proporção de ancestralidade EUCP estimada por genoma, respectivamente. O eixo y representa a diferença nas estimativas entre os dados de todo o genoma e 129 AIMs. As linhas a tracejado vermelho e azul são intervalos de confiança médios e 95%, separadamente.
Figura 8. Proporções de ascendência estimadas por ADMIXTURE supervisionado em K = 3. A altura de cada barra representa três proporções de ascendência em uma população. A proporção média de cada ascendência em RUMS e CSLM é destacada com gráficos de tortas, respectivamente.
Discussão
Desde o século XIX, os criadores de porcos do Ocidente têm usado porcos chineses para hibridizar com porcos europeus para melhorar o seu efectivo reprodutor (Groenen, 2016). Bianco et al. (2015) descobriram que os porcos domésticos europeus têm 20% de introgressão genómica dos porcos asiáticos. Por outro lado, Yang et al. (2017) relataram que os porcos europeus contribuíram com pelo menos 20% para oito raças asiáticas. Nos últimos anos, foram apresentadas evidências de que agricultores chineses locais cruzam porcos locais com porcos comerciais importados (Berthouly-Salazar et al., 2012). A introdução introduz novos materiais genéticos, que podem ajudar a melhorar certas características, especialmente o desempenho da produção. Infelizmente, a introgressão, seja em sentido restrito, como mistura com raças estrangeiras, ou em sentido amplo, como mistura com raças de diferentes áreas dentro de uma nação, também introduz “poluição genética” que dificilmente é evitável. Por exemplo, em estudo recente, Zhang et al. descobriram que quase todas as galinhas indígenas chinesas têm introgressão genética de frangos de corte comerciais (Zhang et al., 2019).
Desde que a carne de porco indígena é vendida a um preço superior ao dos porcos comerciais europeus na China, a falsa propaganda, o fenómeno da falta de qualidade no mercado começou a aumentar. Uma atenção significativa tem sido dada à questão da adulteração da carne suína, no entanto, nesta fase, o trabalho de identificação foi baseado principalmente em intuições e experiências do lado do cliente (Dai et al., 2009; Kwon et al., 2017). Felizmente, os produtos suínos das 10 raças do nosso conjunto de referência são dominantes na China (Bosse et al., 2015; Gong et al., 2018; Zhao et al., 2018), o nosso método constitui assim uma forma promissoramente eficaz na detecção da adulteração de carne suína a nível do ADN na vigilância do mercado. Do ponto de vista de um pesquisador, em estudos de associação de genoma, diferentes ancestralidades genéticas entre caso e controle levarão à estratificação da população. Portanto, se selecionar as amostras de proporções ancestrais similares ou considerar a ancestralidade como covariada no modelo de regressão para ajustar a estratificação, isso ajudaria a reduzir os falsos positivos (Qin et al., 2014).
Overtodo, é altamente importante rastrear a origem ou estimar a ancestralidade genética, seja no respeito à proteção dos recursos genéticos, vigilância de mercado ou estratificação populacional. Os AIMs fornecem uma abordagem econômica em comparação com o uso de SNPs de genoma inteiro, e portanto é muito adequado para testes de grande volume.
No presente estudo, descobrimos que tão poucos quanto dois AIMs são suficientes para distinguir porcos chineses de porcos comerciais europeus, e 10 raças puras poderiam ser atribuídas com precisão a três grupos correspondentes (ECHP, SCHP e EUCP), usando tão poucos quanto sete AIMs. Através de simulações de dados, demonstramos que os MIFs selecionados de indivíduos não misturados também podem ser aplicados com sucesso para estimar proporções de ancestralidade para indivíduos misturados. Desenvolvemos ainda um painel de 129 MCA para inferir as proporções de ancestralidade em indivíduos possivelmente misturados de forma eficaz. Considerando a flexibilidade, confiabilidade e facilidade de manutenção, a plataforma Agena MassARRAY seria atualmente a melhor escolha para a genotipagem do conjunto de 129 AIMs. No entanto, para testes de grande volume, um chip SNP de baixa densidade personalizado ou uma sequenciação de próxima geração baseada em PCR multiplex seria mais rentável.
O nosso trabalho forneceu um exemplo útil do uso de um pequeno número de AIMs para classificações e estimativas de proporções de ancestralidade. Ainda podem ser feitos esforços para optimizar os MIE a um número mínimo, se necessário. Por exemplo, entre os 129 MIE, aqueles que representam as diferenças entre o EUCP e o ECHP ou SCHP poderiam possivelmente ser reduzidos. Ou, para incluir mais MIE para aumentar o poder de discriminação entre ECHP e SCHP.
Vale a pena notar que um dos pré-requisitos importantes para obter MIE eficazes tanto para a classificação como para a estimativa de ascendência é encontrar boas populações de referência. Por exemplo, Daya et al. (2013) relataram que um painel de 96 MIE poderia ser usado para inferir as proporções de ancestralidade para a população sul-africana colorida (SAC), usando populações representativas. Contudo, esses marcadores não tiveram um bom desempenho na inferência dos ancestrais do Sul da Ásia e do Leste Asiático. No nosso estudo, 10 raças puras de suínos de três grupos (ECHP, SCHP e EUCP) são escolhidas como populações de referência. Há várias razões pelas quais escolhemos estas raças. Em primeiro lugar, muitos suínos comerciais europeus ou cruzamentos de raças autóctones com raças comerciais europeias tornam-se cada vez mais comuns na China, pelo que aqui as principais raças comerciais europeias importadas, incluindo Duroc, Pietrain e Landrace, foram escolhidas como populações representativas do EUCP. Em segundo lugar, as raças chinesas incluídas neste estudo cobriam dois antecedentes ancestrais designados. No estudo Yang et al. (Yang et al., 2017), China_Erhualian (CNEH), China_Jinhua (CNJH), China_Meishan (CNMS) os porcos são claramente derivados de uma ascendência, e China_Bamaxiang (CNBX), China_Congjiangxiang (CNCJ), China_Guangdongdahuabai (CNDH) e China_Luchuan (CNLU) são claramente derivados da outra. A análise de mistura mostrou que eles são menos introgressados pelo EUCP e podem ser claramente separados um do outro. Eles constituem assim, juntos, a melhor população de referência disponível até agora, considerando tanto a pureza genética como a capacidade de revelar a mistura potencial em outras raças chinesas. Se raças mais puras forem incluídas no conjunto de referência no futuro, pode-se esperar uma estimativa mais precisa, assim como uma gama mais ampla de populações onde nosso método poderia ser aplicável.
Contribuições dos autores
YZ concebeu e supervisionou o estudo. ZL analisou o conteúdo principal dos dados com o auxílio de LB, YQ, YP, e RY. ZL e YZ escreveram o manuscrito. Todos os autores leram e aprovaram o manuscrito final.
Funding
O projeto foi apoiado pelo Programa Nacional de Pesquisa e Desenvolvimento de Tecnologia Chave (2015BAD03B01-01) e pela Fundação Nacional de Ciências Naturais da China (U1704233).
Conflito de interesses
Os autores declaram que a pesquisa foi realizada na ausência de qualquer relação comercial ou financeira que pudesse ser interpretada como um potencial conflito de interesses.
Material Suplementar
O Material Suplementar para este artigo pode ser encontrado online em: https://www.frontiersin.org/articles/10.3389/fgene.2019.00183/full#supplementary-material
Pés
- ^http://dx.doi.org/10.5061/dryad.30tk6
- ^https://github.com/boxiangliu/ANTseq
- ^http://www.curveexpert.net
Ai, H., Huang, L., e Ren, J. (2013). Diversidade genética, desequilíbrio de ligação e assinaturas de seleção em porcos chineses e ocidentais revelados por marcadores do SNP em todo o genoma. PLoS One 8:e56001. doi: 10.1371/journal.pone.0056001
PubMed Abstract | CrossRef Full Text | Google Scholar
Alexander, D. H., Novembre, J., e Lange, K. (2009). Estimativa rápida baseada em modelos de ancestralidade em indivíduos não relacionados. Genome Res. 19, 1655-1664. doi: 10.1101/gr.094052.109
PubMed Abstract | CrossRef Full Text | Google Scholar
Barbosa, F. B., Cagnin, N. F., Simioni, M., Farias, A. A., Torres, F. R., Molck, M. C., et al. (2017). Painel de marcador informativo de ascendência para estimar a estratificação da população usando a matriz humana do genoma. Ann. Hum. Genet. 81, 225-233. doi: 10.1111/ahg.12208
PubMed Abstract | CrossRef Full Text | Google Scholar
Bauchet, M., McEvoy, B., Pearson, L. N., Quillen, E. E., Sarkisian, T., Hovhannesyan, K., et al. (2007). Measuring european population stratification with microarray genotype data. Am. J. Hum. Genet. 80, 948-956. doi: 10.1086/513477
PubMed Abstract | CrossRef Full Text | Google Scholar
Berthouly-Salazar, C., Thevenon, S., Van, T. N., Nguyen, B. T., Pham, L. D., Chi, C. V., et al. (2012). Amistura descontrolada e perda da diversidade genética numa raça de porcos vietnamita local. Ecol. Evol. 2, 962-975. doi: 10.1002/ece3.229
PubMed Abstract | CrossRef Full Text | Google Scholar
Bertolini, F., Galimberti, G., Schiavo, G., Mastrangelo, S., Di Gerlando, R., Strillacci, M. G., et al. (2017). As estatísticas de pré-seleção e a classificação aleatória das florestas identificam polimorfismos de nucleotídeos únicos informativos da população em raças bovinas cosmopolitas e autóctones. Animal 12, 12-19. doi: 10.1017/S1751731117001355
PubMed Abstract | CrossRef Full Text | Google Scholar
Bianco, E., Soto, H. W., Vargas, L., e Perez-Enciso, M. (2015). O genoma quimérico da Isla del Coco feral pigs (Costa Rica), uma população isolada desde 1793, mas com níveis de diversidade notáveis. Mol. Ecol. 24, 2364-2378. doi: 10.1111/mec.13182
PubMed Abstract | CrossRef Full Text | Google Scholar
Bosse, M., Madsen, O., Megens, H. J., Frantz, L. A. F., Paudel, Y., Crooijmans, R. P., et al. (2015). Origem híbrida dos porcos comerciais europeus examinados através de uma análise haplótipo aprofundada sobre o cromossoma 1. Frente. Genet. 5:442. doi: 10.3389/Fgene.2014.00442
PubMed Abstract | CrossRef Full Text | Google Scholar
Bosse, M., Megens, H. J., Frantz, L. A. F., Madsen, O., Larson, G., Paudel, Y., et al. (2014). Genomic analysis reveals selection for asian genes in european pigs following human-mediated introgression. Nat. Commun. 5:4392. doi: 10.1038/Ncomms5392
PubMed Abstract | CrossRef Full Text | Google Scholar
Bouchemousse, S., Liautard-Haag, C., Bierne, N., and Viard, F. (2016). Distinguindo a hibridização contemporânea da introgressão passada com SNPs pós-informativos ancestrais em espécies de Ciona fortemente diferenciadas. Mol. Ecol. 25, 5527-5542. doi: 10.1111/mec.13854
PubMed Abstract | CrossRef Full Text | Google Scholar
Browning, S. R., and Browning, B. L. (2007). Fases rápidas e precisas do haplótipo e inferência de dados ausentes para estudos de associação de todo o genoma através do uso de agrupamento de haplótipos localizados. Am. J. Hum. Genet. 81, 1084-1097. doi: 10.1086/521987
PubMed Abstract | CrossRef Full Text | Google Scholar
Da Mota, B., Tudoran, R., Costan, A., Varoquaux, G., Brasche, G., Conrod, P., et al. (2014). Padrões de aprendizagem de máquinas para estudos neuro-imagem-genéticos na nuvem. Frente. Neuroinformação. 8:31. doi: 10.3389/Fnininf.2014.00031
PubMed Abstract | CrossRef Full Text | Google Scholar
Dai, F. W., Feng, D. Y., Cao, Q. Y., Ye, H., Zhang, C. M., Xia, W. G., et al. (2009). Diferenças de desenvolvimento em carcaça, qualidade da carne e características das fibras musculares entre a landrace e um porco nativo chinês. S. Afr. J. Animais. Sci. 39, 267-273.
Google Scholar
Daya, M., van der Merwe, L., Galal, U., Moller, M., Salie, M., Chimusa, E. R., et al. (2013). Um painel de marcadores informativos ancestrais para a complexa população sul-africana de cor de cinco vias misturada. PLoS One 8:e82224. doi: 10.1371/journal.pone.0082224
PubMed Abstract | CrossRef Full Text | Google Scholar
Dimauro, C., Nicoloso, L., Cellesi, M., Macciotta, N. P. P., Ciani, E., Moioli, B., et al. (2015). Seleção de marcadores discriminantes de SNP para raça e atribuição geográfica de ovinos italianos. Pequeno Rumin. Res. 128, 27-33. doi: 10.1016/j.smallrumres.2015.05.001
CrossRef Full Text | Google Scholar
Ding, L. L., Wiener, H., Abebe, T., Altaye, M., Go, R. C. P., Kercsmar, C., et al. (2011). Comparação de medidas de informatividade de marcadores para mapeamento de ancestralidade e mistura. BMC Genomics 12:622. doi: 10.1186/1471-2164-12-622
PubMed Abstract | CrossRef Full Text | Google Scholar
Fang, M., Hu, X., Jiang, T., Braunschweig, M., Hu, L., Du, Z., et al. (2005). A filogenia das raças de porcos indígenas chineses inferida a partir de marcadores de microsatélites. Anim. Genet. 36, 7-13. doi: 10.1111/j.1365-2052.2004.01234.x
PubMed Abstract | CrossRef Full Text | Google Scholar
Frantz, L. A. F., Schraiber, J. G., Madsen, O., Megens, H. J., Bosse, M., Paudel, Y., et al. (2013). A sequenciação do genoma revela a história da diversificação e reticulação em escala fina durante a especiação em Sus. Genome Biol. 14:R107. doi: 10.1186/Gb-2013-14-9-R107
PubMed Abstract | CrossRef Full Text | Google Scholar
Galanter, J. M., Fernandez-Lopez, J. C., Gignoux, C. R., Barnholtz-Sloan, J., Fernandez-Rozadilla, C., Via, M., et al. (2012). Desenvolvimento de um painel de marcadores informativos sobre a ancestralidade do genoma para estudar a mistura em todas as américas. PLoS Genet. 8:e1002554. doi: 10.1371/journal.pgen.1002554
PubMed Abstract | CrossRef Full Text | Google Scholar
Getachew, T., Huson, H. J., Wurzinger, M., Burgstaller, J., Gizaw, S., Haile, A., et al. (2017). Identificação de marcadores genéticos altamente informativos para quantificação das proporções de ascendência em populações de ovinos cruzados: implicações na escolha dos níveis ótimos de mistura. BMC Genet. 18:80. doi: 10.1186/s12863-017-0526-2
PubMed Abstract | CrossRef Full Text | Google Scholar
Gong, H., Xiao, S., Li, W., Huang, T., Huang, X., Yan, G., et al. (2018). Desvendando os loci genéticos para crescimento e características de carcaça em suínos Bamaxiang chineses com base em uma matriz de 1,4 milhões de SNP. J. Anim. Raça. Genet. 136, 3-14. doi: 10.1111/jbg.12365
PubMed Abstract | CrossRef Full Text | Google Scholar
Groenen, M. A. M. (2016). Uma década de seqüenciamento do genoma suíno: uma janela sobre domesticação e evolução do porco. Genet. Sel. Evol. 48:23. doi: 10.1186/s12711-016-0204-2
PubMed Abstract | CrossRef Full Text | Google Scholar
Hong, J. H., and Cho, S. B. (2008). Uma estratégia probabilística multiclasse de máquinas vetoriais de apoio ao repouso de um Vs. para classificação do câncer. Neurocomputing 71, 3275-3281. doi: 10.1016/j.neucom.2008.04.033
CrossRef Full Text | Google Scholar
Kwon, T., Yoon, J., Heo, J., Lee, W., e Kim, H. (2017). Rastreamento da fazenda de criação de suínos domésticos usando seleção de características (Sus scrofa). Asian Aust. J. Anim. Sci. 30, 1540-1549. doi: 10.5713/ajas.17.0561
PubMed Abstract | CrossRef Full Text | Google Scholar
Larson, G., Dobney, K., Albarella, U., Fang, M. Y., Matisoo-Smith, E., Robins, J., et al. (2005). A filogeografia mundial de javalis revela múltiplos centros de domesticação de porcos. Science 307, 1618-1621. doi: 10.1126/science.1106927
PubMed Abstract | CrossRef Full Text | Google Scholar
Lawson, D. J., Hellenthal, G., Myers, S., e Falush, D. (2012). Inferência da estrutura da população usando dados densos do haplótipo. PLoS Genet. 8:e1002453. doi: 10.1371/journal.pgen.1002453
PubMed Abstract | CrossRef Full Text | Google Scholar
Lee, S., Epstein, M. P., Duncan, R., and Lin, X. H. (2012). Análise de componentes principais esparsa para a identificação de marcadores de ancestralidade-informativos em estudos de associação de todo o genoma. Genet. Epidemiol. 36, 293-302. doi: 10.1002/gepi.21621
PubMed Abstract | CrossRef Full Text | Google Scholar
Li, C. X., Pakstis, A. J., Jiang, L., Wei, Y. L., Sun, Q. F., Wu, H., et al. (2016). Um painel de 74 AISNPs: inferência melhorada da ancestralidade dentro da Ásia Oriental. Ciência Forense. Int. Genet. 23, 101-110. doi: 10.1016/j.fsigen.2016.04.002
PubMed Abstract | CrossRef Full Text | Google Scholar
Li, S.-J., Yang, S.-H., Zhao, S.-H., Fan, B., Yu, M., Wang, H.-S., et al. (2004). Análise da diversidade genética de 10 populações indígenas de porcos chineses com base em 20 microssatélites. J. Anim. Sci. 82, 368-374. doi: 10.2527/2004.822368x
PubMed Abstract | CrossRef Full Text | Google Scholar
Maples, B. K., Gravel, S., Kenny, E. E., e Bustamante, C. D. (2013). RFMix: uma abordagem de modelagem discriminatória para uma rápida e robusta inferência local-ancestral. Am. J. Hum. Genet. 93, 278-288. doi: 10.1016/j.ajhg.2013.06.020
PubMed Abstract | CrossRef Full Text | Google Scholar
Monzon, J., Kays, R., and Dykhuizen, D. E. (2014). Avaliação da mistura coiote-molf-dog usando SNPs de diagnóstico de ancestrais-informativos. Mol. Ecol. 23, 182-197. doi: 10.1111/mec.12570
PubMed Abstract | CrossRef Full Text | Google Scholar
Pardo-Seco, J., Martinon-Torres, F., e Salas, A. (2014). Avaliando a precisão dos painéis AIM em quantificar a ancestralidade do genoma. BMC Genomics 15:543. doi: 10.1186/1471-2164-15-543
PubMed Abstract | CrossRef Full Text | Google Scholar
Patterson, N., Price, A. L., and Reich, D. (2006). Estrutura populacional e auto-análise. PLoS Genet. 2:e190. doi: 10.1371/journal.pgen.0020190
PubMed Abstract | CrossRef Full Text | Google Scholar
Peterson, R. E., Edwards, A. C., Bacanu, S. A., Dick, D. M., Kendler, K. S., e Webb, B. T. (2017). A utilidade da atribuição empírica de grupos de ascendência em estudos genéticos de dependência entre populações. Am. J. Viciado. 26, 494-501. doi: 10.1111/ajad.12586
PubMed Abstract | CrossRef Full Text | Google Scholar
Qin, P., Li, Z., Jin, W., Lu, D., Lou, H., Shen, J., et al. (2014). Um painel de marcadores informativos ancestrais para estimar e corrigir os efeitos potenciais da estratificação da população na China Han. Eur. J. Hum. Genet. 22, 248-253. doi: 10.1038/ejhg.2013.111
PubMed Abstract | CrossRef Full Text | Google Scholar
Rosenberg, N. A., Li, L. M., Ward, R., and Pritchard, J. K. (2003). Informativeness of genetic markers for inference of ancestry. Am. J. Hum. Genet. 73, 1402-1422. doi: 10.1086/380416
PubMed Abstract | CrossRef Full Text | Google Scholar
Santos, H. C., Horimoto, A. V. R., Tarazona-Santos, E., Rodrigues-Soares, F., Barreto, M. L., Horta, B. L., et al. (2016). Um conjunto mínimo de marcadores informativos ancestrais para determinar as proporções de mistura numa população americana mista: o conjunto brasileiro. Eur. J. Hum. Genet. 24, 725-731. doi: 10.1038/ejhg.2015.187
PubMed Abstract | CrossRef Full Text | Google Scholar
Shriver, M. D., Parra, E. J., Dios, S., Bonilla, C., Norton, H., Jovel, C., et al. (2003). Pigmentação da pele, ancestralidade biogeográfica e mapeamento de misturas. Hum. Genet. 112, 387-399. doi: 10.1007/s00439-002-0896-y
PubMed Abstract | CrossRef Full Text | Google Scholar
Sun, K., Ye, Y., Luo, T., and Hou, Y. (2016). Análise Multi-InDel para inferência de ancestrais de sub-populações na China. Sci. Rep. 6:3979797. doi: 10.1038/srep3979797
PubMed Abstract | CrossRef Full Text | Google Scholar
Tian, C., Kosoy, R., Nassir, R., Lee, A., Villoslada, P., Klareskog, L., et al. (2009). Sub-estrutura genética da população europeia: definição adicional de marcadores informativos ancestrais para distinguir entre os diversos grupos étnicos europeus. Mol. Med. 15, 371-383. doi: 10.2119/molmed.2009.00094
PubMed Abstract | CrossRef Full Text | Google Scholar
vonHoldt, B. M., Kays, R., Pollinger, J. P., e Wayne, R. K. (2016). O mapeamento de mistura identifica regiões genômicas introgressadas em canídeos norte-americanos. Mol. Ecol. 25, 2443-2453. doi: 10.1111/mec.13667
PubMed Abstract | CrossRef Full Text | Google Scholar
Yang, B., Cui, L. L., Perez-Enciso, M., Traspov, A., Crooijmans, R. P. M. A., Zinovieva, N., et al. (2017). Dados do SNP para todo o genoma revelam a globalização dos porcos domesticados. Genet. Sel. Evol. 49:71. doi: 10.1186/s12711-017-0345-y
PubMed Abstract | CrossRef Full Text | Google Scholar
Zeng, X. P., Chakraborty, R., King, J. L., Larue, B., Moura-Neto, R. S., e Budowle, B. (2016). Seleção de marcadores altamente informativos do SNP para afiliação populacional das principais populações dos EUA. Int. J. Med. Legal. 130, 341-352. doi: 10.1007/s00414-015-1297-9
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhang, C., Lin, D., Wang, Y., Peng, D., Li, H., Fei, J., et al. (2019). Introdução generalizada em raças de galinhas indígenas chinesas de frangos de corte comerciais. Evol. Appl. 12, 610-621. doi: 10.1111/eva.12742
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhang, F., Zhang, L., and Deng, H. W. (2009). Um método baseado em PCA para seleção de marcadores informativos ancestrais em populações estruturadas. Sci. Chin. Série C Life Sci. 52, 972-976. doi: 10.1007/s11427-009-0128-y
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhao, P., Yu, Y., Feng, W., Du, H., Yu, J., Kang, H., et al. (2018). Evidências da história evolutiva e varreduras seletivas no genoma do porco Meishan revelam sua caracterização genética e fenotípica. Gigascience 7. doi: 10.1093/gigascience/giy058
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhu, Y., Li, W., Yang, B., Zhang, Z., Ai, H., Ren, J., et al. (2017). Assinaturas de seleção e introgressão interespécies no genoma dos porcos domésticos chineses. Biol do Genoma. Evol. 9, 2592-2603. doi: 10.1093/gbe/evx186
PubMed Abstract | CrossRef Full Text | Google Scholar