Frontières en génétique
- Introduction
- Matériel et méthodes
- Collecte des données et contrôle de qualité
- Structure de la population
- Sélection des AIM
- Classification des groupes avec des MIA minimaux
- Inférence d’ascendance avec des AIM optimaux
- Résultats
- Structure des populations de référence
- Classification des groupes à l’aide des MIA
- Estimation précise de la proportion d’ascendance à l’aide des AIM
- Estimation de la proportion d’ascendance pour l’ensemble de données de test
- Discussion
- Contributions de l’auteur
- Funding
- Déclaration de conflit d’intérêts
- Matériel supplémentaire
- Notes de bas de page
Introduction
Le polymorphisme mononucléotidique (SNP) et l’insertion-délétion (InDel) autosomiques sont largement utilisés pour l’inférence de l’ascendance humaine et l’affectation de la population (Bauchet et al, 2007 ; Tian et al., 2009 ; Sun et al., 2016). Les marqueurs informatifs d’ascendance (AIM) sont des marqueurs génétiques de différences de fréquence entre les populations (Shriver et al., 2003). De multiples statistiques ont été utilisées pour obtenir des MIA, notamment les statistiques F (FST), les différences absolues de fréquence des allèles (δ), la mesure de l’informativité pour l’assignation (In) et les scores de chargement des composantes principales (Rosenberg et al., 2003 ; Zhang et al., 2009 ; Ding et al., 2011 ; vonHoldt et al., 2016 ; Barbosa et al., 2017 ; Peterson et al., 2017). Au lieu d’utiliser des marqueurs du génome entier, les MIA ont été considérés comme suffisamment précis pour l’inférence de l’ascendance pour une taille de population limitée. Par conséquent, cela constitue un moyen économique de cribler et d’analyser des milliers d’échantillons. Santos et al. (2016) ont signalé que 192 MIA sélectionnés à partir de données SNP ∼370 K peuvent être utilisés pour estimer avec précision les proportions d’ascendance de trois grandes populations au Brésil. Li et al. (2016) ont développé un panel de 74 MIA pour inférer les proportions d’ascendance de 500 individus tests issus de 11 populations. En raison de la haute résolution des MIA, un panel de 23 MIA généré par Zeng et al. (2016). a distingué quatre grandes populations américaines, et a correctement attribué l’ascendance pour neuf populations supplémentaires (Zeng et al., 2016).
Pour la génétique des populations animales, les MIA ont été appliqués avec succès pour identifier les races de différentes variétés et évaluer les compositions génétiques dans les populations hybrides (Dimauro et al., 2015 ; Bouchemousse et al., 2016). Bertolini et al. (2017) ont constaté que 96 AIM ont donné de bons résultats pour discriminer six races de bovins laitiers. Dans une autre étude, 63 MIA sélectionnés parmi 427 canidés ont été utilisés pour évaluer l’admixtion génétique chez les coyotes (Monzon et al., 2014). Récemment, 74 MIA ont été utilisés pour calculer les proportions d’ascendance chez les moutons croisés (Awassi avec deux races indigènes en Éthiopie), et il a été constaté que différents niveaux d’admixture d’Awassi affectaient significativement les traits de la croissance des agneaux et de la reproduction des brebis (Getachew et al…, 2017).
Les porcs (Sus scrofa) ont divergé en sangliers européens et asiatiques au milieu du Pléistocène (il y a 1,2-0,8 millions d’années) (Larson et al., 2005 ; Frantz et al., 2013). La domestication du porc en Chine a eu lieu il y a ∼9 000 ans (Larson et al., 2005). Il a été documenté que les porcs domestiques chinois étaient divisés en six types selon la région d’habitation et les caractéristiques phénotypiques (I-Chine du Nord, II-Bassin inférieur du Changjiang, III-Chine centrale, IV-Chine du Sud, V-Sud-Ouest et VI-Plateau) (Li et al., 2004 ; Fang et al., 2005). Dans une étude récente, Yang et al. (2017). ont suivi les ascendances de diverses races chinoises et ont identifié deux principales ascendances distinctes, qui sont l’origine de la Chine de l’Est (par exemple, Meishan et JinHua) et de la Chine du Sud (par exemple, Luchuan et Bamaxiang). En outre, l’introgression génomique des races commerciales européennes vers les porcs indigènes chinois a également été signalée (Ai et al., 2013 ; Bosse et al., 2014 ; Zhu et al…, 2017), ce qui rend les compositions génétiques des porcs chinois modernes encore plus compliquées.
Bien qu’elle ait été largement appliquée chez d’autres animaux, et qu’elle soit d’une grande importance dans des scénarios d’application spécifiques, notamment la surveillance du marché et la protection des ressources génétiques, il n’existe actuellement aucune étude qui aborde spécifiquement le problème de l’utilisation efficace des MIA pour distinguer les races de porcs ou pour estimer les proportions d’ascendance. Ici, en utilisant les données des puces SNP de ∼60 K des porcs, nous avons recherché le nombre optimal de MIA pour distinguer les porcs d’origine chinoise orientale, chinoise méridionale ou européenne. Sur la base de 129 AIM sélectionnés, nous avons estimé les proportions d’ascendance des origines ci-dessus pour d’autres porcs chinois. Nous avons suggéré que les MIA sélectionnés à partir de populations de référence non mélangées pourraient être utilisés pour estimer avec précision les proportions d’ascendance dans les populations hybrides. Nos résultats fournissent un exemple utile de l’utilisation des MIA pour la classification des races et l’estimation de l’ascendance chez les porcs.
Matériel et méthodes
Collecte des données et contrôle de qualité
Les données de génotypage de 2 113 échantillons ont été extraites du dépôt numérique Dryad1. Seuls les échantillons provenant de races asiatiques, et de races européennes ont été utilisés dans cette étude (un total de 1 157 échantillons provenant de 71 populations, détails dans le tableau supplémentaire S1). Les échantillons et les SNP ont été exclus si les critères suivants étaient remplis : (1) un individu contenait plus de 10 % de génotypes manquants ; (2) des SNP avec un taux d’appel inférieur à 95 % ; (3) des SNP avec une fréquence d’allèle mineur inférieure à 0,05 ; (4) des SNP qui étaient situés sur les chromosomes sexuels ; et (5) des SNP qui n’étaient pas bialéliques. Les génotypes manquants ont ensuite été imputés en utilisant BEAGLE (version 3.3.2) (Browning et Browning, 2007). Finalement, il restait 45 562 SNP et 1 155 échantillons. Les 1 155 échantillons ont ensuite été divisés en deux ensembles de données. Pour l’ensemble de référence, 186 échantillons ont été choisis parmi 10 populations représentatives des trois principaux groupes d’ascendance : le porc de Chine orientale (PCM), le porc de Chine méridionale (PCM) et le porc commercial européen (PCUE). Les 10 populations ont été sélectionnées sur la base du fait qu’il n’y avait pas de mélange évident entre les populations appartenant au groupe ECHP ou SCHP, selon un rapport de Yang et al. (2017). Cet ensemble de données est résumé dans le tableau 1. L’ensemble de données de test contenait les 969 échantillons restants provenant de 61 populations (détails dans le tableau supplémentaire S2). Compte tenu de la commodité de l’application pratique, les données de génotype de l’ensemble de données de test ont été directement extraites des données brutes sans mise en phase ni imputation.
Tableau 1. Informations sur les races porcines dans l’ensemble de référence.
Structure de la population
L’analyse en composantes principales (ACP) a été réalisée sur les données de la puce ∼60 K en utilisant SMARTPCA (version 6.1.4) dans l’ensemble de référence (Patterson et al., 2006). Pour confirmer le statut de non-mixité, la méthode non supervisée ADMIXTURE (version 1.23) (Alexander et al., 2009) a été utilisée pour calculer les proportions d’ascendance des échantillons de l’ensemble de référence, le nombre d’ascendances (K) allant de K = 3 à K = 15. Le modèle lié ChromoPainter v2 (Lawson et al., 2012) a également été choisi pour explorer la similarité/dissimilarité des individus de l’ensemble de référence. En détail, le fichier de carte de recombinaison a été généré à l’aide du script makeuniformrecfile.pl fourni par fineSTRUCTURE (version 2.1.1) (Lawson et al., 2012). En utilisant un profil de modèle de Markov caché, ChromoPainter v2 infère les haplotypes du « donneur » et du « receveur » pour créer une matrice de coancestry. Initialement, 20 étapes de maximisation de l’espérance ont été utilisées pour estimer le taux de mutation et de commutation sur 1/5 des membres de l’échantillon aléatoire de tous les individus avec tous les autosomes considérés. Les taux de mutation et de commutation déduits pour chaque chromosome ont ensuite été moyennés. Ensuite, avec les taux de mutation et de commutation estimés et les autres valeurs par défaut, ChromoPainter v2 a de nouveau été utilisé pour générer la matrice de coancestry pour tous les individus. Enfin, l’algorithme MCMC implémenté dans fineSTRUCTURE a été employé pour regrouper hiérarchiquement les individus avec un burn-in et un temps d’exécution de 1 000 000 et 6 000 000 itérations, respectivement.
Sélection des AIM
L’ensemble des 186 échantillons du jeu de données de référence a été utilisé pour calculer le FST et l’In. Les SNP candidats ont été sélectionnés à partir du sélecteur d’algorithme AIMs qui a été implémenté dans AIMs_generator.py du pipeline ANTseq2. Plus précisément, nous avons d’abord exclu les SNP en déséquilibre de liaison (LD) élevé en sélectionnant un seul SNP dans une région de LD fort (r2 > 0,3) et à une distance de 500 kb. Au sein de chaque groupe, les SNP qui présentaient des fréquences hétérogènes entre les populations ont en outre été exclus sur la base d’un test du chi carré (Galanter et al., 2012). Ensuite, la FST et l’In ont été calculés pour chacun des trois groupes appariés : PCM vs PCUE, PCS vs PCUE, et PCM vs PCS (Rosenberg et al., 2003).
Classification des groupes avec des MIA minimaux
En utilisant l’ensemble de données de référence, nous avons d’abord comparé le pouvoir discriminatoire des MIA sélectionnés par la FST ou l’In. La classification binaire pour les trois groupes appariés a été effectuée séparément. Pour chaque groupe apparié, nous avons commencé par sélectionner les deux à 30 premiers AIM, avec un incrément d’un AIM. Les échantillons du groupe apparié correspondant ont été répartis aléatoirement en deux proportions : 75% pour l’entraînement, 25% pour le test, et cette opération a été répétée 50 fois. GridSearchCV, implémenté dans le package Scikit-learn (version 0.18), a ensuite été utilisé pour déterminer les paramètres optimaux d’un classificateur de type machine à vecteurs de support (SVM) (Da Mota et al., 2014). Les paramètres du SVM sont résumés dans le tableau supplémentaire S3. Pour le modèle avec des paramètres optimaux, la précision de la classification a été évaluée par la moyenne du coefficient de corrélation de Matthews (MMCC) pour 50 répétitions comme suit :
où TNi et FNi sont le nombre de vrais négatifs et de faux négatifs, et TPi et FPi sont le nombre de vrais positifs et de faux positifs, pour chaque passage.
Pour déterminer le nombre minimal de MIA permettant de distinguer simultanément la PCM, la PCS et la PCUE, une approche multiclasse de SVM à un vs.rest a été employée sur l’ensemble de données de référence (Hong et Cho, 2008). De même, nous avons commencé par sélectionner les deux à 200 meilleurs MIA de chacun des groupes appariés, avec un incrément d’un MIA, ce qui a donné 199 ensembles de MIA au total. Dans chaque ensemble, les AIM sélectionnés dans les trois groupes appariés ont été fusionnés et les AIM en double ont été supprimés (tableau supplémentaire S4). Le MMCC n’ayant pas été conçu pour évaluer la précision de la classification multiclasse, la matrice de confusion, la statistique kappa de Cohen et le taux d’erreur équilibré ont été utilisés pour évaluer la précision de la classification. Un kappa de Cohen plus élevé mais un taux d’erreur équilibré plus faible indiquent une classification plus précise. Nous avons de nouveau utilisé GridSearchCV pour estimer les meilleurs paramètres pour le SVM à un contre un, dont les paramètres sont résumés dans le tableau supplémentaire S3. Nous avons également généré des ensembles de SNP aléatoires de nombre égal à partir du génome entier pour comparer le pouvoir discriminatoire des AIM sélectionnés.
Inférence d’ascendance avec des AIM optimaux
Les AIM ont été largement utilisés pour estimer les proportions d’ascendance dans les populations hybrides, même dans les cas où ils ont été sélectionnés à partir de populations non mélangées. Sur la base de MIA sélectionnés, pour estimer les proportions d’ascendance de possibles populations porcines admixes, nous avons employé une stratégie similaire à celle utilisée dans une étude précédente de Pardo-Seco et al. (2014). Nous avons d’abord généré des individus pseudo-admixtes en sélectionnant au hasard les génotypes des MIA sélectionnés dans les échantillons de l’ensemble de données de référence avec des proportions égales. Par conséquent, les proportions d’ascendance attendues de ces individus pseudo-mixtes étaient de 1/3 (∼0,3333) de chaque groupe (PCM, PCS et PCUE). Pour chacun des 199 ensembles AIM générés à partir de ce qui précède, 1 000 simulations ont été effectuées. ADMIXTURE supervisé (K = 3) a été utilisé pour estimer les proportions d’ascendance. Les performances ont été évaluées par la moyenne et le coefficient de variation (CV) des proportions d’ascendance estimées. Le CV des proportions d’ascendance estimées en fonction du nombre d’AIMs a été ajusté par le programme Curve Expert 1.43. Le nombre optimal d’AIMs a été déterminé en sélectionnant la pente du seuil tangent de la courbe dont la performance stable a été observée au-delà de ce point. Pour ajouter une validation supplémentaire, nous avons simulé des individus pseudo-mixtes avec des proportions d’ascendance aléatoires en utilisant le nombre optimal de MIA déterminé. Les proportions d’ascendance de PCM, PCS et PCUE ont été attribuées de manière aléatoire avec une proportion minimale fixée à 10%.
Sur la base des MIA sélectionnés lors de la dernière étape, nous avons effectué une inférence d’ascendance pour les 969 individus de l’ensemble de données de test par ADMIXTURE supervisé. La performance a été évaluée par le coefficient de corrélation de Pearson entre les SNP pangénomiques et le nombre optimal de MIA.
Résultats
Structure des populations de référence
Les populations de l’ensemble de référence étaient censées être les moins admixées. Nous avons cependant observé que la PCM, la PCS et la PCUE étaient bien séparées dans un graphique en composantes principales (figure 1A). La distribution de la TSF à l’échelle du génome (figure 1B) a montré une plus grande différenciation entre PCM et PCUE (moyenne = 0,2197, IC à 95 % 0,0006-0,7267) et PCS et PCUE (moyenne = 0,2153, IC à 95 % 0,0005-0,7570), tandis que la différenciation entre PCM et PCS (moyenne = 0,0588, IC à 95 % 0-0,3342) était nettement moins prononcée. En utilisant ADMIXTURE, toutes les races ont été bien divisées en groupes anticipés (figure 1C) lorsque K = 3, conformément à l’étude précédente de Yang et al. (2017). Lorsque K = 10, 10 populations ont pu être séparées clairement, conformément à notre attente que les 10 populations étaient les moins admixées (figure supplémentaire S1).
Figure 1. Structure de la population de 10 races dans l’ensemble de données de référence. (A) Analyse en composantes principales (ACP) des données de la puce ∼60 K. (B) La distribution de la TSF à l’échelle du génome pour les trois groupes appariés : PCM vs PCUE, PCS vs PCUE et PCM vs PCS. La ligne verticale rouge représente la moyenne de la distribution de la TSF. Les lignes verticales en pointillés représentent les percentiles 2,5 et 97,5 % de la distribution de la TSF. (C) Regroupement ADMIXTURE des données de puce ∼60 K lorsque K = 3-12. CNBX, China_Bamaxiang ; CNCJ, China_Congjiangxiang ; CNLU, China_Luchuan ; CNDH, China_Guangdongdahuabai ; CNJH, China_Jinhua ; CNEH, China_Erhualian ; CNMS, China_Meishan ; DUR2, Duroc2 ; PIT1, Pietrain1 ; LDR1, Landrace1. Les codes de couleur pour les grands crochets sont les suivants : vert : Porc de Chine orientale (PCM) ; rouge : Porc de Chine du Sud (SCHP) ; bleu : Porc commercial européen (PCUE).
Pour une quantification plus poussée, les programmes ChromoPainter v2 et fineSTRUCTURE ont été employés pour vérifier la relation entre ces races en considérant le DL. Comme le montre la carte de chaleur de la coancestrie (Figure 2), les individus de chaque groupe présentaient un schéma homogène, et ceux du même groupe partageaient plus de morceaux génétiques que ceux des autres groupes. En particulier, la PCUE présentait un degré négligeable de coancestrie avec les individus des races indigènes chinoises. L’échantillon de la PCM et de la PCSB présentait un degré de coancestrie plus élevé, mais les individus du même groupe avaient toujours tendance à se regrouper davantage qu’entre les groupes. En résumé, les résultats suggèrent que les échantillons de l’ensemble de données de référence présentaient un niveau négligeable de mélange.
Figure 2. Analyse fineSTRUCTURE dans l’ensemble de données de référence. La carte thermique montre le nombre de morceaux génétiques partagés copiés d’un génome donneur (colonne) à un génome receveur (ligne). CNBX, China_Bamaxiang ; CNCJ, China_Congjiangxiang ; CNLU, China_Luchuan ; CNDH, China_Guangdongdahuabai ; CNJH, China_Jinhua ; CNEH, China_Erhualian ; CNMS, China_Meishan ; DUR2, Duroc2 ; PIT1, Pietrain1 ; LDR1, Landrace1. Les codes de couleur sont les suivants : vert : Porc de Chine orientale (PCM) ; rouge : Porc de Chine du Sud (SCHP) ; bleu : Porc commercial européen (PCUE).
Classification des groupes à l’aide des MIA
Afin de construire un ensemble efficace de MIA, nous avons d’abord comparé les performances des statistiques FST et des statistiques In. Pour un groupe apparié de PCM vs PCUE et de PCS vs PCUE, un minimum de deux MIA s’est avéré suffisant pour aboutir à une séparation parfaite (MMCC = 1), soit en sélectionnant la meilleure TSF, soit par les meilleures statistiques In (figure supplémentaire S2). Cependant, pour séparer le PCM du PPB, il fallait au moins quatre MIA en utilisant la TSF, ou au moins cinq en utilisant la statistique In. Pour les MIA sélectionnés par la TSF ou In, nous avons constaté que les MIA informatifs sélectionnés par In se chevauchaient largement avec les MIA sélectionnés par la TSF, ce qui indique que la TSF est au moins aussi informative que In. Par conséquent, les analyses suivantes étaient basées uniquement sur les AIM sélectionnés par la TSF.
Puis, nous avons tenté d’identifier le nombre d’AIM qui pourraient être utilisés pour séparer les PCM, les PCS et les PCUE simultanément en utilisant une approche multiclasse. Comme décrit dans Matériels et Méthodes, les deux à 200 MIA les mieux classés ont été sélectionnés séquentiellement à partir de PCM vs PCUE, PCS vs PCUE et PCM vs PCS, respectivement, ce qui a donné lieu à 199 ensembles de MIA de nombre croissant (Tableau supplémentaire S4). Les AIM de chaque ensemble ont été fusionnés et dédupliqués. Par exemple, pour l’ensemble le plus important, 171 des 200 MIA étaient partagés entre PCM et PCUE et PCS et PCUE (figure supplémentaire S3), 12 des 200 MIA étaient partagés entre PCS et PCUE et PCM et PCS, et 14 des 200 MIA étaient partagés entre PCM et PCUE et PCS. Les 199 ensembles de MIA ont été soumis à un classificateur SVM à un contre un. Comme le montrent la figure 3 et le tableau supplémentaire S5, sept MIA étaient suffisants pour séparer complètement l’ECHP, le SCHP et l’EUCP avec le kappa de Cohen = 1 et le taux d’erreur équilibré = 0. Les informations détaillées des sept MIA ont été résumées dans le tableau 2 et le tableau supplémentaire S7.
Figure 3. Matrices de confusion pour le classificateur SVM à un contre un. (A) La performance de quatre AIMs. (B) La performance de sept AIMs. (C) La performance de quatre marqueurs aléatoires qui sont échantillonnés à partir des données du génome entier. (D) La performance de sept marqueurs aléatoires.
Tableau 2. Les valeurs FST par paire pour les 129 AIM.
Estimation précise de la proportion d’ascendance à l’aide des AIM
Les AIM sélectionnés à partir de populations non mélangées ont été signalés pour être appliqués avec succès pour estimer les proportions d’ascendance dans les populations admixtes (Lee et al., 2012 ; Maples et al., 2013). Pour valider la praticabilité de notre étude, nous avons effectué une simulation des données. Si l’étude est pratique, nous devrions observer une grande cohérence entre les proportions d’ascendance simulées et estimées. Pour chaque ensemble AIM, la méthode supervisée ADMIXTURE a été utilisée pour calculer les proportions d’ascendance dans 1 000 simulations. Pour chaque simulation, le génotype de 60 échantillons sélectionnés à partir de l’ECHP, du SCHP et de l’EUCP a été mélangé de manière aléatoire pour chaque AIM.
Comme le montrent les figures 4A,B, lorsque 80 AIM ou moins ont été inclus, de grandes différences entre la moyenne de la valeur estimée et de la valeur attendue (∼0,3333) ont été observées. Par exemple, les sept AIM fonctionnant parfaitement pour la classification n’étaient pas suffisants pour déduire avec précision les proportions d’ascendance : ECHP (moyenne = 0,2994, coefficient de variation (CV) = 0,8450), SCHP (moyenne = 0,3909, CV = 0,7783) et EUCP (moyenne = 0,3097, CV = 0,9895). Cependant, en incluant les 82 premiers AIM ou plus, les proportions estimées convergent progressivement vers les valeurs attendues (figure 4A). Même tendance pour le tracé du CV dans lequel le CV diminue à mesure que le nombre de MIA augmente (figure 4B).
Figure 4. Inférence d’ascendance sur des individus simulés à partir des 199 ensembles AIM. Dans chaque ensemble, 1 000 simulations ont été réalisées par un script python et les ascendances ont été inférées par ADMIXTURE supervisé. Les lignes pointillées verticales représentent quatre ensembles AIM : sept AIM, 82 AIM, 129 AIM et 403 AIM. (A) La moyenne des proportions d’ascendance pour les trois groupes : PCM (vert), PCS (rouge) et PCUE (bleu). La ligne horizontale noire représente la valeur attendue (∼0,3333) de chaque ascendance. (B) Le coefficient de variation (CV) des proportions d’ascendance pour les trois groupes.
Afin de déterminer l’ensemble optimal de MIA, nous avons ajusté les courbes de CV de la figure 4B avec une fonction logarithmique réciproque (figure supplémentaire S4) pour les MIA entre 82 et 403. Comme la tangente à la courbe se rapproche infiniment de zéro, nous avons déterminé un seuil arbitraire de -0,0004, qui correspond à l’ensemble de 129 AIM, en tenant compte à la fois de la stabilité de la valeur du CV et du coût du génotypage des SNP (tableau supplémentaire S6). L’ensemble AIM de 129 a donné de bons résultats dans l’inférence de l’ascendance pour les échantillons simulés (Figure 5), ce qui a donné : PCM : moyenne = 0,3310, écart type (std) = 0,0772 ; PCS : moyenne = 0,3356, std = 0,0751 ; et PCUE : moyenne = 0,3334, std = 0,0394. Nous avons également observé que la performance de l’ensemble 129 AIMs montrait une différence très limitée par rapport à celle de l’ensemble 403 AIMs, ce qui suggère que l’ensemble 129 AIMs était optimal (tableau supplémentaire S6).
Figure 5. Inférence d’ascendance sur des individus simulés à partir de 129 AIM. La ligne horizontale noire représente la valeur attendue (∼0,3333) de chaque ascendance. Les codes couleur sont les suivants : vert : PCM ; rouge : SCHP ; bleu : EUCP.
Considérant la praticabilité de l’ensemble de 129 AIMs, nous avons ensuite simulé des individus pseudo admixtes avec des proportions d’ascendance aléatoires inégales en utilisant les mêmes AIMs. nous avons d’abord produit 10 proportions d’ascendance aléatoires pour chacun des trois groupes, puis nous avons effectué 1 000 simulations sur chacune des trois proportions d’ascendance. Pour chaque simulation, 60 individus pseudo-mixtes ont été générés. Comme le montre le tableau 3, les 129 AIM ont très bien fonctionné, même pour les échantillons de proportions d’ascendance aléatoires.
Tableau 3. Simulation des proportions d’ascendance aléatoire en utilisant les 129 AIM.
Comme prévu, en utilisant les 129 AIM (tableau 2 et tableau supplémentaire S7), l’ACP a démontré que 10 populations étaient clairement divisées en trois groupes correspondants (figure supplémentaire S5). Il est intéressant de noter que, par rapport à la figure 1A, la sous-structure au sein des populations de chaque groupe était moins évidente.
Estimation de la proportion d’ascendance pour l’ensemble de données de test
Il a été signalé que certaines races porcines asiatiques ont été mélangées avec des races domestiques européennes, et surtout avec des races commerciales. Par exemple, huit races asiatiques (la race locale coréenne (KPKO), la race locale thaïlandaise (THCD), la race chinoise Lichahei (CNLC), la race chinoise Sutai (CNST), la race chinoise Kele (CNKL), la race chinoise Guanling (CNGU), la race chinoise Leanhua (CNLA) et la race chinoise Minzhu (CNMZ)) ont été signalées comme étant introgressées par au moins 20 % d’ancêtres européens (Yang et al., 2017). Afin d’identifier et de quantifier symétriquement l’introgression, nous avons utilisé les 129 AIM sélectionnés pour estimer les compositions d’ascendance de 969 autres échantillons provenant de 61 populations qui sont peut-être admixées au moins dans une certaine mesure.
Dans l’ensemble, en utilisant l’ADMIXTURE supervisé, nous avons trouvé une forte corrélation (Figure 6) entre les proportions d’ascendance calculées par 129 AIM et celles calculées par toutes les données des puces ∼60 K au niveau individuel. Le graphique de Bland-Altman a également montré des accords sur la proportion d’ascendance estimée entre les données de l’ensemble du génome et celles de 129 AIMs (Figure 7). Pour les races dont on sait qu’elles ont été introgressées à partir de l’EUCP, nous avons obtenu des résultats raisonnables. Comme le montrent la figure 8 et le tableau supplémentaire S8, l’estimation de la moyenne des trois proportions d’ascendance dans la population CNMZ en utilisant 129 AIM (ECHP:0,5325, SCHP:0,2456, EUCP:0,2219) était similaire à l’estimation de la moyenne des trois proportions d’ascendance dans la population CNMZ en utilisant les données SNP ∼60 K (ECHP:0,6457, SCHP:0,1291, EUCP:0,2252). Pour le croisement LargeWhite-Meishan (CSLM), qui a été documenté comme une génération F1 de LargeWhite × MeiShan, notre estimation de la proportion d’ascendance à partir des 129 AIM (ECHP:0,4992, SCHP:0,0455, EUCP:0,4553) était conforme à l’attente, et similaire au résultat des données SNP ∼60 K (ECHP:0,5128, SCHP:0,0020, EUCP:0,4852). Dans un autre cas, celui de la Russie Minisibs (RUMS), qui a été signalé comme possédant environ la moitié d’ascendance européenne, nous avons également obtenu un niveau élevé d’ascendance EUCP en utilisant soit 129 AIMs (ECHP:0.1428, SCHP:0,4780, EUCP:0,3791) ou des données SNP ∼60 K (ECHP:0, SCHP:0,5349, EUCP:0,4651).
Figure 6. Corrélation de Pearson entre les ascendances estimées par 129 AIM et les données de la puce ∼60 K. (A) Corrélation pour l’ascendance PCM. (B) Corrélation pour l’ascendance SCHP. (C) Corrélation pour l’ascendance PCUE.
Figure 7. Graphiques de Bland-Altman montrant la différence entre l’inférence de l’ascendance individuelle. L’axe des x représente (A) la proportion d’ascendance de PCM, (B) de PCS et (C) de PCUE estimée par le génome entier, respectivement. L’axe des y représente la différence d’estimation entre les données du génome entier et celles de 129 AIMs. Les lignes pointillées rouges et bleues sont la moyenne et les intervalles de confiance à 95%, séparément.
Figure 8. Proportions d’ascendance estimées par ADMIXTURE supervisé à K = 3. La hauteur de chaque barre représente trois proportions d’ascendance dans une population. La proportion moyenne de chaque ascendance dans le RUMS et le CSLM est mise en évidence avec des diagrammes circulaires, respectivement.
Discussion
Depuis le 19e siècle, les éleveurs de porcs en Occident ont utilisé des porcs chinois pour s’hybrider avec des porcs européens afin d’améliorer leur stock de reproduction (Groenen, 2016). Bianco et al. (2015) ont constaté que les porcs domestiques européens présentent une introgression génomique de 20 % par rapport aux porcs asiatiques. D’autre part, Yang et al. (2017) ont signalé que les porcs européens ont contribué à hauteur d’au moins 20 % à huit races asiatiques. Ces dernières années, des preuves ont été présentées que les agriculteurs chinois locaux croisent des porcs locaux avec des porcs commerciaux importés (Berthouly-Salazar et al., 2012). L’introgression introduit de nouveaux matériaux génétiques, qui pourraient contribuer à améliorer certaines caractéristiques, notamment les performances de production. Malheureusement, l’introgression, que ce soit dans un sens étroit, comme un mélange avec des races étrangères, ou dans un sens large, comme un mélange avec des races provenant de différentes régions d’une même nation, introduit également une « pollution génétique » qui est difficilement évitable. Par exemple, dans une étude récente, Zhang et al. ont constaté que presque tous les poulets indigènes chinois ont une introgression génétique à partir de poulets de chair commerciaux (Zhang et al., 2019).
Depuis que le porc indigène est vendu à un prix plus élevé que celui des porcs commerciaux européens en Chine, la fausse propagande, le phénomène de mauvaise qualité sur le marché a commencé à augmenter. Une attention significative a été accordée à la question de la falsification du porc, cependant, à ce stade, le travail d’identification était principalement basé sur les intuitions et les expériences du côté du client (Dai et al., 2009 ; Kwon et al., 2017). Heureusement, les produits porcins issus des 10 races de notre ensemble de référence sont dominants en Chine (Bosse et al., 2015 ; Gong et al., 2018 ; Zhao et al., 2018), notre méthode constitue donc un moyen efficace et prometteur dans la détection de la falsification du porc au niveau de l’ADN dans la surveillance du marché. Du point de vue d’un chercheur, dans les études d’association pangénomique, les différentes ascendances génétiques entre le cas et le contrôle conduiront à une stratification de la population. Par conséquent, si l’on sélectionne les échantillons de proportions d’ascendance similaires ou si l’on considère l’ascendance comme des covariables dans le modèle de régression pour ajuster la stratification, cela aiderait à réduire les faux positifs(Qin et al., 2014).
Dans l’ensemble, il est très important de retracer l’origine ou d’estimer l’ascendance génétique soit dans le respect de la protection des ressources génétiques, de la surveillance du marché ou de la stratification de la population. Les AIMs fournissent une approche rentable par rapport à l’utilisation des SNP du génome entier, et sont donc très appropriés pour les tests de grand volume.
Dans la présente étude, nous avons constaté que seulement deux AIMs sont suffisants pour distinguer les porcs chinois des porcs commerciaux européens, et 10 races pures pourraient être affectées avec précision à trois groupes correspondants (ECHP, SCHP et EUCP) en utilisant seulement sept AIMs. Grâce à des simulations de données, nous avons démontré que les MIA sélectionnés à partir d’individus non mélangés peuvent également être appliqués avec succès pour estimer les proportions d’ascendance des individus mélangés. Nous avons ensuite développé un panel de 129 AIMs pour déduire efficacement les proportions d’ascendance chez les individus potentiellement mélangés. Compte tenu de sa flexibilité, de sa fiabilité et de sa facilité d’entretien, la plateforme MassARRAY d’Agena serait actuellement le meilleur choix pour le génotypage de l’ensemble des 129 AIM. Cependant, pour les tests à très grand volume, une puce SNP personnalisée à faible densité ou un séquençage de nouvelle génération basé sur la PCR multiplex seraient plus rentables.
Notre travail a fourni un exemple utile d’utilisation d’un petit nombre d’AIMs pour les classifications et l’estimation des proportions d’ascendance. Des efforts peuvent encore être faits pour optimiser les AIM à un nombre minimum si nécessaire. Par exemple, parmi les 129 AIM, ceux représentant les différences entre les PCUE et les PCM ou les PCS pourraient éventuellement être réduits. Ou encore, inclure plus de MIA pour augmenter le pouvoir de discrimination entre PCM et PPB.
Il convient de noter que l’une des conditions préalables importantes pour obtenir des MIA efficaces, que ce soit pour la classification ou l’estimation de l’ascendance, est de trouver de bonnes populations de référence. Par exemple, Daya et al. (2013) ont signalé qu’un panel de 96 MIA pouvait être utilisé pour déduire les proportions d’ascendance pour la population de couleur sud-africaine (SAC), en utilisant des populations représentatives. Cependant, ces marqueurs n’ont pas donné de bons résultats dans l’inférence des ascendances sud-asiatiques et est-asiatiques. Dans notre étude, 10 races porcines pures de trois groupes (ECHP, SCHP et EUCP) sont choisies comme populations de référence. Il y a plusieurs raisons pour lesquelles nous avons choisi ces races. Premièrement, de nombreux porcs commerciaux européens ou des croisements de races indigènes avec des races commerciales européennes deviennent de plus en plus courants en Chine, de sorte que les principales races commerciales européennes importées, notamment Duroc, Pietrain et Landrace, ont été choisies comme populations représentatives de l’EUCP. Deuxièmement, les races chinoises incluses dans cette étude couvraient deux origines ancestrales désignées. Dans l’étude de Yang et al. (Yang et al., 2017), les porcs China_Erhualian (CNEH), China_Jinhua (CNJH), China_Meishan (CNMS) sont clairement dérivés d’une ascendance, et China_Bamaxiang (CNBX), China_Congjiangxiang (CNCJ), China_Guangdongdahuabai (CNDH) et China_Luchuan (CNLU) sont clairement dérivés de l’autre. L’analyse d’admixture a montré qu’ils sont moins introgressés par EUCP et peuvent être clairement séparés les uns des autres. Ils constituent donc ensemble la meilleure population de référence disponible à ce jour, en considérant à la fois la pureté génétique et la capacité à révéler l’admixture potentielle dans d’autres races chinoises. Si davantage de races pures sont incluses dans l’ensemble de référence à l’avenir, on pourrait s’attendre à une estimation plus précise ainsi qu’à un éventail plus large de populations où notre méthodepourrait être applicable.
Contributions de l’auteur
YZ a conçu et supervisé l’étude. ZL a analysé le contenu principal des données avec l’aide de LB, YQ, YP et RY. ZL et YZ ont rédigé le manuscrit. Tous les auteurs ont lu et approuvé le manuscrit final.
Funding
Le projet a été soutenu par le programme national de recherche et de développement des technologies clés (2015BAD03B01-01) et la Fondation nationale des sciences naturelles de Chine (U1704233).
Déclaration de conflit d’intérêts
Les auteurs déclarent que la recherche a été menée en l’absence de toute relation commerciale ou financière qui pourrait être interprétée comme un conflit d’intérêts potentiel.
Matériel supplémentaire
Le matériel supplémentaire pour cet article peut être trouvé en ligne à : https://www.frontiersin.org/articles/10.3389/fgene.2019.00183/full#supplementary-material
Notes de bas de page
- ^http://dx.doi.org/10.5061/dryad.30tk6
- ^https://github.com/boxiangliu/ANTseq
- ^http://www.curveexpert.net
Ai, H., Huang, L., et Ren, J. (2013). Diversité génétique, déséquilibre de liaison et signatures de sélection chez les porcs chinois et occidentaux révélés par des marqueurs SNP à l’échelle du génome. PLoS One 8:e56001. doi : 10.1371/journal.pone.0056001
PubMed Abstract | CrossRef Full Text | Google Scholar
Alexander, D. H., Novembre, J., et Lange, K. (2009). Estimation rapide basée sur un modèle de l’ascendance chez les individus non apparentés. Genome Res. 19, 1655-1664. doi : 10.1101/gr.094052.109
PubMed Abstract | CrossRef Full Text | Google Scholar
Barbosa, F. B., Cagnin, N. F., Simioni, M., Farias, A. A., Torres, F. R., Molck, M. C., et al. (2017). Panel de marqueurs informatifs d’ascendance pour estimer la stratification de la population en utilisant un réseau humain à l’échelle du génome. Ann. Hum. Genet. 81, 225-233. doi : 10.1111/ahg.12208
PubMed Abstract | CrossRef Full Text | Google Scholar
Bauchet, M., McEvoy, B., Pearson, L. N., Quillen, E. E., Sarkisian, T., Hovhannesyan, K., et al. (2007). Measuring european population stratification with microarray genotype data. Am. J. Hum. Genet. 80, 948-956. doi : 10.1086/513477
PubMed Abstract | CrossRef Full Text | Google Scholar
Berthouly-Salazar, C., Thevenon, S., Van, T. N., Nguyen, B. T., Pham, L. D., Chi, C. V., et al. (2012). Mélange incontrôlé et perte de diversité génétique dans une race porcine vietnamienne locale. Ecol. Evol. 2, 962-975. doi : 10.1002/ece3.229
PubMed Abstract | CrossRef Full Text | Google Scholar
Bertolini, F., Galimberti, G., Schiavo, G., Mastrangelo, S., Di Gerlando, R., Strillacci, M. G., et al. (2017). Les statistiques de présélection et la classification par forêt aléatoire identifient les polymorphismes mononucléotidiques informatifs pour la population dans les races bovines cosmopolites et autochtones. Animal 12, 12-19. doi : 10.1017/S1751731117001355
PubMed Abstract | CrossRef Full Text | Google Scholar
Bianco, E., Soto, H. W., Vargas, L., et Perez-Enciso, M. (2015). Le génome chimérique des porcs sauvages d’Isla del Coco (Costa Rica), une population isolée depuis 1793 mais avec des niveaux de diversité remarquables. Mol. Ecol. 24, 2364-2378. doi : 10.1111/mec.13182
PubMed Abstract | CrossRef Full Text | Google Scholar
Bosse, M., Madsen, O., Megens, H. J., Frantz, L. A. F., Paudel, Y., Crooijmans, R. P., et al. (2015). L’origine hybride des porcs commerciaux européens examinée par une analyse approfondie des haplotypes sur le chromosome 1. Front. Genet. 5:442. doi : 10.3389/Fgene.2014.00442
PubMed Abstract | CrossRef Full Text | Google Scholar
Bosse, M., Megens, H. J., Frantz, L. A. F., Madsen, O., Larson, G., Paudel, Y., et al. (2014). L’analyse génomique révèle une sélection pour les gènes asiatiques chez les porcs européens suite à une introgression médiée par l’homme. Nat. Commun. 5:4392. doi : 10.1038/Ncomms5392
PubMed Abstract | CrossRef Full Text | Google Scholar
Bouchemousse, S., Liautard-Haag, C., Bierne, N., et Viard, F. (2016). Distinguer l’hybridation contemporaine de l’introgression passée avec des SNP informatifs sur l’ascendance post-génomique dans des espèces de Ciona fortement différenciées. Mol. Ecol. 25, 5527-5542. doi : 10.1111/mec.13854
PubMed Abstract | CrossRef Full Text | Google Scholar
Browning, S. R., et Browning, B. L. (2007). Mise en phase rapide et précise des haplotypes et inférence des données manquantes pour les études d’association sur le génome entier par l’utilisation du regroupement d’haplotypes localisés. Am. J. Hum. Genet. 81, 1084-1097. doi : 10.1086/521987
PubMed Abstract | CrossRef Full Text | Google Scholar
Da Mota, B., Tudoran, R., Costan, A., Varoquaux, G., Brasche, G., Conrod, P., et al. (2014). Modèles d’apprentissage automatique pour les études de neuroimagerie-génétique dans le cloud. Front. Neuroinform. 8:31. doi : 10.3389/Fninf.2014.00031
PubMed Abstract | CrossRef Full Text | Google Scholar
Dai, F. W., Feng, D. Y., Cao, Q. Y., Ye, H., Zhang, C. M., Xia, W. G., et al. (2009). Developmental differences in carcass, meat quality and muscle fibre characteristics between the landrace and a Chinese native pig. S. Afr. J. Anim. Sci. 39, 267-273.
Google Scholar
Daya, M., van der Merwe, L., Galal, U., Moller, M., Salie, M., Chimusa, E. R., et al. (2013). Un panel de marqueurs informatifs sur l’ascendance pour la population complexe de couleur sud-africaine admixée à cinq voies. PLoS One 8:e82224. doi : 10.1371/journal.pone.0082224
PubMed Abstract | CrossRef Full Text | Google Scholar
Dimauro, C., Nicoloso, L., Cellesi, M., Macciotta, N. P. P., Ciani, E., Moioli, B., et al. (2015). Sélection de marqueurs SNP discriminants pour l’assignation de race et géographique des moutons italiens. Small Rumin. Res. 128, 27-33. doi : 10.1016/j.smallrumres.2015.05.001
CrossRef Full Text | Google Scholar
Ding, L. L., Wiener, H., Abebe, T., Altaye, M., Go, R. C. P., Kercsmar, C., et al. (2011). Comparaison des mesures de l’informativité des marqueurs pour la cartographie de l’ascendance et des mélanges. BMC Genomics 12:622. doi : 10.1186/1471-2164-12-622
PubMed Abstract | CrossRef Full Text | Google Scholar
Fang, M., Hu, X., Jiang, T., Braunschweig, M., Hu, L., Du, Z., et al. (2005). The phylogeny of Chinese indigenous pig breeds inferred from microsatellite markers. Anim. Genet. 36, 7-13. doi : 10.1111/j.1365-2052.2004.01234.x
PubMed Abstract | CrossRef Full Text | Google Scholar
Frantz, L. A. F., Schraiber, J. G., Madsen, O., Megens, H. J., Bosse, M., Paudel, Y., et al. (2013). Le séquençage du génome révèle une diversification à échelle fine et une histoire de réticulation pendant la spéciation chez Sus. Genome Biol. 14:R107. doi : 10.1186/Gb-2013-14-9-R107
PubMed Abstract | CrossRef Full Text | Google Scholar
Galanter, J. M., Fernandez-Lopez, J. C., Gignoux, C. R., Barnholtz-Sloan, J., Fernandez-Rozadilla, C., Via, M., et al. (2012). Développement d’un panel de marqueurs informatifs de l’ascendance à l’échelle du génome pour étudier l’admixture à travers les Amériques. PLoS Genet. 8:e1002554. doi : 10.1371/journal.pgen.1002554
PubMed Abstract | CrossRef Full Text | Google Scholar
Getachew, T., Huson, H. J., Wurzinger, M., Burgstaller, J., Gizaw, S., Haile, A., et al. (2017). Identification de marqueurs génétiques hautement informatifs pour la quantification des proportions d’ascendance dans les populations ovines croisées : implications pour le choix des niveaux optimaux d’admixture. BMC Genet. 18:80. doi : 10.1186/s12863-017-0526-2
PubMed Abstract | CrossRef Full Text | Google Scholar
Gong, H., Xiao, S., Li, W., Huang, T., Huang, X., Yan, G., et al. (2018). Démêler les loci génétiques pour les traits de croissance et de carcasse chez les porcs chinois Bamaxiang sur la base d’un réseau de 1,4 million de SNP. J. Anim. Breed. Genet. 136, 3-14. doi : 10.1111/jbg.12365
PubMed Abstract | CrossRef Full Text | Google Scholar
Groenen, M. A. M. (2016). Une décennie de séquençage du génome du porc : une fenêtre sur la domestication et l’évolution du porc. Genet. Sel. Evol. 48:23. doi : 10.1186/s12711-016-0204-2
PubMed Abstract | CrossRef Full Text | Google Scholar
Hong, J. H., et Cho, S. B. (2008). Une stratégie probabiliste multi-classe de machines à vecteurs de support à un contre un pour la classification du cancer. Neurocomputing 71, 3275-3281. doi : 10.1016/j.neucom.2008.04.033
CrossRef Full Text | Google Scholar
Kwon, T., Yoon, J., Heo, J., Lee, W., et Kim, H. (2017). Tracer l’élevage du porc domestiqué en utilisant la sélection de caractéristiques (Sus scrofa). Asian Aust. J. Anim. Sci. 30, 1540-1549. doi : 10.5713/ajas.17.0561
PubMed Abstract | CrossRef Full Text | Google Scholar
Larson, G., Dobney, K., Albarella, U., Fang, M. Y., Matisoo-Smith, E., Robins, J., et al. (2005). Worldwide phylogeography of wild boar reveals multiple centers of pig domestication. Science 307, 1618-1621. doi : 10.1126/science.1106927
PubMed Abstract | CrossRef Full Text | Google Scholar
Lawson, D. J., Hellenthal, G., Myers, S., et Falush, D. (2012). Inférence de la structure de la population en utilisant des données d’haplotype dense. PLoS Genet. 8:e1002453. doi : 10.1371/journal.pgen.1002453
PubMed Abstract | CrossRef Full Text | Google Scholar
Lee, S., Epstein, M. P., Duncan, R., et Lin, X. H. (2012). Analyse en composantes principales éparses pour identifier les marqueurs informatifs sur l’ascendance dans les études d’association à l’échelle du génome. Genet. Epidemiol. 36, 293-302. doi : 10.1002/gepi.21621
PubMed Abstract | CrossRef Full Text | Google Scholar
Li, C. X., Pakstis, A. J., Jiang, L., Wei, Y. L., Sun, Q. F., Wu, H., et al. (2016). Un panel de 74 AISNP : amélioration de l’inférence de l’ascendance en Asie orientale. Forensic Sci. Int. Genet. 23, 101-110. doi : 10.1016/j.fsigen.2016.04.002
PubMed Abstract | CrossRef Full Text | Google Scholar
Li, S.-J., Yang, S.-H., Zhao, S.-H., Fan, B., Yu, M., Wang, H.-S., et al. (2004). Analyses de la diversité génétique de 10 populations indigènes de porcs chinois basées sur 20 microsatellites. J. Anim. Sci. 82, 368-374. doi : 10.2527/2004.822368x
PubMed Abstract | CrossRef Full Text | Google Scholar
Maples, B. K., Gravel, S., Kenny, E. E., et Bustamante, C. D. (2013). RFMix : une approche de modélisation discriminante pour une inférence rapide et robuste de l’ancêtre local. Am. J. Hum. Genet. 93, 278-288. doi : 10.1016/j.ajhg.2013.06.020
PubMed Abstract | CrossRef Full Text | Google Scholar
Monzon, J., Kays, R., et Dykhuizen, D. E. (2014). Évaluation de l’admixture coyote-loup-chien en utilisant des SNP de diagnostic informatifs sur l’ascendance. Mol. Ecol. 23, 182-197. doi : 10.1111/mec.12570
PubMed Abstract | CrossRef Full Text | Google Scholar
Pardo-Seco, J., Martinon-Torres, F., et Salas, A. (2014). Évaluation de la précision des panneaux AIM à la quantification de l’ascendance du génome. BMC Genomics 15:543. doi : 10.1186/1471-2164-15-543
PubMed Abstract | CrossRef Full Text | Google Scholar
Patterson, N., Price, A. L., et Reich, D. (2006). Structure de la population et analyse propre. PLoS Genet. 2:e190. doi : 10.1371/journal.pgen.0020190
PubMed Abstract | CrossRef Full Text | Google Scholar
Peterson, R. E., Edwards, A. C., Bacanu, S. A., Dick, D. M., Kendler, K. S., et Webb, B. T. (2017). L’utilité d’assigner empiriquement des groupes d’ascendance dans les études génétiques inter-populations de la dépendance. Am. J. Addict. 26, 494-501. doi : 10.1111/ajad.12586
PubMed Abstract | CrossRef Full Text | Google Scholar
Qin, P., Li, Z., Jin, W., Lu, D., Lou, H., Shen, J., et al. (2014). Un panel de marqueurs informatifs de l’ascendance pour estimer et corriger les effets potentiels de la stratification de la population chez les Chinois Han. Eur. J. Hum. Genet. 22, 248-253. doi : 10.1038/ejhg.2013.111
PubMed Abstract | CrossRef Full Text | Google Scholar
Rosenberg, N. A., Li, L. M., Ward, R., et Pritchard, J. K. (2003). Informativeness of genetic markers for inference of ancestry. Am. J. Hum. Genet. 73, 1402-1422. doi : 10.1086/380416
PubMed Abstract | CrossRef Full Text | Google Scholar
Santos, H. C., Horimoto, A. V. R., Tarazona-Santos, E., Rodrigues-Soares, F., Barreto, M. L., Horta, B. L., et al. (2016). Un ensemble minimal de marqueurs informatifs de l’ascendance pour déterminer les proportions d’admixture dans une population américaine mixte : l’ensemble brésilien. Eur. J. Hum. Genet. 24, 725-731. doi : 10.1038/ejhg.2015.187
PubMed Abstract | CrossRef Full Text | Google Scholar
Shriver, M. D., Parra, E. J., Dios, S., Bonilla, C., Norton, H., Jovel, C., et al. (2003). Skin pigmentation, biogeographical ancestry and admixture mapping. Hum. Genet. 112, 387-399. doi : 10.1007/s00439-002-0896-y
PubMed Abstract | CrossRef Full Text | Google Scholar
Sun, K., Ye, Y., Luo, T., et Hou, Y. (2016). Analyse Multi-InDel pour l’inférence de l’ascendance des sous-populations en Chine. Sci. Rep. 6:39797. doi : 10.1038/srep397
PubMed Abstract | CrossRef Full Text | Google Scholar
Tian, C., Kosoy, R., Nassir, R., Lee, A., Villoslada, P., Klareskog, L., et al. (2009). European population genetic substructure : further definition of ancestry informative markers for distinguishing among diverse european ethnic groups. Mol. Med. 15, 371-383. doi : 10.2119/molmed.2009.00094
PubMed Abstract | CrossRef Full Text | Google Scholar
vonHoldt, B. M., Kays, R., Pollinger, J. P., et Wayne, R. K. (2016). La cartographie d’admixtion identifie les régions génomiques introgressées chez les canidés nord-américains. Mol. Ecol. 25, 2443-2453. doi : 10.1111/mec.13667
PubMed Abstract | CrossRef Full Text | Google Scholar
Yang, B., Cui, L. L., Perez-Enciso, M., Traspov, A., Crooijmans, R. P. M. A., Zinovieva, N., et al. (2017). Les données SNP à l’échelle du génome dévoilent la mondialisation des porcs domestiqués. Genet. Sel. Evol. 49:71. doi : 10.1186/s12711-017-0345-y
PubMed Abstract | CrossRef Full Text | Google Scholar
Zeng, X. P., Chakraborty, R., King, J. L., Larue, B., Moura-Neto, R. S., et Budowle, B. (2016). Sélection de marqueurs SNP hautement informatifs pour l’affiliation des principales populations américaines. Int. J. Legal Med. 130, 341-352. doi : 10.1007/s00414-015-1297-9
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhang, C., Lin, D., Wang, Y., Peng, D., Li, H., Fei, J., et al. (2019). Introgression généralisée dans les races de poulet indigènes chinoises à partir de poulets de chair commerciaux. Evol. Appl. 12, 610-621. doi : 10.1111/eva.12742
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhang, F., Zhang, L., et Deng, H. W. (2009). Une méthode basée sur l’ACP pour la sélection de marqueurs informatifs ancestraux dans les populations structurées. Sci. Chin. Series C Life Sci. 52, 972-976. doi : 10.1007/s11427-009-0128-y
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhao, P., Yu, Y., Feng, W., Du, H., Yu, J., Kang, H., et al. (2018). Des preuves de l’histoire de l’évolution et des balayages sélectifs dans le génome du porc Meishan révèlent sa caractérisation génétique et phénotypique. Gigascience 7. doi : 10.1093/gigascience/giy058
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhu, Y., Li, W., Yang, B., Zhang, Z., Ai, H., Ren, J., et al. (2017). Signatures de sélection et d’introgression inter-espèces dans le génome des porcs domestiques chinois. Genome Biol. Evol. 9, 2592-2603. doi : 10.1093/gbe/evx186
PubMed Abstract | CrossRef Full Text | Google Scholar
.