Frontiers in Genetics
- Introduction
- Materialen en Methoden
- Verzameling van gegevens en kwaliteitscontrole
- Populatiestructuur
- Selectie van AIMs
- Groepsindeling met minimale AIM’s
- Ancestry Inference With Optimal AIMs
- Resultaten
- Populatiestructuur van referentiepopulaties
- Groepsindeling met behulp van AIMs
- Accurate Ancestry Proportion Estimation Using AIMs
- Schatting van het afstammingspercentage voor de Test Dataset
- Discussie
- Bijdragen van de auteur
- Funding
- Conflict of Interest Statement
- Supplementary Material
- Footnotes
Introduction
Autosomale single-nucleotide polymorphism (SNP) en insertion-deletion (InDel) worden op grote schaal gebruikt voor het in kaart brengen van de menselijke voorouders en het toewijzen van populaties (Bauchet et al, 2007; Tian et al., 2009; Sun et al., 2016). Ancestry informative markers (AIMs) zijn genetische markers met frequentieverschillen tussen populaties (Shriver et al., 2003). Meerdere statistieken zijn gebruikt om AIMs te verkrijgen, waaronder F-statistieken (FST), absolute allelfrequentieverschillen (δ), informativiteit voor toewijzingsmaatstaf (In), en principal component loading scores (Rosenberg et al., 2003; Zhang et al., 2009; Ding et al., 2011; vonHoldt et al., 2016; Barbosa et al., 2017; Peterson et al., 2017). In plaats van het gebruik van volledige genoom-merkers, werden AIMs geacht voldoende nauwkeurig te zijn voor voorouderlijke inferentie voor een beperkte populatiegrootte. Bijgevolg vormt dit een economische manier om duizenden monsters te screenen en te analyseren. Santos et al. (2016) rapporteerden dat 192 AIMs geselecteerd uit ∼370 K SNP-gegevens kunnen worden gebruikt om de voorouderschapsverhoudingen van drie grote populaties in Brazilië nauwkeurig te schatten. Li et al. (2016) ontwikkelden een panel van 74 AIMs om de ancestry proporties van 500 test individuen uit 11 populaties af te leiden. Vanwege de hoge resolutie van AIMs, een 23-AIMs panel gegenereerd door Zeng et al. (2016). onderscheidde vier grote Amerikaanse populaties, en wees correct voorouders toe voor negen extra populaties (Zeng et al., 2016).
Voor dierlijke populatiegenetica zijn AIMs met succes toegepast om rassen van verschillende variëteiten te identificeren en genetische samenstellingen in hybride populaties te evalueren (Dimauro et al., 2015; Bouchemousse et al., 2016). Bertolini et al. (2017) vonden dat 96 AIMs goed presteerden bij het discrimineren van zes melkveerassen. In een andere studie werden 63 AIMs geselecteerd uit 427 caniden gebruikt om genetische vermenging bij coyotes te beoordelen (Monzon et al., 2014). Onlangs werden 74 AIM’s gebruikt om voorouderschapsverhoudingen te berekenen in gekruiste schapen (Awassi met twee inheemse rassen in Ethiopië), en er werd vastgesteld dat verschillende vermengingsniveaus van Awassi de kenmerken van lammerengroei en voortplanting van ooien significant beïnvloedden (Getachew et al, 2017).
De varkens (Sus scrofa) divergeerden in Europese en Aziatische wilde zwijnen tijdens het midden-Pleistoceen (1,2-0,8 miljoen jaar geleden) (Larson et al., 2005; Frantz et al., 2013). De domesticatie van varkens in China vond ∼9.000 jaar geleden plaats (Larson et al., 2005). Het is gedocumenteerd dat Chinese tamme varkens werden verdeeld in zes types volgens de regio van bewoning en fenotype kenmerken (I-Noord-China, II-Lower Changjiang Basin, III-Central China, IV-Zuid-China, V-Zuidwest, en VI-Plateau) (Li et al., 2004; Fang et al., 2005). In een recente studie hebben Yang et al. (2017). de voorouders van verschillende Chinese rassen getraceerd en twee belangrijke verschillende voorouders geïdentificeerd, die Oost-China (bijv. Meishan en JinHua) en Zuid-China (bijv. Luchuan en Bamaxiang) als oorsprong hebben. Bovendien is ook genomische introgressie van Europese commerciële rassen naar Chinese inheemse varkens gerapporteerd (Ai et al., 2013; Bosse et al., 2014; Zhu et al, 2017), waardoor de genetische samenstelling van moderne Chinese varkens nog gecompliceerder wordt.
Hoewel het op grote schaal is toegepast bij andere dieren, en het van groot belang is in specifieke toepassingsscenario’s, waaronder markttoezicht en bescherming van genetische hulpbronnen, bestaat er momenteel geen studie die specifiek ingaat op het probleem van het efficiënt gebruik van AIM’s voor het onderscheiden van varkensrassen of voor het schatten van afstammingsverhoudingen. Hier hebben we, gebruikmakend van ∼60 K varkens SNP chip data, gezocht naar het optimale aantal AIMs voor het onderscheiden van varkens van Oost-China, Zuid-China, of Europese oorsprong. Op basis van 129 geselecteerde AIMs, schatten we het aandeel van de voorouders van de bovengenoemde oorsprongen voor andere Chinese varkens. Wij suggereerden dat AIMs geselecteerd uit ongemengde referentiepopulaties gebruikt zouden kunnen worden om nauwkeurig het aandeel van voorouders in hybride populaties te schatten. Onze resultaten geven een nuttig voorbeeld van het gebruik van AIMs voor rasclassificatie en voorouderschapsschatting bij varkens.
Materialen en Methoden
Verzameling van gegevens en kwaliteitscontrole
Genotyperingsgegevens van 2.113 monsters werden opgehaald uit de Dryad Digital Repository1. Alleen monsters van Aziatische rassen en Europese rassen werden in deze studie gebruikt (in totaal 1.157 monsters van 71 populaties, details in aanvullende tabel S1). Monsters en SNP’s werden uitgesloten indien aan de volgende criteria werd voldaan: (1) een individu bevatte meer dan 10% ontbrekende genotypes; (2) SNP’s met een call rate lager dan 95%; (3) SNP’s met een minor allelfrequentie lager dan 0,05; (4) SNP’s die zich op geslachtschromosomen bevonden; en (5) SNP’s waren niet biallelisch. De ontbrekende genotypen werden vervolgens geïmputeerd met behulp van BEAGLE (versie 3.3.2) (Browning en Browning, 2007). Uiteindelijk bleven er 45.562 SNP’s en 1.155 monsters over. De 1.155 monsters werden vervolgens opgesplitst in twee datasets. Voor de referentieverzameling werden 186 monsters gekozen uit 10 representatieve populaties van de drie belangrijkste afstammingsgroepen: Oost-Chinees varken (ECHP), Zuid-Chinees varken (SCHP), en Europees commercieel varken (EUCP). De 10 populaties werden geselecteerd op basis van het feit dat er geen duidelijke vermenging was tussen populaties die tot de ECHP- of SCHP-groep behoorden, volgens een rapport van Yang et al. (2017). Deze dataset is samengevat in Tabel 1. De testdataset bevatte de resterende 969 monsters van 61 populaties (details in aanvullende tabel S2). Gezien het gemak van praktische toepassing, werden de genotypegegevens van de testdataset rechtstreeks uit de ruwe gegevens geëxtraheerd zonder fasering of imputatie.
Tabel 1. Informatie over varkensrassen in de referentieset.
Populatiestructuur
Principal component analysis (PCA) werd uitgevoerd op ∼60 K-chipgegevens met behulp van SMARTPCA (versie 6.1.4) in de referentieset (Patterson et al., 2006). Om de ongemengde status te bevestigen werd gebruik gemaakt van ADMIXTURE (versie 1.23) (Alexander et al., 2009) zonder toezicht om de voorouderproporties van monsters uit de referentieset te berekenen met het aantal voorouders (K) ingesteld van K = 3 tot K = 15. Het ChromoPainter v2 (Lawson et al., 2012) gekoppelde model werd ook gekozen om gelijkenis/disongelijkenis voor individuen in de referentieset te onderzoeken. In detail werd het recombinatiekaartbestand gegenereerd met behulp van het script makeuniformrecfile.pl van fineSTRUCTURE (versie 2.1.1) (Lawson et al., 2012). Door gebruik te maken van een verborgen Markov model profiel, leidt ChromoPainter v2 haplotypes van “donor” en “ontvanger” af om een co-antie matrix te creëren. Aanvankelijk werden 20 verwachtings-maximalisatiestappen gebruikt om de mutatie- en switchsnelheid te schatten op 1/5 willekeurige steekproefleden van alle individuen met alle beschouwde autosomen. De afgeleide mutatie- en schakelsnelheden voor elk chromosoom werden vervolgens gemiddeld. Vervolgens werd ChromoPainter v2 met de geschatte mutatie- en switchfrequenties en andere standaardwaarden opnieuw gebruikt om de correlatiematrix voor alle individuen te genereren. Tenslotte werd het MCMC-algoritme, geïmplementeerd in fineSTRUCTURE, gebruikt om individuen hiërarchisch te clusteren met een burn-in en runtime van respectievelijk 1.000.000 en 6.000.000 iteraties.
Selectie van AIMs
Alle 186 monsters in de referentie dataset werden gebruikt om FST en In te berekenen. Kandidaat-SNP’s werden geselecteerd uit de AIMs algoritme selector die werd geïmplementeerd in AIMs_generator.py van ANTseq pipeline2. Specifiek hebben we eerst SNP’s in hoog-linkage disequilibrium (LD) uitgesloten door het selecteren van slechts een SNP in een sterke LD (r2 > 0,3) regio en binnen 500 kb afstand. Binnen elke groep werden SNP’s die heterogene frequenties tussen populaties vertoonden, verder uitgesloten op basis van een Chi-kwadraattest (Galanter et al., 2012). Ten tweede werden FST en In berekend voor elk van de drie gepaarde groepen: ECHP vs. EUCP, SCHP vs. EUCP, en ECHP vs. SCHP (Rosenberg et al., 2003).
Groepsindeling met minimale AIM’s
Op basis van de referentiedataset vergeleken we eerst het discriminerend vermogen van de AIM’s die door FST of In waren geselecteerd. Binaire classificatie voor de drie gepaarde groepen werden afzonderlijk uitgevoerd. Voor elke gepaarde groep begonnen we met het selecteren van de top twee tot en met top 30 AIM’s, met een toename van één AIM. Monsters in de overeenkomstige gepaarde groep werden willekeurig verdeeld in twee verhoudingen: 75% voor training, 25% voor testen, en deze operatie werd 50 keer herhaald. GridSearchCV, geïmplementeerd in het Scikit-learn (versie 0.18) pakket, werd vervolgens gebruikt om de optimale parameters voor een support vector machine (SVM) classifier te bepalen (Da Mota et al., 2014). De parameters voor SVM zijn samengevat in supplementaire tabel S3. Voor het model met optimale parameters werd de nauwkeurigheid van de classificatie geëvalueerd aan de hand van het gemiddelde van de Matthews correlatiecoëfficiënt (MMCC) voor 50 herhalingen, en wel als volgt:
waarbij TNi en FNi het aantal ware negatieven en valse negatieven zijn, en TPi en FPi het aantal ware positieven en valse positieven zijn, voor elke run.
Om het minimumaantal AIM’s te bepalen voor het gelijktijdig onderscheiden van ECHP, SCHP en EUCP, werd een multiklassebenadering van één-vs.-rest SVM toegepast op referentiedata.rest SVM gebruikt op de referentiedataset (Hong en Cho, 2008). Op dezelfde manier zijn we begonnen met het selecteren van de top twee tot en met top 200 AIMs uit elk van de gepaarde groepen, met een toename van één AIM, wat resulteerde in 199 AIM-sets in totaal. In elke set werden AIM’s uit de drie gepaarde groepen samengevoegd en dubbele AIM’s werden verwijderd (aanvullende tabel S4). Aangezien MMCC niet ontworpen was om de nauwkeurigheid van multiklas classificatie te evalueren, werden in plaats daarvan de verwarringsmatrix, de Cohen’s kappa statistiek en de gebalanceerde foutmarge gebruikt om de classificatienauwkeurigheid te evalueren. Een hogere Cohen’s kappa maar een lagere gebalanceerde foutmarge duidt op een nauwkeurigere classificatie. We gebruikten opnieuw GridSearchCV om de beste parameters voor one-vs.-rest SVM te schatten, waarvan de parameters zijn samengevat in supplementaire tabel S3. We genereerden ook willekeurige SNP-sets van gelijk aantal uit het hele genoom voor vergelijking van het discriminerend vermogen met de geselecteerde AIMs.
Ancestry Inference With Optimal AIMs
AIMs zijn op grote schaal gebruikt om voorouderschapsverhoudingen in hybride populaties te schatten, zelfs in gevallen waarin ze werden geselecteerd uit ongemengde populaties. Op basis van geselecteerde AIMs, om de voorouderproporties van mogelijke bewonderde varkenspopulaties te schatten, hebben we een strategie gebruikt die vergelijkbaar was met die gebruikt in een eerdere studie van Pardo-Seco et al. (2014). We genereerden eerst pseudo-vermengde individuen door willekeurig genotypen van geselecteerde AIMs te selecteren uit monsters in de referentiedataset met gelijke proporties. Daarom waren de verwachte afstamming proporties van deze pseudo-gefixeerde individuen 1/3 (∼0.3333) van elke groep (ECHP, SCHP, en EUCP). Voor elk van de 199 AIM sets die uit het bovenstaande gegenereerd werden, werden 1.000 simulaties uitgevoerd. ADMIXTURE (K = 3) werd gebruikt om de proporties van de voorouders te schatten. De prestaties werden geëvalueerd aan de hand van het gemiddelde en de variatiecoëfficiënt (CV) van de geschatte voorouderproporties. De CV van de geschatte voorouderproporties ten opzichte van het aantal AIMs werd bepaald met het Curve Expert 1.4 programma3. Het optimale aantal AIM’s werd bepaald door de helling van de raaklijndrempel van de curve te kiezen waarvan de prestatie boven dat punt stabiel was. Om een extra validatie toe te voegen, simuleerden wij pseudo-vermengde individuen met willekeurige afstammingsverhoudingen met gebruikmaking van het vastgestelde optimale aantal AIM’s. De voorouderverhoudingen van ECHP, SCHP en EUCP werden willekeurig toegewezen met een minimumaandeel van 10%.
Op basis van de in de laatste stap geselecteerde AIMs voerden we een voorouderinferentie uit voor de 969 individuen in de testdataset met ADMIXTURE onder supervisie. De prestatie werd geëvalueerd aan de hand van de Pearson correlatiecoëfficiënt tussen de genoomwijde SNPs en het optimale aantal AIMs.
Resultaten
Populatiestructuur van referentiepopulaties
Populaties in de referentieset werden verondersteld het minst vermengd te zijn. We hebben geconstateerd dat ECHP, SCHP en EUCP goed gescheiden waren in een principale-componentenplot (Figuur 1A). De genoombrede FST verdeling (Figuur 1B) toonde een hogere differentiatie zowel tussen ECHP vs. EUCP (gemiddelde = 0.2197, 95% CI 0.0006-0.7267) en SCHP vs. EUCP (gemiddelde = 0.2153, 95% CI 0.0005-0.7570), terwijl de differentiatie tussen ECHP vs. SCHP (gemiddelde = 0.0588, 95% CI 0-0.3342) merkbaar minder uitgesproken was. Met behulp van ADMIXTURE werden alle rassen goed verdeeld in verwachte groepen (Figuur 1C) wanneer K = 3, in overeenstemming met de eerdere studie van Yang et al. (2017). Wanneer K = 10, konden 10 populaties duidelijk worden gescheiden, consistent met onze verwachting dat de 10 populaties het minst vermengd waren (Supplementary Figure S1).
Figuur 1. Populatiestructuur van 10 rassen in de referentie dataset. (A) Principale-componentenanalyse (PCA) van ∼60 K-chipgegevens. (B) De genoombrede FST-verdeling voor de drie gepaarde groepen: ECHP vs. EUCP, SCHP vs. EUCP en ECHP vs. SCHP. De rode verticale lijn vertegenwoordigt het gemiddelde van de FST-verdeling. De gestippelde verticale lijnen geven het 2,5- en 97,5-percentiel van de FST-verdeling weer. (C) ADMIXTURE-clustering van ∼60 K-chipgegevens bij K = 3-12. CNBX, China_Bamaxiang; CNCJ, China_Congjiangxiang; CNLU, China_Luchuan; CNDH, China_Guangdongdahuabai; CNJH, China_Jinhua; CNEH, China_Erhualian; CNMS, China_Meishan; DUR2, Duroc2; PIT1, Pietrain1; LDR1, Landrace1. De kleurcodes voor grote bretels zijn als volgt, groen: Oost-Chinees varken (ECHP); rood: Zuid-Chinees varken (SCHP); blauw: Europees commercieel varken (EUCP).
Voor verdere kwantificering werden de programma’s ChromoPainter v2 en fineSTRUCTURE gebruikt om de verwantschap tussen deze rassen na te gaan rekening houdend met LD. Zoals blijkt uit de heatmap van de cohesie (Figuur 2), vertoonden de individuen binnen elke groep een homogeen patroon, en die van dezelfde groep deelden meer genetische brokken dan die van andere groepen. In het bijzonder had de EUCP een verwaarloosbare mate van verwantschap met individuen van inheemse Chinese rassen. De steekproef van ECHP en SCHP vertoonde een hogere graad van verwantschap, maar individuen van dezelfde groep hadden nog steeds de neiging meer samen te groeperen dan tussen groepen. Samenvattend suggereren de resultaten dat de monsters in de referentie-dataset een verwaarloosbaar niveau van vermenging vertoonden.
Figuur 2. fijnstuctuuranalyse in de referentie-dataset. De heatmap toont het aantal gedeelde genetische brokken die van een donorgenoom (kolom) naar een ontvangergenoom (rij) zijn gekopieerd. CNBX, China_Bamaxiang; CNCJ, China_Congjiangxiang; CNLU, China_Luchuan; CNDH, China_Guangdongdahuabai; CNJH, China_Jinhua; CNEH, China_Erhualian; CNMS, China_Meishan; DUR2, Duroc2; PIT1, Pietrain1; LDR1, Landrace1. De kleurcodes zijn als volgt, groen: Oost-China varken (ECHP); rood: Zuid-Chinees varken (SCHP); blauw: Europees commercieel varken (EUCP).
Groepsindeling met behulp van AIMs
Om een effectieve set van AIMs te bouwen, hebben we eerst de prestaties van FST-statistieken en In-statistieken vergeleken. Voor een gepaarde groep van ECHP vs. EUCP en SCHP vs. EUCP, bleken minimaal twee AIMs voldoende te zijn om te resulteren in een perfecte scheiding (MMCC = 1), hetzij door het selecteren van de top FST of door de top In statistieken (Supplementary Figure S2). Om ECHP vs. SCHP te scheiden, waren echter minstens vier AIM’s vereist bij gebruik van FST, of minstens vijf bij gebruik van In. Voor AIMs geselecteerd door FST of In vonden we dat informatieve AIMs geselecteerd door In grotendeels overlapten met AIMs geselecteerd door FST, wat erop wijst dat FST minstens even informatief is als In. Daarom waren de volgende analyses alleen gebaseerd op AIMs geselecteerd door FST.
Volgende, we hebben geprobeerd om het aantal AIMs te identificeren dat kan worden gebruikt om ECHP, SCHP en EUCP gelijktijdig te scheiden met behulp van een multiklasse aanpak. Zoals beschreven in Materialen en Methoden, werden achtereenvolgens twee tot 200 AIMs geselecteerd uit respectievelijk ECHP vs. EUCP, SCHP vs. EUCP en ECHP vs. SCHP, wat resulteerde in 199 AIM-sets van oplopend aantal (Supplementary Table S4). AIM’s in elke set werden samengevoegd en ontdubbeld. Bijvoorbeeld, voor de grootste set, 171 van de 200 AIMs werden gedeeld tussen ECHP vs. EUCP en SCHP vs. EUCP (Supplementary Figuur S3), 12 van de 200 AIMs waren de gedeelde tussen SCHP vs. EUCP en ECHP vs. SCHP, en 14 van de 200 AIMs werden gedeeld tussen ECHP vs. EUCP en ECHP vs. SCHP. Alle 199 AIM-reeksen werden gevoed aan een one-vs.-rest SVM-classificator. Zoals blijkt uit figuur 3 en aanvullende tabel S5, waren zeven AIMs voldoende om ECHP, SCHP en EUCP volledig te scheiden met Cohen’s kappa = 1 en balanced error rate = 0. De gedetailleerde informatie van zeven AIMs werd samengevat in tabel 2 en aanvullende tabel S7.
Figuur 3. Verwarringsmatrices voor de één-vs.-rest SVM-classificator. (A) De prestaties van vier AIM’s. (B) De prestaties van zeven AIM’s. (C) De prestatie van vier willekeurige markers die uit volledige genoomgegevens zijn genomen. (D) De prestatie van zeven willekeurige markers.
Tabel 2. De paarsgewijze FST-waarden voor de 129 AIMs.
Accurate Ancestry Proportion Estimation Using AIMs
AIMs geselecteerd uit ongemengde populaties werden met succes toegepast om voorouderschapsverhoudingen in gemengde populaties te schatten (Lee et al., 2012; Maples et al., 2013). Om de uitvoerbaarheid in onze studie te valideren, hebben we datasimulatie uitgevoerd. Als de studie praktisch uitvoerbaar is, zouden we een hoge consistentie tussen de gesimuleerde en de geschatte voorouderproporties moeten waarnemen. Voor elke AIM set werd de gesuperviseerde ADMIXTURE gebruikt om de voorouderproporties te berekenen in 1.000 simulaties. Voor elke simulatie werd het genotype van 60 monsters uit ECHP, SCHP en EUCP willekeurig gemengd voor elke AIM.
Zoals getoond in Figuren 4A,B, werden bij 80 of minder AIMs grote verschillen tussen het gemiddelde van de geschatte en de verwachte waarde (∼0,3333) waargenomen. Zo waren de zeven AIM’s die perfect voor de classificatie werkten, niet voldoende om de afstammingsverhoudingen accuraat af te leiden: ECHP (gemiddelde = 0,2994, variatiecoëfficiënt (CV) = 0,8450), SCHP (gemiddelde = 0,3909, CV = 0,7783) en EUCP (gemiddelde = 0,3097, CV = 0,9895). Echter, door het opnemen van top 82 AIMs of meer, de geschatte proporties geleidelijk convergeerden naar de verwachte waarden (figuur 4A). Dezelfde tendens voor de CV plot waarin de CV daalde als het aantal AIMs toegenomen (figuur 4B).
Figuur 4. Afleiding van voorouders bij gesimuleerde individuen uit de 199 AIM-reeksen. In elke set werden 1000 simulaties uitgevoerd met een pythonscript en de voorouders werden afgeleid met ADMIXTURE onder supervisie. Verticale stippellijnen stellen vier AIM-reeksen voor: zeven AIM’s, 82 AIM’s, 129 AIM’s en 403 AIM’s. (A) Het gemiddelde van de voorouderproporties voor de drie groepen: ECHP (groen), SCHP (rood) en EUCP (blauw). De zwarte horizontale lijn geeft de verwachte waarde (∼0,3333) van elk voorgeslacht weer. (B) De variatiecoëfficiënt (CV) van de voorouderverhoudingen voor de drie groepen.
Om de optimale AIM-set te bepalen, pasten we de CV-curven in figuur 4B aan met een reciproke logaritmische functie (supplementaire figuur S4) voor AIMs tussen 82 en 403. Aangezien de raaklijn aan de curve oneindig dicht bij nul komt, bepaalden wij een willekeurige drempel van -0,0004, wat overeenkomt met de reeks van 129 AIM’s, door zowel de stabiliteit van de CV-waarde als de genotyperingskosten voor SNP’s in aanmerking te nemen (Supplementary Table S6). De AIM-reeks van 129 presteerde goed in voorouderlijke gevolgtrekking voor gesimuleerde monsters (Figuur 5), wat resulteerde in ECHP: gemiddelde = 0,3310, standaardafwijking (std) = 0,0772; SCHP: gemiddelde = 0,3356, std = 0,0751; en EUCP: gemiddelde = 0,3334, std = 0,0394. We stelden ook vast dat de prestaties van 129 AIMs-set een zeer beperkt verschil vertoonden met die van 403 AIMs-set, wat suggereert dat de 129 AIMs-set optimaal was (Supplementary Table S6).
Figuur 5. Afleiding van voorouders bij gesimuleerde individuen uit 129 AIM’s. De zwarte horizontale lijn geeft de verwachte waarde (∼0,3333) van elk voorgeslacht weer. De kleurcodes zijn als volgt: groen: ECHP; rood: SCHP; blauw: EUCP.
Gezien de bruikbaarheid van de 129 AIMs-set, hebben we vervolgens pseudo-vermengde individuen met ongelijke willekeurige voorouderverhoudingen gesimuleerd met gebruikmaking van dezelfde AIMs. We produceerden eerst 10 willekeurige voorouderverhoudingen voor elke drie groepen, en vervolgens hebben we 1.000 simulaties uitgevoerd op elke drie voorouderverhoudingen. Voor elke simulatie werden 60 pseudo-vermengde individuen gegenereerd. Zoals blijkt uit tabel 3, werkten de 129 AIM’s zeer goed, zelfs voor steekproeven van willekeurige afstammingsverhoudingen.
Tabel 3. Simulation of random ancestry proportions using the 129 AIMs.
Zoals verwacht, met behulp van de 129 AIMs (tabel 2 en aanvullende tabel S7), PCA aangetoond dat 10 populaties waren duidelijk onderverdeeld in drie overeenkomstige groepen (Supplementary Figuur S5). Interessant genoeg, in vergelijking met Figuur 1A, was de substructuur binnen populaties in elke groep minder duidelijk.
Schatting van het afstammingspercentage voor de Test Dataset
Er is gerapporteerd dat sommige Aziatische varkensrassen werden vermengd met Europese tamme rassen, en vooral met commerciële rassen. Zo is van acht Aziatische rassen (Koreaans lokaal ras (KPKO), Thais lokaal ras (THCD), China Lichahei (CNLC), China Sutai (CNST), China Kele (CNKL), China Guanling (CNGU), China Leanhua (CNLA), en China Minzhu (CNMZ)) gerapporteerd dat ze met ten minste 20% van Europese afstamming zijn geïntrogresseerd (Yang et al., 2017). Om de introgressie symmetrisch te identificeren en te kwantificeren, gebruikten we de 129 geselecteerde AIMs om de vooroudersamenstellingen te schatten van nog eens 969 monsters van 61 populaties die mogelijk ten minste tot op zekere hoogte zijn vermengd.
Over het geheel genomen vonden we, met behulp van de gesuperviseerde ADMIXTURE, een sterke correlatie (Figuur 6) tussen voorouderproporties berekend door 129 AIMs en die berekend door alle ∼60 K-chipgegevens op individueel niveau. Bland-Altman plot toonde ook overeenkomsten over de geschatte afstamming proportie tussen genoombrede en 129 AIMs gegevens (figuur 7). Voor rassen waarvan bekend was dat ze door EUCP geïnterogresseerd waren, verkregen we redelijke resultaten. Zoals blijkt uit figuur 8 en aanvullende tabel S8, was de schatting van het gemiddelde van drie voorouderverhoudingen in de CNMZ-populatie aan de hand van 129 AIM’s (ECHP:0,5325, SCHP:0,2456, EUCP:0,2219) vergelijkbaar met de schatting van het gemiddelde van drie voorouderverhoudingen in de CNMZ-populatie aan de hand van ∼60 K SNP-gegevens (ECHP:0,6457, SCHP:0,1291, EUCP:0,2252). Bij de kruising LargeWhite-Meishan (CSLM), die is gedocumenteerd als een F1-generatie van LargeWhite × MeiShan, was onze schatting van het aandeel van de voorouders op basis van de 129 AIM’s (ECHP:0.4992, SCHP:0.0455, EUCP:0.4553) in overeenstemming met de verwachting, en vergelijkbaar met het resultaat op basis van ∼60 K SNP-gegevens (ECHP:0.5128, SCHP:0.0020, EUCP:0.4852). In een ander geval, Rusland Minisibs (RUMS), waarvan is gerapporteerd dat het ongeveer de helft van de Europese voorouders heeft, verkregen we ook een hoog niveau van EUCP-voorouders door gebruik te maken van 129 AIMs (ECHP:0.1428, SCHP:0.4780, EUCP:0.3791) of ∼60 K SNP-gegevens (ECHP:0, SCHP:0.5349, EUCP:0.4651).
Figuur 6. Pearson correlatie tussen voorouders geschat door 129 AIMs en ∼60 K chip data. (A) Correlatie voor ECHP-voorouders. (B) Correlatie voor SCHP-voorouders. (C) Correlatie voor EUCP-afstamming.
Figuur 7. Bland-Altman plots tonen het verschil tussen de individuele voorouderinferentie. Op de x-as staan respectievelijk (A) ECHP, (B) SCHP en (C) EUCP voorouderverhouding geschat op basis van genoombrede schatting. De y-as vertegenwoordigt het verschil in schatting tussen genoombrede en 129 AIMs gegevens. De rode en blauwe stippellijnen zijn het gemiddelde en de 95%-betrouwbaarheidsintervallen, afzonderlijk.
Figuur 8. Verhoudingen tussen de voorouders geschat met ADMIXTURE onder toezicht bij K = 3. De hoogte van elke staaf vertegenwoordigt drie voorouderproporties in één populatie. De gemiddelde proportie van elk voorgeslacht in RUMS en CSLM is gemarkeerd met cirkeldiagrammen, respectievelijk.
Discussie
Sinds de 19e eeuw hebben varkensfokkers in het Westen Chinese varkens gebruikt om te hybridiseren met Europese varkens om hun fokdierenbestand te verbeteren (Groenen, 2016). Bianco et al. (2015) vonden dat Europese tamme varkens 20% genomische introgressie hebben van Aziatische varkens. Aan de andere kant rapporteerden Yang et al. (2017) dat Europese varkens ten minste 20% hebben bijgedragen aan acht Aziatische rassen. In de afgelopen jaren is bewijs gepresenteerd dat lokale Chinese boeren lokale varkens kruisen met geïmporteerde commerciële varkens (Berthouly-Salazar et al., 2012). Introgressie introduceert nieuw genetisch materiaal, dat zou kunnen helpen om bepaalde kenmerken te verbeteren, vooral de productieprestaties. Helaas introduceert introgressie, in enge zin, als vermenging met buitenlandse rassen, of in brede zin, als vermenging met rassen uit verschillende gebieden binnen een land, ook “genetische vervuiling” die nauwelijks te vermijden is. In een recente studie vonden Zhang et al. bijvoorbeeld dat bijna alle Chinese inheemse kippen gen-introgressie hebben van commerciële vleeskuikens (Zhang et al., 2019).
Omdat het inheemse varkensvlees tegen een hogere prijs wordt verkocht dan dat van Europese commerciële varkens in China, begonnen valse propaganda, slordig fenomeen op de markt toe te nemen. Aanzienlijke aandacht is besteed aan de kwestie van de vervalsing van varkensvlees, maar in dit stadium was het werk van de identificatie meestal gebaseerd op intuïties en ervaringen van de kant van de klant (Dai et al., 2009; Kwon et al., 2017). Gelukkig zijn varkensproducten van de 10 rassen in onze referentieset dominant in China (Bosse et al., 2015; Gong et al., 2018; Zhao et al., 2018), onze methode vormt dus een veelbelovende effectieve manier in het opsporen van varkensvleesvervalsing op DNA-niveau in markttoezicht. Vanuit het oogpunt van een onderzoeker zullen in genoomwijde associatiestudies verschillende genetische voorouders tussen geval en controle leiden tot populatiestratificatie. Daarom zou het selecteren van de monsters van vergelijkbare voorouderschapsverhoudingen of het beschouwen van voorouders als covariaten in het regressiemodel om stratificatie aan te passen, helpen om vals-positieven te verminderen(Qin et al., 2014).
Over het geheel genomen is het zeer belangrijk om de oorsprong te traceren of genetische voorouders te schatten in het kader van de bescherming van genetische hulpbronnen, markttoezicht of populatiestratificatie. AIMs biedt een kosteneffectieve aanpak in vergelijking met het gebruik van whole-genome SNP’s, en is dus zeer geschikt voor het testen van grote volumes.
In de huidige studie vonden we dat slechts twee AIMs voldoende zijn om Chinese varkens te onderscheiden van Europese commerciële varkens, en 10 zuivere rassen konden nauwkeurig worden toegewezen aan drie overeenkomstige groepen (ECHP, SCHP en EUCP) door slechts zeven AIMs te gebruiken. Door middel van datasimulaties toonden we aan dat de AIMs geselecteerd uit ongemengde individuen ook met succes kunnen worden toegepast om het aandeel in de voorouders van gemengde individuen te schatten. We ontwikkelden verder een panel van 129 AIMs om de voorouderverhoudingen van mogelijk gemengde individuen effectief af te leiden. Gezien de flexibiliteit, betrouwbaarheid en serviceability, zou het Agena MassARRAY platform momenteel de beste keuze zijn voor genotypering voor de 129 AIMs set. Voor het testen van zeer grote volumes zouden op maat gemaakte SNP-chips met lage dichtheid of multiplex PCR-gebaseerde next-generation sequencing echter kosteneffectiever zijn.
Ons werk was een nuttig voorbeeld van het gebruik van een klein aantal AIMs voor classificaties en het schatten van afstammingsverhoudingen. Er kunnen nog inspanningen worden geleverd om de AIM’s zo nodig tot een minimumaantal te optimaliseren. Van de 129 AIM’s zouden bijvoorbeeld die welke de verschillen tussen EUCP en ECHP of SCHP weergeven, eventueel kunnen worden gereduceerd. Of om meer AIMs op te nemen om het onderscheidingsvermogen tussen ECHP en SCHP te vergroten.
Het is de moeite waard op te merken dat een van de belangrijke voorwaarden voor het verkrijgen van effectieve AIMs voor hetzij classificatie of voorouderschapsschatting is het vinden van goede referentiepopulaties. Daya et al. (2013) meldden bijvoorbeeld dat een panel van 96 AIMs kon worden gebruikt om de voorouderschapsverhoudingen af te leiden voor de Zuid-Afrikaans gekleurde (SAC) bevolking, door gebruik te maken van representatieve populaties. Deze markers presteerden echter niet goed bij de afleiding van Zuid-Aziatische en Oost-Aziatische voorouders. In onze studie zijn 10 zuivere varkensrassen uit drie groepen (ECHP, SCHP en EUCP) gekozen als referentiepopulaties. Er zijn verschillende redenen waarom wij deze rassen hebben gekozen. Ten eerste, veel Europese commerciële varkens of kruisingen van inheemse rassen met Europese commerciële rassen worden steeds gebruikelijker in China, dus hier werden de belangrijkste geïmporteerde Europese commerciële rassen waaronder Duroc, Pietrain en Landrace gekozen als representatieve populaties van EUCP. Ten tweede, de Chinese rassen in deze studie bestreken twee aangewezen afstammingachtergronden. In de studie van Yang et al. (Yang et al., 2017) zijn China_Erhualian (CNEH), China_Jinhua (CNJH), China_Meishan (CNMS) varkens duidelijk afgeleid van het ene voorgeslacht, en China_Bamaxiang (CNBX), China_Congjiangxiang (CNCJ), China_Guangdongdahuabai (CNDH) en China_Luchuan (CNLU) zijn duidelijk afgeleid van het andere. Admixture analyse toonde aan dat zij het minst geïnterogresseerd zijn door EUCP en duidelijk van elkaar gescheiden kunnen worden. Samen vormen zij dus de beste referentiepopulatie die tot nu toe beschikbaar is, zowel wat betreft genetische zuiverheid als het vermogen om potentiële vermenging in andere Chinese rassen aan het licht te brengen. Als in de toekomst meer zuivere rassen in de referentiepopulatie worden opgenomen, kan een nauwkeurigere schatting worden verwacht, evenals een groter aantal populaties waarop onze methode kan worden toegepast.
Bijdragen van de auteur
YZ heeft de studie opgezet en begeleid. ZL analyseerde de belangrijkste gegevens met de hulp van LB, YQ, YP, en RY. ZL en YZ schreven het manuscript. Alle auteurs lazen en keurden het definitieve manuscript goed.
Funding
Het project werd ondersteund door het National Key Technology Research and Development Program (2015BAD03B01-01) en de National Natural Science Foundation of China (U1704233).
Conflict of Interest Statement
De auteurs verklaren dat het onderzoek is uitgevoerd in afwezigheid van commerciële of financiële relaties die kunnen worden opgevat als een potentieel belangenconflict.
Supplementary Material
Het Supplementary Material voor dit artikel is online te vinden op: https://www.frontiersin.org/articles/10.3389/fgene.2019.00183/full#supplementary-material
Footnotes
- ^http://dx.doi.org/10.5061/dryad.30tk6
- ^https://github.com/boxiangliu/ANTseq
- ^http://www.curveexpert.net
Ai, H., Huang, L., and Ren, J. (2013). Genetische diversiteit, linkage disequilibrium en selectie handtekeningen in Chinese en westerse varkens onthuld door genoom-brede SNP markers. PLoS One 8:e56001. doi: 10.1371/journal.pone.0056001
PubMed Abstract | CrossRef Full Text | Google Scholar
Alexander, D. H., Novembre, J., and Lange, K. (2009). Fast model-based estimation of ancestry in unrelated individuals. Genome Res. 19, 1655-1664. doi: 10.1101/gr.094052.109
PubMed Abstract | CrossRef Full Text | Google Scholar
Barbosa, F. B., Cagnin, N. F., Simioni, M., Farias, A. A., Torres, F. R., Molck, M. C., et al. (2017). Ancestry informative marker panel to estimate population stratification using genome-wide human array. Ann. Hum. Genet. 81, 225-233. doi: 10.1111/ahg.12208
PubMed Abstract | CrossRef Full Text | Google Scholar
Bauchet, M., McEvoy, B., Pearson, L. N., Quillen, E. E., Sarkisian, T., Hovhannesyan, K., et al. (2007). Het meten van Europese populatie stratificatie met microarray genotype data. Am. J. Hum. Genet. 80, 948-956. doi: 10.1086/513477
PubMed Abstract | CrossRef Full Text | Google Scholar
Berthouly-Salazar, C., Thevenon, S., Van, T. N., Nguyen, B. T., Pham, L. D., Chi, C. V., et al. (2012). Ongecontroleerde vermenging en verlies van genetische diversiteit in een lokaal vietnamees varkensras. Ecol. Evol. 2, 962-975. doi: 10.1002/ece3.229
PubMed Abstract | CrossRef Full Text | Google Scholar
Bertolini, F., Galimberti, G., Schiavo, G., Mastrangelo, S., Di Gerlando, R., Strillacci, M. G., et al. (2017). Preselectiestatistieken en random forest classificatie identificeren populatie-informatieve single nucleotide polymorfismen in kosmopolitische en autochtone runderrassen. Animal 12, 12-19. doi: 10.1017/S1751731117001355
PubMed Abstract | CrossRef Full Text | Google Scholar
Bianco, E., Soto, H. W., Vargas, L., and Perez-Enciso, M. (2015). The chimerical genome of Isla del Coco feral pigs (Costa Rica), an isolated population since 1793 but with remarkable levels of diversity. Mol. Ecol. 24, 2364-2378. doi: 10.1111/mec.13182
PubMed Abstract | CrossRef Full Text | Google Scholar
Bosse, M., Madsen, O., Megens, H. J., Frantz, L. A. F., Paudel, Y., Crooijmans, R. P., et al. (2015). Hybride oorsprong van europese commerciële varkens onderzocht door een diepgaande haplotype analyse op chromosoom 1. Front. Genet. 5:442. doi: 10.3389/Fgene.2014.00442
PubMed Abstract | CrossRef Full Text | Google Scholar
Bosse, M., Megens, H. J., Frantz, L. A. F., Madsen, O., Larson, G., Paudel, Y., et al. (2014). Genomic analysis reveals selection for asian genes in european pigs following human-mediated introgression. Nat. Commun. 5:4392. doi: 10.1038/Ncomms5392
PubMed Abstract | CrossRef Full Text | Google Scholar
Bouchemousse, S., Liautard-Haag, C., Bierne, N., and Viard, F. (2016). Distinguishing contemporary hybridization from past introgression with postgenomic ancestry-informative SNPs in strongly differentiated Ciona species. Mol. Ecol. 25, 5527-5542. doi: 10.1111/mec.13854
PubMed Abstract | CrossRef Full Text | Google Scholar
Browning, S. R., and Browning, B. L. (2007). Rapid and accurate haplotype phasing and missing-data inference for whole-genome association studies by use of localized haplotype clustering. Am. J. Hum. Genet. 81, 1084-1097. doi: 10.1086/521987
PubMed Abstract | PubRef Full Text | Google Scholar
Da Mota, B., Tudoran, R., Costan, A., Varoquaux, G., Brasche, G., Conrod, P., et al. (2014). Machine learning patronen voor neuroimaging-genetische studies in de wolk. Front. Neuroinform. 8:31. doi: 10.3389/Fninf.2014.00031
PubMed Abstract | CrossRef Full Text | Google Scholar
Dai, F. W., Feng, D. Y., Cao, Q. Y., Ye, H., Zhang, C. M., Xia, W. G., et al. (2009). Developmental differences in carcass, meat quality and muscle fibre characteristics between the landrace and a Chinese native pig. S. Afr. J. Anim. Sci. 39, 267-273.
Google Scholar
Daya, M., van der Merwe, L., Galal, U., Moller, M., Salie, M., Chimusa, E. R., et al. (2013). A panel of ancestry informative markers for the complex five-way admixed South African coloured population. PLoS One 8:e82224. doi: 10.1371/journal.pone.0082224
PubMed Abstract | CrossRef Full Text | Google Scholar
Dimauro, C., Nicoloso, L., Cellesi, M., Macciotta, N. P. P., Ciani, E., Moioli, B., et al. (2015). Selectie van discriminerende SNP-merkers voor ras- en geografische toewijzing van Italiaanse schapen. Small Rumin. Res. 128, 27-33. doi: 10.1016/j.smallrumres.2015.05.001
CrossRef Full Text | Google Scholar
Ding, L. L., Wiener, H., Abebe, T., Altaye, M., Go, R. C. P., Kercsmar, C., et al. (2011). Comparison of measures of marker informativeness for ancestry and admixture mapping. BMC Genomics 12:622. doi: 10.1186/1471-2164-12-622
PubMed Abstract | CrossRef Full Text | Google Scholar
Fang, M., Hu, X., Jiang, T., Braunschweig, M., Hu, L., Du, Z., et al. (2005). The phylogeny of Chinese indigenous pig breeds inferred from microsatellite markers. Anim. Genet. 36, 7-13. doi: 10.1111/j.1365-2052.2004.01234.x
PubMed Abstract | CrossRef Full Text | Google Scholar
Frantz, L. A. F., Schraiber, J. G., Madsen, O., Megens, H. J., Bosse, M., Paudel, Y., et al. (2013). Genome sequencing reveals fine scale diversification and reticulation history during speciation in Sus. Genome Biol. 14:R107. doi: 10.1186/Gb-2013-14-9-R107
PubMed Abstract | CrossRef Full Text | Google Scholar
Galanter, J. M., Fernandez-Lopez, J. C., Gignoux, C. R., Barnholtz-Sloan, J., Fernandez-Rozadilla, C., Via, M., et al. (2012). Development of a panel of genome-wide ancestry informative markers to study admixture throughout the americas. PLoS Genet. 8:e1002554. doi: 10.1371/journal.pgen.1002554
PubMed Abstract | CrossRef Full Text | Google Scholar
Getachew, T., Huson, H. J., Wurzinger, M., Burgstaller, J., Gizaw, S., Haile, A., et al. (2017). Identifying highly informative genetic markers for quantification of ancestry proportions in crossbred sheep populations: implications for choosing optimum levels of admixture. BMC Genet. 18:80. doi: 10.1186/s12863-017-0526-2
PubMed Abstract | CrossRef Full Text | Google Scholar
Gong, H., Xiao, S., Li, W., Huang, T., Huang, X., Yan, G., et al. (2018). Ontrafelen van de genetische loci voor groei en karkaskenmerken in Chinese Bamaxiang varkens op basis van een 1,4 miljoen SNP array. J. Anim. Breed. Genet. 136, 3-14. doi: 10.1111/jbg.12365
PubMed Abstract | CrossRef Full Text | Google Scholar
Groenen, M. A. M. (2016). A decade of pig genome sequencing: a window on pig domestication and evolution. Genet. Sel. Evol. 48:23. doi: 10.1186/s12711-016-0204-2
PubMed Abstract | CrossRef Full Text | Google Scholar
Hong, J. H., and Cho, S. B. (2008). A probabilistic multi-class strategy of one-vs.-rest support vector machines for cancer classification. Neurocomputing 71, 3275-3281. doi: 10.1016/j.neucom.2008.04.033
CrossRef Full Text | Google Scholar
Kwon, T., Yoon, J., Heo, J., Lee, W., and Kim, H. (2017). Traceren van de fokkerij van gedomesticeerd varken met behulp van feature selection (Sus scrofa). Asian Aust. J. Anim. Sci. 30, 1540-1549. doi: 10.5713/ajas.17.0561
PubMed Abstract | CrossRef Full Text | Google Scholar
Larson, G., Dobney, K., Albarella, U., Fang, M. Y., Matisoo-Smith, E., Robins, J., et al. (2005). Wereldwijde fylogeografie van wilde zwijnen onthult meerdere centra van varkens domesticatie. Science 307, 1618-1621. doi: 10.1126/science.1106927
PubMed Abstract | CrossRef Full Text | Google Scholar
Lawson, D. J., Hellenthal, G., Myers, S., and Falush, D. (2012). Inference of population structure using dense haplotype data. PLoS Genet. 8:e1002453. doi: 10.1371/journal.pgen.1002453
PubMed Abstract | CrossRef Full Text | Google Scholar
Lee, S., Epstein, M. P., Duncan, R., and Lin, X. H. (2012). Sparse principal component analysis for identifying ancestry-informative markers in genome-wide association studies. Genet. Epidemiol. 36, 293-302. doi: 10.1002/gepi.21621
PubMed Abstract | CrossRef Full Text | Google Scholar
Li, C. X., Pakstis, A. J., Jiang, L., Wei, Y. L., Sun, Q. F., Wu, H., et al. (2016). Een panel van 74 AISNP’s: verbeterde inferentie van voorouders binnen Oost-Azië. Forensic Sci. Int. Genet. 23, 101-110. doi: 10.1016/j.fsigen.2016.04.002
PubMed Abstract | CrossRef Full Text | Google Scholar
Li, S.-J., Yang, S.-H., Zhao, S.-H., Fan, B., Yu, M., Wang, H.-S., et al. (2004). Genetische diversiteitsanalyses van 10 inheemse Chinese varkenspopulaties op basis van 20 microsatellieten. J. Anim. Sci. 82, 368-374. doi: 10.2527/2004.822368x
PubMed Abstract | CrossRef Full Text | Google Scholar
Maples, B. K., Gravel, S., Kenny, E. E., and Bustamante, C. D. (2013). RFMix: een discriminatieve modellering aanpak voor snelle en robuuste lokale-antiestry inferentie. Am. J. Hum. Genet. 93, 278-288. doi: 10.1016/j.ajhg.2013.06.020
PubMed Abstract | CrossRef Full Text | Google Scholar
Monzon, J., Kays, R., and Dykhuizen, D. E. (2014). Assessment of coyote-wolf-hond admixture using ancestry-informative diagnostic SNPs. Mol. Ecol. 23, 182-197. doi: 10.1111/mec.12570
PubMed Abstract | CrossRef Full Text | Google Scholar
Pardo-Seco, J., Martinon-Torres, F., and Salas, A. (2014). Evaluating the accuracy of AIM panels at quantifying genome ancestry. BMC Genomics 15:543. doi: 10.1186/1471-2164-15-543
PubMed Abstract | CrossRef Full Text | Google Scholar
Patterson, N., Price, A. L., and Reich, D. (2006). Populatiestructuur en eigenanalyses. PLoS Genet. 2:e190. doi: 10.1371/journal.pgen.0020190
PubMed Abstract | CrossRef Full Text | Google Scholar
Peterson, R. E., Edwards, A. C., Bacanu, S. A., Dick, D. M., Kendler, K. S., and Webb, B. T. (2017). The utility of empirically assigning ancestry groups in cross-population genetic studies of addiction. Am. J. Addict. 26, 494-501. doi: 10.1111/ajad.12586
PubMed Abstract | CrossRef Full Text | Google Scholar
Qin, P., Li, Z., Jin, W., Lu, D., Lou, H., Shen, J., et al. (2014). Een panel van voorouderinformatieve markers om potentiële effecten van populatiestratificatie in Han-Chinezen te schatten en te corrigeren. Eur. J. Hum. Genet. 22, 248-253. doi: 10.1038/ejhg.2013.111
PubMed Abstract |Ref Full Text | Google Scholar
Rosenberg, N. A., Li, L. M., Ward, R., and Pritchard, J. K. (2003). Informativeness of genetic markers for inference of ancestry. Am. J. Hum. Genet. 73, 1402-1422. doi: 10.1086/380416
PubMed Abstract | CrossRef Full Text | Google Scholar
Santos, H. C., Horimoto, A. V. R., Tarazona-Santos, E., Rodrigues-Soares, F., Barreto, M. L., Horta, B. L., et al. (2016). Een minimale set van ancestry informatieve markers voor het bepalen van admixture proporties in een gemengde Amerikaanse populatie: de Braziliaanse set. Eur. J. Hum. Genet. 24, 725-731. doi: 10.1038/ejhg.2015.187
PubMed Abstract | CrossRef Full Text | Google Scholar
Shriver, M. D., Parra, E. J., Dios, S., Bonilla, C., Norton, H., Jovel, C., et al. (2003). Huidpigmentatie, biogeografische voorouders en admixture mapping. Hum. Genet. 112, 387-399. doi: 10.1007/s00439-002-0896-y
PubMed Abstract | CrossRef Full Text | Google Scholar
Sun, K., Ye, Y., Luo, T., and Hou, Y. (2016). Multi-InDel analyse voor voorouderlijke inferentie van sub-populaties in china. Sci. Rep. 6:39797. doi: 10.1038/srep39797
PubMed Abstract | CrossRef Full Text | Google Scholar
Tian, C., Kosoy, R., Nassir, R., Lee, A., Villoslada, P., Klareskog, L., et al. (2009). European population genetic substructure: further definition of ancestry informative markers for distinguishing among diverse european ethnic groups. Mol. Med. 15, 371-383. doi: 10.2119/molmed.2009.00094
PubMed Abstract |Ref Full Text | Google Scholar
vonHoldt, B. M., Kays, R., Pollinger, J. P., and Wayne, R. K. (2016). Admixture mapping identificeert introgressed genomische regio’s in Noord-Amerikaanse caniden. Mol. Ecol. 25, 2443-2453. doi: 10.1111/mec.13667
PubMed Abstract | CrossRef Full Text | Google Scholar
Yang, B., Cui, L. L., Perez-Enciso, M., Traspov, A., Crooijmans, R. P. M. A., Zinovieva, N., et al. (2017). Genoombrede SNP-gegevens onthullen de globalisering van gedomesticeerde varkens. Genet. Sel. Evol. 49:71. doi: 10.1186/s12711-017-0345-y
PubMed Abstract | CrossRef Full Text | Google Scholar
Zeng, X. P., Chakraborty, R., King, J. L., Larue, B., Moura-Neto, R. S., and Budowle, B. (2016). Selectie van zeer informatieve SNP-merkers voor populatieverwantschap van belangrijke Amerikaanse populaties. Int. J. Legal Med. 130, 341-352. doi: 10.1007/s00414-015-1297-9
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhang, C., Lin, D., Wang, Y., Peng, D., Li, H., Fei, J., et al. (2019). Wijdverspreide introgressie in Chinese inheemse kippenrassen van commerciële vleeskuikens. Evol. Appl. 12, 610-621. doi: 10.1111/eva.12742
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhang, F., Zhang, L., and Deng, H. W. (2009). Een PCA-gebaseerde methode voor voorouderlijke informatieve markerselectie in gestructureerde populaties. Sci. Chin. Series C Life Sci. 52, 972-976. doi: 10.1007/s11427-009-0128-y
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhao, P., Yu, Y., Feng, W., Du, H., Yu, J., Kang, H., et al. (2018). Bewijs van evolutionaire geschiedenis en selectieve vegen in het genoom van Meishan varken onthult zijn genetische en fenotypische karakterisering. Gigascience 7. doi: 10.1093/gigascience/giy058
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhu, Y., Li, W., Yang, B., Zhang, Z., Ai, H., Ren, J., et al. (2017). Signaturen van selectie en interspecies introgressie in het genoom van chinese huisvarkens. Genome Biol. Evol. 9, 2592-2603. doi: 10.1093/gbe/evx186
PubMed Abstract | CrossRef Full Text | Google Scholar