Frontiers in Genetics
- Introduction
- Materiál a metody
- Sběr dat a kontrola kvality
- Struktura populace
- Výběr AIMs
- Klasifikace skupin pomocí minimálních AIM
- Ancestry Inference With Optimal AIMs
- Výsledky
- Struktura populace referenčních populací
- Klasifikace skupin pomocí AIMs
- Přesný odhad podílu předků pomocí AIMs
- Odhad podílu předků pro testovací soubor dat
- Diskuse
- Příspěvky autora
- Financování
- Prohlášení o střetu zájmů
- Přídavné materiály
- Přílohy
Introduction
Autosomální jednonukleotidový polymorfismus (SNP) a inserce-delece (InDel) jsou široce využívány pro odvozování lidského původu a přiřazování populací (Bauchet et al., 2007; Tian et al., 2009; Sun et al., 2016). Informativní markery původu (Ancestry informative markers, AIM) jsou genetické markery frekvenčních rozdílů mezi populacemi (Shriver et al., 2003). K získání AIM bylo použito více statistik, včetně statistiky F (FST), absolutních rozdílů frekvencí alel (δ), míry informativnosti pro přiřazení (In) a skóre zatížení hlavních komponent (Rosenberg et al., 2003; Zhang et al., 2009; Ding et al., 2011; vonHoldt et al., 2016; Barbosa et al., 2017; Peterson et al., 2017). Místo použití celogenomových markerů byly AIM považovány za dostatečně přesné pro odvození původu pro omezenou velikost populace. V důsledku toho představuje ekonomický způsob screeningu a analýzy tisíců vzorků. Santos et al. (2016) uvedli, že 192 AIM vybraných z dat ∼370 K SNP lze použít k přesnému odhadu podílů předků tří hlavních populací v Brazílii. Li et al. (2016) vytvořili panel 74 AIM k odvození proporcí původu 500 testovaných jedinců z 11 populací. Díky vysokému rozlišení AIMs panel 23 AIMs vytvořený Zengem et al (2016). rozlišil čtyři hlavní americké populace a správně určil původ u devíti dalších populací (Zeng et al., 2016).
Pro populační genetiku zvířat byly AIMs úspěšně použity k identifikaci plemen různých odrůd a k hodnocení genetického složení v hybridních populacích (Dimauro et al., 2015; Bouchemousse et al., 2016). Bertolini et al. (2017) zjistili, že 96 AIM se dobře osvědčilo při rozlišování šesti plemen mléčného skotu. V jiné studii bylo 63 AIM vybraných ze 427 psovitých šelem využito k posouzení genetické příměsi u kojotů (Monzon et al., 2014). Nedávno bylo 74 AIM použito k výpočtu podílů předků u kříženců ovcí (Awassi se dvěma původními plemeny v Etiopii) a bylo zjištěno, že různé úrovně příměsi Awassi významně ovlivňují znaky růstu jehňat a reprodukce ovcí (Getachew et al.,
Vepři (Sus scrofa) se v průběhu poloviny pleistocénu (před 1,2-0,8 miliony let) rozdělili na evropské a asijské divočáky (Larson et al., 2005; Frantz et al., 2013). K domestikaci prasat v Číně došlo před ∼9 000 lety (Larson et al., 2005). Bylo doloženo, že čínská domácí prasata byla rozdělena do šesti typů podle oblasti obývání a fenotypových charakteristik (I-Severní Čína, II-Dolní povodí Changjiang, III-Střední Čína, IV-Jižní Čína, V-Jihozápadní a VI-Plateau) (Li et al., 2004; Fang et al., 2005). V nedávné studii Yang et al. (2017). sledovali předky různých čínských plemen a identifikovali dva hlavní odlišné předky, které jsou východočínského (např. Meishan a JinHua) a jihočínského (např. Luchuan a Bamaxiang) původu. Kromě toho byla také zaznamenána genomická introgrese z evropských komerčních plemen do čínských původních prasat (Ai et al., 2013; Bosse et al., 2014; Zhu et al., 2017), čímž se genetické složení moderních čínských prasat ještě více komplikuje.
Ačkoli se široce uplatňuje u jiných zvířat a má velký význam ve specifických scénářích použití, včetně dozoru nad trhem a ochrany genetických zdrojů, v současné době neexistuje žádná studie, která by se konkrétně zabývala problémem efektivního využití AIM pro rozlišování plemen prasat nebo pro odhad podílů předků. Zde jsme s využitím dat z ∼60 K SNP čipů prasat hledali optimální počet AIM pro rozlišení prasat východočínského, jihočínského nebo evropského původu. Na základě 129 vybraných AIM jsme odhadli podíly předků výše uvedeného původu u ostatních čínských prasat. Navrhli jsme, že AIM vybrané z nesmíšených referenčních populací lze použít k přesnému odhadu podílů předků v hybridních populacích. Naše výsledky poskytují užitečný příklad využití AIMs pro klasifikaci plemen a odhad původu u prasat.
Materiál a metody
Sběr dat a kontrola kvality
Genotypová data 2 113 vzorků byla získána z digitálního repozitáře Dryad1. V této studii byly použity pouze vzorky z asijských plemen a evropských plemen (celkem 1 157 vzorků ze 71 populací, podrobnosti v doplňkové tabulce S1). Vzorky a SNP byly vyloučeny, pokud byla splněna následující kritéria: (1) jedinec obsahoval více než 10 % chybějících genotypů; (2) SNP s call rate nižší než 95 %; (3) SNP s frekvencí minoritní alely nižší než 0,05; (4) SNP, které se nacházely na pohlavních chromozomech; a (5) SNP nebyly bialelické. Chybějící genotypy byly následně imputovány pomocí BEAGLE (verze 3.3.2) (Browning a Browning, 2007). Nakonec zůstalo 45 562 SNP a 1 155 vzorků. Těchto 1 155 vzorků bylo následně rozděleno do dvou datových souborů. Pro referenční soubor bylo vybráno 186 vzorků z 10 reprezentativních populací tří hlavních rodových skupin: Východočínské prase (ECHP), Jihočínské prase (SCHP) a Evropské komerční prase (EUCP). Těchto 10 populací bylo vybráno na základě skutečnosti, že mezi populacemi patřícími do skupiny ECHP nebo SCHP nebyla zjevná příměs, jak uvádí zpráva Yang et al. (2017). Tento soubor dat je shrnut v tabulce 1. Testovací soubor dat obsahoval zbývajících 969 vzorků z 61 populací (podrobnosti v doplňkové tabulce S2). S ohledem na pohodlí praktického použití byly údaje o genotypu testovacího souboru dat získány přímo ze surových dat bez fázování nebo imputace.
Tabulka 1. Informace o plemenech prasat v referenčním souboru.
Struktura populace
Analýza hlavních komponent (PCA) byla provedena na ∼60 K čipových datech pomocí SMARTPCA (verze 6.1.4) v referenčním souboru (Patterson et al., 2006). K potvrzení stavu nesmíšeného původu byl použit neřízený program ADMIXTURE (verze 1.23) (Alexander et al., 2009) k výpočtu podílů předků vzorků z referenčního souboru s počtem předků (K) nastaveným od K = 3 do K = 15. V případě, že se jedná o vzorky s neřízenými předky, byl použit program ADMIXTURE (verze 1.23) (Alexander et al., 2009). Ke zkoumání podobnosti/nepodobnosti jedinců v referenčním souboru byl rovněž zvolen propojený model ChromoPainter v2 (Lawson et al., 2012). Podrobněji byl soubor rekombinační mapy vygenerován pomocí skriptu makeuniformrecfile.pl poskytnutého programem fineSTRUCTURE (verze 2.1.1) (Lawson et al., 2012). Pomocí profilu skrytého Markovova modelu ChromoPainter v2 odvozuje haplotypy „dárce“ a „příjemce“ a vytváří matici koancí. Zpočátku bylo použito 20 kroků maximalizace očekávání k odhadu míry mutací a přepínání na 1/5 náhodných členů vzorku ze všech jedinců se všemi uvažovanými autozomy. Odhadnuté míry mutací a přepínání pro každý chromozom byly poté zprůměrovány. Následně byla s odhadnutou mírou mutace, mírou přepínání a dalšími výchozími hodnotami opět použita aplikace ChromoPainter v2 ke generování matice koancí pro všechny jedince. Nakonec byl použit algoritmus MCMC implementovaný v programu fineSTRUCTURE k hierarchickému shlukování jedinců s vyhořením a dobou běhu 1 000 000, resp. 6 000 000 iterací.
Výběr AIMs
Všech 186 vzorků v referenčním souboru dat bylo použito k výpočtu FST a In. Kandidátní SNP byly vybrány ze selektoru algoritmu AIMs, který byl implementován v souboru AIMs_generator.py z pipeline ANTseq2. Konkrétně jsme nejprve vyloučili SNP ve vysoké vazbové nerovnováze (LD) výběrem pouze jednoho SNP v oblasti silné LD (r2 > 0,3) a ve vzdálenosti do 500 kb. V rámci každé skupiny byly dále vyloučeny SNP, které vykazovaly heterogenní frekvence mezi populacemi, a to na základě Chi-kvadrát testu (Galanter et al., 2012). Za druhé, FST a In byly vypočteny pro každou ze tří párových skupin : ECHP vs. EUCP, SCHP vs. EUCP a ECHP vs. SCHP (Rosenberg et al., 2003).
Klasifikace skupin pomocí minimálních AIM
Při použití referenčního souboru dat jsme nejprve porovnali diskriminační sílu AIM vybraných pomocí FST nebo In. Binární klasifikace pro tři párové skupiny byla provedena samostatně. Pro každou párovou skupinu jsme začali výběrem dvou až 30 nejlepších AIM s přírůstkem jednoho AIM. Vzorky v příslušné párové skupině byly náhodně rozděleny na dva podíly: 75 % pro trénink, 25 % pro testování a tato operace byla opakována 50krát. GridSearchCV implementovaný v balíčku Scikit-learn (verze 0.18) byl poté použit k určení optimálních parametrů pro klasifikátor SVM (support vector machine) (Da Mota et al., 2014). Parametry pro SVM jsou shrnuty v doplňkové tabulce S3. U modelu s optimálními parametry byla přesnost klasifikace vyhodnocena pomocí průměrného Matthewsova korelačního koeficientu (MMCC) pro 50 opakování takto:
kde TNi a FNi jsou počty pravdivě negativních a falešně negativních výsledků a TPi a FPi jsou počty pravdivě pozitivních a falešně pozitivních výsledků, pro každý běh.
Pro určení minimálního počtu AIM pro současné rozlišení ECHP, SCHP a EUCP se používá přístup více tříd jedna-vs.zbytku SVM byl použit na referenčním souboru dat (Hong a Cho, 2008). Podobně jsme začali výběrem dvou až dvou set nejlepších AIM z každé z párových skupin s přírůstkem jednoho AIM, čímž jsme získali celkem 199 sad AIM. V každé sadě byly AIM vybrané ze tří párových skupin sloučeny a duplicitní AIM byly odstraněny (doplňková tabulka S4). Vzhledem k tomu, že MMCC nebyl navržen pro hodnocení přesnosti klasifikace více tříd, byly místo toho k hodnocení přesnosti klasifikace použity matice záměny, Cohenova statistika kappa a vyvážená chybovost. Vyšší Cohenova kappa, ale nižší vyvážená chybovost znamenaly vyšší přesnost klasifikace. K odhadu nejlepších parametrů pro jednotřídní SVM jsme opět využili GridSearchCV, jehož parametry jsou shrnuty v doplňkové tabulce S3. Vytvořili jsme také náhodné sady SNP o stejném počtu z celého genomu pro porovnání diskriminační síly s vybranými AIMs.
Ancestry Inference With Optimal AIMs
AIMs byly široce používány k odhadu podílů předků v hybridních populacích, a to i v případech, kdy byly vybrány z nesmíšených populací. Na základě vybraných AIM jsme k odhadu podílů předků u možných příbuzenských populací prasat použili strategii, která byla podobná strategii použité v předchozí studii Pardo-Seco et al. (2014). Nejprve jsme vytvořili pseudopříbuzné jedince náhodným výběrem genotypů vybraných AIM ze vzorků v referenčním souboru dat se stejným podílem. Očekávané podíly předků těchto pseudopříbuzných jedinců byly tedy 1/3 (∼0,3333) z každé skupiny (ECHP, SCHP a EUCP). Pro každou ze 199 sad AIM vytvořených na základě výše uvedeného bylo provedeno 1 000 simulací. K odhadu podílů předků byla použita metoda ADMIXTURE s dohledem (K = 3). Výkonnost byla hodnocena podle průměru a variačního koeficientu (CV) odhadnutých podílů předků. CV odhadnutých podílů předků v závislosti na počtu AIM byl vypočítán pomocí programu Curve Expert 1.43. Optimální počet AIM byl určen výběrem sklonu prahové tečny křivky, jejíž stabilní výkonnost byla pozorována nad tímto bodem. Abychom přidali další ověření, simulovali jsme pseudopříbuzné jedince s náhodnými poměry předků pomocí určeného optimálního počtu AIM. Podíly předků ECHP, SCHP a EUCP byly přiřazeny náhodně s minimálním podílem nastaveným na 10 %.
Na základě AIM vybraných v posledním kroku jsme provedli odvození předků pro 969 jedinců v testovacím souboru dat pomocí metody ADMIXTURE s dohledem. Výkonnost byla hodnocena pomocí Pearsonova korelačního koeficientu mezi celogenomovými SNP a optimálním počtem AIM.
Výsledky
Struktura populace referenčních populací
Populace v referenčním souboru měly být nejméně příbuzné. Pozorovali jsme však, že ECHP, SCHP a EUCP byly v grafu hlavních komponent dobře odděleny (obrázek 1A). Celogenomové rozdělení FST (obrázek 1B) ukázalo vyšší diferenciaci jak mezi ECHP vs. EUCP (průměr = 0,2197, 95% CI 0,0006-0,7267), tak mezi SCHP vs. EUCP (průměr = 0,2153, 95% CI 0,0005-0,7570), zatímco diferenciace mezi ECHP vs. SCHP (průměr = 0,0588, 95% CI 0-0,3342) byla zřetelně méně výrazná. Pomocí metody ADMIXTURE byla všechna plemena dobře rozdělena do předpokládaných skupin (obr. 1C), když K = 3, v souladu s předchozí studií Yang et al. (2017). Při K = 10 bylo možné jasně oddělit 10 populací, což bylo v souladu s naším očekáváním, že 10 populací bylo nejméně příbuzných (doplňkový obrázek S1).
Obrázek 1. Při K = 10 bylo možné jasně oddělit 10 populací, což bylo v souladu s naším očekáváním, že 10 populací bylo nejméně příbuzných (doplňkový obrázek S1). Populační struktura 10 plemen v referenčním souboru dat. (A) Analýza hlavních komponent (PCA) dat z ∼60 K čipů. (B) Celogenomové rozdělení FST pro tři párové skupiny: ECHP vs. EUCP, SCHP vs. EUCP a ECHP vs. SCHP. Červená svislá čára představuje průměr distribuce FST. Čárkované svislé čáry představují 2,5 a 97,5 % percentil distribuce FST. (C) ADMIXTURE shlukování dat z čipu ∼60 K, když K = 3-12. CNBX, China_Bamaxiang; CNCJ, China_Congjiangxiang; CNLU, China_Luchuan; CNDH, China_Guangdongdahuabai; CNJH, China_Jinhua; CNEH, China_Erhualian; CNMS, China_Meishan; DUR2, Duroc2; PIT1, Pietrain1; LDR1, Landrace1. Barevné kódy velkých závorek jsou následující, zelená: Východočínské prase (ECHP); červená: Jihočínské prase (SCHP); modrá: Evropské komerční prase (EUCP).
Pro další kvantifikaci byly použity programy ChromoPainter v2 a fineSTRUCTURE pro kontrolu příbuznosti mezi těmito plemeny s ohledem na LD. Jak ukazuje heatmapa koancestrie (obr. 2), jedinci v rámci každé skupiny vykazovali homogenní vzorec a jedinci ze stejné skupiny sdíleli více genetických kusů než z jiných skupin. Zejména EUCP mělo zanedbatelný stupeň koancestrie s jedinci z původních čínských plemen. Vzorek z ECHP a SCHP vykazoval vyšší stupeň koancestrie, ale jedinci ze stejné skupiny měli stále tendenci shlukovat se více dohromady než mezi skupinami. Celkově výsledky naznačují, že vzorky v referenčním souboru dat vykazovaly zanedbatelnou míru příměsi.
Obrázek 2. Analýza fineSTRUCTURE v referenčním souboru dat. Teplotní mapa zobrazuje počet sdílených genetických kusů zkopírovaných z genomu dárce (sloupec) do genomu příjemce (řádek). CNBX, China_Bamaxiang; CNCJ, China_Congjiangxiang; CNLU, China_Luchuan; CNDH, China_Guangdongdahuabai; CNJH, China_Jinhua; CNEH, China_Erhualian; CNMS, China_Meishan; DUR2, Duroc2; PIT1, Pietrain1; LDR1, Landrace1. Barevné kódy jsou následující, zelená: Východočínské prase (ECHP); červená: Jihočínské prase (SCHP); modrá: Evropské komerční prase (EUCP).
Klasifikace skupin pomocí AIMs
Pro vytvoření efektivní sady AIMs jsme nejprve porovnali výkonnost statistik FST a In. Pro párovou skupinu ECHP vs. EUCP a SCHP vs. EUCP bylo zjištěno, že k dokonalému oddělení (MMCC = 1) stačí minimálně dva AIM, a to buď výběrem nejlepší FST, nebo nejlepší In statistiky (doplňkový obrázek S2). K oddělení ECHP vs. SCHP však bylo zapotřebí alespoň čtyř AIM při použití FST nebo alespoň pěti při použití In. U AIM vybraných pomocí FST nebo In jsme zjistili, že informativní AIM vybrané pomocí In se z velké části překrývaly s AIM vybranými pomocí FST, což naznačuje, že FST je přinejmenším stejně informativní jako In. Proto byly následující analýzy založeny pouze na AIM vybraných pomocí FST.
Dále jsme se pokusili určit počet AIM, které by mohly být použity k oddělení ECHP, SCHP a EUCP současně pomocí přístupu více tříd. Jak je popsáno v části Materiály a metody, byly postupně vybrány dva až 200 nejlépe hodnocených AIM z ECHP vs. EUCP, SCHP vs. EUCP, resp. z ECHP vs. SCHP, čímž vzniklo 199 sad AIM s rostoucím počtem (doplňková tabulka S4). AIM v každé sadě byly sloučeny a deduplikovány. Například u největšího souboru bylo 171 z 200 AIM společných mezi ECHP vs. EUCP a SCHP vs. EUCP (doplňkový obrázek S3), 12 z 200 AIM bylo společných mezi SCHP vs. EUCP a ECHP vs. SCHP a 14 z 200 AIM bylo společných mezi ECHP vs. EUCP a ECHP vs. SCHP. Všech 199 sad AIM bylo vloženo do klasifikátoru SVM typu „jeden proti druhému“. Jak ukazuje obrázek 3 a doplňková tabulka S5, sedm AIM stačilo k úplnému oddělení ECHP, SCHP a EUCP s Cohenovým kappa = 1 a vyváženou chybovostí = 0. Podrobné informace o sedmi AIM byly shrnuty v tabulce 2 a doplňkové tabulce S7.
Obrázek 3. Matice zmatení pro klasifikátor SVM s jednou volbou a druhou volbou. (A) Výkonnost čtyř AIM. (B) Výkonnost sedmi AIM. (C) Výkonnost čtyř náhodných markerů, které jsou vzorkovány z dat celého genomu. (D) Výkonnost sedmi náhodných markerů.
Tabulka 2: Výkonnost sedmi náhodných markerů. Párové hodnoty FST pro 129 AIMs.
Přesný odhad podílu předků pomocí AIMs
Uvádí se, že AIMs vybrané z nesmíšených populací byly úspěšně použity k odhadu podílu předků u smíšených populací (Lee et al., 2012; Maples et al., 2013). Pro ověření praktické použitelnosti v naší studii jsme provedli simulaci dat. Pokud je studie praktická, měli bychom pozorovat vysokou konzistenci mezi simulovanými a odhadovanými proporcemi předků. Pro každou sadu AIM byl k výpočtu proporcí předků v 1 000 simulacích použit kontrolovaný program ADMIXTURE. Pro každou simulaci byl pro každý AIM náhodně smíchán genotyp 60 vzorků vybraných z ECHP, SCHP a EUCP.
Jak je vidět na obrázcích 4A,B, při zahrnutí 80 nebo méně AIM byly pozorovány velké rozdíly mezi průměrem odhadované a očekávané hodnoty (∼0,3333). Například sedm AIM dokonale fungujících pro klasifikaci nestačilo k přesnému odvození podílů předků: ECHP (průměr = 0,2994, variační koeficient (CV) = 0,8450), SCHP (průměr = 0,3909, CV = 0,7783) a EUCP (průměr = 0,3097, CV = 0,9895). Při zahrnutí 82 a více nejlepších AIM se však odhadované podíly postupně přiblížily očekávaným hodnotám (obrázek 4A). Stejnou tendenci měl i graf CV, v němž se CV snižoval s rostoucím počtem AIM (obrázek 4B).
Obrázek 4. Odvozování původu na simulovaných jedincích ze 199 sad AIM. V každé sadě bylo provedeno 1000 simulací pomocí skriptu pythonu a předky byly odvozeny pomocí kontrolované metody ADMIXTURE. Svislé přerušované čáry představují čtyři sady AIM: sedm AIM,82 AIM, 129 AIM a 403 AIM. (A) Průměrné podíly předků pro tři skupiny: ECHP (zeleně), SCHP (červeně) a EUCP (modře). Černá vodorovná čára představuje očekávanou hodnotu (∼0,3333) jednotlivých předků. (B) Variační koeficient (CV) podílů předků pro tři skupiny.
Pro určení optimální sady AIM jsme křivky CV na obrázku 4B vybavili reciproční logaritmickou funkcí (doplňkový obrázek S4) pro AIM v rozmezí 82 až 403. Křivky CV na obrázku 4B jsme porovnali s křivkami CV na obrázku 4B. Vzhledem k tomu, že tečna ke křivce se nekonečně blíží nule, určili jsme libovolnou prahovou hodnotu -0,0004, která odpovídá souboru 129 AIM, a to s ohledem na stabilitu hodnoty CV i na náklady na genotypování SNP (Doplňková tabulka S6). Sada 129 AIM se dobře osvědčila při odvozování původu pro simulované vzorky (obr. 5), což vedlo k ECHP: průměr = 0,3310, směrodatná odchylka (std) = 0,0772; SCHP: průměr = 0,3356, std = 0,0751; a EUCP: průměr = 0,3334, std = 0,0394. Pozorovali jsme také, že výkonnost sady 129 AIMs vykazuje velmi omezený rozdíl oproti výkonnosti sady 403 AIMs, což naznačuje, že optimální je sada 129 AIMs (doplňková tabulka S6).
Obrázek 5: Výkonnost sady 129 AIMs se liší od výkonnosti sady 403 AIMs. Odvozování předků na simulovaných jedincích ze 129 AIMs. Černá vodorovná čára představuje očekávanou hodnotu (∼0,3333) každého předka. Barevné kódy jsou následující, zelená: ECHP; červená: SCHP; modrá: EUCP.
S ohledem na praktickou použitelnost sady 129 AIMs jsme dále simulovali pseudopříbuzné jedince s nerovnými náhodnými poměry předků pomocí stejných AIMs. nejprve jsme vytvořili 10 náhodných poměrů předků pro každé tři skupiny a poté jsme provedli 1000 simulací pro každé tři poměry předků. Pro každou simulaci bylo vygenerováno 60 pseudopříbuzných jedinců. Jak ukazuje tabulka 3, 129 AIM fungovalo velmi dobře, a to i pro vzorky náhodných proporcí předků.
Tabulka 3. Simulace náhodných podílů předků pomocí 129 AIM.
Podle očekávání při použití 129 AIM (tabulka 2 a doplňková tabulka S7) PCA ukázala, že 10 populací bylo jasně rozděleno do tří odpovídajících skupin (doplňkový obrázek S5). Zajímavé je, že ve srovnání s obrázkem 1A byla substruktura v rámci populací u každé skupiny méně zřejmá.
Odhad podílu předků pro testovací soubor dat
Bylo zjištěno, že některá asijská plemena prasat byla přimíšena k evropským domácím plemenům, a to zejména k plemenům užitkovým. Například u osmi asijských plemen (korejské místní plemeno (KPKO), thajské místní plemeno (THCD), China Lichahei (CNLC), China Sutai (CNST), China Kele (CNKL), China Guanling (CNGU), China Leanhua (CNLA) a China Minzhu (CNMZ)) byla zaznamenána nejméně 20% introgrese z evropského původu (Yang et al., 2017). Abychom symetricky identifikovali a kvantifikovali introgresi, využili jsme 129 vybraných AIM k odhadu složení předků dalších 969 vzorků z 61 populací, které jsou pravděpodobně alespoň do určité míry přimíšené.
Celkově jsme pomocí kontrolované metody ADMIXTURE zjistili silnou korelaci (obr. 6) mezi podíly předků vypočtenými pomocí 129 AIM a podíly vypočtenými pomocí všech ∼60 K čipových dat na individuální úrovni. Bland-Altmanův graf rovněž ukázal shody v podílech předků odhadnutých mezi celogenomovými daty a daty 129 AIMs (obrázek 7). U plemen, u kterých byla známa introgrese z EUCP, jsme získali přiměřené výsledky. Jak ukazuje obrázek 8 a doplňková tabulka S8, odhad průměru tří podílů předků v populaci CNMZ pomocí 129 AIMs (ECHP:0,5325, SCHP:0,2456, EUCP:0,2219) byl podobný odhadu průměru tří podílů předků v populaci CNMZ pomocí dat ∼60 K SNP (ECHP:0,6457, SCHP:0,1291, EUCP:0,2252). U křížence LargeWhite-Meishan (CSLM), který byl doložen jako F1 generace z LargeWhite × MeiShan, byl náš odhad podílu předků ze 129 AIM (ECHP:0,4992, SCHP:0,0455, EUCP:0,4553) v souladu s očekáváním a podobný výsledku z dat ∼60 K SNP (ECHP:0,5128, SCHP:0,0020, EUCP:0,4852). V dalším případě, Rusko Minisibs (RUMS), o kterém se uvádí, že má přibližně polovinu evropských předků, jsme také získali vysokou úroveň EUCP předků buď pomocí 129 AIM (ECHP:0.1428, SCHP:0,4780, EUCP:0,3791) nebo údajů o ∼60 K SNP (ECHP:0, SCHP:0,5349, EUCP:0,4651).
Obrázek 6. Pearsonova korelace mezi předky odhadnutými pomocí 129 AIM a údaji z čipu ∼60 K. (A) Korelace pro předky ECHP. (B) Korelace pro původ SCHP. (C) Korelace pro předky EUCP.
Obrázek 7. Bland-Altmanovy grafy ukazující rozdíl mezi odvozením individuálního původu. Osa x znázorňuje (A) podíl ECHP, (B) SCHP a (C) EUCP předků odhadnutý podle celého genomu. Osa y představuje rozdíl v odhadech mezi celogenomovými a 129 AIM daty. Červená a modrá přerušovaná čára představují průměr a 95% interval spolehlivosti zvlášť.
Obrázek 8. Podíly předků odhadnuté pomocí metody ADMIXTURE pod dohledem při K = 3. Výška každého sloupce představuje tři proporce předků v jedné populaci. Průměrné podíly jednotlivých předků v RUMS a CSLM jsou zvýrazněny koláčovými grafy, v tomto pořadí.
Diskuse
Od 19. století využívají chovatelé prasat na Západě čínská prasata ke křížení s evropskými prasaty, aby zlepšili svůj chov (Groenen, 2016). Bianco et al. (2015) zjistili, že evropská domácí prasata mají 20 % genomické introgrese od asijských prasat. Na druhou stranu Yang et al. (2017) uvádí, že evropská prasata přispěla nejméně 20 % k osmi asijským plemenům. V posledních letech byly předloženy důkazy, že místní čínští zemědělci kříží místní prasata s importovanými komerčními prasaty (Berthouly-Salazar et al., 2012). Introgrese přináší nový genetický materiál, který může pomoci zlepšit některé vlastnosti, zejména produkční výkonnost. Bohužel introgrese, ať už v užším slova smyslu jako příměs s cizími plemeny, nebo v širším slova smyslu jako příměs s plemeny z různých oblastí v rámci jednoho státu, přináší také „genetické znečištění“, kterému se lze jen stěží vyhnout. Například v nedávné studii Zhang a kol. zjistili, že téměř všechna čínská domorodá kuřata mají genovou introgresi z komerčních brojlerů (Zhang a kol., 2019).
Protože se domorodé vepřové maso prodává za vyšší cenu než evropská komerční prasata v Číně, začala na trhu narůstat falešná propaganda, nekvalitní jev. Problematice falšování vepřového masa byla věnována značná pozornost, nicméně v této fázi byla práce s identifikací založena především na intuici a zkušenostech ze strany zákazníků (Dai et al., 2009; Kwon et al., 2017). Naštěstí v Číně převažují produkty z 10 plemen prasat z našeho referenčního souboru (Bosse et al., 2015; Gong et al., 2018; Zhao et al., 2018), naše metoda tak představuje slibně účinný způsob detekce falšování vepřového masa na úrovni DNA při dozoru nad trhem. Z pohledu výzkumníka povedou v celogenomových asociačních studiích rozdílné genetické předky mezi případem a kontrolou ke stratifikaci populace. Pokud by se tedy vybraly vzorky s podobným poměrem předků nebo by se v regresním modelu zvážil původ jako kovariát pro úpravu stratifikace, pomohlo by to snížit počet falešně pozitivních výsledků(Qin et al., 2014).
Celkově je velmi důležité vysledovat původ nebo odhadnout genetický původ buď z hlediska ochrany genetických zdrojů, dozoru nad trhem nebo stratifikace populace. AIM poskytuje nákladově efektivní přístup ve srovnání s použitím celogenomových SNP, a je tedy velmi vhodný pro velkoobjemové testování.
V této studii jsme zjistili, že k rozlišení čínských prasat od evropských komerčních prasat stačí pouhé dva AIM a 10 čistokrevných plemen lze přesně přiřadit do tří odpovídajících skupin (ECHP, SCHP a EUCP) pomocí pouhých sedmi AIM. Prostřednictvím simulací dat jsme prokázali, že AIM vybrané z nemíchaných jedinců lze úspěšně použít i k odhadu podílů předků u míchaných jedinců. Dále jsme vyvinuli panel 129 AIM, který umožňuje efektivně odvozovat proporce předků u případně příbuzensky smíšených jedinců. Vzhledem k flexibilitě, spolehlivosti a použitelnosti by platforma Agena MassARRAY byla v současné době nejlepší volbou pro genotypizaci souboru 129 AIMs. Pro testování velmi velkého objemu by však bylo nákladově efektivnější použít vlastní čip SNP s nízkou hustotou nebo multiplexní sekvenování nové generace založené na PCR.
Naše práce poskytla užitečný příklad použití malého počtu AIMs pro klasifikaci a odhad proporcí předků. V případě potřeby lze ještě vyvinout úsilí o optimalizaci AIM na minimální počet. Například mezi 129 AIM by se případně mohly snížit ty, které představují rozdíly mezi EUCP a ECHP nebo SCHP. Nebo zařadit více AIM, aby se zvýšila rozlišovací schopnost mezi ECHP a SCHP.
Je třeba poznamenat, že jedním z důležitých předpokladů pro získání účinných AIM pro klasifikaci nebo odhad původu je nalezení dobrých referenčních populací. Například Daya et al. (2013) uvedli, že panel 96 AIM lze použít k odvození proporcí předků pro jihoafrickou barevnou populaci (SAC), a to pomocí reprezentativních populací. Tyto markery se však neosvědčily při odvozování jihoasijského a východoasijského původu. V naší studii bylo jako referenční populace vybráno 10 čistokrevných plemen prasat ze tří skupin (ECHP, SCHP a EUCP). Důvodů, proč jsme vybrali právě tato plemena, je několik. Za prvé, v Číně se stále častěji vyskytuje mnoho evropských komerčních plemen prasat nebo křížení původních plemen s evropskými komerčními plemeny, takže zde byla jako reprezentativní populace EUCP vybrána hlavní importovaná evropská komerční plemena včetně plemen Duroc, Pietrain a Landrace. Za druhé, čínská plemena zahrnutá do této studie zahrnovala dva určené původy. Ve studii Yang et al. (Yang et al., 2017) jsou prasata China_Erhualian (CNEH), China_Jinhua (CNJH), China_Meishan (CNMS) jasně odvozena od jednoho původu a China_Bamaxiang (CNBX), China_Congjiangxiang (CNCJ), China_Guangdongdahuabai (CNDH) a China_Luchuan (CNLU) jsou jasně odvozena od druhého původu. Analýza příměsí ukázala, že jsou nejméně introgrované EUCP a lze je od sebe jasně oddělit. Společně tak představují nejlepší referenční populaci, která je dosud k dispozici, a to jak z hlediska genetické čistoty, tak z hlediska schopnosti odhalit potenciální příměsi u jiných čínských plemen. Pokud bude v budoucnu do referenčního souboru zahrnuto více čistých plemen, lze očekávat přesnější odhady i širší rozsah populací, kde by naše metoda mohla být použitelná.
Příspěvky autora
YZ studii vymyslel a vedl. ZL analyzoval hlavní obsah dat s pomocí LB, YQ, YP a RY. ZL a YZ napsali rukopis. Všichni autoři přečetli a schválili konečný rukopis.
Financování
Projekt byl podpořen Národním programem výzkumu a vývoje klíčových technologií (2015BAD03B01-01) a Čínskou národní nadací pro přírodní vědy (U1704233).
Prohlášení o střetu zájmů
Autoři prohlašují, že výzkum byl prováděn bez jakýchkoli komerčních nebo finančních vztahů, které by mohly být chápány jako potenciální střet zájmů.
Přídavné materiály
Přídavné materiály k tomuto článku naleznete online na adrese: https://www.frontiersin.org/articles/10.3389/fgene.2019.00183/full#supplementary-material
Přílohy
- ^http://dx.doi.org/10.5061/dryad.30tk6
- ^https://github.com/boxiangliu/ANTseq
- ^http://www.curveexpert.net
Ai, H., Huang, L., and Ren, J. (2013). Genetická diverzita, vazebná nerovnováha a selekční znaky u čínských a západních prasat odhalené pomocí celogenomových SNP markerů. PLoS One 8:e56001. doi: 10.1371/journal.pone.0056001
PubMed Abstract | CrossRef Full Text | Google Scholar
Alexander, D. H., Novembre, J., and Lange, K. (2009). Rychlý modelový odhad původu u nepříbuzných jedinců. Genome Res. 19, 1655-1664. doi: 10.1101/gr.094052.109
PubMed Abstract | CrossRef Full Text | Google Scholar
Barbosa, F. B., Cagnin, N. F., Simioni, M., Farias, A. A., Torres, F. R., Molck, M. C. a další (2017). Ancestry informative marker panel to estimate population stratification using genome-wide human array (Panel informativních markerů předků k odhadu stratifikace populace pomocí celogenomové matice člověka). Ann. Hum. Genet. 81, 225-233. doi: 10.1111/ahg.12208
PubMed Abstract | CrossRef Full Text | Google Scholar
Bauchet, M., McEvoy, B., Pearson, L. N., Quillen, E. E., Sarkisian, T., Hovhannesyan, K., et al. (2007). Measuring european population stratification with microarray genotype data (Měření stratifikace evropských populací pomocí genotypových dat z mikročipů). Am. J. Hum. Genet. 80, 948-956. doi: 10.1086/513477
PubMed Abstract | CrossRef Full Text | Google Scholar
Berthouly-Salazar, C., Thevenon, S., Van, T. N., Nguyen, B. T., Pham, L. D., Chi, C. V., et al. (2012). Nekontrolované příměsi a ztráta genetické rozmanitosti u místního vietnamského plemene prasat. Ecol. Evol. 2, 962-975. doi: 10.1002/ece3.229
PubMed Abstract | CrossRef Full Text | Google Scholar
Bertolini, F., Galimberti, G., Schiavo, G., Mastrangelo, S., Di Gerlando, R., Strillacci, M. G., et al. (2017). Předvýběrová statistika a klasifikace pomocí náhodného lesa identifikují populačně informativní jednonukleotidové polymorfismy u kosmopolitních a autochtonních plemen skotu. Animal 12, 12-19. doi: 10.1017/S1751731117001355
PubMed Abstract | CrossRef Full Text | Google Scholar
Bianco, E., Soto, H. W., Vargas, L., and Perez-Enciso, M. (2015). Chimérický genom divokých prasat z Isla del Coco (Kostarika), izolované populace od roku 1793, ale s pozoruhodnou úrovní diverzity. Mol. Ecol. 24, 2364-2378. doi: 10.1111/mec.13182
PubMed Abstract | CrossRef Full Text | Google Scholar
Bosse, M., Madsen, O., Megens, H. J., Frantz, L. A. F., Paudel, Y., Crooijmans, R. P., et al. (2015). Hybridní původ evropských komerčních prasat zkoumaný pomocí hloubkové analýzy haplotypů na chromozomu 1. Front. Genet. 5:442. doi: 10.3389/Fgene.2014.00442
PubMed Abstract | CrossRef Full Text | Google Scholar
Bosse, M., Megens, H. J., Frantz, L. A. F., Madsen, O., Larson, G., Paudel, Y., et al. (2014). Genomická analýza odhaluje selekci asijských genů u evropských prasat po introgresi zprostředkované člověkem. Nat. Commun. 5:4392. doi: 10.1038/Ncomms5392
PubMed Abstract | CrossRef Full Text | Google Scholar
Bouchemousse, S., Liautard-Haag, C., Bierne, N., and Viard, F. (2016). Rozlišení současné hybridizace od minulé introgrese pomocí postgenomických SNP informujících o původu u silně diferencovaných druhů rodu Ciona. Mol. Ecol. 25, 5527-5542. doi: 10.1111/mec.13854
PubMed Abstract | CrossRef Full Text | Google Scholar
Browning, S. R., and Browning, B. L. (2007). Rychlé a přesné fázování haplotypů a odvozování chybějících dat pro celogenomové asociační studie pomocí lokalizovaného shlukování haplotypů. Am. J. Hum. Genet. 81, 1084-1097. doi: 10.1086/521987
PubMed Abstract | CrossRef Full Text | Google Scholar
Da Mota, B., Tudoran, R., Costan, A., Varoquaux, G., Brasche, G., Conrod, P., et al. (2014). Vzory strojového učení pro neurozobrazovací genetické studie v cloudu. Front. Neuroinform. 8:31. doi: 10.3389/Fninf.2014.00031
PubMed Abstract | CrossRef Full Text | Google Scholar
Dai, F. W., Feng, D. Y., Cao, Q. Y., Ye, H., Zhang, C. M., Xia, W. G., et al. (2009). Vývojové rozdíly v charakteristikách jatečně upraveného těla, kvality masa a svalových vláken mezi landrace a původním čínským prasetem. S. Afr. J. Anim. Sci. 39, 267-273.
Google Scholar
Daya, M., van der Merwe, L., Galal, U., Moller, M., Salie, M., Chimusa, E. R., et al. (2013). A panel of ancestry informative markers for the complex five-way admixed South African coloured population (Panel informativních markerů původu pro složitou pětkrát smíšenou jihoafrickou barevnou populaci). PLoS One 8:e82224. doi: 10.1371/journal.pone.0082224
PubMed Abstract | CrossRef Full Text | Google Scholar
Dimauro, C., Nicoloso, L., Cellesi, M., Macciotta, N. P. P., Ciani, E., Moioli, B., et al. (2015). Výběr diskriminačních SNP markerů pro plemenné a geografické zařazení italských ovcí. Small Rumin. Res. 128, 27-33. doi: 10.1016/j.smallrumres.2015.05.001
CrossRef Full Text | Google Scholar
Ding, L. L., Wiener, H., Abebe, T., Altaye, M., Go, R. C. P., Kercsmar, C., et al. (2011). Porovnání měr informativnosti markerů pro mapování původu a příměsí. BMC Genomics 12:622. doi: 10.1186/1471-2164-12-622
PubMed Abstract | CrossRef Full Text | Google Scholar
Fang, M., Hu, X., Jiang, T., Braunschweig, M., Hu, L., Du, Z., et al. (2005). The phylogeny of Chinese indigenous pig breeds inferred from microsatellite markers [Fylogeneze původních čínských plemen prasat odvozená z mikrosatelitních markerů]. Anim. Genet. 36, 7-13. doi: 10.1111/j.1365-2052.2004.01234.x
PubMed Abstract | CrossRef Full Text | Google Scholar
Frantz, L. A. F., Schraiber, J. G., Madsen, O., Megens, H. J., Bosse, M., Paudel, Y., et al. (2013). Sekvenování genomu odhaluje jemnou škálu diverzifikace a historii retikulace během speciace u Sus. Genome Biol. 14:R107. doi: 10.1186/Gb-2013-14-9-R107
PubMed Abstract | CrossRef Full Text | Google Scholar
Galanter, J. M., Fernandez-Lopez, J. C., Gignoux, C. R., Barnholtz-Sloan, J., Fernandez-Rozadilla, C., Via, M., et al. (2012). Development of a panel of genome-wide ancestry informative markers to study admixture throughout the americas (Vývoj panelu informativních markerů pro studium příměsí v celé Americe). PLoS Genet. 8:e1002554. doi: 10.1371/journal.pgen.1002554
PubMed Abstract | CrossRef Full Text | Google Scholar
Getachew, T., Huson, H. J., Wurzinger, M., Burgstaller, J., Gizaw, S., Haile, A., et al. (2017). Identifikace vysoce informativních genetických markerů pro kvantifikaci podílů předků v populacích kříženců ovcí: důsledky pro volbu optimální úrovně příměsi. BMC Genet. 18:80. doi: 10.1186/s12863-017-0526-2
PubMed Abstract | CrossRef Full Text | Google Scholar
Gong, H., Xiao, S., Li, W., Huang, T., Huang, X., Yan, G., et al. (2018). Odhalení genetických lokusů pro růstové a jatečné znaky u čínských prasat plemene Bamaxiang na základě pole 1,4 milionu SNP. J. Anim. Breed. Genet. 136, 3-14. doi: 10.1111/jbg.12365
PubMed Abstract | CrossRef Full Text | Google Scholar
Groenen, M. A. M. (2016). Desetiletí sekvenování genomu prasat: okno do domestikace a evoluce prasat. Genet. Sel. Evol. 48:23. doi: 10.1186/s12711-016-0204-2
PubMed Abstract | CrossRef Full Text | Google Scholar
Hong, J. H., and Cho, S. B. (2008). A probabilistic multi-class strategy of one-vs.-rest support vector machines for cancer classification (Pravděpodobnostní strategie více tříd strojů s podpůrnými vektory pro klasifikaci rakoviny). Neurocomputing 71, 3275-3281. doi: 10.1016/j.neucom.2008.04.033
CrossRef Full Text | Google Scholar
Kwon, T., Yoon, J., Heo, J., Lee, W., and Kim, H. (2017). Sledování chovu domestikovaného prasete pomocí výběru příznaků (Sus scrofa). Asian Aust. J. Anim. Sci. 30, 1540-1549. doi: 10.5713/ajas.17.0561
PubMed Abstract | CrossRef Full Text | Google Scholar
Larson, G., Dobney, K., Albarella, U., Fang, M. Y., Matisoo-Smith, E., Robins, J., et al. (2005). Celosvětová fylogeografie divokých prasat odhaluje více center domestikace prasat. Science 307, 1618-1621. doi: 10.1126/science.1106927
PubMed Abstract | CrossRef Full Text | Google Scholar
Lawson, D. J., Hellenthal, G., Myers, S., and Falush, D. (2012). Odvozování populační struktury pomocí hustých haplotypových dat. PLoS Genet. 8:e1002453. doi: 10.1371/journal.pgen.1002453
PubMed Abstract | CrossRef Full Text | Google Scholar
Lee, S., Epstein, M. P., Duncan, R., and Lin, X. H. (2012). Sparse principal component analysis for identifying ancestry-informative markers in genome-wide association studies (Analýza řídkých hlavních komponent pro identifikaci markerů informujících o původu v celogenomových asociačních studiích). Genet. Epidemiol. 36, 293-302. doi: 10.1002/gepi.21621
PubMed Abstract | CrossRef Full Text | Google Scholar
Li, C. X., Pakstis, A. J., Jiang, L., Wei, Y. L., Sun, Q. F., Wu, H. a další (2016). Panel 74 AISNP: lepší odvozování původu v rámci východní Asie. Forensic Sci. Int. Genet. 23, 101-110. doi: 10.1016/j.fsigen.2016.04.002
PubMed Abstract | CrossRef Full Text | Google Scholar
Li, S.-J., Yang, S.-H., Zhao, S.-H., Fan, B., Yu, M., Wang, H.-S., et al. (2004). Analýza genetické diverzity 10 původních čínských populací prasat na základě 20 mikrosatelitů. J. Anim. Sci. 82, 368-374. doi: 10.2527/2004.822368x
PubMed Abstract | CrossRef Full Text | Google Scholar
Maples, B. K., Gravel, S., Kenny, E. E., and Bustamante, C. D. (2013). RFMix: diskriminační modelovací přístup pro rychlé a robustní odvozování lokální příbuznosti. Am. J. Hum. Genet. 93, 278-288. doi: 10.1016/j.ajhg.2013.06.020
PubMed Abstract | CrossRef Full Text | Google Scholar
Monzon, J., Kays, R., and Dykhuizen, D. E. (2014). Posouzení příměsi kojota a vlka a psa pomocí diagnostických SNP informujících o původu. Mol. Ecol. 23, 182-197. doi: 10.1111/mec.12570
PubMed Abstract | CrossRef Full Text | Google Scholar
Pardo-Seco, J., Martinon-Torres, F., and Salas, A. (2014). Hodnocení přesnosti panelů AIM při kvantifikaci genomového původu. BMC Genomics 15:543. doi: 10.1186/1471-2164-15-543
PubMed Abstract | CrossRef Full Text | Google Scholar
Patterson, N., Price, A. L., and Reich, D. (2006). Populační struktura a vlastní analýza. PLoS Genet. 2:e190. doi: 10.1371/journal.pgen.0020190
PubMed Abstract | CrossRef Full Text | Google Scholar
Peterson, R. E., Edwards, A. C., Bacanu, S. A., Dick, D. M., Kendler, K. S., and Webb, B. T. (2017). Užitečnost empirického přiřazování skupin předků v mezipopulačních genetických studiích závislostí. Am. J. Addict. 26, 494-501. doi: 10.1111/ajad.12586
PubMed Abstract | CrossRef Full Text | Google Scholar
Qin, P., Li, Z., Jin, W., Lu, D., Lou, H., Shen, J., et al. (2014). Panel informativních markerů původu k odhadu a korekci potenciálních vlivů stratifikace populace u čínských Chanů. Eur. J. Hum. Genet. 22, 248-253. doi: 10.1038/ejhg.2013.111
PubMed Abstract | CrossRef Full Text | Google Scholar
Rosenberg, N. A., Li, L. M., Ward, R., and Pritchard, J. K. (2003). Informativnost genetických markerů pro odvozování původu. Am. J. Hum. Genet. 73, 1402-1422. doi: 10.1086/380416
PubMed Abstract | CrossRef Full Text | Google Scholar
Santos, H. C., Horimoto, A. V. R., Tarazona-Santos, E., Rodrigues-Soares, F., Barreto, M. L., Horta, B. L., et al. (2016). Minimální soubor informativních markerů původu pro určení proporcí příměsí ve smíšené americké populaci: brazilský soubor. Eur. J. Hum. Genet. 24, 725-731. doi: 10.1038/ejhg.2015.187
PubMed Abstract | CrossRef Full Text | Google Scholar
Shriver, M. D., Parra, E. J., Dios, S., Bonilla, C., Norton, H., Jovel, C., et al. (2003). Kožní pigmentace, biogeografický původ a mapování příměsí. Hum. Genet. 112, 387-399. doi: 10.1007/s00439-002-0896-y
PubMed Abstract | CrossRef Full Text | Google Scholar
Sun, K., Ye, Y., Luo, T., and Hou, Y. (2016). Multi-InDel analýza pro odvození původu subpopulací v Číně. Sci. Rep. 6:39797. doi: 10.1038/srep39797
PubMed Abstract | CrossRef Full Text | Google Scholar
Tian, C., Kosoy, R., Nassir, R., Lee, A., Villoslada, P., Klareskog, L. a další (2009). European population genetic substructure: further definition of ancestry informative markers for distinguishing among diverse european ethnic groups (Genetická substruktura evropské populace: další definice informativních markerů původu pro rozlišení různých evropských etnických skupin). Mol. Med. 15, 371-383. doi: 10.2119/molmed.2009.00094
PubMed Abstract | CrossRef Full Text | Google Scholar
vonHoldt, B. M., Kays, R., Pollinger, J. P., and Wayne, R. K. (2016). Admixture mapping identifies introgressed genomic regions in North American canids. Mol. Ecol. 25, 2443-2453. doi: 10.1111/mec.13667
PubMed Abstract | CrossRef Full Text | Google Scholar
Yang, B., Cui, L. L., Perez-Enciso, M., Traspov, A., Crooijmans, R. P. M. A., Zinovieva, N., et al. (2017). Celogenomová data SNP odhalují globalizaci domestikovaných prasat. Genet. Sel. Evol. 49:71. doi: 10.1186/s12711-017-0345-y
PubMed Abstract | CrossRef Full Text | Google Scholar
Zeng, X. P., Chakraborty, R., King, J. L., Larue, B., Moura-Neto, R. S., and Budowle, B. (2016). Výběr vysoce informativních markerů SNP pro populační příslušnost hlavních populací USA. Int. J. Legal Med. 130, 341-352. doi: 10.1007/s00414-015-1297-9
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhang, C., Lin, D., Wang, Y., Peng, D., Li, H., Fei, J., et al. (2019). Widespread introgression in Chinese indigenous chicken breeds from commercial broiler (Široce rozšířená introgrese u původních čínských plemen kuřat z komerčních chovů). Evol. Appl. 12, 610-621. doi: 10.1111/eva.12742
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhang, F., Zhang, L., and Deng, H. W. (2009). Metoda založená na PCA pro výběr informativních markerů předků ve strukturovaných populacích. Sci. Chin. Series C Life Sci. 52, 972-976. doi: 10.1007/s11427-009-0128-y
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhao, P., Yu, Y., Feng, W., Du, H., Yu, J., Kang, H. a další (2018). Důkazy evoluční historie a selekčních zásahů v genomu prasete Meishan odhalují jeho genetickou a fenotypovou charakteristiku. Gigascience 7. doi: 10.1093/gigascience/giy058
PubMed Abstract | CrossRef Full Text | Google Scholar
Zhu, Y., Li, W., Yang, B., Zhang, Z., Ai, H., Ren, J., et al. (2017). Signatury selekce a mezidruhové introgrese v genomu čínských prasat domácích. Genome Biol. Evol. 9, 2592-2603. doi: 10.1093/gbe/evx186
PubMed Abstract | CrossRef Full Text | Google Scholar
.