Frontiere în genetică

Introducere

Polimorfismul autozomal cu un singur nucleotid (SNP) și inserția-deleție (InDel) sunt utilizate pe scară largă pentru inferența de ascendență umană și atribuirea populației (Bauchet et al., 2007; Tian et al., 2009; Sun et al., 2016). Markerii informativi de ascendență (AIM) sunt markeri genetici ai diferențelor de frecvență între populații (Shriver et al., 2003). Au fost utilizate mai multe statistici pentru a obține AIM-uri, inclusiv statisticile F (FST), diferențele absolute de frecvență alelelor (δ), informativitatea pentru măsurarea atribuirii (In) și scorurile de încărcare a componentelor principale (Rosenberg et al., 2003; Zhang et al., 2009; Ding et al., 2011; vonHoldt et al., 2016; Barbosa et al., 2017; Peterson et al., 2017). În loc să se utilizeze markerii genomului întreg, s-a considerat că AIM-urile sunt suficient de precise pentru inferența ancestralității în cazul unei populații de dimensiuni limitate. În consecință, aceasta constituie o modalitate economică de a examina și analiza mii de eșantioane. Santos et al. (2016) au raportat că 192 de AIM selectați din datele SNP ∼370 K pot fi utilizați pentru a estima cu precizie proporțiile de ascendență a trei populații majore din Brazilia. Li et al. (2016) au dezvoltat un panel de 74 de AIM-uri pentru a deduce proporțiile de ascendență a 500 de indivizi de test din 11 populații. Datorită rezoluției ridicate a AIM-urilor, un panel de 23 de AIM-uri generat de Zeng et al. (2016). a distins patru populații americane majore și a atribuit corect ascendența pentru nouă populații suplimentare (Zeng et al., 2016).

Pentru genetica populațiilor de animale, AIM-urile au fost aplicate cu succes pentru a identifica rasele de diferite soiuri și pentru a evalua compozițiile genetice în populațiile hibride (Dimauro et al., 2015; Bouchemousse et al., 2016). Bertolini et al. (2017) au constatat că 96 de AIM-uri au avut performanțe bune în discriminarea a șase rase de bovine de lapte. Într-un alt studiu, 63 de AIM-uri selectate din 427 de canide au fost utilizate pentru a evalua amestecul genetic la coioți (Monzon et al., 2014). Recent, 74 de AIM-uri au fost utilizate pentru a calcula proporțiile de ascendență la oile încrucișate (Awassi cu două rase indigene din Etiopia) și s-a constatat că diferitele niveluri de amestec din Awassi au afectat în mod semnificativ trăsăturile de creștere a mieilor și de reproducere a oilor (Getachew et al., 2017).

Sus scrofa (Sus scrofa) a deviat în porcii mistreți europeni și asiatici în timpul pleistocenului mediu (acum 1,2-0,8 milioane de ani) (Larson et al., 2005; Frantz et al., 2013). Domesticirea porcilor în China a avut loc în urmă cu ∼9.000 de ani (Larson et al., 2005). A fost documentat faptul că porcii domestici chinezi au fost împărțiți în șase tipuri în funcție de regiunea de locuire și de caracteristicile fenotipului (I-Nordul Chinei, II-Bazinul Changjiang inferior, III-Centrul Chinei, IV-Sudul Chinei, V-Sud-Vest și VI-Plateau) (Li et al., 2004; Fang et al., 2005). Într-un studiu recent, Yang et al. (2017). au urmărit strămoșii diferitelor rase chinezești și au identificat două strămoșii majore distincte, care au originea în China de Est (de exemplu, Meishan și JinHua) și China de Sud (de exemplu, Luchuan și Bamaxiang). În plus, a fost raportată, de asemenea, introgresia genomică de la rasele comerciale europene la porcii indigeni chinezi (Ai et al., 2013; Bosse et al., 2014; Zhu et al., 2017), ceea ce face ca compoziția genetică a porcilor chinezi moderni să fie și mai complicată.

Deși a fost aplicată pe scară largă la alte animale și este de mare importanță în scenarii de aplicare specifice, inclusiv supravegherea pieței și protecția resurselor genetice, nu există în prezent niciun studiu care să abordeze în mod specific problema utilizării eficiente a AIM pentru a distinge rasele de porci sau pentru a estima proporțiile de ascendență. În acest caz, folosind date de cipuri SNP ∼60 K pentru porci, am căutat numărul optim de AIM-uri pentru a distinge porcii din China de Est, China de Sud sau de origine europeană. Pe baza celor 129 de AIM-uri selectate, am estimat proporțiile de ascendență ale originilor de mai sus pentru alți porci chinezi. Am sugerat că AIM-urile selectate din populații de referință neamestecate ar putea fi utilizate pentru a estima cu precizie proporțiile ancestrale în populațiile hibride. Rezultatele noastre oferă un exemplu util de utilizare a AIM-urilor pentru clasificarea rasei și estimarea strămoșilor la porci.

Materiale și metode

Colectarea datelor și controlul calității

Datele de genotipare a 2.113 probe au fost preluate din Dryad Digital Repository1. În acest studiu au fost utilizate numai eșantioane din rase asiatice, precum și din rase europene (un total de 1 157 de eșantioane din 71 de populații, detalii în tabelul suplimentar S1). Probele și SNP-urile au fost excluse dacă au fost îndeplinite următoarele criterii: (1) un individ conținea mai mult de 10 % genotipuri lipsă; (2) SNP-uri cu o rată de apelare mai mică de 95 %; (3) SNP-uri cu o frecvență a alelei minore mai mică de 0,05; (4) SNP-uri care erau localizate pe cromozomii sexuali; și (5) SNP-urile nu erau bialelice. Genotipurile lipsă au fost imputate ulterior prin utilizarea BEAGLE (versiunea 3.3.2) (Browning și Browning, 2007). În cele din urmă, au rămas 45.562 de SNP-uri și 1.155 de eșantioane. Cele 1.155 de probe au fost apoi împărțite în două seturi de date. Pentru setul de referință, 186 de eșantioane au fost alese din 10 populații reprezentative ale celor trei grupuri ancestrale majore: Porcul din estul Chinei (ECHP), porcul din sudul Chinei (SCHP) și porcul comercial european (EUCP). Cele 10 populații au fost selectate pe baza faptului că nu a existat o amestecare evidentă între populațiile aparținând grupului ECHP sau SCHP, conform unui raport al lui Yang et al. (2017). Acest set de date este rezumat în Tabelul 1. Setul de date de testare a conținut restul de 969 de eșantioane din 61 de populații (detalii în Tabelul suplimentar S2). Având în vedere comoditatea aplicării practice, datele genotipice din setul de date de testare au fost extrase direct din datele brute, fără fasonare sau imputare.

TABEL 1
www.frontiersin.org

Tabel 1. Informații despre rasele de porci din setul de referință.

Structura populației

Analiza componentelor principale (PCA) a fost efectuată pe datele cipului ∼60 K folosind SMARTPCA (versiunea 6.1.4) în setul de referință (Patterson et al., 2006). Pentru a confirma statutul de neamestec, s-a utilizat ADMIXTURE nesupervizat (versiunea 1.23) (Alexander et al., 2009) pentru a calcula proporțiile de strămoși ale eșantioanelor din setul de referință cu numărul de strămoși (K) stabilit de la K = 3 până la K = 15. Modelul legat ChromoPainter v2 (Lawson et al., 2012) a fost, de asemenea, ales pentru a explora similaritatea/dizimilaritatea pentru indivizii din setul de referință. În detaliu, fișierul cu harta de recombinare a fost generat cu ajutorul scriptului makeuniformrecfile.pl furnizat de fineSTRUCTURE (versiunea 2.1.1) (Lawson et al., 2012). Utilizând un profil de model Markov ascuns, ChromoPainter v2 deduce haplotipurile „donatorului” și „destinatarului” pentru a crea o matrice de co-ancestrie. Inițial, au fost utilizați 20 de pași de maximizare a așteptărilor pentru a estima rata de mutație și de comutare pe 1/5 membri de eșantionare aleatorie din toți indivizii cu toți autosomii luați în considerare. Ratele de mutație și de comutare deduse pentru fiecare cromozom au fost apoi mediate. Ulterior, cu rata estimată de mutație, rata de comutare și alte valori implicite, ChromoPainter v2 a fost utilizat din nou pentru a genera matricea de co-ancestrie pentru toți indivizii. În cele din urmă, algoritmul MCMC implementat în fineSTRUCTURE a fost utilizat pentru a grupa ierarhic indivizii cu un burn-in și un timp de execuție de 1.000.000 și, respectiv, 6.000.000.000 de iterații.

Selecția AIM-urilor

Toate cele 186 de probe din setul de date de referință au fost utilizate pentru a calcula FST și In. SNP-urile candidate au fost selectate din selectorul algoritmului AIMs care a fost implementat în AIMs_generator.py din ANTseq pipeline2. În mod specific, am exclus mai întâi SNP-urile în dezechilibru de legătură ridicat (LD) prin selectarea unui singur SNP într-o regiune LD puternică (r2 > 0,3) și la o distanță de 500 kb. În cadrul fiecărui grup, SNP-urile care au prezentat frecvențe eterogene între populații au fost excluse în continuare pe baza unui test Chi pătrat (Galanter et al., 2012). În al doilea rând, FST și In au fost calculate pentru fiecare dintre cele trei grupuri împerecheate : ECHP vs. EUCP, SCHP vs. EUCP și ECHP vs. SCHP (Rosenberg et al., 2003).

Clasificarea grupurilor cu AIM-uri minime

Utilizând setul de date de referință, am comparat mai întâi puterea de discriminare a AIM-urilor selectate prin FST sau In. Clasificarea binară pentru cele trei grupuri împerecheate a fost realizată separat. Pentru fiecare grup împerecheat, am început prin a selecta de la primele două până la primele 30 de AIM-uri, cu o creștere de un AIM. Probele din grupul împerecheat corespunzător au fost împărțite aleatoriu în două proporții: 75% pentru instruire, 25% pentru testare, iar această operațiune a fost repetată de 50 de ori. GridSearchCV implementat în pachetul Scikit-learn (versiunea 0.18) a fost apoi utilizat pentru a determina parametrii optimi pentru un clasificator SVM (Support Vector Machine) (Da Mota et al., 2014). Parametrii pentru SVM sunt rezumați în tabelul suplimentar S3. Pentru modelul cu parametrii optimi, acuratețea clasificării a fost evaluată prin media coeficientului de corelație Matthews (MMCC) pentru 50 de repetări, după cum urmează:

MMCC=×150

unde TNi și FNi sunt numărul de adevărate negative și false negative, iar TPi și FPi sunt numărul de adevărate pozitive și false pozitive, pentru fiecare rulare.

Pentru a determina numărul minim de AIM-uri pentru a distinge simultan ECHP, SCHP și EUCP, s-a folosit o abordare multiclasă de unu contra unu.rest SVM a fost utilizată pe setul de date de referință (Hong și Cho, 2008). În mod similar, am început prin a selecta de la primele două până la primele 200 de AIM-uri din fiecare dintre grupurile împerecheate, cu o creștere de un AIM, rezultând 199 de seturi de AIM-uri în total. În fiecare set, AIM-urile selectate din cele trei grupuri împerecheate au fost îmbinate, iar AIM-urile duplicate au fost eliminate (tabelul suplimentar S4). Deoarece MMCC nu a fost conceput pentru a evalua acuratețea clasificării multiclasă, pentru a evalua acuratețea clasificării au fost utilizate în schimb matricea de confuzie, statistica kappa a lui Cohen și rata de eroare echilibrată. Un coeficient kappa al lui Cohen mai mare, dar o rată de eroare echilibrată mai mică au indicat o clasificare mai precisă. Am utilizat din nou GridSearchCV pentru a estima cei mai buni parametri pentru SVM unu contra unu, ai căror parametri sunt rezumați în tabelul suplimentar S3. Am generat, de asemenea, seturi aleatorii de SNP de număr egal din întregul genom pentru a compara puterea de discriminare cu AIM-urile selectate.

Ancestry Inference With Optimal AIMs

AIM-urile au fost utilizate pe scară largă pentru a estima proporțiile de ascendență în populațiile hibride, chiar și în cazurile în care acestea au fost selectate din populații neamestecate. Pe baza AIM-urilor selectate, pentru a estima proporțiile de strămoși ale unor posibile populații de porci amestecați, am utilizat o strategie similară cu cea utilizată într-un studiu anterior de Pardo-Seco et al. (2014). Am generat mai întâi indivizi pseudoamestecați prin selectarea aleatorie a genotipurilor AIM-urilor selectate din eșantioanele din setul de date de referință cu proporții egale. Prin urmare, proporțiile de ascendență așteptate ale acestor indivizi pseudoamestecați au fost de 1/3 (∼0,3333) din fiecare grup (ECHP, SCHP și EUCP). Pentru fiecare dintre cele 199 de seturi AIM generate din cele de mai sus, au fost efectuate 1.000 de simulări. ADMIXTURE supravegheat (K = 3) a fost utilizat pentru a estima proporțiile strămoșilor. Performanțele au fost evaluate prin media și coeficientul de variație (CV) al proporțiilor ancestrale estimate. CV-ul proporțiilor ancestrale estimate în funcție de numărul de AIM-uri a fost ajustat cu ajutorul programului Curve Expert 1.43. Numărul optim de AIM-uri a fost determinat prin selectarea pantei pragului tangent la curba a cărei performanță stabilă a fost observată dincolo de acest punct. Pentru a adăuga o validare suplimentară, am simulat indivizi pseudoamestecați cu proporții aleatorii ale strămoșilor folosind numărul optim de AIM determinat. Proporțiile de ascendență ale ECHP, SCHP și EUCP au fost atribuite aleatoriu, cu o proporție minimă stabilită la 10 %.

Pe baza AIM-urilor selectate în ultima etapă, am efectuat inferența de ascendență pentru cei 969 de indivizi din setul de date de testare prin ADMIXTURE supravegheat. Performanța a fost evaluată prin coeficientul de corelație Pearson între SNP-urile la nivel de genom și numărul optim de AIM-uri.

Rezultate

Structura populațiilor de referință

Populațiile din setul de referință au fost presupuse a fi cel mai puțin amestecate. Am observat că ECHP, SCHP și EUCP au fost bine separate într-un grafic al componentelor principale (figura 1A). Distribuția FST la nivelul genomului (Figura 1B) a arătat o diferențiere mai mare atât între ECHP vs. EUCP (medie = 0,2197, IC 95% 0,0006-0,7267), cât și între SCHP vs. EUCP (medie = 0,2153, IC 95% 0,0005-0,7570), în timp ce diferențierea între ECHP vs. SCHP (medie = 0,0588, IC 95% 0-0,3342) a fost vizibil mai puțin pronunțată. Prin utilizarea ADMIXTURE, toate rasele au fost bine împărțite în grupuri anticipate (Figura 1C) atunci când K = 3, în conformitate cu studiul anterior al lui Yang et al. (2017). Când K = 10, 10 populații au putut fi separate clar, în concordanță cu așteptările noastre că cele 10 populații au fost cel mai puțin amestecate (Figura suplimentară S1).

FIGURA 1
www.frontiersin.org

Figura 1. Structura populației celor 10 rase din setul de date de referință. (A) Analiza componentelor principale (PCA) a datelor cipului ∼60 K. (B) Distribuția FST la nivelul genomului pentru cele trei grupuri împerecheate: ECHP vs. EUCP, SCHP vs. EUCP și ECHP vs. SCHP. Linia verticală roșie reprezintă media distribuției FST. Liniile verticale punctate reprezintă percentilele 2,5 și 97,5% ale distribuției FST. (C) Gruparea ADMIXTURE a datelor cipurilor ∼60 K atunci când K = 3-12. CNBX, China_Bamaxiang; CNCJ, China_Congjiangxiang; CNLU, China_Luchuan; CNDH, China_Guangdongdahuabai; CNJH, China_Jinhua; CNEH, China_Erhualian; CNMS, China_Meishan; DUR2, Duroc2; PIT1, Pietrain1; LDR1, Landrace1. Codurile de culoare pentru bretelele mari sunt următoarele: verde: Porc din China de Est (ECHP); roșu: Porc din China de Sud (SCHP); albastru: Porc comercial european (EUCP).

Pentru o cuantificare suplimentară, programele ChromoPainter v2 și fineSTRUCTURE au fost utilizate pentru a verifica relația dintre aceste rase luând în considerare LD. După cum se arată în harta termică a coancestriei (figura 2), indivizii din cadrul fiecărui grup au prezentat un model omogen, iar cei din același grup au împărțit mai multe bucăți genetice decât cei din alte grupuri. În special, EUCP a avut un grad neglijabil de coancestrie cu indivizii din rasele indigene chinezești. Eșantionul provenit din ECHP și SCHP a prezentat un grad mai ridicat de coancestrie, dar indivizii din același grup au avut totuși tendința de a se grupa mai mult între ei decât între grupuri. În concluzie, rezultatele au sugerat că eșantioanele din setul de date de referință au prezentat un nivel neglijabil de amestec.

FIGURA 2
www.frontiersin.org

Figura 2. Analiza fineSTRUCTURE în setul de date de referință. Harta termică arată numărul de bucăți genetice comune copiate de la un genom donator (coloană) la un genom receptor (rând). CNBX, China_Bamaxiang; CNCJ, China_Congjiangxiang; CNLU, China_Luchuan; CNDH, China_Guangdongdahuabai; CNJH, China_Jinhua; CNEH, China_Erhualian; CNMS, China_Meishan; DUR2, Duroc2; PIT1, Pietrain1; LDR1, Landrace1. Codurile de culori sunt după cum urmează: verde: Porc din China de Est (ECHP); roșu: Porc din sudul Chinei (SCHP); albastru: Porc comercial european (EUCP).

Clasificarea grupurilor folosind AIM-uri

Pentru a construi un set eficient de AIM-uri, am comparat mai întâi performanța statisticilor FST și a statisticilor In. Pentru un grup împerecheat de ECHP vs. EUCP și SCHP vs. EUCP, s-a constatat că un minim de două AIM-uri sunt suficiente pentru a duce la o separare perfectă (MMCC = 1), fie prin selectarea FST de top, fie prin statisticile In de top (Figura suplimentară S2). Cu toate acestea, pentru a separa ECHP vs. SCHP, au fost necesare cel puțin patru AIM prin utilizarea FST, sau cel puțin cinci prin utilizarea In. Pentru AIM-urile selectate de FST sau In, am constatat că AIM-urile informative selectate de In s-au suprapus în mare măsură cu AIM-urile selectate de FST, ceea ce indică faptul că FST este cel puțin la fel de informativă ca In. Prin urmare, analizele următoare s-au bazat numai pe AIM-urile selectate de FST.

În continuare, am încercat să identificăm numărul de AIM-uri care ar putea fi utilizate pentru a separa simultan ECHP, SCHP și EUCP utilizând o abordare multiclasă. După cum este descris în Materiale și metode, au fost selectate secvențial primele două până la 200 de AIM din ECHP vs. EUCP, SCHP vs. EUCP și, respectiv, ECHP vs. SCHP, rezultând 199 de seturi de AIM cu număr crescător (tabelul suplimentar S4). AIM-urile din fiecare set au fost fuzionate și deduplicate. De exemplu, pentru cel mai mare set, 171 din 200 de AIM-uri au fost împărțite între ECHP vs. EUCP și SCHP vs. EUCP (Figura suplimentară S3), 12 din 200 de AIM-uri au fost cele împărțite între SCHP vs. EUCP și ECHP vs. SCHP, iar 14 din 200 de AIM-uri au fost cele împărțite între ECHP vs. EUCP și ECHP vs. SCHP. Toate cele 199 de seturi de AIM au fost introduse într-un clasificator SVM de tip unu contra unu. După cum se arată în figura 3 și în tabelul suplimentar S5, șapte AIM-uri au fost suficiente pentru a separa complet ECHP, SCHP și EUCP cu kappa Cohen = 1 și rata de eroare echilibrată = 0. Informațiile detaliate ale celor șapte AIM-uri au fost rezumate în tabelul 2 și în tabelul suplimentar S7.

FIGURA 3
www.frontiersin.org

Figura 3. Matricele de confuzie pentru clasificatorul SVM cu un singur răspuns. (A) Performanța a patru AIM-uri. (B) Performanța a șapte AIM-uri. (C) Performanța a patru markeri aleatori care este eșantionată din datele întregului genom. (D) Performanța a șapte markeri aleatori.

TABELUL 2
www.frontiersin.org

Tabelul 2. Valorile FST pe perechi pentru cele 129 de AIM-uri.

Accurate Ancestry Proportion Estimation Using AIMs

S-a raportat că AIM-urile selectate din populații neamestecate au fost aplicate cu succes pentru a estima proporțiile de strămoși în populațiile amestecate (Lee et al., 2012; Maples et al., 2013). Pentru a valida caracterul practic în studiul nostru, am efectuat o simulare a datelor. Dacă studiul este practic, ar trebui să observăm o coerență ridicată între proporțiile ancestrale simulate și cele estimate. Pentru fiecare set AIM, ADMIXTURE supravegheat a fost utilizat pentru a calcula proporțiile strămoșilor în 1.000 de simulări. Pentru fiecare simulare, genotipul a 60 de eșantioane selectate din ECHP, SCHP și EUCP a fost amestecat aleatoriu pentru fiecare AIM.

Așa cum se arată în figurile 4A,B, atunci când au fost incluse 80 sau mai puține AIM-uri, au fost observate diferențe mari între media valorii estimate și cea așteptată (∼0,3333). De exemplu, cele șapte AIM-uri care au funcționat perfect pentru clasificare nu au fost suficiente pentru a deduce cu exactitate proporțiile de ascendență: ECHP (media = 0,2994, coeficient de variație (CV) = 0,8450), SCHP (media = 0,3909, CV = 0,7783) și EUCP (media = 0,3097, CV = 0,9895). Cu toate acestea, prin includerea primelor 82 de AIM sau mai multe, proporțiile estimate au convergent treptat către valorile așteptate (Figura 4A). Aceeași tendință pentru graficul CV, în care CV-ul a scăzut pe măsură ce numărul de AIM-uri a crescut (Figura 4B).

FIGURA 4
www.frontiersin.org

Figura 4. Inferența de ascendență pe indivizi simulați din cele 199 de seturi AIM. În fiecare set, 1.000 de simulări au fost efectuate de un script python, iar ascendentele au fost deduse prin ADMIXTURE supravegheat. Liniile verticale punctate reprezintă patru seturi AIM: șapte AIM-uri,82 AIM-uri, 129 AIM-uri și 403 AIM-uri. (A) Media proporțiilor de strămoși pentru cele trei grupuri: ECHP (verde), SCHP (roșu) și EUCP (albastru). Linia orizontală neagră reprezintă valoarea așteptată (∼0,3333) a fiecărei strămoșii. (B) Coeficientul de variație (CV) al proporțiilor strămoșilor pentru cele trei grupuri.

Pentru a determina setul optim de AIM, am ajustat curbele CV din figura 4B cu o funcție logaritmică reciprocă (figura suplimentară S4) pentru AIM-uri între 82 și 403. Deoarece tangenta la curbă se apropie la infinit de zero, am determinat un prag arbitrar de -0,0004, care corespunde setului de 129 AIM, luând în considerare atât stabilitatea valorii CV, cât și costul de genotipare pentru SNP (tabelul suplimentar S6). Setul de AIM de 129 a avut performanțe bune în inferența ancestralității pentru eșantioanele simulate (Figura 5), care a dus la ECHP: medie = 0,3310, abatere standard (std) = 0,0772; SCHP: medie = 0,3356, std = 0,0751; și EUCP: medie = 0,3334, std = 0,0394. Am observat, de asemenea, că performanța setului de 129 AIMs a prezentat o diferență foarte limitată față de cea a setului de 403 AIMs, sugerând că setul de 129 AIMs a fost optim (Tabelul suplimentar S6).

FIGURA 5
www.frontiersin.org

Figura 5. Inferența de ascendență pe indivizi simulați din 129 AIMs. Linia orizontală neagră reprezintă valoarea așteptată (∼0,3333) a fiecărui ascendent. Codurile de culoare sunt după cum urmează: verde: ECHP; roșu: SCHP; albastru: EUCP.

Considerând practicabilitatea setului de 129 de AIM-uri, am simulat în continuare indivizi pseudoamestecați cu proporții aleatorii inegale ale strămoșilor folosind aceleași AIM-uri. am produs mai întâi 10 proporții aleatorii ale strămoșilor pentru fiecare dintre cele trei grupuri și apoi am efectuat 1.000 de simulări pe fiecare dintre cele trei proporții ale strămoșilor. Pentru fiecare simulare, au fost generați 60 de indivizi pseudoamestecați. După cum se arată în tabelul 3, cele 129 de AIM-uri au funcționat foarte bine, chiar și pentru eșantioane de proporții aleatorii ale strămoșilor.

TABEL 3
www.frontiersin.org

Tabel 3. Simularea proporțiilor aleatoare ale strămoșilor folosind cele 129 de AIM-uri.

Așa cum s-a anticipat, folosind cele 129 de AIM-uri (tabelul 2 și tabelul suplimentar S7), PCA a demonstrat că 10 populații au fost clar împărțite în trei grupuri corespunzătoare (figura suplimentară S5). În mod interesant, în comparație cu Figura 1A, substructura în cadrul populațiilor din fiecare grup a fost mai puțin evidentă.

Ancestry Proportion Estimation for the Test Dataset

S-a raportat că unele rase de porci asiatice au fost amestecate cu rase domestice europene și, în special, cu rase comerciale. De exemplu, s-a raportat că opt rase asiatice (rasa locală coreeană (KPKO), rasa locală thailandeză (THCD), China Lichahei (CNLC), China Sutai (CNST), China Kele (CNKL), China Guanling (CNGU), China Leanhua (CNLA) și China Minzhu (CNMZ)) au fost introgresate cu cel puțin 20 % din strămoșii europeni (Yang et al., 2017). Pentru a identifica și cuantifica simetric introgresia, am utilizat cele 129 de AIM selectate pentru a estima compozițiile ancestrale ale altor 969 de eșantioane din 61 de populații care sunt posibil amestecate cel puțin într-o anumită măsură.

În general, prin utilizarea ADMIXTURE supravegheat, am constatat o corelație puternică (Figura 6) între proporțiile ancestrale calculate de 129 AIM și cele calculate de toate datele cipurilor ∼60 K la nivel individual. Graficul Bland-Altman a arătat, de asemenea, acorduri privind proporția de ascendență estimată între datele de la nivelul întregului genom și cele de la 129 AIMs (Figura 7). Pentru rasele despre care se știa că au fost introgresate din EUCP, am obținut rezultate rezonabile. După cum se arată în figura 8 și în tabelul suplimentar S8, estimarea mediei a trei proporții de ascendență în populația CNMZ prin utilizarea 129 AIMs (ECHP:0,5325, SCHP:0,2456, EUCP:0,2219) a fost similară cu estimarea mediei a trei proporții de ascendență în populația CNMZ prin utilizarea datelor ∼60 K SNP (ECHP:0,6457, SCHP:0,1291, EUCP:0,2252). În cazul încrucișării LargeWhite-Meishan (CSLM), care a fost documentată ca fiind o generație F1 din LargeWhite × MeiShan, estimarea proporției noastre de strămoși din cele 129 AIM (ECHP:0,4992, SCHP:0,0455, EUCP:0,4553) a fost în concordanță cu așteptările și similară cu rezultatul obținut din datele ∼60 K SNP (ECHP:0,5128, SCHP:0,0020, EUCP:0,4852). Într-un alt caz, Rusia Minisibs (RUMS), despre care s-a raportat că posedă aproximativ jumătate de ascendență europeană, am obținut, de asemenea, un nivel ridicat de ascendență EUCP folosind fie 129 AIMs (ECHP:0.1428, SCHP:0,4780, EUCP:0,3791) sau date ∼60 K SNP (ECHP:0, SCHP:0,5349, EUCP:0,4651).

FIGURA 6
www.frontiersin.org

Figura 6. Corelația Pearson între strămoșii estimați de 129 AIM-uri și datele cipului ∼60 K. (A) Corelația pentru ascendența ECHP. (B) Corelația pentru ascendența SCHP. (C) Corelația pentru ascendența EUCP.

FIGURA 7
www.frontiersin.org

Figura 7. Diagrame Bland-Altman care arată diferența dintre inferențele de ascendență individuală. Axa x reprezintă (A) proporția de ascendență ECHP, (B) SCHP și, respectiv, (C) EUCP estimată prin genom-wide. Axa y reprezintă diferența dintre estimările dintre datele la nivel de genom și cele din 129 AIMs. Liniile punctate roșii și albastre reprezintă media și intervalele de încredere de 95%, separat.

FIGURA 8
www.frontiersin.org

Figura 8. Proporțiile de ascendență estimate prin ADMIXTURE supravegheat la K = 3. Înălțimea fiecărei bare reprezintă trei proporții de ascendență într-o populație. Proporția medie a fiecărei strămoșii în RUMS și CSLM este evidențiată cu diagrame circulare, respectiv cu diagrame circulare.

Discuție

Din secolul al XIX-lea, crescătorii de porci din Occident au folosit porci chinezi pentru a se hibridiza cu porci europeni pentru a-și îmbunătăți efectivele de reproducere (Groenen, 2016). Bianco et al. (2015) au constatat că porcii domestici europeni au o introgresie genomică de 20 % de la porcii asiatici. Pe de altă parte, Yang et al. (2017) au raportat că porcii europeni au contribuit cu cel puțin 20% la opt rase asiatice. În ultimii ani, au fost prezentate dovezi că fermierii chinezi locali încrucișează porcii locali cu porci comerciali importați (Berthouly-Salazar et al., 2012). Introgresia introduce noi materiale genetice, care ar putea contribui la îmbunătățirea anumitor caracteristici, în special a performanțelor de producție. Din păcate, introgresia, fie în sens restrâns, ca amestec cu rase străine, fie în sens larg, ca amestec cu rase din diferite zone ale unei națiuni, introduce, de asemenea, o „poluare genetică” care poate fi cu greu evitată. De exemplu, într-un studiu recent, Zhang et al. au constatat că aproape toți puii autohtoni chinezi au introgresie genetică de la puii de carne comerciali (Zhang et al., 2019).

Din moment ce carnea de porc autohtonă este vândută la un preț mai mare decât cel al porcilor comerciali europeni în China, propaganda falsă, fenomenul de proastă calitate de pe piață a început să crească. O atenție semnificativă a fost acordată problemei falsificării cărnii de porc, cu toate acestea, în această etapă, activitatea de identificare s-a bazat în principal pe intuiții și experiențe din partea clienților (Dai et al., 2009; Kwon et al., 2017). Din fericire, produsele de porc din cele 10 rase din setul nostru de referință sunt dominante în China (Bosse et al., 2015; Gong et al., 2018; Zhao et al., 2018), metoda noastră constituind astfel o modalitate promițător de eficientă în detectarea adulterării cărnii de porc la nivel de ADN în cadrul supravegherii pieței. Din punctul de vedere al unui cercetător, în studiile de asociere la nivel de genom, strămoșii genetici diferiți între caz și control vor duce la stratificarea populației. Prin urmare, dacă se selectează eșantioanele cu proporții similare de strămoși sau dacă se ia în considerare strămoșii ca și covariate în modelul de regresie pentru a ajusta stratificarea, aceasta ar ajuta la reducerea rezultatelor fals pozitive(Qin et al., 2014).

În general, este foarte important să se urmărească originea sau să se estimeze strămoșii genetici fie în ceea ce privește protecția resurselor genetice, fie în ceea ce privește supravegherea pieței sau stratificarea populației. AIM-urile oferă o abordare rentabilă în comparație cu utilizarea SNP-urilor din întregul genom și, prin urmare, este foarte potrivită pentru testarea volumelor mari.

În studiul de față, am constatat că doar două AIM-uri sunt suficiente pentru a distinge porcii chinezi de porcii comerciali europeni, iar 10 rase pure au putut fi atribuite cu precizie la trei grupuri corespunzătoare (ECHP, SCHP și EUCP) prin utilizarea a doar șapte AIM-uri. Prin simulări de date, am demonstrat că AIM-urile selectate de la indivizi neamestecați pot fi, de asemenea, aplicate cu succes pentru a estima proporțiile de ascendență pentru indivizi amestecați. Am dezvoltat în continuare un panou de 129 de AIM-uri pentru a deduce în mod eficient proporțiile strămoșilor la indivizii posibil amestecați. Având în vedere flexibilitatea, fiabilitatea și capacitatea de service, platforma Agena MassARRAY ar fi în prezent cea mai bună alegere pentru genotiparea setului de 129 de AIM-uri. Cu toate acestea, pentru testarea unui volum foarte mare, un cip SNP personalizat de joasă densitate sau secvențierea de generație următoare bazată pe PCR multiplex ar fi mai rentabilă.

Lucrarea noastră a oferit un exemplu util de utilizare a unui număr mic de AIM-uri pentru clasificări și estimarea proporțiilor de ascendență. Se pot face în continuare eforturi pentru a optimiza AIM-urile la un număr minim, dacă este necesar. De exemplu, dintre cele 129 de AIM-uri, cele care reprezintă diferențele dintre EUCP și ECHP sau SCHP ar putea fi eventual reduse. Sau, să se includă mai multe AIM-uri pentru a crește puterea de discriminare între ECHP și SCHP.

Este demn de remarcat faptul că una dintre condițiile prealabile importante pentru a obține AIM-uri eficiente, fie pentru clasificare, fie pentru estimarea strămoșilor, este de a găsi populații de referință bune. De exemplu, Daya et al. (2013) au raportat că un panel de 96 AIM-uri ar putea fi utilizat pentru a deduce proporțiile de strămoși pentru populația de culoare din Africa de Sud (SAC), prin utilizarea unor populații reprezentative. Cu toate acestea, acești markeri nu au avut performanțe bune în ceea ce privește inferența strămoșilor din Asia de Sud și Asia de Est. În studiul nostru, 10 rase pure de porci din trei grupuri (ECHP, SCHP și EUCP) sunt alese ca populații de referință. Există mai multe motive pentru care am ales aceste rase. În primul rând, mulți porci comerciali europeni sau încrucișări de rase indigene cu rase comerciale europene devin din ce în ce mai frecvente în China, astfel încât, în acest caz, principalele rase comerciale europene importate, inclusiv Duroc, Pietrain și Landrace, au fost alese ca populații reprezentative ale EUCP. În al doilea rând, rasele chinezești incluse în acest studiu au acoperit două medii ancestrale desemnate. În studiul lui Yang et al. (Yang et al., 2017), porcii China_Erhualian (CNEH), China_Jinhua (CNJH), China_Meishan (CNMS) provin în mod clar dintr-o ascendență, iar porcii China_Bamaxiang (CNBX), China_Congjiangxiang (CNCJ), China_Guangdongdahuabai (CNDH) și China_Luchuan (CNLU) provin în mod clar din cealaltă ascendență. Analiza amestecului a arătat că acestea sunt cel mai puțin introgresate de EUCP și pot fi separate în mod clar una de cealaltă. Împreună, acestea constituie astfel cea mai bună populație de referință disponibilă până în prezent, atât din punct de vedere al purității genetice, cât și al capacității de a evidenția potențialul amestec în alte rase chinezești. Dacă în viitor vor fi incluse mai multe rase pure în setul de referință, ne putem aștepta la o estimare mai precisă, precum și la o gamă mai largă de populații în care metoda noastră ar putea fi aplicabilă.

Contribuții ale autorilor

YZ a conceput și a supravegheat studiul. ZL a analizat conținutul principal al datelor cu ajutorul lui LB, YQ, YP, YP și RY. ZL și YZ au redactat manuscrisul. Toți autorii au citit și aprobat manuscrisul final.

Finanțare

Proiectul a fost susținut de Programul național de cercetare și dezvoltare a tehnologiilor cheie (2015BAD03B01-01) și de Fundația Națională de Științe Naturale din China (U1704233).

Declarație privind conflictul de interese

Autorii declară că cercetarea a fost efectuată în absența oricăror relații comerciale sau financiare care ar putea fi interpretate ca un potențial conflict de interese.

Material suplimentar

Materialul suplimentar pentru acest articol poate fi găsit online la adresa:

Supplementary Material

Supplementary Material for this article can be found online at: https://www.frontiersin.org/articles/10.3389/fgene.2019.00183/full#supplementary-material

Footnotes

  1. ^http://dx.doi.org/10.5061/dryad.30tk6
  2. ^https://github.com/boxiangliu/ANTseq
  3. ^http://www.curveexpert.net

Ai, H., Huang, L. și Ren, J. (2013). Diversitatea genetică, dezechilibrul de legătură și semnăturile de selecție la porcii chinezi și occidentali dezvăluite de markerii SNP la nivel de genom. PLoS One 8:e56001. doi: 10.1371/journal.pone.0056001

PubMed Abstract | CrossRef Full Text | Google Scholar

Alexander, D. H., Novembre, J., și Lange, K. (2009). Estimarea rapidă bazată pe model a strămoșilor la indivizi neînrudiți. Genome Res. 19, 1655-1664. doi: 10.1101/gr.094052.109

PubMed Abstract | CrossRef Full Text | Google Scholar

Barbosa, F. B., Cagnin, N. F. F., Simioni, M., Farias, A. A., Torres, F. R., Molck, M. C., et al. (2017). Panou de markeri informativi de ascendență pentru a estima stratificarea populației utilizând o matrice umană la nivel de genom. Ann. Hum. Genet. 81, 225-233. doi: 10.1111/ahg.12208

PubMed Abstract | Full Text | Google Scholar

Bauchet, M., McEvoy, B., Pearson, L. N., Quillen, E. E., Sarkisian, T., Hovhannesyan, K., et al. (2007). Măsurarea stratificării populației europene cu ajutorul datelor genotipice de tip microarray. Am. J. Hum. Genet. 80, 948-956. doi: 10.1086/513477

PubMed Abstract | Full CrossRef Text | Google Scholar

Berthouly-Salazar, C., Thevenon, S., Van, T. N., Nguyen, B. T., Pham, L. D., Chi, C. V., et al. (2012). Amestecul necontrolat și pierderea diversității genetice într-o rasă locală de porci vietnamezi. Ecol. Evol. 2, 962-975. doi: 10.1002/ece3.229

PubMed Abstract | Refef Full Text | Google Scholar

Bertolini, F., Galimberti, G., Schiavo, G., Mastrangelo, S., Di Gerlando, R., Strillacci, M. G., et al. (2017). Statisticile de preselecție și clasificarea random forest identifică polimorfismele single nucleotide informative pentru populație în rasele de bovine cosmopolite și autohtone. Animal 12, 12-19. doi: 10.1017/S1751731117001355

PubMed Abstract | Refef Full Text | Google Scholar

Bianco, E., Soto, H. W., Vargas, L., și Perez-Enciso, M. (2015). Genomul chimeric al porcilor sălbatici din Isla del Coco (Costa Rica), o populație izolată din 1793, dar cu niveluri remarcabile de diversitate. Mol. Ecol. 24, 2364-2378. doi: 10.1111/mec.13182

PubMed Abstract | CrossRef Full Text | Google Scholar

Bosse, M., Madsen, O., Megens, H. J., Frantz, L. A. F., Paudel, Y., Crooijmans, R. P., et al. (2015). Originea hibridă a porcilor comerciali europeni examinată printr-o analiză aprofundată a haplotipurilor pe cromozomul 1. Front. Genet. 5:442. doi: 10.3389/Fgene.2014.00442

PubMed Abstract | Text integral | Google Scholar

Bosse, M., Megens, H. J., Frantz, L. A. F., Madsen, O., Larson, G., Paudel, Y., et al. (2014). Analiza genomică dezvăluie selecția pentru gene asiatice la porcii europeni în urma introgresiei mediate de om. Nat. Commun. 5:4392. doi: 10.1038/Ncomms5392

PubMed Abstract | Text integral | Google Scholar

Bouchemousse, S., Liautard-Haag, C., Bierne, N., și Viard, F. (2016). Distingerea hibridizării contemporane de introgresia trecută cu SNP-uri postgenomice de informare a strămoșilor în speciile Ciona puternic diferențiate. Mol. Ecol. 25, 5527-5542. doi: 10.1111/mec.13854

PubMed Abstract | Full Text | Google Scholar

Browning, S. R., și Browning, B. L. (2007). Fazarea rapidă și precisă a haplotipurilor și inferența datelor lipsă pentru studiile de asociere a întregului genom prin utilizarea grupării haplotipurilor localizate. Am. J. Hum. Genet. 81, 1084-1097. doi: 10.1086/521987

PubMed Abstract | CrossRef Full Text | Google Scholar

Da Mota, B., Tudoran, R., Costan, A., Varoquaux, G., Brasche, G., Conrod, P., et al. (2014). Modele de învățare automată pentru studii neuroimagistice-genetice în cloud. Front. Neuroinform. 8:31. doi: 10.3389/Fninf.2014.00031

PubMed Abstract | CrossRef Full Text | Google Scholar

Dai, F. W., Feng, D. Y., Cao, Q. Y., Ye, H., Zhang, C. M., Xia, W. G., et al. (2009). Diferențe de dezvoltare a carcasei, a calității cărnii și a caracteristicilor fibrelor musculare între rasa locală și un porc autohton chinezesc. S. Afr. J. Anim. Sci. 39, 267-273.

Google Scholar

Daya, M., van der Merwe, L., Galal, U., Moller, M., Salie, M., Chimusa, E. R., et al. (2013). Un panou de markeri informativi ai strămoșilor pentru populația de culoare sud-africană de culoare complexă amestecată în cinci direcții. PLoS One 8:e82224. doi: 10.1371/journal.pone.0082224

PubMed Abstract | CrossRef Full Text | Google Scholar

Dimauro, C., Nicoloso, L., Cellesi, M., Macciotta, N. P. P. P., Ciani, E., Moioli, B., et al. (2015). Selectarea markerilor SNP discriminanți pentru atribuirea rasei și a alocării geografice a ovinelor italiene. Small Rumin. Res. 128, 27-33. doi: 10.1016/j.smallrumres.2015.05.001

CrossRef Full Text | Google Scholar

Ding, L. L., Wiener, H., Abebe, T., Altaye, M., Go, R. C. P., Kercsmar, C., et al. (2011). Compararea măsurilor de informativitate a markerilor pentru cartografierea strămoșilor și a amestecurilor. BMC Genomics 12:622. doi: 10.1186/1471-2164-12-622

PubMed Abstract | Refef Full Text | Google Scholar

Fang, M., Hu, X., Jiang, T., Braunschweig, M., Hu, L., Du, Z., et al. (2005). The phylogeny of Chinese indigenous pig breeds inferred from microsatellite markers. Anim. Genet. 36, 7-13. doi: 10.1111/j.1365-2052.2004.01234.x

PubMed Abstract | CrossRef Full Text | Google Scholar

Frantz, L. A. F., Schraiber, J. G., Madsen, O., Megens, H. J., Bosse, M., Paudel, Y., et al. (2013). Secvențierea genomului dezvăluie diversificarea la scară fină și istoria reticulației în timpul speciației la Sus. Genome Biol. 14:R107. doi: 10.1186/Gb-2013-14-9-R107

PubMed Abstract | Refef Full Text | Google Scholar

Galanter, J. M., Fernandez-Lopez, J. C., Gignoux, C. R., Barnholtz-Sloan, J., Fernandez-Rozadilla, C., Via, M., et al. (2012). Dezvoltarea unui panou de markeri informativi ancestrali la nivelul genomului pentru a studia amestecul în întreaga Americă. PLoS Genet. 8:e1002554. doi: 10.1371/journal.pgen.1002554

PubMed Abstract | Refef Full Text | Google Scholar

Getachew, T., Huson, H. J., Wurzinger, M., Burgstaller, J., Gizaw, S., Haile, A., et al. (2017). Identificarea markerilor genetici foarte informativi pentru cuantificarea proporțiilor de strămoși în populațiile de ovine încrucișate: implicații pentru alegerea nivelurilor optime de amestec. BMC Genet. 18:80. doi: 10.1186/s12863-017-0526-2

PubMed Abstract | CrossRef Full Text | Google Scholar

Gong, H., Xiao, S., Li, W., Huang, T., Huang, X., Yan, G., et al. (2018). Unravelling the genetic loci for growth and carcass traits in Chinese Bamaxiang pigs based on a 1.4 million SNP array. J. Anim. Breed. Genet. 136, 3-14. doi: 10.1111/jbg.12365

PubMed Abstract | Full CrossRef Text | Google Scholar

Groenen, M. A. M. M. (2016). Un deceniu de secvențiere a genomului porcin: o fereastră asupra domesticirii și evoluției porcinelor. Genet. Sel. Evol. 48:23. doi: 10.1186/s12711-016-0204-2

PubMed Abstract | Full CrossRef Text | Google Scholar

Hong, J. H., and Cho, S. B. (2008). O strategie probabilistică multiclasă probabilistică a mașinilor vectoriale de suport unu-vs.-rest pentru clasificarea cancerului. Neurocomputing 71, 3275-3281. doi: 10.1016/j.neucom.2008.04.033

CrossRef Full Text | Google Scholar

Kwon, T., Yoon, J., Heo, J., Lee, W., și Kim, H. (2017). Urmărirea fermei de reproducere a porcilor domestici folosind selecția caracteristicilor (Sus scrofa). Asian Aust. J. Anim. Sci. 30, 1540-1549. doi: 10.5713/ajas.17.0561

PubMed Abstract | CrossRef Full Text | Google Scholar

Larson, G., Dobney, K., Albarella, U., Fang, M. Y., Matisoo-Smith, E., Robins, J., et al. (2005). Filogeografia mondială a porcilor mistreți relevă existența mai multor centre de domesticire a porcilor. Science 307, 1618-1621. doi: 10.1126/science.1106927

PubMed Abstract | Full Text | Google Scholar

Lawson, D. J., Hellenthal, G., Myers, S., și Falush, D. (2012). Inferența structurii populației folosind date dense de haplotipuri. PLoS Genet. 8:e1002453. doi: 10.1371/journal.pgen.1002453

PubMed Abstract | Refef Full Text | Google Scholar

Lee, S., Epstein, M. P., Duncan, R., și Lin, X. H. (2012). Sparse principal component analysis for identifying ancestry-informative markers in genome-wide association studies. Genet. Epidemiol. 36, 293-302. doi: 10.1002/gepi.21621

PubMed Abstract | Full CrossRef Text | Google Scholar

Li, C. X., Pakstis, A. J., Jiang, L., Wei, Y. L., Sun, Q. F., Wu, H., et al. (2016). Un panou de 74 AISNP: inferență ancestrală îmbunătățită în Asia de Est. Forensic Sci. Int. Genet. 23, 101-110. doi: 10.1016/j.fsigen.2016.04.002

PubMed Abstract | CrossRef Full Text | Google Scholar

Li, S.-J., Yang, S.-H., Zhao, S.-H., Fan, B., Yu, M., Wang, H.-S., et al. (2004). Analiza diversității genetice a 10 populații indigene de porci chinezi pe baza a 20 de microsateliți. J. Anim. Sci. 82, 368-374. doi: 10.2527/2004.822368x

PubMed Abstract | CrossRef Full Text | Google Scholar

Maples, B. K., Gravel, S., Kenny, E. E., și Bustamante, C. D. (2013). RFMix: o abordare de modelare discriminativă pentru o inferență rapidă și robustă a ancestrării locale. Am. J. Hum. Genet. 93, 278-288. doi: 10.1016/j.ajhg.2013.06.020

PubMed Abstract |Ref Full Text | Google Scholar

Monzon, J., Kays, R., și Dykhuizen, D. E. (2014). Evaluarea amestecului coiot-lup-câine cu ajutorul SNP-urilor de diagnosticare informativă a strămoșilor. Mol. Ecol. 23, 182-197. doi: 10.1111/mec.12570

PubMed Abstract | Full Text | Google Scholar

Pardo-Seco, J., Martinon-Torres, F., și Salas, A. (2014). Evaluarea acurateței panourilor AIM la cuantificarea strămoșilor genomului. BMC Genomics 15:543. doi: 10.1186/1471-2164-15-543

PubMed Abstract | CrossRef Full Text | Google Scholar

Patterson, N., Price, A. L., și Reich, D. (2006). Structura populației și analiza proprie. PLoS Genet. 2:e190. doi: 10.1371/journal.pgen.0020190

PubMed Abstract | Ref Full Text | Google Scholar

Peterson, R. E., Edwards, A. C., Bacanu, S. A., Dick, D. M., Kendler, K. S., și Webb, B. T. (2017). Utilitatea atribuirii empirice a grupurilor de strămoși în studiile genetice de dependență între popoare. Am. J. Addict. 26, 494-501. doi: 10.1111/ajad.12586

PubMed Abstract | CrossRef Full Text | Google Scholar

Qin, P., Li, Z., Jin, W., Lu, D., Lou, H., Shen, J., et al. (2014). Un panou de markeri informativi de ancestralitate pentru a estima și corecta efectele potențiale ale stratificării populației la chinezii Han. Eur. J. Hum. Genet. 22, 248-253. doi: 10.1038/ejhg.2013.111

PubMed Abstract | Refef Full Text | Google Scholar

Rosenberg, N. A., Li, L. M., Ward, R., și Pritchard, J. K. (2003). Informativeness of genetic markers for inference of ancestry. Am. J. Hum. Genet. 73, 1402-1422. doi: 10.1086/380416

PubMed Abstract | Full CrossRef Text | Google Scholar

Santos, H. C., Horimoto, A. V. R., Tarazona-Santos, E., Rodrigues-Soares, F., Barreto, M. L., Horta, B. L., et al. (2016). Un set minim de markeri informativi de ancestralitate pentru determinarea proporțiilor de amestec într-o populație americană mixtă: setul brazilian. Eur. J. Hum. Genet. 24, 725-731. doi: 10.1038/ejhg.2015.187

PubMed Abstract | CrossRef Full Text | Google Scholar

Shriver, M. D., Parra, E. J., Dios, S., Bonilla, C., Norton, H., Jovel, C., et al. (2003). Pigmentarea pielii, ancestralitatea biogeografică și cartografierea amestecului. Hum. Genet. 112, 387-399. doi: 10.1007/s00439-002-0896-y

PubMed Abstract | Full CrossRef Text | Google Scholar

Sun, K., Ye, Y., Luo, T., și Hou, Y. (2016). Multi-InDel analysis for ancestry inference of sub-populations in china. Sci. Rep. 6:39797. doi: 10.1038/srep39797

PubMed Abstract | Refef Full Text | Google Scholar

Tian, C., Kosoy, R., Nassir, R., Lee, A., Villoslada, P., Klareskog, L., et al. (2009). European population genetic substructure: further definition of ancestry informative markers for distingishing among diverse european ethnic groups. Mol. Med. 15, 371-383. doi: 10.2119/molmed.2009.00094

PubMed Abstract | Full CrossRef Text | Google Scholar

vonHoldt, B. M., Kays, R., Pollinger, J. P., și Wayne, R. K. (2016). Cartografierea amestecului identifică regiunile genomice introgresate în canidele nord-americane. Mol. Ecol. 25, 2443-2453. doi: 10.1111/mec.13667

PubMed Abstract | Full Text | Google Scholar

Yang, B., Cui, L. L., Perez-Enciso, M., Traspov, A., Crooijmans, R. P. M. A., Zinovieva, N., et al. (2017). Datele SNP la nivel de genom dezvăluie globalizarea porcilor domesticiți. Genet. Sel. Evol. 49:71. doi: 10.1186/s12711-017-0345-y

PubMed Abstract | Full CrossRef Text | Google Scholar

Zeng, X. P., Chakraborty, R., King, J. L., Larue, B., Moura-Neto, R. S., and Budowle, B. (2016). Selectarea markerilor SNP foarte informativi pentru afilierea populațională a principalelor populații din SUA. Int. J. Legal Med. 130, 341-352. doi: 10.1007/s00414-015-1297-9

PubMed Abstract | Full CrossRef Text | Google Scholar

Zhang, C., Lin, D., Wang, Y., Peng, D., Li, H., Fei, J., et al. (2019). Introgresie larg răspândită în rasele de pui indigene chinezești de pui de carne comercial. Evol. Appl. 12, 610-621. doi: 10.1111/eva.12742

PubMed Abstract | Reflect Full Text | Google Scholar

Zhang, F., Zhang, L., și Deng, H. W. (2009). O metodă bazată pe PCA pentru selectarea markerilor informativi ancestrali în populații structurate. Sci. Chin. Series C Life Sci. 52, 972-976. doi: 10.1007/s11427-009-0128-y

PubMed Abstract | CrossRef Full Text | Google Scholar

Zhao, P., Yu, Y., Feng, W., Du, H., Yu, J., Kang, H., et al. (2018). Dovezi ale istoriei evoluției și ale măturilor selective în genomul porcului Meishan dezvăluie caracterizarea sa genetică și fenotipică. Gigascience 7. doi: 10.1093/gigascience/giy058

PubMed Abstract | Full CrossRef Text | Google Scholar

Zhu, Y., Li, W., Yang, B., Zhang, Z., Ai, H., Ren, J., et al. (2017). Semnături de selecție și introgresie interspecii în genomul porcilor domestici chinezi. Genome Biol. Evol. 9, 2592-2603. doi: 10.1093/gbe/evx186

PubMed Abstract | CrossRef Full Text | Google Scholar