Identifiering av tandem Ankyrin repeats i proteinstrukturer

Här presenterar vi analysen av den föreslagna algoritmen på en representativ uppsättning av femton ANK-repeat-proteiner (tabell 2). Vi diskuterar först i detalj vår analys på ett utformat ANK-protein, 1N0R (kedja A), som består av fyra exakta ANK-repeter i tandem enligt figur 2(a) och dess proteinkontaktnätverk som visas i figur 2(b). De viktigaste egenvektorerna i adjacensmatrisen, A levc , för det designade ANK-proteinet 1N0R visas i figur 3(a). Ett tydligt repetitivt mönster i A levc-profilen observeras i de fyra upprepade regionerna (streckade och heldragna vertikala linjer motsvarar start- och slutgränserna för upprepningar baserade på RADAR-utdata). Detta syns tydligt genom att överlappa A levc-profilen för de enskilda upprepade kopiorna i figur 3(b) efter normalisering med den största toppen i varje upprepad kopia. Förutsägelsen är bra både när det gäller antalet kopior och start- och slutgränserna för de upprepade regionerna jämfört med det sekvensbaserade verktyget RADAR (se tabell 2), medan två upprepade kopior missas av det strukturbaserade programmet ConSole, till och med i fallet med det designade ANK-proteinet. De multipla sekvensanpassningarna (MSA) av de upprepade regionerna som förutsagts av vår metod, RADAR och ConSole visas i figur 4(a), (b) respektive (c) med hjälp av CLUSTALW . MSA för de enskilda kopiorna i båda fallen är mycket välbevarade och stämmer väl överens.

Tabell 2 Prediktion av upprepningsregioner för en representativ uppsättning av 15 proteiner jämfört med UniProt annotation, RADAR och ConSole output
Figur 4
figure4

MSA för de predikterade upprepningsregionerna för 1N0R. (a) Predikterade av den föreslagna metoden, (b) RADAR-utgång och (c) ConSole-utgång.

Vi betraktar härnäst ett exempel på ett naturligt protein, Osteoklaststimulerande faktor 1, 3EHQ (kedja A), som inducerar benresorption. Enligt annotationen i UniProt innehåller det tre Ankyrin-repetitioner från 72-168 som visas i 3D-strukturen med olika färger i figur 5(a). I figur 5(b) visas A levc-profilen för 3EHQ, som tydligt visar förekomsten av tre repetitiva enheter i regionen 72-177. Det finns en god överensstämmelse mellan de förutsagda start- och slutgränserna för de tre upprepade enheterna och UniProt-annotationen (se tabell 2). RADAR:s och ConSoles förutsägelser av de upprepade regionerna överensstämmer dock inte med UniProt-annotationen. RADAR:s förutsägelse skiljer sig åt både när det gäller antalet kopior och gränserna för de upprepade enheterna, och den första upprepningen saknas helt och hållet. ConSole förutsäger tre kopior av ANK-repetitionerna, men positionerna för de upprepade enheternas start- och slutgränser avviker med cirka 10 rester för varje repeterad kopia. I figur 6 visas MSA för de upprepade regionerna (a) som förutsägs av vår metod, (b) som är annoterade i UniProt-databasen och (c) som förutsägs av ConSole. MSA för den förutspådda upprepningsregionen i figur 6(a) stämmer mycket väl överens med MSA för de annoterade upprepningsregionerna i UniProt (figur 6(b)), jämfört med MSA för den förutspådda ConSole-regionen i figur 6(c). Resultaten för en representativ uppsättning av 15 ANK-repeterade proteiner sammanfattas i tabell 2 tillsammans med annoteringen i UniProt-databasen och förutsägelser med sekvens- och strukturbaserade metoder, RADAR respektive ConSole. I stort sett observerar vi en god överensstämmelse vid detektering av Ankyrinrepeater både i fråga om antal kopior och repetitionsgränser med UniProt-annotationen och även med ConSole.

Figur 5
figure5

Naturligt Ankyrinrepeat-protein 3EHQ (kedja A). (a) 3d-strukturen och (b) egenvektorkomponenterna som motsvarar det största egenvärdet i adjacensmatrisen (A levc ).

Figur 6
figur6

MSA av de upprepade regionerna i protein 3EHQ. (a) förutsägs av den föreslagna metoden, (b) annoteras i UniProt-databasen och (c) förutsägs av ConSole-output.

I tabell 2 har proteinerna valts ut för att presentera exempel både på god överensstämmelse och på oenighet. Nedan diskuterar vi några exempel där vår prediktion skiljer sig från annoteringen i UniProt-databasen. I fallet med protein 3EU9 (kedja A) är till exempel fem kopior av ANK-motiv annoterade i UniProt från 89-253, medan vårt tillvägagångssätt förutsäger sju kopior, en extra kopia på vardera sidan från 57-88 och 258-281. Från 3D-strukturen av 3EU9 i figur 7(a) och A levc-profilen i figur 7(b) är det tydligt att de förutspådda terminala upprepningarna (visas i rött) uppvisar en levc-profil som liknar de fem mellanliggande upprepningarna (visas i grått). Den strukturella anpassningen av dessa förutspådda terminala upprepningar till ett representativt strukturellt ANK-motiv (från det designade proteinet 1N0R) med hjälp av Cealign-modulen i Pymol visas i figur 7(c) och (d); RMSD (Root Mean Square Deviation) för varje terminalupprepning är mindre än 1 Å, vilket tyder på hög strukturell likhet med ANK-motivet. På sekvensnivå är dock dessa terminala upprepningar inte välkonserverade, vilket framgår av MSA för de förutspådda regionerna i figur 8(a), jämfört med MSA för de UniProt-annoterade upprepningsregionerna i figur 8(b). Med ytterligare en terminal kopia som förutsägs av ConSole förutsägs totalt sex kopior, men gränserna för ConSole-kopiorna är förskjutna med cirka 10 rester jämfört med UniProt-annoteringen. I allmänhet är de terminala upprepningarna mindre konserverade på sekvensnivå eller ofullständiga, och det är inte lätt att upptäcka dem. I 52 andra proteiner (se Additional file 1) har ytterligare kopior av ANK-repeaten förutsagts med den föreslagna metoden, vilket förbättrar annoteringen av den fullständiga repetitionsregionen i dessa 53 proteiner. I 16 av dessa fall förutsägs en extra kopia också av ConSole. För proteinet 3SO8 (kedja A, UniProt Id: Q9H9E1) annoterades ursprungligen tre ANK-repetitioner i den tidigare utgåvan av UniProt (utgåva 2012_08) från 181-279, medan fem repetitioner förutsägs av vårt tillvägagångssätt från rester 149-310, dvs. en extra repetition i varje ände. I den senaste utgåvan av UniProt-databasen (utgåva 2014_05) annoteras proteinet nu med fem kopior av ANK-motivet från 148-313, vilket stämmer överens med förutsägelsen av den föreslagna metoden (tabell 2).

Figur 7
figur7

Naturligt Ankyrinrepeat-protein 3EU9 (kedja A). (a) 3D-struktur (b) Plott av den viktigaste egenvektorn i adjacensmatrisen. (c) – (d) Strukturell anpassning av extra Ankyrin-repeatkopia förutspådd i 3EU9 (visas i blå färg) med en repeterad kopia av det designade proteinet 1N0R (visas i röd färg).

Figur 8
figur8

MSA av de repeterade regionerna i protein 3EU9. (a) förutsägs av den föreslagna metoden och (b) annoteras i UniProt-databasen.

I protein 1D9S (kedja A) rapporteras fyra ANK-repetitioner från 5-130 i UniProt-databasen, men endast två identifieras av vår metod från 71-129. Vid analys av sekundärstrukturarkitekturen från PDBsum för 1D9S i figur 9 observerar vi att regionen 38-66 endast innehåller en helix som tilldelats av både STRIDE och DSSP , medan ett ANK-motiv består av två antiparallella helixar, vilket tyder på att denna region kan ha annoterats felaktigt i UniProt-databasen. Region 5-34 förutspås som ANK-motiv i den preliminära screeningen av vår metod, men den kastas bort i efterbearbetningssteget medan sammanhängande tandemrepetitionsregioner rapporteras. En liknande situation uppstod i 18 andra proteiner (se tilläggsfil 1) där den första upprepningen i UniProt-annoteringen först förutsägs av vår algoritm, men senare förkastas eftersom nästa upprepning inte identifieras inom ett tröskelvärde på 17 rester (halva längden på ett ANK-motiv). För alla dessa proteiner, utom 4HBD, missar ConSole en eller flera kopior jämfört med UniProt-annotationen (se tilläggsfil 1). Det är möjligt att i alla dessa proteiner är det saknade ANK-motivet muterat så att det inte går att känna igen ens på strukturnivå eller att en helix är borttagen. Vi ser alltså att adjacensmatrisens egna spektrum fångar ANK-motivets repetitiva veckningsmönster mycket väl, och genom att införliva informationen om sekundärstrukturen och variationen i deras längder är det möjligt att förutsäga repetitionsgränserna på ett exakt sätt (tabell 2). Om det finns ett fel i tilldelningen av sekundärstrukturen påverkas dock förutsägelsen av den föreslagna algoritmen.

Figur 9
figur9

Sekundärstrukturrepresentation av Ankyrinrepeatprotein 1D9S (kedja A) från PDBsum.

Den föreslagna algoritmens prestanda

Först diskuterar vi ANK-motivens prediktionsnoggrannhet med UniProt-annotationen på en känd uppsättning av 370 proteiner som består av en positiv testuppsättning av 125 Ankyrinrepeat-proteiner och en negativ testuppsättning av 245 icke-solenoidproteiner. Resultaten sammanfattas i tabell 3 (a), där algoritmens känslighet och specificitet beräknas enligt följande:

Känslighet= T P T P + F N ≃0.976
Specificity= T N T N + F P ≃1
Tabell 3 Prestanda för det föreslagna tillvägagångssättet

där TP motsvarar antalet korrekt förutspådda kända Ankyrin-repeatproteiner, FN – antalet kända Ankyrin-repeterade proteiner som missats av vår metod, FP – antalet proteiner som vår metod förutsäger att de innehåller tandem ANK-repeterade proteiner men som inte har annoterats som Ankyrin-proteiner, och TN – antalet proteiner som vår metod korrekt förutsäger att de inte är Ankyrin-proteiner. Eftersom det bara fanns tre falskt negativa (FN), 1SW6, 2ETB och 3ZRH, och inga falskt positiva (FP), är algoritmens känslighet och specificitet mycket hög (≃1).

Nästan för de förutspådda Ankyrin-proteinerna analyserar vi antalet ANK-motiv som korrekt förutspåtts i datasetet med 125 kända Ankyrin-repeat-proteiner och jämför med en nyare strukturbaserad metod, ConSole, och en sekvensbaserad metod RADAR. I UniProt-databasen finns totalt 584 ANK-motiv annoterade i dessa 125 proteiner, medan 582 ANK-motiv förutsägs av den föreslagna metoden, 528 av ConSole och 458 av RADAR. Detaljerna i analysen sammanfattas i tabell 3(b) när det gäller känslighet och precision, definierade som:

Känslighet= T P T P + F N
Precision= T P T P + F P

där TP är antalet ANK-motiv som korrekt förutspåtts av metoden i en känd datamängd på 125 proteiner, FP är antalet ANK-motiv som förutsägs av metoden men som inte är annoterade i UniProt-databasen, och FN är antalet annoterade ANK-motiv som metoden missat. Det kan konstateras att både känsligheten och precisionen för den föreslagna metoden AnkPred är ~ 0,88, vilket är ganska bra jämfört med ConSole (0,72 och 0,79) och RADAR (0,68 och 0,86). De terminala kopiorna är kända för att ha ett lågt sekvensbevarande, vilket resulterar i en lägre känslighet för RADAR-metoden. Vi inser att känsligheten hos vår algoritm, med dess beroende av tilldelningen av sekundärstrukturen, kan förbättras ytterligare.

För att analysera noggrannheten hos de upprepningsgränser som förutsägs av den föreslagna metoden konstruerade vi Multiple sequence alignment (MSA) av de 582 förutsagda ANK-motiven i datamängden av 125 kända Ankyrinproteiner med hjälp av CLUSTALW .Konsensus för de förutsagda ANK-motiven byggdes sedan upp med hjälp av SeaView vid 50 % identitet och visas nedan:

XGXTPLHXAXXXGXXXXXXXXXLLXXXAXX

Detta stämmer mycket väl överens med det konsensus ANK-motiv som föreslagits av Kohl et al. och Mosavi et al. . Det bevarade tetrapeptidmotivet TPLH på positionerna 4-7, glycin på positionerna 2 och 13 och leucin på positionerna 21-22 bekräftar den föreslagna metoden för förutsägelse av repetitionsgränserna.

Analys på protein data bank

Vi utförde den föreslagna algoritmen på hela PDB. Totalt hämtades 98 341 strukturer representerade som proteiner eller proteiner i komplex med nukleinsyror. Efter att ha tagit bort korta fragment < 50 rester (eftersom det är osannolikt att dessa innehåller två sammanhängande kopior av ANK-motiv) och proteiner utan tilldelade sekundärstrukturer användes totalt 94 975 strukturer för analys. Den föreslagna algoritmen identifierade 819 proteinstrukturer som innehåller minst två tandemvis upprepade ANK-motiv. Av dessa är 181 annoterade som kända ANK-proteiner i UniProt, Pfam, PROSITE och PDB, varav ~ 50 strukturer innehåller designade upprepade Ankyrinproteiner (DARPINS). Antalet korrekt förutspådda Ankyrinrepeatproteiner är 178 och endast tre missades av vår metod, 1SW6 (kedja A), 2ETB (kedja A) och 3ZRH (kedja A). I de två första fallen missade det föreslagna tillvägagångssättet upptäckten av ANK-motiv eftersom de UniProt-annoterade upprepade regionerna innehåller 3-4 spiraler, medan ett ANK-motiv enligt de regler som definieras i algoritmen består av två antiparallella spiraler. I 3ZRH är de två annoterade kopiorna av ANK-repeaten inte sammanhängande utan separerade med 23 rester och missades därför av vår metod. De återstående 641 strukturerna föreslås därför vara tidigare oidentifierade Ankyrinrepeatörer och förtecknas i tilläggsfil 2. Det kan konstateras att 27 av dessa proteiner har annoterats som innehållande andra typer av upprepningar, nämligen 9 TPR, 7 Pumilio-repetitioner, 2 HEAT, 2 Annexin-repetitioner, 2 receptorer för tumörnekrosfaktorn (TNFR-Cys), 2 upprepningar av mitokondriella termineringsfaktorer (MTERF), 2 upprepningar av tunga kedjor av Clathrin (CHCR) och 1 HAT (Additional file 2). Strukturellt sett är TPR-, HEAT- och HAT-motiven mycket lika ANK-repetitionsmotivet, var och en av dem består av två antiparallella spiraler som bildar en Helix-Turn-Helix-kärna och är också av liknande längd, ~ 30-34 rester. Den största skillnaden är att ANK-motivet har en lång slinga som slutar i en β-sväng, vilket inte finns i TPR-, HEAT- och HAT-motiven. Trots denna starka likhet mellan dessa strukturella motiv rapporteras endast 13 falskt positiva motiv (9 TPR, 3 HEAT och 1 HAT) av vår metod. För att kontrollera tillförlitligheten hos vår förutsägelse i dessa proteiner utförde vi struktur-strukturöverlagring av den förutsagda ANK-repeterade regionen med ett DARPin-motiv från 1N0R med hjälp av Cealign-modulen i Pymol . I protein 1OUV (kedja A) rapporteras till exempel sju kopior av TPR i UniProt-databasen från 29-278 (Additional file 2) som innehåller 14 helices H 1-H 14, vilket visas i sekundärstrukturrepresentationen från PDBsum i figur 10(a). Överlagringen är bra med en medelkvadratavvikelse (RMSD) för alla de tre förutspådda ANK-repeatenheterna < 3 Å, vilket visas i figur 10(b). A levc-profilen i den förutspådda Ankyrin-regionen från 185 till 292 i figur 10(c) är också mycket lik den för ett typiskt ANK-motiv i figur 1(a). I det här fallet ligger de förutsagda ANK-repetitionsmotiven inom den TPR-annoterade regionen och består av en helix från varje intilliggande TPR-repetitionsmotiv och kan representeras som H 2 i T i H 1 i + 1 där H 2 i är den andra helixen i det i:e TPR-motivet och H 1 i + 1 är den första helixen i det (i + 1):e TPR-motivet. Den strukturella anpassningen av de sju annoterade TPR-regionerna utfördes med ett representativt TPR-motiv från det designade proteinet 1NA0 och RMSD för varje upprepningsenhet < 2 Å (resultat visas inte), vilket tyder på att UniProt-annoteringen också är korrekt. Det observerades dock att β-svängningen mellan två helices inom ett TPR-motiv var längre än det typiska designade TPR-motivet och liknade ANK-motivets terminala slinga. Detta tyder på möjligheten av en arkitektur med flera upprepningar i komplexa proteiner. För 21 andra upprepade proteiner observerades en liknande arkitektur med flera upprepningar. När det gäller HEAT-repeatprotein 3LWW (kedja A) är annoteringen i UniProt sex kontinuerliga kopior från 124-441 och två avlägsna kopior från 602-641 och 687-726. Den förutspådda ANK-upprepningen ligger i den icke-HEAT-regionen från 520-621 med en mycket liten överlappning på 20 rester med HEAT-upprepningen. I detta fall finns två olika upprepningar i olika regioner i proteinet och totalt 10 proteiner som innehåller två olika typer av upprepningar som inte överlappar varandra observerades (markerade med ”*” i tilläggsfil 2). För dessa proteiner som uppvisar en arkitektur med flera upprepningar skulle det vara intressant att analysera interaktionsplatserna, vilket skulle bidra till att bekräfta flera annotationer/funktioner i dessa proteiner med komplex arkitektur. Det strukturbaserade tillvägagångssättet som föreslås här är således lovande när det gäller att upptäcka tandemstrukturella upprepningar i proteiner och är tillräckligt kraftfullt för att skilja mellan mycket liknande strukturella upprepningar, nämligen Ankyrin och TPR/HEAT/HAT.

Figur 10
figur10

Förutspådda Ankyrinrepeatprotein 1OUV (kedja A). (a) Representation av sekundärstrukturen från PDBsum. (b) Strukturell anpassning av den förutspådda ANK-repeterade kopian (visas i blå färg) med en repeterad kopia av det designade ANK-proteinet 1N0R (visas i orange). (c) En levc-plot med streckade och heldragna linjer som visar början och slutet av de förutspådda ANK-gränserna.

Funktionell analys av tidigare okända ankyrinproteiner

Vi identifierade 641 tidigare okända ankyrinrepeatproteiner med den föreslagna metoden. I tabell 4 presenterar vi vår analys av 11 av dessa proteiner. I alla dessa proteiner observerar vi att de bindningsställen som rapporterats i PDBsum ligger i den förutspådda Ankyrinrepeat-regionen. Till exempel innehåller DNA-polymeras lambda-proteinet 3HWT (människa), som är viktigt för DNA-replikationsprocessen, fyra domäner. De rapporterade DNA-bindningsställena i 3HWT finns i DNA-polymerasdomänen (257-331) och ligger på den andra helixen i båda kopiorna av de förutspådda Ankyrinenheterna. Förekomsten av Ankyrinrepeatörer i de DNA-bindande proteinerna 1SW6 och 3V30, som är annoterade i UniProt, ger stöd för vår förutsägelse och 3HWT:s möjliga funktionella roll. Denna analys hjälper till att förstå vilken typ av interaktion 3HWT är involverad i och en jämförelse med andra proteiner med liknande funktioner kan leda till en bättre förståelse av Ankyrinrepeatens roll. På samma sätt är interaktionen mellan Ankyrinrepeaten och RNA känd för 1WDY och 4G8K. Vi observerar att proteinerna 3Q0P, 3K4E och 3V71 har bindningsställen som rapporterats i den förutspådda repetitionsregionen med RNA som bindningspartner, vilket återigen ger stöd för vår förutsägelse.

Tabell 4 Exempel på proteiner med bindningsställen i den förutspådda Ankyrinrepetitionsregionen

Vi förutspådde Ankyrinrepetitioner i två mannosidaseproteinstrukturer, 1FO3 (människa) och 1KRF (P. citrinum). Kifunensin (KIF) är en hämmare av mannosidaser och reglerar aktiviteten hos dessa proteiner. I PDBsum är KIF-bindningsställena för proteinerna 1FO3 och 1KRF annoterade i den region som förutsägs som Ankyrin-repeat genom vår metod. Detta tyder på nya interaktioner mellan dessa Ankyrin repeat-proteiner. Således skulle man kunna genomföra en systematisk analys av andra tidigare okända Anyrinproteiner för att identifiera deras interaktionspartners, vilket skulle leda till en förståelse av deras funktionella roll.

Analys av modellerade ankyrinproteiner

Proteinstrukturell information ökar i snabb takt i och med framstegen med att lösa upp proteinstrukturer, men är fortfarande inte jämförbar med rikedomen av sekvensinformation. Det kan noteras att av över 1200 proteiner som annoterats som innehållande Ankyrin-repeatmotiv i UniProt-databasen har endast ca 60 Ankyrinproteiner strukturell information tillgänglig. För att visa hur effektivt vårt tillvägagångssätt är på modellerade strukturer har vi modellerat 30 Ankyrin-repeat-proteiner från UniProt-databasen för vilka strukturen ännu inte är klarlagd. Strukturerna modellerades med hjälp av Swiss-Model-servern , som identifierar mallstrukturer från PDB baserat på sekvenstäckning och sekvensidentitet. De mallar som har hög täckning och sekvensidentitet i den upprepade regionen väljs ut för homologibaserad modellering av dessa 30 proteinsekvenser. Den föreslagna algoritmen AnkPred körs på motsvarande modellerade proteiner och förutsägelsen av de upprepade regionerna finns i tilläggsfil 3. I figur 11(a) visas förutsägelsen av den föreslagna metoden på den modellerade strukturen av Integrin-linked protein kinase (UniProt Id: Q99J82), som stämmer mycket väl överens med annoteringen i UniProt. Det kan noteras att i ungefär hälften av proteinerna (markerade med en asterisk i Additional file 3) hade det förutspådda antalet kopior ökat, med identifiering av terminala upprepningar. Det är känt att terminala kopior i allmänhet är mindre konserverade och ibland ofullständiga och därför missas av sekvensbaserade metoder, men identifieras av vår strukturbaserade metod, vilket visas för ANKRD-proteinet (UniProt Id: Q7Z3H0) i figur 11(b). Detta tyder på att vår metod kan förbättra annoteringen av upprepade regioner för proteinsekvenser för vilka ingen strukturinformation finns tillgänglig.

Figur 11
figure11

Förutsägelse på modellerade strukturer visas. (a) Integrinlänkat proteinkinas (UniProt Id: Q99J82). Upprepningsgränserna för fem Ankyrinmotiv som förutsagts av AnkPred (visas i olika färger) stämmer väl överens med fem annoterade kopior i Uniprot. (b) ANKRD-protein (UniProt Id: Q7Z3H0). I det här fallet är endast tre Ankyrinmotiv annoterade i UniProt (mellanliggande kopior) medan AnkPred förutspår ytterligare två kopior på vardera sidan.

Analys av andra strukturella upprepningar

För att utvärdera effektiviteten hos den föreslagna metoden på andra upprepningsfamiljer av proteiner, presenterar vi härnäst vår analys av fyra olika upprepningstyper: Tetratricopeptide repeat (TPR), Armadillo repeat (ARM), Leucine-rich repeat (LRR) och Kelch repeat. Den tredimensionella strukturen för ett representativt protein från varje typ av upprepning visas i figur 12(a)-(d) och deras respektive A levc-profiler i figur 12(e)-(h). En unik A levc-profil observeras i de upprepade regionerna i vart och ett av dessa proteiner som är väl bevarade inom de intilliggande upprepade enheterna, vilket visas genom överlappning av A levc-profilen i de upprepade enheterna i figur 12(i)-(l). De olika A levc-profilerna för olika upprepningar motsvarar den specifika orienteringen av de sekundära strukturelementen i varje upprepningstyp. Det kan noteras att A levc-profilen för TPR-repeaten är mycket distinkt jämfört med den för Ankyrin-repeaten (figur 3 a), även om den är lika lång och har en mycket likartad sekundärstrukturarkitektur med helix-turn-helix-kärna. Detta visar tydligt kraften hos egenspektrumanalysen av proteinkontaktnätverket vid identifiering av strukturella upprepningar och dess känslighet när det gäller att särskilja liknande strukturella upprepningar.

Figur 12
figur12

Proteiner från andra strukturella upprepningsfamiljer. (a)-(d) 3D-struktur: (a) 2C2L: kedja A (TPR) (b) 3SL9: kedja A (ARM) (c) 1D0B: kedja A (LRR) (d) 1U6D: kedja X (KELCH). I (e), (f), (g) och (h) visas A levc-plotten för respektive protein. I (i), (j), (k) och (l) är A levc-profilen för de upprepade regionerna i respektive proteiner överlappade.