Identificering af tandem Ankyrin gentagelser i proteinstrukturer

Her præsenterer vi analysen af den foreslåede algoritme på et repræsentativt sæt af femten ANK gentagelsesproteiner (Tabel 2). Vi diskuterer først i detaljer vores analyse på et designet ANK-protein, 1N0R (kæde A), der omfatter fire nøjagtige ANK-repeats i tandem, som vist i figur 2(a), og dets proteinkontaktnetværk, der er vist i figur 2(b). De vigtigste egenvektorer i adjacensmatricen, A levc , for det designede ANK-protein 1N0R er vist i figur 3(a). Der ses et tydeligt gentagelsesmønster i A levc-profilen i de fire gentagelsesregioner (stiplede og lodrette lodrette linjer svarer til start- og slutgrænserne for gentagelser baseret på RADAR-udgangen). Dette ses tydeligt ved at overlappe A levc-profilen for de enkelte gentagelseskopier i figur 3(b) efter normalisering med den største top i hver gentagelseskopi. Forudsigelsen er god både med hensyn til kopiantal og start-end grænserne for gentagelsesregionerne sammenlignet med det sekvensbaserede værktøj RADAR (se tabel 2), mens to gentagelseskopier overses af det strukturbaserede program ConSole, selv i tilfældet med det designede ANK-protein. De multiple sekvenstilpasninger (MSA) af de gentagelsesregioner, der er forudsagt af vores metode, RADAR og ConSole, er vist i figur 4(a), (b) og (c) ved hjælp af henholdsvis CLUSTALW . MSA’erne for de enkelte kopier er i begge tilfælde meget velbevarede og i god overensstemmelse.

Tabel 2 Forudsigelse af gentagelsesregioner for et repræsentativt sæt af 15 proteiner sammenlignet med UniProt annotation, RADAR og ConSole output
Figur 4
figure4

MSA af de forudsagte gentagelsesregioner for 1N0R. (a) forudsagt af den foreslåede tilgang, (b) RADAR-udgang og (c) ConSole-udgang.

Vi ser nu på et eksempel på et naturligt protein, Osteoclast-stimulerende faktor 1, 3EHQ (kæde A), der inducerer knogleresorption. Ifølge annotationen i UniProt indeholder det tre Ankyrin-repeats fra 72-168, som vist i 3D-strukturen med forskellige farver i figur 5(a). I figur 5(b) er vist A levc-profilplottet for 3EHQ, som tydeligt viser tilstedeværelsen af tre gentagelsesenheder i området 72-177. Der er en god overensstemmelse mellem de forudsagte start- og slutgrænser for de tre gentagelsesenheder og UniProt-annotationen (se tabel 2). RADAR og ConSole’s forudsigelse af de gentagne regioner er imidlertid ikke i overensstemmelse med UniProt-annotationen. RADAR’s forudsigelse afviger både med hensyn til antallet af kopier og gentagelsesgrænserne, idet den første gentagelse ikke er medtaget. ConSole forudsiger tre kopier af ANK-repeats, men positionerne af start- og slutgrænserne for de gentagne enheder afviger med ca. 10 rester for hver gentagelseskopi. I figur 6 er vist MSA for de gentagelsesregioner (a) forudsagt af vores metode, (b) annoteret i UniProt-databasen og (c) forudsagt af ConSole. MSA’en for den forudsagte gentagelsesregion i figur 6(a) er i meget god overensstemmelse med MSA’en for de annoterede gentagelsesregioner i UniProt (figur 6(b)), sammenlignet med MSA’en for den forudsagte ConSole-region i figur 6(c). Resultaterne for et repræsentativt sæt af 15 ANK-repeatproteiner er opsummeret i tabel 2 sammen med annotationen i UniProt-databasen og forudsigelser ved hjælp af henholdsvis sekvens- og strukturbaserede metoder, RADAR og ConSole. I det store og hele observerer vi en god overensstemmelse i detektionen af Ankyrin-repeats både med hensyn til kopiantal såvel som repeatgrænser med UniProt-annotationen og også med ConSole.

Figur 5
figur5

Naturligt Ankyrin-repeat-protein 3EHQ (kæde A). (a) 3d-strukturen og (b) egenvektorkomponenterne svarende til den største egenværdi af adjacensmatricen (A levc ).

Figur 6
figur6

MSA af de gentagne regioner i protein 3EHQ. (a) forudsagt af den foreslåede metode, (b) annoteret i UniProt-databasen og (c) forudsagt af ConSole-output.

I tabel 2 er proteinerne udvalgt for at præsentere eksempler både på god overensstemmelse og på uoverensstemmelse. Nedenfor diskuterer vi et par eksempler, hvor vores forudsigelse afviger fra annotationen i UniProt-databasen. For eksempel er der i tilfældet med protein 3EU9 (kæde A) fem kopier af ANK-motiver annoteret i UniProt fra 89-253, mens vores tilgang forudsiger syv kopier, en ekstra kopi på hver side fra 57-88 og 258-281. Af 3D-strukturen af 3EU9 i figur 7(a) og A levc-profilen vist i figur 7(b) fremgår det tydeligt, at de forudsagte terminale gentagelser (vist i rødt) udviser en levc-profil svarende til de fem mellemliggende gentagelser (vist i gråt). Den strukturelle tilpasning af disse forudsagte terminale gentagelser med et repræsentativt strukturelt ANK-motiv (fra det designede protein 1N0R) ved hjælp af Cealign-modulet i Pymol er vist i figur 7(c) og (d); Root Mean Square Deviation (RMSD) for hver terminal kopi er mindre end 1 Å, hvilket indikerer høj strukturel lighed med ANK-motivet. På sekvensniveau er disse terminale gentagelser imidlertid ikke velkonserverede, hvilket fremgår af MSA’en for de forudsagte regioner i figur 8(a), sammenlignet med MSA’en for de UniProt-annoterede gentagelsesregioner i figur 8(b). Med en ekstra terminal kopi forudsagt af ConSole forudsiges i alt seks kopier af ConSole, men grænserne for ConSole-kopierne er forskudt med omkring 10 rester sammenlignet med UniProt-annotationen. Generelt er de terminale gentagelser mindre konserverede på sekvensniveau eller ufuldstændige, og det er ikke let at detektere dem. I 52 andre proteiner (se Additional file 1) er yderligere kopier af ANK-repeterne blevet forudsagt af den foreslåede tilgang, hvilket forbedrer annotationen af den komplette gentagelsesregion i disse 53 proteiner. I 16 af disse tilfælde er en ekstra kopi også forudsagt af ConSole. For proteinet 3SO8 (kæde A, UniProt Id: Q9H9E1) blev oprindeligt tre ANK-repeats annoteret i den tidligere udgave af UniProt (udgivelse 2012_08) fra 181-279, mens fem repeats forudsiges af vores metode fra rest 149-310, dvs. en ekstra repeat i hver ende. I den seneste udgivelse af UniProt-databasen (udgivelse 2014_05) er proteinet nu annoteret som havende fem kopier af ANK-motivet fra 148-313, hvilket er i overensstemmelse med forudsigelsen af den foreslåede tilgang (tabel 2).

Figur 7
figure7

Naturligt Ankyrin-repeat-protein 3EU9 (kæde A). (a) 3D-struktur (b) Plot af den vigtigste egenvektor i adjacensmatrixen. (c) – (d) Strukturel alignment af ekstra Ankyrin-repeatkopi forudsagt i 3EU9 (vist i blå farve) med en repeatkopi af designet protein 1N0R (vist i rød farve).

Figur 8
figur8

MSA af de gentagne regioner i protein 3EU9. (a) forudsagt af den foreslåede tilgang, og (b) annoteret i UniProt-databasen.

I protein 1D9S (kæde A) er fire ANK-repeats rapporteret fra 5-130 i UniProt-databasen, men kun to er identificeret af vores tilgang fra 71-129. Ved analyse af sekundærstrukturarkitekturen fra PDBsum for 1D9S i figur 9 observerer vi, at regionen 38-66 kun indeholder én helix tildelt af både STRIDE og DSSP , mens et ANK-motiv består af to antiparallelle helixer, hvilket tyder på, at denne region kan være blevet fejlannoteret i UniProt-databasen. Region 5-34 er forudsagt som ANK-motiv i den indledende screening af vores metode, men er udeladt i efterbehandlingsfasen, mens der rapporteres om sammenhængende tandemrepeatregioner. En lignende situation opstod i 18 andre proteiner (se Additional file 1), hvor den første gentagelse i UniProt-annotationen oprindeligt forudsiges af vores algoritme, men senere kasseres, fordi den næste gentagelse ikke identificeres inden for en tærskelværdi på 17 rester (halv længde af et ANK-motiv). For alle disse proteiner, undtagen 4HBD, overses en eller flere kopier af ConSole sammenlignet med UniProt-annotationen (se yderligere fil 1). Det er muligt, at det manglende ANK-motiv i alle disse proteiner er muteret så meget, at det ikke kan genkendes, selv på strukturniveau, eller at der er en sletning af en helix. Vi kan således se, at adjacensmatricens egen spekter fanger ANK-motivets gentagne foldemønster meget godt, og ved at indarbejde sekundærstrukturoplysningerne og variationen i deres længder er det muligt at forudsige gentagelsesgrænserne præcist (tabel 2). Hvis der imidlertid er en fejl i sekundærstrukturtildelingen, påvirkes forudsigelsen af den foreslåede algoritme.

Figur 9
figur9

Sekundærstrukturrepræsentation af Ankyrin repeat protein 1D9S (kæde A) fra PDBsum.

Den foreslåede algoritmes ydeevne

Først diskuterer vi ANK-motivernes forudsigelsesnøjagtighed med UniProt-annotationen på et kendt sæt af 370 proteiner, der omfatter et positivt testsæt af 125 Ankyrin-repeat-proteiner og et negativt testsæt af 245 ikke-solenoide proteiner. Resultaterne er opsummeret i tabel 3 (a), hvor algoritmens følsomhed og specificitet beregnes på følgende måde:

Følsomhed= T P T P + F N ≃0.976
Specificity= T N T N + F P ≃1
Tabel 3 Ydelsen af den foreslåede metode

hvor TP svarer til antallet af korrekt forudsagte kendte Ankyrin-repeat-proteiner, der er kendt, FN – antallet af kendte Ankyrin-repeat-proteiner, som vores metode ikke har fundet, FP – antallet af proteiner, som vores metode forudsiger, at de indeholder tandem-ANK-repeats, men som ikke er annoteret som Ankyrin-protein, og TN – antallet af proteiner, som vores metode korrekt forudsiger som ikke-Ankyrin-proteiner. Da der kun var tre falsk negative (FN), 1SW6, 2ETB og 3ZRH, og ingen falsk positive (FP), er algoritmens følsomhed og specificitet meget høj (≃1).

Næst analyserer vi for de forudsagte Ankyrin-proteiner antallet af ANK-motiver, der er korrekt forudsagt i datasættet af 125 kendte Ankyrin-repeat-proteiner, og sammenligner med en nyere strukturbaseret tilgang, ConSole, og en sekvensbaseret tilgang, RADAR. I UniProt-databasen er der i alt 584 ANK-motiver annoteret i disse 125 proteiner, mens 582 ANK-motiver forudsiges af den foreslåede metode, 528 af ConSole og 458 af RADAR. Detaljerne i analysen er opsummeret i tabel 3(b) med hensyn til følsomhed og præcision, defineret som:

Følsomhed= T P T P + F N
Præcision= T P T P + F P

hvor TP er antallet af ANK-motiver, der er korrekt forudsagt af metoden i et kendt datasæt på 125 proteiner, FP er antallet af ANK-motiver, der er forudsagt af metoden, men som ikke er annoteret i UniProt-databasen, og FN er antallet af annoterede ANK-motiver, som metoden ikke har fundet. Det kan konstateres, at både følsomheden og præcisionen af den foreslåede metode, AnkPred, er ~ 0,88, hvilket er rimeligt godt sammenlignet med henholdsvis ConSole (0,72 og 0,79) og RADAR (0,68 og 0,86). De terminale kopier er kendt for at have lav sekvensbevaring, hvilket resulterer i en lavere følsomhed for RADAR-metoden. Vi erkender, at følsomheden af vores algoritme, med dens afhængighed af sekundærstrukturtildelingen, kan forbedres yderligere.

For at analysere nøjagtigheden af de gentagelsesgrænser, der forudsiges af den foreslåede tilgang, konstruerede vi Multiple sequence alignment (MSA) af de 582 forudsagte ANK-motiver i datasættet af 125 kendte Ankyrin-proteiner ved hjælp af CLUSTALW .Konsensus af de forudsagte ANK-motiver blev derefter opbygget ved hjælp af SeaView ved 50 % identitet og er angivet nedenfor:

XGXTPLHXAXXXGXXXXXXXXXLLXXXAXX

Dette er i meget god overensstemmelse med det konsensus ANK-motiv, der er foreslået af Kohl et al. og Mosavi et al. . Det bevarede tetrapeptidmotiv TPLH på positionerne 4-7, Glycine på positionerne 2 og 13 og Leucine på positionerne 21-22 bekræfter den foreslåede fremgangsmådes forudsigelsesnøjagtighed af gentagelsesgrænserne.

Analyse på proteindatabank

Vi udførte den foreslåede algoritme på den komplette PDB. Der blev downloadet et samlet antal på 98 341 strukturer repræsenteret som proteiner eller proteiner i kompleks med nukleinsyrer. Ved at fjerne korte fragmenter < 50 rester (da disse sandsynligvis ikke indeholder to sammenhængende kopier af ANK-motiver) og proteiner uden tilknyttede sekundære strukturer blev der anvendt i alt 94 975 strukturer til analyse. Den foreslåede algoritme identificerede 819 proteinstrukturer, der indeholdt mindst to tandemvis gentagne ANK-motiver. Heraf er 181 annoteret som kendte ANK-proteiner i UniProt, Pfam, PROSITE og PDB, hvoraf ~ 50 strukturer indeholder designede Ankyrin-repeat-proteiner (DARPINS). Antallet af korrekt forudsagte Ankyrin-repeat-proteiner er 178, og kun 3 blev overset af vores metode, 1SW6 (kæde A), 2ETB (kæde A) og 3ZRH (kæde A). I de to første tilfælde overså den foreslåede fremgangsmåde ikke detekteringen af ANK-motiver, da de UniProt-annoterede gentagelsesregioner indeholder 3-4 helikser, mens et ANK-motiv i henhold til de regler, der er defineret i algoritmen, består af to antiparallelle helikser. I 3ZRH er de to annoterede kopier af ANK-repeats ikke sammenhængende, men adskilt af 23 rester, og derfor blev de overset af vores metode. De resterende 641 strukturer foreslås derfor som tidligere uerkendte Ankyrin-repeats og er opført i Additional file 2. Det bemærkes, at 27 af disse proteiner er annoteret som indeholdende andre gentagelsestyper, nemlig 9 TPR, 7 Pumilio-repeat, 2 HEAT, 2 Annexin-repeat, 2 Tumor necrosis factor receptor (TNFR-Cys), 2 Mitochondrial termination factor repeat (MTERF), 2 Clathrin heavy chain repeat (CHCR) og 1 HAT (Additional file 2). Strukturelt ligner TPR-, HEAT- og HAT-motiverne meget ANK-repeatemotivet, idet de hver især består af to antiparallelle helikser, der danner en Helix-Turn-Helix-kerne, og de har også samme længde, ~ 30-34 rester. Den største forskel er, at ANK-motivet har en lang løkke, der ender i en β-svingning, som ikke findes i TPR-, HEAT- og HAT-motiverne. Selv med en så stor lighed mellem disse strukturelle motiver rapporteres kun 13 falske positive resultater (9 TPR-, 3 HEAT- og 1 HAT-motiver) af vores metode. For at kontrollere pålideligheden af vores forudsigelse i disse proteiner udførte vi struktur-struktur-superposition af den forudsagte ANK-repeterede region med et DARPin-motiv fra 1N0R ved hjælp af Cealign-modulet i Pymol . For eksempel er der i protein 1OUV (kæde A) rapporteret syv kopier af TPR i UniProt-databasen fra 29-278 (Additional file 2), som indeholder 14 helices H 1-H 14 som vist i sekundærstrukturrepræsentationen fra PDBsum i figur 10(a). Overlejringen er god med en gennemsnitlig kvadratisk afvigelse (RMSD) for alle tre forudsagte ANK gentagelsesenheder < 3 Å, som vist i figur 10(b). A levc-profilen i den forudsagte Ankyrin-region fra 185 til 292 i figur 10(c) er også meget lig den for et typisk ANK-motiv i figur 1(a). I dette tilfælde befinder de forudsagte ANK-repeatmotiver sig inden for den TPR-annoterede region, der består af en helix fra hver tilstødende TPR-repeat og kan repræsenteres som H 2 i T i H 1 i + 1, hvor H 2 i er den anden helix af det i-te TPR-motiv og H 1 i + 1 er den første helix af det (i + 1)-te TPR-motiv. Den strukturelle tilpasning af de 7 annoterede TPR-regioner blev udført med et repræsentativt TPR-motiv fra det designede protein 1NA0, og RMSD for hver gentagelsesenhed < 2 Å (resultater ikke vist), hvilket tyder på, at UniProt-annotationen også er korrekt. Det blev imidlertid observeret, at β-svingningen mellem to helikser inden for et TPR-motiv var længere end det typiske designede TPR-motiv og lignede ANK-motivets terminale loop. Dette tyder på, at der er mulighed for en arkitektur med flere gentagelser i komplekse proteiner. For 21 andre gentagne proteiner blev der observeret en lignende multi-repeat-arkitektur. I tilfælde af HEAT-repeatprotein 3LWW (kæde A) er annotationen i UniProt seks kontinuerlige kopier fra 124-441 og to fjerne kopier fra 602-641 og 687-726. Den forudsagte ANK-repetition ligger i den ikke-HEAT-region fra 520-621 med et meget lille overlap på 20 rester med HEAT-repetitionen. I dette tilfælde er der to forskellige gentagelser i forskellige regioner i proteinet, og der blev i alt observeret 10 proteiner, der indeholder to forskellige gentagelsestyper, som ikke overlapper hinanden (markeret med “*” i Additional file 2). For disse proteiner, der udviser en arkitektur med flere gentagelser, ville det være interessant at analysere interaktionsstederne, hvilket ville hjælpe med at bekræfte flere annotationer/funktioner i disse proteiner med kompleks arkitektur. Den strukturbaserede tilgang, der er foreslået her, er således lovende med hensyn til at detektere tandemstrukturelle gentagelser i proteiner og er kraftig nok til at skelne mellem meget ens strukturelle gentagelser, nemlig Ankyrin og TPR/HEAT/HAT.

Figur 10
figur10

Forudsagt Ankyrin gentagelsesprotein 1OUV (kæde A). (a) Sekundærstrukturrepræsentation fra PDBsum (b) Strukturel alignment af forudsagt ANK-repeatkopi (vist i blå farve) med en gentagelseskopi af designet ANK-protein 1N0R (vist i orange) (c) Et levc-plot med stiplede og faste linjer, der viser starten og slutningen af de forudsagte ANK-grænser.

Funktionel analyse af tidligere uerkendte ankyrinproteiner

Vi identificerede 641 tidligere uerkendte Ankyrin-repeat-proteiner ved hjælp af den foreslåede fremgangsmåde. I tabel 4 præsenterer vi vores analyse af 11 af disse proteiner. I alle disse proteiner observerer vi, at de bindingssteder, der er rapporteret i PDBsum, ligger i den forudsagte Ankyrin-repeatregion. F.eks. indeholder DNA-polymerase lambda-proteinet 3HWT (Human), som er vigtigt for DNA-replikationsprocessen, fire domæner. De rapporterede DNA-bindingssteder i 3HWT findes i DNA-polymerase-domænet (257-331) og ligger på den anden helix af begge kopier af de forudsagte Ankyrin-enheder. Tilstedeværelsen af Ankyrin-repeats i DNA-bindingsproteinerne 1SW6 og 3V30, der er annoteret i UniProt, støtter vores forudsigelse og den mulige funktionelle rolle af 3HWT. Denne analyse bidrager til at forstå, hvilken type interaktion 3HWT er involveret i, og en sammenligning med andre proteiner med lignende funktioner kan føre til en bedre forståelse af Ankyrin-repeaternes rolle. Tilsvarende er Ankyrin-repeats’ interaktion med RNA kendt i forbindelse med 1WDY og 4G8K. Vi observerer, at proteinerne 3Q0P, 3K4E og 3V71 har bindingssteder rapporteret i den forudsagte gentagelsesregion med RNA som bindingspartner, hvilket igen giver støtte til vores forudsigelse.

Tabel 4 Eksempelproteiner med bindingssteder i den forudsagte Ankyrin gentagelsesregion

Vi forudsagde Ankyrin gentagelser i to mannosidaseproteinstrukturer, 1FO3 (menneske) og 1KRF (P. citrinum). Kifunensin (KIF) er en inhibitor af mannosidaser og regulerer aktiviteten af disse proteiner. I PDBsum er KIF-bindingsstederne for proteinerne 1FO3 og 1KRF annoteret i det område, der er forudsagt som Ankyrin-repeat ved vores metode. Dette tyder på nye interaktioner mellem disse Ankyrin-repeat-proteiner. Man kunne således foretage en systematisk analyse af andre tidligere ukendte Anyrin-proteiner for at identificere deres interaktionspartnere, hvilket ville føre til en forståelse af deres funktionelle rolle.

Analyse af modellerede Ankyrin-proteiner

Proteinstrukturelle oplysninger øges i et hurtigt tempo med fremskridt i opløsningen af proteinstrukturer, men er stadig ikke sammenlignelige med rigdommen af sekvensinformation. Det kan bemærkes, at ud af over 1200 proteiner, der er annoteret som indeholdende Ankyrin-repeatmotiver i UniProt-databasen, har kun omkring 60 Ankyrin-proteiner strukturelle oplysninger til rådighed. For at vise effektiviteten af vores tilgang til modellerede strukturer har vi modelleret 30 Ankyrin-repeat-proteiner fra UniProt-databasen, for hvilke strukturen endnu ikke er opløst. Strukturerne blev modelleret ved hjælp af Swiss-Model-serveren , som identificerer skabelonstrukturer fra PDB på grundlag af sekvensdækning og sekvensidentitet. De skabeloner, der har høj dækning og sekvensidentitet i gentagelsesområdet, er udvalgt til homologibaseret modellering af disse 30 proteinsekvenser. Den foreslåede algoritme, AnkPred, er udført på de tilsvarende modellerede proteiner, og forudsigelsen af gentagelsesregionerne er angivet i Additional file 3. I figur 11(a) er vist den foreslåede fremgangsmådes forudsigelse af den modellerede struktur af Integrin-linked proteinkinase (UniProt Id: Q99J82), som er i meget god overensstemmelse med annotationen i UniProt. Det kan bemærkes, at i omkring halvdelen af proteinerne (markeret med en asterisk i Additional file 3) var det forudsagte kopiantal steget, idet der blev identificeret terminale gentagelser. Det er kendt, at terminale kopier generelt er mindre konserverede og nogle gange ufuldstændige og derfor overses af sekvensbaserede metoder, men identificeres af vores strukturbaserede metode, som vist for ANKRD (UniProt Id: Q7Z3H0) protein i figur 11(b). Dette tyder på, at vores tilgang er effektiv til at forbedre annotationen af gentagne regioner for proteinsekvenser, for hvilke der ikke foreligger strukturinformationer.

Figur 11
figur11

Forudsigelse på modellerede strukturer vist. (a) Integrin-linked proteinkinase (UniProt Id: Q99J82). Gentagelsesgrænserne for fem Ankyrin-motiver forudsagt af AnkPred (vist med forskellige farver) er i god overensstemmelse med fem annoterede kopier i Uniprot. (b) ANKRD-protein (UniProt Id: Q7Z3H0). I dette tilfælde er kun 3 Ankyrin-motiver annoteret i UniProt (mellemliggende kopier), mens AnkPred forudsiger to yderligere kopier på begge sider.

Analyse af andre strukturelle gentagelser

For at vurdere effektiviteten af den foreslåede fremgangsmåde på andre gentagelsesfamilier af proteiner, præsenterer vi nu vores analyse på fire forskellige gentagelsestyper: Tetratricopeptide repeat (TPR), Armadillo repeat (ARM), Leucine-rich repeat (LRR) og Kelch repeat. Den 3-dimensionelle struktur af et repræsentativt protein fra hver gentagelsestype er vist i figur 12(a)-(d) og deres respektive A levc-profiler i figur 12(e)-(h). Der observeres en unik A levc-profil i de gentagne regioner i hvert af disse proteiner, som er velkonserveret inden for de tilstødende gentagelsesenheder, som det fremgår af overlapningen af A levc-profilen i de gentagelsesenheder i figur 12(i)-(l). De forskellige A levc-profiler for de forskellige gentagelser svarer til den specifikke orientering af de sekundære strukturelle elementer i hver gentagelsestype. Det kan bemærkes, at A levc-profilen for TPR-repetitionen er meget anderledes end for Ankyrin-repetitionen (figur 3(a)), selv om den er af samme længde og har en meget lignende sekundærstrukturarkitektur med en helix-turn-helix-kerne. Dette viser tydeligt styrken af egen spektralanalysen af proteinkontaktnetværket ved identifikation af strukturelle gentagelser og dens følsomhed ved skelnen mellem lignende strukturelle gentagelser.

Figur 12
figur12

Proteiner af andre strukturelle gentagelsesfamilier. (a)-(d) 3-D struktur: (a) 2C2L: kæde A (TPR) (b) 3SL9: kæde A (ARM) (c) 1D0B: kæde A (LRR) (d) 1U6D: kæde X (KELCH). I (e), (f), (g) og (h) er A levc-plottet for de respektive proteiner vist. I (i), (j), (k) og (l) er A levc-profilen for de gentagne regioner i de respektive proteiner overlappet.