Identification des répétitions d’Ankyrine en tandem dans les structures protéiques

Nous présentons ici l’analyse de l’algorithme proposé sur un ensemble représentatif de quinze protéines à répétition ANK (tableau 2). Nous discutons d’abord en détail notre analyse sur une protéine ANK conçue, 1N0R (chaîne A), comprenant quatre répétitions ANK exactes en tandem, comme le montre la figure 2(a), et son réseau de contacts protéiques donné dans la figure 2(b). Les principaux vecteurs propres de la matrice d’adjacence, A levc , pour la protéine ANK 1N0R conçue sont représentés sur la figure 3(a). Un motif répétitif clair dans le profil A levc est observé dans les quatre régions répétées (les lignes verticales pointillées et pleines correspondent aux limites de début et de fin de répétition basées sur la sortie RADAR). Ceci est clairement visible en superposant le profil A levc pour les copies de répétition individuelles dans la Figure 3(b) après normalisation avec le pic le plus important dans chaque copie de répétition. La prédiction est bonne à la fois en termes de nombre de copies et de limites de début et de fin des régions répétées par rapport à l’outil RADAR basé sur la séquence (voir tableau 2), alors que deux copies répétées sont manquées par le programme ConSole basé sur la structure, même dans le cas de la protéine ANK conçue. Les alignements de séquences multiples (MSA) des régions répétées prédites par notre approche, RADAR et ConSole sont présentés dans la Figure 4(a), (b) et (c) respectivement en utilisant CLUSTALW . La MSA des copies individuelles dans les deux cas est très bien conservée et en bon accord.

Tableau 2 Prédiction des régions répétées pour un ensemble représentatif de 15 protéines comparées à l’annotation UniProt, à la sortie de RADAR et de ConSole
Figure 4
figure4

MSA des régions répétées prédites pour 1N0R. (a) prédites par l’approche proposée, (b) sortie RADAR, et (c) sortie ConSole.

Nous considérons ensuite un exemple de protéine naturelle, le facteur 1 de stimulation des ostéoclastes, 3EHQ (chaîne A), qui induit la résorption osseuse. Selon l’annotation dans UniProt, elle contient trois répétitions d’Ankyrine de 72 à 168, comme le montre la structure 3-D par différentes couleurs dans la Figure 5(a). Dans la Figure 5(b) est montré le tracé du profil A levc pour 3EHQ, indiquant clairement la présence de trois unités répétitives dans la région 72-177. Il y a un bon accord entre les limites prédites de début et de fin des trois unités répétées avec l’annotation UniProt (voir tableau 2). Cependant, la prédiction des régions répétées par RADAR et ConSole n’est pas en accord avec l’annotation UniProt. La prédiction de RADAR diffère à la fois en termes de nombre de copies et de limites de répétition, la première répétition étant complètement manquée. ConSole prédit trois copies des répétitions ANK, mais les positions des limites de début et de fin des unités répétées sont décalées d’environ 10 résidus pour chaque copie de répétition. La figure 6 montre les MSA des régions répétées (a) prédites par notre approche, (b) annotées dans la base de données UniProt, et (c) prédites par ConSole. La MSA de la région répétée prédite dans la Figure 6(a) est en très bon accord avec celle des régions répétées annotées dans UniProt (Figure 6(b)), comparée à celle de la région prédite par ConSole dans la Figure 6(c). Les résultats pour un ensemble représentatif de 15 protéines répétées ANK sont résumés dans le tableau 2 avec l’annotation fournie dans la base de données UniProt, et les prédictions par les méthodes basées sur la séquence et la structure, RADAR et ConSole, respectivement. Dans l’ensemble, nous observons un bon accord dans la détection des répétitions d’Ankyrine à la fois dans le nombre de copies ainsi que les frontières de répétition avec l’annotation UniProt et aussi avec ConSole.

Figure 5
figure5

Protéine naturelle de répétition d’Ankyrine 3EHQ (chaîne A). (a) La structure 3d, et (b) les composantes du vecteur propre correspondant à la plus grande valeur propre de la matrice d’adjacence (A levc ).

Figure 6
figure6

MSA des régions répétées dans la protéine 3EHQ. (a) prédites par l’approche proposée, (b) annotées dans la base de données UniProt, et (c) prédites par la sortie ConSole.

Dans le tableau 2, les protéines ont été sélectionnées pour présenter des exemples à la fois de bon accord et de désaccord. Nous discutons ci-dessous quelques exemples dans lesquels notre prédiction diffère de l’annotation dans la base de données UniProt. Par exemple, dans le cas de la protéine 3EU9 (chaîne A), cinq copies des motifs ANK sont annotées dans UniProt de 89-253, alors que notre approche prédit sept copies, une copie supplémentaire de chaque côté de 57-88 et 258-281. D’après la structure 3-D de 3EU9 dans la Figure 7(a) et le profil A levc montré dans la Figure 7(b), il est clair que les répétitions terminales prédites (montrées en rouge) présentent un profil A levc similaire aux cinq répétitions intermédiaires (montrées en gris). L’alignement structurel de ces répétitions terminales prédites avec un motif ANK structurel représentatif (de la protéine conçue 1N0R) en utilisant le module Cealign dans Pymol est montré dans la Figure 7(c) et (d) ; la déviation quadratique moyenne (RMSD) pour chaque copie terminale est inférieure à 1 Å indiquant une grande similarité structurelle avec le motif ANK. Cependant, au niveau de la séquence, ces répétitions terminales ne sont pas bien conservées, comme le montre clairement la MSA des régions prédites dans la Figure 8(a), comparée à celle des régions répétées annotées UniProt dans la Figure 8(b). Avec une copie terminale supplémentaire prédite par ConSole, un total de six copies est prédit par cette dernière, mais les limites des copies de ConSole sont décalées d’environ 10 résidus par rapport à l’annotation UniProt. En général, les répétitions terminales sont moins conservées au niveau de la séquence ou incomplètes, et leur détection n’est pas facile. Dans 52 autres protéines (voir fichier additionnel 1), des copies supplémentaires des répétitions ANK ont été prédites par l’approche proposée, améliorant ainsi l’annotation de la région répétée complète dans ces 53 protéines. Dans 16 de ces cas, une copie supplémentaire est également prédite par ConSole. Pour la protéine 3SO8 (chaîne A, UniProt Id : Q9H9E1), initialement trois répétitions ANK étaient annotées dans la version antérieure d’UniProt (version 2012_08) de 181 à 279, alors que cinq répétitions sont prédites par notre approche à partir des résidus 149 à 310, c’est-à-dire une répétition supplémentaire à chaque extrémité. Dans la récente version de la base de données UniProt (version 2014_05), la protéine est maintenant annotée comme ayant cinq copies du motif ANK de 148-313, ce qui est en accord avec la prédiction de l’approche proposée (tableau 2).

Figure 7
figure7

Protéine naturelle à répétition d’ankyrine 3EU9 (chaîne A). (a) Structure 3-D (b) Tracé du vecteur propre principal de la matrice d’adjacence. (c) – (d) Alignement structurel de la copie répétée d’Ankyrine supplémentaire prédite dans 3EU9 (représentée en couleur bleue) avec une copie répétée de la protéine conçue 1N0R (représentée en couleur rouge).

Figure 8
figure8

MSA des régions répétées dans la protéine 3EU9. (a) prédites par l’approche proposée, et (b) annotées dans la base de données UniProt.

Dans la protéine 1D9S (chaîne A), quatre répétitions ANK sont signalées de 5 à 130 dans la base de données UniProt, mais seulement deux sont identifiées par notre approche de 71 à 129. En analysant l’architecture de la structure secondaire de PDBsum pour 1D9S dans la Figure 9, nous observons que la région 38-66 ne contient qu’une seule hélice assignée à la fois par STRIDE et DSSP, alors qu’un motif ANK comprend deux hélices antiparallèles, ce qui suggère que cette région a pu être annotée de manière erronée dans la base de données UniProt. La région 5-34 est prédite comme motif ANK dans le criblage préliminaire de notre approche, mais elle est écartée dans l’étape de post-traitement alors que l’on rapporte les régions de répétition en tandem contiguës. Une situation similaire a été rencontrée pour 18 autres protéines (voir le fichier supplémentaire 1) où la première répétition dans l’annotation UniProt est initialement prédite par notre algorithme, mais ensuite rejetée parce que la répétition suivante n’est pas identifiée dans un seuil de 17 résidus (demi-longueur d’un motif ANK). Pour toutes ces protéines, à l’exception de 4HBD, une ou plusieurs copies sont manquées par ConSole par rapport à l’annotation UniProt (voir fichier additionnel 1). Il est possible que dans toutes ces protéines le motif ANK manquant soit muté au-delà de la reconnaissance même au niveau de la structure ou qu’il y ait une délétion de l’hélice. Ainsi, nous voyons que les spectres propres de la matrice d’adjacence capturent très bien le modèle de pliage répétitif du motif ANK et qu’en incorporant les informations sur la structure secondaire et la variation de leurs longueurs, une prédiction précise des limites des répétitions est possible (tableau 2). Cependant, s’il y a une erreur dans l’assignation de la structure secondaire, la prédiction de l’algorithme proposé est affectée.

Figure 9
figure9

Représentation de la structure secondaire de la protéine répétée Ankyrine 1D9S (chaîne A) à partir de PDBsum.

Performance de l’algorithme proposé

Premièrement, nous discutons de la précision de prédiction des motifs ANK avec l’annotation UniProt sur un ensemble connu de 370 protéines comprenant un ensemble de test positif de 125 protéines à répétition d’Ankyrine et un ensemble de test négatif de 245 protéines non-solénoïdes. Les résultats sont résumés dans le tableau 3 (a), où la sensibilité et la spécificité de l’algorithme sont calculées comme suit :

Sensibilité= T P T P + F N ≃0.976
Spécificité= T N T N + F P ≃1
Tableau 3 Performance de l’approche proposée

où TP correspond au nombre de protéines à répétition d’Ankyrine connues correctement prédites, FN – le nombre de protéines à répétition d’Ankyrine connues manquées par notre approche, FP – le nombre de protéines prédites par notre approche comme contenant des répétitions ANK en tandem mais non annotées comme protéine d’Ankyrine, et TN – le nombre de protéines correctement prédites par notre approche comme protéines non-Ankyrine. Comme il n’y a eu que trois faux négatifs (FN), 1SW6, 2ETB et 3ZRH, et aucun faux positif (FP), la sensibilité et la spécificité de l’algorithme sont très élevées (≃1).

Puis, pour les protéines Ankyrine prédites, nous analysons le nombre de motifs ANK correctement prédits dans le jeu de données de 125 protéines à répétition Ankyrine connues et comparons avec une approche récente basée sur la structure, ConSole, et une approche basée sur la séquence RADAR. Dans la base de données UniProt, un total de 584 motifs ANK sont annotés dans ces 125 protéines, tandis que 582 motifs ANK sont prédits par l’approche proposée, 528 par ConSole et 458 par RADAR. Les détails de l’analyse sont résumés dans le tableau 3(b) en termes de sensibilité et de précision, définies comme :

Sensibilité= T P T P + F N
Précision= T P T P + F P

où, TP est le nombre de motifs ANK correctement prédits par la méthode dans un ensemble de données connu de 125 protéines, FP est le nombre de motifs ANK prédits par la méthode mais non annotés dans la base de données UniProt, et FN est le nombre de motifs ANK annotés manqués par la méthode. On peut observer que la sensibilité et la précision de l’approche proposée, AnkPred, sont toutes deux de ~ 0,88, ce qui est raisonnablement bon comparé à celles de ConSole (0,72 et 0,79) et de RADAR (0,68 et 0,86) respectivement. Les copies terminales sont connues pour avoir une faible conservation de la séquence, ce qui entraîne une sensibilité plus faible de la méthode RADAR. Nous reconnaissons que la sensibilité de notre algorithme, avec sa dépendance à l’affectation de la structure secondaire, pourrait être encore améliorée.

Pour analyser la précision des limites de répétition prédites par l’approche proposée, nous avons construit l’alignement de séquences multiples (MSA) des 582 motifs ANK prédits dans le jeu de données de 125 protéines d’Ankyrine connues en utilisant CLUSTALW .Le consensus des motifs ANK prédits a ensuite été construit en utilisant SeaView à 50% d’identité et est donné ci-dessous :

XGXTPLHXAXXXGXXXXXXXLLXXXAXX

Ceci est en très bon accord avec le motif ANK consensuel proposé par Kohl et al et Mosavi et al . Le motif tétrapeptidique conservé TPLH aux positions 4-7, Glycine aux positions 2 et 13, et Leucine aux positions 21-22 confirme la précision de prédiction des limites de répétition par l’approche proposée.

Analyse sur la banque de données des protéines

Nous avons effectué l’algorithme proposé sur la PDB complète. Un nombre total de 98 341 structures représentées comme des protéines ou des protéines en complexe avec des acides nucléiques ont été téléchargées. Après avoir éliminé les fragments courts < 50 résidus (car il est peu probable qu’ils contiennent deux copies contiguës de motifs ANK) et les protéines auxquelles aucune structure secondaire n’a été attribuée, un total de 94 975 structures a été utilisé pour l’analyse. L’algorithme proposé a identifié 819 structures protéiques contenant au moins deux motifs ANK répétés en tandem. Parmi celles-ci, 181 sont annotées comme des protéines ANK connues dans UniProt, Pfam, PROSITE et PDB, dont environ 50 structures contiennent des protéines à répétition d’Ankyrine conçues (DARPINS). Le nombre de protéines à répétition d’Ankyrine correctement prédites est de 178 et seulement 3 ont été manquées par notre approche, 1SW6 (chaîne A), 2ETB (chaîne A) et 3ZRH (chaîne A). Dans les deux premiers cas, l’approche proposée a manqué la détection des motifs ANK car les régions répétées annotées UniProt contiennent 3-4 hélices alors que selon les règles définies dans l’algorithme, un motif ANK comprend deux hélices antiparallèles. Dans 3ZRH, les deux copies annotées des répétitions ANK ne sont pas contiguës mais séparées par 23 résidus, et donc manquées par notre approche. Ainsi, les 641 structures restantes sont proposées comme des répétitions d’Ankyrine non reconnues auparavant et sont listées dans le fichier additionnel 2. On observe que 27 de ces protéines sont annotées comme contenant d’autres types de répétitions, à savoir, 9 TPR, 7 répétitions Pumilio, 2 HEAT, 2 répétitions Annexin, 2 récepteurs du facteur de nécrose tumorale (TNFR-Cys), 2 répétitions du facteur de terminaison mitochondrial (MTERF), 2 répétitions de la chaîne lourde de la Clathrine (CHCR) et 1 HAT (fichier additionnel 2). Structurellement, les motifs TPR, HEAT et HAT sont très similaires au motif répété ANK, chacun d’entre eux comprenant deux hélices antiparallèles formant un noyau Helix-Turn-Helix et sont également de longueurs similaires, ~ 30-34 résidus. La principale différence est que le motif ANK possède une longue boucle se terminant par un virage β qui n’est pas présent dans les motifs TPR, HEAT et HAT. Même avec une telle similarité entre ces motifs structurels, seuls 13 faux positifs (9 TPR, 3 HEAT et 1 HAT) sont signalés par notre approche. Pour vérifier la fiabilité de notre prédiction dans ces protéines, nous avons effectué une superposition structure-structure de la région répétée ANK prédite avec un motif DARPin de 1N0R en utilisant le module Cealign de Pymol . Par exemple, dans la protéine 1OUV (chaîne A), sept copies de TPR sont rapportées dans la base de données UniProt de 29 à 278 (fichier additionnel 2) contenant 14 hélices H 1-H 14 comme le montre la représentation de la structure secondaire de PDBsum dans la Figure 10(a). La superposition est bonne avec un écart quadratique moyen (RMSD) pour les trois unités de répétitions ANK prédites < 3 Å comme le montre la Figure 10(b). Le profil A levc dans la région prédite de l’Ankyrine de 185 à 292 dans la Figure 10(c) est également très similaire à celui d’un motif ANK typique dans la Figure 1(a). Dans ce cas, les motifs répétés ANK prédits se trouvent dans la région annotée TPR, composée d’une hélice de chaque répétition TPR adjacente et peut être représentée par H 2 i T i H 1 i + 1 où H 2 i est la deuxième hélice du i-ème motif TPR et H 1 i + 1 est la première hélice du (i + 1)-ème motif TPR. L’alignement structurel des 7 régions TPR annotées a été effectué avec un motif TPR représentatif de la protéine conçue 1NA0 et RMSD pour chaque unité de répétition < 2 Å (résultats non montrés) suggérant que l’annotation UniProt est également correcte. Cependant, le tour β entre deux hélices dans un motif TPR a été observé comme étant plus long que celui du motif TPR conçu typique et ressemblant à la boucle terminale du motif ANK. Cela suggère la possibilité d’une architecture multirépétitive dans les protéines complexes. Pour 21 autres protéines répétées, une architecture multirépétitive similaire a été observée. Dans le cas de la protéine répétée HEAT 3LWW (chaîne A), l’annotation dans UniProt est six copies continues de 124-441 et deux copies distantes de 602-641 et 687-726. La répétition ANK prédite se trouve dans la région non-HEAT de 520-621 avec un très petit chevauchement de 20 résidus avec la répétition HEAT. Dans ce cas, deux répétitions différentes sont présentes dans des régions différentes de la protéine et un total de 10 protéines contenant deux types de répétition différents ne se chevauchant pas a été observé (marqué ‘*’ dans le fichier supplémentaire 2). Pour ces protéines qui présentent une architecture à plusieurs répétitions, il serait intéressant d’analyser les sites d’interaction, ce qui aiderait à confirmer les multiples annotations/fonctions de ces protéines à l’architecture complexe. Ainsi, l’approche basée sur la structure proposée ici est prometteuse pour détecter les répétitions structurelles en tandem dans les protéines et est suffisamment puissante pour distinguer des répétitions structurelles très similaires, à savoir l’Ankyrine et le TPR/HEAT/HAT.

Figure 10
figure10

Protéine à répétition d’Ankyrine prédite 1OUV (chaîne A). (a) Représentation de la structure secondaire à partir de PDBsum (b) Alignement structurel de la copie répétée ANK prédite (représentée en couleur bleue) avec une copie répétée de la protéine ANK conçue 1N0R (représentée en orange) (c) Un tracé de levc avec des lignes pointillées et solides montrant le début et la fin des frontières ANK prédites.

Analyse fonctionnelle des protéines d’ankyrine précédemment non reconnues

Nous avons identifié 641 protéines à répétition d’Ankyrine précédemment non reconnues par l’approche proposée. Dans le tableau 4, nous présentons notre analyse de 11 de ces protéines. Dans toutes ces protéines, nous observons que les sites de liaison rapportés dans PDBsum se trouvent dans la région prédite de la répétition d’Ankyrine. Par exemple, la protéine 3HWT (humaine) de l’ADN polymérase lambda, qui est importante pour le processus de réplication de l’ADN, contient quatre domaines. Les sites de liaison à l’ADN signalés dans 3HWT sont présents dans le domaine de l’ADN polymérase (257-331) et se trouvent sur la deuxième hélice des deux copies des unités d’Ankyrine prédites. La présence de répétitions d’Ankyrine dans les protéines de liaison à l’ADN, 1SW6 et 3V30, annotées dans UniProt, soutient notre prédiction et le rôle fonctionnel possible de 3HWT. Cette analyse aide à comprendre le type d’interaction dans lequel 3HWT est impliqué et la comparaison avec d’autres protéines ayant des fonctions similaires peut conduire à une meilleure compréhension du rôle des répétitions d’Ankyrine. De même, l’interaction des répétitions d’Ankyrine avec l’ARN est connue dans le cas de 1WDY et 4G8K. Nous observons que les protéines 3Q0P, 3K4E et 3V71 ont des sites de liaison signalés dans la région répétée prédite avec l’ARN comme partenaire de liaison, ce qui apporte à nouveau un soutien à notre prédiction.

Tableau 4 Exemples de protéines avec des sites de liaison dans la région répétée d’Ankyrine prédite

Nous avons prédit des répétitions d’Ankyrine dans deux structures de protéines mannosidases, 1FO3 (humain) et 1KRF (P. citrinum). La kifunensine (KIF) est l’inhibiteur des mannosidases et régule l’activité de ces protéines. Dans PDBsum, les sites de liaison de KIF pour les protéines 1FO3 et 1KRF sont annotés dans la région prédite comme Ankyrine répétée par notre approche. Ceci suggère de nouvelles interactions de ces protéines à répétition Ankyrine. Ainsi, on pourrait effectuer une analyse systématique d’autres protéines Anyrin non reconnues auparavant pour identifier leurs partenaires d’interaction, conduisant à une compréhension de leur rôle fonctionnel.

Analyse des protéines ankyrines modélisées

Les informations structurelles des protéines augmentent à un rythme rapide avec les progrès dans la résolution des structures protéiques, mais ne sont toujours pas comparables à la richesse des informations de séquence. On peut noter que sur plus de 1200 protéines annotées comme contenant des motifs répétés d’Ankyrine dans la base de données UniProt, seulement environ 60 protéines d’Ankyrine ont des informations structurelles disponibles. Pour montrer l’efficacité de notre approche sur les structures modélisées, nous avons modélisé 30 protéines à répétition d’Ankyrine de la base de données UniProt pour lesquelles la structure n’est pas encore résolue. Les structures ont été modélisées à l’aide du serveur Swiss-Model, qui identifie les structures modèles de la base de données PDB en fonction de la couverture et de l’identité des séquences. Les modèles ayant une couverture et une identité de séquence élevées dans la région répétée sont sélectionnés pour la modélisation basée sur l’homologie de ces 30 séquences de protéines. L’algorithme proposé, AnkPred, est exécuté sur les protéines modélisées correspondantes et la prédiction des régions répétées est donnée dans le fichier supplémentaire 3. La figure 11(a) montre la prédiction de l’approche proposée sur la structure modélisée de la protéine kinase liée à l’intégrine (UniProt Id : Q99J82), qui est en très bon accord avec l’annotation dans UniProt. On peut noter que dans environ la moitié des protéines (marquées par un astérisque dans le fichier supplémentaire 3), le nombre de copies prédit avait augmenté, avec des répétitions terminales identifiées. Il est connu que les copies terminales sont généralement moins conservées et parfois incomplètes, et donc manquées par les méthodes basées sur la séquence, mais elles sont identifiées par notre méthode basée sur la structure, comme le montre la figure 11(b) pour la protéine ANKRD (UniProt Id : Q7Z3H0). Cela suggère la puissance de notre approche pour améliorer l’annotation des régions répétées pour les séquences de protéines pour lesquelles aucune information de structure n’est disponible.

Figure 11
figure11

Prédiction sur les structures modélisées présentées. (a) Protéine kinase liée à l’intégrine (UniProt Id : Q99J82). Les limites de répétition de cinq motifs d’Ankyrine prédits par AnkPred (indiqués dans des couleurs différentes) sont en bon accord avec cinq copies annotées dans Uniprot. (b) La protéine ANKRD (UniProt Id : Q7Z3H0). Dans ce cas, seuls 3 motifs Ankyrine sont annotés dans UniProt (copies intermédiaires) alors qu’AnkPred prédit deux copies supplémentaires de part et d’autre.

Analyse d’autres répétitions structurelles

Pour évaluer l’efficacité de l’approche proposée sur d’autres familles de répétitions protéiques, nous présentons ensuite notre analyse sur quatre types de répétitions différents : La répétition tétricopeptidique (TPR), la répétition Armadillo (ARM), la répétition riche en leucine (LRR) et la répétition Kelch. La structure tridimensionnelle d’une protéine représentative de chaque type de répétition est présentée dans la figure 12(a)-(d) et leurs profils A levc respectifs dans la figure 12(e)-(h). Un profil A levc unique est observé dans les régions répétées de chacune de ces protéines, qui sont bien conservées dans les unités répétées adjacentes, comme le montre la superposition du profil A levc dans les unités répétées de la figure 12(i)-(l). Les profils A levc distincts pour les différentes répétitions correspondent à l’orientation spécifique des éléments de structure secondaire dans chaque type de répétition. On peut noter que le profil A levc de la répétition TPR est très distinct de celui de la répétition Ankyrine (Figure 3(a)), bien qu’il soit de longueur similaire et présente une architecture de structure secondaire très semblable avec un noyau hélice-tour-hélice. Cela montre clairement la puissance de l’analyse des spectres propres du réseau de contact des protéines dans l’identification des répétitions structurelles et sa sensibilité dans la distinction des répétitions structurelles similaires.

Figure 12
figure12

Protéines d’autres familles de répétitions structurelles. (a)-(d) Structure 3-D : (a) 2C2L : chaîne A (TPR) (b) 3SL9 : chaîne A (ARM) (c) 1D0B : chaîne A (LRR) (d) 1U6D : chaîne X (KELCH). Dans (e), (f), (g) et (h), le tracé du levc A pour les protéines respectives est montré. En (i), (j), (k) et (l) le profil A levc des régions répétées dans les protéines respectives sont superposées.

.