Identificación de repeticiones de Ankyrin en tándem en estructuras de proteínas

Aquí presentamos el análisis del algoritmo propuesto en un conjunto representativo de quince proteínas de repetición ANK (Tabla 2). Primero discutimos en detalle nuestro análisis sobre una proteína ANK diseñada, 1N0R (cadena A), que comprende cuatro repeticiones ANK exactas en tándem como se muestra en la Figura 2(a) y su red de contactos de proteínas dada en la Figura 2(b). Los vectores propios principales de la matriz de adyacencia, A levc , para la proteína ANK diseñada 1N0R se representan en la Figura 3(a). Se observa un claro patrón repetitivo en el perfil de A levc en las cuatro regiones de repetición (las líneas verticales discontinuas y sólidas corresponden a los límites de repetición de principio a fin basados en la salida del RADAR). Esto se ve claramente al superponer el perfil de A levc para las copias repetidas individuales en la Figura 3(b) después de normalizar con el pico más grande de cada copia repetida. La predicción es buena tanto en lo que respecta al número de copias como a los límites de inicio y fin de las regiones de repetición en comparación con la herramienta basada en la secuencia RADAR (véase la Tabla 2), mientras que el programa basado en la estructura ConSole pasa por alto dos copias de repetición, incluso en el caso de la proteína ANK diseñada. Las alineaciones de secuencias múltiples (MSA) de las regiones de repetición predichas por nuestro enfoque, RADAR y ConSole se muestran en la Figura 4(a), (b) y (c) respectivamente utilizando CLUSTALW . El MSA de las copias individuales en ambos casos está muy bien conservado y en buen acuerdo.

Tabla 2 Predicción de regiones de repetición para un conjunto representativo de 15 proteínas comparado con la anotación de UniProt, RADAR y la salida de ConSole
Figura 4
figura4

MSA de las regiones de repetición predichas para 1N0R. (a) predicho por el enfoque propuesto, (b) resultado de RADAR, y (c) resultado de ConSole.

A continuación consideramos un ejemplo de una proteína natural, el factor estimulante de osteoclastos 1, 3EHQ (cadena A), que induce la resorción ósea. Según la anotación en UniProt, contiene tres repeticiones de Ankyrin del 72 al 168, como se muestra en la estructura tridimensional con diferentes colores en la Figura 5(a). En la Figura 5(b) se muestra el gráfico del perfil A levc para 3EHQ, indicando claramente la presencia de tres unidades de repetición en la región 72-177. Hay una buena concordancia entre los límites iniciales y finales predichos de las tres unidades de repetición con la anotación de UniProt (véase la Tabla 2). Sin embargo, la predicción de las regiones de repetición realizada por RADAR y ConSole no coincide con la anotación de UniProt. La predicción de RADAR difiere tanto en el número de copias como en los límites de las repeticiones, y la primera repetición se omite por completo. ConSole predice tres copias de las repeticiones de ANK, pero las posiciones de los límites de los extremos iniciales de las unidades de repetición están desviadas en unos 10 residuos para cada copia de la repetición. En la Figura 6 se muestra el MSA de las regiones de repetición (a) predichas por nuestro enfoque, (b) anotadas en la base de datos UniProt, y (c) predichas por ConSole. El MSA de la región de repetición predicha en la Figura 6(a) concuerda muy bien con el de las regiones de repetición anotadas en UniProt (Figura 6(b)), en comparación con el de la región predicha por ConSole en la Figura 6(c). Los resultados para un conjunto representativo de 15 proteínas de repetición ANK se resumen en la Tabla 2 junto con la anotación proporcionada en la base de datos UniProt, y las predicciones por métodos basados en la secuencia y la estructura, RADAR y ConSole, respectivamente. En general, observamos una buena concordancia en la detección de las repeticiones de Ankyrin tanto en el número de copias como en los límites de las repeticiones con la anotación de UniProt y también con ConSole.

Figura 5
figura5

Proteína natural de repetición de Ankyrin 3EHQ (cadena A). (a) La estructura 3d, y (b) los componentes del vector propio correspondiente al mayor valor propio de la matriz de adyacencia (A levc ).

Figura 6
figura6

MSA de las regiones de repetición en la proteína 3EHQ. (a) predicha por el enfoque propuesto, (b) anotada en la base de datos UniProt, y (c) predicha por la salida de ConSole.

En la Tabla 2 se han seleccionado las proteínas para presentar ejemplos tanto de buen acuerdo como de desacuerdo. A continuación discutimos algunos ejemplos en los que nuestra predicción difiere de la anotación en la base de datos UniProt. Por ejemplo, en el caso de la proteína 3EU9 (cadena A), en UniProt se anotan cinco copias de motivos ANK de 89 a 253, mientras que nuestro enfoque predice siete copias, una copia extra a cada lado de 57-88 y 258-281. A partir de la estructura tridimensional de 3EU9 en la Figura 7(a) y del perfil A levc mostrado en la Figura 7(b), está claro que las repeticiones terminales predichas (mostradas en rojo) muestran un perfil A levc similar al de las cinco repeticiones intermedias (mostradas en gris). La alineación estructural de estas repeticiones terminales predichas con un motivo estructural ANK representativo (de la proteína diseñada 1N0R) utilizando el módulo Cealign en Pymol se muestra en la Figura 7(c) y (d); la desviación media cuadrática (RMSD) para cada copia terminal es inferior a 1 Å, lo que indica una alta similitud estructural con el motivo ANK. Sin embargo, a nivel de secuencia, estas repeticiones terminales no están bien conservadas, como se desprende del MSA de las regiones predichas en la Figura 8(a), comparado con el de las regiones de repetición anotadas en UniProt en la Figura 8(b). Con una copia terminal adicional predicha por ConSole, se predice un total de seis copias, pero los límites de las copias de ConSole están desplazados unos 10 residuos en comparación con la anotación de UniProt. En general, las repeticiones terminales están menos conservadas a nivel de secuencia o son incompletas, y su detección no es fácil. En otras 52 proteínas (véase el archivo adicional 1), se han predicho copias adicionales de las repeticiones ANK mediante el enfoque propuesto, mejorando así la anotación de la región de repetición completa en estas 53 proteínas. En 16 de estos casos, una copia adicional también es predicha por ConSole. En el caso de la proteína 3SO8 (cadena A, Id. de UniProt: Q9H9E1), inicialmente se anotaron tres repeticiones ANK en la versión anterior de UniProt (versión 2012_08) a partir de 181-279, mientras que nuestro enfoque predice cinco repeticiones a partir del residuo 149-310, es decir, una repetición extra en cada extremo. En la reciente publicación de la base de datos UniProt (publicación 2014_05), la proteína está ahora anotada con cinco copias del motivo ANK desde 148-313, lo que está de acuerdo con la predicción del enfoque propuesto (Tabla 2).

Figura 7
figura7

Proteína natural de repetición de anquirina 3EU9 (cadena A). (a) Estructura tridimensional (b) Trazado del vector propio principal de la matriz de adyacencia. (c) – (d) Alineamiento estructural de la copia de la repetición de anquirina extra predicha en 3EU9 (mostrada en color azul) con una copia de la repetición de la proteína diseñada 1N0R (mostrada en color rojo).

Figura 8
figura8

MSA de las regiones de repetición en la proteína 3EU9. (a) predicho por el enfoque propuesto, y (b) anotado en la base de datos UniProt.

En la proteína 1D9S (cadena A), se reportan cuatro repeticiones ANK de 5-130 en la base de datos UniProt pero sólo dos son identificadas por nuestro enfoque de 71-129. Al analizar la arquitectura de la estructura secundaria de PDBsum para 1D9S en la Figura 9, observamos que la región 38-66 contiene sólo una hélice asignada tanto por STRIDE como por DSSP , mientras que un motivo ANK consta de dos hélices antiparalelas, lo que sugiere que esta región puede haber sido anotada erróneamente en la base de datos UniProt. La región 5-34 se predice como motivo ANK en el cribado preliminar de nuestro enfoque, pero se descarta en el paso de posprocesamiento mientras se informa de las regiones de repetición en tándem contiguas. Una situación similar se encontró en otras 18 proteínas (véase el archivo adicional 1) en las que la primera repetición en la anotación de UniProt es inicialmente predicha por nuestro algoritmo, pero posteriormente se descarta porque la siguiente repetición no se identifica dentro de un umbral de 17 residuos (la mitad de la longitud de un motivo ANK). En todas estas proteínas, excepto en la 4HBD, ConSole pasa por alto una o más copias en comparación con la anotación de UniProt (véase el archivo adicional 1). Es posible que en todas estas proteínas el motivo ANK faltante esté mutado más allá del reconocimiento incluso a nivel de estructura o que haya una supresión de hélice. Así, vemos que los espectros eigen de la matriz de adyacencia capturan muy bien el patrón de pliegues repetitivos del motivo ANK y, al incorporar la información de la estructura secundaria y la variación de sus longitudes, es posible una predicción precisa de los límites de las repeticiones (Tabla 2). Sin embargo, si hay un error en la asignación de la estructura secundaria, la predicción del algoritmo propuesto se ve afectada.

Figura 9
figura9

Representación de la estructura secundaria de la proteína de repetición Ankyrin 1D9S (cadena A) a partir de PDBsum.

Rendimiento del algoritmo propuesto

En primer lugar, discutimos la precisión de la predicción de los motivos ANK con la anotación de UniProt en un conjunto conocido de 370 proteínas que comprende un conjunto de prueba positivo de 125 proteínas de repetición de anquirina y un conjunto de prueba negativo de 245 proteínas no solenoides. Los resultados se resumen en la Tabla 3 (a), donde la sensibilidad y la especificidad del algoritmo se calculan como sigue:

Sensibilidad= T P T P + F N ≃0.976
Especificidad= T N T N + F P ≃1
Tabla 3 Rendimiento del enfoque propuesto

donde TP corresponde al número de proteínas de repetición de Ankyrin conocidas predichas correctamente, FN – el número de proteínas de repetición de Ankirina conocidas que no fueron detectadas por nuestro enfoque, FP – el número de proteínas predichas por nuestro enfoque que contienen repeticiones de ANK en tándem pero que no fueron anotadas como proteínas de Ankirina, y TN – el número de proteínas correctamente predichas por nuestro enfoque como proteínas que no son de Ankirina. Como sólo hubo tres falsos negativos (FN), 1SW6, 2ETB y 3ZRH, y ningún falso positivo (FP), la sensibilidad y especificidad del algoritmo es muy alta (≃1).

A continuación, para las proteínas Ankyrin predichas, analizamos el número de motivos ANK correctamente predichos en el conjunto de datos de 125 proteínas de repetición Ankyrin conocidas y comparamos con un enfoque reciente basado en la estructura, ConSole, y un enfoque basado en la secuencia RADAR. En la base de datos UniProt, un total de 584 motivos ANK están anotados en estas 125 proteínas, mientras que 582 motivos ANK son predichos por el enfoque propuesto, 528 por ConSole y 458 por RADAR. Los detalles del análisis se resumen en la Tabla 3(b) en términos de sensibilidad y precisión, definidos como:

Sensibilidad= T P T P + F N
Precisión= T P T P + F P

donde, TP es el número de motivos ANK correctamente predichos por el método en el conjunto de datos conocido de 125 proteínas, FP es el número de motivos ANK predichos por el método pero no anotados en la base de datos UniProt, y FN es el número de motivos ANK anotados que el método no detectó. Se puede observar que tanto la sensibilidad como la precisión del enfoque propuesto, AnkPred, es de ~ 0,88, razonablemente buena comparada con la de ConSole (0,72 y 0,79) y RADAR (0,68 y 0,86) respectivamente. Se sabe que las copias terminales tienen una baja conservación de la secuencia, lo que hace que la sensibilidad del método RADAR sea menor. Reconocemos que la sensibilidad de nuestro algoritmo, con su dependencia de la asignación de la estructura secundaria, podría mejorarse aún más.

Para analizar la precisión de los límites de repetición predichos por el enfoque propuesto, construimos la alineación de secuencias múltiples (MSA) de los 582 motivos ANK predichos en el conjunto de datos de 125 proteínas Ankyrin conocidas utilizando CLUSTALW .El consenso de los motivos ANK predichos se construyó entonces utilizando SeaView con un 50% de identidad y se indica a continuación:

XGXTPLHXAXXXGXXXXXLLXXXAXX

Esto concuerda muy bien con el motivo ANK de consenso propuesto por Kohl et al. y Mosavi et al. . El motivo tetrapéptido conservado TPLH en las posiciones 4-7, Glicina en las posiciones 2 y 13, y Leucina en las posiciones 21-22 confirma la precisión de la predicción de los límites de la repetición por el enfoque propuesto.

Análisis en el banco de datos de proteínas

Realizamos el algoritmo propuesto en el PDB completo. Se descargó un número total de 98.341 estructuras representadas como proteínas o proteínas en complejo con ácidos nucleicos. Al eliminar los fragmentos cortos < 50 residuos (ya que es poco probable que contengan dos copias contiguas de motivos ANK) y las proteínas sin estructuras secundarias asignadas, se utilizó un total de 94.975 estructuras para el análisis. El algoritmo propuesto identificó 819 estructuras de proteínas que contenían al menos dos motivos ANK repetidos en tándem. De ellas, 181 están anotadas como proteínas ANK conocidas en UniProt, Pfam, PROSITE y PDB, de las cuales ~ 50 estructuras contienen proteínas de repetición de Ankyrin diseñadas (DARPINS). El número de proteínas de repetición de ankirina predichas correctamente es de 178 y sólo 3 fueron omitidas por nuestro enfoque, 1SW6 (cadena A), 2ETB (cadena A) y 3ZRH (cadena A). En los dos primeros casos, el enfoque propuesto no detectó los motivos ANK, ya que las regiones de repetición anotadas en UniProt contienen 3-4 hélices, mientras que, según las reglas definidas en el algoritmo, un motivo ANK consta de dos hélices antiparalelas. En 3ZRH, las dos copias anotadas de las repeticiones ANK no son contiguas, sino que están separadas por 23 residuos, por lo que nuestro enfoque no las detectó. Así pues, las 641 estructuras restantes se proponen como repeticiones de ankirina no reconocidas anteriormente y se enumeran en el archivo adicional 2. Se observa que 27 de estas proteínas están anotadas como conteniendo otros tipos de repetición, a saber, 9 TPR, 7 repeticiones Pumilio, 2 HEAT, 2 repeticiones Annexin, 2 receptores del factor de necrosis tumoral (TNFR-Cys), 2 repeticiones del factor de terminación mitocondrial (MTERF), 2 repeticiones de la cadena pesada de Clathrin (CHCR) y 1 HAT (archivo adicional 2). Estructuralmente, los motivos TPR, HEAT y HAT son muy similares al motivo de repetición ANK, cada uno de ellos comprende dos hélices antiparalelas que forman un núcleo de hélice-giro-hélice y también tienen longitudes similares, ~ 30-34 residuos. La principal diferencia es que el motivo ANK tiene un bucle largo que termina en un giro β que no está presente en los motivos TPR, HEAT y HAT. A pesar de la gran similitud entre estos motivos estructurales, nuestro enfoque sólo ha detectado 13 falsos positivos (9 TPR, 3 HEAT y 1 HAT). Para comprobar la fiabilidad de nuestra predicción en estas proteínas, llevamos a cabo la superposición estructura-estructura de la región de repetición ANK predicha con un motivo DARPin de 1N0R utilizando el módulo Cealign en Pymol . Por ejemplo, en la proteína 1OUV (cadena A), se reportan siete copias de TPR en la base de datos UniProt de 29-278 (archivo adicional 2) que contienen 14 hélices H 1-H 14 como se muestra en la representación de la estructura secundaria de PDBsum en la Figura 10(a). La superposición es buena con una desviación media cuadrática (RMSD) para las tres unidades de repetición ANK predichas < 3 Å como se muestra en la Figura 10(b). El perfil de A levc en la región predicha de Ankyrin de 185 a 292 en la Figura 10(c) es también muy similar al de un motivo ANK típico en la Figura 1(a). En este caso, los motivos de repetición ANK predichos están dentro de la región anotada TPR, compuesta por una hélice de cada repetición TPR adyacente y puede representarse como H 2 i T i H 1 i + 1, donde H 2 i es la segunda hélice del motivo TPR i y H 1 i + 1 es la primera hélice del motivo TPR (i + 1). La alineación estructural de las 7 regiones TPR anotadas se realizó con un motivo TPR representativo de la proteína diseñada 1NA0 y el RMSD para cada unidad de repetición < 2 Å (resultados no mostrados) sugiriendo que la anotación de UniProt también es correcta. Sin embargo, se observó que el giro β entre dos hélices dentro de un motivo TPR es más largo que el del típico motivo TPR diseñado y se asemeja al bucle terminal del motivo ANK. Esto sugiere la posibilidad de una arquitectura multirepetida en proteínas complejas. En el caso de otras 21 proteínas de repetición, se observó una arquitectura multirepetida similar. En el caso de la proteína de repetición HEAT 3LWW (cadena A), la anotación en UniProt es de seis copias continuas de 124-441 y dos copias distantes de 602-641 y 687-726. La repetición ANK predicha se encuentra en la región no HEAT de 520-621 con un solapamiento muy pequeño de 20 residuos con la repetición HEAT. En este caso, dos repeticiones diferentes están presentes en diferentes regiones de la proteína y se observó un total de 10 proteínas que contenían dos tipos de repeticiones diferentes que no se solapaban entre sí (marcadas con un ‘*’ en el archivo adicional 2). En el caso de estas proteínas que presentan una arquitectura de repeticiones múltiples, sería interesante analizar los sitios de interacción, lo que ayudaría a confirmar múltiples anotaciones/funciones en estas proteínas con una arquitectura compleja. Por lo tanto, el enfoque basado en la estructura propuesto aquí es prometedor en la detección de repeticiones estructurales en tándem en las proteínas y es lo suficientemente potente como para distinguir entre repeticiones estructurales muy similares, a saber, Ankyrin y TPR/HEAT/HAT.

Figura 10
figura10

Previsión de la proteína de repetición Ankyrin 1OUV (cadena A). (a) Representación de la estructura secundaria a partir de PDBsum (b) Alineación estructural de la copia de la repetición ANK predicha (mostrada en color azul) con una copia de la repetición de la proteína ANK diseñada 1N0R (mostrada en color naranja) (c) Un gráfico levc con líneas punteadas y sólidas que muestran el inicio y el final de los límites de la ANK predicha.

Análisis funcional de proteínas de ankirina no reconocidas previamente

Hemos identificado 641 proteínas de repetición de ankirina no reconocidas previamente mediante el enfoque propuesto. En la Tabla 4, presentamos nuestro análisis de 11 de estas proteínas. En todas estas proteínas, observamos que los sitios de unión reportados en PDBsum se encuentran en la región de repetición de Ankyrin predicha. Por ejemplo, la proteína ADN polimerasa lambda 3HWT (humana), que es importante para el proceso de replicación del ADN, contiene cuatro dominios. Los sitios de unión al ADN reportados en la 3HWT están presentes en el dominio de la ADN polimerasa (257-331) y se encuentran en la segunda hélice de las dos copias de las unidades de Anquirina predichas. La presencia de repeticiones de Ankyrin en las proteínas de unión al ADN, 1SW6 y 3V30, anotadas en UniProt proporciona apoyo a nuestra predicción y al posible papel funcional de 3HWT. Este análisis ayuda a comprender el tipo de interacción en la que participa la 3HWT y la comparación con otras proteínas con funciones similares puede conducir a una mejor comprensión del papel de las repeticiones de anquirina. Del mismo modo, se conoce la interacción de las repeticiones de Ankyrin con el ARN en el caso de 1WDY y 4G8K. Observamos que las proteínas 3Q0P, 3K4E y 3V71 tienen sitios de unión reportados en la región de repetición predicha con el ARN como socio de unión, proporcionando de nuevo apoyo a nuestra predicción.

Tabla 4 Proteínas de ejemplo con sitios de unión en la región de repetición de Ankyrin predicha

Predecimos repeticiones de Ankyrin en dos estructuras de proteínas mannosidasas, 1FO3 (humana) y 1KRF (P. citrinum). La kifunensina (KIF) es el inhibidor de las mannosidasas y regula la actividad de estas proteínas. En PDBsum, los sitios de unión de KIF para las proteínas 1FO3 y 1KRF están anotados en la región predicha como repetición de Ankyrin por nuestro enfoque. Esto sugiere nuevas interacciones de estas proteínas de repetición de anquirina. Por lo tanto, se podría llevar a cabo un análisis sistemático de otras proteínas Anyrin no reconocidas previamente para identificar sus socios de interacción, lo que llevaría a una comprensión de su papel funcional.

Análisis de proteínas Ankyrin modeladas

La información estructural de las proteínas está aumentando a un ritmo rápido con los avances en la resolución de las estructuras de las proteínas, pero todavía no es comparable a la riqueza de la información de la secuencia. Cabe destacar que de las más de 1200 proteínas anotadas como conteniendo motivos de repetición de Ankyrin en la base de datos UniProt, sólo unas 60 proteínas Ankyrin tienen información estructural disponible. Para demostrar la eficacia de nuestro enfoque en las estructuras modeladas, modelamos 30 proteínas de repetición de Ankyrin de la base de datos UniProt cuya estructura aún no está resuelta. Las estructuras se modelaron utilizando el servidor Swiss-Model, que identifica las estructuras de plantilla de la base de datos PDB basándose en la cobertura y la identidad de la secuencia. Las plantillas que tienen una alta cobertura e identidad de secuencia en la región de repetición se seleccionan para el modelado basado en la homología de estas 30 secuencias de proteínas. El algoritmo propuesto, AnkPred, se ejecuta en las correspondientes proteínas modeladas y la predicción de las regiones de repetición se presenta en el archivo adicional 3. En la Figura 11(a) se muestra la predicción del enfoque propuesto sobre la estructura modelada de la proteína quinasa ligada a la integrina (Id. UniProt: Q99J82), que concuerda muy bien con la anotación en UniProt. Cabe señalar que en aproximadamente la mitad de las proteínas (marcadas con un asterisco en el archivo adicional 3), el número de copias predicho había aumentado, identificándose repeticiones terminales. Se sabe que las copias terminales suelen estar menos conservadas y a veces son incompletas, por lo que no son detectadas por los métodos basados en la secuencia, pero son identificadas por nuestro método basado en la estructura, como se muestra para la proteína ANKRD (Id. UniProt: Q7Z3H0) en la Figura 11(b). Esto sugiere el poder de nuestro enfoque en la mejora de la anotación de las regiones de repetición para las secuencias de proteínas para las que no hay información de la estructura disponible.

Figura 11
figura11

Predicción sobre las estructuras modeladas mostradas. (a) Proteína quinasa ligada a la integrina (Id. UniProt: Q99J82). Los límites de repetición de cinco motivos de Ankyrin predichos por AnkPred (mostrados en diferentes colores) están en buen acuerdo con cinco copias anotadas en Uniprot. (b) Proteína ANKRD (Id. UniProt: Q7Z3H0). En este caso sólo hay 3 motivos de Ankyrin anotados en UniProt (copias intermedias) mientras que AnkPred predice dos copias adicionales a cada lado.

Análisis de otras repeticiones estructurales

Para evaluar la eficacia del enfoque propuesto en otras familias de repeticiones de proteínas, presentamos a continuación nuestro análisis en cuatro tipos de repeticiones diferentes: La repetición tetrapéptida (TPR), la repetición armadillo (ARM), la repetición rica en leucina (LRR) y la repetición Kelch. La estructura tridimensional de una proteína representativa de cada tipo de repetición se muestra en la Figura 12(a)-(d) y sus respectivos perfiles A levc en la Figura 12(e)-(h). Se observa un perfil A levc único en las regiones de repetición de cada una de estas proteínas, que se conservan bien dentro de las unidades de repetición adyacentes, como se representa al superponer el perfil A levc en las unidades de repetición en la Figura 12(i)-(l). Los distintos perfiles A levc para las diferentes repeticiones corresponden a la orientación específica de los elementos estructurales secundarios en cada tipo de repetición. Puede observarse que el perfil A levc para la repetición TPR es muy distinto comparado con el de la repetición Ankyrin (Figura 3(a)), aunque es de longitud similar y tiene una arquitectura de estructura secundaria muy parecida con un núcleo de hélice-giro-hélice. Esto muestra claramente el poder del análisis del espectro propio de la red de contactos de la proteína en la identificación de repeticiones estructurales y su sensibilidad para distinguir repeticiones estructurales similares.

Figura 12
figura12

Proteínas de otras familias de repeticiones estructurales. (a)-(d) Estructura 3-D: (a) 2C2L: cadena A (TPR) (b) 3SL9: cadena A (ARM) (c) 1D0B: cadena A (LRR) (d) 1U6D: cadena X (KELCH). En (e), (f), (g) y (h) se muestra el gráfico de A levc para las respectivas proteínas. En (i), (j), (k) y (l) se superpone el perfil A levc de las regiones repetidas en las respectivas proteínas.