Identificazione delle ripetizioni tandem di Ankyrin nelle strutture delle proteine

Qui presentiamo l’analisi dell’algoritmo proposto su un set rappresentativo di quindici proteine con ripetizioni ANK (Tabella 2). Prima discutiamo in dettaglio la nostra analisi su una proteina ANK progettata, 1N0R (catena A), che comprende quattro ripetizioni ANK esatte in tandem come mostrato in Figura 2(a) e la sua rete di contatti proteici data in Figura 2(b). I principali autovettori della matrice di adiacenza, A levc, per la proteina ANK progettata 1N0R è tracciata nella Figura 3(a). Un chiaro modello ripetitivo nel profilo A levc è osservato nelle quattro regioni di ripetizione (linee verticali tratteggiate e solide corrispondono a inizio-fine ripetere confini basati su output RADAR). Questo è chiaramente visto sovrapponendo il profilo A levc per le singole copie ripetere in Figura 3 (b) dopo la normalizzazione con il più grande picco in ogni copia ripetere. La previsione è buona sia in termini di numero di copie che di limiti di inizio e fine delle regioni ripetute rispetto allo strumento RADAR basato sulla sequenza (vedi Tabella 2), mentre due copie ripetute sono mancate dal programma ConSole basato sulla struttura, anche nel caso della proteina ANK progettata. Gli allineamenti multipli di sequenza (MSA) delle regioni ripetute predette dal nostro approccio, da RADAR e da ConSole sono mostrati nella Figura 4(a), (b) e (c) rispettivamente usando CLUSTALW . La MSA delle singole copie in entrambi i casi è molto ben conservata e in buon accordo.

Tabella 2 Predizione delle regioni di ripetizione per un set rappresentativo di 15 proteine confrontate con l’annotazione UniProt, l’output RADAR e ConSole
Figura 4
figura4

MSA delle regioni di ripetizione previste per 1N0R. (a) predette dall’approccio proposto, (b) output RADAR, e (c) output ConSole.

Prendiamo in considerazione un esempio di una proteina naturale, il fattore stimolante gli osteoclasti 1, 3EHQ (catena A), che induce il riassorbimento osseo. Secondo l’annotazione in UniProt, contiene tre ripetizioni Ankyrin da 72-168 come mostrato nella struttura 3-D da colori diversi in Figura 5(a). In Figura 5(b) è mostrato il grafico del profilo A levc per 3EHQ, che indica chiaramente la presenza di tre unità ripetute nella regione 72-177. C’è un buon accordo tra i confini previsti di inizio e fine delle tre unità ripetute con l’annotazione UniProt (vedi Tabella 2). Tuttavia, le previsioni delle regioni ripetute da RADAR e ConSole non sono in accordo con l’annotazione UniProt. La predizione di RADAR differisce sia in termini di numero di copie che di confini di ripetizione, la prima ripetizione è completamente mancata. ConSole predice tre copie delle ripetizioni di ANK, ma le posizioni dei confini di inizio e fine delle unità ripetute sono sbagliate di circa 10 residui per ogni copia ripetuta. Nella Figura 6 è mostrato l’MSA delle regioni ripetute (a) previste dal nostro approccio, (b) annotate nel database UniProt, e (c) previste da ConSole. L’MSA della regione ripetuta predetta nella Figura 6(a) è in ottimo accordo con quello delle regioni ripetute annotate da UniProt (Figura 6(b)), rispetto a quello della regione predetta da ConSole nella Figura 6(c). I risultati per un set rappresentativo di 15 proteine ANK ripetere è riassunta nella tabella 2 insieme con l’annotazione fornita nel database UniProt, e le previsioni di sequenza e la struttura basata metodi, RADAR e ConSole, rispettivamente. In generale osserviamo un buon accordo nel rilevamento delle ripetizioni di Anchirina sia nel numero di copie che nei limiti di ripetizione con l’annotazione UniProt e anche con ConSole.

Figura 5
figura5

Proteina naturale 3EHQ (catena A). (a) La struttura 3d, e (b) le componenti dell’autovettore corrispondenti al più grande autovalore della matrice di adiacenza (A levc ).

Figura 6
figura6

MSA delle regioni ripetute nella proteina 3EHQ. (a) predette dall’approccio proposto, (b) annotate nel database UniProt, e (c) predette dall’output di ConSole.

Nella tabella 2 le proteine sono state selezionate per presentare esempi sia di buon accordo che di disaccordo. Di seguito discutiamo alcuni esempi in cui la nostra predizione differisce dall’annotazione nel database UniProt. Per esempio, nel caso della proteina 3EU9 (catena A), cinque copie di motivi ANK sono annotate in UniProt da 89-253, mentre il nostro approccio predice sette copie, una copia extra su entrambi i lati da 57-88 e 258-281. Dalla struttura 3-D di 3EU9 in Figura 7(a) e dal profilo A levc mostrato in Figura 7(b), è chiaro che le ripetizioni terminali previste (mostrate in rosso) mostrano un profilo A levc simile alle cinque ripetizioni intermedie (mostrate in grigio). L’allineamento strutturale di queste ripetizioni previsto terminale con un motivo rappresentativo strutturale ANK (da progettato proteina 1N0R) utilizzando Cealign modulo in Pymol è mostrato in Figura 7 (c) e (d); il Root Mean Square Deviation (RMSD) per ogni copia terminale è inferiore a 1 Å indicando alta somiglianza strutturale con il motivo ANK. Tuttavia a livello di sequenza queste ripetizioni terminali non sono ben conservate come è chiaro dalla MSA delle regioni previste in Figura 8(a), rispetto a quella delle regioni ripetute annotate da UniProt in Figura 8(b). Con una copia terminale aggiuntiva prevista da ConSole, un totale di sei copie sono previste da esso, ma i confini delle copie ConSole sono spostati di circa 10 residui rispetto all’annotazione UniProt. In generale, le ripetizioni terminali sono meno conservate a livello di sequenza o incomplete, e la loro individuazione non è facile. In altre 52 proteine (vedi file aggiuntivo 1), copie aggiuntive delle ripetizioni ANK sono state predette dall’approccio proposto, migliorando così l’annotazione della regione di ripetizione completa in queste 53 proteine. In 16 di questi casi, una copia extra è stata predetta anche da ConSole. Per la proteina 3SO8 (catena A, UniProt Id: Q9H9E1), inizialmente tre ripetizioni ANK sono state annotate nella precedente versione di UniProt (versione 2012_08) da 181-279 mentre cinque ripetizioni sono previste dal nostro approccio dal residuo 149-310, cioè una ripetizione extra ad ogni estremità. Nel recente rilascio del database UniProt (rilascio 2014_05), la proteina è ora annotata come avente cinque copie del motivo ANK da 148-313, che è in accordo con la previsione dell’approccio proposto (Tabella 2).

Figura 7
figura7

Proteina naturale a ripetizione Ankyrin 3EU9 (catena A). (a) Struttura 3-D (b) Grafico dell’autovettore principale della matrice di adiacenza. (c) – (d) Allineamento strutturale della copia extra di ripetizione dell’Anchirina predetta in 3EU9 (mostrata in colore blu) con una copia di ripetizione della proteina progettata 1N0R (mostrata in colore rosso).

Figura 8
figura8

MSA delle regioni ripetute nella proteina 3EU9. (a) predette dall’approccio proposto, e (b) annotate nel database UniProt.

Nella proteina 1D9S (catena A), quattro ripetizioni ANK sono riportate da 5-130 nel database UniProt ma solo due sono identificate dal nostro approccio da 71-129. Analizzando l’architettura della struttura secondaria da PDBsum per 1D9S in Figura 9, osserviamo che la regione 38-66 contiene solo una elica assegnata sia da STRIDE e DSSP, mentre un motivo ANK comprende due eliche antiparallele, suggerendo che questa regione può essere stato erroneamente annotato nel database UniProt. La regione 5-34 è prevista come motivo ANK nello screening preliminare del nostro approccio, ma viene scartata nella fase di post-elaborazione mentre si riportano le regioni di ripetizione tandem contigue. Una situazione simile è stata riscontrata in altre 18 proteine (vedi file aggiuntivo 1) dove la prima ripetizione nell’annotazione UniProt è inizialmente predetta dal nostro algoritmo, ma successivamente scartata perché la ripetizione successiva non è identificata entro una soglia di 17 residui (metà lunghezza di un motivo ANK). Per tutte queste proteine, tranne 4HBD, una o più copie sono mancate da ConSole rispetto all’annotazione UniProt (vedi file aggiuntivo 1). È possibile che in tutte queste proteine il motivo ANK mancante sia mutato al di là del riconoscimento anche a livello di struttura o che ci sia una delezione di elica. Così, vediamo che gli spettri eigen della matrice di adiacenza cattura il modello di piega ripetitiva del motivo ANK molto bene e incorporando le informazioni della struttura secondaria e la variazione nella loro lunghezza, una previsione accurata dei confini di ripetizione è possibile (Tabella 2). Tuttavia, se c’è un errore nell’assegnazione della struttura secondaria, la predizione dell’algoritmo proposto ne risente.

Figura 9
figura9

Rappresentazione della struttura secondaria della proteina ripetuta Ankyrin 1D9S (catena A) da PDBsum.

Performance dell’algoritmo proposto

Prima di tutto, discutiamo l’accuratezza della predizione dei motivi ANK con l’annotazione UniProt su un set noto di 370 proteine che comprende un test set positivo di 125 proteine a ripetizione Ankyrin e un test set negativo di 245 proteine non solenoidi. I risultati sono riassunti nella tabella 3 (a), dove la sensibilità e la specificità dell’algoritmo è calcolata come segue:

Sensibilità= T P T P + F N ≃0.976
Specificità= T N T N + F P ≃1
Tabella 3 Prestazioni dell’approccio proposto

dove TP corrisponde al numero di proteine ripetute di Anchirina note correttamente predette, FN – il numero di proteine note con ripetizioni di Anchirina mancate dal nostro approccio, FP – il numero di proteine predette dal nostro approccio come contenenti ripetizioni ANK in tandem ma non annotate come proteine di Anchirina, e TN – il numero di proteine correttamente predette dal nostro approccio come proteine non-Ankyrin. Poiché ci sono stati solo tre falsi negativi (FN), 1SW6, 2ETB e 3ZRH, e nessun falso positivo (FP), la sensibilità e la specificità dell’algoritmo è molto alta (≃1).

In seguito, per le proteine Ankyrin predette, analizziamo il numero di motivi ANK correttamente predetti nel dataset di 125 proteine ripetute Ankyrin note e confrontiamo con un recente approccio basato sulla struttura, ConSole, e un approccio basato sulla sequenza RADAR. Nel database UniProt, un totale di 584 motivi ANK sono annotati in queste 125 proteine, mentre 582 motivi ANK sono predetti dall’approccio proposto, 528 da ConSole e 458 da RADAR. I dettagli dell’analisi sono riassunti nella tabella 3(b) in termini di sensibilità e precisione, definiti come:

Sensibilità= T P T P + F N
Precisione= T P T P + F P

dove, TP è il numero di motivi ANK correttamente predetti dal metodo nel dataset noto di 125 proteine, FP è il numero di motivi ANK predetti dal metodo ma non annotati nel database UniProt, e FN è il numero di motivi ANK annotati mancati dal metodo. Si può osservare che sia la sensibilità che la precisione dell’approccio proposto, AnkPred, è ~ 0,88, ragionevolmente buona rispetto a quella di ConSole (0,72 e 0,79) e RADAR (0,68 e 0,86) rispettivamente. Le copie terminali sono note per avere una bassa conservazione della sequenza, con conseguente minore sensibilità del metodo RADAR. Riconosciamo che la sensibilità del nostro algoritmo, con la sua dipendenza dall’assegnazione della struttura secondaria, potrebbe essere ulteriormente migliorata.

Per analizzare l’accuratezza dei confini di ripetizione predetti dall’approccio proposto, abbiamo costruito l’allineamento di sequenza multiplo (MSA) dei 582 motivi ANK predetti nel dataset di 125 proteine Ankyrin note usando CLUSTALW .Il consenso dei motivi ANK predetti è stato poi costruito utilizzando SeaView al 50% di identità ed è dato di seguito:

XGXTPLHXAXXXGXXXXXXXLLXXXAXX

Questo è in ottimo accordo con il motivo ANK di consenso proposto da Kohl et al. e Mosavi et al. Il motivo tetrapeptidico conservato TPLH nelle posizioni 4-7, la glicina nelle posizioni 2 e 13, e la leucina nelle posizioni 21-22 conferma l’accuratezza della previsione dei limiti di ripetizione con l’approccio proposto.

Analisi sulla banca dati delle proteine

Abbiamo eseguito l’algoritmo proposto sul PDB completo. Un numero totale di 98.341 strutture rappresentate come proteine o proteine in complesso con acidi nucleici sono state scaricate. Rimuovendo brevi frammenti < 50 residui (poiché è improbabile che questi contengano due copie contigue di motivi ANK) e proteine senza strutture secondarie assegnate, un totale di 94.975 strutture sono state utilizzate per l’analisi. L’algoritmo proposto ha identificato 819 strutture proteiche contenenti almeno due motivi ANK ripetuti in tandem. Di queste 181 sono annotate come proteine ANK conosciute in UniProt, Pfam, PROSITE e PDB di cui ~ 50 strutture contengono proteine a ripetizione Ankyrin progettate (DARPINS). Il numero di proteine a ripetizione anchirinica correttamente predette è 178 e solo 3 sono state mancate dal nostro approccio, 1SW6 (catena A), 2ETB (catena A) e 3ZRH (catena A). Nei primi due casi l’approccio proposto non ha rilevato i motivi ANK in quanto le regioni ripetute annotate da UniProt contengono 3-4 eliche mentre secondo le regole definite nell’algoritmo, un motivo ANK comprende due eliche antiparallele. In 3ZRH le due copie annotate di ripetizioni ANK non sono contigue ma separate da 23 residui, e quindi non sono state considerate dal nostro approccio. Così, le restanti 641 strutture sono proposte come ripetizioni Ankyrin non riconosciute in precedenza e sono elencate nel file aggiuntivo 2. Si osserva che 27 di queste proteine sono annotati come contenenti altri tipi di ripetizione, vale a dire, 9 TPR, 7 Pumilio ripetere, 2 HEAT, 2 ripetizione Annexin, 2 Tumor necrosis factor receptor (TNFR-Cys), 2 fattore di terminazione mitocondriale ripetere (MTERF), 2 catena pesante Clathrin ripetere (CHCR) e 1 HAT (file aggiuntivo 2). Strutturalmente, i motivi TPR, HEAT e HAT sono molto simili al motivo di ripetizione ANK, ognuno dei quali comprende due eliche antiparallele che formano un nucleo Helix-Turn-Helix e sono anche di lunghezza simile, ~ 30-34 residui. La differenza principale è che il motivo ANK ha un lungo loop che termina con una curva β che non è presente nei motivi TPR, HEAT e HAT. Anche con questa forte somiglianza tra questi motivi strutturali, solo 13 falsi positivi (9 TPR, 3 HEAT e 1 HAT) sono riportati dal nostro approccio. Per verificare l’affidabilità della nostra previsione in queste proteine, abbiamo effettuato la sovrapposizione struttura-struttura della regione di ripetizione ANK prevista con un motivo DARPin da 1N0R utilizzando il modulo Cealign in Pymol. Per esempio, nella proteina 1OUV (catena A), sette copie di TPR sono riportati nel database UniProt da 29-278 (Additional file 2) contenente 14 eliche H 1-H 14 come mostrato nella rappresentazione della struttura secondaria da PDBsum in Figura 10(a). La sovrapposizione è buona con deviazione quadratica media (RMSD) per tutte le tre unità ANK predetti ripetizioni < 3 Å come mostrato nella Figura 10 (b). Il profilo A levc nella regione Ankyrin predetto da 185 a 292 in Figura 10 (c) è anche molto simile a quello per un tipico motivo ANK in Figura 1 (a). In questo caso, i motivi di ripetizione ANK predetti sono all’interno della regione annotata TPR, composta da un’elica di ogni ripetizione TPR adiacente e può essere rappresentata come H 2 i T i H 1 i + 1 dove H 2 i è la seconda elica dell’iesimo motivo TPR e H 1 i + 1 è la prima elica del (i + 1)terzo motivo TPR. L’allineamento strutturale delle 7 regioni TPR annotate è stato eseguito con un motivo TPR rappresentativo dalla proteina progettata 1NA0 e RMSD per ogni unità di ripetizione < 2 Å (risultati non mostrati) suggerendo che l’annotazione UniProt è anche corretta. Tuttavia, il giro β tra due eliche all’interno di un motivo TPR è stato osservato per essere più lungo di quello del tipico motivo TPR progettato e simile al ciclo terminale del motivo ANK. Questo suggerisce la possibilità di un’architettura multiripetitiva nelle proteine complesse. Per altre 21 proteine ripetute, è stata osservata un’architettura multiripetitiva simile. Nel caso della proteina HEAT 3LWW (catena A), l’annotazione in UniProt è di sei copie continue da 124-441 e due copie distanti da 602-641 e 687-726. La ripetizione ANK prevista si trova nella regione non-HEAT da 520-621 con una sovrapposizione molto piccola di 20 residui con la ripetizione HEAT. In questo caso due diverse ripetizioni sono presenti in diverse regioni della proteina ed è stato osservato un totale di 10 proteine contenenti due diversi tipi di ripetizioni non sovrapposte l’una all’altra (contrassegnate con ‘*’ nel file aggiuntivo 2). Per queste proteine che presentano un’architettura a più ripetizioni, sarebbe interessante analizzare i siti di interazione che aiuterebbero a confermare annotazioni/funzioni multiple in queste proteine con architettura complessa. Così, l’approccio basato sulla struttura proposto qui è promettente nel rilevare le ripetizioni strutturali in tandem nelle proteine ed è abbastanza potente per distinguere tra le ripetizioni strutturali molto simili, cioè Ankyrin e TPR/HEAT/HAT.

Figura 10
figura10

Predetta proteina 1OUV con ripetizione Ankyrin (catena A). (a) Rappresentazione della struttura secondaria da PDBsum (b) Allineamento strutturale della copia ripetuta ANK predetta (mostrata in colore blu) con una copia ripetuta della proteina ANK progettata 1N0R (mostrata in arancione) (c) Un plot levc con linee tratteggiate e solide che mostrano l’inizio e la fine dei confini ANK predetti.

Analisi funzionale delle proteine anchiriniche precedentemente non riconosciute

Abbiamo identificato 641 proteine ripetute anchiriniche precedentemente non riconosciute dall’approccio proposto. Nella tabella 4, presentiamo la nostra analisi di 11 di queste proteine. In tutte queste proteine, osserviamo che i siti di legame riportati in PDBsum si trovano nella regione prevista di ripetizione di Ankyrin. Per esempio, la proteina DNA polimerasi lambda 3HWT (umana), che è importante per il processo di replicazione del DNA, contiene quattro domini. I siti di legame al DNA riportati in 3HWT sono presenti nel dominio della DNA polimerasi (257-331) e si trovano sulla seconda elica di entrambe le copie delle unità di Ankyrin predette. La presenza di ripetizioni di Ankyrin nelle proteine leganti il DNA, 1SW6 e 3V30, annotate in UniProt fornisce supporto alla nostra predizione e al possibile ruolo funzionale di 3HWT. Questa analisi aiuta a capire il tipo di interazione in cui è coinvolta la 3HWT e il confronto con altre proteine con funzioni simili può portare a una migliore comprensione del ruolo delle ripetizioni di Ankyrin. Allo stesso modo, l’interazione delle ripetizioni di Ankyrin con l’RNA è nota nel caso di 1WDY e 4G8K. Osserviamo che le proteine 3Q0P, 3K4E e 3V71 hanno siti di legame riportati nella regione di ripetizione prevista con l’RNA come partner di legame, fornendo ancora una volta supporto alla nostra predizione.

Tabella 4 Proteine di esempio con siti di legame nella regione di ripetizione di Ankyrin prevista

Abbiamo previsto le ripetizioni di Ankyrin in due strutture di proteine mannosidasi, 1FO3 (umana) e 1KRF (P. citrinum). La Kifunensina (KIF) è l’inibitore delle mannosidasi e regola l’attività di queste proteine. In PDBsum, i siti di legame di KIF per le proteine 1FO3 e 1KRF sono annotati nella regione predetta come ripetizione di Ankyrin dal nostro approccio. Questo suggerisce nuove interazioni di queste proteine a ripetizione di Ankyrin. Così si potrebbe effettuare un’analisi sistematica di altre proteine Anyrin precedentemente non riconosciute per identificare i loro partner di interazione, portando alla comprensione del loro ruolo funzionale.

Analisi delle proteine anchiriniche modellate

Le informazioni strutturali delle proteine stanno aumentando ad un ritmo rapido con i progressi nella risoluzione delle strutture delle proteine, ma non sono ancora paragonabili alla ricchezza delle informazioni di sequenza. Si può notare che di oltre 1200 proteine annotate come contenenti motivi di ripetizione Ankyrin nel database UniProt, solo circa 60 proteine Ankyrin hanno informazioni strutturali disponibili. Per mostrare l’efficacia del nostro approccio sulle strutture modellate, abbiamo modellato 30 proteine a ripetizione di Ankyrin dal database UniProt per le quali la struttura non è ancora risolta. Le strutture sono state modellate usando il server Swiss-Model, che identifica le strutture modello dal PDB in base alla copertura della sequenza e all’identità della sequenza. I modelli con alta copertura e identità di sequenza nella regione di ripetizione sono stati selezionati per la modellazione basata sull’omologia di queste 30 sequenze proteiche. L’algoritmo proposto, AnkPred, viene eseguito sulle corrispondenti proteine modellate e la predizione delle regioni di ripetizione è data nel file aggiuntivo 3. In Figura 11(a) è mostrata la predizione dell’approccio proposto sulla struttura modellata della proteina chinasi legata all’integrina (UniProt Id: Q99J82), che è in ottimo accordo con l’annotazione in UniProt. Si può notare che in circa la metà delle proteine (contrassegnate da un asterisco nel file aggiuntivo 3), il numero di copie previsto era aumentato, con ripetizioni terminali identificate. È noto che le copie terminali sono generalmente meno conservati e talvolta incompleto, e quindi mancato da metodi basati sulla sequenza, ma sono identificati dal nostro metodo basato sulla struttura come mostrato per ANKRD (UniProt Id: Q7Z3H0) proteina in Figura 11 (b). Questo suggerisce la potenza del nostro approccio nel migliorare l’annotazione delle regioni di ripetizione per le sequenze proteiche per le quali non sono disponibili informazioni sulla struttura.

Figura 11
figura11

Previsione sulle strutture modellate mostrate. (a) Proteina chinasi legata all’integrina (UniProt Id: Q99J82). I confini di ripetizione di cinque motivi Ankyrin predetti da AnkPred (mostrati in colori diversi) sono in buon accordo con cinque copie annotate in Uniprot. (b) ANKRD proteina (UniProt Id: Q7Z3H0). In questo caso solo 3 motivi Ankyrin sono annotati in UniProt (copie intermedie) mentre AnkPred predice due copie aggiuntive su entrambi i lati.

Analisi di altre ripetizioni strutturali

Per valutare l’efficacia dell’approccio proposto su altre famiglie di proteine ripetute, presentiamo la nostra analisi su quattro diversi tipi di ripetizioni: Tetratricopeptide repeat (TPR), Armadillo repeat (ARM), Leucine-rich repeat (LRR) e Kelch repeat. La struttura tridimensionale di una proteina rappresentativa di ogni tipo di ripetizione è mostrata in Figura 12(a)-(d) e i loro rispettivi profili A levc in Figura 12(e)-(h). Un unico profilo A levc è osservato nelle regioni di ripetizione in ciascuna di queste proteine che sono ben conservati all’interno delle unità di ripetizione adiacenti come raffigurato dalla sovrapposizione del profilo A levc nelle unità di ripetizione in Figura 12 (i) – (l). I profili A levc distinti per le diverse ripetizioni corrispondono all’orientamento specifico degli elementi strutturali secondari in ogni tipo di ripetizione. Si può notare che il profilo A levc per la ripetizione TPR è molto distinto rispetto a quello della ripetizione Ankyrin (Figura 3(a)), anche se è di lunghezza simile e ha molto simile architettura della struttura secondaria con elica-turno-elica nucleo. Questo mostra chiaramente il potere dell’analisi degli spettri di eigen della rete di contatto delle proteine nell’identificazione delle ripetizioni strutturali e la sua sensibilità nel distinguere le ripetizioni strutturali simili.

Figura 12
figura12

Proteine di altre famiglie di ripetizioni strutturali. (a)-(d) Struttura 3-D: (a) 2C2L: catena A (TPR) (b) 3SL9: catena A (ARM) (c) 1D0B: catena A (LRR) (d) 1U6D: catena X (KELCH). In (e), (f), (g) e (h) il grafico A levc per le rispettive proteine mostrate. In (i), (j), (k) e (l) il profilo A levc delle regioni ripetute nelle rispettive proteine sono sovrapposte.