Human BLAT Search

BLAT on DNA è progettato per trovare rapidamente sequenze di somiglianza del 95% e superiori di lunghezza pari o superiore a 25 basi. Può mancare allineamenti di sequenze più divergenti o più brevi. BLAT sulle proteine trova sequenze dell’80% e più di somiglianza della lunghezza di 20 aminoacidi o più. In pratica DNA BLAT funziona bene sui primati, e proteinBLAT sui vertebrati terrestri.

BLAT non è BLAST. DNA BLAT funziona tenendo in memoria un indice dell’intero genoma. L’indice consiste in tutte le sovrapposizioni di 11 meri a passo di 5, tranne quelle fortemente coinvolte nelle ripetizioni. L’indice occupa circa 2 gigabyte di RAM. La RAM può essere ulteriormente ridotta a meno di 1 GB aumentando la dimensione del passo a 11. Il genoma stesso non è tenuto in memoria, permettendo a BLAT di fornire alte prestazioni su una scatola Linux di prezzo ragionevole. L’indice è usato per trovare aree di probabile omologia, che sono poi caricate in memoria per un allineamento dettagliato. Protein BLAT funziona in modo simile, tranne che con 4-meri piuttosto che 11-meri. L’indice delle proteine richiede poco più di 2 gigabyte.

BLAT è stato scritto da Jim Kent.Come la maggior parte del software di Jim, l’uso interattivo su questo server web è gratuito per tutti.I sorgenti e gli eseguibili per eseguire lavori in batch sul proprio server sono disponibili gratuitamente per scopi accademici, personali e senza scopo di lucro. Sono disponibili anche licenze commerciali non esclusive. Vedere il sito web della Kent Informatics per i dettagli.

Per maggiori informazioni sulla versione grafica di BLAT, fare clic sul pulsante Help sulla barra dei menu in alto o vedere le FAQ di Genome Browser.