Human BLAT Search

BLAT en el ADN está diseñado para encontrar rápidamente secuencias de 95% y más de similitud de longitud 25 bases o más. Puede perder alineaciones de secuencias más divergentes o más cortas. BLAT en proteínas encuentra secuencias con un 80% o más de similitud con una longitud de 20 aminoácidos o más. En la práctica, DNA BLAT funciona bien en primates y proteinBLAT en vertebrados terrestres.

BLAT no es BLAST. DNA BLAT funciona manteniendo un índice de todo el genoma en la memoria. El índice consiste en todos los solapamientos de 11-mers que se superponen por 5, excepto los que están muy implicados en las repeticiones. El índice ocupa unos 2 gigabytes de RAM. La memoria RAM puede reducirse a menos de 1 GB si se aumenta el tamaño de los pasos a 11. El genoma en sí no se guarda en la memoria, lo que permite a BLAT ofrecer un alto rendimiento en un equipo Linux de precio razonable. El BLAT de proteínas funciona de forma similar, excepto con los 4meros en lugar de los 11meros. El índice de proteínas ocupa un poco más de 2 gigabytes.

BLAT fue escrito por Jim Kent.Como la mayor parte del software de Jim, el uso interactivo en este servidor web es gratuito para todos.Las fuentes y los ejecutables para ejecutar trabajos por lotes en su propio servidor están disponibles gratuitamentepara fines académicos, personales y no lucrativos. También hay disponibles licencias comerciales no exclusivas. Consulte el sitio web de Kent Informatics para obtener más detalles.

Para obtener más información sobre la versión gráfica de BLAT, haga clic en el botón de ayuda de la barra de menú superior o consulte las preguntas frecuentes del navegador del genoma.