Blastn vs. blastp

Blastn er faktisk et ret dårligt værktøj til at finde sekvenser, der koder for proteiner. Dette skyldes til dels wobble-positionen af det tredje nukleotid i de fleste kodoner. De fleste aminosyrer kan være kodet af flere kodoner, der adskiller sig i den tredje position. Således kan nøjagtig den samme aminosyresekvens være kodet af to nukleotidsekvenser, der adskiller sig i hver tredje position (da mutationer i den tredje position ikke påvirker det resulterende protein, ophobes sådanne mutationer typisk ret hurtigt). Da aminosyresekvenserne er identiske, vil blastp ikke have problemer med at finde den ene sekvens ved at bruge den anden sekvens som forespørgsel. Blastn bruger imidlertid en standardordstørrelse på 11 nukleotider. Det betyder, at de to sekvenser skal matche med mindst 11 nukleotider for at blastn overhovedet kan rapportere et hit. I ovenstående eksempel, hvor ordstørrelsen var sat til 6, havde det bedste hit en e-værdi på 0,031. I dette tilfælde blev der fundet et perfekt match på 6 nukleotider mellem forespørgsels- og databasesekvenserne, men blastn var ikke i stand til at udvide denne alignment særlig meget, hvilket forklarer den dårlige e-værdi (ofte ville dette ikke blive betragtet som et signifikant hit).