Blastn vs. blastp

Blastn jest w rzeczywistości raczej słabym narzędziem do znajdowania sekwencji kodujących białka. Wynika to po części z chybotliwej pozycji trzeciego nukleotydu w większości kodonów. Większość aminokwasów może być kodowana przez wiele kodonów różniących się trzecią pozycją. Tak więc dokładnie ta sama sekwencja aminokwasów może być kodowana przez dwie sekwencje nukleotydów różniące się w każdej trzeciej pozycji (ponieważ mutacje w trzeciej pozycji nie wpływają na powstające białko, takie mutacje zazwyczaj gromadzą się dość szybko). Ponieważ sekwencje aminokwasów są identyczne, blastp nie miałby problemu z pobraniem jednej sekwencji, używając drugiej jako zapytania. Blastn, jednakże, używa domyślnego rozmiaru słowa 11 nukleotydów. Oznacza to, że obie sekwencje muszą pasować do siebie co najmniej 11 nukleotydami, aby blastn mógł w ogóle zgłosić jakiekolwiek trafienie. W powyższym przykładzie, przy ustawieniu rozmiaru słowa na 6, najlepsze trafienie miało wartość e-value 0.031. W tym przypadku, idealne dopasowanie 6 nukleotydów zostało znalezione pomiędzy sekwencjami zapytania i bazy danych, ale blastn nie był w stanie rozszerzyć tego dopasowania, tłumacząc złą wartość e-value (często, nie byłoby to uważane za znaczące trafienie).