Blastn vs. blastp

Blastn je ve skutečnosti poměrně špatný nástroj pro vyhledávání sekvencí kódujících proteiny. Částečně je to způsobeno wobble pozicí třetího nukleotidu ve většině kodonů. Většina aminokyselin může být kódována více kodony lišícími se ve třetí pozici. Přesně stejná sekvence aminokyseliny tak může být kódována dvěma nukleotidovými sekvencemi lišícími se v každé třetí pozici (protože mutace ve třetí pozici nemají vliv na výsledný protein, takové mutace se obvykle poměrně rychle hromadí). Vzhledem k tomu, že sekvence aminokyselin jsou identické, blastp by neměl problém s vyhledáním jedné sekvence za použití druhé sekvence jako dotazu. Blastn však používá výchozí velikost slova 11 nukleotidů. To znamená, že obě sekvence se musí shodovat alespoň 11 nukleotidy, aby byl blastn vůbec schopen ohlásit nějakou shodu. Ve výše uvedeném příkladu při nastavení velikosti slova na 6 měla nejlepší shoda e-hodnotu 0,031. V tomto případě byla mezi sekvencí dotazu a databází nalezena dokonalá shoda 6 nukleotidů, ale blastn nebyl schopen toto zarovnání příliš rozšířit, což vysvětluje špatnou hodnotu e- (často by to nebylo považováno za významnou shodu).

.