Blastn vs. blastp

Blastn is in feite een tamelijk slecht gereedschap voor het vinden van eiwit-coderende sequenties. Dit is gedeeltelijk te wijten aan de wobble positie van de derde nucleotide in de meeste codons. De meeste aminozuren kunnen worden gecodeerd door meerdere codons die verschillen in de derde positie. Zo kan exact dezelfde aminozuursequentie worden gecodeerd door twee nucleotidesequenties die op elke derde positie verschillen (aangezien mutaties op de derde positie geen invloed hebben op het resulterende eiwit, stapelen dergelijke mutaties zich doorgaans vrij snel op). Aangezien de aminozuursequenties identiek zijn, zou blastp geen probleem hebben om de ene sequentie op te halen, met de andere sequentie als query. Blastn gebruikt echter een standaard woordgrootte van 11 nucleotiden. Dit betekent dat de twee sequenties ten minste 11 nucleotiden moeten overeenkomen, wil blastn een hit kunnen rapporteren. In het bovenstaande voorbeeld had de beste hit, wanneer de woordgrootte op 6 werd ingesteld, een e-waarde van 0,031. In dit geval werd een perfecte overeenkomst van 6 nucleotiden gevonden tussen de query en de database sequenties, maar blastn was niet in staat om deze uitlijning erg uit te breiden, wat de slechte e-waarde verklaart (vaak zou dit niet worden beschouwd als een significante hit).