Blastn vs. blastp

Blastn är faktiskt ett ganska dåligt verktyg för att hitta proteinkodande sekvenser. Detta beror delvis på wobble-positionen för den tredje nukleoiden i de flesta kodoner. De flesta aminosyror kan kodas av flera kodoner som skiljer sig åt i den tredje positionen. Exakt samma aminosyrasekvens kan således kodas av två nukleotidsekvenser som skiljer sig åt i varje tredje position (eftersom mutationer i den tredje positionen inte påverkar det resulterande proteinet ackumuleras sådana mutationer vanligtvis ganska snabbt). Eftersom aminosyrasekvenserna är identiska skulle blastp inte ha några problem med att hitta den ena sekvensen med den andra sekvensen som fråga. Blastn använder dock en standardordstorlek på 11 nukleotider. Detta innebär att de två sekvenserna måste överensstämma med minst 11 nukleotider för att blastn ska kunna rapportera någon träff alls. I exemplet ovan hade den bästa träffen ett e-värde på 0,031 när ordstorleken sattes till 6. I det här fallet hittades en perfekt matchning på 6 nukleotider mellan fråge- och databassekvenserna, men blastn kunde inte utvidga denna anpassning särskilt mycket, vilket förklarar det dåliga e-värdet (ofta skulle detta inte betraktas som en betydande träff).