Blastn vs. blastp

Blastn este, de fapt, un instrument destul de slab pentru a găsi secvențe codificatoare de proteine. Acest lucru se datorează în parte poziției de oscilație a celui de-al treilea nucleotid în majoritatea codonilor. Majoritatea aminoacizilor pot fi codificați de mai mulți codoni care diferă în cea de-a treia poziție. Astfel, exact aceeași secvență de aminoacizi poate fi codificată de două secvențe de nucleotide care diferă la fiecare a treia poziție (deoarece mutațiile în a treia poziție nu afectează proteina rezultată, astfel de mutații se acumulează de obicei destul de rapid). Secvențele de aminoacizi fiind identice, blastp nu ar avea nicio problemă în recuperarea unei secvențe, folosind cealaltă secvență ca interogare. Blastn, cu toate acestea, utilizează o dimensiune implicită a cuvintelor de 11 nucleotide. Aceasta înseamnă că cele două secvențe trebuie să se potrivească cu cel puțin 11 nucleotide pentru ca blastn să poată raporta orice rezultat. În exemplul de mai sus, atunci când se stabilește dimensiunea cuvântului la 6, cea mai bună potrivire a avut o valoare e- de 0,031. În acest caz, s-a găsit o potrivire perfectă de 6 nucleotide între secvența de interogare și secvența din baza de date, dar blastn nu a reușit să extindă foarte mult această aliniere, ceea ce explică valoarea e- proastă (adesea, aceasta nu ar fi considerată o potrivire semnificativă).

.