Formarea treptată a sistemului flagelar bacterian
Rezultate
Definirea setului de bază al genelor flagelare.
Prin interogarea genomurilor de bacterii flagelate pentru care sunt disponibile secvențe complete ale genomului, am obținut distribuția filogenetică a fiecărei gene cunoscute ca fiind implicate în biosinteza și reglarea flagelului. Pentru a investiga originea și evoluția sistemului de flagelare bacteriană, am aplicat apoi o metodă de profilare filogenetică (21) pentru a repartiza genele în grupuri funcționale pe baza co-ocurenței și a distribuției lor comune în genomuri. Genele cu roluri funcționale diferite au distribuții și profiluri filogenetice distincte; cu toate acestea, majoritatea genelor ale căror produse proteice constituie componentele structurale ale flagelului sunt prezente în toate filamentele bacteriene luate în considerare (Fig. 1). Această distribuție sugerează că acest set central de gene structurale își are originea înainte de divergența principalelor neamuri bacteriene și include 21 de gene care specifică proteinele care formează filamentul (fliC, care este adesea prezentă în mai multe copii), joncțiunea cârlig-filament (flgK și flgL), cârligul (flgE, care este prezentă ca pseudogena în Thermotoga maritima), tija (flgB, flgC, flgG și flgF, care lipsește doar din Listeria innocua), inelul MS (fliF), inelul C (fliG, fliM și fliN), motorul (motA și motB) și aparatul de export (flhA, flhB, fliI, fliP, fliR și fliQ, căruia îi lipsește un omolog în Clostridium tetani). În plus, flgD, care codifică proteina de acoperire a cârligului, necesară pentru asamblarea flagelară, dar care nu contribuie la structura finală, are omologi în toate bacteriile flagelate și, prin urmare, a fost considerată ca făcând parte din setul de bază.
Distribuția proteinelor flagelare (cu excepția proteinelor de chemotaxie) în rândul speciilor de bacterii flagelate. Acele proteine codificate de genele de bază sunt desemnate cu bold. Această figură este redesenată cu permisiunea celor care apar în baza de date KEGG pathway (www.genome.jp/kegg/pathway/eco/eco02040.html).
Alte gene structurale flagelare care sunt larg, dar nu universal distribuite între speciile flagelate includ flgH, flgI, fliD, fliE și fliH. Absența unora dintre aceste gene dintr-un genom este de înțeles odată ce se iau în considerare caracteristicile bacteriei respective. De exemplu, proteinele inelelor L și P FlgH și FlgI nu sunt necesare la Firmicutes, deoarece aceste bacterii nu au membrana externă în care aceste proteine sunt situate de obicei la bacteriile Gram-negative. De asemenea, FlgH și FlgI nu sunt necesare la Spirochaetes, care au un flagel periplasmic situat în interiorul membranei externe. Firmicutes și Spirochaetes sunt considerate ca fiind două dintre cele mai bazale linii bacteriene (22, 23), ceea ce sugerează că flgH și flgI au apărut după setul central de proteine structurale. În schimb, alte trei gene (fliD, fliE și fliH) sunt prezente în toate grupurile majore, dar lipsesc sporadic din câteva genomuri, mai ales în cazul Alphaproteobacteriilor. Deoarece distribuțiile actuale ale acestor trei gene pot fi atribuite pierderilor secundare, și ele ar trebui să fie considerate ca făcând parte din setul ancestral de gene care specifică flagelul bacterian, aducând totalul genelor de bază la 24.
Prin urmare, sarcina de a elucida evoluția flagelului se bazează pe stabilirea modului în care acest set de 24 de gene structurale a luat naștere. Celelalte gene flagelare rămase, inclusiv cele care joacă roluri reglatoare sau auxiliare în asamblarea și funcția flagelară (cum ar fi regulatorii principali flhC și flhD și gena de control al lungimii cârligului fliK), au distribuții foarte variabile și sunt excluse din setul de bază, chiar dacă se știe că unele dintre gene sunt esențiale pentru buna funcționare a sistemului flagelar la o anumită specie. (Istoriile evolutive ale acestor gene de reglare, împreună cu cea a unui al doilea sistem flagelar bacterian rămân de descris.)
Analiză filogenetică a genelor centrale flagelare.
Pentru a verifica dacă cele 24 de gene care formează setul central flagelar au istorii evolutive congruente între ele, am comparat arborele filogenetic dedus pentru fiecare genă centrală cu cel bazat pe alinierile concatenate ale proteinelor codificate de 14 dintre genele centrale. (Aceste 14 gene au fost selectate deoarece au fost prezente în toate speciile incluse în acest studiu și au codificat proteinele care au o proporție ridicată de poziții aliniate). Pentru fiecare dintre cele 24 de gene, toate ramurile cu valori de bootstrap >75% au fost de acord cu cele din arborele concatenat, ceea ce indică faptul că niciun ordin alternativ de ramificare nu prezintă o susținere puternică și că fiecare dintre aceste gene a urmat o istorie comună în bacterii de la originea lor.
Congruența genelor flagelare cu filogenia organismică a bacteriilor.
Distribuția celor 24 de gene de bază între filamentele bacteriene divergente este cea mai consistentă cu o origine veche, anterioară strămoșului comun al bacteriilor. Cu toate acestea, distribuția ar fi putut fi obținută prin transfer orizontal ulterior. Am testat aceste alternative prin compararea filogeniei proteinelor de bază flagelare cu filogenia filamentelor bacteriene corespunzătoare pe baza a 25 de gene distribuite universal. Filogeniile sunt în mare măsură congruente pe ramuri care au >75% suport bootstrap; cu toate acestea, există două inconsecvențe între genele de bază și filogenia organismelor; în plasarea atât a alphaproteobacteriei Zymomonas mobilis, cât și a unei clade de trei Betaproteobacterii în cadrul Gammaproteobacteriilor (Fig. 2). Deoarece genele flagelare individuale din cadrul setului de bază prezintă aceeași istorie evolutivă (a se vedea mai sus), aceste neconcordanțe au rezultat probabil din transferul întregului complex de gene flagelare între liniile proteobacteriene după separarea lor de alte grupuri majore de bacterii.
Congruența dintre arborele speciilor și arborele proteinelor flagelare. (A) Arborele speciilor bazat pe alinierea proteică concatenată a 25 de proteine cu o singură copie. (B) Arborele proteinelor flagelare bazat pe alinierea concatenată a proteinelor din 14 proteine de bază flagelare. Grupurile de bacterii sunt umbrite pentru a evidenția neconcordanțele rezultate în urma evenimentelor de transfer de gene.
Proteinele flagelare de bază au apărut prin duplicarea și diversificarea unui singur precursor.
Când fiecare dintre cele 24 de proteine flagelare de bază ale E. coli sunt comparate (prin BLAST) cu toate proteinele codificate în genomul E. coli, cele mai bune și, adesea, singurele lor rezultate sunt cu alte proteine flagelare de bază. Comparațiile perechi între aceste proteine de bază au arătat că zece dintre ele sunt omoloage cu alte proteine de bază atunci când se aplică un prag de valoare electronică de 10-4 (Fig. 3). Acest model indică faptul că genele structurale care specifică porțiunea de flagel care rezidă în afara membranei citoplasmatice (adică tija, cârligul și filamentul) sunt paralogi și au derivat unele din altele prin duplicare.
Rețea de relații între proteinele de bază flagelare. Deasupra fiecărei legături se află numărul de genomuri pentru care omologia dintre o anumită pereche de proteine a fost detectată prin comparație pe perechi la o valoare de tăiere de 10-4 sau mai mică. Liniile albastre care leagă proteinele încadrate în caseta galbenă reprezintă rețeaua de homologie dezvăluită atunci când proteinele de bază ale E. coli au fost supuse comparațiilor pe perechi.
În afară de aceste potriviri cu alte proteine de bază, comparațiile pe perechi ale acestor proteine flagelare cu cele >4.000 de proteine nonflagelare codificate de întregul genom E. coli au recuperat cumulativ un total de numai 24 de rezultate care au atins același nivel de semnificație. Dintre aceste potriviri, jumătate (inclusiv unele cu valori e- de până la 3e -10 față de proteinele de bază flagelare) sunt implicate în alte sisteme de secreție, cum ar fi pilusul P și sistemul de secreție de tip V, ceea ce este în concordanță cu ideea că flagelul și-a avut originea ca sistem de secreție. Alte 10 din cele 24 de rezultate pozitive (cu valori e- variind de la 10-5 la 10-6) sunt proteine de membrană, iar celelalte două sunt proteine ale fibrelor de coadă ale profagelor. Astfel, concluzionăm că, în ciuda vechimii lor, asemănările dintre proteinele de bază între ele sunt mai frecvente și, în medie, mai puternice decât cu proteinele non-flagelare.
Pentru că genele care constituie setul de bază sunt vechi și foarte divergente, este posibil ca unele dintre relațiile dintre gene să nu fie recunoscute din analizele limitate la complexul flagelar E. coli. Am repetat această analiză și am comparat setul de gene de bază al fiecărei alte bacterii flagelate cu toate proteinele codificate în genomurile corespunzătoare și între ele, și am obținut un rezultat similar, și anume, cele mai bune (și adesea singurele) potriviri ale genelor de bază flagelare au fost cu alte gene de bază flagelare. Cu toate acestea, prin extinderea acestei analize dincolo de E. coli, au fost rezolvate relațiile de similitudine și legăturile dintre mai multe alte gene centrale. De exemplu, o potrivire foarte semnificativă între fliM și fliN (care nu a fost detectată pentru omologii E. coli) a fost evidentă în 15 genomuri din diverse subdiviziuni bacteriene (Fig. 3). În plus, componentele de export care interacționează, codificate de fliP, fliR și fliQ, sunt înrudite pe baza secvențelor lor proteice în cadrul mai multor taxoni. Și chiar și printre cele 10 gene de bază din E. coli care inițial au prezentat similitudini între ele, au existat mai multe interconexiuni noi (de exemplu, flgB atât cu flgE, cât și cu flgG și între flgL și flgK) evidențiate prin efectuarea analizei pe alte genomuri. În mod cumulativ, fiecare dintre cele 24 de gene de bază prezintă o similitudine semnificativă cu una sau mai multe dintre celelalte gene de bază (Fig. 3), un model care ar rezulta din proveniența lor succesivă una din alta prin duplicări și/sau fuziuni genetice independente.
Similitudinea dintre proteina proximală a tijei FlgF, proteina distală a tijei FlgG și proteina cârligului FlgE exemplifică relațiile dintre aceste proteine flagelare (Fig. 4). FlgF și FlgG au dimensiuni similare (251 aa vs. 260 aa la E. coli) și prezintă 31% identitate de aminoacizi pe întreaga lor lungime. În schimb, gena flgE este mult mai lungă și pare să fi evoluat de la flgG printr-o duplicare intragenică care a adăugat un domeniu de 160 aa la extremitatea N a proteinei sale codificate. Căutările PSI-BLAST relevă două alinieri semnificative între FlgE și FlgG în E. coli: una cu 24% identitate între întreaga lungime a lui FlgG și terminația C a lui FlgE (156-401 aa), iar cealaltă cu 29% identitate între terminația N a celor două proteine (≈160 aa). Faptul că flgE a evoluat printr-o duplicare este, de asemenea, susținut de faptul că există două versiuni de flgE în genul Bacillus: printre genomurile secvențiate, patru specii (B. subtilis, B. clausii, B. licheniformis și B. halodurans) conțin o versiune mai scurtă, care are o lungime similară cu flgG, iar trei specii (B. thuringiensis, B. cereus și B. anthracis) au versiunea mai lungă.
Similitudinea secvenței proteice între proteina proximală a tijei FlgF, proteina distală a tijei FlgG și proteina cârligului FlgE din E. coli. În timp ce FlgF și FlgG sunt omoloage pe întreaga lor lungime, FlgE conține o duplicare intragenică la extremitatea sa N.
Din matricea de relații și alinieri ale secvențelor proteice ale genelor nucleului flagelar din E. coli, este, de asemenea, posibil să se deducă ordinea în care au apărut multe dintre aceste gene și structurile lor corespunzătoare. Nivelurile scăzute de identitate proteică între acești paralogi, perechile de paralogi sunt între 18% și 32% identice, au necesitat aplicarea unei metode care combină rezultatele unor serii de programe de aliniere multiplă pentru a obține o aliniere consensuală. Alinierile pe regiunile terminale ale proteinelor, în special la terminația C, oferă cea mai mare încredere. Un arbore de unire a vecinilor fără rădăcini și un arbore de probabilitate maximă arată că proteinele tijei își au originea fie în FlgB, fie în FlgC, care sunt ambele proteine scurte, și apoi au generat FlgF și FlgG (și proteina cârlig FlgE) printr-o serie de evenimente de duplicare. Relațiile evolutive ale acestor gene flagelare sunt paralele cu locațiile proteinelor lor codificate în flagelii contemporani. Proteinele tijei proximale, apoi cele distale, preced (atât evolutiv cât și fizic) proteinele cârligului, care au precedat joncțiunea cârlig-filament și proteinele filamentului.
.