A bakteriális flagelláris rendszer fokozatos kialakulása

Eredmények

Defining the Core Set of Flagellar Genes.

A flagellás baktériumok azon genomjainak lekérdezésével, amelyek teljes genomszekvenciái rendelkezésre állnak, megkaptuk a flagellák bioszintézisében és szabályozásában részt vevő összes ismert gén filogenetikai eloszlását. A bakteriális flagelláris rendszer eredetének és evolúciójának vizsgálatához ezután egy filogenetikai profilalkotó módszert (21) alkalmaztunk, hogy a géneket funkcionális csoportokba soroljuk a genomokban való együttes előfordulásuk és közös eloszlásuk alapján. A különböző funkcionális szerepű gének eltérő filogenetikai eloszlással és profilokkal rendelkeznek; azonban a legtöbb olyan gén, amelynek fehérjetermékei a flagellum szerkezeti összetevőit alkotják, minden vizsgált bakteriális filában jelen van (1. ábra). Ez az eloszlás arra utal, hogy a strukturális géneknek ez a magkészlete a fő baktériumcsaládok divergenciája előtt keletkezett, és 21 olyan gént tartalmaz, amelyek a fonalat (fliC, amely gyakran több példányban is jelen van), a kampó-filament csomópontot (flgK és flgL), a kampót (flgE, amely pszeudogénként van jelen a Thermotoga maritima-ban), a rudat (flgB, flgC, flgG és flgF, amely csak a Listeria innocua-ban hiányzik), az MS-gyűrűt (fliF), a C-gyűrű (fliG, fliM és fliN), a motor (motA és motB), és az export apparátus (flhA, flhB, fliI, fliP, fliR és fliQ, amelynek nincs homológja a Clostridium tetani-ban). Ezen kívül az flgD-nek, amely a kampófedő fehérjét kódolja, amely szükséges a flagelláris összeszereléshez, de nem járul hozzá a végső szerkezethez, minden flagellás baktériumban van homológja, ezért az alapkészlet részének tekintettük.

1. ábra.

A flagelláris fehérjék (kivéve a kemotaxis fehérjéket) megoszlása a flagellás baktériumfajok között. A core gének által kódolt fehérjéket félkövérrel jelöltük. Ez az ábra a KEGG útvonal-adatbázisban (www.genome.jp/kegg/pathway/eco/eco02040.html) megjelenő ábra engedélyével átrajzolva.

A flagelláris szerkezeti gének közül az flgH, flgI, fliD, fliE és fliH széles körben, de nem általánosan elterjedt a flagellált fajok között. Ezen gének némelyikének hiánya a genomból érthető, ha figyelembe vesszük az adott baktérium jellemzőit. Például az L- és P-gyűrű fehérjék FlgH és FlgI nem szükségesek a Firmicutes fajokban, mivel ezeknél a baktériumoknál hiányzik a külső membrán, amelyben ezek a fehérjék jellemzően a Gram-negatív baktériumoknál helyezkednek el. Az FlgH és az FlgI szintén nem szükséges a Spirochaetesekben, amelyeknek a külső membránon belül található periplazmás flagellumuk van. A Firmicutes és a Spirochaetes a két legbazálisabb bakteriális vonalnak tekinthető (22, 23), ami arra utal, hogy az flgH és az flgI a strukturális fehérjék magkészlete után keletkezett. Ezzel szemben három másik gén (fliD, fliE és fliH) minden nagyobb csoportban jelen van, de szórványosan hiányzik néhány genomból, leginkább az Alphaproteobaktériumokból. Mivel e három gén mai eloszlása másodlagos elvesztésnek tulajdonítható, ezeket is a bakteriális flagellumot specifikáló ősi génkészlet részének kell tekinteni, így a központi gének száma 24-re emelkedik.

A flagellum evolúciójának felderítése tehát azon múlik, hogy megállapítsuk, hogyan keletkezett ez a 24 szerkezeti génből álló készlet. A fennmaradó flagelláris gének, beleértve azokat is, amelyek szabályozó vagy segítő szerepet játszanak a flagelláris felépítésében és működésében (mint például a flhC és flhD mesterregulátorok, valamint a kampó hosszát szabályozó fliK gén), nagyon változó eloszlásúak, és ki vannak zárva a magkészletből, még akkor is, ha néhány génről tudjuk, hogy elengedhetetlen a flagelláris rendszer megfelelő működéséhez egy adott fajban. (Ezeknek a szabályozó géneknek az evolúciós története, valamint egy másik bakteriális flagelláris rendszer evolúciós története még leírásra vár.)

A flagelláris maggének filogenetikai elemzése.

Hogy megbizonyosodjunk arról, hogy a flagelláris magkészletet alkotó 24 gén evolúciós története egybeesik-e egymással, összehasonlítottuk az egyes maggénekre levezetett filogenetikai fát azzal, amely a 14 maggén által kódolt fehérjék konkatenált igazításán alapul. (Ezt a 14 gént azért választottuk ki, mert a vizsgálatba bevont valamennyi fajban jelen voltak, és azokat a fehérjéket kódolták, amelyeknek magas volt az igazítható pozíciók aránya). Mind a 24 gén esetében az összes >75%-os bootstrap-értékkel rendelkező ág megegyezett a konkatenált fa ágaival, ami azt jelzi, hogy egyetlen alternatív elágazási sorrend sem mutat erős támogatást, és hogy e gének mindegyike közös történetet követett a baktériumokban keletkezése óta.

A flagelláris gének egyezése a baktériumok szervezeti filogeniájával.

A 24 központi gén eloszlása az eltérő bakteriális phylák között leginkább egy ősi, a baktériumok közös ősét megelőző eredetnek felel meg. Az eloszlás azonban későbbi horizontális transzfer révén is létrejöhetett. Ezeket az alternatívákat úgy teszteltük, hogy a flagelláris magfehérjék filogenezisét összehasonlítottuk a megfelelő baktériumtörzsek filogenezisével, amely 25 általánosan elterjedt gén alapján készült. A filogeniák nagyrészt egybeesnek azokon az ágakon, amelyek >75%-os bootstrap-támogatással rendelkeznek; azonban két ellentmondás van a core-gén és a szervezetek filogeniája között; mind az alfaproteobaktérium Zymomonas mobilis, mind egy három Betaproteobaktériumból álló klád elhelyezése a Gammaproteobaktériumokon belül (2. ábra). Mivel az egyes flagelláris gének a magkészleten belül ugyanazt az evolúciós történetet mutatják (lásd fentebb), ezek az inkongruenciák valószínűleg a teljes flagelláris génkomplexek proteobaktérium-vonalak közötti átviteléből adódtak, miután azok elkülönültek a többi nagy baktériumcsoporttól.

2. ábra.

A fajfa és a flagelláris fehérjefa közötti összhang. (A) Fajfa 25 egykópiás fehérje konkatenált fehérjeillesztésén alapuló fajfa. (B) Flagelláris fehérjefa 14 flagelláris magfehérje konkatenált fehérjeillesztése alapján. A baktériumcsoportok árnyékolva vannak, hogy kiemeljék a génátviteli eseményekből eredő inkongruenciákat.

A flagelláris magfehérjék egyetlen prekurzor duplikációja és diverzifikációja révén keletkeztek.

Amikor az E. coli 24 flagelláris magfehérjéjének mindegyikét összehasonlítjuk (BLAST segítségével) az E. coli genomban kódolt összes fehérjével, a legjobb és gyakran egyetlen találatuk más flagelláris magfehérjékkel van. A magfehérjék közötti páros összehasonlítások azt mutatták, hogy tíz homológ más magfehérjékkel, ha 10-4-es e-értéket alkalmazunk (3. ábra). Ez a mintázat azt jelzi, hogy a flagellum citoplazmamembránon kívüli részét (azaz a rudat, a kampót és a filamentumot) specifikáló szerkezeti gének paralógok, és duplikációk révén származtak egymástól.

3. ábra.

A flagelláris magfehérjék közötti kapcsolatrendszer. Minden kapcsolat felett azoknak a genomoknak a száma látható, amelyek esetében az adott fehérjepár közötti homológiát páronkénti összehasonlítással 10-4 vagy annál alacsonyabb cutoff-értékkel detektálták. A sárga keretes fehérjéket összekötő kék vonalak az E. coli magfehérjék páronkénti összehasonlításakor feltárt homológiahálózatot ábrázolják.

A többi magfehérjével való ilyen egyezések mellett e flagelláris fehérjéknek a teljes E. coli genom által kódolt >4000 nem flagelláris fehérjével való páronkénti összehasonlítása összesen csak 24 olyan találatot eredményezett, amelyek ugyanezt a szignifikancia szintet érték el. Ezen találatok fele (köztük néhány olyan, amelynek e-értéke a flagelláris magfehérjékhez képest mindössze 3e -10) más szekréciós rendszerekben, például a P piluszban és az V. típusú szekréciós rendszerben vesz részt, ami összhangban van azzal az elképzeléssel, hogy a flagellum eredetileg szekréciós rendszerként alakult ki. A 24 találatból további 10 (10-5 és 10-6 közötti e-értékkel) membránfehérje, a fennmaradó kettő pedig profág farokrostfehérje. Így arra a következtetésre jutottunk, hogy régiségük ellenére a magfehérjék egymáshoz való hasonlóságai gyakoribbak és átlagosan erősebbek, mint a nem flagelláris fehérjékhez.

Mivel a magkészletet alkotó gének ősi és erősen divergáltak, lehetséges, hogy a gének közötti kapcsolatok egy része nem ismerhető fel az E. coli flagelláris komplexre korlátozódó elemzésekből. Megismételtük ezt az elemzést, és összehasonlítottuk az összes többi flagelláris baktérium maggénkészletét a megfelelő genomokban és egymás között kódolt összes fehérjével, és hasonló eredményt kaptunk, azaz a flagelláris maggének legjobb (és gyakran egyetlen) találatai más flagelláris maggénekkel voltak. Ezt az elemzést azonban az E. coli-n túlra kiterjesztve számos más maggén közötti hasonlósági kapcsolatokat és kapcsolatokat sikerült feloldani. Például a fliM és a fliN között (az E. coli homológjainál nem észlelt) rendkívül szignifikáns egyezés volt kimutatható 15 genomban, amelyek különböző bakteriális alosztályokból származtak (3. ábra). Ezenkívül a fliP, fliR és fliQ által kódolt kölcsönhatásban lévő exportkomponensek a fehérjeszekvenciáik alapján több taxonban is rokonok. És még az eredetileg egymáshoz hasonlóságot mutató 10 E. coli maggén között is számos új összeköttetést (pl. az flgB az flgE és az flgG génhez is, valamint az flgL és az flgK között) tárt fel az elemzés más genomokon történő elvégzése. Összességében a 24 maggén mindegyike jelentős hasonlóságot mutat egy vagy több másik maggénnel (3. ábra), amely mintázatot az egymástól független génduplikációk és/vagy génfúziók révén történő egymást követő keletkezésük eredményezheti.

A proximális rúdfehérje FlgF, a disztális rúdfehérje FlgG és a kampófehérje FlgE közötti hasonlóság jól példázza az e flagelláris fehérjék közötti kapcsolatokat (4. ábra). Az FlgF és az FlgG hasonló méretűek (251 aa vs. 260 aa az E. coli-ban) és 31%-os aminosav azonosságot mutatnak teljes hosszukban. Ezzel szemben az flgE gén sokkal hosszabb, és úgy tűnik, hogy az flgG-ből fejlődött ki egy intragenikus duplikáció révén, amely a kódolt fehérje N-terminusához egy 160-aa doménnel egészítette ki. A PSI-BLAST keresések két jelentős illeszkedést mutatnak az E. coliban lévő FlgE és FlgG között: az egyik 24%-os azonosságot mutat az FlgG teljes hossza és az FlgE C-terminusa között (156-401 aa), a másik pedig 29%-os azonosságot a két fehérje N-terminusa között (≈160 aa). Azt, hogy az flgE duplikációval fejlődött ki, az is alátámasztja, hogy a Bacillus nemzetségben az flgE-nek két változata létezik: a szekvenált genomok közül négy faj (B. subtilis, B. clausii, B. licheniformis és B. halodurans) a rövidebb, az flgG-hez hasonló hosszúságú változatot, három faj (B. thuringiensis, B. cereus és B. anthracis) pedig a hosszabb változatot tartalmazza.

4. ábra.

A proximális rúdfehérje FlgF, a disztális rúdfehérje FlgG és a kampófehérje FlgE közötti fehérjeszekvencia-hasonlóság E. coli-ban. Míg az FlgF és az FlgG teljes hosszukban homológok, az FlgE az N-terminusán egy intragenikus duplikációt tartalmaz.

Az E. coli flagelláris maggénjeinek kapcsolati mátrixából és a fehérjeszekvenciák összehangolásából arra is lehet következtetni, hogy számos ilyen gén és a hozzájuk tartozó struktúrák milyen sorrendben keletkeztek. A fehérjeazonosság alacsony szintje e paralógok között, a paralóg párok 18% és 32% közötti azonosságot mutatnak, szükségessé tette, hogy egy olyan módszert alkalmazzunk, amely többféle illesztési programsorozat kimenetét kombinálja egy konszenzusos illesztés levezetése érdekében. A fehérjék terminális régióinak, különösen a C-terminusnak az összehangolása nyújtja a legnagyobb megbízhatóságot. A gyökértelen szomszéd-összekötő fa és a maximális valószínűségű fa azt mutatja, hogy a rúdfehérjék vagy az FlgB vagy az FlgC fehérjékből származnak, amelyek mindkettő rövid fehérje, majd egy sor duplikációs eseményen keresztül létrehozták az FlgF és az FlgG (és a kampófehérje FlgE) fehérjéket. E flagellagének evolúciós kapcsolatai párhuzamosak az általuk kódolt fehérjék elhelyezkedésével a mai flagellákban. A proximális, majd a disztális rúdfehérjék megelőzik (mind evolúciósan, mind fizikailag) a horogfehérjéket, amelyek megelőzték a horog-filament csomópont és a filament fehérjéket.