Postupné formování bakteriálního bičíkového systému
Výsledky
Definování základní sady bičíkových genů.
Vyhledáním genomů bičíkových bakterií, u nichž jsou k dispozici kompletní sekvence genomu, jsme získali fylogenetické rozložení všech genů, o nichž je známo, že se podílejí na biosyntéze a regulaci bičíků. Abychom prozkoumali původ a evoluci bakteriálního bičíkového systému, použili jsme poté metodu fylogenetického profilování (21) k roztřídění genů do funkčních skupin na základě jejich společného výskytu a sdílené distribuce napříč genomy. Geny s různými funkčními rolemi mají odlišné fylogenetické distribuce a profily; většina genů, jejichž proteinové produkty tvoří strukturní komponenty bičíku, je však přítomna ve všech uvažovaných bakteriálních fylech (obr. 1). Toto rozložení naznačuje, že tato základní sada strukturních genů vznikla před divergencí hlavních bakteriálních linií a zahrnuje 21 genů, které specifikují proteiny tvořící vlákno (fliC, který je často přítomen ve více kopiích), spojení háčku a vlákna (flgK a flgL), háček (flgE, který je přítomen jako pseudogen u Thermotoga maritima), tyčinku (flgB, flgC, flgG a flgF, který chybí pouze u Listeria innocua), MS prstenec (fliF), (fliG, fliM a fliN), motor (motA a motB) a exportní aparát (flhA, flhB, fliI, fliP, fliR a fliQ, který chybí v Clostridium tetani). Kromě toho flgD, kódující háček uzavírající protein, který je nutný pro sestavení bičíku, ale nepodílí se na konečné struktuře, má homology u všech bičíkatých bakterií, a proto byl považován za součást základního souboru.
Rozdělení bičíkatých proteinů (kromě proteinů chemotaxe) mezi druhy bičíkatých bakterií. Ty proteiny, které jsou kódovány jádrovými geny, jsou označeny tučně. Tento obrázek je se svolením překreslen z obrázku uvedeného v databázi KEGG pathway (www.genome.jp/kegg/pathway/eco/eco02040.html).
Další bičíkaté strukturní geny, které jsou široce, ale ne univerzálně rozšířeny mezi bičíkatými druhy, zahrnují flgH, flgI, fliD, fliE a fliH. Nepřítomnost některých z těchto genů v genomu je pochopitelná, jakmile se zváží vlastnosti konkrétních bakterií. Například proteiny L a P kruhu FlgH a FlgI nejsou u Firmicutes nezbytné, protože tyto bakterie nemají vnější membránu, v níž se tyto proteiny u gramnegativních bakterií obvykle nacházejí. FlgH a FlgI nejsou nezbytné ani u Spirochaetes, které mají periplazmatický bičík umístěný uvnitř vnější membrány. Firmicutes a Spirochaetes jsou považovány za dvě nejzákladnější bakteriální linie (22, 23), což naznačuje, že flgH a flgI vznikly až po základní sadě strukturních proteinů. Naproti tomu tři další geny (fliD, fliE a fliH) jsou přítomny ve všech hlavních skupinách, ale v několika genomech ojediněle chybí, nejvýrazněji u alfaproteobakterií. Protože současné rozšíření těchto tří genů lze přičíst sekundární ztrátě, měly by být i ony považovány za součást ancestrální sady genů specifikujících bakteriální bičík, čímž se celkový počet základních genů zvýší na 24.
Úkol objasnit evoluci bičíku tedy spočívá ve zjištění, jak tato sada 24 strukturních genů vznikla. Zbývající bičíkové geny, včetně těch, které hrají regulační nebo pomocnou roli při sestavování a funkci bičíku (jako jsou hlavní regulátory flhC a flhD a gen pro kontrolu délky háčku fliK), mají velmi variabilní rozložení a jsou ze základního souboru vyloučeny, i když je známo, že některé z těchto genů jsou pro správné fungování bičíkového systému u konkrétního druhu nezbytné. (Evoluční historie těchto regulačních genů spolu s historií druhého bakteriálního bičíkového systému ještě nebyla popsána.)
Fylogenetická analýza bičíkových jaderných genů.
Abychom zjistili, zda 24 genů, které tvoří bičíkovou jadernou sadu, má vzájemně shodnou evoluční historii, porovnali jsme fylogenetický strom odvozený pro každý jaderný gen se stromem založeným na konkatenovaných zarovnáních proteinů kódovaných 14 jadernými geny. (Těchto 14 genů bylo vybráno, protože byly přítomny u všech druhů zahrnutých do této studie a kódovaly proteiny s vysokým podílem zarovnatelných pozic). U každého z 24 genů se všechny větve s >75% hodnotami bootstrapu shodovaly s větvemi v konkatenovaném stromu, což naznačuje, že žádné alternativní pořadí větvení nevykazuje silnou podporu a že každý z těchto genů má u bakterií od svého vzniku společnou historii.
Soulad bičíkatých genů s fylogenezí organismů bakterií.
Rozložení 24 základních genů mezi různými bakteriálními fylami nejvíce odpovídá dávnému původu, který předcházel společnému předkovi bakterií. Rozložení však mohlo být dosaženo pozdějším horizontálním přenosem. Tyto alternativy jsme testovali porovnáním fylogeneze bičíkatých jádrových proteinů s fylogenezí odpovídajících bakteriálních fylů na základě 25 univerzálně distribuovaných genů. Fylogeneze se do značné míry shodují na větvích, které mají >75% bootstrapovou podporu; existují však dvě nesrovnalosti mezi fylogenezí jádrových genů a fylogenezí organismů; v umístění jak alfaproteobakterie Zymomonas mobilis, tak klanu tří Betaproteobakterií v rámci Gammaproteobakterií (obr. 2). Vzhledem k tomu, že jednotlivé bičíkové geny v rámci základního souboru vykazují stejnou evoluční historii (viz výše), vznikly tyto nesrovnalosti pravděpodobně v důsledku přenosu celých bičíkových genových komplexů mezi proteobakteriálními liniemi po jejich oddělení od ostatních hlavních skupin bakterií.
Kongruence mezi druhovým stromem a stromem bičíkatých proteinů. (A) Druhový strom založený na konkatenovaném zarovnání 25 proteinů s jednou kopií. (B) Strom bičíkatých proteinů založený na konkatenovaném zarovnání proteinů 14 bičíkatých jádrových proteinů. Bakteriální skupiny jsou vystínovány, aby se zvýraznily nesrovnalosti vyplývající z událostí přenosu genů.
Jádrové bičíkové proteiny vznikly duplikací a diverzifikací jediného prekurzoru.
Pokud se každý z 24 jádrových bičíkových proteinů E. coli porovná (pomocí BLAST) se všemi proteiny kódovanými v genomu E. coli, jejich nejlepší a často jediné shody jsou s jinými jádrovými bičíkovými proteiny. Párová porovnání mezi těmito jádrovými proteiny odhalila, že deset z nich je homologních s jinými jádrovými proteiny, pokud se použije mezní e-hodnota 10-4 (obr. 3). Tento vzorec naznačuje, že strukturní geny specifikující část bičíku sídlící mimo cytoplazmatickou membránu (tj. tyčinka, háček a vlákno) jsou paralogy a byly od sebe odvozeny duplikací.
Síť vztahů mezi bílkovinami bičíkového jádra. Nad každým odkazem je uveden počet genomů, u nichž byla zjištěna homologie mezi určitým párem proteinů párovým srovnáním při mezní hodnotě 10-4 nebo nižší. Modré čáry spojující žlutě označené proteiny znázorňují síť homologie odhalenou při párovém porovnávání jádrových proteinů E. coli.
Kromě těchto shod s jinými jádrovými proteiny bylo párovým porovnáváním těchto bičíkových proteinů se >4 000 ne-bičíkovými proteiny kódovanými celým genomem E. coli získáno kumulativně pouze 24 shod, které dosáhly stejné úrovně významnosti. Mezi těmito shodami se polovina (včetně některých s e-hodnotami pouhých 3e -10 k proteinům bičíkového jádra) podílí na jiných sekrečních systémech, jako je pilus P a sekreční systém typu V, což je v souladu s myšlenkou, že bičík vznikl jako sekreční systém. Dalších 10 z 24 shod (s e-hodnotami v rozmezí 10-5 až 10-6) jsou membránové proteiny a zbývající dva jsou proteiny ocasních vláken profágu. Došli jsme tedy k závěru, že navzdory jejich starobylosti jsou podobnosti mezi jádrovými proteiny navzájem častější a v průměru silnější než s neflagelárními proteiny.
Protože geny, které tvoří jádrovou sadu, jsou starobylé a vysoce divergentní, je možné, že některé vztahy mezi geny nemusí být rozpoznány z analýz omezených na bičíkový komplex E. coli. Zopakovali jsme tuto analýzu a porovnali jádrový soubor genů každé další bičíkovité bakterie se všemi proteiny kódovanými v příslušných genomech a mezi sebou a získali jsme podobný výsledek, tj. nejlepší (a často jediné) shody jádrových genů bičíkovců byly s jinými jádrovými geny bičíkovců. Rozšířením této analýzy mimo E. coli se však podařilo vyřešit podobnostní vztahy a vazby mezi několika dalšími jádrovými geny. Například vysoce významná shoda mezi fliM a fliN (která nebyla zjištěna u homologů E. coli) byla patrná u 15 genomů z různých bakteriálních pododdělení (obr. 3). Kromě toho jsou interagující exportní komponenty kódované fliP, fliR a fliQ příbuzné na základě jejich proteinových sekvencí v rámci několika taxonů. A dokonce i mezi 10 základními geny E. coli, které původně vykazovaly vzájemnou podobnost, bylo provedením analýzy na jiných genomech odhaleno několik nových propojení (např. flgB s flgE i flgG a mezi flgL a flgK). Souhrnně lze říci, že každý z 24 základních genů vykazuje významnou podobnost s jedním nebo více dalšími základními geny (obr. 3), což je vzorec, který by mohl být výsledkem jejich postupného vzniku jeden od druhého nezávislými genovými duplikacemi a/nebo genovými fúzemi.
Podobnost mezi proximálním tyčinkovým proteinem FlgF, distálním tyčinkovým proteinem FlgG a háčkovým proteinem FlgE je příkladem vztahů mezi těmito bičíkovými proteiny (obr. 4). FlgF a FlgG mají podobnou velikost (251 aa vs. 260 aa u E. coli) a vykazují 31% identitu aminokyselin po celé své délce. Naproti tomu gen flgE je mnohem delší a zdá se, že se vyvinul z flgG prostřednictvím intragenové duplikace, která přidala 160aa doménu na N terminus jeho kódovaného proteinu. Vyhledávání PSI-BLAST odhalilo dvě významná zarovnání mezi FlgE a FlgG v E. coli: jedno s 24% identitou mezi celou délkou FlgG a C terminusem FlgE (156-401 aa) a druhé s 29% identitou mezi N terminusem obou proteinů (≈160 aa). To, že se flgE vyvinul duplikací, podporuje také skutečnost, že v rodu Bacillus existují dvě verze flgE: mezi sekvenovanými genomy obsahují čtyři druhy (B. subtilis, B. clausii, B. licheniformis a B. halodurans) kratší verzi, která má podobnou délku jako flgG, a tři druhy (B. thuringiensis, B. cereus a B. anthracis) mají delší verzi.
Podobnost proteinových sekvencí proximálního tyčinkového proteinu FlgF, distálního tyčinkového proteinu FlgG a háčkového proteinu FlgE u E. coli. Zatímco FlgF a FlgG jsou homologní po celé své délce, FlgE obsahuje na svém N-konci intragenovou duplikaci.
Z matice vztahů a zarovnání proteinových sekvencí genů bičíkového jádra E. coli lze také odvodit pořadí, v jakém mnohé z těchto genů a jim odpovídající struktury vznikly. Nízká úroveň identity proteinů mezi těmito paralogy, paralogní páry jsou shodné v rozmezí od 18 % do 32 %, vyžadovala, abychom použili metodu, která kombinuje výstupy řady programů pro vícenásobné zarovnání k získání konsenzuálního zarovnání. Nejvyšší důvěryhodnost poskytují zarovnání v koncových oblastech proteinů, zejména na C-konci. Nezakořeněný strom spojování sousedů a strom maximální pravděpodobnosti ukazují, že tyčinkové proteiny vznikly buď z FlgB, nebo FlgC, což jsou oba krátké proteiny, a poté vznikly FlgF a FlgG (a hákový protein FlgE) prostřednictvím série duplikačních událostí. Evoluční vztahy těchto bičíkových genů jsou paralelní s umístěním jimi kódovaných proteinů v současných bičících. Proximální a posléze distální tyčinkové proteiny předcházejí (evolučně i fyzicky) háčkové proteiny, které předcházely háčkovo-vláknovému spojení a vláknovým proteinům
.