Stegvis bildning av bakteriernas flagellarsystem

Resultat

Definiering av kärnan av flagellargener.

Genom att söka i genomet av flagellerade bakterier för vilka fullständiga genomsekvenser finns tillgängliga har vi fått fram den fylogenetiska fördelningen av varje gen som är känd för att vara involverad i biosyntesen och regleringen av flageller. För att undersöka ursprunget och utvecklingen av det bakteriella flagellarsystemet tillämpade vi sedan en fylogenetisk profileringsmetod (21) för att sortera gener i funktionella grupper baserat på deras samvariation och delade fördelning i olika genomer. Gener med olika funktionella roller har olika fylogenetiska fördelningar och profiler, men de flesta gener vars proteinprodukter utgör flagellans strukturella komponenter finns i alla bakteriefyler som vi har undersökt (fig. 1). Denna fördelning tyder på att denna kärnuppsättning av strukturella gener uppstod före divergensen mellan de stora bakteriella släktena och omfattar 21 gener som specificerar proteiner som bildar filamentet (fliC, som ofta finns i flera kopior), krok-filamentförbindelsen (flgK och flgL), kroken (flgE, som finns som en pseudogen i Thermotoga maritima), staven (flgB, flgC, flgG och flgF, som endast saknas i Listeria innocua), MS-ringen (fliF), C-ringen (fliG, fliM och fliN), motorn (motA och motB) och exportapparaten (flhA, flhB, fliI, fliP, fliR och fliQ, som saknar homolog i Clostridium tetani). Dessutom har flgD, som kodar för det krokbeklädnadsprotein som krävs för flagellarsammansättning men som inte bidrar till den slutliga strukturen, homologer i alla flagellerade bakterier och betraktades därför som en del av kärnuppsättningen.

Fig. 1.

Fördelning av flagellära proteiner (exklusive kemotaxiproteiner) bland flagellerade bakteriearter. De proteiner som kodas av kärngenerna är betecknade med fet stil. Denna figur är omritad med tillstånd från den som finns i KEGG pathway database (www.genome.jp/kegg/pathway/eco/eco02040.html).

Andra flagellära strukturella gener som är brett men inte universellt fördelade över flagellaterade arter inkluderar flgH, flgI, fliD, fliE och fliH. Avsaknaden av vissa av dessa gener i ett genom är förståeligt när man tar hänsyn till de särskilda bakteriernas egenskaper. Till exempel är L- och P-ringproteinerna FlgH och FlgI inte nödvändiga hos Firmicutes eftersom dessa bakterier saknar det yttre membranet där dessa proteiner vanligtvis befinner sig hos gramnegativa bakterier. FlgH och FlgI är inte heller nödvändiga hos Spirochaetes, som har en periplasmatisk flagell som är placerad inuti det yttre membranet. Firmicutes och Spirochaetes betraktas som två av de mest basala bakterielinjerna (22, 23), vilket tyder på att flgH och flgI uppstod efter kärnuppsättningen av strukturella proteiner. Däremot finns tre andra gener (fliD, fliE och fliH) i alla större grupper men saknas sporadiskt i några genomer, mest påtagligt i alfaproteobakterierna. Eftersom dagens fördelning av dessa tre gener kan tillskrivas sekundär förlust, bör även de betraktas som en del av den ursprungliga uppsättningen gener som specificerar bakterieflagellen, vilket innebär att det totala antalet kärngener uppgår till 24.

Därmed vilar uppgiften att belysa flagellens utveckling på att fastställa hur denna uppsättning av 24 strukturella gener har uppkommit. De återstående flagellära generna, inklusive de som spelar en reglerande eller hjälpande roll i flagellärans sammansättning och funktion (t.ex. huvudregulatorerna flhC och flhD och genen för kontroll av kroklängden fliK), har en mycket varierande fördelning och utesluts från kärnuppsättningen, även om det är känt att en del av generna är nödvändiga för att flagellärsystemet ska fungera korrekt hos en viss art. (Den evolutionära historien för dessa reglerande gener, tillsammans med den för ett andra bakteriellt flagellarsystem, återstår att beskriva.)

Fylogenetisk analys av flagellarsystemets kärngener.

För att fastställa om de 24 gener som bildar flagellarsystemets kärnuppsättning har en kongruent evolutionär historia med varandra jämförde vi det fylogenetiska trädet som härleddes för varje kärngen med det som baserades på sammanlänkade anpassningar av de proteiner som kodas av 14 av kärngenerna. (Dessa 14 gener valdes ut eftersom de fanns i alla arter som ingick i den här studien och kodade för de proteiner som hade en hög andel aligerbara positioner). För var och en av de 24 generna stämde alla grenar med >75% bootstrap-värden överens med dem i det sammanlänkade trädet, vilket indikerar att inga alternativa förgreningsordningar uppvisar starkt stöd och att var och en av dessa gener har följt en gemensam historia i bakterier sedan de uppstod.

Samstämmighet mellan flagellargener och bakteriernas organismfylogeni.

Fördelningen av de 24 kärngenerna bland divergerande bakteriefyler är mest förenlig med ett gammalt ursprung, som föregår bakteriernas gemensamma förfader. Fördelningen kan dock ha uppnåtts genom senare horisontell överföring. Vi testade dessa alternativ genom att jämföra fylogenin för flagellära kärnproteiner med fylogenin för motsvarande bakteriefyla baserat på 25 universellt fördelade gener. Fylogenierna är i stort sett kongruenta på grenar som har >75% bootstrap-stöd; det finns dock två inkonsekvenser mellan kärngenerna och organismfylogenierna; i placeringen av både alfaproteobakterien Zymomonas mobilis och en klad av tre Betaproteobakterier inom Gammaproteobakterierna (fig. 2). Eftersom enskilda flagellargener inom kärnuppsättningen uppvisar samma utvecklingshistoria (se ovan) har dessa inkongruenser troligen uppstått genom överföring av hela flagellargenkomplex mellan proteobakteriella linjer efter deras separation från andra större bakteriegrupper.

Fig. 2.

Kongruens mellan artträdet och flagellära proteinträdet. (A) Artträd baserat på sammanlänkad proteinjustering av 25 enkelkopierade proteiner. (B) Flagellärt proteinträd baserat på sammanlänkad proteinjustering av 14 flagellära kärnproteiner. Bakteriegrupper är skuggade för att framhäva inkongruenser till följd av genöverföring.

Flagellära kärnproteiner uppstod genom duplicering och diversifiering av en enskild prekursor.

När vart och ett av E. coli:s 24 flagellära kärnproteiner jämförs (via BLAST) med alla proteiner som kodas i E. coli-genomet, är deras bästa och ofta enda träff andra flagellära kärnproteiner. Parvisa jämförelser mellan dessa kärnproteiner visade att tio är homologa med andra kärnproteiner när man tillämpar ett e-värde på 10-4 (fig. 3). Detta mönster tyder på att de strukturella gener som specificerar den del av flagellen som befinner sig utanför cytoplasmimembranet (dvs. staven, kroken och filamentet) är paraloger och härstammar från varandra genom duplikationer.

Fig. 3.

Nätverk av relationer mellan flagellära kärnproteiner. Ovanför varje länk står antalet genomer för vilka homologi mellan ett visst proteinpar upptäcktes genom parvis jämförelse vid ett gränsvärde på 10-4 eller lägre. Blå linjer som förbinder gulmarkerade proteiner visar det homologinätverk som avslöjades när E. coli:s kärnproteiner utsattes för parvisa jämförelser.

Bortsett från dessa träffar på andra kärnproteiner gav parvisa jämförelser av dessa flagellära proteiner med de >4 000 icke-flagellära proteiner som hela E. coli-genomet kodar för totalt endast 24 träffar som uppnådde samma signifikansnivå. Av dessa träffar är hälften (inklusive några med e-värden så låga som 3e -10 till flagellära kärnproteiner) involverade i andra sekretionssystem, t.ex. P-pilus och typ V-sekretionssystemet, vilket stämmer överens med idén att flagellen har sitt ursprung som ett sekretionssystem. Ytterligare 10 av de 24 träffarna (med e-värden som varierar mellan 10-5 och 10-6) är membranproteiner, och de återstående två är profagens svansfiberproteiner. Således drar vi slutsatsen att trots deras ålderdom är likheterna mellan kärnproteiner till varandra vanligare och i genomsnitt starkare än till icke-flagellära proteiner.

Då de gener som utgör kärnuppsättningen är gamla och starkt divergerande är det möjligt att vissa av relationerna mellan generna inte skulle kunna kännas igen från analyser som är begränsade till E. coli-flagellärkomplexet. Vi upprepade denna analys och jämförde kärngenuppsättningen för varje annan flagellbakterie med alla proteiner som kodas i motsvarande genom och sinsemellan, och vi fick ett liknande resultat, dvs. de bästa (och ofta de enda) träffarna för flagellkärngenerna var till andra flagellkärngener. Genom att utvidga denna analys utanför E. coli löstes dock likhetsrelationerna och kopplingarna mellan flera andra kärngener. Till exempel fanns en mycket signifikant överensstämmelse mellan fliM och fliN (som inte upptäcktes för E. coli-homologer) i 15 genomer från olika bakteriella underavdelningar (fig. 3). Dessutom är de interagerande exportkomponenter som kodas av fliP, fliR och fliQ besläktade baserat på deras proteinsekvenser inom flera taxa. Och även bland de tio E. coli-kärngener som ursprungligen uppvisade likheter med varandra fanns det flera nya sammankopplingar (t.ex. flgB till både flgE och flgG och mellan flgL och flgK) som avslöjades genom att utföra analysen på andra genomer. Sammantaget uppvisar var och en av de 24 kärngenerna betydande likheter med en eller flera av de andra kärngenerna (fig. 3), ett mönster som skulle vara ett resultat av att de successivt uppkommit från varandra genom oberoende genduplikationer och/eller genfusioner.

Likheten mellan det proximala stavproteinet FlgF, det distala stavproteinet FlgG och krokproteinet FlgE exemplifierar relationerna mellan dessa flagellära proteiner (fig. 4). FlgF och FlgG är av liknande storlek (251 aa mot 260 aa i E. coli) och uppvisar 31 % aminosyraidentitet över hela sin längd. Däremot är flgE-genen mycket längre och verkar ha utvecklats från flgG genom en intragen duplikation som lade till en 160-aa-domän till N-terminalen av dess kodade protein. PSI-BLAST-sökningar avslöjar två signifikanta anpassningar mellan FlgE och FlgG i E. coli: en med 24 % identitet mellan hela längden av FlgG och Cterminus av FlgE (156-401 aa), och den andra med 29 % identitet mellan N-terminus av två proteiner (≈160 aa). Att flgE utvecklats genom en duplikation stöds också av det faktum att det finns två versioner av flgE i släktet Bacillus: bland sekvenserade genomer innehåller fyra arter (B. subtilis, B. clausii, B. licheniformis och B. halodurans) en kortare version, som har samma längd som flgG, och tre arter (B. thuringiensis, B. cereus och B. anthracis) har den längre versionen.

Fig. 4.

Proteinsekvenslikhet mellan det proximala stavproteinet FlgF, det distala stavproteinet FlgG och krokproteinet FlgE i E. coli. Medan FlgF och FlgG är homologa över hela sin längd innehåller FlgE en intragen duplikation vid sin N-terminus.

Utifrån matrisen av relationer och proteinsekvensanpassningar av flagellära kärngener i E. coli är det också möjligt att härleda i vilken ordning många av dessa gener och deras motsvarande strukturer har sitt ursprung. De låga nivåerna av proteinidentitet bland dessa paraloger, paraloga par är mellan 18 % och 32 % identiska, krävde att vi tillämpade en metod som kombinerar resultatet från serier av flera anpassningsprogram för att härleda en konsensusanpassning. Anpassningarna på proteinernas ändregioner, särskilt vid C-terminalen, ger det högsta förtroendet. Ett orotat grannföreningsträd och ett maximalt sannolikhetsträd visar att stavproteinerna har sitt ursprung i antingen FlgB eller FlgC, som båda är korta proteiner, och att de sedan genererade FlgF och FlgG (och krokproteinet FlgE) genom en rad duplikationshändelser. De evolutionära relationerna mellan dessa flagellgener är parallella med placeringen av deras kodade proteiner i nutida flageller. De proximala och sedan distala stavproteinerna föregår (både evolutionärt och fysiskt) krokproteinerna, som föregick krok-filamentförbindelsen och filamentproteinerna.