Stapsgewijze vorming van het bacterieel flagellair systeem
Results
Defining the Core Set of Flagellar Genes.
Door het bevragen van de genomen van gevlagelleerde bacteriën waarvoor volledige genoomsequenties beschikbaar zijn, verkregen we de fylogenetische distributie van elk gen waarvan bekend is dat het betrokken is bij de biosynthese en regulatie van flagella. Om de oorsprong en evolutie van het bacteriële flagellasysteem te onderzoeken, hebben we vervolgens een fylogenetische profileringsmethode (21) toegepast om genen in functionele groepen te rangschikken op basis van hun co-occurentie en gedeelde distributies over de genomen. Genen met verschillende functionele rollen hebben verschillende fylogenetische distributies en profielen; de meeste genen waarvan de eiwitproducten de structurele componenten van het flagellum vormen zijn echter aanwezig in alle beschouwde bacteriële fyla (Fig. 1). Deze verdeling suggereert dat deze kern van structurele genen is ontstaan vóór de divergentie van de belangrijkste bacteriële lijnen en omvat 21 genen die eiwitten specificeren die het filament vormen (fliC, dat vaak in meervoudige kopieën aanwezig is), de haak-filament junctie (flgK en flgL), de haak (flgE, die als pseudogeen aanwezig is in Thermotoga maritima), de staaf (flgB, flgC, flgG, en flgF, die alleen ontbreekt in Listeria innocua), de MS-ring (fliF), de C-ring (fliG, fliM en fliN), de motor (motA en motB), en het uitvoerapparaat (flhA, flhB, fliI, fliP, fliR en fliQ, waarvan een homoloog in Clostridium tetani ontbreekt). Bovendien heeft flgD, dat codeert voor het haak-afdekeiwit, dat nodig is voor de flagellaire assemblage maar niet bijdraagt tot de uiteindelijke structuur, homologe cellen in alle gevlagelleerde bacteriën en werd daarom beschouwd als deel van de kernverzameling.
Distributie van flagellaire proteïnen (met uitzondering van chemotaxis proteïnen) onder gevlagelleerde bacteriesoorten. De eiwitten die door de kerngenen worden gecodeerd, zijn vetgedrukt. Deze figuur is met toestemming overgenomen uit de KEGG pathway database (www.genome.jp/kegg/pathway/eco/eco02040.html).
Andere flagellaire structurele genen die breed maar niet universeel verspreid zijn over de flagellatensoorten zijn flgH, flgI, fliD, fliE, en fliH. De afwezigheid van bepaalde van deze genen in een genoom is begrijpelijk wanneer de kenmerken van de specifieke bacterie in aanmerking worden genomen. Zo zijn de L- en P-ringeiwitten FlgH en FlgI niet noodzakelijk in de Firmicutes, omdat deze bacteriën het buitenmembraan missen waarin deze eiwitten zich typisch in Gram-negatieve bacteriën bevinden. FlgH en FlgI zijn evenmin noodzakelijk in Spirochaeten, die een periplasmatisch flagellum hebben dat zich binnen het buitenmembraan bevindt. De Firmicutes en Spirochaetes worden beschouwd als twee van de meest basale bacteriële lijnen (22, 23), wat suggereert dat flgH en flgI zijn ontstaan na de kernverzameling van structurele eiwitten. Drie andere genen (fliD, fliE en fliH) daarentegen zijn aanwezig in alle grote groepen, maar ontbreken sporadisch in enkele genomen, het meest opvallend in de Alphaproteobacteria. Omdat de huidige verspreiding van deze drie genen kan worden toegeschreven aan secundair verlies, moeten ook zij worden beschouwd als deel van de voorouderlijke reeks genen die het bacterieel flagellum specificeren, waarmee het totaal van de kerngenen op 24 komt.
Daarom berust de taak van het ophelderen van de evolutie van het flagellum op het vaststellen hoe deze reeks van 24 structurele genen is ontstaan. De resterende flagellaire genen, met inbegrip van die welke een regulerende of ondersteunende rol spelen bij de assemblage en functie van het flagellum (zoals de hoofdregulatoren flhC en flhD, en het haaklengte-controlegen fliK), hebben zeer variabele distributies en zijn uitgesloten van de kernverzameling, ook al is van sommige van de genen bekend dat zij essentieel zijn voor het goed functioneren van het flagellarsysteem in een bepaalde soort. (De evolutionaire geschiedenis van deze regulatorische genen, samen met die van een tweede bacterieel flagellair systeem moet nog worden beschreven.)
Phylogenetische analyse van flagellaire kerngenen.
Om na te gaan of de 24 genen die de flagellaire kernreeks vormen een congruente evolutionaire geschiedenis met elkaar hebben, vergeleken we de fylogenetische boom die voor elk kerngen werd afgeleid met die op basis van samengevoegde alignementen van eiwitten die door 14 van de kerngenen worden gecodeerd. (Deze 14 genen werden geselecteerd omdat ze aanwezig waren in alle soorten die in deze studie werden opgenomen en omdat ze codeerden voor eiwitten met een hoog aandeel aan aligneerbare posities). Voor elk van de 24 genen kwamen alle takken met >75% bootstrap-waarden overeen met die in de samengevoegde boom, wat erop wijst dat geen enkele alternatieve vertakkingsvolgorde sterke steun vertoont en dat elk van deze genen sinds hun ontstaan een gemeenschappelijke geschiedenis in bacteriën heeft gevolgd.
Congruentie van Flagellaire Genen met Organismale Fylogenie van Bacteria.
De verdeling van de 24 kerngenen over uiteenlopende bacteriële fyla’s is het meest consistent met een oude oorsprong, die voorafgaat aan de gedeelde voorouder van Bacteria. De verdeling zou echter ook door latere horizontale overdracht tot stand kunnen zijn gekomen. Wij hebben deze alternatieven getest door de fylogenie van de flagellaire kernproteïnen te vergelijken met de fylogenie van de corresponderende bacteriële fyla op basis van 25 universeel verdeelde genen. De fylogenieën zijn grotendeels congruent op takken die >75% bootstrap steun hebben; er zijn echter twee inconsistenties tussen de kern-gen en de organismale fylogenieën; in de plaatsing van zowel de alfaproteobacteriële Zymomonas mobilis als een clade van drie Betaproteobacteria binnen de Gammaproteobacteria (Fig. 2). Omdat individuele flagellaire genen binnen de kerngroep dezelfde evolutionaire geschiedenis vertonen (zie boven), zijn deze ongerijmdheden waarschijnlijk het gevolg van de overdracht van de gehele flagellaire gencomplexen tussen proteobacteriële lijnen na hun afscheiding van andere grote bacteriegroepen.
Congruentie tussen soortenboom en flagellaire eiwitboom. (A) Soortenboom gebaseerd op de aaneenschakeling van 25 enkelvoudige kopieën van eiwitten. (B) Flagellaire eiwitboom gebaseerd op de aaneenschakeling van 14 flagellaire kernproteïnen. Bacteriële groepen zijn gearceerd om incongruenties als gevolg van genoverdracht te markeren.
Kern flagellaire proteïnen zijn ontstaan door verdubbeling en diversificatie van een enkele precursor.
Wanneer elk van de 24 kern flagellaire proteïnen van E. coli worden vergeleken (via BLAST) met alle proteïnen gecodeerd in het E. coli genoom, zijn hun beste en vaak enige treffers die met andere kern flagellaire proteïnen. Paar-wise vergelijkingen tussen deze kern-eiwitten toonden aan dat er tien homoloog zijn met andere kern-eiwitten wanneer een e-waarde cutoff van 10-4 wordt toegepast (Fig. 3). Dit patroon geeft aan dat de structurele genen die het gedeelte van het flagellum specificeren dat zich buiten het cytoplasmamembraan bevindt (d.w.z. de staaf, de haak en het filament) paralogen zijn en door duplicaties van elkaar werden afgeleid.
Netwerk van relaties tussen flagellaire kernproteïnen. Boven elke link is het aantal genomen waarvoor homologie tussen een bepaald eiwit paar werd gedetecteerd door paarsgewijze vergelijking bij een cutoff waarde van 10-4 of lager. Blauwe lijnen die geel omlijnde proteïnen verbinden, geven het homologienetwerk weer dat werd onthuld toen kernproteïnen van E. coli werden onderworpen aan paarsgewijze vergelijkingen.
Afgezien van deze overeenkomsten met andere kernproteïnen, leverden paarsgewijze vergelijkingen van deze flagellaire proteïnen met de >4.000 niet-flagellaire proteïnen die door het volledige genoom van E. coli werden gecodeerd, cumulatief slechts 24 treffers op die hetzelfde significantieniveau bereikten. Van deze overeenkomsten is de helft (waaronder enkele met e-waarden zo laag als 3e -10 voor de flagellaire kernproteïnen) betrokken bij andere secretiesystemen, zoals de P pilus en het Type V secretiesysteem, hetgeen consistent is met het idee dat het flagellum is ontstaan als een secretiesysteem. Nog eens 10 van de 24 treffers (met e-waarden variërend van 10-5 tot 10-6) zijn membraaneiwitten, en de resterende twee zijn prophage staartvezel-eiwitten. Aldus concluderen wij dat, ondanks hun ouderdom, de overeenkomsten tussen de kern-eiwitten onderling meer voorkomen en gemiddeld sterker zijn dan met niet-flagellaire eiwitten.
Omdat de genen die de kern vormen oud zijn en sterk gedivergeerd, is het mogelijk dat sommige van de relaties tussen de genen niet herkend zouden kunnen worden uit analyses die beperkt zijn tot het flagellaire complex van E. coli. Wij herhaalden deze analyse en vergeleken de kerngenenset van elke andere geflagelleerde bacterie met alle eiwitten die gecodeerd worden in de overeenkomstige genomen en onderling, en wij verkregen een gelijkaardig resultaat, d.w.z., de beste (en dikwijls de enige) treffers van de flagellaire kerngenen waren met andere flagellaire kerngenen. Door deze analyse echter uit te breiden tot buiten E. coli, werden de gelijkenis-relaties en verbanden tussen verschillende andere kerngenen opgelost. Bijvoorbeeld, een zeer significante overeenkomst tussen fliM en fliN (die niet werd gedetecteerd voor E. coli homologs) was duidelijk in 15 genomen van diverse bacteriële onderverdelingen (Fig. 3). Bovendien zijn de op elkaar inwerkende exportcomponenten die gecodeerd worden door fliP, fliR, en fliQ verwant op basis van hun eiwitsequenties binnen verschillende taxa. En zelfs onder de 10 E. coli kerngenen die oorspronkelijk gelijkenis vertoonden met elkaar, waren er verscheidene nieuwe onderlinge verbanden (b.v. flgB met zowel flgE als flgG, en tussen flgL en flgK) die aan het licht kwamen door de analyse op andere genomen uit te voeren. Cumulatief vertoont elk van de 24 kerngenen significante overeenkomsten met één of meer van de andere kerngenen (Fig. 3), een patroon dat het resultaat zou zijn van hun opeenvolgende oorsprong uit elkaar door onafhankelijke gen duplicaties en/of gen fusies.
De overeenkomst tussen het proximale staaf-eiwit FlgF, het distale staaf-eiwit FlgG, en het haak-eiwit FlgE illustreert de relaties tussen deze flagellaire eiwitten (Fig. 4). FlgF en FlgG zijn van vergelijkbare grootte (251 aa vs. 260 aa in E. coli) en vertonen 31% aminozuuridentiteit over hun gehele lengte. Daarentegen is het flgE gen veel langer en lijkt het te zijn geëvolueerd uit flgG door een intragene duplicatie die een 160-aa domein toevoegde aan de N terminus van zijn gecodeerd eiwit. PSI-BLAST opzoekingen onthullen twee significante overeenkomsten tussen FlgE en FlgG in E. coli: één met 24% identiteit tussen de gehele lengte van FlgG en de C terminus van FlgE (156-401 aa), en de andere met 29% identiteit tussen de N terminus van twee eiwitten (≈160 aa). Dat flgE is geëvolueerd door een duplicatie wordt ook ondersteund door het feit dat er twee versies van flgE bestaan in het genus Bacillus: onder de gesequenteerde genomen, bevatten vier soorten (B. subtilis, B. clausii, B. licheniformis, en B. halodurans) een kortere versie, die in lengte vergelijkbaar is met flgG, en drie soorten (B. thuringiensis, B. cereus, en B. anthracis) hebben de langere versie.
Gelijkenis in eiwitsequentie tussen het proximale staafeiwit FlgF, het distale staafeiwit FlgG, en het haakeiwit FlgE in E. coli. Terwijl FlgF en FlgG over hun gehele lengte homoloog zijn, bevat FlgE een intragene duplicatie aan zijn N terminus.
Uit de matrix van verwantschappen en eiwit-sequentie-afstemming van de flagellaire kerngenen van E. coli, is het ook mogelijk om de volgorde af te leiden waarin veel van deze genen en hun corresponderende structuren zijn ontstaan. De lage niveaus van eiwitidentiteit onder deze paralogi, paraloge paren zijn tussen 18% en 32% identiek, vereiste dat we een methode toepasten die de uitvoer van reeksen meervoudige uitlijningsprogramma’s combineert om een consensus uitlijning af te leiden. De uitlijningen op de eindgebieden van de proteïnen, vooral op het C eindpunt, bieden de meeste zekerheid. Een unrooted neighbor-joining tree en een maximum-likelihood tree tonen aan dat de staafeiwitten hun oorsprong vinden in FlgB of FlgC, die beide korte eiwitten zijn, en vervolgens FlgF en FlgG (en het haak-eiwit FlgE) hebben voortgebracht via een reeks duplicatiegebeurtenissen. De evolutionaire verwantschappen van deze flagella-genen lopen parallel met de locaties van hun gecodeerde eiwitten in hedendaagse flagella. De proximale en vervolgens de distale staaf-eiwitten gaan (zowel evolutionair als fysisch) vooraf aan de haak-eiwitten, die voorafgingen aan de haak-filament junctie en filament-eiwitten.