Schrittweise Entstehung des bakteriellen Geißelsystems

Ergebnisse

Bestimmung des Kernsatzes von Geißelgenen.

Durch Abfrage der Genome von Geißelbakterien, für die vollständige Genomsequenzen verfügbar sind, erhielten wir die phylogenetische Verteilung aller Gene, von denen bekannt ist, dass sie an der Biosynthese und Regulierung der Geißeln beteiligt sind. Um den Ursprung und die Entwicklung des bakteriellen Geißelsystems zu untersuchen, wendeten wir dann eine phylogenetische Profilierungsmethode (21) an, um Gene auf der Grundlage ihres gemeinsamen Vorkommens und ihrer gemeinsamen Verteilung in den Genomen in funktionelle Gruppen einzuteilen. Gene mit unterschiedlichen funktionellen Aufgaben haben unterschiedliche phylogenetische Verteilungen und Profile; die meisten Gene, deren Proteinprodukte die strukturellen Komponenten des Flagellums bilden, sind jedoch in allen betrachteten bakteriellen Phyla vorhanden (Abb. 1). Diese Verteilung deutet darauf hin, dass dieser Kernsatz von Strukturgenen vor der Divergenz der großen bakteriellen Linien entstanden ist und 21 Gene umfasst, die Proteine spezifizieren, die das Filament (fliC, das oft in mehreren Kopien vorhanden ist), die Haken-Filament-Verbindung (flgK und flgL), den Haken (flgE, das als Pseudogen in Thermotoga maritima vorkommt), den Stab (flgB, flgC, flgG und flgF, das nur in Listeria innocua fehlt), den MS-Ring (fliF), den C-Ring (fliG, fliM und fliN), den Motor (motA und motB) und den Exportapparat (flhA, flhB, fliI, fliP, fliR und fliQ, dem ein Homolog in Clostridium tetani fehlt). Darüber hinaus hat flgD, das für das Hook-Capping-Protein kodiert, das für den Zusammenbau der Geißeln erforderlich ist, aber nicht zur endgültigen Struktur beiträgt, Homologe in allen geißelnden Bakterien und wurde daher als Teil des Kernsatzes betrachtet.

Abb. 1.

Verteilung der Geißelproteine (ohne Chemotaxisproteine) unter den geißelnden Bakterienarten. Die Proteine, die von den Kerngenen kodiert werden, sind fett gedruckt. Diese Abbildung wurde mit Genehmigung aus der KEGG-Datenbank (www.genome.jp/kegg/pathway/eco/eco02040.html) übernommen.

Zu den weiteren Strukturgenen der Geißeln, die zwar breit, aber nicht universell über alle Geißelarten verteilt sind, gehören flgH, flgI, fliD, fliE und fliH. Das Fehlen einiger dieser Gene in einem Genom ist verständlich, wenn man die Eigenschaften der jeweiligen Bakterien berücksichtigt. Beispielsweise sind die L- und P-Ring-Proteine FlgH und FlgI bei Firmicutes nicht notwendig, da diesen Bakterien die äußere Membran fehlt, in der diese Proteine bei gramnegativen Bakterien typischerweise zu finden sind. FlgH und FlgI sind auch in Spirochaeten nicht erforderlich, da diese ein periplasmatisches Flagellum haben, das sich innerhalb der äußeren Membran befindet. Firmicutes und Spirochaeten werden als zwei der basalsten bakteriellen Linien angesehen (22, 23), was darauf hindeutet, dass flgH und flgI nach dem Kernsatz der Strukturproteine entstanden sind. Im Gegensatz dazu sind drei andere Gene (fliD, fliE und fliH) in allen größeren Gruppen vorhanden, fehlen aber sporadisch in einigen Genomen, am auffälligsten bei den Alphaproteobacteria. Da die heutige Verteilung dieser drei Gene auf einen sekundären Verlust zurückzuführen ist, sollten auch sie als Teil des ursprünglichen Satzes von Genen betrachtet werden, die das bakterielle Flagellum spezifizieren, wodurch sich die Gesamtzahl der Kerngene auf 24 erhöht.

Die Aufgabe, die Evolution des Flagellums aufzuklären, besteht also darin, festzustellen, wie dieser Satz von 24 Strukturgenen entstanden ist. Die übrigen Geißelgene, einschließlich derjenigen, die eine regulierende oder unterstützende Rolle beim Aufbau und der Funktion der Geißel spielen (wie die Hauptregulatoren flhC und flhD und das Gen zur Kontrolle der Hakenlänge fliK), sind sehr variabel verteilt und werden aus dem Kernsatz ausgeschlossen, auch wenn einige der Gene bekanntermaßen für das ordnungsgemäße Funktionieren des Geißelsystems in einer bestimmten Spezies wesentlich sind. (Die Evolutionsgeschichte dieser regulatorischen Gene sowie die eines zweiten bakteriellen Flagellarsystems muss noch beschrieben werden.)

Phylogenetische Analyse der Flagellar-Kerngen.

Um festzustellen, ob die 24 Gene, die den Flagellar-Kernsatz bilden, eine kongruente Evolutionsgeschichte haben, haben wir den für jedes Kerngen abgeleiteten phylogenetischen Baum mit dem Baum verglichen, der auf konkatenierten Alignments von Proteinen basiert, die von 14 der Kerngene kodiert werden. (Diese 14 Gene wurden ausgewählt, weil sie in allen in diese Studie einbezogenen Arten vorkommen und für die Proteine mit einem hohen Anteil an alignierbaren Positionen kodieren). Für jedes der 24 Gene stimmten alle Zweige mit >75% Bootstrap-Werten mit denen im verketteten Baum überein, was darauf hindeutet, dass keine alternativen Verzweigungsordnungen starke Unterstützung zeigen und dass jedes dieser Gene seit seiner Entstehung eine gemeinsame Geschichte in Bakterien durchlaufen hat.

Kongruenz der Flagellargengene mit der Phylogenie der Bakterien

Die Verteilung der 24 Kerngene unter den verschiedenen bakteriellen Phyla ist am ehesten mit einem alten Ursprung vereinbar, der dem gemeinsamen Vorfahren der Bakterien vorausgeht. Die Verteilung könnte jedoch auch durch einen späteren horizontalen Transfer erreicht worden sein. Wir haben diese Alternativen getestet, indem wir die Phylogenie der Flagellar-Kernproteine mit der Phylogenie der entsprechenden bakteriellen Phyla auf der Grundlage von 25 universell verteilten Genen verglichen haben. Die Phylogenien sind auf Zweigen, die >75% Bootstrap-Unterstützung aufweisen, weitgehend deckungsgleich; es gibt jedoch zwei Unstimmigkeiten zwischen den Kerngenen und den Phylogenien der Organismen, und zwar bei der Platzierung sowohl des alphaproteobakteriellen Zymomonas mobilis als auch einer Gruppe von drei Betaproteobakterien innerhalb der Gammaproteobakterien (Abb. 2). Da einzelne Geißelgene innerhalb des Kernsatzes dieselbe Evolutionsgeschichte aufweisen (siehe oben), sind diese Unstimmigkeiten wahrscheinlich auf den Transfer der gesamten Geißelgenkomplexe zwischen den proteobakteriellen Linien nach ihrer Trennung von anderen großen Bakteriengruppen zurückzuführen.

Abb. 2.

Kongruenz zwischen Artenbaum und Geißelproteinbaum. (A) Speziesbaum auf der Grundlage des konkatenierten Protein-Alignments von 25 Single-Copy-Proteinen. (B) Geißelproteinbaum auf der Grundlage des konkatenierten Protein-Alignments von 14 Geißelkernproteinen. Die Bakteriengruppen sind schattiert, um Inkongruenzen hervorzuheben, die auf Gentransferereignisse zurückzuführen sind.

Die Flagellar-Kernproteine entstanden durch die Duplikation und Diversifizierung eines einzigen Vorläufers.

Wenn jedes der 24 Flagellar-Kernproteine von E. coli (über BLAST) mit allen im E. coli-Genom kodierten Proteinen verglichen wird, sind ihre besten und oft einzigen Treffer andere Flagellar-Kernproteine. Paarweise Vergleiche zwischen diesen Kernproteinen ergaben, dass zehn von ihnen homolog zu anderen Kernproteinen sind, wenn man einen e-Wert von 10-4 anwendet (Abb. 3). Dieses Muster deutet darauf hin, dass die Strukturgene, die den Teil des Flagellums spezifizieren, der sich außerhalb der Zytoplasmamembran befindet (d. h. der Stab, der Haken und das Filament), Paraloge sind und durch Duplikationen voneinander abgeleitet wurden.

Abb. 3.

Netzwerk der Beziehungen zwischen den Flagellar-Kernproteinen. Über jedem Link steht die Anzahl der Genome, für die eine Homologie zwischen einem bestimmten Proteinpaar durch paarweisen Vergleich bei einem Cutoff-Wert von 10-4 oder weniger festgestellt wurde. Die blauen Linien, die die gelb markierten Proteine miteinander verbinden, stellen das Homologienetzwerk dar, das durch paarweise Vergleiche der Kernproteine von E. coli aufgedeckt wurde.

Abgesehen von diesen Übereinstimmungen mit anderen Kernproteinen ergaben paarweise Vergleiche dieser Geißelproteine mit den >4.000 nicht-geißelartigen Proteinen, die vom gesamten E. coli-Genom kodiert werden, insgesamt nur 24 Treffer, die das gleiche Signifikanzniveau erreichten. Von diesen Treffern ist die Hälfte (darunter einige mit e-Werten von nur 3e -10 zu den Flagellar-Kernproteinen) an anderen Sekretionssystemen beteiligt, wie dem P-Pilus und dem Typ-V-Sekretionssystem, was mit der Vorstellung übereinstimmt, dass das Flagellum ursprünglich ein Sekretionssystem war. Weitere 10 der 24 Treffer (mit e-Werten zwischen 10-5 und 10-6) sind Membranproteine, und die restlichen zwei sind Prophagen-Schwanzfaserproteine. Daraus schließen wir, dass die Ähnlichkeiten zwischen den Kernproteinen trotz ihres hohen Alters häufiger und im Durchschnitt stärker sind als bei den nicht-flagellaren Proteinen.

Da die Gene, aus denen der Kernsatz besteht, sehr alt und stark divergent sind, ist es möglich, dass einige der Beziehungen zwischen den Genen bei Analysen, die sich auf den E. coli-Flagellar-Komplex beschränken, nicht erkannt werden. Wir wiederholten diese Analyse und verglichen die Kerngene jedes anderen Geißelbakteriums mit allen Proteinen, die in den entsprechenden Genomen und untereinander kodiert werden, und wir erhielten ein ähnliches Ergebnis, d. h. die besten (und oft die einzigen) Treffer der Geißelkerngene waren zu anderen Geißelkerngenen. Durch die Ausweitung dieser Analyse über E. coli hinaus konnten jedoch die Ähnlichkeitsbeziehungen und Verbindungen zwischen mehreren anderen Kerngenen geklärt werden. So wurde beispielsweise eine hochsignifikante Übereinstimmung zwischen fliM und fliN (die bei E. coli-Homologen nicht festgestellt wurde) in 15 Genomen aus verschiedenen bakteriellen Unterabteilungen festgestellt (Abb. 3). Darüber hinaus sind die interagierenden Exportkomponenten, die von fliP, fliR und fliQ kodiert werden, auf der Grundlage ihrer Proteinsequenzen in mehreren Taxa verwandt. Und selbst unter den 10 E. coli-Kerngenen, die ursprünglich Ähnlichkeit miteinander aufwiesen, gab es mehrere neue Verbindungen (z. B. zwischen flgB und sowohl flgE als auch flgG sowie zwischen flgL und flgK), die durch die Durchführung der Analyse an anderen Genomen entdeckt wurden. Insgesamt zeigt jedes der 24 Kerngene eine signifikante Ähnlichkeit mit einem oder mehreren anderen Kerngenen (Abb. 3), ein Muster, das aus ihrer sukzessiven Entstehung durch unabhängige Genduplikationen und/oder Genfusionen resultieren würde.

Die Ähnlichkeit zwischen dem proximalen Stäbchenprotein FlgF, dem distalen Stäbchenprotein FlgG und dem Hakenprotein FlgE veranschaulicht die Beziehungen zwischen diesen Geißelproteinen (Abb. 4). FlgF und FlgG sind von ähnlicher Größe (251 aa vs. 260 aa in E. coli) und weisen über ihre gesamte Länge eine 31%ige Aminosäureidentität auf. Im Gegensatz dazu ist das flgE-Gen viel länger und scheint sich aus flgG durch eine intragenische Duplikation entwickelt zu haben, die dem N-Terminus des kodierten Proteins eine 160-Aa-Domäne hinzugefügt hat. PSI-BLAST-Suchen zeigen zwei signifikante Übereinstimmungen zwischen FlgE und FlgG in E. coli: eine mit 24 % Identität zwischen der gesamten Länge von FlgG und dem C-Terminus von FlgE (156-401 aa), und die andere mit 29 % Identität zwischen dem N-Terminus der beiden Proteine (≈160 aa). Dafür, dass flgE durch eine Duplikation entstanden ist, spricht auch die Tatsache, dass es in der Gattung Bacillus zwei Versionen von flgE gibt: Von den sequenzierten Genomen enthalten vier Arten (B. subtilis, B. clausii, B. licheniformis und B. halodurans) eine kürzere Version, die ähnlich lang ist wie flgG, und drei Arten (B. thuringiensis, B. cereus und B. anthracis) haben die längere Version.

Abb. 4.

Proteinsequenzähnlichkeit zwischen dem proximalen Stäbchenprotein FlgF, dem distalen Stäbchenprotein FlgG und dem Hakenprotein FlgE in E. coli. Während FlgF und FlgG über ihre gesamte Länge homolog sind, enthält FlgE eine intragenische Duplikation an seinem N-Terminus.

Aus der Beziehungsmatrix und den Proteinsequenz-Alignments der Flagellar-Kerngen von E. coli lässt sich auch die Reihenfolge ableiten, in der viele dieser Gene und ihre entsprechenden Strukturen entstanden sind. Aufgrund der geringen Proteinidentität zwischen diesen Paralogen – paraloge Paare sind zu 18 % bis 32 % identisch – mussten wir eine Methode anwenden, die die Ergebnisse mehrerer Alignment-Programme kombiniert, um ein Konsens-Alignment zu erstellen. Die Alignments an den terminalen Regionen der Proteine, insbesondere am C-Terminus, bieten das höchste Vertrauen. Ein unverwurzelter Nachbarschaftsbaum und ein Maximum-Likelihood-Baum zeigen, dass die Stäbchenproteine entweder von FlgB oder FlgC abstammen, die beide kurze Proteine sind, und dann durch eine Reihe von Duplikationsereignissen FlgF und FlgG (und das Hakenprotein FlgE) erzeugt haben. Die evolutionäre Verwandtschaft dieser Geißelgene verläuft parallel zu den Positionen der von ihnen kodierten Proteine in den heutigen Geißeln. Die proximalen und dann die distalen Stäbchenproteine gehen (sowohl evolutionär als auch physikalisch) den Hakenproteinen voraus, die wiederum den Haken-Filament-Verbindungs- und Filamentproteinen vorausgingen.