Stepwise formation of the bacterial flagellar system

Results

Defining the Core Set of Flagellar Genes.

Poprzez przeszukanie genomów bakterii flagellarnych, dla których dostępne są kompletne sekwencje genomowe, uzyskaliśmy filogenetyczne rozmieszczenie każdego genu, o którym wiadomo, że jest zaangażowany w biosyntezę i regulację flagelli. Aby zbadać pochodzenie i ewolucję bakteryjnego systemu flagowego, zastosowaliśmy metodę profilowania filogenetycznego (21), aby podzielić geny na grupy funkcjonalne na podstawie ich współwystępowania i wspólnego rozmieszczenia w genomach. Geny o różnych rolach funkcjonalnych mają odmienne rozmieszczenie filogenetyczne i profile; jednakże większość genów, których produkty białkowe stanowią składniki strukturalne flagellum, jest obecna we wszystkich rozpatrywanych fyllach bakteryjnych (Rys. 1). Rozkład ten sugeruje, że ten podstawowy zestaw genów strukturalnych powstał przed dywergencją głównych linii bakteryjnych i obejmuje 21 genów, które określają białka tworzące filament (fliC, który często występuje w wielu kopiach), połączenie hak-filament (flgK i flgL), hak (flgE, który jest obecny jako pseudogen u Thermotoga maritima), pręcik (flgB, flgC, flgG i flgF, którego brak tylko u Listeria innocua), pierścień MS (fliF), pierścień C (fliG, fliM i fliN), silnik (motA i motB) oraz aparat eksportowy (flhA, flhB, fliI, fliP, fliR i fliQ, którego brak u Clostridium tetani). Dodatkowo, flgD, kodujące białko zamykające hak, które jest wymagane do montażu flagelli, ale nie przyczynia się do ostatecznej struktury, ma homologi u wszystkich bakterii flagellowych i dlatego zostało uznane za część zestawu podstawowego.

Ryc. 1.

Rozkład białek flagellarnych (z wyłączeniem białek chemotaksji) wśród gatunków bakterii flagellarnych. Pogrubioną czcionką zaznaczono białka kodowane przez geny rdzeniowe. Rysunek ten został przerysowany za pozwoleniem z rysunku znajdującego się w bazie danych ścieżek KEGG (www.genome.jp/kegg/pathway/eco/eco02040.html).

Inne strukturalne geny flagellarne, które są szeroko, ale nie uniwersalnie rozpowszechnione wśród gatunków flagellarnych obejmują flgH, flgI, fliD, fliE i fliH. Brak niektórych z tych genów w genomie jest zrozumiały, gdy weźmie się pod uwagę cechy poszczególnych bakterii. Na przykład, białka pierścienia L i P FlgH i FlgI nie są konieczne u Firmicutes, ponieważ bakterie te nie posiadają błony zewnętrznej, w której białka te są zwykle umiejscowione u bakterii Gram-ujemnych. FlgH i FlgI nie są również konieczne u Spirochaetes, które mają peryplazmatyczne flagellum znajdujące się wewnątrz błony zewnętrznej. Firmicutes i Spirochaetes są postrzegane jako dwie najbardziej bazalne linie bakteryjne (22, 23), co sugeruje, że flgH i flgI powstały po podstawowym zestawie białek strukturalnych. W przeciwieństwie do nich, trzy inne geny (fliD, fliE i fliH) są obecne we wszystkich głównych grupach, ale brakuje ich sporadycznie w kilku genomach, najbardziej zauważalnie w Alphaproteobacteria. Ponieważ obecne rozmieszczenie tych trzech genów można przypisać wtórnej utracie, one również powinny być traktowane jako część rodowego zestawu genów określających bakteryjne flagellum, podnosząc całkowitą liczbę genów rdzeniowych do 24.

W związku z tym, zadanie wyjaśnienia ewolucji flagellum polega na ustaleniu, jak powstał ten zestaw 24 genów strukturalnych. Pozostałe geny flagellarne, w tym te, które odgrywają role regulacyjne lub pomocnicze w montażu i funkcjonowaniu flagelli (takie jak główne regulatory flhC i flhD oraz gen kontrolujący długość haka fliK), mają bardzo zmienne rozmieszczenie i są wyłączone z głównego zestawu, nawet jeśli wiadomo, że niektóre z nich są niezbędne do prawidłowego funkcjonowania systemu flagellarnego u danego gatunku. (Historie ewolucyjne tych genów regulacyjnych, wraz z historią drugiego bakteryjnego systemu flagowego, pozostają do opisania.)

Phylogenetic Analysis of Flagellar Core Genes.

Aby upewnić się, czy 24 geny tworzące zestaw flagowy mają zgodne historie ewolucyjne ze sobą, porównaliśmy drzewo filogenetyczne wywnioskowane dla każdego genu rdzeniowego z drzewem opartym na skojarzonych wyrównaniach białek kodowanych przez 14 genów rdzeniowych. (Te 14 genów zostało wybranych, ponieważ były one obecne u wszystkich gatunków objętych tym badaniem i kodowały białka o wysokim odsetku pozycji zgodnych). Dla każdego z 24 genów, wszystkie gałęzie z >75% wartościami bootstrap zgadzały się z tymi w drzewie połączonym, wskazując, że żaden z alternatywnych porządków rozgałęzień nie wykazuje silnego wsparcia i że każdy z tych genów podążał wspólną historią w bakteriach od czasu ich powstania.

Congruence of Flagellar Genes with Organismal Phylogeny of Bacteria.

Rozkład 24 genów rdzeniowych wśród rozbieżnych filogenez bakteryjnych jest najbardziej zgodny ze starożytnym pochodzeniem, poprzedzającym wspólnego przodka Bacteria. Jednakże, dystrybucja mogła zostać osiągnięta przez późniejszy transfer poziomy. Przetestowaliśmy te alternatywy, porównując filogenezę białek rdzenia flagelli z filogenezą odpowiednich filogenów bakteryjnych opartą na 25 uniwersalnie rozmieszczonych genach. Filogenezy są w dużej mierze zgodne w gałęziach, które mają >75% wsparcia bootstrapowego; istnieją jednak dwie niezgodności między filogenezą genów rdzeniowych a filogenezą organizmów; w umiejscowieniu zarówno alfaproteobakterii Zymomonas mobilis, jak i kladu trzech Betaproteobacteria w obrębie Gammaproteobacteria (ryc. 2). Ponieważ poszczególne geny flagellarne w obrębie podstawowego zestawu wykazują tę samą historię ewolucyjną (patrz wyżej), te nieścisłości powstały prawdopodobnie w wyniku transferu całych kompleksów genów flagellarnych pomiędzy liniami proteobakterii po ich oddzieleniu się od innych głównych grup bakterii.

Ryc. 2.

Zgodność pomiędzy drzewem gatunkowym a drzewem białek flagellarnych. (A) Drzewo gatunkowe oparte na konkatenacyjnym wyrównaniu białek 25 jednokopijnych białek. (B) Drzewo białek flagowych oparte na wyrównaniu 14 białek rdzenia flagowego. Grupy bakterii są zacienione, aby podkreślić niezgodności wynikające z przeniesienia genów.

Rdzeniowe białka flagowe powstały poprzez powielenie i zróżnicowanie pojedynczego prekursora.

Gdy każde z 24 rdzeniowych białek flagowych E. coli jest porównywane (przez BLAST) do wszystkich białek zakodowanych w genomie E. coli, ich najlepsze i często jedyne trafienia dotyczą innych rdzeniowych białek flagowych. Porównanie parami tych białek rdzeniowych ujawniło, że dziesięć z nich jest homologicznych z innymi białkami rdzeniowymi przy zastosowaniu wartości odcięcia e- 10-4 (Rys. 3). Ten wzór wskazuje, że geny strukturalne określające część flagellum przebywającą poza błoną cytoplazmatyczną (tj. pręt, hak i włókno) są paralogami i pochodzą od siebie poprzez duplikacje.

Ryc. 3.

Sieć powiązań pomiędzy białkami rdzeniowymi flagelli. Nad każdym łącznikiem znajduje się liczba genomów, dla których homologia między daną parą białek została wykryta przez porównanie parami przy wartości odcięcia 10-4 lub niższej. Niebieskie linie łączące białka zaznaczone żółtą ramką przedstawiają sieć homologii ujawnioną, gdy białka rdzeniowe E. coli poddano porównaniom parami.

Oprócz tych dopasowań do innych białek rdzeniowych, porównania parami tych białek flagowych z >4000 białek nieflagowych kodowanych przez cały genom E. coli odzyskały łącznie tylko 24 trafienia, które osiągnęły ten sam poziom istotności. Wśród tych dopasowań połowa (w tym niektóre z wartościami e- tak niskimi jak 3e -10 do białek rdzenia flagellarnego) jest zaangażowana w inne systemy wydzielania, takie jak pilus P i system wydzielania typu V, co jest zgodne z ideą, że flagellum powstało jako system wydzielania. Dodatkowe 10 z 24 trafień (z wartościami e- w zakresie od 10-5 do 10-6) to białka błonowe, a pozostałe dwa to białka włókien ogonowych profaga. Tak więc stwierdzamy, że pomimo ich starożytności, podobieństwa między białkami rdzeniowymi do siebie nawzajem są bardziej powszechne i średnio silniejsze niż do białek nieflagowych.

Ponieważ geny, które tworzą zestaw rdzeniowy są starożytne i wysoce rozbieżne, możliwe jest, że niektóre z relacji między genami mogą nie być rozpoznane z analiz ograniczonych do kompleksu flagowego E. coli. Powtórzyliśmy tę analizę i porównaliśmy zestaw genów rdzenia każdej innej bakterii flagelarnej do wszystkich białek kodowanych w odpowiednich genomach i między sobą, i uzyskaliśmy podobny wynik, tj. najlepsze (i często jedyne) trafienia genów rdzenia flagelarnego były do innych genów rdzenia flagelarnego. Jednakże, poprzez rozszerzenie tej analizy poza E. coli, podobieństwo-relacje i powiązania pomiędzy kilkoma innymi genami rdzeniowymi zostały rozwiązane. Na przykład, wysoce znacząca zgodność pomiędzy fliM i fliN (która nie została wykryta dla homologów E. coli) była widoczna w 15 genomach z różnych poddziałów bakterii (Rys. 3). Ponadto, wzajemnie oddziałujące komponenty eksportowe kodowane przez fliP, fliR i fliQ są powiązane na podstawie sekwencji ich białek w obrębie kilku taksonów. Nawet wśród 10 genów rdzeniowych E. coli, które pierwotnie wykazywały podobieństwo do siebie, pojawiło się kilka nowych powiązań (np. flgB z flgE i flgG oraz między flgL i flgK), które ujawniły się po przeprowadzeniu analizy na innych genomach. Łącznie, każdy z 24 genów rdzeniowych wykazuje znaczące podobieństwo do jednego lub więcej innych genów rdzeniowych (Ryc. 3), wzór, który wynikałby z ich sukcesywnego powstawania od siebie nawzajem przez niezależne duplikacje genów i/lub fuzje genów.

Podobieństwo między proksymalnym białkiem pręcikowym FlgF, dystalnym białkiem pręcikowym FlgG i białkiem hakowym FlgE egzemplifikuje związki między tymi białkami flagowymi (Ryc. 4). FlgF i FlgG mają podobny rozmiar (251 aa vs. 260 aa u E. coli) i wykazują 31% identyczność aminokwasów na całej długości. W przeciwieństwie do nich, gen flgE jest znacznie dłuższy i wydaje się, że powstał z flgG w wyniku wewnątrzgenowej duplikacji, która dodała 160-aa domenę do N-końca kodowanego białka. Poszukiwania PSI-BLAST ujawniły dwa znaczące dopasowania pomiędzy FlgE i FlgG w E. coli: jedno z 24% identycznością pomiędzy całą długością FlgG i C terminusem FlgE (156-401 aa), a drugie z 29% identycznością pomiędzy N terminusem dwóch białek (≈160 aa). Za tym, że flgE wyewoluował przez duplikację, przemawia również fakt, że w rodzaju Bacillus występują dwie wersje flgE: wśród zsekwencjonowanych genomów cztery gatunki (B. subtilis, B. clausii, B. licheniformis i B. halodurans) zawierają krótszą wersję, która ma długość podobną do flgG, a trzy gatunki (B. thuringiensis, B. cereus i B. anthracis) mają wersję dłuższą.

Ryc. 4.

Podobieństwo sekwencji białek wśród proksymalnego białka pręcikowego FlgF, dystalnego białka pręcikowego FlgG i białka hakowego FlgE u E. coli. Podczas gdy FlgF i FlgG są homologiczne na całej swojej długości, FlgE zawiera wewnątrzgenową duplikację na swoim N-końcu.

Z matrycy powiązań i wyrównania sekwencji białek genów rdzenia flagelarnego E. coli, możliwe jest również wnioskowanie o kolejności, w jakiej powstało wiele z tych genów i odpowiadających im struktur. Niski poziom identyczności białek wśród tych paralogów (pary paralogiczne są od 18% do 32% identyczne) wymagał zastosowania metody, która łączy wyniki serii programów wielokrotnego dopasowania w celu uzyskania dopasowania konsensusowego. Największą pewność dają dopasowania w końcowych regionach białek, szczególnie na C-końcu. Nieukorzenione drzewo sąsiedztwa i drzewo maksymalnego prawdopodobieństwa wskazują, że białka pręcikowe pochodzą od FlgB lub FlgC, które są krótkimi białkami, a następnie utworzyły FlgF i FlgG (oraz białko hakowe FlgE) poprzez serię duplikacji. Ewolucyjne relacje tych genów flagellarnych pokrywają się z lokalizacją kodowanych przez nie białek we współczesnych flagellach. Proksymalne, a następnie dystalne białka pręcikowe poprzedzają (zarówno ewolucyjnie, jak i fizycznie) białka hakowe, które poprzedzają połączenia hakowo-włóknowe i białka włókienkowe.

.