細菌べん毛システムの段階的形成

Results

べん毛遺伝子のコアセットの定義

全ゲノム配列が利用可能なべん毛性細菌のゲノムに問い合わせることにより、べん毛の生合成や制御に関与することが知られているすべての遺伝子の系統的分布を得ることができました。 次に、細菌べん毛システムの起源と進化を調べるために、系統的プロファイリング法(21)を適用し、ゲノム間での遺伝子の共起と共有分布に基づいて機能グループに分類した。 機能的に異なる役割を持つ遺伝子は、系統的な分布やプロファイルが異なる。しかし、べん毛の構造成分を構成するタンパク質産物を持つ遺伝子のほとんどは、検討したすべての細菌門に存在している(図1)。 この分布は、この構造遺伝子のコアセットが主要な細菌系統の分岐以前に生まれたことを示唆しており、フィラメントを形成するタンパク質(fliC、これはしばしば複数コピーで存在する)、フックとフィラメントの接合部(flgKとflgL)、フック(flgE, これはThermotoga maritimaに偽遺伝子として存在する)、ロッド(flgB, flgC, flgG, flgF, Listeria innocuaのみ欠落)、MSリング(fliF)です。 Cリング(fliG, fliM, fliN)、モーター(motA, motB)、輸出装置(flhA, flhB, fliI, fliP, fliR, fliQ, Clostridium tetaniにはホモログがない)である。 さらに、鞭毛の組み立てに必要だが最終的な構造には寄与しないフックキャッピングタンパク質をコードするflgDは、すべての鞭毛細菌にホモログがあるため、コアセットの一部として考慮した

図1.

鞭毛タンパク質(化学走性タンパク質を除く)の鞭毛細菌種間の分布。 コア遺伝子にコードされるタンパク質は太字で示した。 この図はKEGGパスウェイデータベース(www.genome.jp/kegg/pathway/eco/eco02040.html)に掲載されているものを許可を得て再描画した。

その他の鞭毛構造遺伝子として、flgH、flgI、fliD、fliE、およびfliHは鞭毛虫種間で広く分布しているが普遍的でない。 これらの遺伝子がゲノムに存在しないことは、特定の細菌の特徴を考慮すれば理解できる。 例えば、LおよびPリングタンパク質FlgHとFlgIは、Firmicutesでは必要ない。なぜなら、これらの細菌には、グラム陰性細菌で通常これらのタンパク質が位置している外膜がないからである。 また、スピロヘータは外膜の内側に鞭毛を持つので、FlgHとFlgIは必要ない。 FirmicutesとSpirochaetesは最も基本的な細菌系統とみなされており(22, 23)、FlgHとFlgIは構造タンパク質のコアセットの後に発生したことが示唆される。 一方、他の3つの遺伝子(fliD、fliE、fliH)は、すべての主要なグループに存在するが、いくつかのゲノムから散発的に欠落しており、アルファプロテオバクテリアで最も顕著に欠落している。 この3つの遺伝子の現在の分布は二次的な損失に起因するため、これらも細菌べん毛を規定する祖先の遺伝子群の一部と考えるべきで、コア遺伝子の合計は24になる

したがって、べん毛の進化を解明する課題は、この24の構造遺伝子群がいかに起源を持つかを確立することにかかっている。 残りの鞭毛遺伝子は、鞭毛の組み立てや機能において調節的または補助的な役割を果たすもの(マスター制御因子flhCやflhD、鉤長制御遺伝子fliKなど)を含むが、その分布は非常に多様で、特定の種で鞭毛システムが適切に機能するために必須の遺伝子もあることが知られていても、コアセットから除外されている。 (これらの制御遺伝子の進化史は、第二の細菌べん毛システムの進化史とともに、まだ解明されていない)

べん毛コア遺伝子の系統解析

べん毛コアセットを形成する24遺伝子が互いに一致した進化史を持っているかどうかを確かめるために、それぞれのコア遺伝子について推定した系統樹を、コア遺伝子14個のコードするタンパク質の連結配列に基づいて比較検討しました。 (これらの14個の遺伝子は、この研究に含まれるすべての種に存在し、アラインメント可能な位置の割合が高いタンパク質をコードしていることから選択された)。 24の遺伝子それぞれについて、ブートストラップ値が<9775>75%の枝はすべて連結樹の枝と一致し、代替枝順が強い支持を示すことはなく、これらの遺伝子はそれぞれその起源からバクテリアにおいて共通の歴史を辿ってきたことが示された。

べん毛遺伝子の細菌系統との整合性

24個のコア遺伝子の分岐した細菌門間の分布は、細菌の共有祖先より前の古い起源と最もよく一致した。 しかし、この分布は後の水平移動によって達成された可能性もある。 我々は、これらの選択肢を、べん毛のコアタンパク質の系統を、25の普遍的に分布する遺伝子に基づく対応する細菌門の系統と比較することで検証した。 しかし、コア遺伝子の系統と生物の系統の間には2つの矛盾がある。アルファプロテオバクテリアのZymomonas mobilisと、ガンマプロテオバクテリアの中の3つのベータプロテオバクテリアのクレードの配置である(図2)。 このような矛盾は、べん毛遺伝子が他の主要な細菌群から分離した後に、べん毛遺伝子複合体全体がプロテオバクテリアの系統間で移動したことに起因すると考えられる(5025)

Fig.

種樹とべん毛蛋白質樹の一致。 (A)25個の単一コピータンパク質の連結アライメントに基づく種樹。 (B)14個の鞭毛コアタンパク質の連結アラインメントに基づく鞭毛タンパク質ツリー。 5025>

Core Flagellar Proteins Arose Through Duplication and Diversification of a Single Precursor.

E. coliの24のコアべん毛タンパク質それぞれを大腸菌ゲノムにコードされている全てのタンパク質とBLASTで比較すると、最もよく、しばしば他のコアべん毛タンパク質が唯一ヒットすることがわかる。 これらのコアタンパク質を一対一で比較した結果、e-valueのカットオフ値を10-4にすると、10個のコアタンパク質が他のコアタンパク質と相同であることが明らかになった(図3)。 このパターンは、細胞質膜の外に存在する鞭毛の部分(すなわち、ロッド、フック、フィラメント)を指定する構造遺伝子がパラログであり、重複によって互いに派生したことを示している

図3.

鞭毛コアタンパク質間の関係のネットワーク。 各リンクの上には、カットオフ値10-4以下で一対一比較により特定のタンパク質ペア間の相同性が検出されたゲノムの数が示されている。 5025>

他のコアタンパク質とのマッチングは別として、これらのべん毛タンパク質と大腸菌ゲノム全体がコードする>4000個の非べん毛タンパク質とのペアワイズ比較では、累積で同じレベルの有意性を持つヒット数はわずか24個しか得られなかった。 このうち半数は、PピラスやV型分泌系など、他の分泌系に関与しており、鞭毛が分泌系として生まれたという考えと一致するものであった。 さらに24のヒットのうち10個(e値は10-5から10-6の範囲)は膜タンパク質であり、残りの2個はプロファージ尾部繊維タンパク質であった。 5025>

コアセットを構成する遺伝子は古く、分岐が激しいため、大腸菌べん毛複合体に限定した解析では、遺伝子間の関係の一部が認識されない可能性がある。 この解析を繰り返し、他の各鞭毛虫細菌のコア遺伝子セットと、対応するゲノムにコードされる全タンパク質との間で比較したところ、同様の結果が得られた。すなわち、鞭毛コア遺伝子の最良の(そしてしばしば唯一の)ヒットは、他の鞭毛コア遺伝子であったのである。 しかし、この解析を大腸菌以外にも拡張することで、他のいくつかのコア遺伝子間の類似性-関係やリンクが解決されました。 例えば、fliMとfliNの間には、大腸菌のホモログでは検出されなかった非常に有意な一致が、多様な細菌亜門の15個のゲノムで明らかになりました(図3)。 さらに、fliP、fliR、fliQがコードする相互作用する輸送成分は、いくつかの分類群内でそのタンパク質配列に基づいて関連していることが明らかになった。 また、もともと類似性を示していた10個の大腸菌コア遺伝子の間でも、他のゲノムで解析を行うことにより、新たにいくつかの相互関係が明らかになった(例えば、flgBとflgEおよびflgGの両方、flgLとflgKの間など)。 その結果、24のコア遺伝子のそれぞれが、他のコア遺伝子の1つ以上と有意な類似性を示し(図3)、このパターンは、独立した遺伝子重複や遺伝子融合によって互いに連続的に発生したことに起因すると考えられる。

近位ロッドタンパク質FlgF、遠位ロッドタンパク質FlgG、フックタンパク質FlgE間の類似性は、これらのべん毛タンパク質間の関係(図4)の例である。 FlgFとFlgGは、大腸菌では251 aaと260 aaという同程度の大きさで、全長にわたって31%のアミノ酸の同一性を示している。 一方、FlgE遺伝子ははるかに長く、遺伝子内重複によってFlgGから進化し、そのコードされたタンパク質のN末端に160aのドメインが追加されたと思われる。 一つはFlgGの全長とFlgEのC末端(156-401 aa)の間の24%の同一性、もう一つは二つのタンパク質のN末端(≒160 aa)間の29%の同一性である。 また、FlgEが重複して進化したことは、バチルス属に2つのバージョンのFlgEが存在することからも裏付けられる。配列決定されたゲノムのうち、4種(B. subtilis, B. clausii, B. licheniformis, B. halodurans)がflgGと同様の長さの短いバージョンを、3種(B. thuringiensis, B. cereus, B. anthracis)が長いバージョンを有している

図4.Bacillus属に存在する2つのバージョンのFlgE

大腸菌の近位ロッドタンパク質FlgF、遠位ロッドタンパク質FlgG、フックタンパク質FlgE間のタンパク質配列の類似性。 5025>

大腸菌の鞭毛コア遺伝子の関係マトリックスとタンパク質配列アラインメントから、これらの遺伝子とそれに対応する構造の多くが生まれた順番を推測することも可能である。 これらのパラロガス間のタンパク質同一性のレベルは低く、パラロガス対の同一性は18%から32%である。このため、一連のマルチアラインメントプログラムの出力を結合してコンセンサスアラインメントを導き出す方法を適用することが必要であった。 タンパク質の末端領域、特にC末端でのアラインメントが最も信頼性が高い。 根のない近傍結合樹と最尤法樹から、齧歯類タンパク質は短いタンパク質であるFlgBまたはFlgCに由来し、その後、一連の重複事象を経てFlgFとFlgG(およびフックタンパク質FlgE)を生成したことが示された。 これらの鞭毛遺伝子の進化的関係は、コードされたタンパク質が現代の鞭毛に存在する位置と平行である。 近位、遠位のロッドタンパク質はフックタンパク質に先行し、フックタンパク質はフック-フィラメント接合部やフィラメントタンパク質に先行する(進化的、物理的にも)