Bakteerien lippulaarijärjestelmän vaiheittainen muodostuminen

Tulokset

Flagellageenien ydinjoukon määrittäminen.

Kyselemällä sellaisten lippulaivabakteerien genomeja, joiden täydelliset genomisekvenssit ovat saatavilla, saimme selville kaikkien niiden geenien filogeneettisen jakauman, joiden tiedetään olevan osallisena lippulaivojen biosynteesissä ja säätelyssä. Tutkiaksemme bakteerien flagellaarijärjestelmän alkuperää ja evoluutiota sovelsimme sen jälkeen fylogeneettistä profilointimenetelmää (21) lajitellaksemme geenejä toiminnallisiin ryhmiin niiden samanaikaisen esiintymisen ja jaettujen jakaumien perusteella eri genomeissa. Geeneillä, joilla on erilaiset toiminnalliset tehtävät, on erilaiset fylogeneettiset jakaumat ja profiilit; suurin osa geeneistä, joiden proteiinituotteet muodostavat flagellumin rakennekomponentit, esiintyy kuitenkin kaikissa tarkastelluissa bakteerifylleissä (kuva 1). Tämä jakauma viittaa siihen, että tämä rakenteellisten geenien ydinjoukko on saanut alkunsa ennen tärkeimpien bakteerilinjojen erilaistumista, ja siihen kuuluu 21 geeniä, jotka määrittelevät proteiineja, jotka muodostavat filamentin (fliC, jota esiintyy usein useina kopioina), koukun ja filamentin liitoskohdan (flgK ja flgL), koukun (flgE, joka esiintyy pseudogeeninä Thermotoga maritimassa), sauvan (flgB, flgC, flgG ja flgF, joka puuttuu vain Listeria innocua -bakteerista), MS-renkaan (fliF), C-rengas (fliG, fliM ja fliN), moottori (motA ja motB) ja vientilaite (flhA, flhB, fliI, fliP, fliR ja fliQ, joka puuttuu Clostridium tetani -bakteerista). Lisäksi flgD:llä, joka koodaa koukkua peittävää proteiinia, jota tarvitaan lippulaivan kokoamiseen, mutta joka ei vaikuta lopulliseen rakenteeseen, on homologeja kaikissa lippulaivabakteereissa, ja siksi sitä pidettiin osana ydinjoukkoa.

Kuva 1. Lippulaivan kokoaminen.

Lippuproteiinien (lukuun ottamatta kemotaksiaproteiineja) jakautuminen lippulajeissa elävien bakteerilajien kesken. Ydingeenien koodaamat proteiinit on merkitty lihavoituna. Tämä kuva on piirretty uudelleen luvalla KEGG-polkutietokannassa (www.genome.jp/kegg/pathway/eco/eco02040.html) esiintyvästä kuvasta.

Muut flagellaariset rakennegeenit, jotka ovat laajalti, mutta eivät yleisesti jakautuneet lippulajeissa, ovat flgH, flgI, fliD, fliE ja fliH. Tiettyjen näiden geenien puuttuminen genomista on ymmärrettävää, kun otetaan huomioon kyseisen bakteerin ominaispiirteet. Esimerkiksi L- ja P-rengasproteiinit FlgH ja FlgI eivät ole välttämättömiä Firmicutes-heimossa, koska näiltä bakteereilta puuttuu ulkokalvo, jossa nämä proteiinit tyypillisesti sijaitsevat gramnegatiivisissa bakteereissa. FlgH ja FlgI eivät myöskään ole välttämättömiä Spirochaeteissa, joilla on ulkokalvon sisällä sijaitseva periplasminen flagellum. Firmicutes- ja Spirochaetes-heimoja pidetään kahtena perustavimmista bakteerilinjoista (22, 23), mikä viittaa siihen, että flgH ja flgI ovat syntyneet rakenneproteiinien ydinjoukon jälkeen. Sen sijaan kolme muuta geeniä (fliD, fliE ja fliH) esiintyy kaikissa pääryhmissä, mutta ne puuttuvat satunnaisesti muutamista genomeista, erityisesti alfaproteobakteereista. Koska näiden kolmen geenin nykyiset jakaumat johtuvat sekundaarisesta häviämisestä, niitäkin olisi pidettävä osana bakteerien flagellumin määrittelevien geenien esi-isäjoukkoa, jolloin ydingeenien kokonaismäärä nousee 24:ään.

Näin ollen flagellumin evoluution selvittäminen edellyttää, että selvitetään, miten tämä 24:stä rakenteellisesta geenistä koostuva joukko on syntynyt. Jäljelle jäävillä flagellageeneillä, mukaan lukien geenit, joilla on säätely- tai aputehtäviä flagellan kokoonpanossa ja toiminnassa (kuten masterregulaattorit flhC ja flhD sekä koukun pituutta säätelevä fliK-geeni), on hyvin vaihteleva jakauma, ja ne on jätetty ydinjoukon ulkopuolelle, vaikka joidenkin geenien tiedetään olevan välttämättömiä flagellarijärjestelmän asianmukaisen toiminnan kannalta tietyssä lajissa. (Näiden säätelygeenien sekä toisen bakteerin flagellarijärjestelmän geenien evoluutiohistoria on vielä kuvaamatta.)

Fylogeneettinen analyysi flagellar-ydingeeneistä.

Voidaksemme selvittää, onko flagellar-ydinjoukon muodostavien 24 geenin evoluutiohistoria yhtenevä keskenään, vertasimme kullekin ydingeenille johdettua fylogeneettistä puuta siihen, joka perustui 14:llä ydingeenin koodaamien proteiinien ketjutettuihin rinnastuksiin. (Nämä 14 geeniä valittiin, koska ne esiintyivät kaikissa tässä tutkimuksessa mukana olleissa lajeissa ja koodasivat proteiineja, joilla oli suuri osuus kohdistettavissa olevista paikoista). Jokaisen 24 geenin osalta kaikki oksat, joiden bootstrap-arvot olivat >75 %, olivat yhtäpitäviä konkatenoidun puun oksien kanssa, mikä osoittaa, että mikään vaihtoehtoinen haarautumisjärjestys ei osoita vahvaa tukea ja että kukin näistä geeneistä on kulkenut yhteistä historiaa bakteereissa niiden synnystä lähtien.

Flagellaarigeenien yhtenevyys bakteerien organismifylogenian kanssa.

24 ydingeenin jakautuminen eri bakteerifylleihin on johdonmukaisinta muinaisen alkuperän kanssa, joka edeltää bakteerien yhteistä esi-isää. Jakauma on kuitenkin voinut syntyä myöhemmän horisontaalisen siirron kautta. Testasimme näitä vaihtoehtoja vertaamalla flagellaaristen ydinproteiinien fylogeniaa vastaavien bakteerifyllien fylogeniaan, joka perustuu 25 yleisesti jakautuneeseen geeniin. Fylogeniat ovat suurelta osin yhteneväisiä oksilla, joiden bootstrap-tuki on >75 %; ydingeenien ja organismien fylogenioiden välillä on kuitenkin kaksi epäjohdonmukaisuutta; sekä alfaproteobakteeriperäisen Zymomonas mobilis -bakteerin että kolmen betaproteobakteeriperäisen bakteerin kladin sijoittuminen Gammaproteobakteerien sisälle (kuva 2). Koska yksittäiset flagellageenit ydinsarjan sisällä osoittavat samaa evoluutiohistoriaa (ks. edellä), nämä epäjohdonmukaisuudet ovat todennäköisesti johtuneet kokonaisten flagellageenikompleksien siirtymisestä proteobakteerilinjojen välillä sen jälkeen, kun ne erottuivat muista suurista bakteeriryhmistä.

Kuva 2. Proteobakteerien geenikompleksit.

Lajipuun ja flagellaariproteiinipuun välinen yhtenevyys. (A) Lajipuu, joka perustuu 25 yhden kopion proteiinin konkatenoituun proteiinikohdistukseen. (B) Flagellaproteiinipuu, joka perustuu 14 flagellan ydinproteiinin ketjutettuun proteiinikohdistukseen. Bakteeriryhmät on tummennettu geeninsiirtotapahtumista johtuvien epäjohdonmukaisuuksien korostamiseksi.

Core flagellar Proteins Arose Through the Duplication and Diversification of a Single Precursor.

Kun kutakin E. colin 24:stä flagellar-ydinproteiinista verrataan (BLAST-menetelmällä) kaikkeen E. colin genomissa koodattuihin proteiineihin, niiden parhaimmat, ja usein myös ainoat, löydökset kohdistuvat toisiin flagellar-ydinproteiineihin. Näiden ydinproteiinien pareittaiset vertailut osoittivat, että kymmenen niistä on homologisia muiden ydinproteiinien kanssa, kun käytettiin e-arvon raja-arvoa 10-4 (kuva 3). Tämä kuvio osoittaa, että rakenteelliset geenit, jotka spesifioivat sytoplasmamembraanin ulkopuolella sijaitsevan flagellumin osan (eli sauvan, koukun ja filamentin), ovat paralogisia ja ovat peräisin toisistaan duplikaatioiden kautta.

Kuva 3. Flagellumin rakenneproteiinit.

Suhteiden verkosto flagellaaristen ydinproteiinien välillä. Kunkin linkin yläpuolella on niiden genomien lukumäärä, joiden osalta tietyn proteiiniparin välinen homologia havaittiin pareittaisella vertailulla raja-arvolla 10-4 tai alhaisemmalla raja-arvolla. Keltaisella laatikolla merkittyjä proteiineja yhdistävät siniset viivat kuvaavat homologiaverkostoa, joka paljastui, kun E. colin ydinproteiineja verrattiin pareittain.

Tämän muiden ydinproteiinien kanssa tehtyjen vastaavuuksien lisäksi näiden flagellaaristen proteiinien pareittaiset vertailut koko E. coli -genomin koodaamiin >4 000 muuhun kuin flagellaariseen proteiiniin toivat kumuloituneena esiin vain 24 osumaa, jotka ylsivät samalle merkitsevyystasolle. Näistä osumista puolet (mukaan lukien jotkut, joiden e-arvot olivat niinkin alhaiset kuin 3e -10 flagellan ydinproteiineihin nähden) osallistuvat muihin eritysjärjestelmiin, kuten P-pilukseen ja tyypin V eritysjärjestelmään, mikä on sopusoinnussa sen ajatuksen kanssa, että flagellum on syntynyt eritysjärjestelmänä. Lisäksi 24 osumasta 10 (joiden e-arvot vaihtelevat 10-5:stä 10-6:een) on kalvoproteiineja, ja loput kaksi ovat profaagin häntäkuituproteiineja. Näin ollen voimme päätellä, että muinaisuudestaan huolimatta ydinproteiinien samankaltaisuudet toisiinsa ovat yleisempiä ja keskimäärin vahvempia kuin muihin kuin flagellaariproteiineihin.

Koska ydinjoukon muodostavat geenit ovat ikivanhoja ja hyvin erilaistuneita, on mahdollista, että joitakin geenien välisiä sukulaisuussuhteita ei tunnisteta E. coli -lippulaarikompleksiin rajoittuvissa analyyseissä. Toistimme tämän analyysin ja vertasimme kunkin muun flagellabakteerin ydingeenijoukkoa kaikkiin vastaavissa genomeissa ja keskenään koodattuihin proteiineihin, ja saimme samankaltaisen tuloksen, eli flagellan ydingeenien parhaat (ja usein ainoat) osumat olivat muihin flagellan ydingeeneihin. Laajentamalla tätä analyysia E. colin ulkopuolelle saatiin kuitenkin selvitettyä useiden muiden ydingeenien väliset samankaltaisuussuhteet ja yhteydet. Esimerkiksi fliM:n ja fliN:n välinen erittäin merkittävä vastaavuus (jota ei havaittu E. coli -homologeista) oli ilmeinen 15 genomissa, jotka olivat peräisin erilaisista bakteerien alaryhmistä (kuva 3). Lisäksi fliP:n, fliR:n ja fliQ:n koodaamat vuorovaikutuksessa olevat vientikomponentit ovat sukua niiden proteiinisekvenssien perusteella useissa taksoneissa. Ja jopa niiden 10 E. coli -ydingeenin joukossa, jotka alun perin osoittivat samankaltaisuutta keskenään, oli useita uusia yhteyksiä (esim. flgB:n yhteys sekä flgE:hen että flgG:hen ja flgL:n ja flgK:n välinen yhteys), jotka paljastuivat, kun analyysi suoritettiin muilla genomeilla. Kumulatiivisesti jokainen 24 ydingeenistä osoittaa merkittävää samankaltaisuutta yhden tai useamman muun ydingeenin kanssa (kuva 3), mikä on seurausta siitä, että ne ovat syntyneet peräkkäin toisistaan riippumattomien geeniduplikaatioiden ja/tai geenifuusioiden kautta.

Proksimaalisen sauvaproteiinin FlgF, distaalisen sauvaproteiinin FlgG ja koukkuproteiinin FlgE samankaltaisuus on esimerkki näiden flagellaariproteiinien välisistä suhteista (kuva 4). FlgF ja FlgG ovat samankokoisia (251 aa vs. 260 aa E. coli:ssa), ja niillä on 31 prosentin aminohappoidentiteetti koko pituudeltaan. Sitä vastoin flgE-geeni on paljon pidempi, ja se näyttää kehittyneen flgG:stä intragenisella duplikaatiolla, joka lisäsi 160-aa:n domeenin sen koodaaman proteiinin N-päätteeseen. PSI-BLAST-haun perusteella E. coli -bakteerissa esiintyvien FlgE:n ja FlgG:n välillä on kaksi merkittävää samankaltaisuutta: toisessa FlgG:n koko pituuden ja FlgE:n C-päätteen (156-401 aa) välillä on 24 %:n identtisyys ja toisessa näiden kahden proteiinin N-päätteen välillä on 29 %:n identtisyys (≈160 aa). Sitä, että flgE on kehittynyt duplikaation kautta, tukee myös se, että Bacillus-suvussa on kaksi versiota flgE:stä: sekvensoiduista genomeista neljällä lajilla (B. subtilis, B. clausii, B. licheniformis ja B. halodurans) on lyhyempi versio, joka on pituudeltaan samanlainen kuin flgG, ja kolmella lajilla (B. thuringiensis, B. cereus ja B. anthracis) on pidempi versio.

Fig. 4.

Proksimaalisen sauvaproteiinin FlgF, distaalisen sauvaproteiinin FlgG ja koukkuproteiinin FlgE proteiinisekvenssin samankaltaisuus E. colissa. Siinä missä FlgF ja FlgG ovat homologisia koko pituudeltaan, FlgE:ssä on intrageninen duplikaatio sen N-terminaalissa.

E. coli -lajin flagellaaristen ydingeenien sukulaisuusmatriisista ja proteiinisekvenssikohdistuksista voidaan päätellä myös järjestys, jossa monet näistä geeneistä ja niitä vastaavat rakenteet ovat syntyneet. Näiden paralogien proteiinien alhainen identiteettitaso – paralogiparien identiteettitaso on 18-32 prosenttia – edellytti, että sovellamme menetelmää, jossa yhdistetään useiden eri kohdistamisohjelmien tuotokset konsensuskohdistuksen aikaansaamiseksi. Proteiinien terminaalialueiden, erityisesti C-terminaalin, kohdistus tarjoaa suurimman luottamuksen. Juurruttamaton naapuriliitospuu ja suurimman todennäköisyyden puu osoittavat, että sauvaproteiinit ovat saaneet alkunsa joko FlgB:stä tai FlgC:stä, jotka molemmat ovat lyhyitä proteiineja, ja sitten ne ovat synnyttäneet FlgF:n ja FlgG:n (ja koukkuproteiinin FlgE:n) useiden monistumistapahtumien kautta. Näiden flagellageenien evolutiiviset suhteet ovat samansuuntaisia kuin niiden koodaamien proteiinien sijainti nykyisissä flagelloissa. Proksimaaliset ja sitten distaaliset sauvaproteiinit edeltävät (sekä evolutiivisesti että fyysisesti) koukkuproteiineja, jotka edeltävät koukku-filamenttiliitos- ja filamenttiproteiineja.