Aerobisten ja anaerobisten prokaryoottien vertaileva analyysi hapentarpeen ja geenien funktionaalisten assosiaatiomallien välisen korrelaation tunnistamiseksi

Prokaryoottien toiminnot ovat keskeisessä asemassa ympäristön muokkaamisessa, ja ympäristö vaikuttaa niihin myös suuresti. Kun genomien ja metagenomien sekvensoinnissa on tapahtunut huomattavaa edistystä ja kun ekologinen kontekstitieto on pian standardoitavissa, ympäristökeskeinen vertaileva genomiikka täydentää lajikeskeistä vertailevaa genomiikkaa ja valaisee, miten ympäristöt ovat muokanneet ja ylläpitäneet prokaryoottien monimuotoisuutta. Tässä artikkelissa raportoimme alustavista tutkimuksistamme, jotka koskevat prokaryoottien genomisten ja ekologisten ominaisuuksien erityisen kaksikon – geenien ja geenien funktionaalisten assosiaatiomallien ja hapentarpeen olosuhteiden – assosiaatioanalyysiä. Luomme ensin stokastisen mallin, jolla kuvataan geenijärjestelyjä kromosomeilla ja jonka perusteella geenien väliset funktionaaliset assosiaatiot kvantifioidaan. Geenien ja geenien funktionaalisten assosiaatioiden mittaukset validoidaan käyttämällä biologisen prosessin ontologiaa ja KEGG-polkujen merkintöjä. Tämän jälkeen aerobisille ja anaerobisille organismeille tehdään Studentin t-testit niiden geeniparien tunnistamiseksi, joilla on erilaiset funktionaaliset assosiaatiomallit kahdessa eri hapentarveolosuhteessa. Koska on vaikeaa suunnitella ja tehdä biologisia kokeita sellaisten genomin ja ympäristön välisten assosiaatioyhteyksien validoimiseksi, jotka ovat syntyneet pitkän aikavälin kumulatiivisten genomin ja ympäristön välisten vuorovaikutusten tuloksena, suoritamme lopuksi laskennallisia validointeja määrittääksemme, onko organismin hapentarpeen tila ennustettavissa geenien funktionaalisten assosiaatioyhteysmallien perusteella. Raportoitu tutkimus osoittaa tiettyjen geenien ja geenien funktionaalisten assosiaatiomallien ja prokaryoottien hapentarveolosuhteiden välisten assosiaatioyhteyksien olemassaolon ja merkityksen sekä tällaiseen assosiaatioanalyysiin käytetyn menetelmän tehokkuuden.