Extrémní prostředí jsou zakódována do genomů organismů, které tam žijí

KonverzaceGenom organismu je soubor instrukcí DNA potřebných pro jeho vývoj, funkci a reprodukci. Genom dnešního organismu obsahuje informace z jeho cesty evoluční cestou, která začíná „prvním univerzálním společným předkem“ veškerého života na Zemi a vrcholí tímto organismem.

Genom organismu, zakódovaný v sobě, obsahuje informace, které mohou odhalit spojení s jeho předky a jeho příbuznými.

Jiné dimenze genomu

Náš výzkum zkoumá hypotézu, že genom organismu by mohl obsahovat jiné typy informací, mimo genealogii nebo taxonomii. Ptali jsme se: Mohl by genom organismu obsahovat informace, které by nám umožnily určit typ prostředí, ve kterém organismus žije?

Pitch Lake v Trinidadu a Tobagu

Extremofilové byli nalezeni v prostředích, jako je jezero Pitch Lake v Trinidadu a Tobago, největší naleziště asfaltu na světě.

Obrazový kredit: Anton_Ivanov/Shutterstock.com

Jakkoli se to zdá nepravděpodobné, náš tým výzkumníků v oblasti informatiky a biologie na University of Waterloo a Western University zjistil, že je tomu tak u extrémofilů – organismů, které žijí a prospívají v extrémně drsných podmínkách. Tyto podmínky prostředí se pohybují od extrémního horka (přes 100 °C) po extrémní chlad (pod -12 °C), vysokou radiaci nebo extrémní kyselost nebo tlak.

DNA jako jazyk

Dívali jsme se na genomovou DNA jako na text napsaný „jazykem DNA“. Řetězec DNA (nebo sekvence DNA) se skládá z posloupnosti základních jednotek zvaných nukleotidy, které jsou spojeny cukro-fosfátovou páteří. Existují čtyři takové různé jednotky DNA: adenin, cytosin, guanin a thymin (A,C,G,T).

Při abstraktním pohledu lze sekvenci DNA považovat za řádek textu napsaný „písmeny“ z „abecedy DNA“. Například „CAT“ by bylo třípísmenné „slovo DNA“ odpovídající tříjednotkové sekvenci DNA cytosin-adenin-thymin.

V 90. letech 20. století bylo zjištěno, že spočítáním výskytů takových slov DNA v krátké sekvenci DNA extrahované z genomu organismu lze identifikovat druh organismu a míru jeho příbuznosti s jinými organismy v evolučním „stromu“. života.”

Mechanismus této identifikace nebo klasifikace organismu na základě počtu slov DNA je podobný procesu, který nám umožňuje odlišit anglickou knihu od francouzské knihy: Když z každé knihy vezmeme jednu stránku, všimneme si, že anglický text má mnoho výskytů třípísmenné slovo „the“, zatímco francouzský text má mnoho výskytů třípísmenného slova „les“.

Všimněte si, že profil frekvence slov každé knihy nezávisí na konkrétní stránce, kterou jsme se rozhodli číst, a na tom, zda jsme uvažovali o více stránkách, jedné stránce nebo celé kapitole. Podobně frekvenční profil slov DNA v genomu nezávisí na umístění a délce sekvence DNA, která byla vybrána, aby reprezentovala daný genom.

Ilustrace řetězce DNA

Řetězec DNA se skládá z řady základních jednotek: adeninu, cytosinu, guaninu a thyminu (ACGT).

Obrazový kredit: ktsdesign/Shutterstock.com

To, že profily frekvence slov DNA mohou fungovat jako „genomický podpis“ organismu, byl významný objev a až dosud se věřilo, že profil frekvence slov DNA genomu obsahuje pouze evoluční informace týkající se druhu, rodu, rodina, řád, třída, kmen, království nebo doména, do které organismus patřil.

Náš tým se rozhodl zeptat, zda by frekvenční profil slova DNA genomu mohl odhalit další druhy informací – například informace o typu extrémního prostředí, ve kterém se mikrobiálnímu extrémofilovi daří.

Otisky prostředí v extremofilní DNA

Použili jsme soubor dat 700 mikrobiálních extrémofilů žijících v extrémních teplotách (buď extrémní teplo nebo chlad) nebo extrémních podmínkách pH (silně kyselé nebo zásadité). K testování naší hypotézy jsme použili jak strojové učení pod dohledem, tak výpočetní přístupy bez dozoru.

V obou typech podmínek prostředí jsme zjistili, že jsme schopni jasně detekovat environmentální signál indikující typ extrémního prostředí, které konkrétní organismus obývá.

V případě strojového učení bez dozoru dostal „slepý“ algoritmus datovou sadu extrémofilních sekvencí DNA (a žádné další informace o jejich taxonomii nebo životním prostředí). Algoritmus byl poté požádán, aby seskupil tyto sekvence DNA do shluků na základě jakýchkoli podobností, které našel mezi jejich frekvenčními profily DNA.

Očekávalo se, že všechny shluky objevené tímto způsobem budou podle taxonomických linií: bakterie seskupené s bakteriemi a archaea seskupené s archaea. K našemu velkému překvapení tomu tak nebylo vždy a některé archaea a bakterie byly důsledně seskupeny, bez ohledu na to, jaké algoritmy jsme použili.

Jedinou zřejmou společnou vlastností, která by mohla vysvětlit, že jsou považováni za podobné mnoha algoritmy strojového učení, bylo to, že to byli extrémofilové milující teplo.

Šokující zjištění

Strom života, koncepční rámec používaný v biologii, který představuje geneaologické vztahy mezi druhy, má tři hlavní větve, nazývané domény: bakterie, archaea a eukarya.

Eukaryota jsou organismy, které mají jádro vázané na membránu, a tato doména zahrnuje zvířata, rostliny, houby a jednobuněčné mikroskopické protisty. Naproti tomu bakterie a archaea jsou jednobuněčné organismy, které nemají membránově vázané jádro obsahující genom. To, co odlišuje bakterie od archaea, je složení jejich buněčných stěn.

Strom života

Schematický strom života s primárními doménami, archaeami a bakteriemi, zobrazenými fialově a modře a sekundární doménou, eukaryoty, zeleně.

Tyto tři oblasti života se od sebe dramaticky liší a z genetického hlediska je bakterie stejně odlišná od archaeona jako lední medvěd (eukarya) od E-coli (bakterie).

Očekávalo se proto, že genom bakterie a archaeona bude co možná nejdále od sebe v jakémkoli shlukování podle jakéhokoli měřítka genomové podobnosti. Náš nález některých bakterií a archaeí seskupených dohromady, zřejmě jen proto, že jsou obě adaptovány na extrémní teplo, znamená, že extrémní teplotní prostředí, ve kterém žijí, způsobilo všudypřítomné, v celém genomu, systémové posuny v jejich genomovém jazyce.

Tento objev je podobný nalezení zcela nové dimenze genomu, environmentální dimenze, která existuje vedle jeho dobře známého taxonomického rozměru.

Genomický dopad jiných prostředí

Kromě toho, že je toto zjištění neočekávané, může mít důsledky pro naše chápání vývoje života na Zemi a také může vést naše myšlení k tomu, co by bylo zapotřebí k životu ve vesmíru.

Pyrococcus furiosus

Pyrococcus furiosusteplomilný archeon, který byl překvapivě seskupen s teplomilnými bakteriemi.

Náš probíhající výzkum skutečně zkoumá existenci environmentálního signálu v genomickém podpisu radiačně odolných extrémofilů, jako je např. Deinococcus radioduranskterý může přežít vystavení radiaci, stejně jako chladu, dehydrataci, vakuu a kyselinám, a bylo prokázáno, že je schopen přežít ve vesmíru až tři roky.Konverzace

Kathleen A. Hill, docentka biologie, Západní univerzita a Lila Kari, profesorka informatiky, University of Waterloo

Tento článek je znovu publikován z The Conversation pod licencí Creative Commons. Přečtěte si původní článek.

Leave a Reply

Your email address will not be published. Required fields are marked *