Evoluční adaptace na nové prostředí obvykle zvrátí plastické fenotypové změny

Výskyt reverze exprese v experimentální evoluci

Idefinovali jsme pět studií, které provedly šest různých adaptačních experimentů a shromáždily transkriptomová data vyhovující naší analýze. Těchto šest experimentů zahrnovalo 10 replikátů E. coli adaptujících se na prostředí s vysokou teplotou17, 6 replikátů jiného kmene E. coli adaptujícího se na prostředí s vysokou teplotou18, 7 replikátů E. coli adaptujících se na glycerolové médium16, 7 replikátů E. coli adaptující se na laktátové médium16, po 1 replikátu 12 různých kmenů kvasinek (Saccharomyces cerevisiae) adaptujících se na xylulózové médium19 a 2 replikáty gupií (Poecilia reticulata) adaptujících se na prostředí s nízkým výskytem predátorů15. Celkem jsme analyzovali 44 případů adaptace.

V každém případě byla transkriptomová data shromážděna pro organismy v původním prostředí (o pro původní stadium), krátce po jejich vystavení novému prostředí (p pro plastické stadium) a na závěr experimentálního vývoje v novém prostředí (a pro adaptované stadium; obr. 1a). Všimněte si, že doba mezi o a p je tak krátká, že se neočekává, že by nově vzniklá alela dosáhla ve stadiu p znatelné frekvence, která by ovlivnila průměrný fenotyp populace. S úrovní exprese každého genu se zachází jako se znakem. Nechť úrovně exprese genu ve stádiích o, p a a jsou Lo, Lp a La. V každém experimentu jsme nejprve identifikovali geny se znatelnými PC v úrovni exprese tak, že jsme požadovali, aby PC = |Lp-Lo| bylo větší než předem stanovená mezní hodnota. Dále jsme identifikovali geny se znatelnými GC v úrovni exprese tak, že jsme požadovali, aby GC = |La-Lp| bylo větší než stejná předem nastavená mezní hodnota. U genů, které vykazují jak znatelné PC, tak znatelné GC, jsme se ptali, zda jsou obě změny ve stejném směru (tj. posílení), nebo v opačném směru (tj. reverze; obr. 1b, c). Jako mezní hodnotu jsme ve výše uvedené analýze použili 20 % původní úrovně genové exprese (tj. 0,2Lo). Podíl genů vykazujících posílení úrovně exprese (CRI) je menší než podíl genů vykazujících reverzi (CRV) ve 42 ze 44 adaptací a rozdíl mezi CRI a CRV je významný ve 40 z těchto 42 případů (nominální P < 0,05; dvouvýběrový binomický test; obr. 1d). Mezi dvěma adaptacemi s CRI > CRV je jejich rozdíl významný pouze v jednom případě (obr. 1d). Obecná převaha reverze úrovně exprese (tj. 42 ze 44 případů) v adaptaci je statisticky významná (P = 1,1 × 10-10, dvouvýběrový binomický test). Stejný trend je patrný při změně mezní hodnoty na 0,05Lo (doplňkový obr. 1a) nebo 0,5Lo (doplňkový obr. 2a), což naznačuje, že výše uvedené zjištění je robustní vůči volbě mezní hodnoty. Je zřejmé, že transkriptomická data nepodporují hypotézu, že plasticita obecně usnadňuje genetickou adaptaci.

Reverze metabolických toků při adaptacích na prostředí

Pro posouzení obecnosti výše uvedeného zjištění a pochopení jeho základní příčiny jsme rozšířili srovnání fenotypového posílení a reverze metabolických toků (viz Úvod). Protože naše metabolická analýza nemá za cíl modelovat výše uvedenou experimentální evoluci nebo změny exprese, použité parametry s experimentální evolucí nesouvisí. Konkrétně jsme výpočetně předpověděli plastické a genetické změny toků během adaptací na prostředí pomocí iAF1260, rekonstruované metabolické sítě E. coli23. K předpovědi optimalizovaných toků plně adaptovaných organismů v původním (stadium o), resp. novém (stadium a) prostředí jsme použili analýzu bilance toků (FBA) za předpokladu, že rychlost produkce biomasy, která je zástupným ukazatelem fitness, je maximalizována přirozeným výběrem20. Předpovědi FBA poměrně dobře odpovídají experimentálním opatřením pro organismy přizpůsobené svému prostředí24,25,26,27,28,29 a běžně se používají při studiu vztahů mezi genotypem, prostředím a fenotypem22,27,29,30,31,32,33,34,35,36,37. Při předpovídání změn plastického toku při změnách prostředí (stupeň p) jsme místo FBA použili minimalizaci metabolického přizpůsobení (MOMA), protože MOMA lépe rekapituluje okamžitou reakci toku na perturbace21 (viz Metody). Tok každé reakce v metabolické síti jsme považovali za vlastnost a změny prostředí jsme modelovali změnou zdroje uhlíku dostupného pro síť. V iAF1260 existuje 258 různých výměnných reakcí, z nichž každá přenáší jiný zdroj uhlíku. Proto jsme zkoumali 258 různých prostředí s jedním zdrojem uhlíku.

Analýzu jsme zahájili použitím glukózy jako zdroje uhlíku v původním prostředí, protože toto prostředí bylo při konstrukci iAF1260 referenčním prostředím23. Poté jsme zvažovali adaptace E. coli na 257 nových prostředí, každé s jiným zdrojem jednoho uhlíku. Zjistili jsme, že tato nová prostředí jsou přirozeně rozdělena do dvou skupin podle rychlosti produkce biomasy předpovězené metodou MOMA, což je ukazatel fitness ve fázi p (fp) (doplňkový obr. 3). Jedna skupina vykazuje fp < 10-4, což naznačuje, že E. coli se v těchto nových prostředích pravděpodobně neudrží. Zaměřili jsme se proto na zbývajících 50 nových prostředí s fp > 10-4, na která se E. coli pravděpodobně dokáže adaptovat (Doplňková tabulka 1).

Definováním posílení toku a reverze a použitím hranice 0,2Lo jako v analýze transkriptomu jsme zjistili, že CRV je v každé adaptaci významně větší než CRI (nominální P < 10-10, dvouvýběrový binomický test). Náhodná pravděpodobnost, že všech 50 adaptací vykazuje CRV > CRI, je 1,8 × 10-15 (dvouvýběrový binomický test; obr. 2a), což naznačuje obecnou převahu reverze toku. Průměrná hodnota CRV je 30,2 % a medián 30,5 %, zatímco hodnoty pro CRI jsou pouze 1,0 % a 0,8 %. Výše uvedený trend platí, i když změníme mezní hodnotu na 0,05Lo (doplňkový obr. 1b) nebo 0,5Lo (doplňkový obr. 2b). Protože problém FBA nebo MOMA může mít více řešení, mohlo by pořadí reakcí ve stechiometrické matici ovlivnit konkrétní řešení poskytnuté řešitelem. Nicméně když jsme náhodně zamíchali pořadí reakcí v iAF1260, obecný vzorec CRV > CRI se nezměnil (doplňkový obr. 4a). Protože kvadratické programování – vyžadované programem MOMA – je obtížnější na řešení než lineární programování používané v programu FBA, mohlo být CRV ve srovnání s CRI nadhodnoceno. Abychom tento potenciální problém napravili, navrhli jsme MOMA založenou na kvadratickém programování s názvem „MOMA-b“ a použili ji místo FBA k předpovědi toků ve fázi a (viz Metody), ale zjistili jsme, že CRV stále převyšuje CRI (Doplňkový obr. 4b). Tento trend tedy není technickým artefaktem rozdílu v řešení mezi MOMA a FBA.

Obr. 2

Převaha reverze toku při adaptaci E. coli na prostředí. a Podíly reakcí s posilujícími (CRI), resp. reverzními (CRV) změnami toku při adaptaci z prostředí glukózy na každé z 50 nových prostředí. Každý sloupec představuje adaptaci na nové prostředí. Rovnost podílu posilujících a zvratných reakcí je testována dvouvýběrovým binomickým testem. Pokud je CRV > CRI, jsou P-hodnoty uvedeny následovně: *P < 0,05; **P < 10-10; ***P < 10-100; když CRV < CRI, P-hodnoty jsou uvedeny takto: oP < 0,05; ooP < 10-10; oooP < 10-100. b Klasifikace reverze do tří kategorií podle toho, zda je fenotypová hodnota v původním prostředí nedostatečně obnovená, obnovená nebo nadměrně obnovená. c Podíly tří kategorií reverze v každé z 50 adaptací. d Podíl posilujících reakcí vzhledem k podílu reverzních reakcí (CRI/CRV) v adaptacích E. coli na nejméně 20 nových prostředí z každého ze 41 zkoumaných původních prostředí. Poměry CRI/CRV pro všechny adaptace z každého původního prostředí jsou uvedeny v krabicovém grafu, kde dolní a horní okraj krabice představují první (qu1), resp. třetí (qu3) kvartil, vodorovná čára uvnitř krabice označuje medián (md), metličky sahají k nejextrémnějším hodnotám uvnitř vnitřních ohraničení, md ± 1.5(qu3 – qu1) a kruhy představují hodnoty mimo vnitřní ohrady (odlehlé hodnoty)

Převrácení toku do značné míry obnovuje původní toky

Převaha převrácení toku bez ohledu na původní prostředí

Abychom prozkoumali obecnost našeho zjištění o převaze převrácení toku, zkoumali jsme také adaptace s původním prostředím bez glukózy. U mnoha původních prostředí se však metabolická síť E. coli dokáže adaptovat pouze na několik nových prostředí. Zaměřili jsme se tedy na 41 původních prostředí (včetně dříve používaného glukózového prostředí), z nichž každé má více než 20 adaptabilních (tj. fp > 10-4) nových prostředí (doplňková tabulka 2). Pro každé z těchto původních prostředí jsme vypočítali poměr CRI/CRV pro každé adaptabilní nové prostředí a zjistili jsme, že je obvykle nižší než 0,1 (obr. 2d). Poté jsme z každého původního prostředí vypočítali medián CRI/CRV ve všech adaptabilních nových prostředích. Napříč 41 původními prostředími je největší medián CRI/CRV 0,11 a medián mediánu CRI/CRV je pouze 0,02. Na základě toho jsme dospěli k závěru, že největší medián CRI/CRV je 0,02. Proto je bez ohledu na původní prostředí fluktuační reverze mnohem častější než posílení během genetických adaptací na nová prostředí.

Proč je fenotypová reverze častější než posílení

Naše zjištění, že fenotypové posílení nejenže není častější, ale ve skutečnosti je mnohem méně časté než reverze, je nečekané, a proto vyžaduje vysvětlení. Pozorování tohoto trendu v transkriptomických i fluxomických analýzách naznačuje obecný základní mechanismus, kterým je podle našeho návrhu výskyt PC > TC. Z geometrického hlediska je zřejmé, že když PC > TC, musí GC obrátit PC (levý a prostřední diagram v horním řádku na obr. 3a). Naproti tomu, když PC < TC, jsou reverze i posílení stejně pravděpodobné, pokud neexistuje žádná jiná odchylka (levý a prostřední diagram ve spodním řádku na obr. 3a). Nechť pravděpodobnost PC > TC je q (> 0). Očekává se, že CRI/CRV bude / = (1 – q)/(1 + q) < 1. Jinými slovy, dokud je PC > TC pro několik znaků, očekává se, že reverze bude častější než posílení (při neexistenci jiného vychýlení).

Obr. 3

Příčina převahy fenotypové reverze v adaptaci. a Schéma znázorňující model. Horní část ukazuje, že pokud je plastická změna (PC) větší než celková změna (TC), musí genetická změna (GC) zvrátit PC (levý a prostřední diagram). Jedním z důvodů pro PC > TC je, že rozdíl ve fitness mezi organismy ve stádiích o a p je větší než mezi stádii o a (pravý diagram). Spodní část ukazuje, že pokud PC < TC, GC buď posiluje, nebo obrací PC (levý a prostřední diagram). K tomu může dojít, pokud je rozdíl ve fitness mezi organismy ve stádiích o a p menší než mezi o a a (pravý diagram) nebo pokud fenotyp není spojen s fitness. b Podíl genů vykazujících expresi PC > TC během každé ze 44 experimentálních evolučních adaptací. c Podíl reakcí vykazujících tok PC > TC během každé z metabolických adaptací E. coli z prostředí glukózy do 50 nových prostředí. d Fitness ve stadiu p a ve stadiu a vzhledem k fitness ve stadiu o, předpovězená analýzou metabolické sítě, pro každou z 50 adaptací v c. Přerušovaná čára ukazuje fitness ve fázi o. e Průměrný PC ve všech tocích negativně koreluje s relativním fitness ve fázi p (fp) mezi 50 adaptacemi v c. f Průměrná TC napříč všemi toky pozitivně koreluje s relativní fitness ve stadiu a (fa) mezi 50 adaptacemi v c

Pro hledání empirických důkazů pro výše uvedené vysvětlení jsme pro každý ze 44 případů experimentální evoluce vypočítali podíl genů, jejichž změny exprese splňují PC > TC (obr. 3b). Průměrný a mediánový podíl činí 0,51, resp. 0,48. Navíc poté, co odstraníme všechny geny, u nichž PC > TC, již nedochází k přebytku reverzí (doplňkový obr. 5a), což svědčí o dostatečnosti našeho vysvětlení. Podobně jsme vypočítali podíl metabolických reakcí vykazujících PC > TC při adaptaci metabolické sítě E. coli z prostředí glukózy na každé z 50 nových prostředí (obr. 3c). Průměrný a mediánový podíl činí 0,85 a 0,93. Podobně po odstranění reakcí vykazujících PC > TC neexistuje obecný trend většího navracení než posilování napříč 50 adaptacemi (doplňkový obr. 5b). Tyto výsledky transkriptomu a fluxomu podporují, že převaha reverze nad posilováním je vysvětlitelná výskytem PC > TC u nezanedbatelného podílu znaků.

Proč PC převyšuje TC u mnoha znaků? Pravděpodobným důvodem je, že PC umožňuje organismům přežít při náhlé změně prostředí, ale fitness je mnohem nižší ve srovnání s fitness v původním prostředí i s fitness po adaptaci na nové prostředí. Celkový fyziologický stav organismů tak může být dosti podobný mezi adaptovanými stadii v původním a novém prostředí, ale je značně odlišný v plastickém stadiu s nízkou kondicí těsně po změně prostředí. To může vysvětlovat, proč PC převyšuje TC u mnoha znaků bez ohledu na to, zda jsou hodnoty znaků příčinou nebo důsledkem fitness a fyziologie organismu.

Analýzou metabolických sítí jsme nalezli silné důkazy pro výše uvedený model. Nejprve jsme pomocí předpokládané rychlosti produkce biomasy jako ukazatele fitness porovnali fitness E. coli v plastické fázi (fp) a po adaptaci na nové prostředí (fa) vzhledem k fitness v původním prostředí s glukózou pro každou z 50 adaptací na nové prostředí. Ve všech případech fp < 1 (obr. 3d), což potvrzuje, že změny prostředí způsobují pokles fitness před genetickou adaptací. Zjistili jsme, že fa se obvykle blíží 1, i když v několika nových prostředích je mnohem >1 (obr. 3d). V měřítku log10 se fp liší od 1 více než fa ve 43 z 50 adaptací (P = 1,0 × 10-7; jednovýběrový binomický test). Za druhé, náš model předpokládá souvislost mezi změnami toku a změnami fitness22. Napříč 50 adaptacemi z prostředí glukózy existuje silná negativní korelace mezi fp a průměrným PC (Spearmanovo ρ = -0.98, P < 10-300; obr. 3e). Opačná korelace existuje mezi fa a průměrným TC (ρ = 0,57, P = 1,1 × 10-5; obr. 3f). Naše analýzy dohromady ukazují, že hlavním důvodem vyšší frekvence fenotypové reverze než posílení během adaptace je to, že z hlediska fitness a souvisejících fenotypů se organismy ve stadiu p více liší od organismů ve stadiu a ve srovnání s organismy ve stadiu o.

Fenotypová reverze v náhodných metabolických sítích

PC a GC v úrovni genové exprese a metabolického toku během adaptací závisí na regulační síti, resp. metabolické síti daného druhu. Vzhledem k tomu, že tyto sítě jsou výsledkem miliard let evoluce, je otázkou, zda je převaha fenotypové reverze dána evoluční historií studovaného druhu, zejména prostředím, v němž byl daný druh a jeho předci v minulosti selektováni, nebo vnitřní vlastností jakéhokoli funkčního systému. Abychom se touto otázkou zabývali, použili jsme stejnou analýzu na 500 funkčních náhodných metabolických sítí, které byly dříve vytvořeny22. Tyto sítě byly zkonstruovány z iAF1260 záměnou jeho reakcí za náhodně vybrané reakce z univerza všech metabolických reakcí v Kjótské encyklopedii genů a genomů38 , pokud má síť při každé záměně reakcí nenulový fitness předpovězený FBA v prostředí glukózy39.

Nejméně 20 z 500 náhodných sítí se dokáže adaptovat na 20 nových prostředí, na která se iAF1260 dokáže adaptovat (z prostředí glukózy). Analyzovali jsme tedy adaptace náhodných sítí na každé z těchto 20 nových prostředí, přičemž původním prostředím bylo prostředí glukózy. Pro každé nové prostředí se medián CRV všech náhodných sítí, které se na toto prostředí mohou adaptovat, obecně pohybuje kolem 0,1 (krabicové grafy na obr. 4a), přičemž medián mediánu CRV je 0,11. Naproti tomu medián CRI všech náhodných sítí pro nové prostředí je obecně nižší než 0,01 (krabicové grafy na obr. 4b), přičemž medián mediánu CRI je 0,0033. Medián poměru CRI/CRV v náhodných sítích pro nové prostředí je obecně nižší než 0,05 (krabicový graf na obr. 4c), přičemž medián mediánu CRI/CRV je 0,0033. Je zřejmé, že převaha reverze toku je patrná i ve funkčních náhodných sítích, což naznačuje, že tato vlastnost je vlastní každé funkční metabolické síti, a nikoliv produktem konkrétní evoluční historie. Mechanistické vysvětlení této vlastnosti u skutečných organismů (obr. 3) skutečně platí i pro zde zkoumané náhodné metabolické sítě. Konkrétně podíl reakcí vykazujících PC > TC je značný (obr. 4d) a fp je většinou nižší než 1 (obr. 4e). Kromě toho se fp obecně více liší od 1 než fa ve stupnici log10, protože |log10fp|-|log10fa| je převážně kladný (obr. 4f).

Obr. 4

Převaha reverze toku v náhodných metabolických sítích. Podíly reakcí vykazujících flux reversion (CRV) (a), podíly reakcí vykazujících posílení toku (CRI) (b), poměry CRI/CRV (c), podíly reakcí vykazujících PC > TC (d), fp (e) a |log10fp| – |log10fa| (f) v adaptacích náhodných sítí z prostředí glukózy na každé z 20 zkoumaných nových prostředí. Pro každé nové prostředí jsou hodnoty odhadnuté z různých náhodných sítí znázorněny krabicovým grafem, přičemž symboly jsou vysvětleny v legendě k obr. 2d. Odpovídající hodnoty pro síť E. coli iAF1260 jsou znázorněny červenými diamanty

Zajímavé však je, že pro 19 z 20 nových prostředí CRV v metabolické síti E. coli převyšuje medián CRV v náhodných sítích (obr. 4a). Podobný, ale méně zřejmý trend platí pro CRI (obr. 4b). U 16 z 20 nových prostředí je CRI/CRV z E. coli menší než medián CRI/CRV náhodných sítí (P = 0,012, dvouvýběrový binomický test; obr. 4c). Ačkoli tedy jak metabolická síť E. coli, tak náhodné sítě vykazují převahu flux reverze, tento jev je výraznější u E. coli. Mechanisticky je tento rozdíl alespoň kvalitativně vysvětlitelný naším modelem v předchozí části. Konkrétně u 15 z 20 nových prostředí převyšuje podíl reakcí E. coli s PC > TC odpovídající mediánový podíl v náhodných sítích (P = 0,021, jednovýběrový binomický test; obr. 4d). Pro všech 20 nových prostředí je fp E. coli nižší než medián fp náhodných sítí (P = 9,5 × 10-7, jednovýběrový binomický test; obr. 4e). Pro 19 z 20 nových prostředí je |log10 fp| – |log10 fa| pro E. coli větší než odpovídající medián náhodných sítí (P = 2,0 × 10-5, jednovýběrový binomický test; obr. 4f). Proč je však fp u E. coli nižší než u náhodných sítí? Jedním z možných vysvětlení je, že složení a struktura metabolické sítě E. coli byly evolučně optimalizovány pro růst v prostředí glukózy a/nebo v příbuzných prostředích, zatímco u náhodných sítí tomu tak není, protože u nich byla vyžadována pouze životaschopnost v prostředí glukózy. V důsledku toho, když je glukóza nahrazena novým zdrojem uhlíku v novém prostředí, fitness E. coli podstatně klesne, ale fitness náhodných sítí může klesnout jen mírně. Ačkoli absolutní fitness v plastické fázi může být u E. coli vyšší než u náhodných sítí, očekává se, že relativní fitness, kterým je fp, bude u E. coli nižší než u náhodných sítí. Vyšší výskyt reverze toku v porovnání s posilováním u E. coli než u náhodných sítí je tedy pravděpodobně vedlejším produktem silnější selekce E. coli ve srovnání s náhodnými sítěmi v původním prostředí použitém v naší adaptační analýze.

Reverze je přinejmenším stejně častá jako posilování i u znaků se znatelnými TC

V předchozích analýzách transkriptomů (obr. 1d) a fluxomů (obr. 2a) jsme uvažovali všechny znaky vykazující znatelné PC a GC. Ve srovnávacích a evolučních studiích jsou však fenotypy ve stadiu p obvykle nedostupné. V důsledku toho se komparativní a evoluční biologové obvykle zaměřují na znaky, jejichž fenotypové hodnoty se liší mezi stadii o a a, přestože i u ostatních znaků mohlo dojít k adaptivním změnám (z hodnot ve stadiu p na hodnoty ve stadiu a). Abychom prozkoumali, zda se naše výše uvedené závěry vztahují na znaky, které jsou předmětem zájmu většiny srovnávacích a evolučních biologů, zaměříme se na podmnožinu výše analyzovaných znaků, které splňují podmínku TC > 0,2Lo. Ze 44 případů experimentální evoluce jich 33 vykazovalo CRV > CRI (P = 0,0013, dvouvýběrový binomický test), přičemž ve 30 z nich CRV významně převyšuje CRI (nominální P < 0,05; dvouvýběrový binomický test; obr. 5a). Z 50 environmentálních adaptací metabolické sítě E. coli pocházejících z prostředí glukózy se ve třech případech vyskytl stejný počet reverzních a posilujících toků. Ze zbývajících 47 případů vykazovalo 22 případů více reverze než posílení, zatímco 25 případů vykazovalo opak (P = 0,77, dvouvýběrový binomický test; obr. 5b). Pokud se CRI významně liší od CRV, 15 případů vykazovalo CRV < CRI, zatímco 11 naopak (P = 0,70, dvouvýběrový binomický test; obr. 5b). Z toho vyplývá, že ani mezi znaky s TC > 0,2Lo se neprokázalo významně větší posílení než zvrat. Za zmínku stojí, že ve výše uvedené metabolické analýze splňovalo TC > 0,2Lo v průměru 139 reakcí na adaptaci. Vzhledem k tomu, že všechny změny toku pozorované při maximalizaci fitness jsou vyžadovány, a jsou tedy z definice prospěšné, i adaptace na jednoduchou změnu zdroje uhlíku zřejmě zahrnuje mnohem více než jen několik reakcí.

Obr. 5

Podíl posilujících znaků (CRI) není v adaptacích větší než podíl reverzních znaků (CRV), i když celková změna přesáhne předem stanovenou mez. Znaky splňující |La – Lo| > 0,2Lo, |Lp – Lo| > 0,2Lo a |La – Lp| > 0,2Lo jsou klasifikovány na zesilující a zvratné znaky podle toho, zda genetické a plastické změny mají stejný nebo opačný směr. a Podíly genů se zesilujícími, resp. zvratnými změnami exprese v experimentální evoluci. Jsou vyznačeny organismy i nová prostředí, na která se organismy adaptovaly. Každý sloupec představuje adaptaci. b Podíly reakcí s předpokládanými posilujícími, respektive opačnými změnami toku v adaptacích E. coli na 50 nových prostředí z prostředí glukózy. V obou panelech je rovnost podílu posilujících a zvratných reakcí testována dvouvýběrovým binomickým testem. Pokud je CRV > CRI, jsou P-hodnoty uvedeny následovně: *P < 0,05; **P < 10-10; ***P < 10-100; když CRV < CRI, P-hodnoty jsou uvedeny takto: oP < 0,05; ooP < 10-10; oooP < 10-100