- Frekvens af ekspressionsomvendelse i eksperimentel evolution
- Metabolisk fluxomvendelse i miljøtilpasninger
- Fluxreversion genopretter i vid udstrækning de oprindelige fluxer
- Dominans af fluxreversion uanset det oprindelige miljø
- Hvorfor fænotypisk reversion er hyppigere end forstærkning
- Fænotypisk reversion i tilfældige metaboliske netværk
- Reversion er mindst lige så almindelig som forstærkning, selv for træk med mærkbar TC
Frekvens af ekspressionsomvendelse i eksperimentel evolution
Vi identificerede fem undersøgelser, der gennemførte seks forskellige tilpasningseksperimenter og indsamlede transkriptomdata, der passede til vores analyse. Disse seks eksperimenter omfattede 10 replikater af E. coli, der tilpasser sig et miljø med høj temperatur17, 6 replikater af en anden stamme af E. coli, der tilpasser sig et miljø med høj temperatur18, 7 replikater af E. coli, der tilpasser sig et glycerolmedium16, 7 replikater af E. coli, der tilpasser sig et glycerolmedium16, 7 replikater af E. coli, der tilpasser sig et miljø med høj temperatur18, 7 replikater af E. coli, der tilpasser sig et laktatmedium16, 1 gentagelse af hver af 12 forskellige gærstammer (Saccharomyces cerevisiae), der tilpasser sig et xylulosemedium19 , og 2 gentagelser af guppyer (Poecilia reticulata), der tilpasser sig et miljø med lavt prædationsniveau15. I alt analyserede vi 44 tilfælde af tilpasning.
I hvert tilfælde blev transkriptomdata henholdsvis indsamlet for organismerne i det oprindelige miljø (o for det oprindelige stadium), kort efter deres eksponering for det nye miljø (p for det plastiske stadium) og ved afslutningen af den eksperimentelle udvikling i det nye miljø (a for det tilpassede stadium; Fig. 1a). Bemærk, at tiden mellem o og p er så kort, at ingen nyopstået allel forventes at have nået en mærkbar frekvens i stadie p til at påvirke populationens gennemsnitlige fænotype. Udtryksniveauet for hvert gen behandles som en egenskab. Lad udtryksniveauet for et gen på o-, p- og a-stadierne være henholdsvis Lo, Lp og La. I hvert forsøg identificerede vi først gener med mærkbare PC’er i ekspressionsniveauet ved at kræve, at PC = |Lp-Lo| skal være større end en forudindstillet grænseværdi. Vi identificerede også gener med mærkbare GC’er i ekspressionsniveauet ved at kræve, at GC = |La-Lp| skal være større end den samme forudindstillede grænseværdi. For de gener, der viser både mærkbare PC’er og mærkbare GC’er, spørger vi, om de to ændringer går i samme retning (dvs. forstærkning) eller i modsat retning (dvs. reversion; fig. 1b, c). Vi brugte 20% af det oprindelige genekspressionsniveau (dvs. 0.2Lo) som cutoff i ovenstående analyse. Fraktionen af gener, der udviser forstærkning af ekspressionsniveauet (CRI), er mindre end fraktionen af gener, der udviser reversion (CRV) i 42 af de 44 tilpasninger, og forskellen mellem CRI og CRV er signifikant i 40 af disse 42 tilfælde (nominel P < 0,05; tosidet binomial test; Fig. 1d). Blandt de to tilpasninger med CRI CRV er deres forskel kun signifikant i et enkelt tilfælde (fig. 1d). Den generelle overvægt af ekspressionsniveauomvendelse (dvs. 42 ud af 44 tilfælde) i tilpasning er statistisk signifikant (P = 1,1 × 10-10, tosidet binomial test). Den samme tendens er tydelig, når cutoff ændres til 0.05Lo (Supplerende fig. 1a) eller 0.5Lo (Supplerende fig. 2a), hvilket tyder på, at ovenstående fund er robust over for cutoff-valget. Det er klart, at de transkriptomiske data ikke understøtter hypotesen om, at plasticitet generelt letter genetisk tilpasning.
Metabolisk fluxomvendelse i miljøtilpasninger
For at vurdere generaliteten af ovenstående fund og forstå den underliggende årsag udvidede vi sammenligningen mellem fænotypisk forstærkning og omvendelse til metaboliske fluxer (se Introduktion). Da vores metaboliske analyse ikke har til formål at modellere den ovennævnte eksperimentelle udvikling eller udtryksændringer, er de anvendte parametre ikke relateret til den eksperimentelle udvikling. Specifikt forudsagde vi beregningsmæssigt plastiske og genetiske fluxændringer under miljøtilpasninger ved hjælp af iAF1260, det rekonstruerede E. coli-metaboliske netværk23. Vi brugte fluxbalanceanalyse (FBA) til at forudsige de optimerede fluxer for fuldt tilpassede organismer i henholdsvis det oprindelige (stadium o) og det nye (stadium a) miljø under den antagelse, at biomasseproduktionshastigheden, en proxy for fitness, maksimeres af naturlig udvælgelse20. FBA-prædiktioner stemmer rimeligt godt overens med eksperimentelle målinger for organismer, der er tilpasset deres miljøer24,25,26,26,27,28,29, og de anvendes almindeligvis til undersøgelse af genotype-miljø-fænotype-relationer22,27,29,30,31,32,32,33,34,35,36,37. Ved forudsigelse af plastiske fluxændringer ved miljøskift (fase p) anvendte vi minimering af metabolisk tilpasning (MOMA) i stedet for FBA, fordi MOMA bedre gengiver det umiddelbare fluxrespons på forstyrrelser21 (se Metoder). Vi behandlede fluxen af hver reaktion i det metaboliske netværk som en egenskab og modellerede miljømæssige forskydninger ved at ændre den kulstofkilde, der er tilgængelig for netværket. Der er 258 forskellige udvekslingsreaktioner i iAF1260, som hver især transporterer en anden kulstofkilde. Vi undersøgte derfor 258 forskellige miljøer med en enkelt kulstofkilde.
Vi startede analysen ved at bruge glukose som kulstofkilde i det oprindelige miljø, fordi dette miljø var benchmark i iAF1260-konstruktionen23. Derefter undersøgte vi E. coli’s tilpasninger til 257 nye miljøer med hver en anden enkelt kulstofkilde. Vi fandt, at disse nye miljøer er naturligt adskilt i to grupper i den MOMA-forudsagte biomasseproduktionshastighed, en proxy for fitness på stadie p (fp) (Supplerende figur 3). Den ene gruppe viser fp < 10-4, hvilket tyder på, at det er usandsynligt, at E. coli kan klare sig i disse nye miljøer. Vi fokuserede derfor på de resterende 50 nye miljøer med fp 10-4, som E. coli formodentlig kan tilpasse sig (Supplerende tabel 1).
Definition af fluxforstærkning og reversion og anvendelse af cutoff på 0,2Lo som i transkriptomanalysen fandt vi CRV som værende signifikant større end CRI (nominel P < 10-10, tosidet binomial test) i hver tilpasning. Den tilfældige sandsynlighed for, at alle 50 tilpasninger viser CRV CRI er 1.8 × 10-15 (tohalet binomial test; Fig. 2a), hvilket tyder på en generel overvægt af fluxomvending. Den gennemsnitlige og median CRV er henholdsvis 30.2% og 30.5%, mens de for CRI kun er henholdsvis 1.0% og 0.8%. Ovenstående tendens gælder også, når vi ændrer grænsen til 0,05Lo (Supplerende fig. 1b) eller 0,5Lo (Supplerende fig. 2b). Da et FBA- eller MOMA-problem kan have flere løsninger, kan rækkefølgen af reaktionerne i den stoichiometriske matrix påvirke den specifikke løsning, der leveres af solveren. Ikke desto mindre er det generelle mønster CRV > CRI uændret, når vi tilfældigt blandede reaktionsrækkefølgen i iAF1260 (Supplerende fig. 4a). Da kvadratisk programmering – som kræves af MOMA – er vanskeligere at løse end lineær programmering, der anvendes i FBA, kan CRV være blevet overvurderet sammenlignet med CRI. For at rette op på dette potentielle problem designede vi en MOMA baseret på kvadratisk programmering ved navn “MOMA-b” og brugte den i stedet for FBA til at forudsige strømme i fase a (se Metoder), men fandt, at CRV stadig overstiger CRI (Supplerende fig. 4b). Denne tendens er således ikke et teknisk artefakt af solverforskellen mellem MOMA og FBA.
Fluxreversion genopretter i vid udstrækning de oprindelige fluxer
Dominans af fluxreversion uanset det oprindelige miljø
For at undersøge generaliteten af vores fund af dominans af fluxreversion undersøgte vi også tilpasninger med et ikke-glucose oprindeligt miljø. For mange oprindelige miljøer er det imidlertid kun nogle få nye miljøer, der kan tilpasses af E. coli’s metaboliske netværk. Vi fokuserede derfor på 41 oprindelige miljøer (herunder det tidligere anvendte glukosemiljø), som hver har mere end 20 adaptable (dvs. fp 10-4) nye miljøer (Supplerende tabel 2). For hvert af disse oprindelige miljøer beregnede vi CRI/CRV-forholdet for hvert tilpasningsdygtigt nyt miljø og fandt, at det typisk var lavere end 0,1 (fig. 2d). Vi beregnede derefter medianen af CRI/CRV på tværs af alle tilpasningsdygtige nye miljøer fra hvert oprindeligt miljø. På tværs af de 41 oprindelige miljøer er den største median CRI/CRV 0,11, og medianen af median CRI/CRV er kun 0,02. Uanset det oprindelige miljø er flux reversion derfor langt mere udbredt end forstærkning under genetiske tilpasninger til nye miljøer.
Hvorfor fænotypisk reversion er hyppigere end forstærkning
Vores fund, at fænotypisk forstærkning ikke blot ikke er mere, men faktisk er langt mindre udbredt end reversion, er uventet og kræver derfor en forklaring. Observationen af denne tendens i både transkriptomiske og fluxomiske analyser tyder på en generel underliggende mekanisme, som vi foreslår er forekomsten af PC > TC. Geometrisk set er det indlysende, at når PC TC, må GC vende PC’en (venstre og midterste diagrammer i øverste række i fig. 3a). Når PC < TC er der derimod lige stor sandsynlighed for omvendelse og forstærkning, hvis der ikke findes andre skævheder (venstre og midterste diagrammer i nederste række i fig. 3a). Lad sandsynligheden for PC > TC være q (> 0). CRI/CRV forventes at være / = (1 – q)/(1 + q) < 1. Med andre ord forventes det, så længe PC TC for nogle få træk, at reversion er hyppigere end forstærkning (hvis der ikke er nogen anden bias).
For at søge empirisk bevis for ovenstående forklaring beregnede vi for hvert af de 44 tilfælde af eksperimentel evolution den andel af gener, hvis udtryksændringer opfylder PC TC (fig. 3b). Middel- og medianfraktionerne er henholdsvis 0,51 og 0,48. Efter at vi har fjernet alle gener, for hvilke PC TC, er der desuden ikke længere et overskud af reversion (Supplerende fig. 5a), hvilket indikerer, at vores forklaring er tilstrækkelig. På samme måde beregnede vi brøkdelen af metaboliske reaktioner, der viser PC > TC i tilpasningen af E. coli’s metaboliske netværk fra glukosemiljøet til hvert af de 50 nye miljøer (fig. 3c). Middel- og medianfraktionerne er henholdsvis 0,85 og 0,93. Tilsvarende er der efter fjernelse af reaktioner, der viser PC > TC, ingen generel tendens til mere omvendelse end forstærkning på tværs af de 50 tilpasninger (Supplerende figur 5b). Disse transkriptom- og fluxomresultater understøtter, at overskuddet af reversion i forhold til forstærkning kan forklares ved forekomsten af PC TC for ikke-negligible fraktioner af egenskaber.
Hvorfor overstiger PC TC for mange egenskaber? En sandsynlig grund er, at PC’er giver organismer mulighed for at overleve ved et pludseligt miljøskifte, men fitnessen er meget reduceret sammenlignet med den i det oprindelige miljø såvel som den efter tilpasningen til det nye miljø. Organismernes overordnede fysiologiske tilstand kan således være ganske ens mellem de tilpassede stadier i det oprindelige og det nye miljø, men er meget forskellig i det plastiske stadium med lav egnethed lige efter miljøskiftet. Dette kan forklare, hvorfor PC overstiger TC for mange træk, uanset om trækværdierne er årsager til eller konsekvenser af organismens fitness og fysiologi.
Vi fandt stærke beviser for ovenstående model ved hjælp af metabolisk netværksanalyse. For det første sammenlignede vi ved hjælp af den forudsagte biomasseproduktionshastighed som en proxy for fitness E. coli-fitness på plastikstadiet (fp) og den efter tilpasning til et nyt miljø (fa), i forhold til den i det oprindelige glukosemiljø, for hver af tilpasningerne til de 50 nye miljøer. I alle tilfælde var fp < 1 (fig. 3d), hvilket bekræfter, at miljøskift forårsager fitnessfald før den genetiske tilpasning. Vi fandt, at fa typisk er tæt på 1, selv om den i nogle få nye miljøer er meget 1 (Fig. 3d). På en log10-skala er fp mere forskellig fra 1 end fa i 43 af de 50 tilpasninger (P = 1,0 × 10-7; enhalet binomial test). For det andet antager vores model en sammenhæng mellem fluxændringer og fitnessændringer22. På tværs af de 50 tilpasninger fra glukosemiljøet er der en stærk negativ korrelation mellem fp og gennemsnitlig PC (Spearmans ρ = -0.98, P < 10-300; Fig. 3e). Der er en modsatrettet korrelation mellem fa og gennemsnitlig TC (ρ = 0,57, P = 1,1 × 10-5; fig. 3f). Tilsammen viser vores analyser, at den primære årsag til en højere frekvens af fænotypisk reversion end forstærkning under tilpasning er, at med hensyn til fitness og tilknyttede fænotyper er organismer på stadium p mere forskellige end dem på stadium a, når de sammenlignes med dem på stadium o.
Fænotypisk reversion i tilfældige metaboliske netværk
Den PC’er og GC’er i genekspressionsniveau og metabolisk flux under tilpasninger afhænger henholdsvis af det regulatoriske netværk og det metaboliske netværk for den pågældende art. Da disse netværk er et resultat af milliarder af års evolution, spørger man sig selv, om den fremherskende fænotypiske reversion kan tilskrives de undersøgte arters udviklingshistorie, især de miljøer, som arten og dens forfædre tidligere er blevet udvalgt i, eller om det er en iboende egenskab ved ethvert funktionelt system. For at besvare dette spørgsmål anvendte vi den samme analyse på 500 funktionelle tilfældige metaboliske netværk, der tidligere var genereret22. Disse netværk blev konstrueret ud fra iAF1260 ved at bytte dets reaktioner med tilfældigt udvalgte reaktioner fra universet af alle metaboliske reaktioner i Kyoto Encyclopedia of Genes and Genomes38 , så længe netværket har en ikke-nul FBA-forudsagt fitness i glukosemiljøet ved hver reaktionsbytning39.
Kun 20 nye miljøer, som iAF1260 kan tilpasse sig (fra glukosemiljøet), kan tilpasses af mindst 20 af de 500 tilfældige netværk. Vi analyserede derfor tilpasningerne af tilfældige netværk til hvert af disse 20 nye miljøer med glukosemiljøet som det oprindelige miljø. For hvert nyt miljø er medianen af CRV for alle tilfældige netværk, der kan tilpasse sig dette miljø, generelt omkring 0,1 (boksdiagrammer i fig. 4a), med en median af median CRV på 0,11. Derimod er medianen af CRI for alle tilfældige netværk i et nyt miljø generelt under 0,01 (boksdiagrammer i fig. 4b), med en median af median CRI på 0,0033. Medianen af CRI/CRV-forholdet på tværs af tilfældige netværk for et nyt miljø er generelt under 0,05 (boksplot i fig. 4c), med en median af medianen af CRI/CRV på 0,0033. Det er klart, at den fremherskende fluxomvendelse også er tydelig i funktionelle tilfældige netværk, hvilket tyder på, at denne egenskab er iboende for ethvert funktionelt metabolisk netværk snarere end et produkt af bestemte evolutionære historier. Den mekanistiske forklaring på denne egenskab i de faktiske organismer (fig. 3) gælder faktisk også for de tilfældige metaboliske netværk, der er undersøgt her. Specielt er andelen af reaktioner, der udviser PC > TC, betydelig (fig. 4d), og fp er for det meste lavere end 1 (fig. 4e). Desuden er fp generelt mere forskellig fra 1 end fa på en log10-skala, fordi |log10fp|-|log10fa| stort set er positiv (Fig. 4f).
Det er imidlertid interessant, at for 19 af de 20 nye miljøer overstiger CRV i det metaboliske E. coli-netværk CRV-medianen i de tilfældige netværk for 19 af de 20 nye miljøer (fig. 4a). En lignende, men mindre indlysende tendens gælder for CRI (fig. 4b). For 16 af de 20 nye miljøer er CRI/CRV fra E. coli mindre end medianen af CRI/CRV i de tilfældige netværk (P = 0,012, tosidet binomial test; fig. 4c). Selv om både det metaboliske E. coli-netværk og de tilfældige netværk viser en overvægt af flux reversion, er dette fænomen således mere udtalt i E. coli. Mekanistisk set kan denne ulighed forklares i det mindste kvalitativt af vores model i det foregående afsnit. Specifikt for 15 af de 20 nye miljøer overstiger fraktionen af E. coli-reaktioner med PC TC den tilsvarende medianfraktion i tilfældige netværk (P = 0,021, enhalet binomial test; Fig. 4d). For alle 20 nye miljøer er E. coli’s fp lavere end medianen af fp i tilfældige netværk (P = 9,5 × 10-7, ensidig binomial test; fig. 4e). For 19 af de 20 nye miljøer er |log10 fp| – |log10 fa| for E. coli større end den tilsvarende medianværdi for de tilfældige netværk (P = 2,0 × 10-5, enhalet binomial test; fig. 4f). Men hvorfor er fp for E. coli lavere end for de tilfældige netværk? En mulig forklaring er, at sammensætningen og strukturen af E. coli’s metaboliske netværk er blevet evolutionært optimeret til vækst i glukosemiljøet og/eller beslægtede miljøer, mens det samme ikke gælder for de tilfældige netværk, som kun var nødvendige for at være levedygtige i glukosemiljøet. Når glukose erstattes af en ny kulstofkilde i et nyt miljø, falder E. coli’s fitness derfor betydeligt, mens de tilfældige netværks fitness kun falder lidt. Selv om den absolutte fitness i den plastiske fase meget vel kan være højere for E. coli end for de tilfældige netværk, forventes den relative fitness, som fp er, at være lavere for E. coli end for de tilfældige netværk. Således er den højere forekomst af fluxreversion i forhold til forstærkning i E. coli end tilfældige netværk sandsynligvis et biprodukt af stærkere selektion af E. coli sammenlignet med tilfældige netværk i det oprindelige miljø, der blev anvendt i vores tilpasningsanalyse.
Reversion er mindst lige så almindelig som forstærkning, selv for træk med mærkbar TC
I de foregående analyser af transkriptomer (Fig. 1d) og fluxomer (Fig. 2a) betragtede vi alle træk, der udviser mærkbare PC’er og GC’er. I sammenlignende og evolutionære undersøgelser er fænotyper på stadium p imidlertid typisk utilgængelige. Derfor fokuserer komparative og evolutionsbiologer normalt på egenskaber, hvis fænotypiske værdier er forskellige mellem stadierne o og a, på trods af at de andre egenskaber også kan have gennemgået adaptive ændringer (fra værdierne på stadiet p til værdierne på stadiet a). For at undersøge, om vores ovenstående resultater gælder for de træk, som de fleste komparative og evolutionsbiologer beskæftiger sig med, fokuserer vi på en delmængde af de ovenfor analyserede træk, som opfylder betingelsen TC 0,2Lo. Af de 44 tilfælde af eksperimentel evolution viste 33 CRV CRI (P = 0,0013, tosidet binomial test), i 30 af dem overstiger CRV signifikant CRI (nominel P < 0,05; tosidet binomial test; Fig. 5a). Af de 50 miljøtilpasninger af E. coli’s metaboliske netværk, der stammer fra glukosemiljøet, havde tre tilfælde lige mange fluxomvendinger og forstærkninger. Blandt de resterende 47 tilfælde viste 22 tilfælde mere reversion end forstærkning, mens 25 tilfælde viste det modsatte (P = 0,77, tosidet binomial test; Fig. 5b). Når CRI er signifikant forskellig fra CRV, viste 15 tilfælde CRV < CRI, mens 11 viste det modsatte (P = 0,70, tosidet binomial test; fig. 5b). Selv blandt træk med TC > 0,2Lo er der således ikke tegn på signifikant mere forstærkning end omvendelse, selv blandt træk med TC > 0,2Lo. Det skal bemærkes, at i ovenstående metaboliske analyse opfyldte i gennemsnit 139 reaktioner TC > 0.2Lo pr. tilpasning. Da alle fluxændringer, der observeres ved maksimering af fitness, er nødvendige og derfor pr. definition er gavnlige, involverer selv tilpasningen til en simpel kulstofkildeændring tilsyneladende meget mere end få reaktioner.