- Förekomst av uttrycksreversion i experimentell evolution
- Metaboliskt flödesreversion i miljöanpassningar
- Fluxreversion återställer till stor del de ursprungliga flödena
- Dominans av fluxreversion oavsett ursprunglig miljö
- Varför fenotypisk reversion är vanligare än förstärkning
- Fenotypisk reversion i slumpmässiga metaboliska nätverk
- Reversion är minst lika vanlig som förstärkning även för egenskaper med märkbar TC
Förekomst av uttrycksreversion i experimentell evolution
Vi identifierade fem studier som genomförde sex olika anpassningsexperiment och samlade in transkriptomdata som passade vår analys. Dessa sex experiment omfattade 10 replikat av E. coli som anpassar sig till en högtemperaturmiljö17, 6 replikat av en annan stam av E. coli som anpassar sig till en högtemperaturmiljö18, 7 replikat av E. coli som anpassar sig till ett glycerolmedium16, 7 replikat av E. coli som anpassar sig till ett glycerolmedium16, 7 replikat av E. coli som anpassar sig till ett glycerolmedium18. coli som anpassar sig till ett laktatmedium16, 1 replik av 12 olika jäststammar (Saccharomyces cerevisiae) som anpassar sig till ett xylulosemedium19 och 2 replikat av guppier (Poecilia reticulata) som anpassar sig till en miljö med låg predation15. Totalt analyserade vi 44 fall av anpassning.
I varje fall samlades transkriptomdata in för organismerna i den ursprungliga miljön (o för det ursprungliga stadiet), kort efter att de exponerats för den nya miljön (p för plaststadiet) och vid avslutningen av den experimentella utvecklingen i den nya miljön (a för det anpassade stadiet; fig. 1a). Observera att tiden mellan o och p är så kort att ingen nyuppkommen allel förväntas ha nått en märkbar frekvens i stadium p för att påverka populationens genomsnittliga fenotyp. Uttrycksnivån för varje gen behandlas som en egenskap. Låt uttrycksnivåerna för en gen i stadierna o, p och a vara Lo, Lp respektive La. I varje experiment identifierade vi först gener med märkbara PCs i uttrycksnivå genom att kräva att PC = |Lp-Lo| är större än ett förinställt gränsvärde. Vi identifierade också gener med märkbara GCs i uttrycksnivå genom att kräva att GC = |La-Lp| är större än samma förinställda gränsvärde. För de gener som uppvisar både märkbara PCs och märkbara GCs frågar vi oss om de två förändringarna går i samma riktning (dvs. förstärkning) eller i motsatt riktning (dvs. reversion; fig. 1b, c). Vi använde 20 % av den ursprungliga genuttrycksnivån (dvs. 0,2Lo) som gränsvärde i ovanstående analys. Andelen gener som uppvisar förstärkning av uttrycksnivån (CRI) är mindre än andelen gener som uppvisar reversion (CRV) i 42 av de 44 anpassningarna, och skillnaden mellan CRI och CRV är signifikant i 40 av dessa 42 fall (nominellt P < 0,05; tvåsidigt binomialtest; fig. 1d). Bland de två anpassningar med CRI CRV är skillnaden signifikant i endast ett fall (fig. 1d). Den allmänna övervikten av omvändning av uttrycksnivå (dvs. 42 av 44 fall) i anpassningen är statistiskt signifikant (P = 1,1 × 10-10, tvåsidigt binomiskt test). Samma tendens är tydlig när avgränsningen ändras till 0,05Lo (kompletterande figur 1a) eller 0,5Lo (kompletterande figur 2a), vilket tyder på att ovanstående resultat är robust för valet av avgränsning. Det är tydligt att de transkriptomiska uppgifterna inte stöder hypotesen att plasticitet generellt sett underlättar genetisk anpassning.
Metaboliskt flödesreversion i miljöanpassningar
För att bedöma generaliserbarheten av ovanstående fynd och förstå den bakomliggande orsaken utvidgade vi jämförelsen mellan fenotypisk förstärkning och reversion till metaboliska flöden (se Inledning). Eftersom vår metaboliska analys inte är avsedd att modellera ovanstående experimentella utveckling eller uttrycksförändringar är de parametrar som används orelaterade till den experimentella utvecklingen. Specifikt förutspådde vi beräkningsmässigt plastiska och genetiska flödesförändringar under miljöanpassningar med hjälp av iAF1260, det rekonstruerade metaboliska nätverket för E. coli23. Vi använde flödesbalansanalys (FBA) för att förutsäga de optimerade flödena hos fullt anpassade organismer i den ursprungliga (stadium o) respektive nya (stadium a) miljön, under antagandet att biomassaproduktionshastigheten, som är ett mått på fitness, maximeras av det naturliga urvalet20. FBA-prediktioner stämmer ganska väl överens med experimentella mått för organismer som är anpassade till sina miljöer24,25,26,27,28,29 och används vanligen vid studier av sambanden mellan genotyp, miljö och fenotyp22,27,29,30,31,32,32,33,34,35,36,37. När vi förutspådde förändringar i plastflödet vid miljöförändringar (steg p) använde vi minimering av metabolisk anpassning (MOMA) i stället för FBA eftersom MOMA bättre återger det omedelbara flödesresponsen på störningar21 (se metoder). Vi behandlade flödet av varje reaktion i det metaboliska nätverket som en egenskap och modellerade miljöförändringar genom att ändra den kolkälla som är tillgänglig för nätverket. Det finns 258 olika utbytesreaktioner i iAF1260, som var och en transporterar en annan kolkälla. Vi undersökte därför 258 olika miljöer med en enda kolkälla.
Vi började analysen med att använda glukos som kolkälla i den ursprungliga miljön, eftersom denna miljö var riktmärket i konstruktionen av iAF126023. Därefter undersökte vi E. coli:s anpassningar till 257 nya miljöer, var och en med en annan enkel kolkälla. Vi fann att dessa nya miljöer naturligt separeras i två grupper i den MOMA-beräknade biomassaproduktionshastigheten, ett mått på fitness vid stadium p (fp) (kompletterande figur 3). Den ena gruppen visar fp < 10-4, vilket tyder på att det är osannolikt att E. coli klarar sig i dessa nya miljöer. Vi fokuserade därför på de återstående 50 nya miljöerna med fp 10-4, som E. coli förmodligen kan anpassa sig till (kompletterande tabell 1).
Med definition av flödesförstärkning och reversion och med användning av gränsvärdet 0,2Lo som i transkriptomanalysen fann vi att CRV var signifikant större än CRI (nominell P < 10-10, tvåsvansat binomialtest) i varje anpassning. Den slumpmässiga sannolikheten att alla 50 anpassningar visar CRV CRI är 1,8 × 10-15 (tvåsidigt binomialtest; fig. 2a), vilket tyder på en allmän dominans av flödesreversion. Medelvärdet och medianvärdet för CRV är 30,2 % respektive 30,5 %, medan de för CRI endast är 1,0 % respektive 0,8 %. Ovanstående trend kvarstår när vi ändrar gränsen till 0,05Lo (kompletterande figur 1b) eller 0,5Lo (kompletterande figur 2b). Eftersom ett FBA- eller MOMA-problem kan ha flera lösningar kan reaktionsordningen i den stökiometriska matrisen påverka den specifika lösning som lösaren tillhandahåller. När vi slumpmässigt blandade reaktionsordningen i iAF1260 är dock det allmänna mönstret CRV > CRI oförändrat (kompletterande figur 4a). Eftersom kvadratisk programmering – som krävs av MOMA – är svårare att lösa än linjär programmering som används i FBA, kan CRV ha överskattats jämfört med CRI. För att åtgärda detta potentiella problem utformade vi en MOMA baserad på kvadratisk programmering kallad ”MOMA-b” och använde den i stället för FBA för att förutsäga flöden i steg a (se metoder), men fann att CRV fortfarande överstiger CRI (kompletterande fig. 4b). Denna trend är alltså inte en teknisk artefakt som beror på skillnaden i lösare mellan MOMA och FBA.
Fluxreversion återställer till stor del de ursprungliga flödena
Dominans av fluxreversion oavsett ursprunglig miljö
För att undersöka generaliserbarheten av vårt fynd av dominans av fluxreversion undersökte vi även anpassningar med en ursprunglig miljö som inte innehåller glukos. För många ursprungliga miljöer är dock endast ett fåtal nya miljöer anpassningsbara av E. coli metaboliska nätverk. Vi fokuserade därför på 41 ursprungliga miljöer (inklusive den tidigare använda glukosmiljön) som var och en har mer än 20 anpassningsbara (dvs. fp 10-4) nya miljöer (kompletterande tabell 2). För var och en av dessa ursprungliga miljöer beräknade vi CRI/CRV-förhållandet för varje anpassningsbar ny miljö och fann att det vanligtvis var lägre än 0,1 (fig. 2d). Vi beräknade sedan medianen av CRI/CRV för alla anpassningsbara nya miljöer från varje ursprunglig miljö. Bland de 41 ursprungliga miljöerna är den största medianen av CRI/CRV 0,11 och medianen av medianen av CRI/CRV endast 0,02. Oavsett den ursprungliga miljön är alltså flödesreversion mycket vanligare än förstärkning under genetiska anpassningar till nya miljöer.
Varför fenotypisk reversion är vanligare än förstärkning
Vår upptäckt att fenotypisk förstärkning inte bara inte är vanligare utan faktiskt mycket mindre vanligt än reversion är oväntad och kräver därför en förklaring. Observationen av denna trend i både transkriptomiska och fluxomiska analyser tyder på en allmän underliggande mekanism, som vi föreslår är förekomsten av PC > TC. Geometriskt sett är det uppenbart att när PC > TC måste GC vända PC (det vänstra och mellersta diagrammet i den översta raden i fig. 3a). När PC < TC är det däremot lika troligt att omvändning och förstärkning sker om det inte finns någon annan bias (det vänstra och mellersta diagrammet i den nedre raden i fig. 3a). Låt sannolikheten för PC TC vara q ( 0). CRI/CRV förväntas vara / = (1 – q)/(1 + q) < 1. Med andra ord, så länge som PC > TC för ett fåtal egenskaper förväntas återgång vara vanligare än förstärkning (om ingen annan bias föreligger).
För att söka empiriska bevis för ovanstående förklaring beräknade vi för vart och ett av de 44 fallen av experimentell evolution fraktionen av gener vars uttrycksförändringar uppfyller PC > TC (fig. 3b). Medel- och medianfraktionerna är 0,51 respektive 0,48. Efter att vi tagit bort alla gener för vilka PC TC finns det dessutom inte längre något överskott av reversion (kompletterande figur 5a), vilket visar att vår förklaring är tillräcklig. På samma sätt beräknade vi andelen metaboliska reaktioner som uppvisar PC TC vid anpassningen av E. coli:s metaboliska nätverk från glukosmiljön till var och en av de 50 nya miljöerna (fig. 3c). Medel- och medianfraktionerna är 0,85 respektive 0,93. Efter avlägsnande av reaktioner som uppvisar PC > TC finns det inte heller någon allmän tendens till mer omvändelse än förstärkning i de 50 anpassningarna (kompletterande fig. 5b). Dessa transkriptom- och fluxomresultat stöder att överskottet av reversion i förhållande till förstärkning kan förklaras av förekomsten av PC > TC för icke försumbara fraktioner av egenskaper.
Varför överstiger PC TC för många egenskaper? En trolig orsak är att PC gör det möjligt för organismer att överleva vid en plötslig miljöförändring, men att deras fitness är mycket lägre jämfört med den i den ursprungliga miljön och med den efter anpassningen till den nya miljön. Organismernas övergripande fysiologiska tillstånd kan alltså vara ganska likt mellan de anpassade stadierna i den ursprungliga och den nya miljön, men är mycket annorlunda i det plastiska stadiet med låg lämplighet direkt efter miljöomvandlingen. Detta kan förklara varför PC överstiger TC för många egenskaper, oavsett om egenskapsvärdena är orsaker eller konsekvenser av organismens fitness och fysiologi.
Vi fann starka bevis för ovanstående modell genom metabolisk nätverksanalys. För det första jämförde vi med hjälp av den förutspådda biomassaproduktionshastigheten som ett mått på fitness, E. coli fitness i plaststadiet (fp) och den efter anpassning till en ny miljö (fa), i förhållande till fitnessen i den ursprungliga glukosmiljön, för var och en av anpassningarna till de 50 nya miljöerna. I samtliga fall var fp < 1 (fig. 3d), vilket bekräftar att miljöförskjutningar orsakar fitnessminskningar före den genetiska anpassningen. Vi fann att fa vanligtvis ligger nära 1, även om den i några få nya miljöer är mycket >1 (fig. 3d). I en log10-skala skiljer sig fp mer från 1 än fa i 43 av de 50 anpassningarna (P = 1,0 × 10-7; ensidigt binomialtest). För det andra förutsätter vår modell ett samband mellan flödesförändringar och fitnessförändringar22. Bland de 50 anpassningarna från glukosmiljön finns det en stark negativ korrelation mellan fp och genomsnittlig PC (Spearmans ρ = -0.98, P < 10-300; fig. 3e). Det finns en motsatt korrelation mellan fa och genomsnittlig TC (ρ = 0,57, P = 1,1 × 10-5; fig. 3f). Sammantaget visar våra analyser att den främsta orsaken till en högre frekvens av fenotypisk reversion än förstärkning under anpassning är att när det gäller fitness och tillhörande fenotyper är organismer i stadium p mer annorlunda än organismer i stadium a, jämfört med organismer i stadium o.
Fenotypisk reversion i slumpmässiga metaboliska nätverk
PKs och GCs i genuttrycksnivån och det metabola flödet under anpassningar beror på respektive reglerande nätverk och metaboliska nätverk hos den berörda arten. Eftersom dessa nätverk är resultatet av miljarder år av evolution kan man fråga sig om övervikten av fenotypisk reversion beror på den studerade artens evolutionära historia, särskilt de miljöer där arten och dess förfäder har valts ut i det förflutna, eller om det är en inneboende egenskap hos alla funktionella system. För att besvara denna fråga tillämpade vi samma analys på 500 funktionella slumpmässiga metaboliska nätverk som tidigare genererats22. Dessa nätverk konstruerades från iAF1260 genom att byta ut dess reaktioner mot slumpmässigt utvalda reaktioner från universumet av alla metaboliska reaktioner i Kyoto Encyclopedia of Genes and Genomes38 så länge nätverket har en FBA-beräknad fitness som inte är lika med noll i glukosmiljön vid varje reaktionsbyte39.
Endast 20 nya miljöer som iAF1260 kan anpassa sig till (från glukosmiljön) är anpassningsbara för minst 20 av de 500 slumpmässiga nätverken. Vi analyserade därför de slumpmässiga nätverkens anpassningar till var och en av dessa 20 nya miljöer, med glukosmiljön som ursprunglig miljö. För varje ny miljö är medianen av CRV för alla slumpmässiga nätverk som kan anpassa sig till denna miljö i allmänhet omkring 0,1 (boxplottar i figur 4a), med medianen av medianen av CRV på 0,11. Däremot är medianen av CRI för alla slumpmässiga nätverk för en ny miljö i allmänhet lägre än 0,01 (boxplottar i figur 4b) och medianen av medianen av CRI är 0,0033. Medianförhållandet CRI/CRV i slumpmässiga nätverk för en ny miljö är i allmänhet lägre än 0,05 (boxplot i figur 4c), med en median av medianen CRI/CRV på 0,0033. Det är uppenbart att övervikten av flödesomvändning också är tydlig i funktionella slumpmässiga nätverk, vilket tyder på att denna egenskap är inneboende i alla funktionella metaboliska nätverk snarare än en produkt av särskilda evolutionära historier. Den mekanistiska förklaringen till denna egenskap i verkliga organismer (fig. 3) gäller för de slumpmässiga metaboliska nätverk som undersökts här. Särskilt är andelen reaktioner som uppvisar PC > TC betydande (fig. 4d) och fp är oftast lägre än 1 (fig. 4e). Dessutom skiljer sig fp i allmänhet mer från 1 än vad fa gör i en log10-skala, eftersom |log10fp|-|log10fa| i stort sett är positiv (fig. 4f).
Intressant nog är det dock så att för 19 av de 20 nya miljöerna överstiger CRV i E. coli metaboliska nätverk medianen för CRV i de slumpmässiga nätverken (fig. 4a). En liknande men mindre uppenbar trend gäller för CRI (fig. 4b). För 16 av de 20 nya miljöerna är CRI/CRV från E. coli mindre än medianen av CRI/CRV i de slumpmässiga nätverken (P = 0,012, tvåsidigt binomialtest; fig. 4c). Även om både det metaboliska nätverket från E. coli och slumpmässiga nätverk uppvisar en dominans av flödesomvändning är detta fenomen alltså mer uttalat i E. coli. Mekanistiskt sett kan denna skillnad åtminstone kvalitativt förklaras av vår modell i föregående avsnitt. För 15 av de 20 nya miljöerna överstiger fraktionen av E. coli-reaktioner med PC > TC motsvarande medianfraktion i slumpmässiga nätverk (P = 0,021, ensidigt binomialtest; fig. 4d). För alla 20 nya miljöer är E. coli:s fp lägre än medianen av fp i slumpmässiga nätverk (P = 9,5 × 10-7, ett ensidigt binomiskt test; fig. 4e). För 19 av de 20 nya miljöerna är |log10 fp| – |log10 fa| för E. coli större än motsvarande medianvärde för de slumpmässiga nätverken (P = 2,0 × 10-5, ett ensidigt binomialtest; fig. 4f). Men varför är fp för E. coli lägre än för slumpmässiga nätverk? En möjlig förklaring är att sammansättningen och strukturen hos E. coli:s metaboliska nätverk har optimerats evolutionärt för tillväxt i glukosmiljön och/eller relaterade miljöer, medan samma sak inte gäller för de slumpmässiga nätverken, som endast behövde vara livskraftiga i glukosmiljön. När glukos ersätts med en ny kolkälla i en ny miljö sjunker därför E. coli:s fitness avsevärt, medan de slumpmässiga nätverken endast sjunker svagt. Även om den absoluta lämpligheten i plaststadiet mycket väl kan vara högre för E. coli än för de slumpmässiga nätverken, förväntas den relativa lämpligheten, som fp är, vara lägre för E. coli än för de slumpmässiga nätverken. Således är den högre förekomsten av flussomvändning i förhållande till förstärkning i E. coli än i slumpmässiga nätverk sannolikt en biprodukt av starkare selektion av E. coli jämfört med slumpmässiga nätverk i den ursprungliga miljö som användes i vår anpassningsanalys.
Reversion är minst lika vanlig som förstärkning även för egenskaper med märkbar TC
I de föregående analyserna av transkriptom (Fig. 1d) och flussom (Fig. 2a), betraktade vi alla egenskaper som uppvisar märkbara PCs och GCs. I jämförande och evolutionära studier är dock fenotyper i stadium p vanligtvis otillgängliga. Därför fokuserar komparativa och evolutionsbiologer vanligtvis på egenskaper vars fenotypiska värden skiljer sig åt mellan stadierna o och a, trots att de andra egenskaperna också kan ha genomgått adaptiva förändringar (från värdena i stadiet p till värdena i stadiet a). För att undersöka om våra tidigare resultat gäller för de egenskaper som är föremål för de flesta komparativa och evolutionära biologer, fokuserar vi på en delmängd av de ovan analyserade egenskaperna som uppfyller villkoret TC > 0,2Lo. Av de 44 fallen av experimentell evolution visade 33 CRV > CRI (P = 0,0013, tvåsidigt binomialtest), i 30 av dessa överstiger CRV signifikant CRI (nominellt P < 0,05; tvåsidigt binomialtest; fig. 5a). Av de 50 miljöanpassningar av E. coli-metaboliska nätverket som har sitt ursprung i glukosmiljön hade tre fall lika många flussomvändningar och förstärkningar. Av de återstående 47 fallen uppvisade 22 fall mer reversion än förstärkning, medan 25 fall uppvisade det motsatta (P = 0,77, tvåsidigt binomiskt test; fig. 5b). När CRI skiljer sig signifikant från CRV visade 15 fall CRV < CRI medan 11 fall visade det motsatta (P = 0,70, binomiskt test med två svansar; fig. 5b). Även bland egenskaper med TC > 0,2Lo finns det alltså inga belägg för signifikant mer förstärkning än reversion. Noterbart är att i ovanstående metaboliska analys uppfyllde i genomsnitt 139 reaktioner TC > 0,2Lo per anpassning. Eftersom alla flödesförändringar som observeras vid maximering av fitness krävs och därför per definition är fördelaktiga, innebär till och med anpassningen till en enkel förändring av kolkällan uppenbarligen mycket mer än några få reaktioner.