- Prevalentie van expressie-terugkeer in experimentele evolutie
- Metabole flux omkering in milieu-aanpassingen
- Fluxomkeer herstelt de oorspronkelijke fluxen grotendeels
- Rominantie van fluxomkeer ongeacht het oorspronkelijke milieu
- Waarom fenotypische reversion vaker voorkomt dan versterking
- Phenotypische omkeer in willekeurige metabolische netwerken
- Reversion is minstens zo gebruikelijk als versterking, zelfs voor kenmerken met merkbare TC
Prevalentie van expressie-terugkeer in experimentele evolutie
We identificeerden vijf studies die zes verschillende aanpassingsexperimenten uitvoerden en transcriptoomgegevens verzamelden die pasten bij onze analyse. Deze zes experimenten omvatten 10 replicaten van E. coli die zich aanpast aan een omgeving met hoge temperatuur17, 6 replicaten van een andere stam van E. coli die zich aanpast aan een omgeving met hoge temperatuur18, 7 replicaten van E. coli die zich aanpast aan een glycerolmedium16, 7 replicaten van E. coli die zich aanpassen aan een lactaatmedium16, 1 replicaat van 12 verschillende giststammen (Saccharomyces cerevisiae) die zich aanpassen aan een xylulose-medium19, en 2 replicaten van guppy’s (Poecilia reticulata) die zich aanpassen aan een omgeving met weinig predatie15. In totaal analyseerden we 44 gevallen van aanpassing.
In elk geval werden transcriptoomgegevens respectievelijk verzameld voor de organismen in de oorspronkelijke omgeving (o voor het oorspronkelijke stadium), kort na hun blootstelling aan de nieuwe omgeving (p voor het plastische stadium), en aan het einde van de experimentele evolutie in de nieuwe omgeving (a voor het aangepaste stadium; Fig. 1a). Merk op dat de tijd tussen o en p zo kort is dat niet verwacht wordt dat een nieuw ontstaan allel een merkbare frequentie heeft bereikt in stadium p om het gemiddelde fenotype van de populatie te beïnvloeden. Het expressieniveau van elk gen wordt behandeld als een eigenschap. Laten de expressieniveaus van een gen in de o, p, en a stadia respectievelijk Lo, Lp, en La zijn. In elk experiment identificeren we eerst genen met merkbare PCs in expressieniveau door te eisen dat PC = |Lp-Lo| groter is dan een vooraf ingestelde cutoff. We identificeerden ook genen met merkbare GCs in expressieniveau door te eisen dat GC = |La-Lp| groter is dan dezelfde vooraf ingestelde cutoff. Voor de genen die zowel merkbare PCs als merkbare GCs vertonen, vragen we of de twee veranderingen in dezelfde richting gaan (d.w.z., versterking) of in tegenovergestelde richting (d.w.z., ommekeer; Fig. 1b, c). We gebruikten 20% van het oorspronkelijke genexpressieniveau (d.w.z. 0.2Lo) als de cutoff in de bovenstaande analyse. De fractie van genen die expressieniveauversterking vertonen (CRI) is kleiner dan de fractie van genen die omkeer vertonen (CRV) in 42 van de 44 aanpassingen, en het verschil tussen CRI en CRV is significant in 40 van deze 42 gevallen (nominaal P < 0.05; binomiale toets met twee staarten; Fig. 1d). Onder de twee aanpassingen met CRI > CRV, is hun verschil significant in slechts één geval (Fig. 1d). De algemene overheersing van expressieniveau-omkering (d.w.z. 42 van 44 gevallen) in adaptatie is statistisch significant (P = 1.1 × 10-10, binomiale toets met twee staarten). Dezelfde trend is duidelijk wanneer de cutoff wordt gewijzigd in 0,05Lo (Supplementary Fig. 1a) of 0,5Lo (Supplementary Fig. 2a), wat suggereert dat de bovenstaande bevinding is robuust voor de cutoff keuze. Het is duidelijk dat de transcriptomische gegevens de hypothese niet ondersteunen dat plasticiteit in het algemeen genetische aanpassing vergemakkelijkt.
Metabole flux omkering in milieu-aanpassingen
Om de algemeenheid van de bovenstaande bevinding te beoordelen en de onderliggende oorzaak te begrijpen, hebben we de vergelijking tussen fenotypische versterking en omkering uitgebreid naar metabole fluxen (zie Inleiding). Omdat onze metabole analyse niet bedoeld is om de bovengenoemde experimentele evolutie of expressieveranderingen te modelleren, zijn de gebruikte parameters niet gerelateerd aan de experimentele evolutie. Concreet hebben we plastic en genetische fluxveranderingen tijdens omgevingsadaptaties computationeel voorspeld met behulp van iAF1260, het gereconstrueerde E. coli metabole netwerk23. We gebruikten flux balance analysis (FBA) om de geoptimaliseerde fluxen te voorspellen van volledig aangepaste organismen in respectievelijk de oorspronkelijke (stadium o) en de nieuwe (stadium a) omgeving, onder de aanname dat de biomassaproductiesnelheid, een proxy voor fitness, door natuurlijke selectie wordt gemaximaliseerd20. FBA-voorspellingen komen redelijk overeen met experimentele metingen voor organismen die aan hun omgeving zijn aangepast24,25,26,27,28,29 en worden vaak gebruikt bij de studie van genotype-milieu-fenotype-relaties22,27,29,30,31,32,33,34,35,36,37. Bij het voorspellen van plastic fluxveranderingen bij milieuverschuivingen (stadium p), gebruikten we minimalisatie van metabole aanpassing (MOMA) in plaats van FBA, omdat MOMA de onmiddellijke fluxrespons op verstoringen beter weergeeft21 (zie Methoden). We behandelden de flux van elke reactie in het metabole netwerk als een eigenschap, en modelleerden milieuverschuivingen door de koolstofbron te veranderen die beschikbaar is voor het netwerk. Er zijn 258 verschillende uitwisselingsreacties in iAF1260, die elk een andere koolstofbron transporteren. We onderzochten daarom 258 verschillende omgevingen met één koolstofbron.
We begonnen de analyse met glucose als koolstofbron in de oorspronkelijke omgeving, omdat deze omgeving de benchmark was bij de bouw van iAF126023. Vervolgens bekeken we de aanpassingen van E. coli aan 257 nieuwe omgevingen, elk met een andere enkelkoolstofbron. We vonden dat deze nieuwe omgevingen op natuurlijke wijze in twee groepen verdeeld zijn in de door MOMA voorspelde biomassaproductiesnelheid, een proxy voor de fitness in stadium p (fp) (supplementaire Fig. 3). Eén groep vertoont fp < 10-4, wat suggereert dat het onwaarschijnlijk is dat E. coli zich in deze nieuwe milieus kan handhaven. We richtten ons daarom op de resterende 50 nieuwe omgevingen met fp > 10-4, waaraan E. coli zich vermoedelijk kan aanpassen (supplementaire tabel 1).
Definiëren van fluxversterking en -omkering en het gebruik van de cutoff van 0,2Lo zoals in de transcriptoomanalyse, vonden we CRV significant groter dan CRI (nominaal P < 10-10, binomiale toets met twee staarten) in elke aanpassing. De toevallige kans dat alle 50 adaptaties CRV > CRI vertonen is 1.8 × 10-15 (tweestaart binomiale test; Fig. 2a), wat een algemene predominantie van flux reversie suggereert. De gemiddelde en mediane CRV zijn respectievelijk 30,2% en 30,5%, terwijl die voor CRI respectievelijk slechts 1,0% en 0,8% zijn. De bovenstaande trend houdt stand wanneer we de cutoff veranderen in 0.05Lo (supplementaire Fig. 1b) of 0.5Lo (supplementaire Fig. 2b). Omdat een FBA of MOMA probleem meerdere oplossingen kan hebben, kan de volgorde van de reacties in de stoichiometrische matrix invloed hebben op de specifieke oplossing die de oplosser geeft. Niettemin, wanneer we de reactievolgorde in iAF1260 willekeurig herschikten, bleef het algemene patroon van CRV > CRI onveranderd (supplementaire Fig. 4a). Omdat kwadratische programmering – vereist door MOMA – moeilijker op te lossen is dan lineaire programmering gebruikt in FBA, zou CRV overschat kunnen zijn in vergelijking met CRI. Om dit potentiële probleem te verhelpen, hebben we een op kwadratisch programmeren gebaseerde MOMA ontworpen, “MOMA-b” genaamd, en deze gebruikt in plaats van FBA om de fluxen in stadium a te voorspellen (zie Methoden), maar we ontdekten dat CRV nog steeds hoger is dan CRI (Supplementary Fig. 4b). Deze trend is dus geen technisch artefact van het verschil in oplosser tussen MOMA en FBA.
Fluxomkeer herstelt de oorspronkelijke fluxen grotendeels
Rominantie van fluxomkeer ongeacht het oorspronkelijke milieu
Om de algemeenheid van onze bevinding van de dominantie van fluxomkeer te onderzoeken, hebben we ook aanpassingen met een niet-glucose oorspronkelijk milieu onderzocht. Voor veel oorspronkelijke omgevingen zijn echter slechts enkele nieuwe omgevingen aanpasbaar door het metabole netwerk van E. coli. We hebben ons dus gericht op 41 oorspronkelijke omgevingen (inclusief de eerder gebruikte glucose-omgeving) die elk meer dan 20 aanpasbare (d.w.z. fp > 10-4) nieuwe omgevingen hebben (supplementaire tabel 2). Voor elk van deze oorspronkelijke omgevingen, berekenden we de CRI / CRV verhouding voor elke aanpasbaar nieuwe omgeving, en vond het meestal lager zijn dan 0,1 (Fig. 2d). Vervolgens berekenden we de mediaan CRI/CRV over alle aanpasbare nieuwe omgevingen van elke oorspronkelijke omgeving. Over de 41 originele omgevingen, is de grootste mediaan CRI/CRV 0.11 en de mediaan van de mediaan CRI/CRV is slechts 0.02. Vandaar dat, ongeacht de oorspronkelijke omgeving, flux reversion veel vaker voorkomt dan versterking tijdens genetische aanpassingen aan nieuwe omgevingen.
Waarom fenotypische reversion vaker voorkomt dan versterking
Onze bevinding dat fenotypische versterking niet alleen niet meer, maar eigenlijk veel minder vaak voorkomt dan reversion is onverwacht en vraagt dus om een verklaring. De waarneming van deze trend in zowel transcriptomische als fluxomische analyses suggereert een algemeen onderliggend mechanisme, dat wij voorstellen als het optreden van PC > TC. Geometrisch is het duidelijk dat wanneer PC > TC, de GC de PC moet omkeren (de linker en middelste diagrammen in de bovenste rij in Fig. 3a). Wanneer PC < TC daarentegen, zijn omkering en versterking even waarschijnlijk als er geen andere bias bestaat (de linker en middelste diagrammen in de onderste rij in Fig. 3a). Stel de waarschijnlijkheid van PC > TC is q (> 0). CRI/CRV is naar verwachting / = (1 – q)/(1 + q) < 1. Met andere woorden, zolang PC > TC voor een paar eigenschappen, zal terugkeer naar verwachting frequenter voorkomen dan versterking (onder geen andere bias).
Om empirisch bewijs voor de bovenstaande verklaring te vinden, hebben we voor elk van de 44 gevallen van experimentele evolutie de fractie berekend van de genen waarvan de expressieveranderingen voldoen aan PC > TC (Fig. 3b). De gemiddelde en mediane fracties zijn respectievelijk 0,51 en 0,48. Bovendien, nadat we alle genen waarvoor PC > TC hebben verwijderd, is er niet langer een overmaat aan reversie (supplementaire Fig. 5a), wat de toereikendheid van onze verklaring aangeeft. Op dezelfde manier berekenden we de fractie van metabolische reacties met PC > TC in de aanpassing van het E. coli metabolisch netwerk van de glucose omgeving naar elk van de 50 nieuwe omgevingen (Fig. 3c). De gemiddelde en mediane fracties zijn respectievelijk 0,85 en 0,93. Ook na het verwijderen van reacties met PC > TC, is er geen algemene trend van meer omkering dan versterking over de 50 aanpassingen (supplementaire Fig. 5b). Deze transcriptoom- en fluxoomresultaten ondersteunen dat de overmaat aan reversie ten opzichte van versterking verklaarbaar is door het voorkomen van PC > TC voor niet te verwaarlozen fracties van eigenschappen.
Waarom is PC voor veel eigenschappen groter dan TC? Een waarschijnlijke reden is dat PC’s organismen in staat stellen te overleven bij een plotselinge verandering van omgeving, maar dat de fitness veel lager is dan die in de oorspronkelijke omgeving en ook die na de aanpassing aan de nieuwe omgeving. De algemene fysiologische toestand van de organismen kan dus vergelijkbaar zijn tussen de aangepaste stadia in het oorspronkelijke en het nieuwe milieu, maar is veel verschillend in het plastic stadium met lage fitheid onmiddellijk na de milieuverschuiving. Dit kan verklaren waarom PC groter is dan TC voor veel eigenschappen, ongeacht of de eigenschappen oorzaken of gevolgen zijn van de fitness en fysiologie van het organisme.
We vonden sterk bewijs voor het bovenstaande model door metabole netwerkanalyse. Ten eerste, met behulp van de voorspelde biomassaproductiesnelheid als een proxy voor fitness, vergeleken we de E. coli fitness in het plastische stadium (fp) en die na aanpassing aan een nieuwe omgeving (fa), ten opzichte van die in de oorspronkelijke glucose-omgeving, voor elk van de aanpassingen aan de 50 nieuwe omgevingen. In alle gevallen, fp < 1 (Fig. 3d), bevestigend dat milieuverschuivingen fitness dalingen veroorzaken vóór genetische aanpassing. We vonden dat fa typisch dicht bij 1 ligt, hoewel het in een paar nieuwe milieus veel >1 is (Fig. 3d). In een log10 schaal, is fp meer verschillend van 1 dan fa is in 43 van de 50 aanpassingen (P = 1.0 × 10-7; eenstaartige binomiale test). Ten tweede veronderstelt ons model een verband tussen fluxveranderingen en fitnessveranderingen22. Over de 50 adaptaties van de glucose-omgeving is er een sterke negatieve correlatie tussen fp en gemiddelde PC (Spearman’s ρ = -0.98, P < 10-300; Fig. 3e). Een tegengestelde correlatie bestaat tussen fa en gemiddelde TC (ρ = 0,57, P = 1,1 × 10-5; Fig. 3f). Samen tonen onze analyses aan dat de voornaamste reden voor een hogere frequentie van fenotypische omkeer dan versterking tijdens adaptatie is dat in termen van fitness en bijbehorende fenotypen, organismen in stadium p meer verschillen dan die in stadium a, in vergelijking met die in stadium o.
Phenotypische omkeer in willekeurige metabolische netwerken
De PCs en GCs in genexpressieniveau en metabolische flux tijdens adaptaties hangen af van, respectievelijk, het regulatorische netwerk en het metabolische netwerk van de betreffende soort. Omdat deze netwerken het resultaat zijn van miljarden jaren evolutie, kan men zich afvragen of het overwicht van fenotypische omkeer toe te schrijven is aan de evolutionaire geschiedenis van de bestudeerde soort, in het bijzonder de omgevingen waarin de soort en zijn voorouders in het verleden werden geselecteerd, of een intrinsieke eigenschap is van om het even welk functioneel systeem. Om deze vraag te beantwoorden, pasten we dezelfde analyse toe op 500 functionele willekeurige metabole netwerken die eerder gegenereerd waren22. Deze netwerken werden geconstrueerd uit iAF1260 door de reacties te verwisselen met willekeurig gekozen reacties uit het universum van alle metabole reacties in de Kyoto Encyclopedia of Genes and Genomes38 , zolang het netwerk een niet-nul FBA-voorspelde fitness in de glucose-omgeving heeft bij elke reactie-wisseling39.
Maar 20 nieuwe omgevingen waaraan iAF1260 zich kan aanpassen (vanuit de glucose-omgeving) zijn aanpasbaar door ten minste 20 van de 500 willekeurige netwerken. We analyseerden dus de aanpassingen van willekeurige netwerken aan elk van deze 20 nieuwe omgevingen, met de glucose-omgeving als de oorspronkelijke omgeving. Voor elke nieuwe omgeving ligt de mediane CRV van alle willekeurige netwerken die zich aan deze omgeving kunnen aanpassen over het algemeen rond 0,1 (boxplots in Fig. 4a), met de mediaan van de mediane CRV op 0,11. Daarentegen is de mediane CRI van willekeurige netwerken voor een nieuwe omgeving over het algemeen lager dan 0,01 (boxplots in Fig. 4b), met een mediaan van de mediane CRI van 0,0033. De mediaan CRI/CRV-verhouding over willekeurige netwerken voor een nieuwe omgeving is over het algemeen lager dan 0,05 (kaderplot in Fig. 4c), waarbij de mediaan van de mediaan CRI/CRV 0,0033 is. Het is duidelijk dat de overheersing van flux reversion ook duidelijk is in functionele willekeurige netwerken, wat suggereert dat deze eigenschap intrinsiek is aan elk functioneel metabolisch netwerk, eerder dan een product van bepaalde evolutionaire geschiedenissen. De mechanistische verklaring voor deze eigenschap in actuele organismen (Fig. 3) geldt inderdaad ook in de hier onderzochte willekeurige metabole netwerken. Meer bepaald is de fractie van reacties met PC > TC aanzienlijk (Fig. 4d) en fp is meestal lager dan 1 (Fig. 4e). Bovendien verschilt fp in het algemeen meer van 1 dan fa in een log10-schaal, omdat |log10fp|-|log10fa| grotendeels positief is (fig. 4f).
Intrigerend is echter dat voor 19 van de 20 nieuwe omgevingen de CRV in het E. coli-metabole netwerk hoger ligt dan de mediaan CRV in de willekeurige netwerken (Fig. 4a). Een gelijkaardige maar minder duidelijke trend geldt voor CRI (Fig. 4b). Voor 16 van de 20 nieuwe omgevingen is CRI/CRV van E. coli kleiner dan de mediaan CRI/CRV van de willekeurige netwerken (P = 0.012, tweestaart binomiale test; Fig. 4c). Hoewel dus zowel het metabolische netwerk van E. coli als willekeurige netwerken een overwicht vertonen van flux reversion, is dit fenomeen meer uitgesproken in E. coli. Mechanistisch gezien kan dit verschil althans kwalitatief verklaard worden door ons model in de vorige sectie. Meer bepaald, voor 15 van de 20 nieuwe omgevingen, overtreft de fractie van E. coli reacties met PC > TC de overeenkomstige mediaanfractie in willekeurige netwerken (P = 0,021, eenstaart binomiale test; Fig. 4d). Voor alle 20 nieuwe milieus is de fp van E. coli lager dan de mediaan fp van willekeurige netwerken (P = 9.5 × 10-7, binomiale eenstaarttoets; Fig. 4e). Voor 19 van de 20 nieuwe omgevingen is |log10 fp| – |log10 fa| voor E. coli groter dan de overeenkomstige mediaanwaarde voor de willekeurige netwerken (P = 2.0 × 10-5, eenstaart binomiale test; Fig. 4f). Maar waarom is fp van E. coli lager dan dat van willekeurige netwerken? Een mogelijke verklaring is dat de samenstelling en structuur van het metabolische netwerk van E. coli evolutionair geoptimaliseerd zijn voor groei in het glucose milieu en/of verwante milieus, terwijl hetzelfde niet geldt voor de willekeurige netwerken, die alleen levensvatbaar hoefden te zijn in het glucose milieu. Bijgevolg, wanneer glucose vervangen wordt door een nieuwe koolstofbron in een nieuwe omgeving, daalt de fitness van E. coli substantieel, maar die van willekeurige netwerken daalt slechts licht. Hoewel de absolute fitness in de plastische fase misschien hoger is voor E. coli dan voor de willekeurige netwerken, wordt verwacht dat de relatieve fitness, die fp is, lager is voor E. coli dan voor de willekeurige netwerken. Dus, de hogere prevalentie van flux reversion ten opzichte van versterking in E. coli dan willekeurige netwerken is waarschijnlijk een bijproduct van sterkere selectie van E. coli in vergelijking met willekeurige netwerken in de oorspronkelijke omgeving gebruikt in onze adaptatie-analyse.
Reversion is minstens zo gebruikelijk als versterking, zelfs voor kenmerken met merkbare TC
In de voorgaande analyses van transcriptomen (Fig. 1d) en fluxomen (Fig. 2a), beschouwden we alle kenmerken die merkbare PCs en GCs vertoonden. In vergelijkende en evolutionaire studies zijn fenotypes in stadium p echter meestal niet toegankelijk. Daarom richten vergelijkende en evolutionaire biologen zich meestal op kenmerken waarvan de fenotypische waarden verschillen tussen de stadia o en a, ondanks het feit dat de andere kenmerken ook adaptieve veranderingen kunnen hebben ondergaan (van de waarden in stadium p naar die in stadium a). Om te bestuderen of onze voorgaande bevindingen van toepassing zijn op de kenmerken die het onderwerp zijn van de meeste vergelijkende en evolutionaire biologen, richten we ons op een subset van de hierboven geanalyseerde kenmerken die voldoen aan de voorwaarde van TC > 0.2Lo. Van de 44 gevallen van experimentele evolutie vertoonden 33 CRV > CRI (P = 0.0013, binomiale toets met twee staarten), in 30 daarvan overtreft CRV significant CRI (nominaal P < 0.05; binomiale toets met twee staarten; Fig. 5a). Van de 50 omgevingsadaptaties van het E. coli metabolisch netwerk afkomstig van de glucose omgeving, hadden drie gevallen een gelijk aantal flux reversion en reinforcement. Van de overige 47 gevallen vertoonden er 22 meer reversie dan versterking, terwijl 25 het tegenovergestelde vertoonden (P = 0,77, binomiale toets met twee staarten; Fig. 5b). Wanneer CRI significant verschillend is van CRV, vertoonden 15 gevallen CRV < CRI, terwijl 11 het tegenovergestelde vertoonden (P = 0,70, binomiale toets met twee staarten; Fig. 5b). Dus, zelfs onder kenmerken met TC > 0.2Lo, is er geen bewijs voor significant meer versterking dan omkering. Merk op dat in de bovenstaande metabole analyse gemiddeld 139 reacties voldeden aan TC > 0.2Lo per adaptatie. Omdat alle fluxveranderingen die worden waargenomen bij de maximalisatie van fitness vereist zijn en daarom per definitie gunstig zijn, omvat zelfs de aanpassing aan een eenvoudige verandering van koolstofbron blijkbaar veel meer dan een paar reacties.