- Prevalența reversiei expresiei în evoluția experimentală
- Reversia fluxurilor metabolice în adaptările la mediu
- Reversia fluxurilor restabilește în mare măsură fluxurile originale
- Predominanța reversiei fluxurilor indiferent de mediul original
- De ce reversia fenotipică este mai frecventă decât întărirea
- Reversia fenotipică în rețele metabolice aleatorii
- Reversia este cel puțin la fel de frecventă ca și întărirea chiar și pentru trăsăturile cu TC apreciabile
Prevalența reversiei expresiei în evoluția experimentală
Am identificat cinci studii care au efectuat șase experimente de adaptare diferite și au colectat date transcriptomice care se potrivesc analizei noastre. Aceste șase experimente au inclus 10 replici de E. coli care se adaptează la un mediu de temperatură ridicată17, 6 replici ale unei alte tulpini de E. coli care se adaptează la un mediu de temperatură ridicată18, 7 replici de E. coli care se adaptează la un mediu de glicerină16, 7 replici de E. coli care se adaptează la un mediu de glicerol16, 7 replici de E. coli care se adaptează la un mediu de lactat16, câte o replică din 12 tulpini diferite de drojdie (Saccharomyces cerevisiae) care se adaptează la un mediu de xiluloză19 și 2 replici de guppy (Poecilia reticulata) care se adaptează la un mediu cu pradă redusă15. În total, am analizat 44 de cazuri de adaptare.
În fiecare caz, datele transcriptomice au fost colectate pentru organismele din mediul inițial (o pentru stadiul inițial), respectiv la scurt timp după expunerea lor la noul mediu (p pentru stadiul plastic) și la încheierea evoluției experimentale în noul mediu (a pentru stadiul adaptat; Fig. 1a). Rețineți că intervalul de timp dintre o și p este atât de scurt încât nu este de așteptat ca nicio alelă nou apărută să fi atins o frecvență apreciabilă în stadiul p pentru a avea un impact asupra fenotipului mediu al populației. Nivelul de expresie al fiecărei gene este tratat ca o trăsătură. Fie ca nivelurile de expresie ale unei gene în stadiile o, p și a să fie Lo, Lp și, respectiv, La. În fiecare experiment, am identificat mai întâi genele cu PC-uri apreciabile în ceea ce privește nivelul de expresie, cerând ca PC = |Lp-Lo| să fie mai mare decât o limită prestabilită. De asemenea, am identificat genele cu GC apreciabile în nivelul de expresie, cerând ca GC = |La-Lp| să fie mai mare decât aceeași limită prestabilită. Pentru acele gene care prezintă atât PC-uri apreciabile, cât și GC-uri apreciabile, ne întrebăm dacă cele două schimbări sunt în aceeași direcție (adică întărire) sau în direcții opuse (adică inversiune; Fig. 1b, c). Am folosit 20 % din nivelul inițial de expresie a genelor (adică 0,2Lo) ca limită în analiza de mai sus. Fracțiunea de gene care prezintă o întărire a nivelului de expresie (CRI) este mai mică decât fracțiunea de gene care prezintă o inversiune (CRV) în 42 din cele 44 de adaptări, iar diferența dintre CRI și CRV este semnificativă în 40 din aceste 42 de cazuri (P nominal < 0,05; test binomial cu două cozi; Fig. 1d). Dintre cele două adaptări cu CRI > CRV, diferența lor este semnificativă doar într-un singur caz (Fig. 1d). Preponderența generală a reversiei nivelului de expresie (și anume, 42 din 44 de cazuri) în adaptare este semnificativă din punct de vedere statistic (P = 1,1 × 10-10, test binomial cu două cozi). Aceeași tendință este evidentă atunci când pragul este modificat la 0,05Lo (Fig. Suplimentară 1a) sau 0,5Lo (Fig. Suplimentară 2a), sugerând că rezultatul de mai sus este robust în funcție de alegerea pragului. În mod clar, datele transcriptomice nu susțin ipoteza că plasticitatea facilitează, în general, adaptarea genetică.
Reversia fluxurilor metabolice în adaptările la mediu
Pentru a evalua generalitatea constatării de mai sus și pentru a înțelege cauza care stă la baza acesteia, am extins comparația dintre întărirea fenotipică și reversia fluxurilor metabolice (a se vedea Introducere). Deoarece analiza noastră metabolică nu este menită să modeleze evoluția experimentală sau modificările de expresie de mai sus, parametrii utilizați nu au legătură cu evoluția experimentală. În mod specific, am prezis prin calcul modificările fluxurilor plastice și genetice în timpul adaptărilor la mediu folosind iAF1260, rețeaua metabolică reconstruită a E. coli23. Am utilizat analiza echilibrului fluxurilor (FBA) pentru a prezice fluxurile optimizate ale organismelor complet adaptate în mediul original (stadiul o) și, respectiv, în cel nou (stadiul a), presupunând că rata de producere a biomasei, un indicator de fitness, este maximizată prin selecție naturală20. Predicțiile FBA corespund rezonabil de bine măsurilor experimentale pentru organismele adaptate la mediile lor24,25,26,26,27,28,29 și sunt utilizate în mod obișnuit în studiul relațiilor genotip-mediu-fenotip22,27,29,30,31,32,33,34,35,36,37. Atunci când am prezis modificările fluxului plastic în urma schimbărilor de mediu (etapa p), am utilizat minimizarea ajustării metabolice (MOMA) în loc de FBA, deoarece MOMA recapitulează mai bine răspunsul imediat al fluxului la perturbații21 (a se vedea Metode). Am tratat fluxul fiecărei reacții din rețeaua metabolică ca pe o trăsătură și am modelat schimbările de mediu prin modificarea sursei de carbon disponibile pentru rețea. Există 258 de reacții de schimb distincte în iAF1260, fiecare transportând o sursă de carbon diferită. Prin urmare, am examinat 258 de medii diferite cu o singură sursă de carbon.
Am început analiza prin utilizarea glucozei ca sursă de carbon în mediul original, deoarece acest mediu a fost punctul de referință în construcția iAF126023. Am luat apoi în considerare adaptările lui E. coli la 257 medii noi, fiecare cu o sursă diferită de carbon unic. Am constatat că aceste medii noi sunt separate în mod natural în două grupe în ceea ce privește rata de producție de biomasă preconizată de MOMA, un indicator pentru fitness în stadiul p (fp) (Fig. suplimentară 3). Un grup prezintă fp < 10-4, sugerând că este puțin probabil ca E. coli să se mențină în aceste medii noi. Prin urmare, ne-am concentrat asupra celorlalte 50 de medii noi cu fp > 10-4, la care se presupune că E. coli se poate adapta (tabelul suplimentar 1).
Definind întărirea fluxului și reversia și utilizând pragul de tăiere de 0,2Lo ca în analiza transcriptomului, am constatat că CRV este semnificativ mai mare decât CRI (P nominal < 10-10, test binomial cu două cozi) în fiecare adaptare. Probabilitatea întâmplătoare ca toate cele 50 de adaptări să prezinte CRV > CRI este de 1,8 × 10-15 (test binomial cu două cozi; Fig. 2a), sugerând o predominanță generală a reversiei fluxului. Media și mediana CRV sunt de 30,2 % și, respectiv, 30,5 %, în timp ce cele pentru CRI sunt de numai 1,0 % și, respectiv, 0,8 %. Tendința de mai sus se menține atunci când modificăm pragul de tăiere la 0,05Lo (Fig. Suplimentară 1b) sau 0,5Lo (Fig. Suplimentară 2b). Deoarece o problemă FBA sau MOMA poate avea soluții multiple, ordinea reacțiilor din matricea stoichiometrică ar putea afecta soluția specifică furnizată de rezolvator. Cu toate acestea, atunci când am amestecat în mod aleatoriu ordinea reacțiilor în iAF1260, modelul general al CRV > CRI este neschimbat (Fig. suplimentară 4a). Deoarece programarea pătratică – cerută de MOMA – este mai greu de rezolvat decât programarea liniară utilizată în FBA, CRV ar fi putut fi supraestimată în comparație cu CRI. Pentru a corecta această potențială problemă, am conceput un MOMA bazat pe programare pătratică numit „MOMA-b” și l-am utilizat în locul FBA pentru a prezice fluxurile în etapa a (a se vedea Metode), dar am constatat că CRV depășește în continuare CRI (Fig. Suplimentară 4b). Astfel, această tendință nu este un artefact tehnic al diferenței de rezolvare dintre MOMA și FBA.
Reversia fluxurilor restabilește în mare măsură fluxurile originale
Predominanța reversiei fluxurilor indiferent de mediul original
Pentru a investiga generalitatea constatării noastre privind predominanța reversiei fluxurilor, am examinat, de asemenea, adaptările cu un mediu original fără glucoză. Cu toate acestea, pentru multe medii originale, doar câteva medii noi sunt adaptabile de către rețeaua metabolică E. coli. Astfel, ne-am concentrat asupra a 41 de medii originale (inclusiv mediul de glucoză utilizat anterior) care au fiecare mai mult de 20 de medii noi adaptabile (adică, fp > 10-4) (tabelul suplimentar 2). Pentru fiecare dintre aceste medii originale, am calculat raportul CRI/CRV pentru fiecare mediu nou adaptabil și am constatat că acesta este, de obicei, mai mic de 0,1 (Fig. 2d). Am calculat apoi mediana CRI/CRV pentru toate mediile noi adaptabile din fiecare mediu original. În cele 41 de medii originale, cel mai mare CRI/CRV median este de 0,11, iar mediana CRI/CRV median este de numai 0,02. Prin urmare, indiferent de mediul original, reversia fluxului este mult mai frecventă decât întărirea în timpul adaptărilor genetice la medii noi.
De ce reversia fenotipică este mai frecventă decât întărirea
Constatarea noastră că întărirea fenotipică nu numai că nu este mai mult, dar este de fapt mult mai puțin frecventă decât reversia este neașteptată și, prin urmare, necesită o explicație. Observarea acestei tendințe atât în analizele transcriptomice, cât și în cele fluxomice sugerează un mecanism general de bază, pe care noi îl propunem ca fiind apariția PC > TC. Din punct de vedere geometric, este evident că, atunci când PC > TC, GC trebuie să inverseze PC (diagramele din stânga și din mijloc din rândul de sus din Fig. 3a). În schimb, atunci când PC < TC, inversarea și întărirea sunt la fel de probabile dacă nu există nicio altă prejudecată (diagramele din stânga și din mijloc din rândul de jos din Fig. 3a). Fie ca probabilitatea ca PC > TC să fie q (> 0). Se așteaptă ca CRI/CRV să fie / = (1 – q)/(1 + q) < 1. Cu alte cuvinte, atâta timp cât PC > TC pentru câteva trăsături, se așteaptă ca reversia să fie mai frecventă decât întărirea (în cazul în care nu există nicio altă prejudecată).
Pentru a căuta dovezi empirice pentru explicația de mai sus, pentru fiecare dintre cele 44 de cazuri de evoluție experimentală, am calculat fracțiunea de gene ale căror modificări de expresie satisfac PC > TC (Fig. 3b). Fracțiile medie și mediană sunt 0,51 și, respectiv, 0,48. Mai mult, după ce am eliminat toate genele pentru care PC > TC, nu mai există un exces de reversie (Fig. suplimentară 5a), ceea ce indică suficiența explicației noastre. În mod similar, am calculat fracțiunea de reacții metabolice care prezintă PC > TC în adaptarea rețelei metabolice E. coli de la mediul de glucoză la fiecare dintre cele 50 de medii noi (Fig. 3c). Fracțiile medie și mediană sunt de 0,85 și, respectiv, 0,93. În mod similar, după eliminarea reacțiilor care prezintă PC > TC, nu există o tendință generală de mai multă reversie decât întărire în cele 50 de adaptări (Fig. suplimentară 5b). Aceste rezultate ale transcriptomului și fluxomului susțin faptul că excesul de reversie în raport cu întărirea poate fi explicat prin apariția PC > TC pentru fracțiuni non-neglijabile de trăsături.
De ce PC depășește TC pentru multe trăsături? Un motiv probabil este că PC permite organismelor să supraviețuiască în urma unei schimbări bruște de mediu, dar fitness-ul este mult redus în comparație cu cel din mediul inițial, precum și cu cel de după adaptarea la noul mediu. Astfel, starea fiziologică generală a organismelor poate fi destul de asemănătoare între stadiile adaptate în mediul original și cel nou, dar este mult diferită în stadiul plastic cu fitness scăzut imediat după schimbarea mediului. Acest lucru poate explica de ce PC depășește TC pentru multe trăsături, indiferent dacă valorile trăsăturilor sunt cauze sau consecințe ale fitness-ului și fiziologiei organismului.
Am găsit dovezi puternice pentru modelul de mai sus prin analiza rețelei metabolice. În primul rând, folosind rata de producere a biomasei prezise ca indicator al fitness-ului, am comparat fitness-ul E. coli în stadiul plastic (fp) și cel după adaptarea la un nou mediu (fa), în raport cu cel din mediul inițial de glucoză, pentru fiecare dintre adaptările la cele 50 de medii noi. În toate cazurile, fp < 1 (Fig. 3d), confirmând faptul că schimbările de mediu provoacă scăderi ale fitness-ului înainte de adaptarea genetică. Am constatat că fa este de obicei aproape de 1, deși în câteva medii noi este mult >1 (Fig. 3d). Pe o scară log10, fp este mai diferită de 1 decât fa în 43 dintre cele 50 de adaptări (P = 1,0 × 10-7; test binomial unilateral). În al doilea rând, modelul nostru presupune o asociere între modificările de flux și modificările de fitness22. În cele 50 de adaptări din mediul de glucoză, există o corelație negativă puternică între fp și PC mediu (Spearman’s ρ = -0.98, P < 10-300; Fig. 3e). Există o corelație opusă între fa și TC mediu (ρ = 0,57, P = 1,1 × 10-5; Fig. 3f). Împreună, analizele noastre demonstrează că motivul principal pentru o frecvență mai mare a reversiei fenotipice decât a întăririi în timpul adaptării este că, în ceea ce privește fitness-ul și fenotipurile asociate, organismele aflate în stadiul p sunt mai diferite decât cele aflate în stadiul a, în comparație cu cele aflate în stadiul o.
Reversia fenotipică în rețele metabolice aleatorii
Pc și GC în nivelul de expresie a genelor și fluxul metabolic în timpul adaptărilor depind, respectiv, de rețeaua de reglementare și de rețeaua metabolică a speciei în cauză. Deoarece aceste rețele sunt rezultatul a miliarde de ani de evoluție, ne întrebăm dacă predominanța reversiei fenotipice se poate atribui istoriei evolutive a speciei studiate, în special mediilor în care specia și strămoșii săi au fost selectați în trecut, sau dacă este o proprietate intrinsecă a oricărui sistem funcțional. Pentru a răspunde la această întrebare, am aplicat aceeași analiză la 500 de rețele metabolice funcționale aleatorii generate anterior22. Aceste rețele au fost construite pornind de la iAF1260 prin înlocuirea reacțiilor sale cu reacții alese la întâmplare din universul tuturor reacțiilor metabolice din Kyoto Encyclopedia of Genes and Genomes38 , atâta timp cât rețeaua are o fitness neprevăzută de FBA diferită de zero în mediul de glucoză la fiecare înlocuire de reacții39.
Doar 20 de medii noi la care se poate adapta iAF1260 (din mediul de glucoză) sunt adaptabile de cel puțin 20 dintre cele 500 de rețele aleatoare. Astfel, am analizat adaptările rețelelor aleatoare la fiecare dintre aceste 20 de medii noi, mediul de glucoză fiind mediul inițial. Pentru fiecare mediu nou, mediana CRV a tuturor rețelelor aleatoare care se pot adapta la acest mediu este, în general, în jurul valorii de 0,1 (diagramele de cutie din Fig. 4a), cu mediana medianei CRV fiind de 0,11. În schimb, CRI mediană a tuturor rețelelor aleatoare pentru un nou mediu este, în general, sub 0,01 (diagramele cu casete din Fig. 4b), mediana CRI mediană fiind de 0,0033. Raportul CRI/CRV median între rețelele aleatoare pentru un mediu nou este, în general, sub 0,05 (diagrama de casete din Fig. 4c), mediana CRI/CRV median fiind de 0,0033. În mod clar, predominanța reversiei fluxului este evidentă și în rețelele aleatoare funcționale, sugerând că această proprietate este intrinsecă oricărei rețele metabolice funcționale, mai degrabă decât un produs al unor istorii evolutive particulare. Într-adevăr, explicația mecanicistă pentru această proprietate în organismele actuale (Fig. 3) este valabilă în cazul rețelelor metabolice aleatorii examinate aici. Mai exact, fracțiunea de reacții care prezintă PC > TC este substanțială (Fig. 4d) și fp este în cea mai mare parte mai mică de 1 (Fig. 4e). Mai mult, fp este, în general, mai diferită de 1 decât este fa pe o scară log10, deoarece |log10fp|-|log10fa|este în mare parte pozitivă (Fig. 4f).
În mod curios, totuși, pentru 19 dintre cele 20 de medii noi, CRV din rețeaua metabolică E. coli depășește CRV mediană din rețelele aleatoare (Fig. 4a). O tendință similară, dar mai puțin evidentă, este valabilă pentru CRI (Fig. 4b). Pentru 16 din cele 20 de medii noi, CRI/CRV din E. coli este mai mică decât CRI/CRV mediană a rețelelor aleatoare (P = 0,012, test binomial cu două cozi; Fig. 4c). Prin urmare, deși atât rețeaua metabolică E. coli, cât și rețelele aleatorii prezintă o predominanță a reversiei fluxului, acest fenomen este mai pronunțat în cazul E. coli. Din punct de vedere mecanic, această disparitate poate fi explicată cel puțin calitativ prin modelul nostru din secțiunea anterioară. Mai exact, pentru 15 dintre cele 20 de medii noi, fracțiunea de reacții E. coli cu PC > TC depășește fracțiunea mediană corespunzătoare în rețelele aleatoare (P = 0,021, test binomial unilateral; Fig. 4d). Pentru toate cele 20 de medii noi, fp de E. coli este mai mică decât fp mediană a rețelelor aleatoare (P = 9,5 × 10-7, test binomial unilateral; Fig. 4e). Pentru 19 din cele 20 de medii noi, |log10 fp| – |log10 fa| pentru E. coli este mai mare decât valoarea mediană corespunzătoare pentru rețelele aleatoare (P = 2,0 × 10-5, test binomial cu o coadă; Fig. 4f). Dar, de ce este fp pentru E. coli mai mică decât cea a rețelelor aleatoare? O explicație potențială este aceea că compoziția și structura rețelei metabolice a E. coli au fost optimizate din punct de vedere evolutiv pentru creșterea în mediul glucozei și/sau în medii conexe, în timp ce nu același lucru este valabil pentru rețelele aleatorii, cărora li s-a cerut doar să fie viabile în mediul glucozei. Prin urmare, atunci când glucoza este înlocuită cu o nouă sursă de carbon într-un mediu nou, fitness-ul lui E. coli scade substanțial, dar cel al rețelelor aleatorii poate scădea doar ușor. Deși este foarte posibil ca fitness-ul absolut în stadiul plastic să fie mai mare pentru E. coli decât pentru rețelele aleatoare, se așteaptă ca fitness-ul relativ, care este fp, să fie mai mic pentru E. coli decât pentru rețelele aleatoare. Astfel, prevalența mai mare a reversiei fluxului în raport cu întărirea la E. coli decât la rețelele aleatoare este probabil un produs secundar al unei selecții mai puternice a E. coli în comparație cu rețelele aleatoare în mediul original utilizat în analiza noastră de adaptare.
Reversia este cel puțin la fel de frecventă ca și întărirea chiar și pentru trăsăturile cu TC apreciabile
În analizele anterioare ale transcriptomilor (Fig. 1d) și fluxomilor (Fig. 2a), am luat în considerare toate trăsăturile care prezintă PC și GC apreciabile. Cu toate acestea, în studiile comparative și evolutive, fenotipurile din stadiul p sunt, de obicei, inaccesibile. Prin urmare, biologii comparativi și evoluționiști se concentrează, de obicei, pe trăsăturile ale căror valori fenotipice diferă între stadiile o și a, în ciuda faptului că și celelalte trăsături ar fi putut suferi modificări adaptative (de la valorile din stadiul p la cele din stadiul a). Pentru a studia dacă constatările noastre de mai sus se aplică trăsăturilor care fac obiectul de studiu al majorității biologilor comparativi și evolutivi, ne concentrăm asupra unui subset de trăsături analizate mai sus care îndeplinesc condiția TC > 0,2Lo. Din cele 44 de cazuri de evoluție experimentală, 33 au prezentat CRV > CRI (P = 0,0013, test binomial cu două cozi), în 30 dintre care CRV depășește semnificativ CRI (P nominal < 0,05; test binomial cu două cozi; Fig. 5a). Dintre cele 50 de adaptări de mediu ale rețelei metabolice de E. coli provenite din mediul glucozei, trei cazuri au avut un număr egal de inversare și întărire a fluxului. Dintre cele 47 de cazuri rămase, 22 au prezentat mai multă inversare decât întărire, în timp ce 25 au prezentat opusul (P = 0,77, test binomial cu două cozi; Fig. 5b). Atunci când CRI este semnificativ diferită de CRV, 15 cazuri au prezentat CRV < CRI, în timp ce 11 au prezentat opusul (P = 0,70, test binomial cu două cozi; Fig. 5b). Prin urmare, chiar și în rândul trăsăturilor cu TC > 0,2Lo, nu există dovezi că există o întărire semnificativ mai mare decât reversul. De remarcat, în analiza metabolică de mai sus, în medie, 139 de reacții au satisfăcut TC > 0,2Lo pe adaptare. Deoarece toate schimbările de flux observate în maximizarea fitness-ului sunt necesare și, prin urmare, sunt prin definiție benefice, chiar și adaptarea la o simplă schimbare a sursei de carbon aparent implică mult mai mult decât câteva reacții.
.