- Powszechność odwracania ekspresji w eksperymentalnej ewolucji
- Odwrócenie strumienia metabolicznego w adaptacjach środowiskowych
- Odwrócenie strumienia w dużej mierze przywraca oryginalne strumienie
- Przewaga odwrócenia strumienia niezależnie od pierwotnego środowiska
- Dlaczego fenotypowe odwrócenie jest częstsze niż wzmocnienie
- Phenotypic reversion in random metabolic networks
- Reversion jest co najmniej tak powszechne jak wzmocnienie nawet dla cech z odczuwalnym TC
Powszechność odwracania ekspresji w eksperymentalnej ewolucji
Zidentyfikowaliśmy pięć badań, które przeprowadziły sześć różnych eksperymentów adaptacyjnych i zebrały dane transkryptomowe pasujące do naszej analizy. Te sześć eksperymentów obejmowało 10 powtórzeń E. coli przystosowującej się do środowiska o wysokiej temperaturze17, 6 powtórzeń innego szczepu E. coli przystosowującego się do środowiska o wysokiej temperaturze18, 7 powtórzeń E. coli przystosowującej się do pożywki glicerolowej16, 7 powtórzeń E. coli przystosowujących się do środowiska mleczanowego16, po 1 replikacji 12 różnych szczepów drożdży (Saccharomyces cerevisiae) przystosowujących się do środowiska ksylulozowego19, oraz 2 replikacje gupików (Poecilia reticulata) przystosowujących się do środowiska o niskim poziomie drapieżnictwa15. W sumie przeanalizowaliśmy 44 przypadki adaptacji.
W każdym przypadku dane transkryptomowe były zbierane odpowiednio dla organizmów w środowisku pierwotnym (o dla stadium pierwotnego), krótko po ich ekspozycji na nowe środowisko (p dla stadium plastycznego) i na zakończenie ewolucji eksperymentalnej w nowym środowisku (a dla stadium zaadaptowanego; Rys. 1a). Zauważmy, że czas pomiędzy o i p jest tak krótki, że oczekuje się, iż żaden nowo powstały allel nie osiągnie znaczącej częstotliwości w stadium p, aby wpłynąć na średni fenotyp populacji. Poziom ekspresji każdego genu jest traktowany jako cecha. Niech poziomy ekspresji genu w stadiach o, p, i a będą odpowiednio Lo, Lp, i La. W każdym eksperymencie najpierw identyfikowaliśmy geny o znaczących PC w poziomie ekspresji, wymagając, aby PC = |Lp-Lo| było większe niż zadany punkt odcięcia. Zidentyfikowaliśmy również geny o znaczącym poziomie ekspresji GC, wymagając, aby GC = |La-Lp| było większe od tego samego punktu odcięcia. Dla tych genów, które wykazują zarówno znaczące PCs, jak i znaczące GCs, zapytaliśmy, czy te dwie zmiany są w tym samym kierunku (tj. wzmocnienie), czy w przeciwnych kierunkach (tj. odwrócenie; ryc. 1b, c). Jako wartość graniczną w powyższej analizie przyjęliśmy 20% pierwotnego poziomu ekspresji genów (tj. 0,2Lo). Frakcja genów wykazujących wzmocnienie poziomu ekspresji (CRI) jest mniejsza niż frakcja genów wykazujących odwrócenie (CRV) w 42 z 44 adaptacji, a różnica między CRI i CRV jest istotna w 40 z tych 42 przypadków (nominalne P < 0,05; test dwumianowy dwuwarstwowy; ryc. 1d). Wśród dwóch adaptacji z CRI > CRV, ich różnica jest istotna tylko w jednym przypadku (ryc. 1d). Ogólna przewaga odwrócenia poziomu ekspresji (tj. 42 z 44 przypadków) w adaptacji jest statystycznie istotna (P = 1,1 × 10-10, test dwumianowy z dwoma ogonami). Ta sama tendencja jest widoczna, gdy wartość odcięcia jest zmieniona na 0,05Lo (Supplementary Fig. 1a) lub 0,5Lo (Supplementary Fig. 2a), co sugeruje, że powyższe odkrycie jest odporne na wybór wartości odcięcia. Wyraźnie widać, że dane transkryptomiczne nie wspierają hipotezy, że plastyczność ogólnie ułatwia adaptację genetyczną.
Odwrócenie strumienia metabolicznego w adaptacjach środowiskowych
Aby ocenić ogólność powyższego odkrycia i zrozumieć jego przyczynę, rozszerzyliśmy porównanie między fenotypowym wzmocnieniem i odwróceniem do strumieni metabolicznych (patrz Wstęp). Ponieważ nasza analiza metaboliczna nie jest przeznaczona do modelowania powyższej eksperymentalnej ewolucji lub zmian ekspresji, użyte parametry nie są związane z eksperymentalną ewolucją. W szczególności, obliczeniowo przewidzieliśmy plastyczne i genetyczne zmiany strumienia podczas adaptacji środowiskowych używając iAF1260, zrekonstruowanej sieci metabolicznej E. coli23. Wykorzystaliśmy analizę równowagi strumieni (FBA) do przewidywania zoptymalizowanych strumieni w pełni zaadaptowanych organizmów w środowisku pierwotnym (stadium o) i nowym (stadium a), odpowiednio, przy założeniu, że tempo produkcji biomasy, przybliżone do kondycji, jest maksymalizowane przez dobór naturalny20. Przewidywania FBA dość dobrze pasują do pomiarów eksperymentalnych dla organizmów przystosowanych do swoich środowisk24,25,26,27,28,29 i są powszechnie stosowane w badaniach zależności genotyp-środowisko-fenotyp22,27,29,30,31,32,33,34,35,36,37. Przy przewidywaniu plastycznych zmian strumienia po zmianach środowiskowych (etap p), zastosowaliśmy minimalizację dostosowania metabolicznego (MOMA) zamiast FBA, ponieważ MOMA lepiej odtwarza natychmiastową odpowiedź strumienia na perturbacje21 (patrz Metody). Potraktowaliśmy strumień każdej reakcji w sieci metabolicznej jako cechę i modelowaliśmy zmiany środowiskowe poprzez zmianę źródła węgla dostępnego dla sieci. W iAF1260 występuje 258 różnych reakcji wymiany, z których każda transportuje inne źródło węgla. Zbadaliśmy zatem 258 różnych środowisk z jednym źródłem węgla.
Analizę rozpoczęliśmy od wykorzystania glukozy jako źródła węgla w środowisku pierwotnym, ponieważ to środowisko było wzorcem w konstrukcji iAF126023. Następnie rozważyliśmy adaptacje E. coli do 257 nowych środowisk, każde z innym źródłem pojedynczego węgla. Stwierdziliśmy, że te nowe środowiska są naturalnie podzielone na dwie grupy pod względem przewidywanego przez MOMA tempa produkcji biomasy, proxy dla kondycji w stadium p (fp) (Supplementary Fig. 3). Jedna grupa wykazuje fp < 10-4, co sugeruje, że jest mało prawdopodobne, aby E. coli utrzymała się w tych nowych środowiskach. Dlatego skupiliśmy się na pozostałych 50 nowych środowiskach z fp > 10-4, do których E. coli może przypuszczalnie się przystosować (Tabela uzupełniająca 1).
Definiując wzmocnienie strumienia i odwrócenie i używając odcięcia 0,2Lo, jak w analizie transkryptomu, znaleźliśmy CRV, aby być znacząco większym niż CRI (nominalne P < 10-10, test dwubiegunowy dwumianowy) w każdej adaptacji. Prawdopodobieństwo, że wszystkie 50 adaptacji wykazuje CRV > CRI wynosi 1.8 × 10-15 (test dwumianowy z dwoma ogonami; Fig. 2a), co sugeruje ogólną przewagę rewersji strumienia. Średnia i mediana CRV wynoszą odpowiednio 30,2% i 30,5%, podczas gdy mediany dla CRI wynoszą odpowiednio tylko 1,0% i 0,8%. Powyższy trend utrzymuje się, gdy zmienimy wartość odcięcia na 0.05Lo (Supplementary Fig. 1b) lub 0.5Lo (Supplementary Fig. 2b). Ponieważ problem FBA lub MOMA może mieć wiele rozwiązań, kolejność reakcji w macierzy stechiometrycznej może mieć wpływ na konkretne rozwiązanie dostarczone przez solver. Niemniej jednak, gdy losowo zmieniliśmy kolejność reakcji w iAF1260, ogólny wzór CRV > CRI pozostał niezmieniony (Supplementary Fig. 4a). Ponieważ programowanie kwadratowe – wymagane przez MOMA – jest trudniejsze do rozwiązania niż programowanie liniowe używane w FBA, CRV mogło zostać przeszacowane w porównaniu z CRI. Aby rozwiązać ten potencjalny problem, zaprojektowaliśmy MOMA opartą na programowaniu kwadratowym o nazwie „MOMA-b” i użyliśmy jej zamiast FBA do przewidywania strumieni w stadium a (patrz Metody), ale okazało się, że CRV nadal przewyższa CRI (Suplementarne Rys. 4b). Tak więc, trend ten nie jest technicznym artefaktem różnicy solverów pomiędzy MOMA i FBA.
Odwrócenie strumienia w dużej mierze przywraca oryginalne strumienie
Przewaga odwrócenia strumienia niezależnie od pierwotnego środowiska
Aby zbadać ogólność naszego odkrycia przewagi odwrócenia strumienia, zbadaliśmy również adaptacje z nieglukozowym pierwotnym środowiskiem. Dla wielu pierwotnych środowisk, jednakże, tylko kilka nowych środowisk jest adaptowalnych przez sieć metaboliczną E. coli. Skupiliśmy się więc na 41 środowiskach pierwotnych (w tym poprzednio używanym środowisku glukozy), z których każde ma więcej niż 20 adaptowalnych (tj. fp > 10-4) nowych środowisk (Tabela uzupełniająca 2). Dla każdego z tych oryginalnych środowisk obliczyliśmy stosunek CRI/CRV dla każdego adaptowalnego nowego środowiska i stwierdziliśmy, że jest on zazwyczaj niższy niż 0,1 (ryc. 2d). Następnie obliczyliśmy medianę CRI/CRV dla wszystkich adaptowalnych nowych środowisk z każdego środowiska pierwotnego. Wśród 41 oryginalnych środowisk największa mediana CRI/CRV wynosi 0,11, a mediana mediany CRI/CRV tylko 0,02. Stąd, niezależnie od pierwotnego środowiska, odwrócenie strumienia jest znacznie bardziej powszechne niż wzmocnienie podczas genetycznych adaptacji do nowych środowisk.
Dlaczego fenotypowe odwrócenie jest częstsze niż wzmocnienie
Nasze odkrycie, że fenotypowe wzmocnienie jest nie tylko nie więcej, ale faktycznie znacznie mniej powszechne niż odwrócenie jest nieoczekiwane i stąd wymaga wyjaśnienia. Obserwacja tego trendu zarówno w analizach transkryptomicznych jak i fluksomicznych sugeruje ogólny mechanizm leżący u podstaw, który proponujemy jako występowanie PC > TC. Geometrycznie jest oczywiste, że kiedy PC > TC, GC musi odwrócić PC (lewy i środkowy diagram w górnym rzędzie na Rys. 3a). Z drugiej strony, gdy PC < TC, odwrócenie i wzmocnienie są równie prawdopodobne, jeśli nie istnieje żadna inna nierówność (lewy i środkowy wykres w dolnym rzędzie na rys. 3a). Niech prawdopodobieństwo PC > TC będzie q (> 0). CRI/CRV ma wynosić / = (1 – q)/(1 + q) < 1. Innymi słowy, tak długo jak PC TC dla kilku cech, oczekuje się, że rewersja będzie częstsza niż wzmocnienie (przy braku innej tendencyjności).
Aby poszukać empirycznych dowodów na powyższe wyjaśnienie, dla każdego z 44 przypadków eksperymentalnej ewolucji obliczyliśmy frakcję genów, których zmiany ekspresji spełniają warunki PC > TC (Rys. 3b). Średnia i mediana frakcji wynoszą odpowiednio 0,51 i 0,48. Co więcej, po usunięciu wszystkich genów, dla których PC > TC, nie ma już nadmiaru rewersji (Supplementary Fig. 5a), co wskazuje na wystarczalność naszego wyjaśnienia. Podobnie, obliczyliśmy frakcję reakcji metabolicznych wykazujących PC > TC w adaptacji sieci metabolicznej E. coli ze środowiska glukozy do każdego z 50 nowych środowisk (Rys. 3c). Średnia i mediana frakcji wynosi odpowiednio 0,85 i 0,93. Podobnie, po usunięciu reakcji wykazujących PC > TC, nie ma ogólnej tendencji do większego odwracania niż wzmacniania we wszystkich 50 adaptacjach (Supplementary Fig. 5b). Te transkryptomowe i fluksomowe wyniki wspierają, że nadmiar rewersji w stosunku do wzmocnienia jest możliwy do wyjaśnienia przez występowanie PC > TC dla nieistotnych frakcji cech.
Dlaczego PC przekracza TC dla wielu cech? Prawdopodobnym powodem jest to, że PC pozwalają organizmom przetrwać przy nagłej zmianie środowiska, ale ich kondycja jest znacznie obniżona w porównaniu z tą w oryginalnym środowisku, jak również po adaptacji do nowego środowiska. Tak więc, ogólny stan fizjologiczny organizmów może być dość podobny pomiędzy przystosowanymi stadiami w oryginalnym i nowym środowisku, ale jest znacznie inny w plastikowym stadium o niskiej kondycji zaraz po zmianie środowiska. To może wyjaśnić, dlaczego PC przekracza TC dla wielu cech, niezależnie od tego, czy wartości cech są przyczynami czy konsekwencjami kondycji i fizjologii organizmu.
Znaleźliśmy silne dowody na powyższy model poprzez analizę sieci metabolicznej. Po pierwsze, używając przewidywanego tempa produkcji biomasy jako przybliżenia dla kondycji, porównaliśmy kondycję E. coli na etapie plastycznym (fp) i po adaptacji do nowego środowiska (fa), w stosunku do tego w oryginalnym środowisku glukozy, dla każdej z adaptacji do 50 nowych środowisk. We wszystkich przypadkach, fp < 1 (Fig. 3d), potwierdzając, że zmiany środowiskowe powodują spadek kondycji przed adaptacją genetyczną. Stwierdziliśmy, że fa jest zazwyczaj zbliżone do 1, chociaż w kilku nowych środowiskach jest znacznie >1 (ryc. 3d). W skali log10, fp różni się bardziej od 1 niż fa w 43 z 50 adaptacji (P = 1.0 × 10-7; test dwumianowy z jednym ogonem). Po drugie, nasz model zakłada związek między zmianami strumienia a zmianami kondycji22. Wśród 50 adaptacji ze środowiska glukozy istnieje silna ujemna korelacja między fp i średnim PC (Spearman’s ρ = -0.98, P < 10-300; ryc. 3e). Przeciwna korelacja istnieje między fa i średnią TC (ρ = 0,57, P = 1,1 × 10-5; Fig. 3f). Łącznie nasze analizy wykazują, że podstawowym powodem wyższej częstości fenotypowego odwrócenia niż wzmocnienia podczas adaptacji jest to, że pod względem kondycji i związanych z nią fenotypów organizmy na etapie p różnią się bardziej niż te na etapie a, w porównaniu z tymi na etapie o.
Phenotypic reversion in random metabolic networks
The PCs and GCs in gene expression level and metabolic flux during adaptations depend, respectively, on the regulatory network and metabolic network of the species concerned. Ponieważ sieci te są wynikiem miliardów lat ewolucji, można się zastanawiać, czy przewaga fenotypowej rewersji jest przypisywana ewolucyjnej historii badanych gatunków, zwłaszcza środowiskom, w których gatunek i jego przodkowie byli wybierani w przeszłości, czy też jest to nieodłączna właściwość każdego systemu funkcjonalnego. Aby odpowiedzieć na to pytanie, zastosowaliśmy tę samą analizę do 500 funkcjonalnych losowych sieci metabolicznych, wcześniej wygenerowanych22. Sieci te zostały skonstruowane na podstawie iAF1260 poprzez zamianę jego reakcji z losowo wybranymi reakcjami z uniwersum wszystkich reakcji metabolicznych w Kyoto Encyclopedia of Genes and Genomes38 tak długo, jak sieć ma niezerową przewidywaną przez FBA kondycję w środowisku glukozy przy każdej zamianie reakcji39.
Tylko 20 nowych środowisk, do których iAF1260 może się przystosować (ze środowiska glukozy), jest adaptowalnych przez co najmniej 20 z 500 losowych sieci. Przeanalizowaliśmy więc adaptacje sieci losowych do każdego z tych 20 nowych środowisk, przy czym środowisko glukozy jest środowiskiem oryginalnym. Dla każdego nowego środowiska mediana CRV wszystkich sieci losowych, które mogą się do niego przystosować, wynosi na ogół około 0,1 (wykresy pudełkowe na rys. 4a), przy czym mediana mediany CRV wynosi 0,11. Natomiast mediana CRI sieci losowych dla nowego środowiska jest na ogół poniżej 0,01 (wykresy pudełkowe na rys. 4b), przy czym mediana mediany CRI wynosi 0,0033. Mediana stosunku CRI/CRV w przypadkowych sieciach dla nowego środowiska jest generalnie poniżej 0,05 (wykres pudełkowy na Rys. 4c), przy czym mediana mediany CRI/CRV wynosi 0,0033. Wyraźnie widać, że przewaga odwracania strumienia jest również widoczna w funkcjonalnych sieciach losowych, co sugeruje, że ta właściwość jest nieodłącznym elementem każdej funkcjonalnej sieci metabolicznej, a nie produktem poszczególnych historii ewolucyjnych. W istocie, mechanistyczne wyjaśnienie tej właściwości w rzeczywistych organizmach (Rys. 3) ma zastosowanie w badanych tu losowych sieciach metabolicznych. W szczególności, frakcja reakcji wykazujących PC > TC jest znaczna (Rys. 4d), a fp jest w większości przypadków niższa niż 1 (Rys. 4e). Ponadto, fp jest generalnie bardziej różne od 1 niż fa w skali log10, ponieważ |log10fp|-|log10fa| jest w większości dodatnie (Rys. 4f).
Intrygujące jest jednak to, że dla 19 z 20 nowych środowisk, CRV w sieci metabolicznej E. coli przekracza medianę CRV w sieciach losowych (Rys. 4a). Podobna, choć mniej oczywista tendencja występuje w przypadku CRI (Rys. 4b). Dla 16 z 20 nowych środowisk, CRI/CRV z E. coli jest mniejsze niż mediana CRI/CRV w sieciach losowych (P = 0,012, test dwumianowy dwuwarstwowy; Rys. 4c). Stąd, chociaż zarówno sieć metaboliczna E. coli, jak i sieci losowe wykazują przewagę odwrócenia strumienia, zjawisko to jest wyraźniejsze w E. coli. Mechanistycznie, rozbieżność ta jest przynajmniej jakościowo wytłumaczalna przez nasz model z poprzedniej sekcji. W szczególności, dla 15 z 20 nowych środowisk, frakcja reakcji E. coli z PC > TC przekracza odpowiadającą jej medianę frakcji w sieciach losowych (P = 0,021, test dwumianowy z jednym ogonem; Rys. 4d). Dla wszystkich 20 nowych środowisk fp E. coli jest niższe niż mediana fp w sieciach losowych (P = 9,5 × 10-7, test dwumianowy z jednym ogonem; ryc. 4e). Dla 19 z 20 nowych środowisk, |log10 fp – |log10 fa| dla E. coli jest większa niż odpowiadająca jej wartość mediany dla sieci losowych (P = 2,0 × 10-5, test dwumianowy z jednym ogonem; ryc. 4f). Dlaczego jednak fp dla E. coli jest niższe niż dla sieci losowych? Jednym z potencjalnych wyjaśnień jest to, że skład i struktura sieci metabolicznej E. coli zostały ewolucyjnie zoptymalizowane do wzrostu w środowisku glukozy i/lub środowiskach pokrewnych, podczas gdy to samo nie jest prawdą w przypadku sieci losowych, które były wymagane tylko do życia w środowisku glukozy. W rezultacie, gdy glukoza zostaje zastąpiona nowym źródłem węgla w nowym środowisku, kondycja E. coli znacznie spada, ale kondycja sieci losowych może spadać tylko nieznacznie. Chociaż bezwzględna kondycja w stadium plastycznym może być wyższa dla E. coli niż dla sieci losowych, oczekuje się, że względna kondycja, którą jest fp, będzie niższa dla E. coli niż dla sieci losowych. Tak więc, wyższa częstość występowania flux reversion w stosunku do wzmocnienia w E. coli niż sieci losowe jest prawdopodobnie produktem ubocznym silniejszej selekcji E. coli w porównaniu z sieciami losowymi w oryginalnym środowisku używanym w naszej analizie adaptacji.
Reversion jest co najmniej tak powszechne jak wzmocnienie nawet dla cech z odczuwalnym TC
W powyższych analizach transkryptomów (Fig. 1d) i fluxomes (Fig. 2a), wzięliśmy pod uwagę wszystkie cechy wykazujące odczuwalne PCs i GCs. W badaniach porównawczych i ewolucyjnych fenotypy na etapie p są jednak zazwyczaj niedostępne. W rezultacie, biolodzy porównawczy i ewolucyjni zwykle skupiają się na cechach, których wartości fenotypowe różnią się między stadiami o i a, mimo że inne cechy również mogły doświadczyć zmian adaptacyjnych (z wartości w stadium p do wartości w stadium a). Aby zbadać, czy nasze powyższe ustalenia odnoszą się do cech, które są przedmiotem zainteresowania większości biologów porównawczych i ewolucyjnych, skupiamy się na podzbiorze wyżej analizowanych cech, które spełniają warunek TC > 0,2Lo. Spośród 44 przypadków ewolucji eksperymentalnej, 33 wykazały CRV > CRI (P = 0,0013, test dwumianowy dwuogonowy), w 30 z nich CRV istotnie przewyższa CRI (nominalnie P < 0,05; test dwumianowy dwuogonowy; ryc. 5a). Spośród 50 adaptacji środowiskowych sieci metabolicznej E. coli pochodzących ze środowiska glukozy, trzy przypadki miały równą liczbę odwrócenia strumienia i wzmocnienia. Wśród pozostałych 47 przypadków, 22 wykazywały więcej rewersji niż wzmocnienia, podczas gdy 25 wykazywało odwrotność (P = 0,77, test dwumianowy dwuogonowy; ryc. 5b). Gdy CRI różni się istotnie od CRV, w 15 przypadkach CRV < CRI, podczas gdy w 11 przypadkach było odwrotnie (P = 0,70, test dwumianowy dwuogonowy; ryc. 5b). Stąd, nawet wśród cech z TC > 0,2Lo, nie ma dowodów na istotnie większe wzmocnienie niż odwrócenie. Na uwagę zasługuje fakt, że w powyższej analizie metabolicznej średnio 139 reakcji spełniało TC > 0,2Lo na adaptację. Ponieważ wszystkie zmiany strumienia obserwowane w maksymalizacji kondycji są wymagane, a więc są z definicji korzystne, nawet adaptacja do prostej zmiany źródła węgla najwyraźniej obejmuje znacznie więcej niż kilka reakcji.
.