- Prévalence de la réversion d’expression dans l’évolution expérimentale
- Réversion des flux métaboliques dans les adaptations environnementales
- La réversion de flux restaure largement les flux originaux
- Prédominance de la réversion de flux indépendamment de l’environnement original
- Pourquoi la réversion phénotypique est plus fréquente que le renforcement
- Réversion phénotypique dans les réseaux métaboliques aléatoires
- La réversion est au moins aussi courante que le renforcement même pour les traits avec des CT appréciables
Prévalence de la réversion d’expression dans l’évolution expérimentale
Nous avons identifié cinq études qui ont mené six expériences d’adaptation différentes et recueilli des données transcriptomiques convenant à notre analyse. Ces six expériences comprenaient 10 réplicats d’E. coli s’adaptant à un environnement à haute température17, 6 réplicats d’une autre souche d’E. coli s’adaptant à un environnement à haute température18, 7 réplicats d’E. coli s’adaptant à un milieu glycérol16, 7 réplicats d’E. coli s’adaptant à un milieu lactate16, 1 réplique de chacune des 12 différentes souches de levure (Saccharomyces cerevisiae) s’adaptant à un milieu xylulose19, et 2 répliques de guppies (Poecilia reticulata) s’adaptant à un environnement à faible prédation15. Au total, nous avons analysé 44 cas d’adaptation.
Dans chaque cas, les données transcriptomiques ont été respectivement collectées pour les organismes dans l’environnement d’origine (o pour le stade d’origine), peu après leur exposition au nouvel environnement (p pour le stade plastique), et à la conclusion de l’évolution expérimentale dans le nouvel environnement (a pour le stade adapté ; Fig. 1a). Notez que le temps entre o et p est si court qu’aucun allèle nouvellement apparu ne devrait avoir atteint une fréquence appréciable au stade p pour avoir un impact sur le phénotype moyen de la population. Le niveau d’expression de chaque gène est traité comme un trait. Les niveaux d’expression d’un gène aux stades o, p et a sont respectivement Lo, Lp et La. Dans chaque expérience, nous avons d’abord identifié les gènes présentant des PC appréciables dans le niveau d’expression en exigeant que PC = |Lp-Lo| soit supérieur à un seuil prédéfini. Nous avons également identifié les gènes présentant des GC appréciables en termes de niveau d’expression en exigeant que GC = |La-Lp| soit supérieur au même seuil prédéfini. Pour les gènes présentant à la fois des PC et des GC appréciables, nous nous demandons si les deux changements vont dans le même sens (c’est-à-dire, renforcement) ou dans des sens opposés (c’est-à-dire, réversion ; Fig. 1b, c). Nous avons utilisé 20% du niveau d’expression du gène original (c’est-à-dire 0,2Lo) comme seuil dans l’analyse ci-dessus. La fraction de gènes présentant un renforcement du niveau d’expression (CRI) est inférieure à la fraction de gènes présentant une réversion (CRV) dans 42 des 44 adaptations, et la différence entre CRI et CRV est significative dans 40 de ces 42 cas (P nominal < 0,05 ; test binomial bilatéral ; Fig. 1d). Parmi les deux adaptations avec CRI > CRV, leur différence n’est significative que dans un seul cas (Fig. 1d). La prépondérance générale de la réversion du niveau d’expression (c’est-à-dire 42 cas sur 44) dans l’adaptation est statistiquement significative (P = 1,1 × 10-10, test binomial bilatéral). La même tendance est évidente lorsque le seuil est modifié à 0,05Lo (figure supplémentaire 1a) ou 0,5Lo (figure supplémentaire 2a), ce qui suggère que la constatation ci-dessus est robuste au choix du seuil. Clairement, les données transcriptomiques ne soutiennent pas l’hypothèse selon laquelle la plasticité facilite généralement l’adaptation génétique.
Réversion des flux métaboliques dans les adaptations environnementales
Pour évaluer la généralité de la constatation ci-dessus et comprendre sa cause sous-jacente, nous avons étendu la comparaison entre le renforcement phénotypique et la réversion aux flux métaboliques (voir Introduction). Comme notre analyse métabolique n’a pas pour but de modéliser l’évolution expérimentale ou les changements d’expression susmentionnés, les paramètres utilisés ne sont pas liés à l’évolution expérimentale. Plus précisément, nous avons prédit par calcul les changements de flux plastiques et génétiques pendant les adaptations environnementales en utilisant iAF1260, le réseau métabolique reconstruit d’E. coli23. Nous avons utilisé l’analyse de l’équilibre des flux (FBA) pour prédire les flux optimisés d’organismes entièrement adaptés dans l’environnement d’origine (stade o) et le nouvel environnement (stade a), respectivement, en supposant que le taux de production de biomasse, un indicateur de l’aptitude, est maximisé par la sélection naturelle20. Les prédictions de l’ACF correspondent raisonnablement bien aux mesures expérimentales pour les organismes adaptés à leur environnement24,25,26,27,28,29 et sont couramment utilisées dans l’étude des relations génotype-environnement-phénotype22,27,29,30,31,32,33,34,35,36,37. Pour prédire les changements de flux plastiques lors de changements environnementaux (stade p), nous avons utilisé la minimisation de l’ajustement métabolique (MOMA) au lieu de l’AFA car la MOMA récapitule mieux la réponse immédiate du flux aux perturbations21 (voir Méthodes). Nous avons traité le flux de chaque réaction du réseau métabolique comme un trait, et nous avons modélisé les changements environnementaux en modifiant la source de carbone disponible pour le réseau. Il existe 258 réactions d’échange distinctes dans iAF1260, chacune transportant une source de carbone différente. Nous avons donc examiné 258 environnements différents à source unique de carbone.
Nous avons commencé l’analyse en utilisant le glucose comme source de carbone dans l’environnement d’origine, car cet environnement était la référence dans la construction d’iAF126023. Nous avons ensuite considéré les adaptations d’E. coli à 257 nouveaux environnements, chacun avec une source de carbone unique différente. Nous avons constaté que ces nouveaux environnements sont naturellement séparés en deux groupes dans le taux de production de biomasse prédit par MOMA, une approximation de la forme physique au stade p (fp) (figure supplémentaire 3). Un groupe présente un fp < 10-4, ce qui suggère qu’il est peu probable qu’E. coli se maintienne dans ces nouveaux environnements. Nous nous sommes donc concentrés sur les 50 nouveaux environnements restants avec fp > 10-4, auxquels E. coli peut vraisemblablement s’adapter (Tableau supplémentaire 1).
En définissant le renforcement et la réversion du flux et en utilisant le seuil de 0,2Lo comme dans l’analyse du transcriptome, nous avons trouvé que le CRV était significativement plus grand que le CRI (P nominal < 10-10, test binomial bilatéral) dans chaque adaptation. La probabilité aléatoire que les 50 adaptations présentent une CRV > CRI est de 1,8 × 10-15 (test binomial à deux intervalles ; Fig. 2a), ce qui suggère une prédominance générale de la réversion du flux. La moyenne et la médiane de la CRV sont respectivement de 30,2 % et 30,5 %, tandis que celles de la CRI ne sont que de 1,0 % et 0,8 %, respectivement. La tendance ci-dessus se maintient lorsque nous modifions le seuil à 0,05Lo (figure supplémentaire 1b) ou à 0,5Lo (figure supplémentaire 2b). Comme un problème FBA ou MOMA peut avoir plusieurs solutions, l’ordre des réactions dans la matrice stœchiométrique pourrait affecter la solution spécifique fournie par le solveur. Néanmoins, lorsque nous avons mélangé de manière aléatoire l’ordre des réactions dans iAF1260, le modèle général de CRV > CRI n’a pas été modifié (figure supplémentaire 4a). Comme la programmation quadratique – requise par MOMA – est plus difficile à résoudre que la programmation linéaire utilisée dans FBA, CRV pourrait avoir été surestimé par rapport à CRI. Pour rectifier ce problème potentiel, nous avons conçu un MOMA basé sur la programmation quadratique appelé « MOMA-b » et l’avons utilisé à la place du FBA pour prédire les flux à l’étape a (voir Méthodes), mais nous avons constaté que la VRC dépasse toujours l’IRC (Fig. 4b supplémentaire). Ainsi, cette tendance n’est pas un artefact technique de la différence de solveur entre MOMA et FBA.
La réversion de flux restaure largement les flux originaux
Prédominance de la réversion de flux indépendamment de l’environnement original
Pour étudier la généralité de notre constatation de la prédominance de la réversion de flux, nous avons également examiné les adaptations avec un environnement original sans glucose. Pour de nombreux environnements originaux, cependant, seuls quelques nouveaux environnements sont adaptables par le réseau métabolique d’E. coli. Nous nous sommes donc concentrés sur 41 environnements originaux (y compris l’environnement de glucose utilisé précédemment) qui ont chacun plus de 20 nouveaux environnements adaptables (c’est-à-dire, fp > 10-4) (Tableau supplémentaire 2). Pour chacun de ces environnements originaux, nous avons calculé le rapport CRI/CRV pour chaque nouvel environnement adaptable, et nous avons constaté qu’il était généralement inférieur à 0,1 (Fig. 2d). Nous avons ensuite calculé la médiane de l’IRC/VRC pour tous les nouveaux environnements adaptables de chaque environnement original. Sur les 41 environnements d’origine, le CRI/CRV médian le plus important est de 0,11 et la médiane du CRI/CRV médian est seulement de 0,02. Par conséquent, indépendamment de l’environnement d’origine, la réversion de flux est beaucoup plus répandue que le renforcement au cours des adaptations génétiques à de nouveaux environnements.
Pourquoi la réversion phénotypique est plus fréquente que le renforcement
Notre constatation que le renforcement phénotypique n’est non seulement pas plus, mais en fait beaucoup moins fréquent que la réversion est inattendue et demande donc une explication. L’observation de cette tendance dans les analyses transcriptomiques et fluxomiques suggère un mécanisme général sous-jacent, que nous proposons comme étant l’occurrence de PC > TC. Géométriquement, il est évident que lorsque PC > TC, le GC doit inverser le PC (les diagrammes de gauche et du milieu dans la rangée supérieure de la Fig. 3a). En revanche, lorsque PC < TC, la réversion et le renforcement sont tout aussi probables s’il n’existe aucun autre biais (les diagrammes de gauche et du milieu dans la rangée inférieure de la figure 3a). Soit la probabilité que PC > TC soit q (> 0). On s’attend à ce que CRI/CRV soit / = (1 – q)/(1 + q) < 1. En d’autres termes, tant que PC > TC pour quelques traits, on s’attend à ce que la réversion soit plus fréquente que le renforcement (sous aucun autre biais).
Pour chercher des preuves empiriques de l’explication ci-dessus, pour chacun des 44 cas d’évolution expérimentale, nous avons calculé la fraction de gènes dont les changements d’expression satisfont PC > CT (Fig. 3b). Les fractions moyenne et médiane sont respectivement de 0,51 et 0,48. De plus, après avoir retiré tous les gènes pour lesquels PC > TC, il n’y a plus d’excès de réversion (Fig. 5a supplémentaire), ce qui indique la suffisance de notre explication. De même, nous avons calculé la fraction des réactions métaboliques présentant PC > TC dans l’adaptation du réseau métabolique d’E. coli de l’environnement glucose à chacun des 50 nouveaux environnements (Fig. 3c). Les fractions moyenne et médiane sont respectivement de 0,85 et 0,93. De même, après l’élimination des réactions montrant PC > TC, il n’y a pas de tendance générale de plus de réversion que de renforcement sur les 50 adaptations (Fig. 5b supplémentaire). Ces résultats du transcriptome et du fluxome confirment que l’excès de réversion par rapport au renforcement est explicable par l’occurrence de PC > TC pour des fractions non négligeables de traits.
Pourquoi le PC dépasse-t-il le TC pour de nombreux traits ? Une raison probable est que les PC permettent aux organismes de survivre lors d’un changement soudain d’environnement, mais la fitness est très réduite par rapport à celle dans l’environnement d’origine ainsi qu’à celle après l’adaptation au nouvel environnement. Ainsi, l’état physiologique global des organismes peut être assez similaire entre les stades adaptés dans l’environnement d’origine et le nouvel environnement, mais il est très différent dans le stade plastique à faible fitness juste après le changement d’environnement. Cela peut expliquer pourquoi le PC dépasse le TC pour de nombreux traits, indépendamment du fait que les valeurs des traits sont des causes ou des conséquences de la fitness et de la physiologie de l’organisme.
Nous avons trouvé des preuves solides pour le modèle ci-dessus par l’analyse du réseau métabolique. Tout d’abord, en utilisant le taux de production de biomasse prédit comme un proxy pour la fitness, nous avons comparé la fitness d’E. coli au stade plastique (fp) et celle après adaptation à un nouvel environnement (fa), par rapport à celle dans l’environnement de glucose d’origine, pour chacune des adaptations aux 50 nouveaux environnements. Dans tous les cas, fp < 1 (Fig. 3d), confirmant que les changements environnementaux provoquent des baisses de fitness avant l’adaptation génétique. Nous avons constaté que fa est généralement proche de 1, bien que dans quelques nouveaux environnements il soit beaucoup >1 (Fig. 3d). Sur une échelle log10, fp est plus différent de 1 que fa dans 43 des 50 adaptations (P = 1,0 × 10-7 ; test binomial unilatéral). Deuxièmement, notre modèle suppose une association entre les changements de flux et les changements de fitness22. Parmi les 50 adaptations de l’environnement de glucose, il existe une forte corrélation négative entre fp et PC moyen (ρ de Spearman = -0.98, P < 10-300 ; Fig. 3e). Une corrélation opposée existe entre fa et TC moyenne (ρ = 0,57, P = 1,1 × 10-5 ; Fig. 3f). Ensemble, nos analyses démontrent que la raison principale d’une fréquence plus élevée de réversion phénotypique que de renforcement au cours de l’adaptation est qu’en termes de fitness et de phénotypes associés, les organismes au stade p sont plus différents que ceux au stade a, lorsqu’on les compare à ceux au stade o.
Réversion phénotypique dans les réseaux métaboliques aléatoires
Les PC et les CG du niveau d’expression des gènes et du flux métabolique au cours des adaptations dépendent, respectivement, du réseau de régulation et du réseau métabolique de l’espèce concernée. Comme ces réseaux résultent de milliards d’années d’évolution, on peut se demander si la prédominance de la réversion phénotypique est attribuable à l’histoire évolutive de l’espèce étudiée, notamment aux environnements dans lesquels l’espèce et ses ancêtres ont été sélectionnés dans le passé, ou à une propriété intrinsèque de tout système fonctionnel. Pour répondre à cette question, nous avons appliqué la même analyse à 500 réseaux métaboliques fonctionnels aléatoires précédemment générés22. Ces réseaux ont été construits à partir de iAF1260 en échangeant ses réactions avec des réactions choisies au hasard dans l’univers de toutes les réactions métaboliques de l’Encyclopédie des gènes et des génomes de Kyoto38, tant que le réseau a une aptitude prédite par FBA non nulle dans l’environnement du glucose à chaque échange de réaction39.
Seulement 20 nouveaux environnements auxquels iAF1260 peut s’adapter (à partir de l’environnement du glucose) sont adaptables par au moins 20 des 500 réseaux aléatoires. Nous avons donc analysé les adaptations des réseaux aléatoires à chacun de ces 20 nouveaux environnements, l’environnement glucose étant l’environnement d’origine. Pour chaque nouvel environnement, le CRV médian de tous les réseaux aléatoires qui peuvent s’adapter à cet environnement est généralement autour de 0,1 (diagrammes en boîte dans la Fig. 4a), la médiane du CRV médian étant de 0,11. En revanche, l’IRC médian des réseaux aléatoires pour un nouvel environnement est généralement inférieur à 0,01 (diagrammes en boîte de la figure 4b), la médiane de l’IRC médian étant de 0,0033. Le rapport CRI/CRV médian à travers les réseaux aléatoires pour un nouvel environnement est généralement inférieur à 0,05 (diagramme en boîte de la figure 4c), la médiane du CRI/CRV médian étant de 0,0033. Il est clair que la prédominance de la réversion du flux est également évidente dans les réseaux aléatoires fonctionnels, ce qui suggère que cette propriété est intrinsèque à tout réseau métabolique fonctionnel plutôt que le produit d’histoires évolutives particulières. En effet, l’explication mécaniste de cette propriété dans les organismes actuels (Fig. 3) se vérifie dans les réseaux métaboliques aléatoires examinés ici. Plus précisément, la fraction de réactions présentant une PC > TC est importante (Fig. 4d) et fp est le plus souvent inférieur à 1 (Fig. 4e). En outre, fp est généralement plus différent de 1 que ne l’est fa dans une échelle log10, car |log10fp|-|log10fa| est largement positif (Fig. 4f).
Intrigamment, cependant, pour 19 des 20 nouveaux environnements, la VRC du réseau métabolique d’E. coli dépasse la VRC médiane des réseaux aléatoires (Fig. 4a). Une tendance similaire mais moins évidente s’applique à l’IRC (Fig. 4b). Pour 16 des 20 nouveaux environnements, l’IRC/VRC de E. coli est inférieur à l’IRC/VRC médian des réseaux aléatoires (P = 0,012, test binomial bilatéral ; figure 4c). Ainsi, bien que le réseau métabolique d’E. coli et les réseaux aléatoires montrent tous deux une prédominance de la réversion de flux, ce phénomène est plus prononcé chez E. coli. D’un point de vue mécanique, cette disparité peut être expliquée, au moins qualitativement, par notre modèle de la section précédente. Plus précisément, pour 15 des 20 nouveaux environnements, la fraction des réactions d’E. coli avec PC > TC dépasse la fraction médiane correspondante dans les réseaux aléatoires (P = 0,021, test binomial unilatéral ; Fig. 4d). Pour les 20 nouveaux environnements, la fp d’E. coli est inférieure à la fp médiane des réseaux aléatoires (P = 9,5 × 10-7, test binomial unilatéral ; Fig. 4e). Pour 19 des 20 nouveaux environnements, |log10 fp| – |log10 fa| d’E. coli est supérieur à la valeur médiane correspondante des réseaux aléatoires (P = 2,0 × 10-5, test binomial unilatéral ; Fig. 4f). Mais, pourquoi le fp d’E. coli est-il inférieur à celui des réseaux aléatoires ? Une explication possible est que la composition et la structure du réseau métabolique d’E. coli ont été optimisées au cours de l’évolution pour la croissance dans l’environnement du glucose et/ou des environnements connexes, alors qu’il n’en va pas de même pour les réseaux aléatoires, qui ne devaient être viables que dans l’environnement du glucose. Par conséquent, lorsque le glucose est remplacé par une nouvelle source de carbone dans un nouvel environnement, la valeur adaptative d’E. coli diminue considérablement, mais celle des réseaux aléatoires peut ne diminuer que légèrement. Bien que la valeur absolue de la valeur adaptative au stade plastique puisse être plus élevée pour E. coli que pour les réseaux aléatoires, la valeur adaptative relative, que représente fp, devrait être plus faible pour E. coli que pour les réseaux aléatoires. Ainsi, la prévalence plus élevée de la réversion du flux par rapport au renforcement chez E. coli que dans les réseaux aléatoires est probablement un sous-produit d’une sélection plus forte d’E. coli par rapport aux réseaux aléatoires dans l’environnement original utilisé dans notre analyse de l’adaptation.
La réversion est au moins aussi courante que le renforcement même pour les traits avec des CT appréciables
Dans les analyses précédentes des transcriptomes (Fig. 1d) et des fluxomes (Fig. 2a), nous avons considéré tous les traits présentant des PC et des GC appréciables. Dans les études comparatives et évolutives, cependant, les phénotypes au stade p sont généralement inaccessibles. Par conséquent, les biologistes comparatifs et évolutionnistes se concentrent généralement sur les traits dont les valeurs phénotypiques diffèrent entre les stades o et a, bien que les autres traits aient également pu subir des changements adaptatifs (des valeurs du stade p à celles du stade a). Pour étudier si nos résultats précédents s’appliquent aux traits qui sont le sujet de la plupart des biologistes comparatifs et évolutionnistes, nous nous concentrons sur un sous-ensemble de traits analysés ci-dessus qui satisfont la condition de TC > 0,2Lo. Sur les 44 cas d’évolution expérimentale, 33 ont montré un CRV > CRI (P = 0,0013, test binomial bilatéral), dans 30 desquels le CRV dépasse significativement le CRI (P nominal < 0,05 ; test binomial bilatéral ; Fig. 5a). Parmi les 50 adaptations environnementales du réseau métabolique d’E. coli provenant de l’environnement du glucose, trois cas présentaient un nombre égal de réversion et de renforcement du flux. Parmi les 47 cas restants, 22 présentaient plus de réversion que de renforcement, tandis que 25 présentaient le contraire (P = 0,77, test binomial bilatéral ; Fig. 5b). Lorsque l’IRC est significativement différent de la VRC, 15 cas ont montré une VRC < IRC tandis que 11 ont montré le contraire (P = 0,70, test binomial bilatéral ; Fig. 5b). Par conséquent, même parmi les caractères avec CT > 0,2Lo, il n’y a pas de preuve pour un renforcement significativement plus important que la réversion. Il convient de noter que, dans l’analyse métabolique ci-dessus, 139 réactions en moyenne ont satisfait à la condition TC > 0,2Lo par adaptation. Puisque tous les changements de flux observés dans la maximisation de la fitness sont nécessaires et sont donc par définition bénéfiques, même l’adaptation à un simple changement de source de carbone implique apparemment beaucoup plus que quelques réactions.
.