新しい環境への進化的適応は一般的に可塑的な表現型の変化を逆転させる

Prevalence of expression reversion in experimental evolution

我々は6種類の適応実験を行って我々の分析に適したトランスクリプトームのデータを収集した研究5件を確認しました。 これらの6つの実験には、高温環境に適応した大腸菌の10複製17、高温環境に適応した別の大腸菌株の6複製18、グリセロール培地に適応した大腸菌の7複製16、大腸菌の7複製が含まれていた。 coliが乳酸培地16に、12種類の酵母(Saccharomyces cerevisiae)がキシルロース培地19に、グッピー(Poecilia reticulata)が低捕食環境に、それぞれ1レプリケートずつ適応している15。

それぞれのケースで、元の環境にいた生物(元のステージはo)、新しい環境にさらされた直後(プラスチックステージはp)、新しい環境での実験的進化の終了時(適応したステージはa)、それぞれトランスクリプトームデータを収集しました(図1a)。 oとpの間の時間は非常に短いので、新しく発生した対立遺伝子はpの段階では集団の平均的な表現型に影響を与えるほどの頻度には達していないと予想されることに注意。 各遺伝子の発現量は形質として扱われる。 ある遺伝子のo期、p期、a期における発現量をそれぞれLo、Lp、Laとすると、o期、p期、a期における発現量は、それぞれLo、Lp、Laとなる。 各実験において、まずPC=|Lp-Lo|があらかじめ設定したカットオフ値より大きいことを条件として、発現量のPCが顕著な遺伝子を同定した。 また、GC = |La-Lp| が事前に設定したカットオフ値より大きいことを条件として、発現レベルがGCと評価できる遺伝子を同定した。 PCとGCの両方を示す遺伝子について、2つの変化が同じ方向(強化)か反対方向(復帰)かを尋ねた(図1b、c)。 上記の解析では、元の遺伝子の発現量の20%(すなわち0.2Lo)をカットオフ値として使用した。 発現レベルの強化を示す遺伝子の割合(CRI)は、復帰を示す遺伝子の割合(CRV)よりも44適応のうち42適応で小さく、CRIとCRVの差はこの42適応のうち40で有意であった(公称P < 0.05; 両側二項検定;図1d)。 CRI > CRVの2つの適応のうち、その差が有意であったのは1例のみであった(図1d)。 適応度における発現レベル逆転の一般的な優勢(すなわち、44例中42例)は、統計的に有意である(P = 1.1 × 10-10、両側二項検定)。 カットオフを0.05Lo(補足図1a)または0.5Lo(補足図2a)に変更しても同様の傾向が見られ、上記の知見はカットオフの選択に対してロバストであることが示唆された。 トランスクリプトームデータは明らかに、可塑性が一般的に遺伝的適応を促進するという仮説を支持しない。

環境適応における代謝フラックス復帰

上記の発見の一般性を評価しその根本原因を理解するために、表現型強化と復帰の比較を代謝フラックスに拡大した(「はじめに」参照)。 我々の代謝解析は上記の実験的進化や発現変化をモデル化するものではないため、使用したパラメータは実験的進化とは無関係である。 具体的には、大腸菌の代謝ネットワークを再構築したiAF1260を用いて、環境適応時の可塑的・遺伝的フラックス変化を計算で予測した23。 フラックスバランス解析(FBA)を用いて、適合度の代用であるバイオマス生産速度が自然選択によって最大化されるという仮定のもと、元の環境(ステージo)と新しい環境(ステージa)でそれぞれ完全に適応した生物の最適化フラックスを予測した20。 FBAの予測値は、環境に適応した生物の実験値とよく一致し24,25,26,27,28,29、遺伝子型-環境-表現型の関係の研究においてよく用いられる22,27,29,30,31,32,33,34,35,36,37。 環境シフトに伴う可塑的なフラックス変化を予測する場合(ステージp)、MOMAの方が摂動に対するフラックス反応をよく再現できるため、FBAではなく最小化代謝調整(MOMA)を採用した21(方法参照)。 代謝ネットワーク内の各反応のフラックスを形質として扱い、ネットワークに利用可能な炭素源を変化させることで環境シフトをモデル化した。 iAF1260には258の異なる交換反応があり、それぞれが異なる炭素源を輸送する。 そこで、258種類の炭素源環境を検討した。

iAF1260構築の際にベンチマークとした環境23であるため、元の環境の炭素源としてグルコースを用いて解析を開始した。 次に、それぞれ異なる単一炭素源を持つ257の新しい環境に対する大腸菌の適応を検討した。 その結果、これらの新しい環境は、ステージpでの適応度の代用であるMOMA予測バイオマス生産率(fp)において、自然に2つのグループに分かれることがわかった(補足図3)。 一方はfp < 10-4を示し、大腸菌がこれらの新しい環境で持続する可能性は低いことが示唆された。 そこで、大腸菌が適応できると考えられるfp > 10-4の残り50の新環境に着目した(補足表1)。

フラックス強化・復帰を定義し、転写産物解析と同様に0.2Loのカットオフを使用すると、それぞれの適応においてCRVがCRIより有意に大きい(名義P < 10-10, 二項検定)ことが確認された。 50適応群すべてがCRV > CRIを示す確率は1.8×10-15(両側二項検定;図2a)であり、一般にフラックスリバーシ ョンが優勢であることが示唆された。 CRVの平均値と中央値はそれぞれ30.2%と30.5%であり、CRIの平均値と中央値はそれぞれ1.0%と0.8%に過ぎない。 この傾向は、カットオフ値を 0.05Lo (Supplementary Fig. 1b) または 0.5Lo (Supplementary Fig. 2b) に変更した場合にも当てはまる。 FBAやMOMAの問題は複数の解を持つことがあるので、化学量論的行列の反応の順番はソルバーが提供する具体的な解に影響を与える可能性がある。 しかし、iAF1260で反応順序をランダムにシャッフルしたところ、CRV > CRIの一般的なパターンは変化しなかった(補足図4a)。 MOMAが要求する二次計画法はFBAで用いられる線形計画法に比べて解きにくいため、CRVはCRIに比べて過大評価されている可能性がある。 この問題を解決するために、我々は二次計画法に基づくMOMAを設計し、MOMA-bと名付け、FBAの代わりにaステージのフラックス予測に使用した(方法参照)。 図2

Predominance of flux reversion in the environmental adaptations of E. coli. a グルコース環境から50の新しい環境それぞれへの適応において、フラックスが強化(CRI)および反転(CRV)した反応のそれぞれのパーセンテージを示したもの。 各バーは新しい環境への適応を表す。 強化反応と逆転反応の割合が等しいかどうかは、両側二項検定で検定した。 CRV > CRIのとき、P値は次のように表示される。 *P < 0.05; **P < 10-10; ***P < 10-100; CRV < CRIの場合、P値は以下のように表示。 b 元の環境での表現型価値が過小回復、回復、過大回復のいずれであるかにより3カテゴリーへの復帰の分類を行う。 d 大腸菌の41の環境から少なくとも20の新しい環境へ適応したときの、強化反応の割合(CRI/CRV)を逆転反応の割合と比較。 箱の下縁と上縁はそれぞれ第一(qu1)と第三(qu3)の四分位を示し、箱の中の水平線は中央値(md)、ひげは内柵の中の極値(md ± 1)まで伸びている。5(qu3 – qu1)、丸は内柵の外側の値(外れ値)

Flux reversion largely restores the original flux

Predominance of flux reversion regardless the original environment

flux reversion優勢という我々の発見の一般性を調べるために、非グルコース元環境での適応も調べた。 しかし、多くのオリジナル環境に対して、大腸菌の代謝ネットワークが適応できる新しい環境はわずかである。 そこで、以前に使用したグルコース環境を含む41の原環境のうち、それぞれ20以上の適応可能な(すなわち、fp > 10-4)新環境に焦点を当てた(補足表2)。 これらの原環境について、各適応可能な新環境のCRI/CRV比を計算したところ、通常0.1より低いことが分かった(図2d)。 次に、それぞれの原環境から適応可能な新しい環境全体のCRI/CRVの中央値を計算した。 41のオリジナル環境全体では、CRI/CRVの中央値が最も大きく0.11、中央値CRI/CRVの中央値はわずか0.02であることがわかった。

Why phenotypic reversion is more frequent than reinforcement

We finding that phenotypic reinforcement is no more but actually much less common than reversion is unexpected and therefore requires an explanation.元の環境にかかわらず、新しい環境に適応する際にフラックス復帰が強化よりはるかに多く見られるのは、予想外であり、それゆえ説明が必要である。 トランスクリプトーム解析とフラックス解析の両方でこの傾向が見られたことは、一般的な基礎となるメカニズムを示唆しており、我々はPC > TCの発生であると提案する。 幾何学的には、PC > TCのとき、GCはPCを逆転しなければならないことは明らかである(図3aの上段の左と中央の図)。 一方、PC < TCの場合、他に偏りがなければ、逆転も強化も同じ確率である(図3aの下段の左図と中図)。 PC > TCの確率をq (> 0)とすると、PC > TCの確率は0である。 CRI/CRVは/ = (1 – q)/(1 + q) < 1と予想される。 つまり、少数の形質でPC > TCである限り、復帰は強化より頻繁であると予想される(他のバイアスがない場合)。

Fig.3

適応において表現型の復帰が優勢な理由 a モデルを説明した図。 上段は可塑的変化(PC)が総変化(TC)より大きい場合、遺伝的変化(GC)はPCを逆転させなければならないことを示している(左図、中図)。 PC > TCとなる理由の一つは、ステージoとpの生物の適応度の差が、ステージoとaのそれよりも大きいからです(右図)。 下図は、PC < TCの場合、GCはPCを強化するか逆転させるかを示している(左図と中図)。 これは、oとpのステージの生物間の適応度の差がoとaのステージのそれよりも小さい場合(右図)、あるいは表現型が適応度と無関係な場合に起こりうる。 b 44の実験的進化的適応のそれぞれにおいて発現PC > TCを示した遺伝子の割合。 d cの50の適応について、代謝ネットワーク解析により予測されるステージpでの適応度とステージaでの適応度、ステージoでの適応度に対する相対的な適応度。 e 全フラックス平均PCは、cの50の適応のうち、ステージpでの相対的なフィットネス(fp)と負の相関がある。 f 全てのフラックスにおける平均的なTCは、cの50の適応のうち、ステージaにおける相対的なフィットネス(fa)と正の相関がある

上記の説明の経験的証拠を探すために、実験的進化の44ケースごとに、発現変化がPC > TCを満たす遺伝子の割合(図3b)を計算した。 その平均値と中央値はそれぞれ0.51と0.48であった。 さらに、PC > TCを満たす遺伝子をすべて取り除くと、回帰の過剰はなくなり(補足図5a)、我々の説明が十分であることがわかる。 同様に、大腸菌の代謝ネットワークがグルコース環境から50の新しい環境へ適応する際に、PC > TCを示す代謝反応の割合を計算した(図3c)。 平均値と中央値はそれぞれ0.85と0.93であった。 同様に、PC > TCを示す反応を取り除いた後でも、50の適応において、強化よりも復帰が多いという一般的な傾向は見られなかった(補足図5b)。 これらのトランスクリプトームとフラクソームの結果から、PC > TCが無視できない割合で発生することで、強化に対して復帰が過剰であることが説明できる。 その理由として考えられるのは、急激な環境変化に対してPCは生物を生存させるが、元の環境でも新しい環境に適応した後でもフィットネスが大幅に低下することである。 したがって、生物の全体的な生理状態は、元の環境での適応段階と新しい環境での適応段階ではよく似ているが、環境変化直後の適応度の低い可塑的な段階では大きく異なっている可能性がある。 このことは、形質値が生物の適応度や生理学の原因であるか結果であるかにかかわらず、多くの形質でPCがTCを上回ることを説明できるかもしれない。

我々は代謝ネットワーク解析により上記のモデルの強い証拠を見出した。 まず、予測されるバイオマス生産率を体力の代理として、50の新しい環境に適応するごとに、大腸菌の可塑段階での体力(fp)と新しい環境に適応した後の体力(fa)を、元のグルコース環境での体力と比較して比較検討した。 すべての場合において、fp < 1であり(図3d)、環境シフトが遺伝的適応の前に体力低下を引き起こすことが確認された。 faは通常1に近いが、いくつかの新しい環境ではかなり>1であることがわかった(Fig. 3d)。 対数10スケールで見ると、50適応のうち43適応でfaよりもfpの方が1からの差が大きい(P = 1.0 × 10-7、片側二項検定)。 第二に、我々のモデルはフラックスの変化と体力の変化の間に関連があることを仮定している22。 グルコース環境からの50の適応において、fpと平均PCの間には強い負の相関があった(Spearmanのρ = -0.98, P < 10-300; 図3e)。 faと平均TCの間には逆の相関が存在する(ρ = 0.57, P = 1.1 × 10-5; Fig.3f)。 これらの解析を総合すると、適応の際に強化よりも表現型回帰の頻度が高い主な理由は、適応度と関連する表現型の観点から、ステージpの生物はステージoの生物と比較すると、ステージaの生物よりも違いが大きいことである。

Phenotypic reversion in random metabolic networks

適応中の遺伝子発現レベルや代謝フラックスのPCやGCはそれぞれ当該種の制御ネットワークや代謝ネットワークによって異なることが明らかにされた。 これらのネットワークは数十億年の進化に起因するため、表現型回帰の優勢は研究対象種の進化史、特にその種とその祖先が過去に選択された環境に起因するのか、それともあらゆる機能システムに内在する特性なのか、疑問が残るところである。 この疑問を解決するために、我々は以前に作成した500の機能的ランダム代謝ネットワークに同じ解析を適用した22。 これらのネットワークは、iAF1260の反応を、Kyoto Encyclopedia of Genes and Genomes38の全代謝反応のユニバースからランダムに選んだ反応と交換することにより構築された。各反応の交換時にグルコース環境においてFBA予測適合度がゼロでない限り39。

500個のランダムネットワークのうち少なくとも20個のネットワークで適応可能なのは、(グルコース環境からの)iAF1260が新しく適応できる環境だけであった。 そこで、グルコース環境を元の環境とし、この20の新しい環境それぞれに対するランダムネットワークの適応度を分析した。 それぞれの新しい環境に対して、この環境に適応できる全てのランダムネットワークのCRVの中央値は概ね0.1程度であり(図4aの箱ひげ図)、CRV中央値の中央値は0.11であることがわかりました。 一方、新しい環境に対するランダムネットワーク全体のCRIの中央値は、一般に0.01以下であり(図4bの箱ひげ図)、CRIの中央値は0.0033であった。 新しい環境に対するランダムネットワーク全体のCRI/CRV比の中央値は、一般に0.05以下であり(図4cのボックスプロット)、中央値のCRI/CRVは0.0033である。 明らかに、フラックスリバーシションの優位性は機能的なランダムネットワークにおいても明らかであり、この特性は特定の進化史の産物というよりも、あらゆる機能的な代謝ネットワークに内在するものであることが示唆される。 実際、実際の生物におけるこの性質のメカニズム的説明(図3)は、今回調べたランダムな代謝ネットワークでも成立している。 具体的には、PC > TCを示す反応の割合はかなり高く(図4d)、fpはほとんど1より小さい(図4e)。 さらに、|log10fp|-|log10fa|が大きく正であるため、fpはlog10スケールでfaよりも一般的に1からの差が大きい(図4f)。 グルコース環境から調査した20の新しい環境へのランダムネットワークの適応において、フラックスリバーションを示す反応の割合(CRV)(a)、フラックス強化を示す反応の割合(CRI)(b)、CRI/CRV比(c)、PC > TCを示す反応の割合(d)、fp(e)、 |log10fp| – |log10fa| (f) を算出した。 各環境について、異なるランダムネットワークから推定した値を箱型プロットで示し、シンボルは図2dの凡例で説明する。 大腸菌iAF1260ネットワークに対応する値は、赤い菱形

で示されている。しかし、興味深いことに、20の新しい環境のうち19において、大腸菌代謝ネットワークのCRVはランダムネットワークのCRV中央値を上回っている(図4a)。 CRIについても同様であるが、あまり顕著な傾向は見られない(図4b)。 20の新しい環境のうち16の環境において、大腸菌のCRI/CRVはランダムネットワークのCRI/CRV中央値より小さい(P = 0.012、両側二項検定;図4c)。 したがって、大腸菌の代謝ネットワークとランダムネットワークの両方がフラックスリバーシションの優勢を示すものの、この現象は大腸菌でより顕著であることがわかった。 この違いは、前項のモデルによって少なくとも定性的に説明することができます。 具体的には、20の新しい環境のうち15において、PC > TCの大腸菌反応の割合は、ランダムネットワークにおける対応する中央値を超えていた(P = 0.021, 片側二項検定; Fig.4d)。 20の新しい環境すべてにおいて、大腸菌のfpはランダムネットワークのfp中央値より低い(P = 9.5 × 10-7, 片側二項検定;Fig.4e)。 また、20の新しい環境のうち19の環境では、大腸菌の|log10 fp| -|log10 fa|はランダムネットワークの中央値より大きい(P = 2.0 × 10-5、片側二項検定;Fig.4f)。 しかし、なぜ大腸菌のfpはランダムネットワークよりも低いのだろうか? 大腸菌の代謝ネットワークの構成と構造は、グルコース環境および関連する環境での増殖に進化的に最適化されているのに対し、グルコース環境でのみ生存が可能であればよかったランダムネットワークはそうではなかったからである。 その結果、グルコースが新しい環境の炭素源に置き換わったとき、大腸菌の体力は大幅に低下するが、ランダムネットワークの体力は軽微にしか低下しないことがある。 可塑的な段階での絶対的な体力はランダムネットワークよりも大腸菌の方が高いかもしれないが、fpが示す相対的な体力はランダムネットワークよりも大腸菌の方が低くなると予想される。 大腸菌ではランダムネットワークよりもフラックスリバーシ ョンが多いのは、適応解析で使用した元の環境において、ランダムネットワークよりも大腸菌がより強く選択された副産物であると思われる。 しかし、比較研究や進化研究において、p期の表現型は一般的にアクセスできない。 そのため、他の形質もp期からa期に適応的に変化している可能性があるにもかかわらず、o期とa期で表現型が異なる形質に注目するのが一般的である。 そこで、上記で分析した形質のうち、TC > 0.2Loの条件を満たすものに着目し、比較・進化生物学者が最も注目している形質が上記の結果に当てはまるかどうか検討した。 実験的に進化した44例のうち、33例はCRV > CRI (P = 0.0013, 両側二項検定)を示し、そのうち30例はCRVがCRIを有意に上回った(公称P < 0.05, 両側二項検定;図5a). グルコース環境に由来する大腸菌代謝ネットワークの環境適応50件のうち、フラックス復帰と強化が同数であったのは3件であった。 残りの47例では、22例が強化より復帰が多く、25例が逆であった(P = 0.77, 両側二項検定;Fig.5b)。 CRIがCRVと有意に異なる場合,CRV < CRIを示したのは15例で,その逆は11例であった(P = 0.70, 両側2項検定;Fig.5b). したがって、TC > 0.2Loの形質であっても、復帰よりも強化が有意に多いという証拠はない。 なお、上記の代謝解析では、1回の適応で平均139の反応がTC > 0.2Loを満たした。 フィットネスの最大化で観察されるフラックス変化はすべて必要であり、したがって定義上有益であるため、単純な炭素源の変化に対する適応でさえ、明らかに少数の反応よりもはるかに多くの反応を伴う。

Fig. 5

変化全体があらかじめ設定したカットオフを超えた場合でも適応において強化形質の割合(CRI)は復帰形質の割合(CRV)より大きくはない。 La – Lo| > 0.2Lo, |Lp – Lo| > 0.2Lo, |La – Lp| > 0.2Lo を満たす形質を、遺伝的変化と可塑的変化が同方向か逆方向かによって強化形質と反転形質に分類。 a 実験進化で強化的発現変化と反転的発現変化のそれぞれの遺伝子を持つ割合。 生物だけでなく、生物が適応した新しい環境も示している。 b 大腸菌のグルコース環境から50の新しい環境への適応において、それぞれ強化および反転するフラックス変化が予測される反応の割合。 両パネルとも、強化反応と逆転反応の割合が等しいかどうかは、両側二項検定で検定している。 CRV > CRIのとき、P値は次のように表示される。 *P < 0.05; **P < 10-10; ***P < 10-100; CRV < CRIの場合、P-valueは以下のように示される: oP < 0.05; ooP < 10-10; oooP < 10-100