A comparative genomics study of 23 Aspergillus species from section Flavi

Assessment of 19 newly sequenced section Flavi genomes

今回、アスペルギルス節フラビ(図1b)から19種のホールゲノム配列について発表した。 このうち2種(A. nomiusとA. arachidicola18,19)は、本研究と並行して他のグループからも発表されている。 これらの19種を、これまでに配列決定されたフラビ節(A. oryzae, A. flavus, A. sojae, A. luteovirescens3,12,13,14 )、および他のアスペルギルス属6種とアウトグループとして Neurospora crassa と Penicillium digitatum を合わせた参考8種(図1a、b)と比較している(4292>

Fig. 3624>

figure1

a 200のモノコア遺伝子(それぞれの種に1つのホモログ)に基づいてRAxML、MUSCLE、Gblocksを用いて構築した系統樹です。 赤い星印は、異なる遺伝子コール方法98,99,100に起因すると思われる不確実な葉を示し、矢印はA. sojaeが系統樹のどこに配置されるべきかを示している。 b 色はFlaviセクションで見つかったクレードを示し、Xは本研究で配列決定された種を示す。 A. oryzaeやA. fumigatusなどの先に配列決定されたゲノムは、光学マッピングと遺伝地図を用いてアセンブルされた。 c 主要なゲノム番号と配列品質パラメータを示す7つのバブルプロット。 4292>

最初の基礎試験として、ゲノムサイズ、GC含量、予測タンパク質数に基づいて、ゲノムアセンブリの品質を比較した(図1c)。 この結果、18ゲノム中13ゲノムが500スカフォールド以下にアセンブルされ、妥当なドラフトゲノムの品質を示した(図1c、5列目)。 このうち、A. coremiiformisは2728個のスキャフォールドを持ち、遺伝子コンテンツの品質が心配されました。 しかし、BUSCO20(Benchmarking Universal Single-Copy Orthologs)の99.78%をカバーし、96%のESTクラスタがゲノムにマップされていることが確認された。 また、expressed sequence tag (EST)クラスターは96%がゲノムにマッピング可能であり、足場が多いにもかかわらず、ゲノムアノテーションは遺伝子量の比較に十分な品質であると結論した。

Multigene phylogeny shows complex heritage of A. oryzae

次に、200の遺伝子から得られた系統樹をもとに、フラビ節の進化関係を調べた(図1a)。 樹内の枝分かれの支持率は高い(ほとんどの枝で100ブートストラップ中100ブートストラップ)。 この木から、Flavi節は単系統のグループであることが確認された。 図1aのクレードはβチューブリン遺伝子に基づく既報の系統樹10,11,22に対応し、セクション間の距離は既報23に対応する。

この樹の潜在的な誤りは、A. sojaeはA. parasiticusの家畜化版として認識されているので、A. flavusと最も近い位置に見つかっている点である。 この分岐は,樹木の中で最も低いブートストラップ値を持っている。 A. sojaeの遺伝子予測は、A. flavusとA. oryzaeのゲノムアノテーション24,25に基づいているため、予測遺伝子に偏りが生じ、この偏りがツリーに反映されていると思われる。 そこで、遺伝子アノテーションに依存しない別の方法(CVTree26,27)を用いて系統樹を作成し、検証を行った。 その結果、全ゲノム配列とプロテオーム配列を用いた場合、A. sojaeはA. parasiticusに最も近いことが明らかになった(補足図1、補足図2)。 4292>

さらに、A. flavusの家畜化として認識されているA. oryzaeは、植物系統樹では直接隣り合わせにはなっていない10,28,29,30。 しかし、A. oryzaeはA. minisclerotigenesやA. aflatoxiformansの祖先の子孫であることが以前から示唆されている31。 系統樹(図1a、zoom)はこの提案を支持し、A. minisclerotigenesとA. aflatoxiformansはA. flavusよりもA. oryzaeの近縁種であることを示している。

共有タンパク質の解析により高い遺伝的多様性を確認

フラビ節の全種、クレード、および個々の種の特徴に共通するコアな特徴を調べるため、種内および種間で共有する相同遺伝子の解析を行い16、これらを相同タンパク質ファミリーに分類した(図2)。 これにより、(1)比較したすべての種で少なくとも1つのメンバーを持つコアゲノムタンパク質ファミリーを同定することができた。 これは必須タンパク質を網羅していると予想される。 (2)セクション特異的、クレード特異的遺伝子-クレード/セクションの全メンバーにホモログがあり、他のどの種にもない遺伝子。 (3) 種特異的遺伝子-比較対象の他の種にホモログがない遺伝子。

図2:コア特異的、セクション特異的、クレード特異的・種特異的遺伝子
 図2

a 29種の麹菌間の系統的関係を表したデンドログラムである。 ノード内の黒いボックスは、そのノードから分岐した種に共通する相同タンパク質ファミリーを表す。 b 各生物種の総タンパク質数(緑)、コアタンパク質数(青)、種特異的タンパク質数(オレンジ)を棒グラフで表したもの。 濃い網掛けは、InterPro32に基づく機能アノテーションを少なくとも1つ持つタンパク質の数を示す。

このデータセット中の31種すべてのコアゲノムは2082のタンパク質ファミリーになる。 Aspergillus 29種では3853、Flavi節だけでは4903のタンパク質ファミリーを構成する。 4292>

Clade-specific protein familiesを調べると、ごくわずか(27-54)しか見つからず(図2a)、以前に調べたセクションNigriと比べると少ない16。 Nigri区とFlavi区はほぼ等しく種数が多いので、Flavi区の種がより明瞭であることを示しているのかもしれない。 このことは、種特異的な遺伝子数が非常に多いこと(166-2181)からも支持される。ここで、166(A. sojae)は、このゲノムの遺伝子呼び出しがA. flavusとA. oryzaeゲノムを基に行われているため、人工的に低い数字になっていると考えられる。

種特異的遺伝子は調節因子やP450をコードしていることが多い

我々は種特異的遺伝子が食品発酵や植物・ヒト病原性など既知のフラビ機能に関連するかどうかを確認したいと考えた。 そのために、InterPro、GO、KOGアノテーション32,33,34,35を用いて、種特異的遺伝子の予測される機能を検討した。 機能アノテーションを持つ割合は低く、InterPro、GO、KOGでそれぞれ20、12、9%であり、合計21%にアノテーションがあった(補足図3-5)。

ここでは、より多くの遺伝子をカバーしているInterProに注目する。InterProで最も多い機能は、転写因子、プロテインキナーゼ、トランスポーター、P450であり(補足図3)、これらも有意に多く存在することがわかった。 これらの形質は食品発酵や病原性に直接関連づけることはできないが、制御は適応に関与し、P450は基質分解と生物活性化合物の生産の両方に役割を果たし、これらは真菌の病原性に関連している。

Species genes are over-represented in sub-telomeric regions

A. nidulans, A. oryzae, A. fumigatusにおいてサブテロメア配列は広範囲に再配列された領域であることが示された21。 これは、哺乳類、線虫、酵母でも見られる36。 以前の研究37,38では、サブテロメア領域はユニークな遺伝子、分岐した遺伝子、欠損した遺伝子に偏りがあることが示されている。 また、別の研究では、A. nidulansとA. fumigatusにおいて二次代謝産物遺伝子クラスター(SMGC)がサブテロメア領域に濃縮されていることが示されている21。

そこで、テロメアからテロメアまでの領域を用いて、種特異的遺伝子、二次代謝産物クラスター、コアゲノムの密度や位置について調査し、A. 4292>

Fig. 3: A. oryzae genomeにおける種特異的遺伝子と二次代謝産物遺伝子の位置
figure3

灰色の棒は、A. oryzaeゲノムを表している。 染色体の上には種特異的遺伝子(ターコイズ)と二次代謝産物遺伝子(オレンジ)がゲノムにマッピングされており、各線は遺伝子を表している。 曲線は30kbp以内の遺伝子の総数から5kb刻みで算出した密度の割合を示している。 ゲノム以下は、コア遺伝子を灰色の点でマッピングし、総数の密度を黒のグラフで示す(30kbpをウィンドウとする)。

目視とフィッシャーの正確検定の両方で、種特異的(p値=7.266e-07)、SMGC(p-value < 2.2e-16)は、コア遺伝子が染色体末端から100kbp離れたサブテロメア領域に向かって濃縮されているが、サブテロメア領域にはあまり見あたらないことが確認された。 このように、種特異的な遺伝子はランダムに分布していないことから、単なるアノテーションや遺伝子モデリングの誤りである可能性が高く、正当な遺伝子であることが示唆された。 種特異的遺伝子の分布は、新しい遺伝子が他の場所よりもテロメア下領域にうまく組み込まれる頻度が高いことを示唆している。

Synteny analysis reveal the islands of highly variable gene content

Syntenic and non-syntenic regions are another factor to consider when analyzing genome location.これはシンテニア領域が、他の領域に対して淘汰された結果か、あるいは両方かはデータからは明らかではない。 A. oryzaeのゲノムは遠縁の麹菌と比較して、シンテニック領域と非シンテニック領域がモザイク状に存在することが示されている1,2。 我々は、A. oryzae RIB40をリファレンスとして、FlaviセクションからA. nidulansおよびA. fumigatusへのシンテニーを調べた(表1)。 この解析は、A. oryzaeがA. flavusよりもA. aflatoxiformansに近いという我々の以前の発見を支持するものである。

Table 1 A. oryzaeと比較して保存されたシンテニーのあるゲノの割合

共有シンテニーを補足図6に概要を示している。 一般に、A. nidulans, A. fumigatus, A. oryzaeの比較で以前見られたように、テロメア末端に向かってシンテニー領域が少なくなっている1,2。 さらに、1番と2番はシンテニーの保存度が非常に高く、6番と8番はシンテニーの保存度がかなり低いことがわかった。

4番、6番、8番のサブテロメア以外の領域には非シンテニー遺伝子が密に存在していることがわかった。 これらは遺伝子水平移動(HGT)、遺伝子シャフリング、またはde novo遺伝子形成によって引き起こされる可能性がある。 我々は、BLASTpを用いてNCBI nonredundant databaseのベストヒットを調べ、HGTの有無を検討した。 最近のHGTは、それが移されたであろう別のグループの種と高い配列同一性を持ち、近縁種には見られないことが予想される39。 これらの島々には、最近のHGTの兆候を示すものはなかった。 さらに、非同系統ブロックに含まれる80の遺伝子のうち、A. oryzaeに特異的なものは23のみであった。 4292>

このように、非常に保存された染色体と、高度に再配列された非シンテニックなブロックが観察されるという事実は、ある領域では安定性を求める進化的圧力がかかり、他の領域では頻繁に遺伝子シャッフリングや再配列が起こる、つまり、A. oryzae特有の遺伝子が出現している可能性があることを示している。

Section Flaviは糖質活性酵素が豊富

Carbohydrate-Active enZymes (CAZymes) は、種がどの炭素源を分解して利用できるかに不可欠である。 フラビ(Flavi)科では、主にA. oryzae1,2,40 について、またA. flavus41,42,43,44,45 とA. このグループの他の種については、付随的な研究しか行われておらず48,49,50,51,52,53,54、それぞれ特定のCAZyme活性やタンパク質の生産または特性について述べられていることが多い

CAZyデータベースを使って、セクションのゲノム中のCAZyme含有量を予測した(図4)。 フラビ23種について、合計13,759個のCAZymが予測された(平均598個/種)。 4292>

Fig. 4: Flavi セクションの糖質活性酵素 (CAZymes).
figure4

a 補助活性、糖質結合分子、糖質エステラーゼ、グリコシドヒドロラーゼ、グリコシルトランスフェラーゼ、多糖類リアーゼの6種の酵素活性に分布する各種のCAZymesの総数を示したもの。 b フラビ(水色)、タマリ(黄色)、ノミウス(紺色)、アリアセウス(水色)、フラビセクションの残り(オレンジ)、他のアスペルギルス(水色)、非アスペルギルス(グレー)間でのCAZymeファミリー含有量と存在量の多様性を示す箱ひげ図。 各CAZymeクラスについて,CAZymの総数(上段)とユニークなCAZymeファミリーの数(下段)が表示されている。 ボックスプロットでは、中央線は中央値、ボックスの上下限は第3四分位と第1四分位を表し、ひげは四分位間の1.5倍まで伸びる。

この解析から、Flavi節(図4b)のクラス間には明確な違いがあり、節内の遺伝子量に再び変動が見られることが明らかであった。

変動するCAZyme含量は植物バイオマス分解能力を反映していない

セクションFlavi全体での実際の炭素利用能力を評価するために、植物バイオマス関連の35基質で31種(29 Aspergilli、うちセクションFlaviの23種)の成長プロファイリングを行い(図5、補足データ2)、植物バイオマス分解に関するCAZyme遺伝子量予測と比較しました(補足データ2)。 以前の研究では、遠縁のアスペルギルス間の成長のばらつきはCAZyme遺伝子含量の違いに関連していると考えられたが55、Aspergillus section Nigri16の近縁種ではそうではなかった。

Fig. 5: Section Flaviにおける糖質活性酵素を図の系統図に従って分類した。 1.
figure5

a Flavi23種と追加8種の35種類の培地での成長プロファイルを表したヒートマップ。 b Aspergillus section Flaviと他のいくつかの菌種のゲノムにおける植物バイオマス分解に関するCAZymeセットを比較したもの。 4292>

グルコースはすべての単糖の中で最もよく増殖したため、増殖の内部基準として使用した(補足図7)。 他の炭素源での生育はd-グルコースでの生育と比較され、この相対的な差が種間で比較された。 単糖での生育はFlavi節の種間でほぼ同様であった(図5、補足図7、補足データ1)。

植物バイオマス分解に関連するCAZymeセットは、A. coremiiformisが強く遺伝子セットを減少させているのを除き、Flavi節で全体的に非常に似ていた(図5)。 これは主にグリコシド加水分解酵素ファミリーの減少によるものであるが、ペクチン、キシラン、キシログルカンの分解に関連するファミリーも多く含まれている。 意外なことに、本種はキシラン上で他の多くの種よりも優れた相対的成長を示したが、他の多糖類上での成長は主にセクションFlaviと同様であった。 したがって、遺伝子セットの減少によって植物バイオマスを分解する能力が低下したわけではない。 このことは、同じくCAZyme遺伝子セットが減少しているが、対応する酵素を非常に高いレベルで生産しているT. reeseiの場合と同様であると考えられる56。 しかし、A. coremiiformisではこのような兆候は見られないが、そのCAZyme含有量は植物細胞壁分解酵素の喪失とその後の大規模なHGT獲得によって形成されたため57、このアプローチの起源は非常に異なると思われる

加水分解の違いはFlaviセクション内のクレード特異的である(補足資料2)。 A. togoensisクレードではキシラン分解遺伝子とキシログルカン分解遺伝子のセットが減少しているが、これは増殖には反映されていない。 一方、A. flavus, A. tamarii, A. nomiusではGH115(α-グルクロニダーゼ)遺伝子が拡大し(これらのクレードのいくつかの種からキシラン分解酵素または活性が報告されている49, 50, 51, 53, 58, 59, 60, 61, 62)、GH62(アラビノキシラン・アラビノフラノヒドラーゼ)はクレード A. leporisで拡大し、クレード A. leporis と A. Nomiusではキシラン分解酵素が拡大し、GH62はクラード A. tamarii, A. nomiusで拡大し、GH62はクラード A. tamarii, A. nomiusで拡大し(これらのクレードから複数のキシラニル分解酵素が報告されている)、GH115はクラードA. avenaceusはCE15(グルクロノイルエステラーゼ)を持つ唯一のクレードであり、これらはFlavi節以外のAspergillus属にも見られた。

ガラクトマンナン分解能力はFlavi節でほぼ完全に保存されていたが、興味深いことにガラクトマンナンが主体のグアーガムの成長は種間で変動していた。 同様に、A. togoensisとA. avenaceusのアミロ分解能力の低下は、デンプンやマルトースでの成長の低下にはつながらなかった。

ペクチン分解遺伝子数には変異が見られた。 最も顕著な違いは,Flavi節のほとんどの種からPL11(ラムノガラクツロナンリアーゼ)遺伝子が欠落し,A. flavusとA. tamarii節でGH78(アルファラムノシダーゼ)が拡大したことである. しかし,これらの違いや他のファミリーにおける小さな違いは,ペクチン上での生育に大きな変化をもたらさなかった。

より明らかな違いは,セロビオース,ラクトース,リグニン上での生育に存在した。 ほとんどの種でβ-グルコシダーゼをコードする遺伝子の数が同程度であるにもかかわらず、セロビオースでの生育が悪かった(補足データ2)。 同様に、A. arachidicolaと、それより少ない程度のA. albertensisだけが、ラクトースでよく成長したが、これらの種のβ-ガラクトシダーゼの数は他の種と同様であった。 最も興味深かったのは,A. albertensisがd-グルコースと同様にリグニンでも生育したことであり,バイオ燃料生産への応用の可能性を示唆している。

以上のことから,フラビ節におけるCAZyme能力はコピー数に多少の変動はあるがほぼ保存されているが,ゲノムの潜在能力や変動は必ずしも生育に反映されてはいないことが分かった. したがって、以前に示唆されたように55、観察された違いは主に調節レベルであると考えられる。

CAZyme family GH28はclade A. flavus

我々は、食品発酵と最終発酵製品の品質に重要であることから、GH28 CAZymesに特に関心を持った63。 FlaviセクションのGH28の全メンバーの系統樹を作成した(補足図8)。 4292>

系統樹の中には、異なるグループが存在する。 5つのグループは23種全てからメンバーを得ており、9つのグループは1〜4種(通常A. coremiiformisとA. caelatus)が欠けており、2つのグループはA. flavus, A. tamarii, A. nomiusクレードに特異的である。 4292>

一般に,A. flavusクレードの種はGH28のメンバー数が多い。 A. sojaeはGH28の数が多いことが知られており、ここでも24名であるが、A. sergiiはさらに多く25名である。

Analysis of secondary metabolism

Aspergillus 属は多数のSMを生産することが知られており、予測されるSMGCの数はさらに多い。 予測されるSMGCの大半は未解明であるため、多様な新規生理活性化合物を生産する可能性を持っている。 我々は、セクションFlaviにおけるSM生産の多様性と可能性を、クラスター数という定量的な観点と、これらのクラスターが潜在的に生産しうる化合物という定性的な観点の両方から検討した。

Secondary metabolism in section Flavi is diverse and prolific

SM生産の可能性を定量的に評価するために、N. crassaとA. sojaeを除くすべての種についてSMURF類似予測ツール64を用いてSMGCを予測した(これらは他の方法で配列決定されていて遺伝子呼び出し方法が異なるから)(図6c)。 Aspergillus 28種では、合計1972個のSMGCが予測され、Section Flaviゲノムでは、合計1606個のSMGC(73/種)である。 これは、非常に多産なペニシリウム属65と比較して、1種あたり15以上余分である。

figure6: 既知の化合物と予測される二次代謝産物バックボーン遺伝子の種ごとの重複排除
figure6

a 種間の系統関係を表すデンドログラムである。 ノード内の黒いボックスは、そのノードから分岐する種の間で共有される二次代謝産物遺伝子クラスター(SMGC)ファミリーを表す。 黒いボックスがない場合は共有するクラスターはゼロである。 先端のグレーのボックスは、フラビセクションの1つの種にのみ見られるユニークなSMGCファミリーの数を示す。 b 各種について、MIBiGデータベース66から既知のクラスターと結合したSMGCファミリーの有無を示すマトリクス。 アフラトキシンのクラスター・ファミリーの概要は補足図11に記載。 c 各生物種の予測二次代謝産物遺伝子を骨格酵素で分けたもの。 DMAT:ジメチルアリルトランスフェラーゼ(プレニルトランスフェラーゼ)、HYBRID:NRPSとPKSのバックボーンのドメインを含むバックボーン遺伝子、NRPS:非リボソームペプチド合成酵素、NRPS-like: 少なくとも2つのNRPS特異的ドメインと別のドメインを含む、または1つのNRPS AドメインとNAD結合4ドメインまたは短鎖デヒドロゲナーゼとの組み合わせ、PKS:ポリケチド合成酵素、PKS様:少なくとも2つのPKS特異的ドメインと別のドメインを含む、ポリケチド合成酵素様、TC:テルペン環状酵素。

SMGCがどれだけユニークなのかを調べたいと思い、SMGCのファミリーを構築した(Supplement Data 3)。 データセット全体では、477のSMGCファミリー、セクションFlaviでは308のSMGCファミリーに分類できた。 このうち、150のSMGCクラスタはFlaviセクションの1つの種にしか見られず(図6a)、各種に固有のクラスタが多いことがわかる(6.8 unique SMGC/種)。 Aspergillus section Nigriと比較すると、本研究の種ごとのクラスター数はやや少ないが、各SMGCファミリーのメンバー数も少なく、section Nigriと比較してsection Flaviでは二次代謝の多様性が大きいことが示された。

Dereplicating secondary metabolism predicts toxin producers

SM生産の可能性を定性的に評価するために、予測されたクラスタと(MIBiGデータベース66から)検証された特徴的なクラスタとをguilt-by-association方式で関連付ける「遺伝的dereplication」パイプラインを使用した67。 これに基づいて、20のクラスターファミリーが複合ファミリーに結合された(図6b)。 いくつかのクラスター・ファミリーは、すべてまたはほぼすべてのフラビゲノムで見つかり、例えば、ナフトピロン68、ニデュラニンA69、アザニゲロン70、4,4′-ピペラジン-2,5-ジイルジメチル-ビス-フェノール、アフラバリン71/エンドクロシン72,73クラスターに類似するものであった。 ほとんどのファミリーは概ね系統群に沿った分布をしており、損失に基づく分布パターンを示唆しているが、asperfuranone74、pseurotin A75、fumagillin76クラスターに類似するSMGCファミリーのように系統群に沿わないものもあった。 さらに、アフラトキシンやアスピロクロリンなどの既知の毒素の潜在的な生産者が同定された(図 6b)。

Combination of data and analysis links a compound to a cluster

既知の SMGC クラスターから拡張して、生産化合物と予測クラスターの存在/不在パターンに基づく化合物とクラスターの関連性に関心があった。 そこで、少なくとも5つの生物種で見つかったすべてのクラスター・ファミリーに、MIBiG dereplicationから予測された化合物ファミリーと、文献調査から手動でキュレーションした化合物ファミリーを加えてヒートマップを作成した(補足図9)。 これに加えて、フラビ種のSM生産量を測定した(補足資料4)。

特に興味深かったのはミヤカミド類である。 もともとA. flavus分離株から単離され、抗生物質としての性質を持つことが示されている77が、生合成遺伝子群は不明であった。 我々の化学分析では、A. sojae, A. nomius, A. parasiticus, A. novoparasiticus, A. transmontanensisで産生されることが確認された。

化学構造からレトロ生合成を行い、生合成遺伝子クラスターには2-3個のアデニル化ドメインを持つnonribosomal peptide synthetase(NRPS)、N-methyltransferase、アセチルトランスフェラーゼ、潜在的にはdecarboxylase/dehydrogenaseが含まれると予想した(補足図10A)。 全てのミヤカミド生産生物種で、NRPS骨格に2-3個のアデニル化ドメインとメチル基転移酵素ドメインを持つメンバーからなるクラスターファミリーを検索したところ、たった1つのクラスターファミリーだけが条件を満たした。 そのクラスターファミリーは、メチルトランスフェラーゼドメインを持つNRPSバックボーンを持ち、ほとんどの種で3つのAドメインを持ち、A. novoparasiticusでは2つのAドメインを持つものであった。 Aドメインが2つしかないと予測されたのは、遺伝子の開始点以前で配列の類似性が保存されているため、アノテーションエラーによる可能性が高い(補足図10B)。 また、予測されたクラスターの大きさは1-9遺伝子であり、その差はSMGCの予測誤差に起因すると考えられる(Synteny plot in Supplementary Fig.) シンテニープロットから、NRPSと機能不明の2つの小さな遺伝子が広く保存されていることがわかった。

アフラトキシン生合成遺伝子群は高度に保存されている

フラビ節の二次代謝産物で最も知られているのは、発ガン性の高いアフラトキシンであろう。 アフラトキシンは多くのセクションFlaviの種(A. arachidicola, A. luteovirescens, A. flavus, A. minisclerotigenes, A. nomius, A. aflatoxiformans, A. pseudocaelatus, A. pseudonomius, A. pseudotamarii, and some A. oryzae isolatedates)によって生産されていることがわかっている4,10).

デレプリケーション解析(図6b)により、ステリグマトシスチンやアフラトキシンの生成に関与すると予測されるSMGCファミリーが、A. flavus, A. nomius, A. tamariiを除く全ての種で同定された。 SMGCファミリーのシンテニープロット(補足図11)より、このクラスターは再配置がなく、アフラトキシン遺伝子のアラインメント同一性が高く、極めてよく保存されていることが示された。 A. caelatusのみaflB, aflC, aflD遺伝子のみの切断型があり、A. tamariiはクラスターが完全に失われているようである。 興味深いことに、予測されたクラスターのほとんどに、アフラトキシン生合成の最終段階を担うaflPとaflQの遺伝子が含まれていなかった。 aflPについてゲノムを検索したところ(補足図12)、すべてのゲノムに存在したが、開始位置が異なり、タンパク質の途中に余分な配列があることがわかった。 RNA-seqデータはこれらのモデルを支持し(補足図13)、A. flavusの遺伝子モデルの誤りを示唆するものである。 同様に、aflQ遺伝子は他のすべての種で見つかっているが、予測されたクラスターから5-10遺伝子離れている。 このように、詳細な解析により、これらの種はすべてアフラトキシン生合成に必要な遺伝子を有していることが示された