- Assessment of 19 newly sequenced section Flavi genomes
- A Flavi szekció fajainak genomja általában kiterjedt
- A multigén-filogenia az A. oryzae összetett örökségét mutatja
- A közös fehérjék elemzése megerősíti a nagy genetikai diverzitást
- A fajspecifikus gének gyakran szabályozást és P450-eket kódolnak
- A fajok génjei felülreprezentáltak a szub-telomerikus régiókban
- A szindrómavizsgálat nagymértékben változó géntartalmú szigeteket tár fel
- A Flavi szekció a szénhidrát-aktív enzimek gazdag forrása
- A változó CAZyme-tartalom nem tükrözi a növényi biomassza lebontásának képességét
- A GH28 CAZyme család felduzzadt az A. flavus kládban
- A másodlagos anyagcsere elemzése
- A másodlagos anyagcsere a Flavi szekcióban változatos és termékeny
- A másodlagos anyagcsere dereplikációja toxintermelőket jelez előre
- Az adatok és az elemzés kombinációja összekapcsol egy vegyületet egy klaszterrel
- Az aflatoxin bioszintetikus génklaszter erősen konzervált
Assessment of 19 newly sequenced section Flavi genomes
A jelen tanulmányban az Aspergillus Flavi szekció 19 fajának teljes genom szekvenciáit mutatjuk be (1b ábra). Ezek közül kettőt (A. nomius és A. arachidicola18,19) más csoportok is publikáltak ezzel a munkával párhuzamosan. Ezt a 19-et összehasonlítjuk a Flavi szekció korábban szekvenált fajaival (A. oryzae, A. flavus, A. sojae és A. luteovirescens3,12,13,14), valamint nyolc referenciafajjal: hat faj az Aspergillus nemzetség többi tagjából, valamint a Neurospora crassa és a Penicillium digitatum mint külső csoportok (1a, b ábra).
Első alapvizsgálatként a genom-összeállítások minőségét a genom mérete, GC-tartalma és a prediktált fehérjék száma alapján hasonlítottuk össze (1c. ábra). Ez megfelelő minőségű genomtervezetet mutatott, a 18 genomból 13-at kevesebb mint 500 scaffolddal szereltek össze (1c. ábra, 5. oszlop). Riadalmat keltett az A. coremiiformis 2728 scaffolddal, ami miatt aggódtunk a géntartalom minősége miatt. A genom azonban a Benchmarking Universal Single-Copy Orthologs (BUSCO20) 99,78%-át lefedi, és az expresszált szekvencia tag (EST) klaszterek 96%-a leképezhető a genomra. Ebből arra következtetünk, hogy a genom annotációja a nagyszámú scaffold ellenére elég jó minőségű a géntartalom összehasonlításához.
A Flavi szekció fajainak genomja általában kiterjedt
Az Aspergillus Flavi szekció genomjának mérete általában nagy más reprezentatív Aspergillusokhoz képest (átlagosan 37,96 Mbp vs. 31,7 Mbp (1c. ábra)), ahogy azt korábban az A. oryzae21 esetében is jelentették. Egy jelentős kivétel az A. coremiiformis, amely kevesebb génnel és jelentősen kisebb genommal rendelkezik, ami egyedivé teszi a szekcióban.
A multigén-filogenia az A. oryzae összetett örökségét mutatja
A következőkben a Flavi szekció evolúciós kapcsolatait vizsgáltuk a 200 génből származtatott filogenia alapján (1a. ábra). A fán belüli elágazások támogatottsága magas (100-ból 100 bootstrap a legtöbb ágban). A fa megerősíti, hogy a Flavi szakasz monofiletikus csoport. Az 1a. ábrán látható kládok megfelelnek a béta-tubulin gén10,11,22 alapján korábban közölt filogenetikai fának, és a szekciók közötti távolságok megfelelnek a korábbi munkáknak23.
A fa egyik lehetséges hibája, hogy az A. sojae az A. flavushoz áll a legközelebb, mivel az A. sojae-t az A. parasiticus háziasított változatának tekintik. Valóban ennek az elágazásnak van a legalacsonyabb bootstrap értéke is a fában. A legvalószínűbb magyarázat az, hogy mivel az A. sojae génjóslások az A. flavus és az A. oryzae genom annotációin24,25 alapulnak, torzítás keletkezik a megjósolt génekben, és ez a torzítás valószínűleg tükröződik a fán. Tesztként a génannotációtól független alternatív módszerekkel (CVTree26,27) is létrehoztunk filogenetikai fákat. Ezek egyértelműen azt mutatják, hogy az A. sojae áll a legközelebb az A. parasiticushoz, mind a teljes genom, mind a proteom szekvenciák felhasználásával (1. kiegészítő ábra és 2. kiegészítő ábra). Ezért úgy gondoljuk, hogy az A. sojae-t az A. parasiticus mellé kell helyezni a filogenetikai fán, ahogy azt az 1a. ábrán a nyíl jelzi.
Az A. flavus10,28,29,30 háziasított változataként felfogott A. oryzae továbbá nem közvetlenül mellette helyezkedik el a fán. Korábban azonban felmerült, hogy az A. oryzae olyan őstől származik, amely az A. minisclerotigenes vagy az A. aflatoxiformans őse volt31. A filogenezis (1a. ábra, zoom) alátámasztja ezt a felvetést, és azt mutatja, hogy az A. minisclerotigenes és az A. aflatoxiformans közelebbi rokonai az A. oryzae-nek, mint az A. flavusnak.
A közös fehérjék elemzése megerősíti a nagy genetikai diverzitást
A Flavi szekció összes faja, kládja, valamint az egyes fajok jellemzői által közösen használt alapvető jellemzők vizsgálata érdekében elvégeztük a fajon belüli és a fajok közötti közös homológ gének elemzését16 , és ezeket homológ fehérjecsaládokba soroltuk (2. ábra). Ez lehetővé tette a következők azonosítását: (1) Azok az alapvető genom-fehérjecsaládok, amelyeknek legalább egy tagja minden összehasonlított fajban megtalálható. Ez várhatóan az esszenciális fehérjéket foglalja magában. (2) Szekcióspecifikus és kládspecifikus gének – olyan gének, amelyeknek homológjuk van egy klád/szakasz minden tagjánál, de más fajnál nem. (3) Fajspecifikus gének – olyan gének, amelyeknek nincs homológjuk egyetlen más összehasonlított fajban sem.
Az ebben az adathalmazban szereplő 31 faj maggenomja 2082 fehérjecsalád. A 29 Aspergillus faj esetében ez a szám 3853, és csak a Flavi szekcióban szereplő fajok esetében 4903 fehérjecsaládot alkot. Így a Flavi szekció fajainak genomjának több mint fele fajonként eltérő.
A kládspecifikus fehérjecsaládokat vizsgálva csak nagyon kevés (27-54) található (2a. ábra), ami a korábban vizsgált Nigri szekcióhoz16 képest kevés. Mivel a Nigri és a Flavi szekciók nagyjából egyformán fajgazdagok, ez arra utalhat, hogy a Flavi szekcióban a fajok jobban elkülönülnek. Ezt támasztja alá az is, hogy a fajspecifikus gének száma igen magas (166-2181), ahol a 166-ot (A. sojae) mesterségesen alacsony számnak tekintjük, ami annak köszönhető, hogy ebben a genomban a génhívás az A. flavus és az A. oryzae genomokon alapul.
A fajspecifikus gének gyakran szabályozást és P450-eket kódolnak
Meg akartuk nézni, hogy a fajspecifikus gének kapcsolatba hozhatók-e ismert Flavi-funkciókkal, például az élelmiszer-fermentációval és a növényi és emberi patogenitással. Ennek érdekében megvizsgáltuk a fajspecifikus gének előre jelzett funkcióit az InterPro, GO és KOG annotációk32,33,34,35 segítségével. A funkcionális annotációval rendelkező gének aránya alacsony volt; 20, 12 és 9% az InterPro, a GO és a KOG esetében; összesen 21%-uk rendelkezett annotációval (3-5. kiegészítő ábra). Ez a nem azonosítható funkciók igen magas – de nem szokatlan – aránya.
Az InterPro-ra koncentrálunk, mivel az több gént fed le: a leggyakoribb InterPro-funkciók közé tartoznak a transzkripciós faktorok, a protein kinázok, a transzporterek és a P450-ek (3. kiegészítő ábra), amelyek szintén jelentősen felülreprezentáltak. Bár ezek a tulajdonságok nem kapcsolhatók közvetlenül az élelmiszer-fermentációhoz és a patogenitáshoz, a szabályozás részt vesz az alkalmazkodásban, és a P450-ek szerepet játszanak mind a szubsztrátlebontásban, mind a bioaktív vegyületek termelésében, amelyek mindegyike releváns a gombák patogenitása szempontjából.
A fajok génjei felülreprezentáltak a szub-telomerikus régiókban
Kimutatták, hogy a szub-telomerikus szekvenciák kiterjedten átrendezett régiók az A. nidulansban, az A. oryzae-ben és az A. fumigatusban21. Ez emlősöknél, fonálférgeknél és élesztőgombáknál is megfigyelhető36. Korábbi tanulmányok37,38 kimutatták, hogy a szubtelomerikus régiókban előszeretettel találhatók egyedi, eltérő vagy hiányzó gének. Egy másik tanulmány kimutatta, hogy az A. nidulansban és az A. fumigatusban21 a szekunder metabolit génklaszterek (SMGC) feldúsulnak a szubtelomerikus régiókban.
Ezért megvizsgáltuk a fajspecifikus gének, a szekunder metabolit klaszterek és a maggenom génsűrűségét és elhelyezkedését a telomér-telomer A. oryzae genomot tekintettük referenciának, hogy felmérjük e gének esetleges felülreprezentáltságát a szubtelomer régiókban (3. ábra).
A vizuális ellenőrzés és a Fisher-féle egzakt teszt is megerősítette, hogy mind a fajspecifikus (p-érték = 7.266e-07) és az SMGC-k (p-érték < 2,2e-16) a szubtelomerikus régiók felé (100 kbp a kromoszóma végektől) gazdagodnak, ahol a maggének ritkábban találhatók a szubtelomerikus régiókban. Az a tény, hogy a fajspecifikus gének nem véletlenszerűen oszlanak el, ellene szól annak, hogy egyszerűen annotációs vagy génmodellezési hibákról van szó, ezért azt jelzi, hogy valóban legitim génekről van szó. A fajspecifikus gének eloszlása arra utal, hogy az új gének gyakrabban épülnek be sikeresen a szubtelomerikus régiókba, mint más helyekre. Hogy ez a szubtelomerikus régióra való szelekció, vagy más régiókkal szembeni kontraszelekció, vagy mindkettő eredménye, az adatokból nem derül ki.
A szindrómavizsgálat nagymértékben változó géntartalmú szigeteket tár fel
A szindrómás és nem szindrómás régiók egy másik tényező, amelyet figyelembe kell venni a genom elhelyezkedésének elemzésekor. Kimutatták, hogy az A. oryzae genomja a távolabbi rokon Aspergilliekhez1,2 képest mozaikos mintázatot mutat szintetikus és nem szintetikus régiókból. A Flavi szekcióban, valamint az A. nidulansban és az A. fumigatusban vizsgáltuk a szindéniát az A. oryzae RIB40-et használva referenciaként (1. táblázat). Ez az elemzés alátámasztja korábbi megállapításunkat, miszerint az A. oryzae közelebbi rokonságban áll az A. aflatoxiformansszal, mint az A. flavusszal.
A közös szüntenikus gének áttekintése a 6. kiegészítő ábrán látható. Általánosságban elmondható, hogy a telomerikus végek felé kevesebb szindéniás régió található, mint ahogyan azt korábban1,2 az A. nidulans, az A. fumigatus és az A. oryzae összehasonlításában láttuk. Megfigyeltük továbbá, hogy az 1. és 2. kromoszómán nagyon magas fokú a konzervált szüntenia, míg a 6. és 8. kromoszómán sokkal alacsonyabb a szüntenia konzerváltsága.
A 4., 6. és 8. kromoszómán a nem szubtelomerikus régiókban nem szüntenikus gének sűrű szigeteit találtuk. Ezeket horizontális géntranszfer (HGT), génkeveredés vagy de novo génképződés okozhatta. A HGT-ket BLASTp segítségével vizsgáltuk az NCBI nem redundáns adatbázisának legjobb találatait. A legújabb HGT-k várhatóan magas szekvenciaazonossággal rendelkeznek egy másik fajcsoporttal, ahonnan átkerültek, és nem találhatók meg a közeli rokon fajokban39. E szigetek egyike sem mutatott jelét a közelmúltbeli HGT-nek. Továbbá a nem szintenikus blokkokban található 80 génből csak 23 volt A. oryzae-specifikus. Így valószínűnek tűnik, hogy ezeket a nem-szinténikus szigeteket jelentős átrendeződések, duplikációs események és az A. oryzae-specifikus gének megjelenésének keveréke okozta.
Az a tény, hogy néhány nagyon konzervált kromoszómát és néhány erősen átrendeződött nem-szinténikus blokkot figyelhetünk meg, együttesen azt jelezheti, hogy bizonyos régiókban evolúciós nyomás érvényesül a stabilitás érdekében, míg más régiókban gyakori a géncserék és átrendeződések, ill, átrendeződési gócpontok.
A Flavi szekció a szénhidrát-aktív enzimek gazdag forrása
A szénhidrát-aktív enZimek (CAZimek) elengedhetetlenek ahhoz, hogy egy faj milyen szénforrásokat tud lebontani és hasznosítani. A Flavi szakaszon belül a CAZimek/szénhidrogén-hasznosítás elsősorban az A. oryzae1,2,40 és kisebb mértékben az A. flavus41,42,43,44,45 és az A. flavus41,42,43,44,45 esetében van leírva. sojae46,47 esetében, míg a csoport többi fajával csak alkalmi tanulmányokat végeztek48,49,50,51,52,53,54, amelyek gyakran egy bizonyos CAZyme-aktivitás vagy fehérje előállítását, illetve jellemzését írják le.
A CAZy adatbázis segítségével megjósoltuk a szekció genomjainak CAZyme-tartalmát (4. ábra). A 23 Flavi fajra összesen 13 759 CAZymet jósoltunk (átlagosan 598/faj). Ez meglehetősen gazdag a bevont referencia Aspergillihez képest (508/faj).
Az elemzésből világosan látszik, hogy a Flavi szekció kládjai között határozott különbség van (4b. ábra), ami ismét a szekció géntartalmának eltérését mutatja.
A változó CAZyme-tartalom nem tükrözi a növényi biomassza lebontásának képességét
A tényleges szénhasznosítási képesség értékeléséhez a Flavi szekcióban 31 faj (29 Aspergilli, köztük 23 faj a Flavi szekcióból) növekedési profilozását végeztük el 35 növényi biomasszával kapcsolatos szubsztráton (5. ábra, Kiegészítő adatok 1), és ezt összehasonlítottuk a növényi biomassza lebontásával kapcsolatos CAZyme-géntartalom előrejelzésével (Kiegészítő adatok 2). Egy korábbi vizsgálatban a távolabbi rokon Aspergillusok közötti növekedési eltérések a CAZyme géntartalom különbségeivel hozhatók összefüggésbe55 , de ez nem volt igaz az Aspergillus Nigri szekció közelebbi rokon fajaira16.
A monoszacharidok közül minden faj esetében a glükóz eredményezte a legjobb növekedést, ezért belső referenciaként használtuk (7. kiegészítő ábra). A többi szénforráson történő növekedést összehasonlítottuk a d-glükózon történő növekedéssel, és ezt a relatív különbséget összehasonlítottuk a fajok között. A monoszacharidokon való növekedés nagyrészt hasonló volt a Flavi szekció fajai között (5. ábra, 7. kiegészítő ábra és 1. kiegészítő adat).
A növényi biomassza lebontásával kapcsolatos CAZyme-készletek összességében nagyon hasonlóak a Flavi szekcióban (5. ábra), kivéve az A. coremiiformis-t, amelynek génkészlete erősen csökkent. Ez főként a glikozid-hidroláz családok csökkenésének köszönhető, de számos, a pektin, xilán és xiloglükán lebontásával kapcsolatos családot is tartalmaz. Meglepő módon ez a faj jobb relatív növekedést mutatott a xilánon, mint a legtöbb más faj, míg a többi poliszacharidon való növekedés főként a Flavi szekcióéhoz hasonló volt. A csökkentett génkészlet tehát nem csökkentette a növényi biomassza lebontására való képességét. Ez hasonló lehet a T. reesei esetéhez, amely szintén csökkentett CAZyme génkészlettel rendelkezik, de a megfelelő enzimeket nagyon magas szinten termeli56. E megközelítés eredete azonban valószínűleg nagyon eltérő, mivel CAZyme-tartalmát a növényi sejtfalat lebontó enzimek elvesztése, majd masszív HGT-gyarapodása alakította57 , míg az A. coremiiformis esetében erre semmi jel nem utal.
A hidrolitikus különbségek kládspecifikusak a Flavi szekción belül (Kiegészítő adatok 2). Az A. togoensis kládban a xilanolitikus és xiloglükanolitikus gének száma csökkent, de ez nem tükröződik a növekedésben. Ezzel szemben a GH115 (alfa-glükuronidáz) gének az A. flavus, A. tamarii és A. nomius kládokban bővültek (xilanolitikus enzimeket vagy aktivitást jelentettek e kládok több fajából49,50,51,53,58,59,60,61,62), a GH62 (arabinoxylan arabinofuranohidroláz) az A. leporis kládban bővült, és az A. leporis és A. avenaceus voltak az egyetlen kládok, amelyekben a CE15 (glükuronoilészterázok) megtalálhatóak voltak a Flavi szakaszon kívüli Aspergillus fajokban is.
A galaktomannán lebontó képesség szinte teljesen konzerválódott a Flavi szakaszban, de érdekes módon a főként galaktomannánból álló guargumin való növekedés változó volt a fajok között. Hasonlóképpen, az A. togoensis és az A. avenaceus kládok csökkent amilolitikus képessége nem eredményezett csökkent növekedést keményítőn vagy maltózon.
Variációt figyeltek meg a pektinolitikus gének számában. A legmarkánsabb különbség a PL11 (ramnogalakturonán-liáz) gének hiánya volt a Flavi szekció legtöbb fajából, valamint a GH78 (alfa-ramnozidáz) gén terjedése az A. flavus és az A. tamarii kládokban. Ezek a különbségek és a kisebb különbségek más családokban azonban nem eredményeztek nagy eltéréseket a pektinre történő növekedés során.
A cellobiózra, laktózra és ligninre történő növekedés során szembetűnőbb különbségek mutatkoztak. A legtöbb faj gyengén növekedett cellobiozon annak ellenére, hogy a legtöbb fajban hasonló számú béta-glükozidázt kódoló gén volt jelen (Kiegészítő adatok 2). Hasonlóképpen, csak az A. arachidicola és kisebb mértékben az A. albertensis nőtt jól laktózon, miközben a béta-galaktozidázok száma ezekben a fajokban hasonló a többi fajéhoz. A legérdekesebb az a megállapítás volt, hogy az A. albertensis ugyanolyan jól növekedett ligninen, mint d-glükózon, ami a bioüzemanyag-termelésben való potenciális alkalmazásra utal.
Összefoglalva, a CAZyme-potenciál a Flavi szakaszban nagyrészt konzervált (az A. coremiiformis kivételével), némi eltéréssel a kópiaszámokban, de a genomiális potenciál és az eltérések nem feltétlenül tükröződnek a növekedésben. Ezért valószínűsíthető, hogy ahogyan azt korábban javasoltuk55 , a megfigyelt különbségek nagyrészt szabályozási szintűek.
A GH28 CAZyme család felduzzadt az A. flavus kládban
A GH28 CAZymei különösen érdekeltek bennünket, mivel fontosak az élelmiszer-fermentáció és a fermentált végtermék minősége szempontjából63. Elkészítettük a GH28 összes tagjának filogenetikai fáját a Flavi szekcióból (8. kiegészítő ábra). A fa 429 fehérjét tartalmaz, fajonként átlagosan 18,7-et.
A fán belül különböző csoportosítások vannak. Öt csoportnak mind a 23 fajból vannak tagjai, kilenc csoportból hiányzik egy-négy faj (általában az A. coremiiformis és az A. caelatus), két csoport pedig az A. flavus, az A. tamarii és az A. nomius kládokra jellemző. Végül nyolc olyan csoport van, amely 2-13 fajt tartalmaz, és nem követi a filogeniát – ami arra utal, hogy ezek a GH28 variáció forrásai.
Az A. flavus kládba tartozó fajok általában nagy számú GH28 tagot tartalmaznak. Az A. sojae-ról ismert, hogy magas GH28-számmal rendelkezik, ami itt is látható, 24 taggal; az A. sergii azonban még magasabb számmal rendelkezik, 25 taggal. Érdekes lenne megvizsgálni, hogy ezt ki lehetne-e használni akár az A. sergii új fajként való felhasználásával az élelmiszer-fermentációban és/vagy új enzimek forrásaként.
A másodlagos anyagcsere elemzése
Az Aspergillus nemzetségről ismert, hogy nagyszámú SM-et termel, és az előre jelzett SMGC-k száma még magasabb. Az előre jelzett SMGC-k többsége nem jellemzett, és ezért új, bioaktív vegyületek sokféleségének előállítására alkalmas. Megvizsgáltuk a Flavi szekcióban az SM-termelés diverzitását és potenciálját, mind mennyiségi szempontból a klaszterek számát, mind pedig minőségi szempontból az e klaszterek által potenciálisan termelhető vegyületeket tekintve.
A másodlagos anyagcsere a Flavi szekcióban változatos és termékeny
Az SM-termelés potenciáljának kvantitatív értékeléséhez az SMGC-ket egy SMURF-szerű előrejelző eszköz64 segítségével jósoltuk meg minden faj esetében, kivéve a N. crassa és az A. sojae fajokat, mivel ezeket más módszerekkel és eltérő génhívó módszerekkel szekvenáltuk (6c. ábra). A 28 Aspergillus fajon belül összesen 1972 prediktált SMGC található, a Flavi szekció genomjai esetében pedig összesen 1606 SMGC (73/faj). Ez fajonként több mint 15 többletet jelent az igen termékeny Penicillium nemzetséghez65 képest.
Az SMGC-k egyediségét kívántuk megvizsgálni, ezért SMGC-családokat konstruáltunk (Kiegészítő adatok 3). A teljes adathalmaz esetében 477 SMGC-családra, a Flavi szekció esetében pedig 308 SMGC-családra tudtuk összevonni. Ezek közül 150 SMGC-klaszter csak egy Flavi szekcióbeli fajban található meg (6a. ábra), ami nagyszámú egyedi klasztert mutat minden fajban (6,8 egyedi SMGC/faj). Az Aspergillus Nigri szekcióval összehasonlítva a fajonkénti klaszterek száma ebben a vizsgálatban valamivel alacsonyabb, de az egyes SMGC családok tagjainak száma is alacsonyabb, ami a másodlagos anyagcsere nagyobb diverzitását mutatja a Flavi szekcióban a Nigri szekcióhoz képest.
A másodlagos anyagcsere dereplikációja toxintermelőket jelez előre
Az SM-termelés lehetőségének kvalitatív értékeléséhez a “genetikai dereplikáció” csővezetékét használtuk, ahol a megjósolt klasztereket ellenőrzött, jellemzett klaszterekkel (a MIBiG adatbázisból66 ) társítottuk egy “guilt-by-association” módszerrel67. Ez alapján 20 klasztercsaládot kapcsoltunk egy vegyületcsaládhoz (6b. ábra). Néhány klasztercsalád minden vagy majdnem minden Flavi genomban megtalálható volt, például a naftopiron68, nidulanin A69, azanigeron70, 4,4′-piperazin-2,5-diildimetil-bisz-fenol és aflavarin71/endokrocin72,73 klaszterekhez hasonlóak. A legtöbb család általában követi a filogenetikai csoportokat, ami veszteségalapú eloszlási mintázatra utal, de néhány, például az aszperfuranon74, a pseurotin A75 vagy a fumagillin76 klaszterekhez hasonló SMGC családok nem követték a filogenetikát. Ezenkívül olyan ismert toxinok potenciális termelőit is azonosítottuk, mint az aflatoxin és az aszpiroklór (6b. ábra).
Az adatok és az elemzés kombinációja összekapcsol egy vegyületet egy klaszterrel
Az ismert SMGC-klaszterekből kiindulva a vegyületek és a klaszterek összekapcsolása érdekelt bennünket a termelt vegyületek és a megjósolt klaszterek jelenlét/hiány mintázata alapján. Ezért hőtérképet készítettünk a legalább öt fajban talált összes klasztercsaládról, hozzáadtuk a MIBiG dereplikációból prediktált vegyületcsaládokat, valamint az irodalmi felmérésből származó, kézzel kurált vegyületcsaládokat (9. kiegészítő ábra). Ezen kívül megmértük a Flavi fajok SM-termelését is (4. kiegészítő adat).
Különös érdeklődésre tartottak számot a miyakamidok. Ezeket eredetileg egy A. flavus izolátumból izolálták, és kimutatták, hogy antibiotikus tulajdonságokkal rendelkeznek77 , de a bioszintetikus génklaszter nem ismert. Kémiai elemzésünk kimutatta a termelést az A. sojae, A. nomius, A. parasiticus, A. novoparasiticus és A. transmontanensis esetében.
A kémiai szerkezetből retro-bioszintézist végeztünk, és megjósoltuk, hogy a bioszintetikus génklaszternek tartalmaznia kell egy nemriboszomális peptidszintetázt (NRPS) 2-3 adenilációs doménnel (mivel a három aminosavból kettő hasonló), egy N-metiltranszferázt, egy acetiltranszferázt és potenciálisan egy dekarboxiláz/dehidrogenázt (10A kiegészítő ábra). Olyan klasztercsaládokat keresve, amelyek tagjai az összes miakamidot termelő fajban rendelkeznek 2-3 adenilációs doménnel és egy metil-transzferáz doménnel rendelkező NRPS gerinccel, csak egy klasztercsalád felelt meg a követelményeknek. Ez a klasztercsalád a legtöbb fajban egy metil-transzferáz doménnel rendelkező NRPS gerinccel, három A doménnel, az A. novoparasiticusban pedig kettővel rendelkezik. A csak két A-domén predikcióját valószínűleg annotációs hiba okozta, mivel a szekvencia-hasonlóság a gén kezdete előtt konzerválódik (10B kiegészítő ábra). A prediktált klaszter mérete 1-9 gén, a különbséget valószínűleg SMGC predikciós hibák okozzák (Synteny plot a 10B. kiegészítő ábrán). A synteny plot azt mutatja, hogy az NRPS és két ismeretlen funkciójú kis gén széles körben konzerválódott. Ezért azt javasoljuk, hogy az azonosított NRPS az ismeretlen funkciójú két konzervált génnel együtt valószínűleg a miyakamid bioszintézisének jelöltjei.
Az aflatoxin bioszintetikus génklaszter erősen konzervált
A Flavi szekció talán legismertebb másodlagos metabolitja az erősen rákkeltő aflatoxin. Aflatoxinok előállítása számos Flavi szekcióbeli fajból ismert (A. arachidicola, A. luteovirescens, A. flavus, A. minisclerotigenes, A. nomius, A. aflatoxiformans, A. pseudocaelatus, A. pseudonomius, A. pseudotamarii és néhány A. oryzae izolátum)4,10 .
A dereplikációs elemzés (6b. ábra) azonosított egy olyan SMGC családot, amelyről azt jósolták, hogy részt vesz a sterigmatocisztin és aflatoxin termelésben, és amely az A. flavus, A. nomius és A. tamarii kládok összes faját magában foglalja, kivéve az A. tamarii fajt. Az SMGC-család szintenia-diagramja (11. kiegészítő ábra) azt mutatja, hogy a klaszter rendkívül jól konzervált, nincsenek átrendeződések, és az aflatoxin-gének esetében magas az illeszkedési azonosság. Csak az A. caelatusnak van egy csonka formája, amelyben csak az aflB, aflC és aflD gének vannak, és az A. tamarii esetében úgy tűnik, hogy a klaszter teljesen elveszett. Érdekes módon a legtöbb előrejelzett klaszter nem tartalmazta az aflatoxin bioszintézis utolsó lépéséért felelős aflP és aflQ géneket. Megkerestük a genomokban az aflP-t (12. kiegészítő ábra), és minden genomban megtaláltuk, de eltérő starthelyekkel és a fehérjék közepén extra szekvenciával. Az RNS-seq adatok alátámasztják ezeket a modelleket (13. kiegészítő ábra), és az A. flavus génmodellek hibáira utalnak. Hasonlóképpen, az aflQ gén megtalálható az összes többi fajban, de 5-10 génnel távolabb a megjósolt klaszterektől. A részletes elemzés tehát azt mutatja, hogy mindezen fajok rendelkeznek az aflatoxin bioszintéziséhez szükséges génekkel.