Egyszerű in silico megközelítés génexpressziós profilok létrehozására rákgenomikai adatok alcsoportjaiból

A genomikai technológiák fejlődése az elmúlt évtizedben lehetővé tette a biológiai folyamatok és betegségek molekuláris mechanizmusainak azonosítását, ami a klinikai kutatás minden területére hatással van, különösen a rákra. Az intratumorális heterogenitás, a rákos sejtek genomjának dinamikus változásai és a genetikai aberrációk az egyes ráktípusok egyedi ujjlenyomatai . A rák ezen jellemzői a prognosztikai altípusok osztályozásával és a kockázati rétegzéssel kombinálva bebizonyították, hogy a génexpressziós profilalkotás lehetővé teszi például a rákban a prognózis és a terápiaérzékenység molekuláris hátterének jobb megértését. Ezenkívül a génexpressziós profilalkotás hatékony molekuláris megközelítés a gyógyszerérzékenység előrejelzésére .

A különböző ráktípusok genomiális változásainak katalógusainak létrehozása érdekében összehangolt, nagyszabású rákgenomikai projekteket dolgoznak ki. A két fő projekt a rákgenomikai atlasz (TCGA) és a Nemzetközi Rákgenomikai Konzorcium (ICGC) , amely számos központot foglal magában, amelyek különböző platformokat használnak a rákgenomikai információk, például génexpresszió, DNS-mutációk, DNS-metiláció, fehérje-expresszió és klinikai adatok szolgáltatására. Ezek a projektek nagy mennyiségű genomikai adatot szolgáltatnak, hogy segítsék a kutatókat új hipotézisek felállításában vagy tesztelésében, amelyek végső soron segíthetik az új rákterápiák, diagnosztikai módszerek és megelőző stratégiák kifejlesztését. A nagy mennyiségű bonyolult adat feltárása, integrálása és elemzése azonban kihívást jelent, különösen a számítógépes programozási vagy informatikai háttérrel nem rendelkező tudósok számára.

A nagy mennyiségű rákgenomikai adat hatékony felhasználása továbbra is kihívást jelent a számítógépes módszerek korlátai és az elégtelen útmutatás miatt. Az adatok vizualizációja nagy segítséget jelent a hatékony adatelemzéshez, és az adatok vizualizációjának megkönnyítésére fejlett eszközöket fejlesztettek ki, például a cBioPortal, a UCSC Cancer Browser és a canEvolve nyílt hozzáférésű portálokat (1. táblázat). A nyílt hozzáférésű portálok azonban elsősorban a nagy adathalmazok vizsgálatát könnyítik meg, és néha korlátozottak az adathalmazok mélyebb feltárása során. Itt egy egyszerű, de hatékony módszert írunk le a minták vagy betegek specifikus genetikai, biológiai vagy klinikai érdeklődésű részhalmazainak vizsgálatára. A génexpressziós profilalkotásra összpontosítunk, és bemutatunk egy módszert a génexpressziós adatoknak a DNS-metilációval és a fehérjeexpresszióval kapcsolatos elemzésére (2. táblázat), amely integrálható az egyes ráktípusokra vonatkozó kutatási hipotézisek tesztelésére.

2. táblázat. A különböző rákgenomikai adatok és a profilalkotásra szolgáló típusok áttekintése.
Genomikai típus Adatok
Gén-expresszió RNS-seq
Tumor RNS (microarray)
DNS-metiláció Metiláció (HM27)
Protein expresszió Reverse-phase protein array (RPPA)

anyag & módszerek

Protokoll in silico génexpressziós profilalkotáshoz

A génexpressziós profilalkotás hatékony technika a biológiai folyamatok molekuláris szintű vizsgálatára. A génaktivitás vagy expresszió értékelhető a fehérjék azonosításával, de a génexpressziót általában az RNS-üzenet vagy transzkript vizsgálatával vizsgálják. Az átfogó génexpressziós profilalkotásra általánosan használt két nagy áteresztőképességű módszer az RNS-szekvenálás újgenerációs szekvenálással (NGS) és a DNS-mikrotáblák .

Általánosságban kétféle génexpressziós megközelítés létezik a rákban: a differenciális és a relatív elemzés. A differenciális megközelítésben a daganatkifejeződési profilokat a beteghez illesztett vagy nem illesztett normál szövetmintákhoz viszonyítva derítik fel, míg a relatív megközelítés a transzkriptumok szintjét hasonlítja össze a daganattípusok vagy sejt- és szövetminták között. A konkrét megközelítéstől függően a minták és minták génexpressziós profilozása nemcsak a biológiába nyújt betekintést, hanem a transzkriptek szerkezetének, változásainak és variációinak részleteivel is szolgálhat . Számos nyílt hozzáférésű portál megkönnyíti a génexpressziós adatok feltárását. Protokollunkat a cBioPortal által biztosított eszközzel illusztráljuk . A többi nyílt hozzáférésű portál, például a UCSC Cancer Browser és a canEvolve szintén használható a genomikai adatok feltárására. A következő fejezeteknél lépésről lépésre ismertetjük a protokollt (Supplemental Protocol):

Áttekintés és az érdeklődésre számot tartó rákos adathalmaz kiválasztása (cBioPortal);

Az érdeklődésre számot tartó esethalmazok/alcsoportok létrehozása egyetlen vizsgálatban;

Gének integráló elemzése egyetlen vizsgálatban. Miután az 1. szakaszban meghatározta az érdeklődésre számot tartó rákos vizsgálatot, és a 2. szakaszban létrehozta az érdeklődésre számot tartó klinikai vagy genetikai adatokkal rendelkező minták/páciensek alcsoportjait. Ez a szakasz osztályozza az egyes minták egyes génjeit, és minden genomikai adatelemzésre és vizualizációra szolgál;

Gén-expressziós és fehérje-expressziós adatok gyűjtése;

Metilációs adatok gyűjtése;

Korrelációs elemzés. A génexpresszió és akár a metilációs állapot, akár a fehérjeszint közötti korreláció vizsgálatához ez a szakasz eszközt biztosít a kapcsolat ábrázolásához;

Grafikus megjelenítés és statisztikai elemzés. Az 5. szakaszban gyűjtött mRNS-expressziós, metilációs vagy fehérje-expressziós adatok vagy a 6. szakasz korrelációelemzésének adataiból származó esethalmazok vizualizálása és elemzése.

Eredmények & Megbeszélés

Reprezentatív eredmények

Az IDH1 gén mutációi az alacsony fokú glioma és a másodlagos glioblastoma kialakulásának ősi eseményei . Az IDH1 mutáció (IDH1MUT) jelenléte a gliomás betegek hosszabb túlélésével jár az IDH1 vad típusú (IDH1WT) betegekhez képest . A cBioPortal klinikai kimeneti lehetőségeit felhasználva a túlélést egy teljes túlélési grafikon szemlélteti, amely az IDH1MUT gliomás betegek körülbelül hatszor hosszabb túlélését mutatja az IDH1WT gliomás betegekhez képest (1. ábra).

1. ábra. A TCGA adatbázisban szereplő IDH1MUT és IDH1WT gliomás betegek össztúlélési görbéinek reprezentatív elemzése.

Az elemzéshez az alacsony fokú glioma és glioblastoma multiforme (TCGA, Cell 2016) tanulmány összevont kohorszát elemezték, amely 411 IDH1MUT versus 401 IDH1WT gliomás beteget tartalmazott. Az össztúlélési Kaplan-Meier-diagram az IDH1MUT gliomás betegek (piros) körülbelül hatszor hosszabb túlélését mutatja az IDH1WT gliomás betegekhez képest (kék).

Az IDH1MUT metabolikus átrendeződést indukál, ami még nem teljesen ismert, de az anyagcsere-enzimek expressziós szintjei közötti különbségek feltárása ígéretes vizsgálati megközelítés. Az IDH1MUT hatása a metabolikus enzimeket kódoló gének expressziójára lehetőséget nyújt a cBioPortal adatintegrációs, feltárási és elemzési lehetőségeinek bemutatására. A TCGA 112 IDH1WT versus 399 IDH1MUT low-grade glioma (LGG) minta és 157 IDH1WT versus kilenc IDH1MUT glioblastoma minta adatait kínálja fel a vizsgálathoz és az elemzéshez történő integráláshoz.

A glükózanyagcserében olyan géneket választottak ki, amelyek sebességkorlátozó metabolikus enzimeket kódolnak: GLUT1/3, HK1, HK2, HK3, PKLR, PKM2, LDHA és LDHB. Az IDH1WT versus IDH1MUT LGG és glioblasztóma betegmintákban a GLUT3, HK2, PKM2 és LDHA esetében magasabb génexpressziós szintet figyeltünk meg (2. ábra), ami arra utal, hogy az IDH1WT glióma nagyobb mértékben függ a glikolízistől az ATP-termelésben, mint az IDH1MUT glióma.

2. ábra. A glükóz-anyagcserében részt vevő enzimek mRNS-expressziós szintjeinek reprezentatív elemzése IDH1WT versus IDH1MUT gliomában.

A cBioPortalból származó IDH1WT (n = 112) és IDH1MUT (n = 399) alacsony fokú glióma, valamint IDH1WT (n = 157) és IDH1MUT (n = 9) glioblastoma minták elemzése a TCGA adathalmazok Brain Lower Grade Glioma (ideiglenes) és Glioblastoma Multiforme (ideiglenes) felhasználásával. Az IDH1WT (kék) és IDH1MUT (piros) relatív mRNS-expressziós szintek összevont adatai láthatók.

***p < 0.001; ****p < 0.0001.

G6PD: Glükóz-6-foszfát-dehidrogenáz; GLUT: Glükóztranszporter; HK: Hexokináz; LDH: Laktát-dehidrogenáz; PK: Piruvát-kináz.

Mivel az IDH1/2 mutációi a myeloid neoplazmás betegek 20%-ánál is előfordulnak, beleértve az AML-t is, a 3. ábrán a három csoport, az IDHWT, IDH1MUT és IDH2MUT mRNS-expressziós elemzésének példája látható. Az akut myeloid leukémiáról (AML; TCGA, ideiglenes) szóló tanulmány 136 IDHWT, 16 IDH1MUT és 16 IDH2MUT AML-mintát kínál a génexpressziós profilok vizsgálatára. A 3. ábrán az ATM gén, egy DNS-károsodásra reagáló fehérje , mRNS-expressziós szintjei az IDHWT, IDH1MUT és IDH2MUT AML mintákban azt mutatják, hogy az ATM mRNS-expressziója súlyosan csökken az IDH1MUT AML-ben.

3. ábra. Az ATM gén mRNS-expressziós szintjének reprezentatív elemzése IDHWT, IDH1MUT és IDH2MUT akut myeloid leukémiás mintákban.

A cBioPortálról származó IDHWT (n = 138), IDH1MUT (n = 16) és IDH2MUT (n = 16) akut myeloid leukémiás minták elemzése a TCGA-adatkészletek Acute Myeloid Leukemia (provisional) segítségével. A relatív mRNS-expressziós szintek adatai az IDHWT (kék), az IDH1MUT (piros) és az IDH2MUT (zöld) esetében láthatók.

**p < 0,01.

Egy másik példát a 4. ábra szemlélteti, amely a génexpresszió és az LDHA gén DNS-metilációjának grafikonját mutatja az LGG-ben. Az LDHA alacsonyabb expressziós szintje, ahogyan az IDH1MUT gliómában megfigyelhető volt, összefüggött a promóterének hipermetilációjával (4A ábra), de az LDHB gén alacsonyabb expressziós szintje IDH1WT-ben nem korrelált a metilációval (4B ábra).

4. ábra. Az mRNS-expresszió és a metiláció közötti korreláció reprezentatív elemzése.

Az (A)LDHA gén és (B)LDHB gén génexpressziójának és DNS-metilációjának korrelációjának ábrája alacsony fokú gliómában (Brain Lower Grade Glioma, ideiglenes) az IDH1MUT státusz szerint (kék: IDH1WT, piros: IDH1MUT).

Az 5. ábra szemléltető példát mutat be annak vizsgálatára, hogy a génexpressziós szintek korrelálnak-e a fehérjék mennyiségével. Az IDH1MUT gliómában a G6PD alacsonyabb gén-expressziós szintjét figyeltük meg az IDH1WT gliómához képest (5A ábra), míg a G6PD fehérjeszintje azonos volt az IDH1MUT és az IDH1WT LGG-ben (5B ábra), ami arra utal, hogy további poszttranszlációs mechanizmusok működnek .

5. ábra. Az mRNS-expresszió és a fehérjebőség közötti korreláció reprezentatív elemzése.

(A) A G6PD génexpressziós szintjének elemzése alacsony fokú gliómában (LGG) a (B) G6PD fehérjebőségével korrelálva az IDH1MUT státusz szerint (kék: IDH1WT, piros: IDH1MUT). (C) A génexpresszió és a fehérjebőség korrelációjának ábrája.

****p < 0,0001.

LGG: Alacsony fokú glióma; ns: Nem szignifikáns.

A folyamatos innováció nagyban segítette a rákról alkotott ismereteink bővülését, ugyanakkor a rákkutatást a biológia egyik legadatintenzívebb területévé tette. A jól strukturált és szervezett rákgenomikai projektek hatalmas mennyiségű tumormintát kínálnak a kutatóknak, amelyeket hasonlóan előkészítenek, normalizálnak és feldolgoznak a számítógépes elemzéshez, hogy bővítsék a rákgenetikáról alkotott ismereteinket. Az itt felsorolt protokoll nyílt hozzáférésű eszközökkel kombinálva csökkenti az ezekhez a komplex adatokhoz való hozzáférés akadályait, és mélyebb adatbányászatot kínál, hogy felgyorsítsa a genomikai adatok új biológiai és klinikai felismerésekké történő fordítását.

A glióma rákgenomikai projekt a TCGA egyik első olyan projektje volt, amely több platformról származó tumorminták jól strukturált adatait szolgáltatta. Ezen adatok genomikai elemzése azonosította a glioblasztóma klinikailag releváns altípusait, és három különböző molekuláris osztályt határolt le az alacsony fokú gliomában, beleértve az IDH-mutációval rendelkező osztályt . A nyílt hozzáférésű portálok megkönnyítik a hozzáférést ezekhez az adatkészletekhez, de korlátozottak az egyes csoportok vizsgálatában. Az ebben a tanulmányban tárgyalt protokoll egy egyszerű módszert ír le a minták vagy betegek specifikus genetikai, biológiai vagy klinikai érdeklődésű alcsoportjainak, például az IDH-mutációval rendelkező tumormintáknak a vizsgálatára. Másodszor, a protokoll leírja, hogyan lehet egy adott útvonalban vagy folyamatban, például az anyagcserében részt vevő gének expressziós profiljait létrehozni a minták ezen adott részhalmazában. Ez lehetővé teszi az érdeklődésre számot tartó egyes gének kiválasztását az összes gén feltárása helyett, és minden egyes gén osztályozását minden egyes mintában, amelyet az elemzéshez és a vizualizációhoz használunk. Végül többdimenziós elemzést biztosítunk a génexpresszió vizsgálatához a DNS-metilációval és a fehérjeexpresszióval összefüggésben.

A többi rendelkezésre álló eszközzel összehasonlítva ez a protokoll olyan webes felületű eszközöket használ, amelyek nem igényelnek további szoftvereket. A protokoll kritikus lépése a megfelelő rákgenomikai tanulmány vagy projekt kiválasztása, amely tartalmazza az érdeklődésre számot tartó adatokat. Jelenleg számos portál tárolja az irodalomból és a TCGA portálról származó adatkészletek adatait. Példaként a cBioPortal jelenleg 76 rákgenomikai projektet kínál a génexpresszióról (RNAseq és microarray), 21 metilációs és 41 fehérjeexpressziós projekttel együtt. A genomikai adatok összehasonlításának érvényessége attól függ, hogy egy minta mennyire jól illeszkedik a referenciához a technikai (pl. az adatfeldolgozás típusa) és biológiai (pl. a molekuláris altípus) torzítások tekintetében. Ezért a jól strukturált rákgenomikai projektekből származó genomikai adatokat szolgáltató portálok használata nem igényel fejlett normalizációs technikákat és tételes korrekciókat.

Összefoglalva, módszerünk lehetővé teszi a minták egy szelektív részhalmazának importálását és integrálását olyan specifikus genomikai, biológiai vagy klinikai érdekességekkel, mint például genomikai elváltozás, mutáció, rák altípusok vagy túlélési tulajdonságok. Ez a módszer egyedülálló koncepciót tartalmaz a génexpressziós profilok létrehozására és e profilok DNS-metilációval és fehérjeexpresszióval való kereszthivatkozására, amelyek integrálhatók a kutatási hipotézisek tesztelésére a rák meghatározott altípusaiban.”

Jövőbeli kilátások

A rákkutatás a biológia egyik legadatintenzívebb tudományágává fejlődött. A Genomics Evidence Neoplasia Information Exchange (GENIE) projekt az eddigi legnagyobb, teljesen nyilvános rákgenomikai adathalmazok közé tartozik. Az olyan könnyen kezelhető portálok, mint a cBioPortal, egyre fontosabb szerepet fognak játszani ebben a tudományágban.

A szerzők hozzájárulása

MK tervezte és végezte a kutatást, RJM és CJFvN felügyelte a vizsgálatot, MK és CJFvN írta a kéziratot, minden szerző elolvasta és jóváhagyta a kézirat végleges változatát

Financiális &versenyző érdekek közzététele

A kutatást a Holland Rákellenes Társaság támogatta (KWF támogatások UVA 2014-6839 és AMC 2016.1-10460). A szerzőknek a közölteken kívül nincs más releváns kapcsolata vagy pénzügyi érintettsége olyan szervezettel vagy szervezeti egységgel, amelynek pénzügyi érdekeltsége vagy pénzügyi konfliktusa van a kéziratban tárgyalt témával vagy anyagokkal kapcsolatban.

A kézirat elkészítéséhez nem használtak írói segítséget.

  • 1. Hanahan D, Weinberg RA. A rák jellemzői. Cell 100(1), 57-70 (2000). crossref, Medline, CAS, Google Scholar
  • 2. Chang JC, Wooten EC, Tsimelzon A et al. Gene expression profiling for the prediction of therapeutic response to docetaxel in patients with breast cancer. Lancet 362(9381), 362-369 (2003).Crossref, Medline, CAS, Google Scholar
  • 3. Byron SA, Van Keuren-Jensen KR, Engelthaler DM, Carpten JD, Craig DW. Az RNS-szekvenálás átültetése a klinikai diagnosztikába: lehetőségek és kihívások. Nat. Rev. Genet. 17(5), 257-271 (2016). crossref, Medline, CAS, Google Scholar
  • 4. International Cancer Genome C, Hudson TJ, Anderson W et al. International network of cancer genome projects. Nature 464(7291), 993-998 (2010).Crossref, Medline, Google Scholar
  • 5. Chin L, Andersen JN, Futreal PA. Rákgenomika: a felfedező tudománytól a személyre szabott orvoslásig. Nat. Med. 17(3), 297-303 (2011). crossref, Medline, CAS, Google Scholar
  • 6. Weeraratna AT, Nagel JE, De Mello-Coelho V, Taub DD. Génexpressziós profilalkotás: a mikrotérképtől az orvostudományig. J. Clin. Immunol. 24(3), 213-224 (2004). crossref, Medline, CAS, Google Scholar
  • 7. Johnson JM, Castle J, Garrett-Engele P et al. Genome-wide survey of human alternative pre-mRNA splicing with exon junction microarrays. Science 302(5653), 2141-2144 (2003). crossref, Medline, CAS, Google Scholar
  • 8. Trapnell C, Williams BA, Pertea G et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat. Biotechnol. 28(5), 511-515 (2010).Crossref, Medline, CAS, Google Scholar
  • 9. Gao J, Aksoy BA, Dogrusoz U et al. Komplex rákgenomikai és klinikai profilok integratív elemzése a cBioPortal segítségével. Sci. Signal 6(269), pl1 (2013). crossref, Medline, Google Scholar
  • 10. Cerami E, Gao J, Dogrusoz U et al. The cBio cancer genomics portal: an open platform for exploring multidimensional cancer genomics data. Cancer Discov. 2(5), 401-404 (2012). crossref, Medline, Google Scholar
  • 11. Parsons DW, Jones S, Zhang X et al. An integrated genomic analysis of human glioblastoma multiforme. Science 321(5897), 1807-1812 (2008).Crossref, Medline, CAS, Google Scholar
  • 12. Balss J, Meyer J, Mueller W, Korshunov A, Hartmann C, Von Deimling A. Az IDH1 kodon 132 mutációjának elemzése agydaganatokban. Acta Neuropathol 116(6), 597-602 (2008).Crossref, Medline, CAS, Google Scholar
  • 13. Bleeker FE, Atai NA, Lamba S et al. A prognosztikus IDH1(R132) mutáció csökkent NADP+-függő IDH-aktivitással társul glioblastomában. Acta Neuropathol. 119(4), 487-494 (2010).Crossref, Medline, CAS, Google Scholar
  • 14. Khurshed M, Molenaar RJ, Lenting K, Leenders WP, Van Noorden CJF. In silico génexpressziós elemzés glikolízist és acetát anaplerózist mutat ki IDH1 vad típusú gliómában és laktát és glutamát anaplerózist IDH1-mutált gliómában. Oncotarget 8(30), 49165-49177 (2017).Crossref, Medline, Google Scholar
  • 15. Khurshed M, Aarnoudse N, Hulsbos R et al. IDH1-mutáns rákos sejtek érzékenyek a ciszplatinra, és egy IDH1-mutáns inhibitor ellensúlyozza ezt az érzékenységet. FASEB J. 32, 6344-6352 (2018).Crossref, Google Scholar
  • 16. Molenaar RJ, Radivoyevitch T, Nagata Y et al. IDH1/2 mutációk érzékennyé teszik az akut myeloid leukémiát a PARP-gátlásra, és ezt az IDH1/2-mutáns inhibitorok visszafordítják. Clin. Cancer Res. 24(7), 1705-1715 (2018). crossref, Medline, CAS, Google Scholar
  • 17. Frederiks WM, Bosch KS, De Jong JS, Van Noorden CJ. A glükóz-6-foszfát-dehidrogenáz aktivitásának poszttranszlációs szabályozása patkánymáj (pre)neoplasztikus elváltozásaiban. J. Histochem. Cytochem. 51(1), 105-112 (2003).Crossref, Medline, CAS, Google Scholar
  • 18. Verhaak RG, Hoadley KA, Purdom E et al. Integrated genomic analysis identifies clinically relevant subtypes of glioblastoma characterized by abnormalities in PDGFRA, IDH1, EGFR, and NF1. Cancer Cell 17(1), 98-110 (2010).Crossref, Medline, CAS, Google Scholar
  • 19. Cancer Genome Atlas Research N, Brat DJ, Verhaak RG et al. Comprehensive, integrative genomic analysis of diffuse lower-grade gliomas. N. Engl. J. Med. 372(26), 2481-2498 (2015).Crossref, Medline, Google Scholar

.