O abordare simplă in silico pentru a genera profiluri de expresie genetică din subseturi de date genomice ale cancerului

În ultimul deceniu, progresele în tehnologiile genomice au permis identificarea mecanismelor moleculare ale proceselor biologice și ale bolilor, cu impact asupra tuturor domeniilor de cercetare clinică, în special asupra cancerului. Eterogenitatea intratumorală, modificările dinamice ale genomului celulelor canceroase și aberațiile genetice sunt amprente unice pentru fiecare tip de cancer . Aceste caracteristici ale cancerului, în combinație cu clasificările subtipurilor de prognostic și stratificarea riscului, au demonstrat că profilarea expresiei genice permite o mai bună înțelegere a fundamentelor moleculare ale, de exemplu, prognosticului și sensibilității la terapie în cancer. Mai mult, profilarea expresiei genice este o abordare moleculară puternică pentru a prezice sensibilitatea la medicamente .

Pentru a genera cataloage de modificări genomice în diferite tipuri de cancer, sunt în curs de dezvoltare proiecte coordonate de genomică a cancerului la scară largă. Cele două proiecte principale sunt Atlasul genomului cancerului (TCGA) și Consorțiul internațional al genomului cancerului (ICGC) , care include multe centre care utilizează diferite platforme pentru a furniza informații genomice despre cancer, cum ar fi expresia genelor, mutațiile ADN, metilarea ADN, expresia proteinelor și date clinice. Aceste proiecte furnizează cantități mari de date genomice pentru a ajuta cercetătorii să genereze sau să testeze ipoteze noi care, în cele din urmă, pot ajuta la dezvoltarea de noi terapii pentru cancer, metode de diagnosticare și strategii preventive . Cu toate acestea, explorarea, integrarea și analiza cantităților mari de date complicate reprezintă o provocare, în special pentru oamenii de știință care nu au cunoștințe de programare computațională sau de informatică.

Utilizarea eficientă a cantităților mari de date privind genomul cancerului rămâne o provocare din cauza limitărilor metodologiilor computaționale și a orientărilor insuficiente. Vizualizarea datelor este foarte utilă pentru o analiză eficientă a datelor și au fost dezvoltate instrumente avansate pentru a facilita vizualizarea datelor, cum ar fi portalurile cu acces liber cBioPortal, UCSC Cancer Browser și canEvolve (tabelul 1). Cu toate acestea, portalurile cu acces liber facilitează în principal investigarea unor seturi mari de date și sunt uneori limitate atunci când se explorează seturile de date mai în profunzime. Aici, descriem o metodă simplă, dar eficientă, de investigare a unor subseturi de eșantioane sau pacienți cu un anumit interes genetic, biologic sau clinic. Ne concentrăm pe profilarea expresiei genice și prezentăm o metodă de analiză a datelor de expresie genică în relație cu metilarea ADN și expresia proteinelor (tabelul 2), care poate fi integrată pentru a testa ipotezele de cercetare pentru tipuri specifice de cancer.

Tabelul 2. Prezentare generală a diferitelor date de genomică a cancerului și tipul pentru profilare.
Tipul genomic Date
Expresia genică ARN-.seq
ARN de tumoră (microarray)
Metilare ADN Metilare (HM27)
Expresie proteică Expresie inversă-phase protein array (RPPA)

Materiale &metode

Protocol pentru profilarea in silico a expresiei genice

Profilarea expresiei genice este o tehnică puternică pentru studierea proceselor biologice la nivel molecular. Activitatea sau expresia genelor poate fi evaluată prin identificarea proteinelor, dar expresia genelor este de obicei investigată prin examinarea mesajului ARN sau a transcriptului. Două metode de mare randament care sunt utilizate în mod obișnuit pentru profilarea cuprinzătoare a expresiei genice sunt secvențierea ARN cu secvențiere de generație următoare (NGS) și microplăcile ADN .

În termeni generali, există două tipuri de abordări ale expresiei genice în cancer: analiza diferențială și analiza relativă. În cadrul abordării diferențiale, se elucidează profilurile de expresie tumorală în raport cu eșantioanele de țesut normal potrivite sau nepotrivite cu pacientul, în timp ce abordarea relativă compară nivelurile de transcriere între tipurile de tumori sau între eșantioanele de celule și țesuturi. În funcție de abordarea specifică, profilarea expresiei genice a probelor și eșantioanelor poate oferi informații nu numai despre biologie, ci și detalii despre structura, alterările și variațiile transcriptelor . Multe portaluri cu acces liber facilitează instrumente de explorare a datelor de expresie genetică. Protocolul nostru este ilustrat cu ajutorul instrumentului furnizat de cBioPortal . Celelalte portaluri cu acces liber, cum ar fi UCSC Cancer Browser și canEvolve, pot fi, de asemenea, utilizate pentru explorarea datelor genomice. Oferim un protocol pas cu pas cu următoarele capitole (Supplemental Protocol):

Overview and selection of cancer dataset of interest (cBioPortal);

Crearea seturilor de cazuri/subseturilor de interes într-un singur studiu;

Analiza integrativă a genelor într-un singur studiu. După definirea studiului de interes privind cancerul în secțiunea 1 și crearea unor subseturi de eșantioane/pacienți cu date clinice sau genetice de interes în secțiunea 2. Această secțiune clasifică fiecare genă din fiecare eșantion și este utilizată pentru toate analizele și vizualizarea datelor genomice;

Colectarea datelor de expresie a genelor și de expresie a proteinelor;

Colectarea datelor de metilare;

Analiză de corelație. Pentru a investiga corelația dintre expresia genelor și fie starea de metilare, fie nivelul proteic, această secțiune oferă un instrument pentru a reprezenta grafic relația;

Vizualizare grafică și analiză statistică. Vizualizarea și analiza seturilor de cazuri de date privind expresia ARNm, metilarea sau expresia proteinelor colectate în secțiunea 5 sau a datelor din analiza de corelație din secțiunea 6.

Rezultate & discuție

Rezultate reprezentative

Mutațiile în gena IDH1 sunt evenimente ancestrale în formarea gliomului de grad scăzut și a glioblastomului secundar . Prezența unei mutații IDH1 (IDH1MUT) este asociată cu o supraviețuire prelungită a pacienților cu gliom comparativ cu pacienții cu IDH1 de tip sălbatic (IDH1WT) . Utilizând posibilitățile de rezultate clinice din cBioPortal, supraviețuirea este ilustrată într-un grafic de supraviețuire globală cu o supraviețuire prelungită de aproximativ șase ori a pacienților cu gliom IDH1MUT în comparație cu pacienții cu gliom IDH1WT (Figura 1).

Figura 1. Analiza reprezentativă a curbelor de supraviețuire generală care compară pacienții cu gliom IDH1MUT și IDH1WT din baza de date TCGA.

Pentru analiză, a fost analizată cohorta fuzionată a studiului privind gliomul de grad scăzut și glioblastomul multiform (TCGA, Cell 2016), incluzând 411 pacienți cu gliom IDH1MUT față de 401 pacienți cu gliom IDH1WT. Supraviețuirea generală Graficul Kaplan-Meier arată o supraviețuire prelungită de aproximativ șase ori a pacienților cu gliom IDH1MUT (roșu) în comparație cu pacienții cu gliom IDH1WT (albastru).

IDH1MUT induce o reconfigurare metabolică care nu este pe deplin înțeleasă, dar explorarea diferențelor în nivelurile de expresie ale enzimelor metabolice este o abordare investigațională promițătoare. Efectele IDH1MUT asupra expresiei genelor care codifică pentru enzimele metabolice oferă o oportunitate de a demonstra posibilitățile oferite de cBioPortal pentru a realiza integrarea, explorarea și analiza datelor. TCGA oferă date din 112 eșantioane de gliom de grad scăzut (LGG) IDH1WT versus 399 IDH1MUT și 157 de eșantioane de glioblastom IDH1WT versus nouă eșantioane de glioblastom IDH1MUT pentru a fi investigate și integrate pentru analiză.

În metabolismul glucozei, au fost selectate genele care codifică pentru enzimele metabolice care limitează viteza: GLUT1/3, HK1, HK1, HK2, HK3, PKLR, PKM2, LDHA și LDHB. În IDH1WT față de IDH1MUT LGG și în probele de pacienți cu glioblastom, au fost observate niveluri mai ridicate de expresie a genelor pentru GLUT3, HK2, PKM2 și LDHA (figura 2), sugerând că gliomul IDH1WT depinde mai mult de glicoliză pentru producerea de ATP decât gliomul IDH1MUT.

Figura 2. Analiza reprezentativă a nivelurilor de expresie a ARNm a enzimelor implicate în metabolismul glucozei în gliomul IDH1WT versus IDH1MUT.

Analiză a probelor de gliom de grad inferior IDH1WT (n = 112) și IDH1MUT (n = 399) și a probelor de glioblastom IDH1WT (n = 157) și IDH1MUT (n = 9), obținute din cBioPortal utilizând seturile de date TCGA Brain Lower Grade Glioma (provizoriu) și Glioblastoma Multiforme (provizoriu). Datele fuzionate ale nivelurilor relative de expresie ARNm sunt prezentate pentru IDH1WT (albastru) și IDH1MUT (roșu).

***p < 0,001; ****p < 0,0001.

G6PD: Glucoză-6-fosfat dehidrogenază; GLUT: Transportator de glucoză; HK: Hexokinază; LDH: Lactat dehidrogenază; PK: Piruvat kinază.

Ca urmare a faptului că mutațiile în IDH1/2 apar, de asemenea, la 20% dintre pacienții cu neoplasme mieloide, inclusiv LMA, un exemplu de analiză a expresiei ARNm a celor trei grupuri, IDHWT, IDH1MUT și IDH2MUT este prezentat în figura 3. Studiul privind leucemia mieloidă acută (AML; TCGA, provizoriu) oferă 136 de probe de AML IDHWT, 16 IDH1MUT și 16 IDH2MUT pentru a investiga profilurile de expresie a genelor. În figura 3, nivelurile de expresie ARNm ale genei ATM, o proteină de răspuns la daunele ADN , în probele de LMA IDHWT, IDH1MUT și IDH2MUT indică faptul că expresia ARNm ATM este grav diminuată în LMA IDH1MUT.

Figura 3. Analiza reprezentativă a nivelurilor de expresie a ARNm a genei ATM în probele de leucemie mieloidă acută IDHWT, IDH1MUT și IDH2MUT.

Analiză a probelor de leucemie mieloidă acută IDHWT (n = 138), IDH1MUT (n = 16) și IDH2MUT (n = 16), obținute din cBioPortal folosind seturile de date TCGA Acute Myeloid Leukemia (provizoriu). Datele privind nivelurile relative de expresie a ARNm sunt prezentate pentru IDHWT (albastru), IDH1MUT (roșu) și IDH2MUT (verde).

**p < 0,01.

Un alt exemplu este ilustrat în Figura 4, care este un grafic al expresiei genice versus metilarea ADN a genei LDHA în LGG. Nivelurile mai scăzute de expresie ale LDHA, așa cum s-a observat în gliomul IDH1MUT, au fost asociate cu hipermetilarea promotorului său (Figura 4A), dar nivelurile mai scăzute de expresie ale genei LDHB în IDH1WT nu au fost corelate cu metilarea (Figura 4B).

Figura 4. Analiză reprezentativă a corelației dintre expresia ARNm și metilarea.

Plotul corelației dintre expresia genei și metilarea ADN a genei (A)LDHA și (B)LDHB în gliomul de grad scăzut (Brain Lower Grade Glioma, provizoriu) în funcție de statutul IDH1MUT (albastru: IDH1WT, roșu: IDH1MUT).

Pentru a investiga dacă nivelurile de expresie a genelor se corelează cu abundența proteinelor, un exemplu ilustrativ este demonstrat în figura 5. În gliomul IDH1MUT, au fost observate niveluri mai scăzute de expresie genetică a G6PD în comparație cu gliomul IDH1WT (Figura 5A), în timp ce nivelurile proteice ale G6PD au fost egale în IDH1MUT și IDH1WT LGG (Figura 5B), sugerând mecanisme post-translaționale suplimentare la lucru .

Figura 5. Analiza reprezentativă a corelației dintre expresia ARNm și abundența proteinelor.

(A) Analiza nivelurilor de expresie genetică a G6PD în gliomul de grad scăzut (LGG) în corelație cu (B) abundența proteică a G6PD în funcție de statusul IDH1MUT (albastru: IDH1WT, roșu: IDH1MUT). (C) Reprezentarea grafică a corelației dintre expresia genetică și abundența proteinelor.

****p < 0,0001.

LGG: Gliom de grad scăzut; ns: Nesemnificativ.

Inovarea constantă a ajutat foarte mult la extinderea înțelegerii noastre asupra cancerului, dar a transformat, de asemenea, cercetarea în domeniul cancerului într-unul dintre domeniile biologiei cu cea mai mare intensitate de date. Proiectele de genomică a cancerului bine structurate și organizate oferă cercetătorilor cantități uriașe de mostre de tumori care sunt pregătite, normalizate și procesate în mod similar pentru analiza computațională în vederea extinderii înțelegerii noastre a geneticii cancerului. Protocolul care este enumerat aici, în combinație cu instrumentele cu acces liber, reduce barierele de acces la aceste date complexe și oferă extragerea datelor mai în profunzime pentru a accelera traducerea datelor genomice în noi perspective biologice și clinice.

Proiectul de genomică a cancerului de gliom a fost unul dintre primele proiecte ale TCGA care a oferit date bine structurate ale probelor tumorale de pe mai multe platforme. Analiza genomică a acestor date a identificat subtipuri de glioblastom relevante din punct de vedere clinic și a delimitat trei clase moleculare diferite în gliomul de grad scăzut, inclusiv clasa cu mutația IDH . Portalurile cu acces liber facilitează accesul la aceste seturi de date, dar sunt limitate în investigarea unor grupuri specifice. Protocolul abordat în această lucrare descrie o metodă simplă de investigare a unor subgrupuri de eșantioane sau pacienți cu un interes genetic, biologic sau clinic specific, cum ar fi eșantioanele tumorale cu mutație IDH. În al doilea rând, protocolul descrie modul de generare a profilurilor de expresie a genelor implicate într-o anumită cale sau proces, cum ar fi metabolismul, în acest subset special de eșantioane. Acest lucru permite selectarea genelor individuale de interes, în loc de explorarea tuturor genelor, și clasifică fiecare genă din fiecare eșantion care este utilizat pentru analiză și vizualizare. În cele din urmă, se oferă o analiză multidimensională pentru a investiga expresia genelor în legătură cu metilarea ADN-ului și expresia proteinelor.

În comparație cu alte instrumente disponibile, acest protocol utilizează instrumente de interfață web care nu necesită software suplimentar. O etapă critică în cadrul protocolului este selectarea studiului sau proiectului corect de genomică a cancerului care conține datele de interes. În prezent, multe portaluri stochează date din seturi de date din literatura de specialitate și din portalul TCGA. Ca exemplu, cBioPortal oferă în prezent 76 de proiecte de genomică a cancerului de expresie genetică (RNAseq și microarray) în combinație cu 21 de proiecte de metilare și 41 de proiecte de expresie a proteinelor. Valabilitatea comparației datelor genomice depinde de cât de bine se potrivește un eșantion cu cel de referință în ceea ce privește prejudecățile tehnice (de exemplu, tipul de procesare a datelor) și biologice (de exemplu, subtipul molecular). Prin urmare, utilizarea portalurilor care furnizează date genomice din proiecte genomice de cancer bine structurate nu necesită tehnici avansate de normalizare și corecții pe loturi.

În concluzie, metoda noastră permite importul și integrarea unui subset selectiv de probe cu un interes genomic, biologic sau clinic specific, cum ar fi alterarea genomică, mutația, subtipurile de cancer sau proprietățile de supraviețuire. Această metodă conține un concept unic pentru a genera profiluri de expresie genetică și pentru a încrucișa aceste profiluri cu metilarea ADN-ului și expresia proteinelor, care pot fi integrate pentru a testa ipotezele de cercetare în subtipuri specifice de cancer.

Perspectivă viitoare

Cercetarea cancerului a evoluat într-una dintre cele mai intensive discipline de date din biologie. Proiectul Genomics Evidence Neoplasia Information Exchange (GENIE) se numără printre cele mai mari seturi de date genomice privind cancerul complet publice publicate până în prezent. Portalurile ușor de gestionat, cum ar fi cBioPortal, vor juca un rol din ce în ce mai esențial în această disciplină.

Contribuții ale autorilor

MK a conceput și a efectuat cercetarea, RJM și CJFvN au supravegheat studiul, MK și CJFvN au scris manuscrisul, toți autorii au citit și au aprobat versiunea finală a manuscrisului

Dezvăluirea intereselor financiare & concurente

Această cercetare a fost susținută de Societatea Olandeză de Cancer (KWF granturi UVA 2014-6839 și AMC 2016.1-10460). Autorii nu au alte afilieri relevante sau implicare financiară cu nicio organizație sau entitate cu un interes financiar sau un conflict financiar cu subiectul sau materialele discutate în manuscris, în afară de cele dezvăluite.

Nu a fost utilizată asistență de scriere în producerea acestui manuscris.

  • 1. Hanahan D, Weinberg RA. Semnele distinctive ale cancerului. Cell 100(1), 57-70 (2000). crossref, Medline, CAS, Google Scholar
  • 2. Chang JC, Wooten EC, Tsimelzon A et al. Gene expression profiling for the prediction of therapeutic response to docetaxel in patients with breast cancer. Lancet 362(9381), 362-369 (2003).Crossref, Medline, CAS, Google Scholar
  • 3. Byron SA, Van Keuren-Jensen KR, Engelthaler DM, Carpten JD, Craig DW. Transpunerea secvențierii ARN în diagnosticul clinic: oportunități și provocări. Nat. Rev. Genet. 17(5), 257-271 (2016).Crossref, Medline, CAS, Google Scholar
  • 4. International Cancer Genome C, Hudson TJ, Anderson W et al. International network of cancer genome projects. Nature 464(7291), 993-998 (2010).Crossref, Medline, Google Scholar
  • 5. Chin L, Andersen JN, Futreal PA. Genomica cancerului: de la știința descoperirii la medicina personalizată. Nat. Med. 17(3), 297-303 (2011).Crossref, Medline, CAS, Google Scholar
  • 6. Weeraratna AT, Nagel JE, De Mello-Coelho V, Taub DD. Profilarea expresiei genice: de la microarrays la medicină. J. Clin. Immunol. 24(3), 213-224 (2004).Crossref, Medline, CAS, Google Scholar
  • 7. Johnson JM, Castle J, Garrett-Engele P et al. Genome-wide survey of human alternative pre-mRNA splicing with exon junction microarrays. Science 302(5653), 2141-2144 (2003).Crossref, Medline, CAS, Google Scholar
  • 8. Trapnell C, Williams BA, Pertea G et al. Transcript assembly and quantification by RNA-Seq reveals unannotated transcripts and isoform switching during cell differentiation. Nat. Biotechnol. 28(5), 511-515 (2010).Crossref, Medline, CAS, Google Scholar
  • 9. Gao J, Aksoy BA, Dogrusoz U et al. Integrative analysis of complex cancer genomics and clinical profiles using the cBioPortal. Sci. Signal 6(269), pl1 (2013).Crossref, Medline, Google Scholar
  • 10. Cerami E, Gao J, Dogrusoz U et al. The cBio cancer genomics portal: an open platform for exploring multidimensional cancer genomics data. Cancer Discov. 2(5), 401-404 (2012).Crossref, Medline, Google Scholar
  • 11. Parsons DW, Jones S, Jones S, Zhang X et al. An integrated genomic analysis of human glioblastoma multiforme. Science 321(5897), 1807-1812 (2008).Crossref, Medline, CAS, Google Scholar
  • 12. Balss J, Meyer J, Mueller W, Korshunov A, Hartmann C, Von Deimling A. Analysis of the IDH1 codon 132 mutation in brain tumors. Acta Neuropathol 116(6), 597-602 (2008).Crossref, Medline, CAS, Google Scholar
  • 13. Bleeker FE, Atai NA, Lamba S et al. Mutația prognostică IDH1(R132) este asociată cu o activitate IDH dependentă de NADP+ redusă în glioblastom. Acta Neuropathol. 119(4), 487-494 (2010).Crossref, Medline, CAS, Google Scholar
  • 14. Khurshed M, Molenaar RJ, Lenting K, Leenders WP, Van Noorden CJF. Analiza in silico a expresiei genice relevă glicoliza și anapleroza acetatului în gliomul de tip sălbatic IDH1 și anapleroza lactatului și a glutamatului în gliomul cu mutație IDH1. Oncotarget 8(30), 49165-49177 (2017).Crossref, Medline, Google Scholar
  • 15. Khurshed M, Aarnoudse N, Hulsbos R et al. IDH1-mutant celulele canceroase mutante IDH1 sunt sensibile la cisplatin și un inhibitor IDH1-mutant contracarează această sensibilitate. FASEB J. 32, 6344-6352 (2018).Crossref, Google Scholar
  • 16. Molenaar RJ, Radivoyevitch T, Nagata Y et al. Mutațiile IDH1/2 sensibilizează leucemia mieloidă acută la inhibiția PARP și acest lucru este inversat de inhibitorii IDH1/2-mutanți. Clin. Cancer Res. 24(7), 1705-1715 (2018).Crossref, Medline, CAS, Google Scholar
  • 17. Frederiks WM, Bosch KS, De Jong JS, Van Noorden CJ. Reglarea post-translațională a activității glucoză-6-fosfat dehidrogenazei în leziunile (pre)neoplazice în ficatul de șobolan. J. Histochem. Cytochem. 51(1), 105-112 (2003).Crossref, Medline, CAS, Google Scholar
  • 18. Verhaak RG, Hoadley KA, Purdom E et al. Analiza genomică integrată identifică subtipuri relevante din punct de vedere clinic de glioblastom caracterizate prin anomalii în PDGFRA, IDH1, EGFR și NF1. Cancer Cell 17(1), 98-110 (2010).Crossref, Medline, CAS, Google Scholar
  • 19. Cancer Genome Atlas Research N, Brat DJ, Verhaak RG et al. Comprehensive, integrative genomic analysis of diffuse lower-grade gliomas. N. Engl. J. Med. 372(26), 2481-2498 (2015).Crossref, Medline, Google Scholar

.