I det seneste årti har fremskridt inden for genomteknologier gjort det muligt at identificere molekylære mekanismer for biologiske processer og sygdomme, hvilket har haft indflydelse på alle områder af klinisk forskning, især kræft. Intratumoral heterogenitet, dynamiske ændringer i kræftcellers genom og genetiske aberrationer er unikke fingeraftryk for hver enkelt kræfttype . Disse kræfttræk i kombination med prognostiske subtypeklassifikationer og risikostratificering har vist, at genekspressionsprofilering giver mulighed for en bedre forståelse af de molekylære baggrunde for f.eks. prognose og behandlingsfølsomhed ved kræft. Desuden er genekspressionsprofilering en effektiv molekylær metode til at forudsige lægemiddelfølsomhed.
For at generere kataloger over genomiske ændringer i forskellige kræfttyper er der ved at blive udviklet koordinerede kræftgenomiske projekter i stor skala. De to vigtigste projekter er Cancer Genome Atlas (TCGA) og International Cancer Genome Consortium (ICGC) , som omfatter mange centre, der anvender forskellige platforme til at levere kræftgenomiske oplysninger såsom genekspression, DNA-mutationer, DNA-methylering, proteinekspression og kliniske data. Disse projekter leverer store mængder genomiske data, der kan hjælpe forskerne med at opstille eller afprøve nye hypoteser, som i sidste ende kan bidrage til udviklingen af nye kræftbehandlinger, diagnostiske metoder og forebyggelsesstrategier . Udforskning, integration og analyse af de store mængder komplicerede data er imidlertid en udfordring, især for forskere, der ikke har en baggrund i computerprogrammering eller informatik.
Den effektive udnyttelse af de store mængder kræftgenomdata er fortsat en udfordring på grund af begrænsningerne i beregningsmetoderne og utilstrækkelig vejledning. Datavisualisering er meget nyttig for effektiv dataanalyse, og der er blevet udviklet avancerede værktøjer til at lette datavisualisering, såsom portalerne med åben adgang cBioPortal, UCSC Cancer Browser og canEvolve (tabel 1). Portaler med åben adgang letter dog hovedsagelig undersøgelser af store datasæt og er undertiden begrænsede, når datasættene skal udforskes mere indgående. Her beskriver vi en enkel, men effektiv metode til at undersøge delmængder af prøver eller patienter med en specifik genetisk, biologisk eller klinisk interesse. Vi fokuserer på profilering af genekspression og præsenterer en metode til analyse af genekspressionsdata i forhold til DNA-methylering og proteinekspression (tabel 2), som kan integreres for at teste forskningshypoteser for specifikke kræfttyper.
Genomisk type | Data |
---|---|
Genekspression | RNA-seq Tumor-RNA (microarray) |
DNA-methylering | Methylering (HM27) |
Proteinekspression | Reverse-phase protein array (RPPA) |
Materialer &metoder
Protokol for in silico genekspressionsprofilering
Genekspressionsprofilering er en effektiv teknik til undersøgelse af biologiske processer på molekylært niveau. Genaktivitet, eller ekspression, kan vurderes ved identifikation af proteiner, men genekspression undersøges normalt ved at undersøge RNA-meddelelsen eller transkriptet. To højtydende metoder, der almindeligvis anvendes til omfattende genekspressionsprofilering, er RNA-sekventering med næste generations sekventering (NGS) og DNA-mikroarrays .
Generelt er der to typer af genekspressionsmetoder inden for kræft: den differentielle og den relative analyse. I den differentielle tilgang belyses tumorekspressionsprofiler i forhold til de patientmatchede eller ikke-matchede normale vævsprøver, mens den relative tilgang sammenligner transkriptniveauer på tværs af tumortyper eller celle- og vævsprøver. Afhængigt af den specifikke fremgangsmåde kan genekspressionsprofilering af prøver og eksemplarer give indsigt ikke blot i biologi, men også i detaljer om struktur, ændringer og variationer i transkriptioner . Mange portaler med fri adgang gør det muligt at anvende værktøjer til udforskning af genekspressionsdata. Vores protokol er illustreret med det værktøj, der leveres af cBioPortal . Andre portaler med åben adgang, f.eks. UCSC Cancer Browser og canEvolve, kan ligeledes anvendes til udforskning af genomiske data. Vi giver en trin-for-trin-protokol med de næste kapitler (Supplerende protokol):
Oversigt og udvælgelse af kræftdatasæt af interesse (cBioPortal); |
|||||
Oprettelse af casesæt/undersæt af interesse i en enkelt undersøgelse; |
|||||
Integrativ analyse af gener i en enkelt undersøgelse. Efter definition af den kræftundersøgelse af interesse i afsnit 1 og oprettelse af delmængder af prøver/patienter med kliniske eller genetiske data af interesse i afsnit 2. Dette afsnit klassificerer hvert gen i hver prøve og anvendes til al analyse og visualisering af genomiske data; |
|||||
Indsamling af gen- og proteinekspressionsdata; |
|||||
Indsamling af methyleringsdata; |
|||||
Korrelationsanalyse. For at undersøge sammenhængen mellem genekspression og enten methyleringsstatus eller proteinniveau indeholder dette afsnit et værktøj til at plotte forholdet; |
|||||
Grafisk visualisering og statistisk analyse. Visualisering og analyse af casesæt af mRNA-ekspressions-, methylerings- eller proteinekspressionsdata indsamlet i afsnit 5 eller data fra korrelationsanalysen i afsnit 6. |
Resultater &diskussion
Repræsentative resultater
Mutationer i IDH1-genet er ancestrale begivenheder i dannelsen af lavgradsgliom og sekundært glioblastom . Tilstedeværelsen af en IDH1-mutation (IDH1MUT) er forbundet med forlænget overlevelse hos gliom-patienter sammenlignet med IDH1-wildtype (IDH1WT) patienter . Ved hjælp af de kliniske udfaldsmuligheder i cBioPortal illustreres overlevelsen i et samlet overlevelsesplot med ca. seks gange længere overlevelse for IDH1MUT-gliom-patienter sammenlignet med IDH1WT-gliom-patienter (figur 1).
IDH1MUT inducerer metabolisk omfordeling, som ikke er fuldt forstået, men udforskning af forskelle i ekspressionsniveauer af metaboliske enzymer er en lovende undersøgelsestilgang. Virkningerne af IDH1MUT på ekspressionen af gener, der koder for metaboliske enzymer, giver en mulighed for at demonstrere mulighederne i cBioPortal til at udføre dataintegration, udforskning og analyse. TCGA tilbyder data fra 112 IDH1WT versus 399 IDH1MUT-prøver af lavgradsgliom (LGG) og 157 IDH1WT versus ni IDH1MUT-prøver af glioblastom til undersøgelse og integration med henblik på analyse.
I glukosemetabolismen blev der udvalgt gener, der koder for hastighedsbegrænsende metaboliske enzymer: GLUT1/3, HK1, HK1, HK2, HK3, PKLR, PKM2, LDHA og LDHB. I IDH1WT versus IDH1MUT LGG- og glioblastom-patientprøver blev der observeret højere niveauer af genekspression for GLUT3, HK2, PKM2 og LDHA (figur 2), hvilket tyder på, at IDH1WT-gliomer er mere afhængige af glykolyse til ATP-produktion end IDH1MUT-gliomer.