がんゲノムデータのサブセットから遺伝子発現プロファイルを生成するシンプルなインシリコアプローチ

過去10年間、ゲノム技術の進歩により生物学的プロセスや疾患の分子メカニズムの特定が可能になり、臨床研究のあらゆる分野、特にがんに影響を与えている。 腫瘍内不均一性、がん細胞ゲノムの動的変化、遺伝子異常は、がんの種類ごとに固有の指紋である。 このようながんの特徴は、予後のサブタイプ分類やリスク層別化と相まって、遺伝子発現プロファイリングによって、例えばがんの予後や治療感受性などの分子的背景をより深く理解できることを実証しています。 さらに、遺伝子発現プロファイリングは、薬剤感受性を予測するための強力な分子的アプローチである。 その代表的なものが、がんゲノムアトラス(TCGA)と国際がんゲノムコンソーシアム(ICGC)であり、多くの施設が異なるプラットフォームを利用して、遺伝子発現、DNA変異、DNAメチル化、タンパク質発現、臨床データなどのがんゲノミクス情報を提供しています。 これらのプロジェクトは、研究者が新しい仮説を立て、それを検証し、最終的に新しいがん治療法、診断法、予防法の開発に役立てるために、大量のゲノムデータを提供しています。 しかし、大量の複雑なデータの探索、統合、解析は、特に計算プログラミングや情報科学のバックグラウンドがない科学者にとって困難です。

計算手法の限界と不十分なガイダンスにより、大量のがんゲノムデータの有効利用は依然として課題となっています。 データの可視化は効率的なデータ解析に非常に有効であり、オープンアクセスのポータルサイトであるcBioPortal、UCSC Cancer Browser、canEvolveなど、データの可視化を容易にする高度なツールが開発されている(表1)。 しかし、オープンアクセスポータルは、主に大規模なデータセットの調査を容易にし、より深くデータセットを調査する際に制限されることがある。 ここでは、特定の遺伝学的、生物学的、臨床的な興味を持つサンプルや患者のサブセットを調査するためのシンプルで効果的な方法について説明します。 遺伝子発現のプロファイリングに焦点を当て、DNAメチル化とタンパク質発現に関連した遺伝子発現データの解析方法(表2)を紹介し、特定の種類の癌に対する研究仮説を検証するために統合することができる。 プロファイリングのためのさまざまながんゲノミクスデータとその種類の概要。

ゲノムタイプ データ 遺伝子発現 RNA->

Data Gene expressionTumor RNA (microarray) DNA methylation Methylation (HM27) タンパク質発現 Reverse->Tumor RNA (マイクロアレイ) TMS (マイクロアレイ) (マイクロアレイ) (HM27) (HM27) (メチレーション)Phase protein array (RPPA)

材料&方法

インシリコ遺伝子発現プロファイリングのプロトコル

遺伝子発現プロファイルは生物プロセスを分子レベルで研究できる強力な技術である。 遺伝子の活性や発現はタンパク質の同定によって評価できますが、遺伝子の発現は通常、RNAメッセージや転写物を調べることによって調査されます。 包括的な遺伝子発現プロファイリングによく使われるハイスループットな2つの方法は、次世代シーケンサー(NGS)によるRNA配列決定とDNAマイクロアレイです。

一般論として、がんにおける遺伝子発現アプローチには、差分分析と相対分析という2種類のアプローチがあります。 差分解析では、患者と一致する、あるいは一致しない正常組織サンプルに対する腫瘍の発現プロファイルが解明され、一方、相対解析では、腫瘍タイプあるいは細胞および組織サンプル間の転写レベルを比較する。 特定のアプローチによりますが、サンプルや検体の遺伝子発現プロファイリングは、生物学的な洞察をもたらすだけでなく、転写物の構造、変化やバリエーションの詳細を提供することができます。 多くのオープンアクセスポータルは、遺伝子発現データを探索するためのツールを提供しています。 私たちのプロトコルは、cBioPortal が提供するツールを使って説明されています。 UCSC Cancer Browser や canEvolve などの他のオープンアクセスポータルも同様に、ゲノムデータの探索に使用することができます。 また、次の章では、プロトコルを順を追って説明します(Supplemental Protocol)。

概略と目的のがんデータセットの選択(cBioPortal)。

単一研究における興味のあるケースセット/サブセットの作成;

単一研究における遺伝子統合的な解析。 1項で興味のある癌研究を定義し、2項で興味のある臨床データや遺伝データを持つサンプル/患者のサブセットを作成した後。 各サンプル中の各遺伝子を分類し、すべてのゲノムデータ解析と可視化に使用します。

遺伝子発現データおよびタンパク質発現データの収集です。

メチル化データの収集;

相関分析………………………………. 遺伝子発現とメチル化状態またはタンパク質レベルの相関を調べるために、その関係をプロットするツールを提供する。

グラフィックによる可視化と統計的解析。 第5項で収集したmRNA発現、メチル化、タンパク質発現データのケースセット、または第6項の相関解析のデータを可視化し、解析する。

結果 & discussion

Representative results

IDH1 遺伝子における変異は低グレードグリオーマと二次グリオブラストーマ形成における祖型的イベントである.IDH1 遺伝子における変異は、グリオバストーマの形成に関与する。 IDH1変異(IDH1MUT)の存在は、IDH1野生型(IDH1WT)患者と比較して、神経膠腫患者の生存期間の延長と関連している。 cBioPortalの臨床転帰の可能性を利用して、IDH1MUT神経膠腫患者の生存期間がIDH1WT神経膠腫患者の約6倍延長していることを全生存プロットで示しました(図1)。 TCGAデータベースにおけるIDH1MUTおよびIDH1WT神経膠腫患者を比較した全生存曲線の代表的な解析結果

解析には、411人のIDH1MUT対401人のIDH1WT神経膠腫患者を含む低級神経膠腫および多形膠芽腫のマージコホート (TCGA, Cell 2016) 試験が分析されました。 全生存期間Kaplan-Meierプロットは、IDH1WT神経膠腫患者(青)と比較してIDH1MUT神経膠腫患者(赤)の約6倍の生存期間の延長を示している。

IDH1MUTは代謝の再配線を誘発するが、完全に理解されていない代謝酵素の発現レベルの差の探索は、有望な調査的アプローチと言える。 代謝酵素をコードする遺伝子の発現に対するIDH1MUTの影響は、データ統合、探索、解析を行うcBioPortalの可能性を示す機会を提供するものである。 TCGAでは、112のIDH1WT対399のIDH1MUT低悪性度グリオーマ(LGG)サンプルおよび157のIDH1WT対9のIDH1MUTグリオブラストーマサンプルのデータを調査・統合し解析することができます

糖代謝では、律速代謝酵素をコードする遺伝子を選択しました。 GLUT1/3、HK1、HK2、HK3、PKLR、PKM2、LDHA、LDHBです。 IDH1WTとIDH1MUTのLGGおよび神経膠芽腫患者サンプルでは、GLUT3、HK2、PKM2およびLDHAでより高い遺伝子発現レベルが観察され(図2)、IDH1MUT神経膠腫よりもIDH1WT神経膠腫がATP生成に解糖により依存していることが示唆された。 IDH1WTとIDH1MUT神経膠腫におけるグルコース代謝に関与する酵素のmRNA発現レベルの代表的な解析結果。

TCGAデータセットBrain Lower Grade Glioma(仮)およびGlioblastoma Multiforme(仮)を用いてcBioPortalから取得したIDH1WT(n = 112)およびIDH1MUT(n = 399)低悪性度神経膠腫およびIDH1WT(n = 157)およびIDH1MUT(n = 9)膠芽腫サンプルの分析結果を示します。 IDH1WT(青)とIDH1MUT(赤)について、相対mRNA発現量のマージデータを示す。

***p < 0.001; ****p < 0.0001.

G6PD: Glucose-6-phosphate dehydrogenase; GLUT.G6PD: Glucose-6-phosphate dehydrogenase; GLUT.G6PD: Glucose-6-phosphate dehydrogenase; G6PD: Glucose-6-phosphate dehydrogenase; GLUT.IDH1WT: IDH1MUT Glucose transporter; HK: Hexokinase; LDH: Lactate dehydrogenase; PK: Pyruvate kinase.

IDH1/2の変異もAMLなどの骨髄性新生物患者の20%に見られるため、IDHWT、IDH1MUT、IDH2MUTという3群のmRNA発現解析例を図3にあげさせていただきました。 急性骨髄性白血病(AML; TCGA, Provisional)の研究では、IDHWT136、IDH1MUT16、IDH2MUT16のAMLサンプルを提供して、遺伝子発現プロファイルを調査しています。 図3では、IDHWT、IDH1MUT、IDH2MUT AMLサンプルにおけるDNA損傷応答タンパク質であるATM遺伝子のmRNA発現量から、IDH1MUT AMLではATM mRNA発現が著しく低下していることが示されている

Figure 3. IDHWT、IDH1MUT、IDH2MUT急性骨髄性白血病サンプルにおけるATM遺伝子のmRNA発現量の代表的な解析結果。

TCGAデータセットAcute Myeloid Leukemia(仮)を用いてcBioPortalから得られたIDHWT(n=138)、IDH1MUT(n=16)、IDH2MUT(n=16)急性骨髄性白血病サンプルの分析結果です。 IDHWT(青)、IDH1MUT(赤)、IDH2MUT(緑)についての相対mRNA発現レベルのデータを示す。

**p <0.01.

別の例を図4に示す。これはLGGにおけるLDHA遺伝子の遺伝子発現対DNAメチル化プロットを示すものである。 IDH1MUT神経膠腫で観察されたようなLDHAの低い発現レベルは、そのプロモーターの高メチル化と関連していたが(図4A)、IDH1WTにおけるLDHB遺伝子の低い発現レベルはメチル化と相関していなかった(図4B)

Figure 4. mRNA発現とメチル化の相関の代表的な解析結果。

IDH1MUTの状態(青:IDH1WT、赤:IDH1MUT)による低悪性度グリオーマ(Brain Lower Grade Glioma、仮称)における(A)LDHA遺伝子、(B)LDHB遺伝子の遺伝子発現とDNAメチル化の相関のプロット図。

遺伝子発現量とタンパク質量に相関があるかどうかを調べるために、図5に例示する。 IDH1MUT神経膠腫では、IDH1WT神経膠腫と比較して、G6PDの低い遺伝子発現レベルが観察されたが(図5A)、G6PDのタンパク質レベルはIDH1MUTとIDH1WT LGGで等しかった(図5B)、働いて追加の翻訳後メカニズムを示唆した.

Figure 5. mRNA発現量とタンパク質存在量の相関の代表的な解析結果。

(A)低悪性度グリオーマ(LGG)におけるG6PDの遺伝子発現量と(B)IDH1MUT状態(青:IDH1WT、赤:IDH1MUT)に応じたG6PDのタンパク質存在量の相関の解析結果。 (C)遺伝子発現とタンパク質存在量の相関のプロット。

****p < 0.0001.

LGG: Low grade glioma; ns:

絶え間ない革新は、がんに対する理解の拡大を大いに助けたが、同時にがん研究を生物学の中で最もデータ集約的な分野のひとつに変貌させた。 よく構造化され組織化されたがんゲノミクスプロジェクトは、研究者に膨大な量の腫瘍サンプルを提供し、同様に準備し、正規化し、がん遺伝学の理解を広げるために計算機解析のために処理されている。 ここで紹介するプロトコルとオープンアクセスツールの組み合わせは、これらの複雑なデータへのアクセスの障壁を低くし、より深いデータマイニングを提供し、ゲノムデータの新しい生物学的および臨床的洞察への変換を加速させることができます。 これらのデータのゲノム解析により、臨床的に関連する膠芽腫のサブタイプが特定され、IDH変異を有するクラスを含む低悪性度神経膠腫の3つの異なる分子クラスが定義された。 オープンアクセスポータルは、これらのデータセットへのアクセスを容易にするが、特定のグループの調査には限界がある。 この論文で取り上げたプロトコルは、IDH 変異を持つ腫瘍サンプルのような、特定の遺伝学的、生物学的、臨床的関心を持つサンプルや患者のサブセットを調査する簡単な方法を説明するものである。 次に、このプロトコルは、この特定のサブセットのサンプルにおいて、代謝などの特定の経路やプロセスに関与する遺伝子の発現プロファイルを作成する方法を説明する。 これにより、すべての遺伝子を探索するのではなく、関心のある個々の遺伝子を選択し、解析と可視化に使用する各サンプルの各遺伝子を分類することができます。 最後に、DNA メチル化およびタンパク質発現に関連する遺伝子発現を調査するための多次元解析が提供される。

利用可能な他のツールと比較して、このプロトコルは追加のソフトウェアを必要としないウェブインターフェースツールを利用する。 このプロトコルの重要なステップは、目的のデータを含む正しいがんゲノミクス研究またはプロジェクトを選択することである。 現在、多くのポータルサイトには、文献やTCGAポータルサイトのデータセットからデータが保存されている。 一例として、cBioPortal は現在、遺伝子発現(RNAseq とマイクロアレイ)の 76 のがんゲノミクスプロジェクトと、21 のメチル化プロジェクトおよび 41 のタンパク質発現プロジェクトを組み合わせて提供しています。 ゲノミクスデータの比較の妥当性は、技術的(データ処理の種類など)および生物学的(分子サブタイプなど)バイアスの観点から、サンプルがリファレンスにどれだけマッチしているかに依存します。 したがって、十分に構造化されたがんゲノムプロジェクトから得られたゲノムデータを提供するポータルを使用すれば、高度な正規化技術やバッチ補正は必要ない。

以上のことから、我々の方法は、ゲノム変化、突然変異、がんサブタイプ、生存特性など、特定のゲノム、生物、臨床的関心を持つサンプルの選択的サブセットのインポートと統合が可能であることがわかる。 この方法は、遺伝子発現プロファイルを生成し、これらのプロファイルをDNAメチル化およびタンパク質発現とクロスリンクさせるユニークな概念を含んでおり、がんの特定のサブタイプにおける研究仮説を検証するために統合することができます。 GENIE(Genomics Evidence Neoplasia Information Exchange)プロジェクトは、これまでに公開された最大のがんゲノムデータセットの一つである。 cBioPortalのような簡単に管理できるポータルは、この分野でますます重要な役割を果たすことでしょう。

著者貢献

MKは研究の設計と実行、RJMとCJFvNは研究の監督、MKとCJFvNは原稿を執筆した。 all authors read and approved final version of manuscript

Financial & competing interests disclosure

本研究は、オランダ癌協会(KWF grants UVA 2014-6839 and AMC 2016.による支援を受けています。1-10460). 著者は、開示されたもの以外に、原稿で議論された主題または材料に金銭的利害関係を有する組織または団体と関連する所属または金銭的関与はない

この原稿の作成に執筆支援は利用しなかった

  • 1. Hanahan D, Weinberg RA.(英語)。 癌の特徴(The hallmarks of cancer)。 Cell 100(1), 57-70 (2000).Crossref, Medline, CAS, Google Scholar
  • 2. Chang JC, Wooten EC, Tsimelzon A et al. Gene expression profiling for the prediction of therapeutic response to docetaxel in patients with breast cancer.Gene expression profiling for the prediction of treatment response to docetaxel in patients. Lancet 362(9381), 362-369 (2003).Crossref, Medline, CAS, Google Scholar
  • 3. Byron SA, Van Keuren-Jensen KR, Engelthaler DM, Carpten JD, Craig DW.「乳がん患者の治療効果予測に向けた遺伝子発現プロファイリング」(日本評論社). RNAシーケンシングを臨床診断に応用する:機会と課題。 Nat. Rev. Genet. 17(5), 257-271 (2016).Crossref, Medline, CAS, Google Scholar
  • 4. International Cancer Genome C, Hudson TJ, Anderson W et al. International network of cancer genome projects.国際がんゲノムプロジェクト. Nature 464(7291), 993-998 (2010).Crossref、Medline、Google Scholar
  • 5. Chin L, Andersen JN, Futreal PA. がんゲノム科学:発見科学から個別化医療へ。 Nat. Med. 17(3), 297-303 (2011).Crossref, Medline, CAS, Google Scholar
  • 6. Weeraratna AT, Nagel JE, De Mello-Coelho V, Taub DD.「がんゲノム:発見科学から個別化医療へ」。 遺伝子発現プロファイリング:マイクロアレイから医療へ。 J. Clin. Immunol. 24(3), 213-224 (2004).Crossref, Medline, CAS, Google Scholar
  • 7. Johnson JM, Castle J, Garrett-Engele P et al. Genome-wide survey of human alternative pre-mRNA splicing with exon junction microarrays.ヒトのプレmRNAの代替スプライシングのゲノムワイドな調査。 また、RNA-Seqによる転写物の組み立てと定量化により、細胞分化時の未注釈転写物やアイソフォームスイッチングを明らかにした。 Nat. Biotechnol. 28(5), 511-515 (2010).Crossref、Medline、CAS、Google Scholar
  • 9. Gao J, Aksoy BA, Dogrusoz U et al. cBioPortalを用いた複雑ながんゲノムと臨床プロファイルの統合的な解析. Sci. Signal 6(269), pl1 (2013).Crossref、Medline、Google Scholar
  • 10. Cerami E, Gao J, Dogrusoz U et al. cBio cancer genomics portal: an open platform for exploring multidimensional cancer genomics data.(cBioがんゲノムポータル:多次元がんゲノムデータ探索のためのオープンプラットフォーム)。 Cancer Discov. 2(5), 401-404 (2012).Crossref、Medline、Google Scholar
  • 11. Parsons DW, Jones S, Zhang X et al. An integrated genomic analysis of human glioblastoma multiforme(ヒト多形性膠芽腫の統合ゲノム解析). Science 321(5897), 1807-1812 (2008).Crossref、Medline、CAS、Google Scholar
  • 12. Balss J, Meyer J, Mueller W, Korshunov A, Hartmann C, Von Deimling A. Analysis of the IDH1 codon 132 mutation in brain tumors.「脳腫瘍におけるIDH1コドン132変異の解析」. Acta Neuropathol 116(6), 597-602 (2008).Crossref, Medline, CAS, Google Scholar
  • 13. Bleeker FE, Atai NA, Lamba S et al. 予後を左右する IDH1(R132) 変異は、グリオブラストーマにおける NADP+ 依存型 IDH 活性の低下と関連している。 Acta Neuropathol. 119(4), 487-494 (2010).Crossref、Medline、CAS、Google Scholar
  • 14. Khurshed M, Molenaar RJ, Lenting K, Leenders WP, Van Noorden CJF. インシリコ遺伝子発現解析により、IDH1野生型グリオーマでは解糖と酢酸のアポトーシスが、IDH1変異型グリオーマでは乳酸とグルタミン酸のアポトーシスが明らかになりました。 Oncotarget 8(30), 49165-49177 (2017).Crossref, Medline, Google Scholar
  • 15.Oncotarget 8(30), 49165-49177 (2017).Crossref, Medline, Google Scholar
  • 15. Khurshed M, Aarnoudse N, Hulsbos R et al. IDH1変異がん細胞はシスプラチンに感受性があり、IDH1変異阻害剤はこの感受性を打ち消す。 FASEB J. 32, 6344-6352 (2018).Crossref, Google Scholar
  • 16. Molenaar RJ, Radivoyevitch T, Nagata Y et al. IDH1/2変異は急性骨髄性白血病をPARP阻害に感作し、これはIDH1/2変異阻害剤によって打ち消される. Clin. Cancer Res. 24(7), 1705-1715 (2018).Crossref, Medline, CAS, Google Scholar
  • 17.Cancer Res.24(7),1705-1715(2018)。 フレデリクスWM、ボッシュKS、デヨングJS、ヴァンヌールデンCJ. ラット肝の(前)腫瘍性病変におけるグルコース-6-リン酸デヒドロゲナーゼ活性の翻訳後制御。 J. Histochem. Cytochem. 51(1), 105-112 (2003).Crossref、Medline、CAS、Google Scholar
  • 18. Verhaak RG、Hoadley KA、Purdom Eら、統合ゲノム解析は、PDGFRA、IDH1、EGFR、およびNF1の異常によって特徴付けられる膠芽腫の臨床的に関連するサブタイプを同定する。 Cancer Cell 17(1), 98-110 (2010).Crossref、Medline、CAS、Google Scholar
  • 19.Cancer Cell 17(1), 98-110 (2010). Cancer Genome Atlas Research N, Brat DJ, Verhaak RG et al. Comprehensive, integrative genomic analysis of diffuse lower-grade gliomas(びまん性低悪性度グリオーマの包括的統合ゲノム解析)。 N. Engl. J. Med. 372(26), 2481-2498 (2015).Crossref, Medline, Google Scholar

.