资讯动态
lncRNA Epigenetic Landscape Analysis Identifies EPIC1 as an Oncogenic lncRNA that Interacts with MYC and Promotes Cell-Cycle Progression in Cancer
lncRNA Epigenetic Landscape Analysis Identifies EPIC1 as an Oncogenic lncRNA that Interacts with MYC and Promotes Cell-Cycle Progression in Cancer
lncRNA表观遗传分析将EPIC1鉴定为与MYC相互作用并促进癌细胞周期进程的致癌lncRNA
期刊:Cancer Cell;影响因子:22.844
发表单位:匹兹堡大学
导 读
TCGA lncRNA启动子区甲基化数据分析寻找重要的lncRNA,发现EPIC1作为潜在的致癌lncRNA,通过其129-283nt区域与MYC蛋白相互作用从而调节细胞周期进程发挥作用。
摘 要
我们描述了编码长链非编码RNA(lncRNA)的基因的表观遗传景观,涉及6,475个肿瘤和455个癌细胞系。与癌症中的CpG岛高甲基化表型形成鲜明对比,我们观察到癌症中1,006个lncRNA基因的复发低甲基化,包括EPIC1(表观遗传学诱导的lncRNA1)。EPIC1的过度表达与管腔B乳腺癌患者的预后不良有关,并在体外和体内增强肿瘤生长。从机制上讲,EPIC1通过EPIC1的129-283区域与MYC相互作用促进细胞周期进程。EPIC1敲低降低了MYC对其靶基因(例如,CDKN1A,CCNA2,CDC20和CDC45)的占据。MYC消耗在体外和体内消除了EPIC1对MYC靶标和管腔乳腺癌肿瘤发生的调节。
研究背景
最近对人类癌症转录组的全基因组表征已经证明lncRNA表达是癌症中最普遍的转录变化之一。表观遗传调节是用于控制lncRNA表达和组织特异性的主要机制之一。表观遗传改变已被确定为肿瘤发生的标志之一。然而,lncRNA基因的表观遗传改变及其在癌症中的后果仍未得到很好的表征。基因组规模研究已经对肿瘤中的DNA甲基化变化产生了重要的见解,但主要集中在PCG启动子上。在癌症中表征lncRNA表观遗传景观的努力已经在lncRNA的不完整注释和缺乏能够检测癌症中lncRNA表观遗传和表达改变的平台的限制下进行。大规模癌症基因组/表观遗传项目的出现,如癌症基因组图谱(TCGA)研究网络项目,为表征癌症中lncRNA表观遗传景观提供了极好的机会。
结 果
1 与PCG启动子相比,LncRNA启动子在癌症中表现出不同的表观遗传改变模式
为了研究癌症中的lncRNA DNA甲基化,我们开发了一种计算方法,将HM450探针重新用于lncRNA启动子。我们首先通过使用TCGA Pan-Cancer数据库(syn4382671,表S1)比较肿瘤和正常组织之间的lncRNA启动子的DNA甲基化谱来确定癌症中的lncRNA DNA甲基化模式。我们在乳腺癌组织中观察到高甲基化和低甲基化的lncRNA启动子。该观察结果与PCG启动子形成鲜明对比,PCG启动子主要在乳腺癌中高度甲基化。在不与PCG共享启动子的基因间lncRNA中,有504个基因间lncRNA启动子显示显著的低甲基化,639个基因间lncRNA启动子显示乳腺癌中显著的高甲基化(错误发现率[FDR] <0.05且效应大小> 0.2)。lncRNA启动子的低甲基化模式在另外九种也具有匹配的正常组织的癌症类型中一致地观察到。
2 整合分析鉴定了20种癌症类型中的2,123个复发的表观遗传学调节的lncRNA
为了确定lncRNA的表达是否受其启动子DNA甲基化变化的调节(例如,低甲基化导致过表达),我们整合了来自MiTranscriptome的lncRNA表达数据,该数据包括5,602个TCGA样品。我们的分析侧重于20种具有DNA甲基化和lncRNA表达数据的癌症类型的TCGA样本。我们应用启发式策略来鉴定肿瘤中表观遗传活化(EA)或表观遗传学沉默(ES)的lncRNA与正常组织中的DNA甲基化状态相比较。以20个癌症类型为特征的患者为中心的基质具有2,123个lncRNA基因的DNA甲基化状态,包括1,006个EA和1,117个ES lncRNA,其在至少一种癌症类型中显示出表观遗传改变。所有表观遗传学调节的lncRNA,在肿瘤中具有低甲基化或高甲基化,在它们的表达和启动子DNA甲基化状态之间显示出显著的负相关(FDR <0.01)。
3 表观遗传学调控的lncRNA与肿瘤存活和蛋白质编码癌症基因改变相关
我们接下来分析了lncRNA表观遗传状态与20种癌症类型患者存活率的关系。前20种EA lncRNA中的12种与至少1种癌症类型中的不良存活显著相关,而前20种ES lncRNA中的10种与有利存活显著相关。在这些存活相关的lncRNA中有SNHG12和MINCR,它们在多种癌症类型中表观遗传活化,包括乳腺癌,膀胱癌,子宫内膜癌,结肠直肠癌和肺癌。为了探索lncRNA表观遗传改变与已知肿瘤基因的体细胞改变之间的关系,我们将lncRNA表观遗传改变与同一肿瘤中已知蛋白编码癌基因的突变和拷贝数改变结合起来。值得注意的是,表观遗传学调控的lncRNA与一组癌症基因突变和拷贝数改变显示出强烈共存。例如,EA lncRNA在多种癌症类型中的TP53突变肿瘤中显著富集。相比之下,ES lncRNA与EGFR扩增和突变表现出显著的互斥性。
4 EPIC1表观遗传活化并与乳腺癌生存率低相关
在多种癌症类型中最常表观遗传激活的lncRNA是ENSG00000224271(表观遗传诱导的lncRNA1 [EPIC1])。该lncRNA在包括乳腺癌在内的十种癌症类型中高达90%的肿瘤样品中表观遗传激活。我们的算法确定HM450中的三个探针映射到EPIC1 CpG岛(图A)。基于三种探针的β值,通过534个乳腺肿瘤中的层次聚类分析鉴定了三个乳腺癌亚组(图B)。高甲基化亚组包括196(36.7%)个乳腺肿瘤,并且表现出与正常乳腺组织中相似的高EPIC1甲基化水平(图B)。该亚组的乳腺肿瘤的特征在于EPIC1表达降低(图C和D),并且与其他两组相比具有较高的总存活率(图E)。相反,肿瘤表现出EPIC1低甲基化和EPIC1表达增加的患者存活率最低(图C-E)。为了确定EPIC1表达是否与乳腺癌中较差的患者存活率强烈相关,我们将探针从五个Affymetrix微阵列重新注释为lncRNA,并在特异性检测EPIC1表达的Affymetrix HG-U133plus2微阵列中鉴定出一个探针(1563009_at)。如图F所示,EPIC1的表达增加始终与6个独立的患者群体(包括905个乳腺肿瘤)中的不良存活相关(图F)。
5 EPIC1通过促进细胞周期进程作为潜在的致癌lncRNA
为了评估EPIC1在癌症中的致癌作用,我们使用qRT-PCR分析了8种癌症类型中28种细胞系中的EPIC1表达状态。与EPIC1在管腔B乳腺癌亚型中的活化一致,EPIC1在管腔乳腺癌细胞系(例如,BT-474,MB361,MCF-7,ZR-75-1和T-47D)以及卵巢癌(A2780cis和OVCAR-4),胰腺癌(BxPC-3和PANC-1),前列腺癌(PC-3)和白血病(K562)细胞系中过表达。我们使用来自MCF-7和T-47D细胞的总RNA进一步进行5'-RACE和3'-RACE克隆以鉴定功能性EPIC1同种型。克隆了EPIC1的三种剪接变体,包括同种型v1(567nt),同种型v2(844nt)和同种型v3(882nt)。EPIC1敲低导致在管腔乳腺癌细胞MCF-7和ZR-75-1中以时间依赖性方式降低细胞增殖。软琼脂测定进一步证明EPIC1敲低显著抑制癌细胞的贴壁依赖性生长。此外,细胞周期分析显示EPIC1的沉默导致MCF-7和ZR-75-1细胞中的G0/G1停滞。接下来,我们使用慢病毒shRNA建立稳定的EPIC1敲低细胞。与shCtrl细胞相比,两种shEPIC1稳定细胞均表现出显著降低的细胞增殖,不依赖贴壁的生长和体内异种移植物生长。
6
EPIC1是一种调节MYC靶标的核lncRNA
细胞组分PCR和亚细胞RNA-seq分析显示EPIC1 RNA主要位于细胞核中,表明EPIC1可能在转录调节和染色质相互作用中起作用。为了探索这种可能性,对单独或合并靶向EPIC1的两种siRNA转染的MCF-7细胞进行RNA-seq分析。MCF-7细胞中的EPIC1敲低导致805个基因的调节(317个基因的上调和488个基因的下调),这些基因与2,005个EPIC1相关基因高度重叠,这些基因与559个TCGA乳腺肿瘤中的EPIC1表达显著相关(p = 2.6×10-25)。基因集富集分析(GSEA)分析显示,20种癌症类型中有17种在EPIC1相关基因中显著富集了细胞周期相关的生物过程,如“MYC靶标”,“G2M检查点”和“E2F靶标”。在MCF-7细胞中EPIC1调节的基因中富集相同的细胞过程。其中,MYC通路/靶标中很多基因被EPIC1调节。例如,MYC靶向CDC45,CDC20和CCNA2被EPIC1敲低显著下调。此外,在EPIC1敲低后显著诱导CDKN1A(编码p21蛋白)。p21是在G1和S期细胞周期进展的公认的负调节因子,其被MYC直接抑制。与我们的观察结果一致,即EPIC1敲低导致癌细胞在G0/G1期停滞。
7 EPIC1通过其129-283nt序列与MYC的148-220氨基酸区域相互作用
RNA pull-down测定显示MYC蛋白可以通过体外转录的生物素化的EPIC1有义转录物共沉淀,但不能通过EPIC1反义转录物共沉淀。为了绘制对应于MYC结合的EPIC1功能基序,我们使用一系列截短的EPIC1片段进行了体外RNA pull-down测定。该分析显示EPIC1的核苷酸1-358(EPIC11-358nt)足以与MYC蛋白相互作用,而其他EPIC1截短的片段不能。为了更精确地绘制与MYC结合的EPIC1序列,我们进一步设计了EPIC1 1-358 nt区域的7个截短或缺失突变体,并揭示了3个缺失突变体(Δ121-180nt,Δ181-240nt和Δ241- 300 nt)可以消除EPIC1与MYC蛋白的结合。所有三个区域(129-283nt)的缺失也消除了EPIC1与MYC蛋白的相互作用(命名为ΔMYC-EPIC1)。这些数据表明EPIC1 129-283 nt区域是EPIC1与MYC蛋白结合所必需的。删除MYC蛋白的148-220aa区域(命名为ΔEPIC1-MYC)消除了其与EPIC1的相互作用。总的来说,我们的研究结果表明,EPIC1通过129-283核苷酸序列与MYC的148-220 aa区域相互作用。
8 EPIC1的致癌作用部分取决于其对靶向启动子MYC占据的调节
观察到EPIC1直接与MYC相互作用,我们进一步分析了EPIC1对MCF-7细胞中MYC靶基因报道分子(例如p21和CCNA2启动子)的影响。报道分析显示,EPIC1或MYC的敲低显著调节p21-Luc和CCNA2-Luc报道荧光素酶活性(图7A)。我们对MYC染色质免疫沉淀测序(ChIP-seq)数据和EPIC1敲低MCF-7细胞的RNA-seq数据进行了综合分析。在805个EPIC1调节的基因中,785个在MCF-7 ChIP-seq数据的两个生物学重复中在其启动子上具有强大的MYC占据。进行ChIP-qPCR并验证EPIC1敲低显著降低MYC在26个靶标的启动子上的占据,包括CDKN1A(p21),CCNA2,CDC20和CDC45。已知MYC与DNA结合并通过与另一种转录因子MAX的异二聚化作为转录因子起作用。MCF-7细胞中的MYC和MAX Co-IP测定显示EPIC1敲低可以适度地减少MYC-MAX复合物的形成。此外,EPIC1的过表达,而不是ΔMYC-EPIC1,可以增强由MYC和MAX介导的报道荧光素酶活性。这些结果表明EPIC1通过其129-283nt序列(即MYC结合序列)促进MYC对EPIC1调节基因的占据。
讨 论
以前的研究,通过重新利用拷贝数和基因表达微阵列数据,成功地确定了拷贝数改变和癌症中lncRNA的表达改变。我们的分析表明,鉴于公共储存库中可获得的大量HM450和RNA-seq数据集,整合HM450微阵列和RNA-seq数据是研究lncRNA基因的DNA甲基化调控的经济有效的策略。lncRNAs可以通过启动子区域中DNA甲基化的丧失在肿瘤中表观遗传激活,这与肿瘤中PCGs的充分证明的CIMP表型形成鲜明对比。通过进一步整合相同肿瘤中的蛋白质编码癌基因改变,我们观察到lncRNA表观遗传活化与多种癌症类型中的TP53突变显示出强烈的共同发生。新出现的证据表明,p53是lncRNAs在癌症中表达的主要调节因子。
微信扫描二维码关注公众号回复数字 “189251” 下载文献原文,完整译文
其他相关文献解读
文献解读:LncRNA在调节动脉粥样硬化中的作用(IF:32.621)
文献解读:胰腺β细胞中lnc是如何发挥作用的?(IF:20.565)
文献解读:lnc-Blnc1与EDF1和LXR蛋白质形成复合物发挥调控作用
文献解读:lncRNA-MUF可以竞争性结合miR-34a促进EMT过程
文献解读:Nature Cell Biology: lncRNA ceRNA调控胃癌EMT过程(IF:19.064)