相关文献
RNA-Seq profiling of circular RNAs in human laryngeal squamous cell carcinomas
RNA-Seq profiling of circular RNAs in human laryngeal squamous cell carcinomas
RNAseq技术研究人喉鳞状细胞癌circRNA表达谱
期刊:Mol Cancer 影响因子:6.204分
发表单位:北京友谊医院
1 摘要
许多肿瘤曾报道过非编码circRNAs的异常表达。越来越多的研究显示circRNAs可能会成为一个极好的诊断标志物和治疗靶点。本研究的目的是评估人喉鳞状细胞癌(简称LSCC)circRNA表达谱。LSCC样品均由手术获得,使用二代测序研究circRNA表达谱,对10例LSCC样品进行测序,其中2个高分化,3个中分化,另5个是对应癌旁样品。共鉴定到21444个circRNAs, 异常表达的筛选标准是q-value < 0.001, foldchange > 2.0或<0.5。在癌组织中,29个circRNA显著上调,19个circRNA显著下调。对癌旁-高分化,癌旁-中分化取交集,上调下调的circRNAs分别是18、5个。另外,我们对circRNA-miRNA-mRNA关系进行研究,发现20个异常表达的circRNAs与一些与癌症相关miRNAs结合。KEGG富集分析发现,密切相关通路有PPAR(过氧化物酶体增殖物激活受体通路),Axon guidance(轴突导向信号通路), Wnt,Cell cycle通路。circRNA hsa_circ:chr20:31876585-31897648能够区分大部分的LSCC癌与癌旁组织。本研究表明,circRNAs具体作为LSCC标志物的潜力。对下调的hsa_circ:chr20:31876585-31897648进行qPCR验证发现,该分子可能是一个新的LSCC抑癌因子。
2 研究方法
2.1 根据病理分类收集LSCC样品
样品通过喉头切除术获得,采集于首都医科大学附属北京友谊医院耳鼻喉科,时间是2016.08-2017.12。10个LSCC癌与癌旁配对样品进行二代测序,并用10对LSCC癌与癌旁配对样品进行qPCR验证。本研究获得友谊医院伦理会的批准,病人术前未进行癌相关治疗。病灶采样后立即液氮速冻,-80℃保存。两位病理医生分别进行组化评估。选出5个病人(2高分化,3中分化)用于二代测序。
2.2 RNA提取及二代测序分析
RNA提取采用RNase/DNase-free水,在RNase-free实验室按照标准流程进行。使用Trizol法提取Total RNA,75%乙醇(1ml)清洗RNA沉淀两次,晾干,溶于RNase/DNase-free water (20ul) 。Turbo DNase Kit (Ambion) 去除DNA残留。RNeasy MinElute Cleanup kit (Qiagen, Valencia, CA, USA) 纯化富集RNA。NanoDrop ND1000 spectrophotometer (NanoDrop, Wilmington, DE, USA) 检测RNA的浓度和质量。OD260/OD280 在1.8-2.1之间,OD260/OD230 大于1.8。变性凝胶电泳检测RNA完整性及DNA残留。为了能富集到更多的circRNAs,使用RNase R (Epicentre, Inc.) 去除线性RNA,二价阳离子适宜温度进行circRNAs扩增并片段化。NEBNext® Ultra™ Directional RNA Library Prep Kit 构建RNAseq文库,Illumina HiSeq™ 3000 测序。使用HTSeq将比对到circRNA的reads数量进行计数。RPM (Reads Per Million mapped reads, including TopHat mapping and TopHat Fusion mapping) 计算circRNA的表达量。DEGseq计算circRNA的差异表达,筛选标准是q-value < 0.05, foldchange >2.0 或<0.5。
2.3 qPCR验证
10例样品RNA提取后,使用反转录试剂盒合成cDNA (SuperScript First-Strand Synthesis System for RT-PCR Invitrogen, Carlsbad, CA, USA) 。qPCR对circRNA定量 (SYBR Green PCR Master Mix, Applied Biosystems, Foster City, CA, USA) 。20ul反应体系:6.8ul cDNA, 10 ul 2 x SYBR Green mix, 0.8ul primer forward (5uM), 0.8ul primer reverse (5uM), and 1.6ul H2O。上机仪器为ABI 7300 RealTime PCR System (Applied Biosystems) ,one 2-min cycle at 50℃, one 10-min cycle at 95℃, forty cycles of 15 s at 95℃ and 1 min at 60℃。β-actin 作为内参,pcr实验三次,采用2-ΔCt 法计算表达量。
统计分析采用GraphPad Prism5 (GraphPad Software, CA, USA) ,R software version 3.2.1(http://www.r-project.org/) and Microsoft Excel (Microsoft, DC, USA) ,Student’s t-test 检测circRNA差异表达。two-sided Pvalue < 0.05 认为有差异。
2.4 circRNA-miRNA关系预测
circRNAs能够通过吸附miRNAs的方式影响miRNA调控基因表达。对测序及qPCR验证得到的12个差异表达的circRNAs使用Arraystar miRNA靶标预测软件进行预测,该软件基于TargetScan和miRanda算法开发。Arraystar软件寻找12个circRNAs的 MREs,并构建circRNA-miRNA网络。Arraystar预测主要包括:1)种子序列类型,种子序列在2-7个核苷酸,2)高AU含量,3)高碱基配对,并在miRNAs 3’(13-16处碱基)配对。circRNA-miRNA网络使用cytoscape 3.01绘制。
2.5 癌相关circRNA-miRNA-靶基因预测
使用多种数据库联合预测circRNA-miRNA-癌相关靶基因关系,KEGG cancer通路相关的miRNA,使用DIANA-miRPath v.3 platform预测。使用IntaRNA对circRNA及预测到的miRNAs进行种子区再预测。DIANA-miRPath的使用参数是 suboptimal interactions 0,minimum number of basepairs in seed 5,maximum number of mismatches in seed 0,temperature for energy computation 37,folding window size target 22,max. Basepair, distance (target) 22,验证得到的circ-miRNA关系,使用DIANA-TarBase 7.0 鉴定候选miRNA的靶基因,并选取前10个癌相关的靶基因作为circRNA-miRNA-靶基因。
3 结果
3.1 人 SLCC样品特征
经过组织学鉴定,10例新鲜组织,用于本次研究,其中3例中分化样品,2例高分化样品,5个配对癌旁组织。具体样品信息如Table S1, 组化鉴定如Figure S1。
3.2 circRNA差异表达谱鉴定
使用二代测序对SLCC样品进行circRNA表达谱分析,共鉴定到21444个circRNA,其中约85% reads来源于基因组外显子区(Fig. 1a) 。差异表达分析,即|log2(fold change)| > 1 ,Student’s t-testing Q-value < 0.05 (火山图 Fig. 1b),相比癌旁组织,癌组织中有29个circRNAs显著上调,19个显著下调。(Fig. 1d and e,Table S2:差异表达总表) ,热图展示(Fig. 1c) 。
3.3 不同类型样品间比较
癌旁-高分化组,与癌旁-中分化组的差异circRNAs取交集可得到23个差异circRNAs,Figure 1d and e 是交集Venn图,其中18个下调(in descending order; Fig. 1d,Table S3) ,5个上调(in descending order;Fig. 1e,Table S3)。
3.4 建立circRNA-miRNA network
由于circRNAs可以通过miRNA response elements (MREs) 结合的方式发挥作用,使用Arraystar 软件预测circRNA的目标miRNA。其中3个显著上调的circRNAs结合miRNAs信息如Table S3.其他两个上调的circRNAs预测结果不可靠,舍弃。17个下调的circRNA预测结果也在该表中。建立circRNA-miRNA关系网如(Fig. 2a,注,此图比较大,看起来比较费劲,作者也懒得多花几分钟调一调这个图,让点少叠在一起)。
3.5 GO、KEGG富集分析预测circRNA潜在功能
有文献报道circRNA能够发挥miRNA海绵吸附作用,并调控基因表达。我们对circRNAs可能结合的miRNAs进行了鉴定和排序。将circRNAs结合的前5个miRNAs用于后续分析。对miRNAs的靶基因进行了预测,并做GO, KEGG富集分析。富集分析显示circRNAs调控的基因涉及到多种生物学过程如developmental process, cellular regulation and cell junction(Figure S2)。同时也能影响许多通路如MAP kinase (MAPK) signaling pathway, Phosphatidylinositol 3-Kinase–AKT (PI3K-Akt) signaling pathway, and Ras signaling pathway (Fig. 2b ,Figure S3)。
3.6 预测与癌症相关的circRNA-miRNA-target gene。
为了更好的理解,差异表达circRNAs的分子机制,我们选择了富集到cancer通路上的miRNA (Fig. 2b;Figure S3) 。并使用生物信息学方法预测cancer相关的miRNA网络,如图Fig. 3a。Table S3是失调circRNAs与miRNAs结合的具体信息。最终我们挑选了前3个circRNA (hsa_circ:chr17:48268229–48,277,287, hsa_circ:chr20:31876585–31,897,648, hsa_circ:chr1:207103173–207,105,911) ,他们分别能够结合151, 112, 208个cancer相关miRNA(Table S3)。通过对这三个circRNA结合的miRNAs取交集,发现miRNAs靶基因涉及到一些与癌相关的重要通路(Fig. 3a)。
3.7 前三个circRNA主要参与PPAR, AXON-guidance, Wnt 和 cell cycle 信号通路
前三个circRNAs结合的miRNAs交集有9个(Fig. 3b) ,对这9个miRNAs的靶基因进行了KEGG富集分析(Fig. 3c) ,主要涉及到PPAR, AXON-guidance, Wnt 和 cell cycle 信号通路。随后,对候选的circRNAs进行验证,由于hsa_circ:chr17:48268229-48,277,287和hsa_circ:chr1:207103173-207,105,911没有找到合适的引物,仅对hsa_circ:chr20:31876585-31,897,648进行验证。10个病人,T为肿瘤组织,C为癌旁,qPCR结果显示下调(Fig. 3d)。hsa_circ:chr20:31876585-31,897,648能够显著区分大部分的癌与癌旁组织,提示该分子或可作为LSCC的一个新的分子标志物。
本研究,我们用二代测序技术进行circRNA表达谱分析,来提高对LSCC发生过程的理解。并发现了一个可具有诊断及预后判断价值的新的circRNA标志物。通过表达谱分析及后续的不同类型样品取交集分析等,共发现20个显著差异与癌相关的circRNA,其中16个上调,4个下调。并有4个显著上调的circRNAs是LSCC最有潜能的标志物。另外,我们使用各种工具对20个显著差异的circRNAs,构建了circRNA-miRNA网络。与这20个circRNAs相关的靶基因参与各种生物学过程,如growth factors binding, protein phosphatase activator activity, skin development, wound healing这些大部分与增值过程相关。KEGG富集分析发现靶基因参与癌相关通路如Ras, MAPK, PI3K-AKT。之前对LSCC的分子研究主要是对基因组层面进行分析。近些年,研究者使用芯片/测序技术研究LSCC circRNAs表达谱。circRNA-miRNA-mRNA关系研究逐渐增多,但目前为止,在LSCC上还没有报道这类关系。我们的研究深入的揭示了20个circRNAs及其可能结合的miRNAs的关系。基于这样一个假设,越重要的circRNAs能够结合越多癌相关的miRNAs, 进而调控不同的癌相关的通路。因此,三个失调的circRNAs能够共同结合9个癌相关的miRNAs。这9个miRNAs能够调控576个mRNA。通路分析发现主要涉及PPAR, AXON-guidance, Wnt 和 cell cycle 信号通路。我们推测这些通路或可成为LSCC潜在的治疗靶点。本研究,也有几点限制。第一,作为一个单独研究 ,样本量较小,统计学说服力不够强。需要更多的研究探讨LSCC中这些circRNAs的功能。第二,由于样本量较少,circRNA与LSCC的关系及circRNA结果的严谨性也不能很好的保证。这些提示我们需要更多的研究。
4 结论
LSCC高通量测序及生物信息分析结果,给我们提供了有用的诊断标记,及潜在治疗靶点,并可用于未来进一步研究。
微信扫描二维码关注公众号获取更多相关文献信息