相关文献
Signature of circular RNAs in human induced pluripotent stem cells and derived cardiomyocytes
Signature of circular RNAs in human induced pluripotent stem cells and derived cardiomyocytes
人类诱导多能干细胞和衍生心肌细胞circRNA特征
期刊:Stem Cell Research & Therapy 影响因子:4.211
发表单位:苏州大学附属第一医院心血管研究所
1 摘要
背景:circular RNAs(circRNAs)是一类新的非编码RNA调控分子。虽然通过RNAseq技术及生物信息分析发现了大量的circRNAs,但对组织及疾病特异性的circRNAs研究还很少,不足以推动 circRNA在基础研究及临床实践上的应用。本研究的目的是研究人类诱导多能干细胞human induced pluripotent stem cells (简称hiPSCs) 和多能干细胞衍生心肌细胞hiPSC derived cardiomyocytes (简称hiPSC-CMs),鉴定心脏或疾病特异性的circRNAs。
方法:成纤维细胞产生hiPSCs,进而用RPMI+B27培养基激活WNT通路分化成hiPSC-CMs,而后进行高通量测序,使用CIRCexplorer软件进行circRNA的鉴定和定量。并对circRNA及其来源基因进行整合分析以了解两者的关系。使用qPCR对心脏及疾病特异性的circRNAs进行确认。
结果:本研究在hiPSCs和hiPSC-CMs中,共鉴定到5602个circRNAs,第一次发现,分化的心肌细胞中circRNAs的丰富度要高于未分化的hiPSCs细胞。除了来源基因依赖的表达,整合分析还发现了许多非来源基因依赖的circRNA表达。circSLC8A1, circCACNA1D, circSPHKAP and circALPK2在心肌分化和人胎儿心脏中呈现选择性表达。circSLC8A1在扩张型心肌病病人的心脏组织中异常高表达。
结论:hiPSC-CMs circRNAs表达丰富,心脏特异性的circRNAs比如circSLC8A1, circCACNA1D, circSPHKAP and circALPK2或可作为hiPSC-CMs标志物。检测异常高表达circSLC8A1或可作为诊断心脏疾病病理状态的一个方法。
2 材料方法
1 人组织收集
本研究使用的捐献成人及胎儿组织,已获得苏州大学和华中科技大学伦理委员会批准。在正常人身上获得正常心脏组织,在扩张型心肌病心脏移植病人处获得心脏疾病组织。胎儿的组织比如脑,心脏,肝,脊柱,胃从怀孕9-10周的流产儿身上获得,并征得病人的同意。
2 成纤维细胞分离和hiPSCs细胞诱导
皮肤活组织切碎,使用胶原酶IV(Thermo Fisher Scientific Inc., MA, USA)在Dulbecco’s modified Eagle medium (DMEM; Gibco)培养基上37℃消化6h。尼龙网过滤,用PBS冲洗成纤维细胞,然后在DMEM培养基上培养,培养基加入10% 胎牛血清(FBS; Gibco),37℃,潮湿,5%CO2环境中培养。成纤维细胞长到不超过5代时,将细胞涂抹到包被凝胶及胎牛血清DMEM培养基中,然后使用编码4个干细胞因子(OCT4, SOX2, KLF4 and cMYC) 的慢病毒颗粒转染。5天后转染的细胞转移至辐射过的MEF饲养层,并在KSR培养基上培养(DMEM/F12 supplemented with 20% KnockOut Serum Replacement, 4 ng/ml bFGF, 2 mM L-glutamine, 1% MEMnon essential amino acids, and 0.007% 2-mercaptoethanol)。20-30天后,采集ESC-like的单克隆细胞,并培养在基质胶包被的E8培养基上。
3 hiPSCs分化成心肌细胞
hiPSCs单层定向分化成心肌细胞按照之前报道的方法,并做了一些小的修改。具体步骤参见原文。
4 hiPSCs和hiPSC-CMs的鉴定。
通过embryoid body(EB),畸胎瘤成型,以及干细胞标志物(OCT4, NANOG, TRA-1-60)免疫荧光染色来证实hiPSC的多能性。hiPSC-CMs则通过形态学分析、钙瞬变、和心肌细胞标志物(TNNT2,α-SA)免疫荧光染色判断。
5 RNA测序
用RNeasy kit (Qiagen,CA, USA), DNase I (Qiagen) 提取hiPSCs和hiPSC-CMs total RNA。用Ovation®RNA-Seq System V2 (NuGEN, CA, USA)构建RNA测序文库,用NEBNext® DNA Library Prep Master Mix Set for Illumina®构建barcode文库,切除回收250bp片段,HiSeq2000平台双端测序,平均深度在30 百万reads。测序序列先使用TopHat 2.1比对到人参考基因组GRCh37/hg19。提取未能完全比对的reads,使用TopHat-Fusion再次比对到参考基因组。同一序列两部分能够比对到相同的染色体,提取非同一方向的reads,作为候选反向剪接reads(back-spliced junction reads)。反向剪接reads重新比对到数据库有注释的基因,准确判断每个剪接事件准确的供体和受体位点。最后剪接reads使用RPB(reads per billion mapped reads, 包括TopHat比对and TopHat-Fusion比对)定量。
6 GO分析
使用Metascape(http://metascape.org)做GO富集分析。
7 siRNA转染knockdown QKI基因
针对QKI基因设计合成了三种类型的siRNAs,使用Lipofectamine 2000 (Invitrogen)转染hiPSC-CMs,两种对hiPSC-CMs QKI基因抑制显著,用于后续分析。
8 RT-PCR 和 qPCR
用PrimeScript reverse transcriptase reagent kit (TaKaRa, Dalian, China)进行RNA的反转录,发散性引物扩增circRNA转录本,凝胶电泳进行扩增片段可视化。引物如Additional file 1: Table S1。PCR产物用Sanger测序验证。用SYBR Premix Ex Taq kit (TaKaRa),在StepOnePlus Real-Time PCR System (Applied Biosystems™, CA, USA)进行qPCR定量。样品三个重复,qPCR定量时三重复。数据用18S rRNA校正,2-ΔΔCT分析。
9 统计分析
使用Student’s t test or one-way ANOVA对qPCR的结果进行统计分析。p < 0.05认为有统计学意义,数据以mean ± SD形式呈现。
3 结果
1 鉴定hiPSCs和hiPSC-CMs circRNAs
使用慢病毒介导的4过表达转录因子(OCT4, KLF4, c-MYC and SOX2),诱导成纤维细胞重编程为hiPSCs。分离的hiPSCs细胞在E8培养基上培养(Fig. 1a),并进一步使用多潜能干细胞标志物NANOG, SOX2, OCT4 and TRA-1-60(Fig. 1b and Additional file 2: Figure S1A),拟胚体,(Additional file 2:Figure S1B),畸胎瘤成型(Fig.1c, d)验证。hiPSCs进一步激活WNT通路诱导成心肌细胞,早期中胚层标志物基因(BRA),心脏中胚层标志物基因(MESP1),心脏特异性前体基因(TBX5)和结构基因(TNNT2, MYH6 and MYH7)均在hiPSC-CMs分化时呈现阶段特异性表达(Additional file 2:Figure S1C–H)。高表达的心脏标志基因如TNNT2、sarcomeric α-actinin 如Fig. 1e,及典型的钙瞬变(Fig. 1f)。这些数据均说明成功的诱导hiPSCs分化为hiPSC-CMs。
提取hiPSC,hiPSC-CMs(传30代)total RNA用于RNAseq,提取测序reads中反向剪接的reads,使用CIRCexplorer(默认参数)进行reads的注释,定量。只有样品中该连接点reads覆盖数量≥2,才会继续用于后续分析。用RPB (reads per billion mapped reads)对表达量进行标准化。一共鉴定到5602个circRNAs, hiPSC组中有1612个,hiPSC-CMs组中有4260个,270个交集共同存在。另外,超过3500个circRNA不在circBase数据库中(Fig. 2a)。hiPSC,hiPSC-CMs分别有614, 2918个novel circRNAs,说明circRNAs在这两种细胞中是特异性存在的。所有鉴定到的circRNAs在Additional file 4: Table S2。
我们研究了circRNA的基因组特征。大部分的host gene能够产生1-7个circRNA转录本,多circRNAs的host gene数量少于少circRNA的host gene数量(Fig. 2b)。相比hiPSC, hiPSC-CMs能产生更多的circRNA转录本(Fig. 2b)。比如TTN基因我们共鉴定到129个不同的转录本,这个基因有非常多的外显子,而且能编码很多条纹肌相关的蛋白(Additional file 4:Table S2)。 然而多能干细胞基因如OCT4 and NANOG并未检测到circRNAs。大部分circRNAs的长度在200-2500bp之间(Fig. 2c),基因组的整体长度不超过45kb(Fig. 2d)。外显子的数量在1-8个(Fig. 2e),单外显子circRNAs外显子的长度要远长于多外显子circRNAs的平均外显子长度(Fig. 2f)。
2 circRNAs在hiPSC-CMs 高丰度表达
正如Fig. 2a看到的,相比hiPSC,hiPSC-CMs能产生更多的circRNA转录本。因此,我们计算了circRNAs reads与所有匹配reads的比例。hiPSC-CMs,hiPSC circRNA的reads数量占比是17.5% vs 6% (Fig. 3a)。所有结果均显示hiPSC-CMs中的circRNA的丰富度要比hiPSC高的多。数据同时显示两个表达量上升的重要的剪接因子Quaking (QKI) and RNA binding Motif protein 20 (RBM20)与circRNA的形成有关。qPCR进行验证两个基因表达量(Fig. 3c)。
top 100 circRNAs热图(Fig. 3d)显示circRNAs在hiPSC,hiPSC-CMs呈现特异性表达。相比hiPSC,hiPSC-CMs大部分circRNAs呈现高表达,只有很少一部分是下调的。进一步用发散引物进行RT-PCR扩增环状转录本验证这些差异表达的circRNAs。hiPSC-CMs 6个编码基因(SLC8A1, ARID1A, FNDC3B, CACNA1D, SPHKAP and ALPK2)产生circRNAs的外显子表达量更高,相比hESC and hiPSC组,hiPSC-CMs和成纤维细胞circAASS, circFIRRE and circTMEFF1的表达量明显下调(Fig. 3e) 与测序得到的结果一致。circSLC8A1, circCACNA1D, circSPHKAP and circALPK2或许可以成为心肌细胞分子标志物。
为了进一步验证这些分子标志物,我们提取心肌细胞不同分化时期的total RNA进行RT-PCR分析(Fig. 3f)。circALPK2在第4天时有高表达,而circSLC8A1, circCACNA1D and circSPHKAP在9,15,30天高表达。尽管一直存在表达,circFNDC3B转录本依然从第9天开始明显上升。随后,我们对扩增片段进行Sanger测序(Fig. 3g and Additional file 5: Figure S2)。以上结果提示circSLC8A1, circCACNA1D and circSPHKAP或可成hESCs or hiPSCs分化为心肌细胞时新的分子标志物。
然后我们进一步研究剪接因子Quaking在hiPSC-CMs circRNA表达时的功能。如Fig. 3h, i,用siRNA抑制QKI的表达后,circRNAs 包括 circSLC8A1, circFNDC3B, circCACNA1D, circSPHKAP and circALPK2的表达量显著下调。结果说明hiPSC-CMs circRNAs丰富表达或许剪接因子如QKI的表达量增加有关。
3 circRNA与来源基因表达整合分析
由于circRNA来源于亲本转录本外显子的反向剪接而成,我们对circRNA与来源基因的表达,做了相关性分析。首先分析hiPSC,hiPSC-CMs中线性转录本,基于阈值50 RPKM,一共鉴定到1270个基因的表达量超过两倍(Additional file 6: Figure S3A, Additional file 7: Table S3)。多潜能基因如NANOG, SOX2 and OCT4下调,而结构基因编码的心脏终端分化肌相关的蛋白包括TNNT2, MYL2, MYH6, and MYH7显著上升。hiPSC上调基因GO分析主要富集到cell cycle, transcriptional regulation of PSCs, DNA replication and chromatin remodeling at the centromere (Additional file 6: Figure S3C, E)。而hiPSC-CMs上调的基因主要涉及到heart development, muscle system process, striated muscle cell differentiation等(Additional file 6: Figure S3D, F)。这些分析的结果也说明了数据的可靠性。
接下来,我们对hiPSCs and hiPSC-CMs top100 circRNAs及其线性亲本RNA的相关性分析显示,两者表现出强烈的正相关性(Fig. 4a, b)。为了挑选独立于基因表达的circRNAs,我们计算了每个基因环状转录本与线性转录本的比例(Fig. 4c, d)。大部分circRNA所占的比例是50%。设置阈值75%,我们发现有一些circRNAs的表达与其线性RNA的表达模式并不一致。相比于hiPSC,hiPSC-CMs组更多circRNA表现出非来源基因依赖的表达。Additional file 8: Table S4是表达丰度高且来源基因依赖的circRNAs表达列表。
对差异表达circRNAs的来源基因进行GO分析,如Fig. 4e, f。hiPSCs and hiPSC-CMs表达丰富的circRNAs来源基因均与covalent chromatin modification, cell cycle and cell morphogenesis等相关,不过子分类不太相同。而hiPSC-CMs上调的circRNAs来源基因富集到myocardial function(心肌功能),如heart development, membrane trafficking(跨膜运输), organelle assembly(细胞器组装), fiber organization(纤维组织)and muscle structure development (Fig. 4f)。而hiPSC特异性的circRNAs的来源基因富集到一些通路如DNA metabolic process, DNA replication等 (Fig. 4e)。
4 人健康及疾病心脏中差异表达的circRNA
为了找到更可靠的心脏circRNAs, 人类正常心脏中鉴定到6075个circRNAs(以前文献), 我们在hiPSC-CMs中鉴定到4260个circRNAs。如Fig. 5a所示,两者交集共有897个circRNAs(Additional file 9: Table S5)。有许多hiPSC-CMs或其他组织特异性的circRNAs,可能是不同阶段的hiPSC-CMs,或组织异质性引起的。circSLC8A1, circFNDC3B, circSPHKAP and circALPK2包含在897个重叠的circRNAs中,而circCACNA1D仅在我们的数据中鉴定到。
我们研究了人胎儿组织 中这5个circRNAs的表达。4个circRNA(circSLC8A1, circCACNA1D, circSPHKAP and circALPK2)在心脏组织中高表达(Fig. 5b-e),circFNDC3B的改变不明显(Fig. 5f )。
为了评估使用circRNAs作为心脏疾病标志物的可行性,qPCR比较正常人心脏与DCM病人心脏circRNAs表达水平。众所周知的一个心肌病分子标志物,natriuretic peptide B (NPPB)在DCM病人心脏中的表达量显著高于正常心脏(Additional file 10: Figure S4A)。在5个circRNAs中,只有circSLC8A1显著升高(Fig. 6 and Additional file 10: Figure S4)。
我们推测circSLC8A1的上调依赖于其线性转录本的升高。为了验证假设,使用特殊的引物qPCR定量线性转录本,与我们的推断一致,SLC8A1线性转录本的表达量也显著增加(Fig. 6d)。值得注意的是circSLC8A1改变的倍数要比其线性转录本改变的倍数高的多(Fig. 6a, d),这或许是因为circRNA更稳定。尽管CACNA1D线性转录本的表达量显著降低,但circCACNA1D的表达确不明显(Fig. 6b, e)。这与我们之前得到的circCACNA1D与来源基因独立表达的结果一致(Additional file 8: Table S4)。除了环状RNA,SPHKAP, ALPK2 and FNDC3B的mRNA没有观察到显著的差异(Fig. 6 and Additional file 10: Figure S4)。
4 讨论
多能干细胞包括ESCs and iPSCs,在心脏疾病干细胞治疗上有很大希望。但我们对心脏发育和心肌分化机制了解还很有限,对于寻找高效的方法产生人源心肌细胞是个大障碍。新出现的心脏特异性的circRNAs提示circRNAs或与心脏发育有关,并可以作为心肌细胞和心脏疾病的分子标志物。这个假设促使我们对iPSCs 和 hiPSC-CMs的circRNA和mRNA表达谱进行研究。本研究,我们一共鉴定到5602个circRNAs。大部分的circRNAs呈现iPSCs或hiPSC-CMs细胞特异性的表达。接下来的研究展示了许多高丰度表达的心脏circRNAs, 如circSLC8A1, circCACNA1D, circSPHKAP and circALPK2。另外,相比正常心脏,circSLC8A1在DCM病人心脏中显著高表达。
我们发现hiPSC-CMs许多高表达的circRNAs来源于心脏相关的基因,涉及到heart development, membrane trafficking and muscle structure development,同样在存在于与hESC-derived CMs。hiPSC-CMs and hESCCMs表达最丰富的一个circRNA是由Solute Carrier Family 8 Member A1 (SLC8A1)的第一个外显子环化而成,这个基因是心肌膜上的一个Na(+)-Ca(2+)交换器,能够在应激收缩时排出Ca(2+)。尽管大部分的circRNAs表现为gene依赖的表达,我们依然发现一些circRNAs与其线性的mRNAs表达呈较差的相关性。或许是因为环化后RNA的稳定性或独特的形成机制。我们的分析显示,这类circRNAs在hiPSC-CMs中比例更高。
本研究的一个关键发现是circRNA在分化hiPSC-CMs表达更丰富而非干细胞如hiPSCs。hiPSCs仅鉴定到一小部分back-splicing reads,大约只占总比对reads的6%。而在hiPSC-CMs中,这一比例增加到17.5%。同样,近期的一些研究发现,分化的神经和动物的脑中circRNAs表达更为丰富。而在增殖的结肠癌细胞和神经胶质瘤中,circRNA相比于正常组织不那么丰富。这些数据说明分化的细胞能够激活许多基因促使circRNA的形成或者稳定性。此前,报道两种RNA结合蛋白能够调控circRNA的环化。QKI是一个剪接因子能够通过结合在两端的内含子区诱导外显子的环化。RNA binding Motif protein 20 (RBM20), 其缺失可引起DCM,有报道他对于TTN转录本的1-band区域的环状是极为重要的。通过RNAseq和qPCR,我们发现RBM20心脏特异性表达,以及QKI的显著升高。下调hiPSC-CMs QKI,能够降低circSLC8A1, circFNDC3B, circCACNA1D, circSPHKAP and circALPK2 的表达,说明QKI在circRNA产生时发挥重要作用。而其他能够激活circRNA表达的调控因子的发现,仍待更多的研究。
稳定性、灵敏性和特异性是分子标志物的重要特征。以往研究显示相比线性RNA,circRNAs能够抵抗核酸酶降解而具有更长的半衰期。结合Tan et al.’s 研究及我们的数据显示hESC-derived and hiPSC-derived CMs细胞特异性circRNA表达如circSLC8A1, circCACNA1D, circSPHKAP and circALPK2。进一步分析发现这4个分子有选择性的在胎儿心脏中高表达。因此,心脏特异性circRNAs或可成为心肌细胞可选的分子标志物。
许多circRNAs具有成为特殊癌症疾病或CD28-related CD8(+) T-cell ageing分子标志物的潜能。Du et al.发现circFOXO3在高龄病人和小鼠心脏高表达,能够结合胞质抗衰老和抗压蛋白而促进衰老。本研究发现,circSLC8A1在DCM病人显著增加。Tan et al.’s study 显示circSLC8A1在心脏疾病如DCM, HCM and IHD呈现上升的趋势,虽缺乏统计意义。Tan et al.’s study 缺乏统计意义,或是因样本量限制,或是对照组受到其他因素的影响。最近,Siede et al. 也报道circSLC8A1在DCM活检组织高表达。本研究显示circSLC8A1与其线性转录本表达呈正相关。circSLC8A1的变化倍数更高,显示其环状的形式要比线性形式更稳定。综合来看,circSLC8A1或可作为心脏疾病病理状态的标志物。同时也需要更多的研究探讨circSLC8A1与其他心脏疾病的关系。健康个体及心脏病人血液circRNA表达谱研究有助于鉴定循环circRNA标志物以用于临床诊断。
5 结论
本研究展示了分化心肌细胞中丰富表达的circRNA, 鉴定了许多非基因依赖的circRNAs,也得到许多心脏特异性的circRNAs,包括circSLC8A1, circCACNA1D, circSPHKAP and circALPK2, 这些或可成为分子标志物。另外,circSLC8A1的异常表达与心脏疾病密切相关。需要更多的研究揭示circRNA在心脏发育,心血管疾病中作用,并研究病人的血液以鉴定新的circRNA分子标志物。
微信扫描二维码关注公众号获取更多相关文献信息