资讯动态
CRISPRi-based genome-scale identification of functional long non-coding RNA loci in human cells
CRISPRi-based genome-scale identification of functional long non-coding RNA loci in human cells
基于CRISPRi的基因组规模鉴定人细胞中功能性长链非编码RNA基因座
期刊:Science;影响因子:41.058
发表单位:加利福尼亚大学
导 读
通过使用CRISPRi对多种细胞系中的lncRNA功能进行系统的大规模筛选,我们鉴定了强大细胞生长所需的499个lncRNA基因座,并发现大多数(89%)lncRNA基因仅在一种细胞类型中鉴定出改良的生长。
摘 要
我们通过开发CRISPR干扰(CRISPRi)平台,靶向7个不同细胞系中的16,401个lncRNA基因座,包括6个转化细胞系和人诱导多能干细胞(iPSC),大规模筛选鉴定强大细胞生长所需的499个lncRNA基因座,其中89%仅在一种细胞类型中显示出生长调节功能。我们进一步发现lncRNA敲低可以以细胞类型特异性方式扰乱复杂的转录网络。这些数据强调了许多lncRNA的功能重要性和细胞类型特异性。
研究背景
某些lncRNA在细胞功能,发育和疾病中起关键作用,然而只有非常小的部分已经建立了生物学功能, 目前,不可能预测哪些lncRNA具有功能,更不用说它们执行的功能。因此,评估大量lncRNA群功能的大规模系统方法对于理解这些非编码转录本在细胞生物学中的作用至关重要。评估lncRNA功能的系统性努力的中心限制是缺乏用于抑制lncRNA基因活性的高度特异性,可扩展的工具。在这里我们增强了之前开发的CRISPRi的sgRNA文库,使其更有特异性。
结 果
1 CRISPRi筛选鉴定改变细胞生长的lncRNA基因座
我们使用设计好的sgRNA文库进行lncRNA基因座的筛选,其增加或减少7个细胞系中每一个的细胞生长。为了便于在不同持续时间和具有不同生长速率的细胞系中进行的筛选之间的比较,我们通过总细胞倍增来标准化sgRNA富集以获得定量生长表型γ,对生物学重复的分析揭示,靶向sgRNA的γ显示出强的和可再现的表型,而非靶向对照sgRNA在0附近紧密分布。我们平均重复sgRNA表型,并使用它们对lncRNA基因进行评分,计算基因表型来自靶向该基因的前3个sgRNA的平均值和来自所有10个sgRNA的Mann-Whitney p值与非靶向性对照sgRNA的比较。我们从用于下游分析的总命中基因组中去除了不确定的命中后,我们的筛选鉴定了499个lncRNA基因,它们修饰细胞生长并且没有必需的编码基因邻居,代表了大量未经研究的非蛋白质编码基因,它们在细胞生物学中起重要作用。
2 lncRNA CRISPRi表型具有强大的敲低可重现性
首先,我们分别克隆了靶向65个代表性lncRNA命中基因座的前两个sgRNA,其中41个仅在一个细胞系中命中。我们使用内部控制的生长测定法测试了来自筛选的观察到的表型是否可重复,其中通过流式细胞术随时间测量用sgRNA感染的细胞部分。我们监测了sgRNA在筛选中表现出表型的细胞系中的生长效应,以及细胞系中几种没有显示效果的sgRNA,并发现个体sgRNA生长表型(γ)与筛选γ有很好的相关性(Pearson r = 0.72)。这证实了lncRNA敲低表型是可重复的并且细胞系之间的lncRNA表型的差异不是由于基因组规模筛选之间的技术差异。随着时间的推移分析这些表型进一步揭示了由lncRNA敲低介导的细胞耗尽的不同动力学。对于12个lncRNA命中,我们通过qPCR测量敲低水平,发现尽管有细胞耗尽的影响,但大多数靶向转录物(U87中14/14 sgRNA; MCF7中10/16 sgRNA)的敲除率超过70-95%。
3 抑制lncRNA基因座引发lncRNA特异性转录组反应
为了更好地理解lncRNA CRISPRi的后果,我们在3种细胞类型中对42个lncRNA命中的CRISPRi敲低后进行了RNA-seq。这些lncRNA基因座中的32个仅在一种细胞类型中命中。选择的lncRNA基因座没有必需的编码基因邻居,并且每个基因的2个或更多个sgRNA被单独测试。靶向相同lncRNA TSS的不同sgRNA导致高度相关的转录组反应(平均Pearson r = 0.980),其在层次聚类分析中通常彼此接近。相比之下,靶向具有相同表型方向的不同命中lncRNA基因座的sgRNA对具有更不相似的转录组反应(平均Pearson r = 0.942,Mann-Whitney p值与相同基因对相比= 6.4×10-08;),尽管具有相似的表型,但暗示了lncRNA的不同分子机制。差异基因表达的RNA-seq分析还揭示了几个共表达基因簇,表明生长调节剂lncRNA基因座调节关键通路。
4 CRISPRi强烈抑制lncRNA转录
为了评估在任何筛选中未显示为命中的lncRNA基因是真正的阴性还是仅仅是CRISPRi无效抑制的结果,我们使用每个基因的所有10个sgRNA,我们测量了在任何细胞中没有观察到表型的5个任意选择的lncRNA基因的敲低,并且在K562和U87细胞中均表达。在这100次敲低测量中,61次显示靶向lncRNA的超过90%的抑制。此外,除了U87细胞中的LOC100506710之外,所有lncRNA被至少三种不同的sgRNA抑制至少90%。对于所有sgRNA,lncRNA敲低效率与其预测的CRISPRi活性相关,并且敲低的效率在K562和U87细胞之间高度相关(Pearson r = 0.78)。基于这些发现,除了少量残留转录本足以用于lncRNA功能的情况之外,我们推断,大多数没有出现筛选的lncRNA基因座产生的转录本对于筛选的细胞系的稳健生长不是必需的。
5 生长调节剂lncRNA功能是高度细胞类型特异性的
绝大多数(89.4%)lncRNA命中仅对一种细胞类型是独特的,没有一种在5种或更多种细胞类型中命中。即使当我们将该分析限制于在所有7种细胞类型中表达的1,329个lncRNA时,82.6%的lncRNA仅在一种细胞类型中发生改变的生长。基于Jensen-Shannon距离的细胞类型特异性评分分析,其量化了给定分布与“完美”特异性的接近程度,揭示了对于lncRNA命中,lncRNA筛选评分的特异性远远大于lncRNA表达的特异性。因此,单独的差异表达模式不足以预测功能性lncRNA。对于在每种细胞类型中评分为命中的lncRNA的筛选评分分布的交叉比较揭示了用于调用命中的阈值未考虑细胞类型特异性。此外,重复之间的筛选得分的交叉比较不支持作为表观细胞类型特异性功能的来源的技术变化。
6 细胞类型特异性lncRNA引发高度不同的表型
我们专注于LINC00263,尽管在筛选的所有7种细胞系中均表达,但在U87中具有比任何其他细胞系更强的负生长表型。在内部控制的生长测定中,两个不同的sgRNA到LINC00263的TSS减少了仅U87细胞而不是K562,MCF7或HeLa细胞的增殖。尽管有相同和特异性CRISPRi靶向的证据,但在LINC00263敲低后,U87和HeLa细胞具有显著不同的转录组变化。值得注意的是,在所有三种细胞系中,LINC00263的敲低效率是相等的。与我们对LINC00263的观察一致,敲除PV87和LINC00909(其在U87中但不在HeLa中)在U87中产生了更多差异表达的基因。相比之下,在U87和HeLa细胞中均受到影响的LINC00680的耗尽导致U87和HeLa细胞中差异表达基因的数量相当。我们的结果表明,lncRNA功能的特异性不是由于CRISPRi活性的差异,而是与跨细胞类型的转录网络的差异有关。
7 学习识别预测生长调节剂lncRNA的特征
使用来自我们的基因组规模筛选的数据,我们寻求识别可以将它们与未命中的lncRNA区分开的lncRNA命中的特性。将来自ENCODE,FANTOM,Vista和其他来源的18类基因组数据与本研究中筛选的所有lncRNA基因座进行比较。与未命中的lncRNA相比,命中的lncRNA基因体在映射的增强子的1kb内的可能性是1.66倍。这代表了我们屏幕中确定的127个lncRNA命中基因座。然而,用于我们分析的FANTOM增强子注释来自数百种不同的细胞类型,因此在我们的筛选中任何给定细胞类型中只有一小部分这些增强子是活跃的。命中位点也是癌症相关SNP的5kb内的可能性的1.4倍。我们的命中物富含多外显子lncRNAs与lncRNA剪接可能是lncRNA功能的一个方面的概念一致。然而,外显子数量的解释力相对较低,我们的屏幕确实识别了几个单个外显子命中,如NEAT1。然而,没有单独或综合分析的基因组特性完全预测给定细胞类型中的生长调节剂lncRNA,强调了执行功能丧失筛选以定义功能基因组的重要性。
讨 论
无论观察到的lncRNA的细胞类型特异性的机制如何,该发现对于理解lncRNA的生物学作用具有意义。LncRNA似乎比蛋白质编码基因起源晚得多,与它们不具有通用的管家角色一致。我们的研究主要关注强大细胞生长所需的lncRNA,低估了这些细胞类型中功能性lncRNA的真实数量,因为已显示lncRNA可调节更复杂的细胞决定,如细胞命运,癌症转移和神经元功能。这里开发的CRISPRi工具现在可以应用于这种更高级细胞过程的研究,其中lncRNA可能表现出更大的功能丰富性。最后,lncRNA基因功能的精细细胞类型特异性对靶向治疗具有明确的意义。
微信扫描二维码关注公众号回复数字 “1810111” 下载文献原文,完整译文
其他相关文献解读
文献解读:S期富集的lncRNA的泛癌分析鉴定致癌驱动因子和生物标志物(IF:12.353)
文献解读:H19诱导腹主动脉瘤的发展和进展(IF18.88)
文献解读:在人类早期发育过程lncRNA XACT在控制X染色体活性上与XIST竞争(IF:23.290)
文献解读:lncRNA lncKdm2b通过启动Zfp292表达来持续维持ILC3细胞(IF:21)
文献解读:4个数据库,数千个RNAseq数据分析lncRNA与肿瘤药物的关系
文献解读:lncRNA Atrolnc-1促进慢性肾病小鼠的肌肉萎缩(IF:12.511)