数据分析
-
数据分析
1、测序碱基错误率评估
测序错误率决定碱基质量,受测序仪本身、测序试剂、样品等多因素影响,原始测序序列raw reads含有带接头的reads及低质量的reads。为了保证信息分析准确,需对原始序列进行筛选,得到clean reads。
2、GCAT含量分布
GC含量分布检查用于检测有无AT、GC分离现象,该现象可能是测序或者建库所引起。对于DGE测序来说,会导致reads前6-7个碱基有较大的波动,属于正常情况。
3、IGV可视化
采用IGV软件对基因组上比对序列文件可视化,可直观查看染色体、基因上具体序列细节。
4、circRNA长度统计
样本的circRNA长度分布如图所示。
5、circRNA来源统计
circRNA可以来源于exon、intron及ingtergenic的剪接。
6、circRNA表达量统计
TPM 密度分布统计。
7、火山图
火山图用于直观展示两组实验中,circRNA表达量的上调、下调情况。
8、circRNA聚类热图
将表达模式相同或相近的circRNA进行聚类分析,进而识别未知circRNA的功能或已知circRNA的未知功能;这些同类的circRNA可能具有相似的功能,或是共同参与同一代谢过程或细胞通路。
9、趋势分析
趋势分析,将不同时间点或状态点的circRNA表达值进行聚类,通过计算circRNA落入时间表达谱或状态表达谱的显著水平,识别显著性的变化趋势表达谱和与这些变化趋势相关的circRNA。
10、差异circRNA来源基因GO富集
对差异circRNA来源基因进行GO富集,直观的反映出在生物过程(Biological Process)、细胞组分(Cellular Component)和分子功能(Molecular Function)富集的GO term上差异基因的个数分布情况。
11、GO有向无环图
DAG有向无环图展现富集到的GO术语之间的关系。
12、差异circRNA来源基因PATHWAY富集
将差异circRNA来源基因进行PATHWAY富集,对得到通路注准差异基因信息,上调基因的KO节点标红色,下调基因的KO节点标绿色。
13、miRNA结合分析
对鉴定的circRNA进行miRNA结合位点分析,有助于进一步研究circRNA的功能。
以上分析皆为标准分析,生因生物可根据具体项目、具体需求提供个性化分析。