经典案例
-
以拟南芥为例依据染色体间的关系de novo组装植物基因组
研究背景
基因组组装的一个典型的两步策略是:双端测序组装contigs,然后contigs组装成scaffolds。在过去的10年间,二代测序逐渐变得低廉、常用、广泛。大多数的植物基因组通过二代测序产生了草图,组装成contigs或scaffolds。但是进一步得到染色体尺度的scaffolds的高质量基因组却依然困难。近期报道一种更为高效的方法是根据染色体的关系得到染色体尺度的组装(Hi-C)。本研究,我们直接根据染色体内部的关系,做了Hi-C分析并评估Hi-C数据。
研究方法
研究结果
1 Ler染色体组装结果。A:Ler de novo组装聚类预测;B:Hi-C与遗传图谱组装结果比较;C-G:5个染色体的顺序和方向预测;H:Hi-C与遗传图谱组装结果顺序比较;I-M:样本中低相互关系的染色体组装评估分布。
2 Hi-C组装结果与已有同源基因组(Col)比较。A:Ler;B:Col;C:两者相关性。
3 聚类中错误scaffolds与正确scaffolds的长度分布。
4 LUSTER_MIN_RE_SITES与ORDER_MIN_N_RES评估。A:聚类覆盖度;B:聚类错误;C:排序覆盖度;D:排序错误;E:方向覆盖度;F:方向错误。
研究结论
根据染色体内关系而开发的de novo染色体尺度组装是一种新精确构建完成参考序列的方法。该方法能够以一种低成本的方式进行更为精确和标准的分析,并为植物其他方面的分析打开一扇门。
参考文献
De Novo Plant Genome Assembly Based on Chromatin Interactions: A Case Study of Arabidopsis thaliana. [Molecular Plant, 2014]