非常感谢。
叶建成 2021-04-10 01:48 开发者_如何学Python
问题1、
BS-seq测序技术的基本原理:通过将DNA序列中未发生甲基化的C->T->读段(打碎),对读段进行单碱基水平的高通量测序。
------------------------------------------------分割线------------------------------------------------------
问题2、
读段定位(成像):在BS-seq测序后,需要将测序的读段定位到参考基因序列的位置上,才能获得发生甲基化的基因区域的具体位置。而由于在测序读段中,已经将C转换为T,所以在读段定位时,参考基因序列中的C可以与读段中C和T匹配,增加了比对难度。
读段定位方法:
(1)wild-card 参考序列中C用Y来代替,Y既可以与C又T匹配。软件:BSMAP、Last。
(2)three-letter:将参考基因与读段中C都用T代替,将ATCG---->ATG 软件:Bis-mark、BS-seeker(UCLA)。
优缺点:
1、覆盖率高,假阳性。
2、覆盖率低,但过滤了甲基化完全匹配
------------------------------------------------分割线------------------------------------------------------
问题3、测序结果
通过读段定位的过程,可以确定基因序列上发生甲基化位点。然而,由于测序误差,定位偏斜,碱基转换等因素,有必要对测得的甲基化位点上的甲基化水平进行一定的预测,从而过滤一些可信度比较低的结果,降低假阳性,对于预测位点甲基化水平计算最简单方法:分析该位点上C与T的分布状况来获得甲基化水平,如计算C与位点上所有碱基的比例,然而,实验说明,这种简单方法存在较大的假阳性。(我们可以假定一定的定位统计模型来对所定位的位点的甲基化状态可信度进行预测,比如我们可以假设读段在整个基因序列上定位时将服从正态分布等)
精彩评论