甲基化DNA免疫共沉淀测序原理及简介(MeDIP-seq)

2014-02-05 MedSci MedSci原创

MeDIP-Seq(Methylated DNA Immunoprecipitation Sequencing)测序是基于抗体富集原理进行测序的全基因组甲基化检测技术,采用甲基化DNA免疫共沉淀技术,通过5'-甲基胞嘧啶抗体特异性富集 基因组上发生甲基化的DNA片段,然后通过高通量测序可以在全基因组水平上进行高精度的CpG密集的高甲基化区域研究。 研究人员可以利用MeDIP-Seq

MeDIP-Seq(Methylated DNA Immunoprecipitation Sequencing)测序是基于抗体富集原理进行测序的全基因组甲基化检测技术,采用甲基化DNA免疫共沉淀技术,通过5'-甲基胞嘧啶抗体特异性富集 基因组上发生甲基化的DNA片段,然后通过高通量测序可以在全基因组水平上进行高精度的CpG密集的高甲基化区域研究。

研究人员可以利用MeDIP-Seq技术快速有效地寻找基因组上的甲基化区域,从而比较不同细胞、组织或疾病样本间的DNA甲基化修饰模式的差异。

技术策略:

技术优势:

■ 精确度高:基因组位点定位精确性可达± 50bp。

■ 可靠性高:直接对甲基化片段进行测序和定量,无交叉反应和背景噪音。

■ 检测范围广:全基因组范围内甲基化区域研究。

■ 高性价比:通过抗体富集高甲基化区域进行测序,有效降低测序费用。


技术路线:


 

 

MeDIP-seq生物信息学分析


将测序结果与参考基因组比对,比对上唯一位置的序列用于后续标准信息分析及个性化分析。信息分析流程如下:

生物信息分析流程图,首先要对测序数据进行去接头去低值处理,然后进行比对分析,采用唯一比对的reads进行下一步分析。之后对唯一比对reads在基 因组,基因元件的分布进行分析。检测到唯一比对的reads的富集区(Peak),并对Peak进行分析。最后进行差异Peak的分析。

1. Data clean

测序完成后,去污染,去接头及去除低质量数据。


数据产出统计信息

样品名称

read长度(bp)

reads数量

原始数据(Gb)

a

49

24,489,796

1.2

b

49

24,489,796

1.2

c

49

24,489,796

1.2

 

2. MeDIP-Seq序列与参考序列的比对

将MeDIP-Seq序列与参考基因组进行比对,每条read最多容许2个碱基的错配,生成最终比对结果文件 *.sop。


比对信息统计

样品名称

原始reads数量

比对reads

比对率(%)

有效链深度

唯一比对reads

唯一比对率(%)

a

24,489,796

21,449,285

87.58

2.82

12,199,426

49.81

b

24,489,796

21,759,594

88.85

2.86

12,328,166

50.34

c

24,489,796

21,979,358

89.75

2.89

12,193,301

49.79

比对率=比对reads数/原始reads数量

有效链深度=比对bases数/基因组参考序列大小

唯一比对率=唯一比对reads数/原始reads数量

3. MeDIP-Seq数据的全基因组分布趋势

3.1 MeDIP-seq 测序 reads 在全基因组上的覆盖深度

计算全基因组上每一个碱基的覆盖深度,得到不同覆盖深度下的碱基百分比,即不同覆盖深度下的碱基对应基因组的覆盖度。

覆盖深度:特定位点被测序 reads 所覆盖的次数。例如某一个位点上的覆盖深度为 10X,则表明这个位点被测序 reads 覆盖了 10 次。而对于特定的 DNA 区域,或者全基因组范围,则可以计算平均覆盖深度。

基因组覆盖度:符合特定条件的碱基数所能覆盖的全基因组碱基数的比例。下图中横轴表示测序深度,纵轴表示不低于这一特定测序深度的基因组覆盖度。



3.2 MeDIP-seq 测序 reads 在 CpG 位点上的覆盖深度

MeDIP-seq 测序reads在CpG位点上的覆盖深度计算全基因组上每一个CpG(Watson链,Crick链,双链)的覆盖深度,得到不同覆盖深度下CpG位点的 覆盖度,即一定覆盖深度以上的CpG位点在MeDIP-seq所测得的全部CpG位点中所占比例。



3.3 MeDIP-Seq测序reads在不同基因功能元件上的分布

对测序reads在9种基因组功能元件上的分布进行比较分析,有助于了解不同功能元件的甲基化修饰特征。这9种功能元件包括CpG Islands, Repetitive Elements, gene upstream2k, first exon, first intron, internal exons, internal introns, last exon , downstream2k。另外,在此基础上对Repetitive Elements区域进一步细分,统计reads在不同类型Repeat区域的分布情况。

横轴表示不同基因区域,纵轴表示分布在特定基因区域的reads占可比对reads总数的比例。


reads在不同基因功能元件上的分布



reads 在重复区域的分布情况


3.4 MeDIP-seq 测序 reads 在不同 GC 含量区域中的分布

以200bp大小的窗口对基因组进行扫描,计算MeDIP-Seq序列在不同GC含量的窗口的分布情况,可以反映出测序数据在不同GC含量区域的富集性分布特征。

下图中横轴代表不同GC含量区域,纵轴代表特定GC含量区域的reads总数占所有可比对reads总数的比例。


4. 统计 MeDIP-seq 数据富集区域 ( Peak ) 的信息

对 MeDIP-seq 序列进行 Peak 扫描,并进行相关统计分析。

4.1 Peak 扫描

全基因组范围扫描寻找Peak区域,得到Peak在基因组上的位置信息。


表3-3 Peak信息统计

样品名称

Peak 数量

Peak平均长度

Peak长度中位数

Peak总长度

Peak覆盖度

a

41,554

1,237.80

1,108

51,435,436

13.81%

b

43,020

1,200.41

1,065

51,641,544

13.87%

c

43,358

1,251.26

1,109

54,252,026

14.57%

 

4.2 寻找 Peak 相关基因

根据Peak扫描的结果,寻找Peak相关基因。

4.3 统计Peak在不同基因功能元件上的分布

分别统计Peak在upstream2k,first exon,first intron,internal exons,internal introns,last exon,downstream2k等7个基因功能元件上的个数分布和覆盖度分布。

下图中横轴表示各个功能元件区域,纵轴表示特定功能元件所包含的peak个数。


下图中横轴表示各个功能元件区域,纵轴表示特定功能元件区域所包含的peak在该区域的覆盖度(即覆盖碱基数与该区域碱基总数的比值)。


将每个基因元件按长度平均分成10份,以曲线图的形式反映每一个功能元件区域的 peak覆盖度变化趋势。


5. 基于 Peak 的多样品间差异性分析

5.1分析两个样品间的 peak 相关差异基因

基于两个样本的MeDIP测序数据,针对各基因功能元件区域的Peak覆盖度做差异分析,找到具有差异的基因。

筛选条件为:p值≤0.05,两个样本在相同基因元件内都有覆盖,且覆盖度的差异在 4 倍以上。下述表格中的数值表示差异基因个数。
 

# of genes

A vs B

 upstream2k

833

first exon

65

First intron

559

Internal exons

517

Internal introns

78

Last exon

220

downstream2k

731

 

5.2 对两个样品间的差异基因进行GO功能富集分析及pathway功能分析

Peak相关差异基因所具有的功能聚类,代表两个样品在特定生物学功能上具有与DNA 甲基化修饰相关的差异性。下图为差异基因的GO功能分析结果。横轴代表GO功能分类项,左纵轴代表与GO相关的基因的比例,右纵轴代表与GO相关基因的数 量,每一个特定功能分类项中均列出两个样品在此功能分类下的分布情况。

图中所标down与up,是将sample1与sample2进行比较后所得到的内容,sample2覆 盖度高于sample1的基因即为up-methylated,反之则为down-methylated。


6. 个性化信息分析

根据客户具体项目需求进行个性化分析。

案例分析:

MeDIP-Seq发现种子发育过程中重复元件广泛的去甲基化是基因印记的基础

在植物中,基因印记现象往往发生在胚乳中。研究人员以两个拟南芥品种Col- gl和Ler各自的胚和胚乳为材料,利用medIP测序的手段对全基因组的甲基化谱进行研究。发现伴随着胚乳的发育以及胚乳特异的一些基因的表达发生了大 规模甲基化的变化。胚乳中重复元件发生了广泛的去甲基化。并且,通过将胚乳中甲基化程度降低的区域与胚乳表达偏好性(preferential expression in endosperm)关联起来作为候选印记基因的方式,寻找到了新的印记基因。所有的结果说明植物中印记的发生来源于在基因调控元件附近插入重复元件的甲 基化以及之后的正向选择的原因。


胚与胚乳中甲基化状况

原文:Extensive Demethylation of Repetitive Elements During Seed Development Underlies Gene Imprinting, Science, 2009

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=1951229, encodeId=4eb3195122958, content=<a href='/topic/show?id=2dcd2896193' target=_blank style='color:#2F92EE;'>#免疫共沉淀#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=32, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=28961, encryptionId=2dcd2896193, topicName=免疫共沉淀)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=7387164, createdName=zhangj7108, createdTime=Tue Jul 29 17:08:00 CST 2014, time=2014-07-29, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1606104, encodeId=f861160610486, content=<a href='/topic/show?id=eb6b1145939' target=_blank style='color:#2F92EE;'>#Med#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=32, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=11459, encryptionId=eb6b1145939, topicName=Med)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=a12645, createdName=智慧医人, createdTime=Fri Feb 07 05:08:00 CST 2014, time=2014-02-07, status=1, ipAttribution=)]
  2. [GetPortalCommentsPageByObjectIdResponse(id=1951229, encodeId=4eb3195122958, content=<a href='/topic/show?id=2dcd2896193' target=_blank style='color:#2F92EE;'>#免疫共沉淀#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=32, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=28961, encryptionId=2dcd2896193, topicName=免疫共沉淀)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=7387164, createdName=zhangj7108, createdTime=Tue Jul 29 17:08:00 CST 2014, time=2014-07-29, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=1606104, encodeId=f861160610486, content=<a href='/topic/show?id=eb6b1145939' target=_blank style='color:#2F92EE;'>#Med#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=32, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=11459, encryptionId=eb6b1145939, topicName=Med)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=a12645, createdName=智慧医人, createdTime=Fri Feb 07 05:08:00 CST 2014, time=2014-02-07, status=1, ipAttribution=)]
    2014-02-07 智慧医人

相关资讯

Biol Reprod:母亲糖尿病能削弱卵母细胞印迹基因的甲基化

科研人员首次证明了没有得到良好控制的母亲糖尿病能对母亲印迹基因Peg3的甲基化产生不良影响,这对后代发育受到损害有贡献。 此前的研究已经表明,糖尿病母亲的后代表现出了更高的畸形和死胎的发生率,即便是把一个单细胞胚胎从糖尿病母亲移植到非糖尿病母亲体内的时候也是如此。糖尿病母亲的卵母细胞倾向于表现出葡萄糖代谢减少,卵丘细胞和卵母细胞之间的通信被削弱,线粒体失灵,以及排卵率下降,所有这些都可以追溯到胚

Science:甲基修饰抑制TLR13识别23S rRNA引发细菌耐药

7月19日,Science在线报道,TLR13受体可识别一类保守的23S核糖体RNA序列,以及一种围绕该相互作用的细菌耐药机制。 保护宿主免受感染的机制依赖于识别受体,如Toll样受体(TLRs),以与生俱来的模式识别病原体。 本研究证实,在小鼠体内,孤儿受体TLR13识别一个细菌内保守的23S核糖体RNA(rRNA)序列。该序列是大环内酯类,林肯酰胺以及链霉杀阳菌素类(MLS)抗生素(包括红

Science:一幅脑内的甲基化图谱

我们基因的表达可能会受到我们DNA上的特定标记的影响,例如那些通过对特定核苷酸碱基对的甲基化而被赋予的标记——这一过程被称为表观遗传学过程。科学家们现在提出了一个详细的图谱用以阐释在发育中的哺乳动物大脑中的甲基化如何随着时间的推移而变化。在我们很小的时候及在我们的神经环路正在成形时,DNA甲基化会发生在我们大脑的神经元中;事实上,甲基化被认为与脑发育、学习及记忆等方面有关联。与此同时,尽管人们对发

2013年诺贝尔奖预测:甲基化发现者可能获奖

离宣布2013年诺贝尔奖的获奖者名单只有一个多星期了。日前,汤森路透宣布了今年“汤森路透引文桂冠奖”的得奖名单,用以预测哪些成果出众的获奖 者有望夺得诺贝尔奖。汤森路透利用他们专有的“Web of Science™”研究与引用数据库中的数据分析可能获得诺贝尔化学奖、物理学奖、生理学或医学奖,以及经济学奖的研究者。   “科学研究的引用情况能够反映研究的影响力,”汤森路透学术与科学研

PLoS Medicine:子宫内膜癌可能与HAND2甲基化有关

来自英国伦敦大学学院妇女癌症部的研究人员在11月12日的PLOS Medicine杂志上发表了一项最新研究:发现HAND2基因是子宫内膜癌中的一种差异甲基化热点,这个基因的表观遗传学修饰在子宫内膜癌的发展中起着关键的作用。 作为一种能够引起全球13%死亡人数的疾病,癌症能够在人体的任何地方发生,但是所有癌症都有这样的特征:不受控制的细胞生长和细胞分化减少。遗传改变——在特定基因中的核苷酸序列的变

Genome Biol:乳腺癌中DNA甲基化和拷贝数改变调控miRNA异常表达

   挪威奥斯陆大学等机构的研究人员对乳腺癌队列人群进行分析,揭示了DNA甲基化和拷贝数改变对microRNA表达的影响,从而为乳腺癌中miRNA失调背后的机制提供了新证据。这项研究成果于11月20日发表在Genome Biology上。   microRNA(miRNA)是一类小的非编码RNA分子,它通过控制mRNA稳定性和翻译而在转录后水平上调控基因表达。之前的研究