MEM-CHIP学习笔记


MEM-CHIP学习笔记
文章图片

MEME-ChIP网址
MEM-ChIP的特性
MEM-ChIP程序可以对你提供的DNA序列进行一系列的motif分析,他特别适合用来分析在Chip-Seq试验中发现的基因结合区域。
它可以做到以下几点:

  • 发现新的DNA结合motif
  • 通过比较已知的结合位点进行相似性分析
  • 可视化预测motif
  • 在你的序列上检测存在富集的motif
  • 预测在你的序列上结合的motif的数量
MEM-ChIP的介绍
输入文件 你需要提供给它FASTA格式的输入文件,理想状态下需要100bp长度,事实上就是Chip-Seq试验中peaks存在位置周围的序列(但实际上对于序列的长度是没有要求的)。
MEM-ChIP可以做什么 MEME-CHIP的最终目的就是给你提供有关于你序列的一系列的建议而不需要去单独配置一系列的工具。这些建议包括:
  • Ab initio motif的发现:我们这里使用两种分析方法:MEME和DREME
    • MEME可以发现你用来做CHIP的TF的结合motif,并且可以发现对应于复合体的长范围的motif
    • DREME可以用来发现单体的短motif以及cofactor
  • 同已知motif进行比对,TOMTOM可以将用户数据里面发现的motif同数据库里面的已知的motif进行比对
  • 对于输入序列寻找到的motif的一个可视化,MAST利用一种合适的match方法给用户展示了在什么地方发现的motif
  • 预测序列对每一个找到的motif的结合亲和性,AMA测试对于每个序列和motif的结合强度
  • motif富集分析,AME可以发现细小的富集的结合motif
MEME-ChIP可以回答你以下问题:
  • 我这次做的CHIP实验蛋白结合位点是怎样的?MEME和DREME可以帮助你回答这个问题
  • 结合事件是否单单只是一个简单事件又或者是包括复合体在内的事件?MEME将会发现长motif
  • 结合是否包括cofactor在内?DREME将会发现不止一个motif( low-p-value)
  • 这里是否存在已知TFs的结合位点?AME可以在你的序列里发现富集的已知的motif
  • 发现的一些motif是否与已知motif相类似?TOMTOM将会回答这一问题
EXAMPLE
Mouse ChIP-Seq experiment (Klf1, mouse)
FASTQ格式的文件
>chr1:9738232-9738732 ACATCGCTCTCGGCTCTCGCTCGGCGTCCCAAGCGACCCTCAAAGGCACATAGCCAGACCTCCGCCGGCCCGACGAGGTCTAGTCCAGGCCCAGGGCGAA TGGCTTTCCTTTTCCTACCAGTTCCTCCTCCTCCTAGGCGAAGGCGGAAGCGCCGGACGTTGTTTCTCTTCTCACTTCTCCACTGCCTTAGCCGTTGCCC CGAACGTAACGGCCACCACCCCACCCCGCACTCACACTCACTCACTCTCGCTCTCTCCCTCAGACACAGACATACACGCCCTCACTGAGACTGCGCAGGC GTAGCTTCTGCTCTGCCCTCTGGGAACCAGAGTCTTCCGGCTCCTCTCTCGCGAAGGAGTGCTAGGCGCTTCCGTCCAGAAAGAACTTCAAATACCGTGA TGCAAAGCGACTCGACGCACGCGGGGAGGAGGAAGAGGAAGGCACTCGGAAGGTGGGGGCAGAAAGGAAGTCGATGATTCGCGGAGCTTGTCGGTAGTTG>chr1:9763390-9763890 TCACTATCTGCCTCCCACTTCGGCAGCTTAGGCAGTGGCCACTAAATAAACCAGTTCCCCTCTCTGAGAATACTGCTGTAGTCTGACCTACAAAGGTTGT GGTAAGAGTCTTGGTGGAATCTGAGAGAGGTNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGAAAGACAGACAGGCTTTTGAGAGACA CTCCTACATGAAAAGAGCAATCTTGAGTTGTGGCATGTGACAAGTTCCTCTAGGACAGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNN NNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNCCCGTTGAAATGGTAACTCCGTTGCTTTCAGATCTGTGCCTTCACTTGACTTGAAAA

MEME-ChIP如何预处理你的输入序列 【MEM-CHIP学习笔记】在MEME-ChIP运行上述工具之前会预处理你的输入序列。长于100bp的序列都会被的切割,随后至多随机挑选600条序列呈递给MEME

    推荐阅读