本周最新文献速递2020-08-02

本周最新文献速递

文献题目: Testing and controlling for horizontal pleiotropy with probabilistic Mendelian randomization in transcriptome-wide association studies
不想看英文题目: 基于转录组关联研究(TWAS)的两样本孟德尔随机化方法
杂志和影响因子: Nat Commun (IF: 12.121)
结论: 整合了现有的转录组关联研究和孟德尔随机化方法,提出了转录水平和表型的因果关系模型,并和之前的 CoMM、 PMR-Egger、 TWAS、LDA MR-Egger、 SMR、PrediXcan方法进行了比较。新方法优势:1)较好的控制了I型错误;2)数据存在水平多效性时能精准的评估基因转录水平和表型的因果关系。
文章链接:
https://pubmed.ncbi.nlm.nih.gov/32737316/
公开的资料:
软件链接:
https://github.com/yuanzhongshang/PMR.
代码:
https://github.com/yuanzhongshang/PMRreproduce

文献题目: Spatiotemporal DNA methylome dynamics of the developing mouse fetus
不想看英文题目: 小鼠发育过程中DNA甲基化空间动态变化
杂志和影响因子: Nature (IF: 42.778)
样本量: 12只小鼠,9个不同发育阶段,168个不同组织或器官的甲基化基因组
分析方法: 做了几件事,第一、找到小鼠发育过程中DNA甲基化发生改变的基因组区域;第二、观察这些区域主要位于基因组的什么区域;第三、研究产前产后的DNA甲基化变化;第四、探讨非CG甲基化聚集的区域,以及聚集区域的甲基化变化规律;第五、结合最新的DNA甲基化数据以及整合多个数据库进行增强子的预测;第六、用实验证明预测出来的增强子是靠谱的;第七、证明预测的增强子与发育过程中的基因表达相关;第八、用人类同源基因组证明推测出来的增强子区域与多种疾病相关。
结论: 1)评估了小鼠胎儿发育中DNA甲基化的变化,发现有1,808,810个基因组区域在小鼠特异性组织的发育过程中甲基化发生了改变,覆盖了小鼠基因组的22.5%;2)大多数(91.5%)变化区域与启动子、CpG岛、CpG岛岸没有重叠;3)胎儿出生前主要过程为CG脱甲基化,出生后则在远端调节元件上进行CG的再甲基化;4)在胎儿发育过程中,非CG甲基化积聚在转录因子的基因体中,与组织发育和器官成熟相关,非CG甲基化积聚区域的基因表现为功能被抑制;5)通过整合小鼠ENCODE的DNA甲基化、组蛋白修饰和染色质数据,总共预测了461,141个增强子; 6)预测的增强子通过实验被准确的验证出来; 7)预测的调控元件显示出增强子活化染色质的时空变化,该变化与组织发育必需的基因动态表达模式相关; 8)预测的增强子在人类直系同源区段与多种疾病有关。
文章链接:
https://pubmed.ncbi.nlm.nih.gov/32728242/
公开的资料:
甲基化数据:
https://www.encodeproject.org/
RNA-seq数据:
https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE100685
代码:
https://github.com/yupenghe/methylpy
https://github.com/yupenghe/REPTILE
https://github.com/yupenghe/encode_dna_dynamics

文献题目: Human L1 Transposition Dynamics Unraveled with Functional Data Analysis
不想看英文题目: 人类长散布元件的功能数据分析
杂志和影响因子: Mol Biol Evol (IF: 11.062)
分析方法: 分析了 17,037个de novo 长散布元件, 1,212个多态性长散布元件以及 1,205 个人类特异性长散布元件的基因组图谱
结论: 1)长散布元件不是随机分布的;2)de novo 长散布元件与早期复制时序正相关,与端粒六聚体负相关;3)DNase超敏感位点,H3K4me2,H3K4me3,H3K9ac组蛋白标记,sperm低甲基化,CpG岛和G-四链体与de novo长散布元件高度重合;4)人类特异性长散布元件倾向于集中在外显子含量较低,且转录阻抑标记和保守元件较富集的区域; 5)通过比较人类特异性长散布元件和de novo长散布元件,发现人类特异性的长散布元件主要富集在H3K9me3组蛋白标记,A-phased重复序列和长散布元件目标基序中。
文章链接:
【本周最新文献速递2020-08-02】https://pubmed.ncbi.nlm.nih.gov/32722770/
公开的资料:
17,037个de novo 长散布元件, 1,212个多态性长散布元件以及 1,205 个人类特异性长散布元件数据、分析流程代码:
https://github.com/makovalab-psu/L1_Project/tree/master/L1_Datasets
本周最新文献速递2020-08-02
文章图片
image

    推荐阅读