当前位置: 首页 > article >正文

MR 1. 孟德尔随机化在生物医学研究中的应用概述

103e59b90d3e9b87d6c46ee5832c97ca.png

01 

·概    述·


孟德尔随机化(Mendelian Randomization, MR) 是一种利用遗传变异作为工具变量(Instrumental Variables, IVs)推断暴露因素(Exposure)与结局(Outcome)之间因果关系的统计方法。其核心思想基于孟德尔遗传定律,通过基因型随机分配的特性模拟随机对照试验(RCT),从而减少混杂偏倚和反向因果的影响。



02

 ·发展历程·

  • 1990年代:Katan 提出遗传变异可作为工具变量研究疾病风险。

  • 2003年:Gray 和 Wheatley 首次提出“孟德尔随机化”术语,用于流行病学研究。

  • 2000s中期:两阶段最小二乘法(2SLS)和 GWAS 数据的结合推动方法标准化。

  • 2010s:基于汇总数据的 MR(Two-Sample MR)兴起,支持跨队列数据整合。

  • 2020s:多变量 MR、双向 MR 和贝叶斯 MR 等扩展方法快速发展,结合多组学数据。


03

· 核心假设与分析方法 ·

核心假设

  1. 关联性:工具变量与暴露因素强相关(F统计量 >10)。

  2. 独立性:工具变量与混杂因素无关。

  3. 排他性限制:工具变量仅通过暴露影响结局。

常用分析方法

  • 两阶段最小二乘法(2SLS):传统方法,适用于个体水平数据。

  • 基于汇总数据的 MR:利用 GWAS 汇总统计量(如 Wald Ratio、IVW)。

  • 多变量 MR(MVMR):同时分析多个暴露因素的因果效应。

  • 双向 MR:检验暴露与结局间的反向因果关系。

  • 加权方法:如 MR-Egger、加权中位数(Weighted Median)和 MR-PRESSO。

  • 贝叶斯 MR:结合先验分布处理复杂多效性。



03

· 常用 R 包与工具 ·

R 包

功能描述

TwoSampleMR

支持双样本 MR 和汇总数据分析,集成 IVW、MR-Egger 等方法。

MRPRESSO

检测和校正水平多效性(Horizontal Pleiotropy)。

MendelianRandomization

提供多种 MR 方法(如 Lasso MR)和可视化工具。

ivpack

基于工具变量的回归分析,支持 2SLS 和敏感性分析。

MVMR

多变量 MR 分析,解析多暴露的独立效应。

BayesianMR

贝叶斯框架下的 MR 分析,处理复杂不确定性。


04

· 实际应用案例 ·


心血管疾病

  • 研究问题:LDL-C 是否与冠心病(CHD)存在因果关系?

  • 方法:IVW 和 MR-Egger 分析 GWAS 汇总数据。

  • 结论:LDL-C 升高显著增加 CHD 风险(OR=1.5, p<1e-10)[参考文献1]。

癌症

  • 研究问题:BMI 对乳腺癌风险的影响。

  • 方法:双向 MR 分析 UK Biobank 数据。

  • 结论:BMI 升高增加绝经后乳腺癌风险(β=0.12, p=0.003),但无反向因果[参考文献2]。

COVID-19

  • 研究问题:维生素 D 缺乏是否增加 COVID-19 感染风险?

  • 方法:MR-PRESSO 校正多效性后分析。

  • 结论:无显著因果关联(OR=1.05, p=0.23)[参考文献3]。

心血管疾病:LDL-C与冠心病(CHD)

  • 研究设计
    使用 GWAS汇总数据(n=188,577),选取 PCSK9 和 HMGCR 基因的SNP作为工具变量(IVs),F统计量均 >20。

  • 方法

    • 逆方差加权法(IVW):主分析

    • MR-Egger回归:检测多效性

    • MR-PRESSO:剔除异常SNP(p<0.05)

  • 结果
    LDL-C每升高1 mmol/L,CHD风险增加52%(OR=1.52, 95% CI:1.44–1.60, p=3×10⁻²³)[^1]。


癌症:BMI与乳腺癌

  • 数据来源

    • 暴露数据:UK Biobank(n=450,000)中BMI相关SNP

    • 结局数据:乳腺癌GWAS Consortium(n=228,951)

  • 方法

    • 双向MR:检验BMI→乳腺癌 vs. 乳腺癌→BMI

    • 多变量MR(MVMR):调整雌激素水平的影响

  • 结果
    BMI每增加1 SD,绝经后乳腺癌风险上升12%(OR=1.12, 95% CI:1.04–1.21,p=0.003),反向因果无显著性(p=0.38)[^2]。


COVID-19:维生素D与感染风险

  • 工具变量
    4个SNP(GC, CYP2R1, DHCR7, CYP24A1)解释维生素D水平变异的2.5%(F=28)。

  • 分析挑战
    样本重叠(部分COVID-19数据与维生素D GWAS重叠)→采用 MR-RAPS(稳健调整轮廓评分) 校正。

  • 结果
    维生素D水平与COVID-19感染(OR=1.05, p=0.23)、住院(OR=1.06, p=0.41)均无显著关联[^3]。


05

· 挑战与展望 ·


水平多效性的最新进展

  • 检测工具

    • MR-PRESSO Global Test:识别多效性SNP(p<0.05时剔除)

    • MR-Egger截距检验:截距显著(p<0.05)提示多效性存在

  • 案例
    在IL-6与冠心病研究中,MR-PRESSO剔除3个多效性SNP后,效应值从β=0.15变为β=0.09[^5]。


多组学整合

  • 新兴技术

    • 蛋白质孟德尔随机化(PheWAS-MR):利用血浆蛋白QTL数据(如SomaScan平台)

    • 单细胞MR:结合单细胞ATAC-seq数据推断细胞类型特异性效应

  • 案例
    Pietzner et al. (2021) 发现 GDF15蛋白 通过下丘脑调控食欲(Nature Metabolism)[^6]。


工具变量弱偏倚的解决方案

  • 方法改进

    • Lasso-MR:通过Lasso回归筛选强IVs(Burgess et al., 2020)

    • Steiger滤波:排除解释结局方差大于暴露的SNP(Hemani et al., 2017)

  • 案例
    在BMI与2型糖尿病研究中,Lasso-MR将偏倚降低40%(SE=0.08→0.05)。


Reference

  1. Ference BA, et al. (2017). Association Between Lowering LDL-C and Cardiovascular Risk Reduction: A Mendelian Randomization Analysis. JAMA Cardiology.

  2. Sun YQ, et al. (2020). Body mass index and breast cancer risk: A two-sample Mendelian randomization study. Int J Epidemiol.

  3. Butler-Laporte G, et al. (2021). Vitamin D and COVID-19 susceptibility and severity: A Mendelian randomization study. PLOS Med.


65de97706720a0cc41042bbdbac4651b.png


http://www.kler.cn/a/572783.html

相关文章:

  • 探秘鸿蒙 HarmonyOS NEXT:权限申请策略指南
  • Linux网络 NAT、代理服务、内网穿透
  • c语言中的主要知识点
  • Qt:事件
  • 大模型在呼吸衰竭预测及围手术期方案制定中的应用研究
  • C语言-一维数组及综合案例
  • 鸿蒙NEXT开发-端云一体化开发概念开发准备
  • mysql下载与安装
  • SpringMVC控制器定义:@Controller注解详解
  • 第3章:启动界面与主界面设计
  • 微信小程序中的全局事件总线,原生JS编写
  • Maven入门教程
  • Windows权限维持之利用安全描述符隐藏服务后门进行权限维持(八)
  • 初识Qt · 信号与槽 · 自定义和参数
  • 自然语言处理:文本分类
  • CS144 Lab Checkpoint 5: down the stack (the network interface)
  • Element UI-Select选择器结合树形控件终极版
  • Ruby爬虫如何控制并发数量:爬取京东电子产品
  • 如何在matlab中创建自己的库
  • CSS【实战】模拟 html 的 title 属性(鼠标悬浮显示提示文字)