GWAS 与 宏基因组数据整合

最后发布时间 : 2026-06-10 13:54:33 浏览量 :

不能直接把“每个 SNP 的 P 值”和“每个菌群丰度”做相关性分析

  • GWAS:每个 SNP 对应一个统计量(β、OR、P 值)
  • 宏基因组:每个样本对应一个菌群丰度

而真正可以建立联系的是样本级(genotype × microbiome) 数据

Samplers123rs456rs789BacteroidesPrevotellaBlautia
S1AAGGCC0.120.030.15
S2AGGTCT0.080.200.10
S3GGTTTT0.250.010.30

实际上就是把 SNP 当作自变量:

菌群丰度 ~ SNP + Age + Sex + BMI + PCA

例如:

 Bacteroides ~ genotype + age + sex + PC1 + PC2

\text{abundance}=\beta_0+\beta_1\text{Genotype}+\beta_2\text{Age}+\cdots+\epsilon