APOE4 的 rs429358 与 rs7412是连锁不平衡吗

最后发布时间 : 2026-06-15 15:33:50 浏览量 :

是的,rs429358rs7412 存在很强的连锁不平衡(Linkage Disequilibrium,LD),但并不是完全连锁(perfect LD),因此仍然需要同时检测这两个位点才能准确确定 APOE 基因型。

1. 为什么需要两个 SNP?

APOE 的 ε2、ε3、ε4 正是由这两个 SNP 的组合定义的:

rs429358rs7412APOE 等位基因
TTε2
TCε3
CCε4
CT极少见(非常罕见的单倍型)

可以看到:

  • ε2 = TT
  • ε3 = TC
  • ε4 = CC

如果只知道一个 SNP,是无法区分三种等位基因的。

例如:

rs429358 = T

那么它既可能是:

  • ε2(TT)
  • ε3(TC)

因此还必须知道 rs7412


2. 它们是不是连锁不平衡(LD)?

是,但不是完全 LD。

这两个 SNP:

  • 位于 APOE 基因内
  • 相距只有约 100 多个碱基(约 138 bp)
  • 在人群中几乎总是一起遗传

因此具有很高的 D′(D prime)

但是 r² 并不是 1

原因就在于存在三个常见单倍型:

Haplotypers429358rs7412APOE
T-TTTε2
T-CTCε3
C-CCCε4

如果只有两个单倍型,那么 r² 可以达到 1;但由于这里存在三个常见组合,因此:

  • D′ 往往接近 1(重组很少)
  • r² 通常小于 1(不能完全互相预测)

简单理解就是:

它们几乎不会因为重组而分开,但一个 SNP 的取值仍不能唯一决定另一个 SNP 的取值。


3. 为什么会这样?

举个例子:

假设某个人检测结果:

rs429358 = T

那么对应的 rs7412 可能是:

T → ε2
C → ε3

因此:

rs429358 = T

不能确定到底是 ε2 还是 ε3。

而如果:

rs429358 = C

在绝大多数情况下:

rs7412 = C

对应 ε4。

所以虽然它们高度相关,但预测并非百分之百准确


4. 为什么文献总是同时检测这两个 SNP?

因为 APOE 的定义本身就是:

APOE allele
        │
        ▼
(rs429358, rs7412) 组合

例如:

rs429358rs7412推断
TTε2
TCε3
CCε4

只检测其中一个 SNP,无法完整区分 ε2、ε3 和 ε4。


5. 在 GWAS 中如何得到 APOE4?

如果使用 SNP 芯片或全基因组测序,通常都会直接获得这两个位点的基因型:

rs429358  C/T
rs7412    C/C

然后根据组合直接推断:

C + C
    ↓
APOE ε4

再结合父母来源(phasing)得到最终基因型,例如:

ε3/ε4
ε4/ε4
ε2/ε3

总结

  • rs429358rs7412 确实存在很强的连锁不平衡(LD),因为它们距离极近并且很少发生重组。
  • 但它们不是完全连锁(r² ≠ 1),存在多个常见单倍型(ε2、ε3、ε4),因此一个 SNP 不能唯一预测另一个 SNP。
  • APOE ε2/ε3/ε4 的定义就是由 rs429358rs7412 的组合决定的,所以临床和研究中通常需要同时检测这两个位点来准确判定 APOE 基因型。