Github开源生信云平台 DEMO
是的,rs429358 和 rs7412 存在很强的连锁不平衡(Linkage Disequilibrium,LD),但并不是完全连锁(perfect LD),因此仍然需要同时检测这两个位点才能准确确定 APOE 基因型。
rs429358
rs7412
APOE 的 ε2、ε3、ε4 正是由这两个 SNP 的组合定义的:
可以看到:
如果只知道一个 SNP,是无法区分三种等位基因的。
例如:
rs429358 = T
那么它既可能是:
因此还必须知道 rs7412。
这两个 SNP:
因此具有很高的 D′(D prime)。
但是 r² 并不是 1。
原因就在于存在三个常见单倍型:
如果只有两个单倍型,那么 r² 可以达到 1;但由于这里存在三个常见组合,因此:
简单理解就是:
它们几乎不会因为重组而分开,但一个 SNP 的取值仍不能唯一决定另一个 SNP 的取值。
举个例子:
假设某个人检测结果:
那么对应的 rs7412 可能是:
T → ε2 C → ε3
因此:
不能确定到底是 ε2 还是 ε3。
而如果:
rs429358 = C
在绝大多数情况下:
rs7412 = C
对应 ε4。
所以虽然它们高度相关,但预测并非百分之百准确。
因为 APOE 的定义本身就是:
APOE allele │ ▼ (rs429358, rs7412) 组合
只检测其中一个 SNP,无法完整区分 ε2、ε3 和 ε4。
如果使用 SNP 芯片或全基因组测序,通常都会直接获得这两个位点的基因型:
rs429358 C/T rs7412 C/C
然后根据组合直接推断:
C + C ↓ APOE ε4
再结合父母来源(phasing)得到最终基因型,例如:
ε3/ε4 ε4/ε4 ε2/ε3