1970-01-01
作者:胥洋
在讨论如何处理观察性研究中时间依赖性混杂(how)之前,我想我们有必要先回答两个问题:
一是what,即什么是时间依赖性混杂?
二是why, 即为什么传统的分层/回归的方法处理时间依赖性混杂会失效?
what
举例来说,现要研究注射胰岛素与口服二甲双胍相比,患者死亡风险升高还是降低?为了简化问题,排除患者两种药物同时用和同时不用的情况。设注射胰岛素取值为1,口服二甲双胍取值为0。
无论是在传统的观察性研究中还是现代的观察性研究中,我们的目的都是为了得到暴露对于结局的因果效应,而如何得到因果效应呢?
假设不存在选择偏倚和测量偏倚,在传统的观察性研究中就是要控制基线时间点上所有可能混杂变量(potential confounder),即非时间依赖性混杂(time-fixed confounding);
在现代的观察性研究中就是要控制随访时间段上各期的所有可能混杂变量,即时间依赖性混杂(time-varying confounding)。
时间依赖性混杂根据当期的时间依赖性暴露取值与下一期的时间依赖性混杂取值之间的关系,可以分为无中介作用的时间依赖性混杂(图1)和有中介作用的时间依赖性混杂(图2)。
图1 无中介作用的时间依赖性混杂,即 Ek 对 Ck+1 无影响
图2 有中介作用的时间依赖性混杂,即 Ek 对 Ck+1 有影响
why
统计学中控制混杂的方法无非有三种,限制(restriction),分层(stratification)/回归(regression),标化(standardization)/加权(weighting),其中分层/回归在流行病学研究中被大量的使用来控制混杂。
那么分层/回归在时间依赖性的情况下是否还能有效地控制混杂,进而得到暴露对结局的因果效应呢?
答案是:视情况而定(it depends)。
图3
(for static strategies, a sufficient condition for identification of the causal effect of treatment strategies is that, at each time k, all backdoor paths into Ek that do not go through any future treatment are blocked)。
我们先来分析一下图1
图1 无中介作用的时间依赖性混杂,即 Ek 对 Ck+1 无影响
当我们按照 Ck 分层或把 Ck 纳入回归模型时,暴露 Ek 与结局 Y 之间的两条backdoor pathway就被blocked。
当我们按照 Ck 和 Ck+1 分层或把 Ck 和 Ck+1 纳入回归模型时,暴露 Ek+1 与结局 Y 之间的三条backdoor pathway就被blocked。
因此,在此种情况下,回归/分层是有效的。
我们再来分析一下图2
图2 有中介作用的时间依赖性混杂,即 Ek 对 Ck+1 有影响
当我们按照 Ck 分层或把 Ck 纳入回归模型时,暴露 Ek 与结局 Y 之间的三条backdoor pathway就被blocked。
当我们按照Ck 和 Ck+1 分层或把 Ck 和 Ck+1 纳入回归模型时,暴露 Ek+1 与结局Y 之间的四条backdoor pathway就被blocked,但是这条backdoor pathway却被打开了。
因此,在此种情况下,回归/分层是无效的。
附录:有向无环图(DAG)
和D-separation规则
有向无环图常常用于因果推断中表示各变量之间的关系,如图1和图2所示,图上的点表示变量,图上的带箭头的直线表示因果关系,箭头的指向为果,如A→Y表示的就是变量A导致变量Y。
要理解D-separation规则,我们首先要定义通路(path)的概念,通路指的是有向无环图上从变量 A 到变量 Y 之间所有带箭头的直线构成的路线,即假设你现在站在变量 A 上,你想走到变量 Y,你的每一条路线就是变量 A 到变量 Y 的一条通路。如果一条通路上含A←...这样的一段,那么这条通路就叫做变量 A 到变量 Y 的一条backdoor通路。
在有向无环图上,一个通路只有两种情况下是被阻断的,一种是一个非碰撞(noncollider)变量C 被conditioned on,如图3和4,另一种是一个碰撞变量(collider)L 及其子变量都没有被conditioned on,如图5。
碰撞变量指的是在一条通路上,有两个箭头同时指向的变量,即...→ L←...
常见的conditioned on的方法为限制(restriction),分层(stratification)/回归(regression)。
(A path is blocked if and only if it contains a noncollider that has been conditioned on, or it contains a collider that has not been conditioned on and has no descendants that have been conditioned on.)
图3
图4
图5
我们在后面的文章中会详细介绍如何处理时间依赖性混杂,敬请期待!
扫码关注“医咖会”公众号,及时获取最新统计教程!
百度浏览 来源 : 医咖会
版权声明:本网站所有注明来源“医微客”的文字、图片和音视频资料,版权均属于医微客所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源:”医微客”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,转载仅作观点分享,版权归原作者所有。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 本站拥有对此声明的最终解释权。
发表评论
注册或登后即可发表评论
登录注册
全部评论(0)