注册 | 登录 | 充值

首页-> 学术资讯 -> 医客课堂 -> 基金 -> 科研基金

临床研究缺失值的处理

科研基金

2020-05-29   

7249 0

在临床研究中经常会出现临床数据缺失的情况,这就是所谓的缺失值。这些缺失值会增加统计分析的难度,减少有效数据,从而影响统计的精度,导致统计推断出现偏差或无效,最终做出偏倚性结论。今天小编就和大家一起来学习缺失值有哪些类型以及对缺失值的处理方法。

一、缺失值的类型

1. 完全随机缺失

完全随机缺失指的是临床研究的数据缺失完全是由随机因素所造成的,这独立于已完成的和将来要进行评价的结果,既不取决于已观察到的数据也不取决于未被观察到的数据。只有当完全随机缺失发生时,随机选取具有完整数据的个体所组成的样本就可认为是从研究总体中得到的随机样本。所以,删除完全随机缺失的数据不会产生偏倚。

2.随机缺失

随机缺失是最常见的缺失类型,观察对象缺失的概率取决于已有的观察结果,并不取决于未观察到的结果。比如,在老年黄斑变性患者接受抗血管生成药物治疗的临床研究中,若研究对象发现临床症状控制不良时决定退出研究,此时出现的缺失值就属于随机缺失。在随机缺失情况下,仅仅使用具有完整数据的个体进行分析则会导致选择偏倚,因为这些样本并不是从研究总体中得到的随机样本。

3.非随机缺失

非随机缺失在极大似然法和贝叶斯理论框架内也被称为“不可忽略性” 。因为这种缺失大都不是因偶然因素造成的,比如疾病进展太快或治疗副作用太大,导致患者无法继续接受随访。非随机缺失现象主要取决于缺失值本身,这类情况往往需要通过建立复杂的模型来合并缺失机制。

二、如何处理缺失值?

1. 忽视缺失值

只有当出现完全随机缺失值时才可以忽视这些缺失值,否则会得到一个偏倚性结论。不过忽视缺失值仅采用完整病例进行分析,这违背了意向性治疗原则且会产生偏倚性结论,不推荐将其作为确证性试验(确证性临床试验是在探索性临床试验基础上,通过开展多中心临床试验,进一步确证药物临床疗效,为获得上市许可获得充足证据)的主要结果的缺失数据处理方法。

2.数据填补

数据填补是处理数据缺失常用的一种技术方法,具有以下优点是:研究人员可对经过填补后的数据集采用完全数据的分析方法,而不需要采用单独的、复杂的算法;在某些情况下,填补可以减少由于无应答等造成的估计偏差。数据填补的缺点有:填补过程比较困难且不容易实现,特别是在多维复杂结构下;此外一些简单的填补可能会歪曲数据的分布和变量间的真实关系。根据对每个缺失值的填补个数来分类,我们通常将数据填补可分为单一填补和多重填补(我们会在以后介绍具体的填补方法)。

3. 基于参数似然的方法-极大似然估计法

极大似然估计法是在总体分布类型已知情况下采取的一种参数估计方法。假定模型正确的情况下,若数据缺失为随机缺失,则可通过已观测数据的边际分布对未知参数进行极大似然估计,从而得到未知参数的准确估计值。

4. 基于加权调整的方法

所谓的加权调整是指当出现数据缺失时,用某种方式把缺失数据(缺失单元)的权数分解到非缺失单元( 即观测数据) 身上,增大样本中有观测数据的权数,从而减小由于缺失数据可能对估计量带来的偏差。

总的来说,数据缺失普遍存在,而绝大多数的统计方法主要针对的是完整数据,因此,数据缺失的处理给研究人员带来了巨大的挑战。熟悉数据缺失的类型,结合临床实际情况采取相应的处理方法,是减小数据缺失导致得出偏倚性结论的有效措施。

 


版权声明:本网站所有注明来源“医微客”的文字、图片和音视频资料,版权均属于医微客所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源:”医微客”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,转载仅作观点分享,版权归原作者所有。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 本站拥有对此声明的最终解释权。



发表评论

注册或登后即可发表评论

登录注册

全部评论(0)