注册 | 登录 | 充值

关于P值,你真的了解吗?

超热文章

2022-05-18   来源 : i医时空

5764 0

在临床研究的结果中,P值是重要的,且往往是不可或缺的一部分。实际上,我们几乎可以在所有报道临床研究结果的文献中找到它的身影。作为一个统计结果,P值是什么意思呢,又该如何解读?这些问题往往给非统计专业的从业者造成困惑,今天就分享一下个人的一些观点。

问题一

首先,P值是什么意思?在谈这个问题之前,先引入临床研究中相关的两个概念:总体与样本。总体是根据研究目的确定的具有相同性质的个体所构成的全体。样本是从总体中随机抽取的部分观察单位。

点此展开

总体与样本是什么?

比如,为了研究全国中学生的身高情况,那么,总体就是全国中学生,从全国中学生中随机挑选100人就构成一个样本,100就是样本量。为了研究总体的情况,最直接的办法是收集全国每一个中学生的身高,但考虑到时间和成本,我们往往通过研究样本的情况来推断总体的相应情况,这个例子就通过尝试收集随机选取的100名中学生的身高,来推测全国中学生的身高。
再比如一个常见的随机对照临床试验设计,为了研究国内HER2+乳腺癌中某治疗方案相比现有标准治疗的情况,从这些患者中随机入组200人,并按1:1的比例随机进入试验组或对照组进行治疗。在这里,符合入选标准的全国患HER2+乳腺癌的患者是总体,这200人构成一个样本。



为了在总体中研究比较试验治疗与对照治疗,最直观的办法是将试验治疗应用到总体并收集结果,再将对照治疗应用到总体并收集结果,但无论从科学、成本或伦理上,这种方式是不可行的,所以,我们通常采用对样本——一个临床试验——的研究来推断总体的情况。
一般地,我们假设在总体中,试验治疗和对照治疗的疗效终点(比如无进展生存期)结果相同。在此基础上,分析一个临床试验中两组的疗效终点,并给出一个概率:试验治疗和对照治疗的疗效终点在总体中结果相同的情况下,观察到目前临床试验中的疗效结果的可能性;这个概率就是P值
一般常见的P值<0.05的说法,它的意义是假设总体中疗效结果相等时,观察到临床试验中此结果的可能性小于0.05,我们一般认为这个概率足够小,足以支持我们推翻总体中疗效结果相等的假设,即推测在总体中试验治疗和对照治疗的疗效终点结果有差异,一般也称作有统计意义。
可能大家会有疑问,为什么是0.05?以0.05作为判断的分界,可以简单的认为我们的判断有5%犯错的风险。为了降低这个风险到比如1%、0.1%,我们就需要观察更多的样本,真正无风险的判断是直接观察总体,但这样做的成本是不可接受的;所以P<0.05的判断标准是权衡风险与成本的结果

问题二

解决了上面的问题,我们大家都接受P<0.05的判断标准了,那么是不是在临床研究的结果中只看P值就足够了?即P<0.05的就有意义,否则就没有意义?
我认为临床研究的结果应该综合判断。如前所述,P值是总体中疗效结果相等时,观察到临床试验中结果的可能性,一般认为P<0.05有统计意义,但这并不等同于具有临床意义。
比如糖尿病研究中,试验组与对照组较基线HbA1c值的变化的比较结果,差值为0.1%,95%置信区间(0.01%,0.19%),P=0.024;这个结果中,P<0.05,数据有统计意义,但组间差异仅为0.1%,是否有临床意义?这样的数据是否可以带来有价值结论,需要综合评估。另一方面,没有得到一个小于0.05的P值,数据是否就没有意义呢?这个问题同样要综合判断。
还是用前述HER-2+乳腺癌临床研究的例子,假如其中某基因型亚组的无进展生存期结果,试验组对比对照组HR:0.65,95%置信区间(0.33,1.28),P=0.243;此结果中,P>0.05,没有统计学意义;但两组的HR点估计为0.65,我们可以进一步结合该亚组的样本量,若样本量仅为50,那么没有得到一个较小的P值,可能是样本不足的原因;再结合该亚组的Kaplan-Meier生存曲线,也许此结果提示我们试验组与对照组在该基因型亚组受试者中的结果可能存在差异,有进一步研究的价值。综上,P<0.05是一个判断标准,但对数据的解读应当全面评估。

问题三

谈到这里,有细心的朋友可能注意到了,乳腺癌临床研究的例子中,基因型亚组的结果有P值,整体的结果也有P值,那这两个P值会不会互相影响?
实际上,我们注意到临床研究中,可能会报告多个疗效终点的结果,也就有多个P值;有些研究中可能有多个试验组,每个试验组与对照组进行比较时也都会报告P值;有些临床试验还包含期中分析,期中分析和最终分析时也都会报告P值;这些情况又该如何解读?有些临床研究中采用0.05作为标准,但有些结果的P值明明小于0.05,却得出没有统计意义的结论,是什么原因导致这种矛盾?这些问题就留待下次与大家分享。
最后,附上2016年美国统计学会(ASA)发布的声明,统计学家们当时提出了6条使用和解释P值的原则,放在今天来看依旧引人深思:

1. P值可以提示数据与一个特定的统计模型是否相容;
2. P值不能代表假说为真的概率,也不代表数据完全是由随机因素造成的概率;
3. 科研结论、商业决策和政策制定不能完全凭P是否小于一个特定的值来决定;
4. 正确的推理需要全面的报告和透明度;
5. 一个P值,或者统计学显著性,不能表示一个效应的大小,或者一个结果的重要性;
6. 单凭P值本身,不能作为判断一个模型或假说的良好量度。

参考文献:《Mathematical Statistics and Data Analysis》机械工业出版社

版权声明:本网站所有注明来源“医微客”的文字、图片和音视频资料,版权均属于医微客所有,非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源:”医微客”。本网所有转载文章系出于传递更多信息之目的,且明确注明来源和作者,转载仅作观点分享,版权归原作者所有。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 本站拥有对此声明的最终解释权。




发表评论

注册或登后即可发表评论

登录注册

全部评论(0)

没有更多评论了哦~

科研资讯 更多>>
  • 肿瘤电场治疗Optune Lua获批治疗..
  • 成本更低的实体瘤抗癌新星:CAR-..
  • 文献速递-子宫内膜癌中的卵黄囊..
  • Nature|MSCs首次用于人体跟腱病..
  • 推荐阅读 更多>>
  • 收藏 | 常见癌种化疗方案缩写对..
  • 化疗药给药顺序分不清?一文搞懂..
  • 我国上市许可持有人制度MAH,如..
  • 重磅,“规培证”不作为学位授予..
  • PD-1专题

    我们提供最新鲜最全面的肿瘤资讯、医疗政策
    • 相关阅读
    • 热门专题
    • 推荐期刊
    • 学院课程
    • 医药卫生
      期刊级别:国家级期刊
      发行周期:暂无数据
      出版地区:其他
      影响因子:暂无数据
    • 中华肿瘤
      期刊级别:北大核心期刊
      发行周期:月刊
      出版地区:北京
      影响因子:1.90
    • 中华医学
      期刊级别:CSCD核心期刊
      发行周期:周刊
      出版地区:北京
      影响因子:0.94