1.1 显著性水平单边α的选择:2.5% vs 5%
统计学中的显著性水平α,控制第一类错误,也就是错误地认为治疗或干预是有效的概率。
一般来说一个严谨的临床实验,如果是优效性试验,α选择一般选单边2.5%;其次,如果主要终点有多个比如PFS、OS,一般要将α分配到PFS、OS上去。
举个例子比如默沙东的SCLC临床实验设计keynote-604:
再来看看康宁杰瑞的临床设计:
依据公开信息及电话会议中公司口径:“中期分析定在死亡数188例,最终分析定在死亡数314例,以及预设中期HR=0.72。”
根据上面的事实,我们可以基于上述数据进行O'Brien-Fleming method建模分析:
根据公司口径信息来看,可以合理推断:
公司非常大概率选择的是单边α=0.05而非0.025优效性试验,如果α选择的是0.025,对应的HR=0.678(这太离谱了,显然不可能!)。此外,很大概率上公司在临床实验设计初期也没有将α分配给PFS主要终点。
胰腺癌的临床实验本身基于过往历史先验信息成功率是较低的,公司在临床设计初期暗含使用0.05的α,并且一定概率没有将α分配到PFS上,这么做是比较不严谨的。也为后面临床实验不及预期、临床实验结果不认可留下了巨大隐患!
此外,公司假设中期分析HR=0.72也是过度乐观的行为,二期临床实验mOS也就12个月整,如果HR=0.72,毛估估一下蕴含对照组mOS也就8.64,然而这个实验中涵盖了相当比例的局晚期胰腺癌患者,并且历史数据胰腺癌患者mOS能达到9.2个月。因为HR=0.72的假设的依据是非常激进的。
因此,依据激进的假设,预计的临床样本408例自然是低估偏小了。
1.2 中期数据不及预期,对公司临床实验设计的影响
仍然按照上面的合理估计那么公司三期试验初步方案:
本次期中分析events=211例(211/314=67.20%)远超188例(188/314=59.9%),因此需要对原实验设计进行修正:
因此因为期中分析死亡数超预期,期中分析相比之前的试验设计多消耗了0.5411%的alpha功效。变相降低了最终分析临床的成功率。
发表评论
注册或登后即可发表评论
登录注册
全部评论(0)