下面我们举个例子来看看生存分析的样本量计算对于各个参数的考虑。假设某非劣效设计的随机对照试验中,A组为试验药组,B组为阳性对照药组,1年的生存率均为55%,HR=1.33。入组时间为2年,中位随访时间为3年。一类错误0.05(双侧),把握度80%,脱落剔除比例为5%。(如果按照非时依性变量为终点指标的普通非劣效设计的样本量计算方法,需要的参数则是不一样)。从PASS软件中操作如下:
得到的结果如下图所示:
从图中可以看到,入组时长对样本量的影响较大,总研究时长中分配给入组的时间越长,相应的随访时间越短,样本量要求越大。为什么会出现这样的情况呢?我们知道,用于生存分析的数据中包含完全数据和截尾数据。完全数据(complete data),即从起点至死亡(死于所研究疾病)或终点事件所经历的时间;截尾数据(也叫删失数据,censored data),即从起点至结尾点所经历的时间,结尾的原因可能有失访、死于其他疾病、观察结束时病人上存活或尚未出现终点事件。所以,希望研究者能尽量加快入组进度,并尽量避免脱落的发生。
总结一下,这篇文章的主要目的是提醒各位研究者,如果您的研究设计的主要终点指标是需要通过生存分析计算结果的时依性变量,请规范使用生存分析的样本量计算方法,而非普通的差异性检验的样本量计算的方法。这已经受到很多方法学审稿专家的重视,可千万别因此而与大牛杂志擦肩而过,黯然神伤。进一步来说,在研究设计阶段,请尽量与方法学及统计学专业人士多多讨论,避免出现无法挽回的研究设计上的硬伤。