在临床试验中,除了对受试对象个体进行筛选外,样本含量也会进行估算,样本含量的多少也会对临床试验造成一定的影响。
一、样本含量
样本含量( sample size)是指在临床试验中需要多少数量的受试对象。样本含量估算的重要意义在于,合适的样本含量有助于研究者用最合理的资源发现有意义的临床差异(如果这个差异确实存在的话)。过少的样本含量难以准确回答试验所研究的科学问题,而过多的样本含量是巨大的资源浪费。
二、样本含量估算方法
样本含量估算方法必须基于明确设计方法、假设检验和主要研究目的指标的特性。例如, 临床试验、诊断性试验、病因学研究有不同的样本含量估算方法;临床研究中平行对照设计、交叉对照设计、Williams 设计、序贯设计、连续测量设计等都有不同的样本含量估算方法;主要目的指标是计数资料或计量资料需要不同的样本含量估算方法;基于计量资料的 t 检验和 F 检验,基于计数资料的卡方检验和 Fisher’s exact test 等都有不同的样本含量估算方法;差异性检验、非劣效性检验和等效性检验也有不同的样本含量估算方法,等等。
三、样本含量变化的基本影响因素
▶ 检验水平(α)
Ⅰ型错误表示, 统计推断拒绝了实际上成立的无效假设(H0)。Ⅰ型错误的概率用 α 表示,进行统计推断时, 研究者需要对容许犯Ⅰ型错误的大小作出规定,通常是 α≤0.05,检验水平 α 值越小,所需样本含量越大。
▶ 把握度(power, 1-β )
Ⅱ型错误表示,统计推断的结果不拒绝实际上不成立的 H0, 其出现的概率用 β 表示,β 值越小,所需要的样本含量越大。根据实际情况,通常规定 β≤0.10,必要时,可取 β=0.20。
▶ 变异(σ )
变异指样本中所包含的个体的差异程度。个体之间的差异越大,所需要的样本含量越大,反之,若个体之间的差异越小,则所需要观察的例数越少。
▶ 临床有意义的差值(δ )
临床有意义的差值也可称为组间效应的差异程度,即不同药物可能的疗效差异。组间差异越大,所需要的病例数越少,反之,则所需要观察的病例数较多。
▶ 单侧检验和双侧检验
差异性检验和等效性检验需要双侧检验,而非劣效性检验和优效性检验需要单侧检验。单侧检验所需样本含量少于双侧检验。
----------------------------------------------------------------------
参考文献:
1. 《药物临床试验质量管理规范》(GCP) 2020版。
2. Center for Drug Evaluation , Food and Drug Administration. Guideline for the format and content of the clinical and statistical sections of an application [J/OL].
3. 国家食品药品监督管理局.药物研究技术指导原则(2005 年)[M].北京:中国医药科技出版社,2006. 161-173.
4. 杨进波.探讨药物临床试验中样本量及相关问题[ J ].中国临床药理学杂志,2007;23 :68-69.
5. CCTS工作组,陈平雁 执笔 临床试验中样本量确定的统计学考虑,中国卫生统计,2015,32(4):(727-733).
6. Lai T L , Lavori P W , Shih M C . Adaptive Trial Designs[M]. Annu Rev Pharmacol Toxicol, 2012.
7. Noordzij M , Dekker F W , Zoccali C , et al. Sample size calculations.[J]. Nephron Clinical Practice, 2011, 118(4):319-323.
-----------------------------------------------------------------------
供稿 / 医学部 于丽杰
|