杨如意_好大夫在线
微信扫码

微信扫码关注医生

有问题随时问

收藏收藏

医学科普

临床研究的医学统计原理(四)

发表者:杨如意 人已读

息,实际工作中,难以得到这种“完全”的生存时间资料,缺项的时间信息资料为不完全数据资料,能处理这类资料是生存分析的一大优势。

肿瘤临床研究经常遇到失访的情况,失访的定义包括由于搬迁等原因的真正意义上的失去联络,而病人仍然活着和由于意外而死亡,而非死于研究疾病或相关疾病(例如化疗相关性死亡、放疗相关性死亡等)的患者,以及在研究结束时仍然活着,且未失去联络的患者三种情况。这类不完全数据称为截尾数据。

生存时间是一个随机变量,其分布特征在肿瘤临床研究中,由于样本量小等原因,常不是标准的正态分布。因而多用某年生存率、中位生存时间、中位肿瘤进展时间、中位无瘤生存时间等来表示。可以按计量资料处理,也可以按计数资料处理。是判定疗效的中长期指标。

1、寿命表法:在大样本的生存分析资料中,应用较多的是寿命表法。原理是应用人口资料和死亡资料,假定同时出生一代人,按当地人口的年龄死亡概率来死亡,来反映这一假定的一代人的死亡规律。这种方法在肿瘤临床研究中仅见于超大型队列研究,平时少用。需编制寿命表。

2、Kaplan-Meier法:该方法常用于肿瘤临床研究的生存分析,适宜于样本量较小资料的生存情况的原始资料,先计算出疗后生存到各时间段时的可能性(即各目的时间段点上的生存概率),然后用直接概率相乘法原理计算出各目的时间段点上的生存率。这种直接用概率乘法原理估计生存率的方法,是一种非参数估计。卡-迈氏曲线有以下三个特点:(1)曲线呈阶梯形:由于不能用斜直线或曲线连接相邻的两个生存率散点所致,但是,随着目的时间段点的增多,阶梯形状也可不明显;(2)曲线左连接:每一级台阶的右端为断点,左边与死亡点相连;(3)曲线尾部不稳定:由于随着时间越长,剩余样本呈越小,因而误差就越大。

3、Logrank检验:用于两组生存情况比较的显著性检验方法或样本生存情况与总体生存情况比较——即实际死亡数与期望死亡数(理论死亡数)的比较的显著性检验方法。例如两组非何杰金氏淋巴瘤病人,一组用“手术+放疗”方法,另一组用“手术+放疗+化疗”的方法,那么两组的生存期谁较长呢?这类型资料就可选用Logrank检验。

4、Cox模型:又称Cox回归,Cox比例风险模型。用于多因素(多变量)干预下一组病人的生存资料的分析。适用条件宽和能够多因素分析是其优点。是肿瘤临床研究中常用的预后分析方法之一。基本思想是设计一个模型结构,在此结构中将每一个病人的生存时间与影响生存时间的所有相关因素,按贡献比例的不同,以函数形式确定下来,这样,同一因素在不同病人身上的影响差别就可以反映出来,同时又反映出了某一因素在同一病人身上的不同时间的影响差别。依据原始资料结合风险函数后,确定每个病人的条件死亡概率。最后利用条件死亡概率的连乘积推出偏似 函数和进行参数估计,计算出不同因素单独作用时参数,再利用逐步回归的方法选出对死亡贡献最大的一项或数项因素。

八、疗效研究的设计要点

临床研究是十分复杂的研究,基本自于生理、社会等多方面因素都会对最终结果产生偏差。肿瘤临床研究尤其是这样,可能对最终结果产生严重干扰的因素包括年龄、性别、体力活动状态、营养状况,有无耦合病存在、各脏器功能情况、肿瘤的临床分期、病理分类及亚型、免疫组化的检查结果、恶性程度的高低,肿块生长部位和社会因素包括亲情关系、性格、社会地位和职业、经济状况,居住环境以及就医环境,这还不包括医术、护理技术的参差不齐等等。在肿瘤临床疗效研究中,能否去伪存真,从千变万化的临床现象中总结出可靠的科学结论来,在很大程度上取决于研究设计的严谨性、科学性和专业性。所应遵从的原则是“随机、对照、盲法、均衡和可重复性”。

1、明确诊断

研究一组非肿瘤患者的资料显然是毫无意义的。几乎所有的病人在入组前必

然明确诊断,包括病理学诊断结果(病理分类、亚型和恶性程度,必要时要求有免疫组化的相应结果)和临床分期。要求详实可靠。诊断要求全面,病人身体所患其他疾病要一并明确。

2、设立对照

正确设立对照组是肿瘤临床研究的核心问题。对照是疗效比较的参照物,设

立对照的目的是为了减少或防止偏移、随机误差。为了使对照组与试验组同时具有可必性,必须使对照组与试验组除了干预措施以外的任何因素均应相同或相似,统计学上称为齐同或均衡。因而,对照组和试验组应进行均衡性检验,否则,结果无说服力。常用对照组包括空白对照、标准对照、试验对照等几种。

3、确定设计方案

选择合适的研究设计方案是试验成功的关键。可依据临床资料类型选择,包

括随机对照试验、配对设计交叉设计等。

4、估算样本量

单纯有随机化是不够的,如果样本量过小,仍然保证不了抽样误差严重影响

的存在。样本量的大小取决于三个因素:(1)试验的精确度要求越高,所需样本量就越大;(2)试验的灵敏度越高,差异越容易显出,研究所需样本量就越小;(3)疗效研究中,Ⅰ类错误α通常是固定的,参取α=0.05,对于Ⅱ类错误的控制,通常以把握度=1-β=80%为度。针对不同的设计方案,统计学上有不同的样检计算公式。

5、确定观察指标

依据不同的干扰目的,来确定疗效观察指标。一个高质量的文章,不仅仅有

近期疗效观察指标,和其他相应完善的观察指标。观察指标的收集方法必须采用十分客观的方法,或依据实际需要的相对客观方法,如果没有,采用主观观察指标时,可靠程度将大打折扣。

6、防止干扰

研究者偏性的纠正主要依靠盲法来解决。受研究者的依从性要予以要求,尽量减少和清除。切忌设计方便存在费用过高、费时过长、风险极大等缺陷,因为此类研究可操作性差。

7、影响疗效的其他因素

(1)干预措施:首先必须了解欲实施的干扰措施本身所引起的疗效及毒性到底有多大,这个问题通常依靠专业知识和临床经验来估测。

(2)疾病的自愈:许多恶性肿瘤的自然病症尚不能完全预料。且约有不足1%的恶性肿瘤疾病可以自愈。

(3)霍桑效应:是指病人因喜欢迷信或厌恶经治医生或医院而产生正负两方面的影响。

(4)安慰集效应:在外形、气味、颜色方面相同的安慰剂也可以不足30%的患者的一些严重症状得到不同程度的缓解。

九、几种设计方案

1、随机对照试验

这是一种评价临床疗效的可靠设计方法。目前在肿瘤临床研究中广泛应用,

既有多中心,又有单中心。成功的例子不胜列举。例如:三苯氧胺治疗乳腺癌的疗效评价,多西紫杉醇治疗非小细胞肺癌的Ⅱ线治疗疗效评价等等。

这种方法的原理和步骤是按事先规定的入选标准和排除标准选择合格的研究对象,并将其按照随机化的方法分为试验组和对照组(或实验Ⅱ组),然后两组分别接受不同的处理措施,在环境条件一致下同步进行观察,依照确定的观测指标收集原始数据,并用客观一致的评价标准对结果进行科学的衡量、分析和评价。

这种方法适用于新疗法与标准疗法的比较,或两种新疗法之间的比较。

这种方法的不足在于(1)时间、人力、物力上花费较大;(2)由于研究对象是经过严格挑选的,所以不能代表某类疾病的全貌,不能揭示某类疾病的总体规律;(3)容易受到影响的因素较多包括病源数量、住院率偏倚、病人依从性和失访等。

2、配对设计

是将每两个研究对象按某些特征或条件相似的原则配成对子,然后随机将其

中一个分为试验组和另一个为对照组,连续试验一定的配对子数后,得到原始数据,比较试验组和观察组之间的差异。此方法简捷、方便、高效、经济。不足之处是适应范围比较窄。

自身配对,同一病人先后接受两种不同的化疗方案或其他治疗方法后,对其疗效进行比较,又称自身前后对照研究。此方法不足之处还有由于研究时间延长一倍,病人的依从性可能下降,盲法不易保证,前次治疗可能会对后次治疗起到干扰,自身配对还可用于病人的左右对称部位、器官,同一病人一次采取的生物材料样本的两种测试方法比较。

异体配对是以主要预后影响因素作为配对条件,如将年龄相差小于5岁、同性别、同病类、同病期的病人配成对子的方法。这种配对可以是1:1配对,也可以是1:2甚至1:3、1:n的配对。

无论计量资料、计数资料,还是等级资料,均可采用此配对的设计。

3、交叉设计

在对一种新的药物进行上市时的临床疗效研究时,通常取平行对照(即同期

对照)的方法,但由于个体间病情的差异等诸多干扰因素存在,除非有足够大的样本,否则很难对疗效作出评价。交叉设计是在随机对照和自身前后对照相结合的基础上的一种特殊设计方法,它是让同一病人分期接受试验用药和对照用药,即在两组病人第一个疗程与第二个疗程中,试验组与对照组的角色互换的一种设计。它既有病人自身内对照,又有病人组间的对照比较。

这种方法的优势在于简单易实施,可在不增加样本量的前提下消除个体差异和个体病情差异,可避免均衡性差的问题,可避免人为的选择性偏倚。不足之处是两种治疗间必须有一段足够长的洗脱期,可能对病人不利,研究时间较长,病人依从性可能下降,失访者多。不适宜对化疗极其不敏感或极其敏感者。

这是一种前瞻性研究,研究结论价值相对较高。

4、序贯设计

通常的临床研究都是事先确定做可能会出现的一种情况,即不必入选那么多

的病例就可以获得阳性结果。序贯设计是指在试验前不规定样本量,而是受试对象配对后随机分配到两个处理组,每得到一对试验结果,就分析一对,直到能判断结果,作出结论时,立刻终止试验。其优点在于当两种处理措施间确定存在差异时,可较早作出结论,节约时间、人力、物力。不足之处在于不适合疗效观察反应期长的试验。适用范围:一些罕见瘤种的多中心试验和一些毒副作用较大的化疗、放+化疗方案的观察。也可用于成组的序贯试验分析。

在设计方案上有双向、单向两种,有开放式和封闭式两种。

5、Meta分析

这是一种现代临床研究中新的研究方法,国内最早应用见于1990年代。又称

荟萃分析,元分析,综合分析,分析的分析、资料的再分析等。

Meta分析定义:以综合现有的发现为目的,对单个研究结果的集合的统计分析方法。

Meta分析是对具有共同研究目的相互独立的多个研究结果给予定量分析,合并分析、剖析研究间差异特征,综合评价研究结果。

(1) 意义

Meta分析通过整合大量的临床研究报告,增加了样本量,增加了结论的统计

功效;利用Meta分析进行合并整合后,对关于某一问题的多篇报道的不同论点进行剖析,可得出对该问题的全面认识,解决临床分歧意见;Meta分析作为一种定量的文献分析方法,则是综合所有相关研究方法和可靠的临床研究结果,试图得出没有偏倚的结论,这与一般综述的主观性综合评价不同,因而它增强疗效评价的可能性和客观性;Meta分析的结果有时会出现一些临床研究事先想不到的结果,即可以引出新见解。

(2) 步骤

首先,确定Meta分析的研究目的,确定单个研究报告的入选标准,文献检索方法,所要采取的统计分析方法;其次,查找文献,Meta分析所要求的研究报告不仅是发表在期刊杂志上的临床论文,还要有一定层次的专业学术会议交流论文及有关专家的尚未发表的论文;第三步则是按事先确定的统计学方法对各个单个研究结果进行综合分析;第四步,对Meta分析得出的结论必须经灵敏度分析,以明确因果关系的强度;最后是总结成文。

(3)计算方法:首先对多个独立研究的统计量进行同质性检验,如果同质,则可以将多个统计量加权合并,如果不同质,则需剔除某些特大、特小或方向相反的统计量,然后再综合。如果多个研究结果具有同质性时,一般多采用固定效益模型,检验结果显示不同时,可用随机效应模型进行校正;其次,对具有一致性的统计量,包括t值、x2值、F值、U值等进行综合加权,计算出合并后的平均统计量;第三是对综合估计出的统计量进行统计检验和统计判断;第四,计算某些统计指标的95%可信限。计数资料的统计分析方法常采用固定效应模型和随机效应模型,计量资料通常采用合并检验及效应测量。

Meta分析常借助软件包来完成。

(4)不足:Meta分析的结论可靠性受到原始研究报告的质量和出版偏倚(作者常常把阳性结果论文拿出来发表)的影响,另外一点就是Meta分析是一种观察,而不是具体临床研究,它把已有的报告被动地接受下来,受到论文质量好坏,数据完整性、混杂因素的复杂性、数据真实性等诸多因素的影响。

Meta分析必须遵循一定的方法和步骤,强调制定明确的文献纳入和剔除标准,在对纳入研究进行严格评价的基础上采用正确的统计学方法进行定量合并,尽量减少偏倚。如果把研究质量和特性各不相同的结果加以合并,就会出现把不同质的文献合并在一起的现象,不但影响Meta分析结果的真实性和可靠性,甚至得出误导性的结论。因此,如何客观分析评价已发表或已公布的Meta分析结果也是近年来备受关注的一个问题。

(5)Meta分析结论的评价方法:

首先要求研究方案;其次应有清晰的资料收集策略;第三要有专门的纳入和剔除文献的标准,并说明理由;第四要进行性同质性检验和直观的图示;第五要有恰当的统计学处理方法和灵敏性分析;第六在出现显著性差异的结论时,需陈述是否排除了出版偏倚;第七所得出结论要做客观剖析,并说明是否需进一步研究。

总之,Meta分析在肿瘤临床研究领域仍是初级阶段,其在定义、应用及方法诸方面尚有待进一步发展,对Meta分析结果不能过分迷信。

十、临床研究中常见统计学错误

1、对照组的设立不合理:主要表现在两个方面,其一是未设对照组,其二是未注重对照组与试验之间的齐同性和均衡性。

2、不重视随机化原则:随机不是随意,将每个观察对象分至试验组或对照组的过程必须遵循随机化原则,否则就难以保证两组间的齐同均衡。应选择合适的随机方法。

3、样本量过小:只有样本量足够大时,才能充分以样本代表总体,才能以频率正确推测概率。

4、将构成比当成率:构成比是说明事物内部各构成成分的比重,而率是事件可能发生的频率。

5、率的比较时未行标准化:两个频率指标的比较,如两组内部构成有差非齐同时,必须进行标准化后再比较。

6、显著性检验方法选择错误:每一类型的资料都有它自身所合适的统计经验方法,切勿张冠李戴。

7、标准差和标准误混淆误用

8、统计图表不规范:统计表一般采用全横线筒型和“王”字开口型,少用或不用竖线和斜线,双边不封口。能用表表示尽量不用图。统计图的标题应放在图下边。

9、检验推断错误:研究数据存在显著性差异,在下结论时要用概率的观点说话,同时要符合医学逻辑。

本文是杨如意版权所有,未经授权请勿转载。
本文仅供健康科普使用,不能做为诊断、治疗的依据,请谨慎参阅

收藏
举报
×
分享到微信
打开微信“扫一扫”,即可分享该文章

发表于:2010-09-04