前言
临床试验是医药研发漫漫征程中的一个重要的环节。一个新药的研发需要约十年时间,花费十亿元美金。很大一部分时间都花在了临床试验上。
我们经常会听到制药公司、生物技术公司临床试验相关的新闻、消息,随之发生的往往是股价的大涨大跌。在这些新闻、消息、报道里往往有很多的术语,您是否知悉这些术语的意思呢?为了自我提高,同时帮助感兴趣的朋友们,医药研发社交平台翻译志愿者联盟很高兴地阅读并编译罗氏2013年的小册子,《Understanding Clinical Trials》,即《了解临床试验》。
这本小册子帮助您理解关于临床试验和相关分析的关键的概念和术语。本手册内容集中于癌症,但其中解释的概念和术语可以被应用于其它的疾病领域。
这是联盟翻译、编译的第三篇作品。医药研发社交平台对本文内容负全部责任。敬请老师朋友们批评指正。衷心感谢!
大纲
1. 药物开发过程介绍
2. 理解临床试验
3. 临床试验设计
4. 解读临床试验终点
* 关键终点
* 其它常见终点
5. 理解关键的数据统计概念
6. 展示临床试验结果的常见方法
7. 评估临床试验重要性的关键问题
1. 药物开发过程介绍
实验室里鉴定出的每5000种肿瘤分子中,有250种左右可以进行临床前测试,这其中又只有不到10种能进入临床实验,而平均只有一种能被监管部门批准。新药从研究阶段(实验室)到临床阶段的时间预计需要10-13年。
* 新药产生于实验室,研究者在实验室里鉴定、分离和研究上千种可能用于治疗肿瘤的分子。
* 一旦候选分子(化合物)在实验室中被鉴定,就需要对其进行严格的临床前测试(在实验室和或动物体内),评估候选分子的化学、生物和毒性特性(候选分子的风险)。
* 临床前测试能够帮助研究者快速了解一种化合物是否有抗癌活性。
* 如果临床前研究的结果是肯定的,该化合物就可以用于临床试验:临床试验包括多期研究,通常先在健康志愿者身上进行小规模研究,然后分步评估药物对患者的疗效。每一期研究中,只有严格符合安全和效果(疗效)标准的化合物才能用于下一期临床研究。
* 当临床试验结果证明化合物的安全性和有效性,公司可以向监管部门申请上市许可(允许销售和在日常医疗实践中使用药物)。通常,上市许可需要在临床III期成功后申请,但如果适用疾病的治疗药物少,或者叫做“高医疗需求”,申请时间也可能提前。
* 最终,上市许可被批准以后,医生可以在处方中使用该新药。监管部门对颁发给药物的许可证有严格的规定——制药公司销售的药物只能用于治疗患有许可证或标签中所描述的疾病(适应症)的患者。
* 药物的使用仍然根据被批准的现行医疗规范进行监管。
文献:欧洲制药工业协会联合会(EFPIA)。一个受高度监管的行业。访问日期:2012年11月。地址:http://62.102.106.100/Content/Default. asp?PageID=361)
2. 理解临床试验
临床试验是为了探究一种药物在人体内如何反应,并在药物被监管部门批准和可被医生使用前,确保药物的耐受性和有效性。临床试验每一期的研究的主要目标或重点(即试验的最重要的结果)、患者数量和研究设计的细节会有不同。但是,所有临床研究都必须按照一套严格标准对药物进行评估,以保护患者的安全。
临床试验可以分为四期:
第一期: 安全性评估
第二期: 药效评估
第三期: 在一个大的患者人群中确认结果
第四期: 临床实践中评估治疗效果
3. 临床试验设计
为了达成有效试验结果,设计临床试验时使用了许多参数。这些参数包括需要研究的患者数量,需要审查的治疗方式,试验进行的终点和方法(比如随机对照或者非随机对照研究)。
* 患者数量
一个临床试验组的患者,必须符合特定的标准。常见的入组标准如:患有某种类型的癌症,具有特定的治疗史,属于一个限定的年龄层。这些入组标准有助于确保,参与临床试验的患者的基本信息、患病类型和阶段尽可能地相似,最大程度地增强治疗效果与药物治疗之间的关联程度,减少其它因素的干扰。
* 临床试验中的对照研究
大部分临床III期受试者和一些临床II期受试者会参与对照试验中,该项研究主要通过比较对照品的数据研究试验药物或者临床方案。(在对照试验里——多数III期和部分II期的试验都属于对照试验,接受审查的试剂和治疗方案都需要和对照组对比)对照品可以是无疗效的安慰剂(如果所研究的的疾病还没有有效的治疗方法),或者是一种广泛使用标准疗法,并在临床试验设计时,该标准疗法已被认为有效。虽然安慰剂常被作为临床试验中的对照品,但是由于涉及到伦理问题,在肿瘤药物的临床试验中很少使用。需要注意的是,因为某些临床试验需要数月甚至数年来完成,在临床试验结题时,作为对照的标准治疗方法可能已经不再被广泛使用。
* 试验终点指标
临床试验的目的是衡量关键治疗效果或者试验终点,以及试验药对特定疾病的疗效和耐受性。试验通常会设定一个主要终点,是临床试验中最重要的终点。如果试验达到这个终点,证明该疗法和临床试验获得了阳性结果。
临床试验方案为实施研究提供设计,预先为研究设定终点,对衡量和评估临床研究终点的方式和时间,有明确的指导。
通常情况下,主要终点用于评估治疗的疗效(干预治疗或药物治疗产生预期效果的能力)。一个临床试验可能设定一个或多个次要终点。次要终点通常包括次要疗效措施(如附加评估指标,旨在考察药物控制疾病的临床效果)和安全性评价(旨在测试研究期间药物的耐受性和安全性)。
* 试验开展
在受试者、治疗方案、终点都确定好以后,临床试验设计才算完成。在治疗肿瘤药物的III期和一些II期试验中,受试的患者可能被随机分配(随机分配其接受某种疗法),或进行分组(分组与治疗方法无关的因素,通常是为了确保每个比较组受试者人数相同,有相同的能影响诊断和干扰反应特点)。临床研究中的黄金标准是一个具有科学性、严谨性、随机性和易于控制的试验。
文献:Chin R, Lee BY. Principles and Practice of Clinical Trial Medicine. Amsterdam, The Netherlands: Academic Press; 2008:3-16.
4. 解读临床试验终点
关键终点
依据癌症的阶段,临床试验倾向于在以下几点中寻找变化:
* 总体生存率(OS)是指在诊断后或治疗研究中一段规定时间内患者的存活率;在治疗开始后一段规定时间内患者的存活率。
OS通常被认为是一个五年生存概率,即患者在诊断或治疗完成的五年后的存活率。不同疾病诊断后的总体生存率将有很大差异,如某些癌症会比其他类型有更好的预期(存活率)。从OS来评价某种疗法效果,需要结合对于治疗的癌症背景和预估的总体生存率来评估。
关于把OS作为一个临床终点的关键要素:OS被卫生主管部门视为临床终点的“黄金标准”,是因为这是一个生存的衡量。然而,当评估早期线性治疗时,OS可能会出现测量问题(线性治疗是指患者接受一个序列的治疗,例如第一线治疗是针对靶向肿瘤的初始治疗,而第二线治疗将在第一线无效时启动)。对OS的测量常常会被后期的疗法影响,导致很难判断第一线治疗的实际效果。
* 无进展生存率(PFS)是指患者在病情未恶化的情况下继续存活的比例(例如:无进展疾病(PD))。
举例来说,PFS-6是指患者在开始接受治疗后6个月内并且未恶化的存活比例。
关于把PFS作为一个临床终点的关键要素:
疾病发展往往伴随着症状和不适,所以延长疾病的发展对患者而言是非常有意义的举措,并且是医生和护士的一个重要目标。
如果某种药物变得无效,患者可以切换到另一种疗法(交叉)或采取其他的治疗方法。不同于其他的试验终点(如OS),PFS不受交叉疗法或者后续治疗线的影响(一般后期疗法不同于前期疗法),因为它是直到病情恶化时才适用的测评指标
* 生存质量(QoL)临床试验可能需要评估治疗对患者生活条件和能力影响。这些评估是通过生活质量标准(调查问卷和量表)来衡量,这些标准被开发用于评测被癌症诊断影响的生活的特定方面。
现在的一些临床试验包含了患者报告的结果指标(PROs),作为衡量QoL的一种方法。这些衡量方法展现了在日常生活中治疗方法的影响,因此对患者来说尤为重要。
* 缓解率(RR)
缓解率一般是通过扫描或者X射线的方法测量肿瘤的体积而得到的。它能够表明肿瘤是否对该治疗具有响应,如果肿瘤体积缩小则认为该疗法对肿瘤的生长具有缓解作用。有多种缓解率的评价标准,其中包括国际普遍认同的在临床试验中经常使用到的RECSIT(实体瘤反应评价标准)。
** 完全缓解(CR)
疾病相关的所有临床证据“消失”。这通常意味着利用医学成像技术(扫描仪/放射性检测)或者通过测量病例样本和样品(组织,活检,血液等)已无法检测到肿瘤的存在。
** 部分缓解(PR)
所有的可测瘤体积产生至少30%的缩减。
** 病情稳定(SD)或者无变化(NC)
所有的可测瘤体积产生小于30%的缩减或者小于25%的增加。这些“缩减”或者“增加”被归为病情稳定是因为如果不进行治疗的话,许多现存的肿瘤预计会持续增殖或者扩散而不仅仅是体积缩减或者更缓慢地生长。
** 病情进展(PD)
跟上一次测量相比,所有或者一部分患者出现了大于25%的肿瘤体积增殖。不像完全缓解,部分缓解或者病情稳定,病情进展表明癌症正在扩张没有得到缓解或者控制。
** 客观缓解率(ORR)
经过治疗后,肿瘤缩小(部分缓解以及(或者)全部缓解)的患者所占的百分比。
有关ORR作为临床试验终点的重要注意事项:
1.客观缓解率是通过物理测量得到的肿瘤体积,被认为是一种治疗有效性的表征。
2.客观缓解率能够告诉医师关于一种疗法如何在患者身上起效的重要信息。
3.客观缓解率对于某些癌症类型尤为重要,特别是那些能够引起变形性病变的癌症,比如基底细胞癌,病变部位会被扩张性的外科手术切除。
* 疾病控制率(DCR)或者临床受益率(CBR)
在一段时间内癌症缩减或者保持稳定的患者的百分比。DCR是完全,部分缓解以及病情稳定率的总和。
* 缓解时间(DR)
从确认部分缓解(PD),完全缓解(CD)或者病情稳定(SD)开始到出现治疗后的病情进展(PD)之间的时间。
其他常规临床终点:
体能状态(PS)
分别考察癌症患者在治疗前,治疗期间以及完成治疗后的各个阶段中是否具有完成日常生活所需的基本的行为能力。PS评级的具体数字代表了因病致残的不同程度,以及/或者疾病症状的严重程度。
两个主要的评分标准是:
(1) 东部肿瘤合作组(ECOG)
从0级到5级评估患者的体能状态,0级是具有完全生活行为能力,5级是死亡。一个评级为3的人,表明他的能力仅限于生活自理,或者说他的50%的醒着的时间是在床上或者轮椅上度过的。
(2) 卡氏状态
评价癌症相关的症状的严重程度以及致残程度,级别从100%(无症状)到0%(死亡)。一个50%的评级表明一个患者需要大量的援助或者频繁的医疗护理。
癌症治疗预计会影响PS的评分,如果疾病负担减轻了则评分增加,如果治疗产生的副作用影响了患者的日常行为能力,则导致评分降低。
进展时间(TTP)
进展时间是指从随机直到肿瘤进展(不包括死亡)的时间。它不同于“无进展生存期”(PFS)—从随机到肿瘤进展或者死亡的时间。
相对生存率
在给定的时间间隔之内,跟相同年龄和性别的未患癌的普通人相比,癌症患者的存活几率。
疾病/无复发生存期(DFS)
经过治疗后,被治者在无疾病状态下的生存时间。
无远处疾病/无复发生存期(DDFS)
一个患者在经过治疗之后,在原发病灶以外没有出现新病灶的时间(没有出现新的转移病灶的时间,疾病转移是指肿瘤从患者的一个器官或者身体的一个部位转移到另一个非相邻的器官或者身体的其他部位)。
无侵袭性疾病生存期(IDFS)
在辅助治疗后患者没有出现侵袭性疾病的生存时间。辅助治疗是指添加在主要治疗形式以外的治疗,比如手术之后的化疗,通过摧毁可能残留的癌症细胞以推迟或者防止疾病复发。
最小残留疾病(MRD)
在治疗中或者治疗后残留在患者体内的恶性肿瘤细胞,它是导致像白血病这类的癌症复发的一个主要因素。
无“事件”生存期(EFS)
从开始治疗到出现预先设定的“事件”之间所持续的时间。其中,这些“事件”可以包括疾病或者治疗所带来的特定的并发症。
病理学完全缓解(pCR)
治疗后没有出现任何残留的侵袭性癌症。
药物代谢动力学(PK)终点
药物代谢动力学是研究药物进入体内后变化的学科,尤其关注一段时间后血液中药物浓度的变化。药物动力学终点主要用于确定和比较同一分子浓度对应的主要医学状态,及药物在何种浓度下能达到最佳效果。
图三中曲线显示两种不同配方的同种药物给药时间和血药浓度的关系。
* Cmax 是指定给药干预的最大血药浓度。
* Ctrough是指定给药干预的最小血药浓度。当达到Ctrough时,表示需要再次给药。因此从给药到达到Ctrough的时间同给药频率相关。
桥接试验(Bridging Study)终点
桥接试验用于测试药物在不同患者或给药方法亚组之间是否有区别。例如,桥接试验可用于比较具有不同体质指数(BMI)值患者的情况区别,从而判断浓度是否需用体重来矫正。
不良事件(Adverse events, AEs)
当治疗被描述为安全时,不代表用药无潜在风险,只是表示其利大于弊。不良事件是指治疗相关的非预期的症状、表现(例如,非正常的实验发现等)、或疾病。不良事件能根据严重程度分级。
1级:无症状或温和症状。此级无需干预。
2级:中等。此级需要微小的、局部的、或无创的干预。如可能会标明如何处理该症状(例如,癌症治疗带来的恶心、呕吐,可以用其他药物来预防或干预)。
3级:严重但不马上致命。此级需入院管理、干预。
4级:通常危及生命。此级需紧急干预。
5级:致死。
5. 理解关键的数据概念
在临床试验的对照组和试验组中,达到试验指标的受试者数量只能表明这种治疗方法的疗效如何。更加重要的是,不同的临床试验组中的数据差别是否有统计学显著性意义(即这种差别不是个例,而是反应了另外一种试验结果模型),以及这种数据差别能否为患者的治疗带来真正的疗效。
统计学通过分析和评估临床试验中的数据,为临床治疗的有效性提供准确的措施;同时,统计学分析不同的治疗方案可能会因为发生某些事件(某一疾病的信号,症状或者致病因素)而产生的其他的可能性。根据以上,统计学能够为治疗方案的时效性和有效性提供数据上准确的方法。
对临床试验结果的正确解读基于恰当而准确的统计学分析,以及正确理解这些试验结果在理论上以及实际对于患者到底意味着什么。
通过数据描述临床试验中的不同点
从统计学上说来很重要
不同组之间的数字上的差别;在一个治疗组中,某一数值(比如获得CR的人的数量)和另外一治疗组之间的这一数值的差别明显超过任何偶然情况下的预期,这就是有显著统计学意义。
概率值
概率值即假设在完全一样的治疗方案中,通过偶然的几率获得符合统计学理论结果的可能性。概率越低,这个结果偶然发生的可能性越小,即意味着更大的可能性是这个结果是试验中的药物引起的。
根据不同的情形,概率值可能不同,但是通常是0.05。0.05的概率值指的是偶然事件发生的可能性只有百分之五。因此,这种试验结果是因为治疗方案的不同而导致的,而不是偶然随机的事件。
平均值-中间值和均数
中间值是用来标记无病生存率或者总体生存率测量方法。
在一组从小到大排列的数字中,中间值指的是位于中间位置的数值,比如数列5,7,9,10,13,18,23中,10就是中间值。在临床试验中,当50%的受试者经历某一事件(比如死亡或者复发)。试验指标中的中间值通常被标上“m”,比如mPFS(无进展生存期的中间值)。 尤为重要的是,在测算总体生存率的时候采取中间值并不能为治疗方案提供准确有效的效果。比如,在一次治疗中,如果51%的患者经过两个月甚至更少的时间就康复,而49%的人需要十个月,甚至更长时间,系统则会认为中间值是两个月甚至更少—这并不是药品疗效的真实反馈。同样地,比如在800位受试者中,一旦有400位达到试验指标(经过某一特定的事件),此时的数值即会被认为是中间值;但是临床药效可能会在另外400位受试者身上体现更好—中间值无法反映这一情况。
平均值的另一形式是均值,其他行业常用均值但是由于患者情况的表现形式不同,临床试验中很少用。均值是把一系列数字(比如,一些列结果)相加,除以个数,最终所得的数字。比如,5,7,9,10,13,18,23的均值是12.1。
风险比
风险比是指在整个临床试验过程中,试验中的某一组相对于另外组别发生某种不良事件的相对风险大小。
* HR为1时,表明试验的2组发生某种不良事件风险无差异。HR 2时,则意味风险翻倍;HR 0.5时,风险降低50%。
* 图6,A组相对于B组而言,其总体生存期(OS)的相对风险比(HR)为0.73。这表明接收A药治疗组患者发生疾病进展或死亡的风险较B药组患者降低了27%。计算公式:(1-0.73(HR))*100=27%。
更重要的是,风险比与中位值不同,风险比对整个临床试验过程所发生不良事件的差异均纳入进行了考量,而不仅是局限在某个时间点或试验终点,因此,就患病整体人群而言,风险比是临床治疗效果最好的预测因子。基于风险比采用的方法学上,充分利用了临床试验中获得的所有数据,包括因任何原因未能完成整个临床试验过程患者的信息和数据。
如果临床试验所采用终点事件发生率在不同事件点不恒定,采用风险比进行统计分析,意义重大。
可信区间(CI)
可信区间百分比(如95%可信区间)是指统计分析结果落在事先规定上限和下限区间的可能性。如一临床试验风险比的95%CI位0.65(下限)-0.80(上限),则说明,在相同研究条件下,对相同适应症人群而言,HR统计分析结果有95%可能性落在0.65-0.80范围内。
就试验结果的精确度而言,可信区间大小的设定,如何能对临床试验提供更有价值的信息。
一个试验结果能否投射到真实世界中的总体患者群,可信区间(CI)是一个重要的参考指标。
绝对风险降低(ARR)和相对风险降低(RRR)
绝对风险降低是指试验组和对照组发生终点事件数量(如,发生疾病进展患者的百分比)的差异。例如,某临床试验中A药治疗组10%患者出现疾病进展,而B药治疗组15%患者出现疾病进展,因此,A药组与B药组相比,绝对风险降低(ARR)为5%(ARR=15%-10%=5%)。
相对风险降低(RRR)也是考察不同治疗组发生终点事件的差异性,但是其采用的是风险比值来表达这种差异性。仍采用上述例子,如果用相对风险降低(RRR)表达的话,A药组与B药组相比,其RRR为33.3%(计算公式: (15-10)/15=33.3%)。
需要治疗数(NNT)
NNT是一项统计数值,是指一个患者为获得特定的终点效益而需要接受指定治疗(或治疗组合)的实际患者人数。NNT是从临床研究的数据中计算得到的,并被视为一种有效量度,可用于判定治疗是否有益于大量接受药物治疗的患者还是只有益于少量接受药物治疗的患者。NNT越小,治疗越有效。
比值比(OR)
治疗有效性的一种量度。OR是在治疗组中发生事件的几率,可表示为在对照组中发生事件的几率的比例。OR越接近1,在治疗干预和对照干预之间的效应差异越小。如果OR大于(或小于)1,则治疗效应优于(或劣于)对照治疗的效应。
6. 展示临床试验结果的常见方法
评估经时变化的重要性
统计学方法允许对所有来自一项研究的数据进行分析,并审核采用简单的中值测量(在试验过程中的特定点所取的测量结果)所无法说明的经时数据,以找出是否在治疗之间存在着统计学意义上的显著差异。采用正确的统计工具,我们可以对治疗效果进行精确测量,测量同时也考虑到患者接受治疗的不同起始时间和时间长度。
(1) Kaplan-Meier(KM)曲线
KM曲线表示在连续的时间范围内仍然存活(或无病症或其他一些特定的治疗结果或终点)的研究人群的比例。
这是用于表示总存活率或疗效的最常用方法。在显示治疗研究总存活率的KM曲线的情况下,该曲线提供了一定时间段的曲线图。他们比较了接受研究性药物的患者与对照组中的患者,表明在一定时间仍然存活的患者比例。可以根据患者一直接受了多久的治疗来计算这一比例,而不是根据患者何时进入该研究而进行计算。
曲线分离越大,所分析的治疗组研究终点之间的差异就越大。如果KM曲线所代表的治疗组遵循类似的路径,则表明,在所测量的终点内的研究组之间,仅存在着少量差异。如果几组曲线是重合的,则意味着在那个特定的时间点上,所测量的终点的两个研究组之间无任何差异。
(2)森林图(FP)
鉴于有许多项研究一直关注同一种疗法,或一项研究内的不同亚组患者对同一种疗法的反应各有差异,就可以使用森林图来展示和比较不同组别的数据。
在不同的研究中或不同的患者亚组中,一种治疗的效益或作用是否一致,用FP可一目了然。一组数据集如亚组或研究通常可用正方形来表示。正方形的大小与该数据集的规模或权重(重要性)成正比,正方形每个框任意一侧的水平线表示置信区间。
从直观的角度来看,森林图采用两栏和一条代表治疗无效的垂直分割线表明一种治疗方法相对于另一种治疗而言是否能够在特定的患者组中确定得出或确定无法得出阳性的结果。通常而言,落在垂直线左侧的数据表明干预治疗组比对照组更有效;而落在无效(垂直)线右侧的数据表明,在该亚组或研究中,对照组比干预治疗组更有效。以下图例(见图9)阐明了一项研究中不同患者亚组的PFS危害比。在落入垂直线左侧的患者亚组中,A疗法比B疗法更有效;而在落入垂直线右侧的患者亚组中,B疗法比A疗法更有效。
(3)瀑布图
这种图表类型反映每例患者个体,如每例患者肿瘤的反应率状态是否为进展、稳定或改善。在肿瘤临床研究中,瀑布图常被用于阐释客观缓解率(ORR)的数据。
7. 评估临床试验重要性的关键问题
本研究的周期是?
临床试验的研究周期是指一种药物或治疗处于研制路径的哪个阶段。例如,只有在早期临床获得令人鼓舞的结果之后,才会在大规模的患者组中开展III期临床研究,且III期临床研究常被用于支持新药的注册申报。
主要终点是什么?
主要终点是临床试验最重要的终点,常被用于评估治疗的疗效。理解终点和肿瘤类型的关系,以及主要终点对患者的意义对于理解临床研究的显著性极为重要。
临床研究的对照药或对照组是什么?
理解临床研究对照组的意义可以帮助理解临床研究的重要性。例如,一项用于对比研究性治疗与护理标准的研究就会比用于对比研究性治疗与疾病处置过程中未经批准的治疗或安慰剂而重要得多。
多少患者参与了本研究?
一般而言,参与一项临床研究的患者越多,其结果越有意义。由于结果来自于大规模的患者,因而某些罕见的患者反应对整体统计的影响就会有所下降,从而该结果就能够更精确地反映治疗是如何影响本研究以外的普通患者人群的。
p值是否有统计学意义?
p值有助于表明研究结果的可能性是由于概率还是所测试的治疗方法之间确有差异。p值小于0.05为显著性的,说明偶然发生的结果只有低于5%的可能性。
参考文献
BMJ Clinical Evidence – glossary. Accessed November 2012. Available at: http://clinicalevidence.bmj.com/ceweb/resources/glossary.jsp
Harris M, Taylor G. Medical Statistics Made Easy Scion Publishing 2006 Ltd ISBN: 9781904842552
Greenhalgh T. How to read a paper: Getting your bearings (deciding what the paper is about). BMJ 1997;315:243–6
European Federation of Pharmaceutical Industries and Associations (EFPIA). A Highly Regulated Industry. Accessed November 2012. Available at: http://62.102.106.100/Content/ Default.asp?PageID=361
Response Evaluation Criteria In Solid Tumors (RECIST). RECIST. Accessed November 2012. Available at: http://www.recist.com/index.html
The Eastern Cooperative Oncology Group (ECOG). Introduction to ECOG. Accessed November 2012. Available at: http://www.ecog. org/general/intro.html