摘要
严重哮喘患者吸入维持治疗的依从性很少得到充分评估,其对试验结果的影响尚不清楚。我们系统地确定了如何在严重哮喘“附加”治疗的临床试验中评估维持治疗的依从性。我们通过准确评估依从性来模拟试验能力的改善。
系统检索了6个主要数据库,确定了严重哮喘附加疗法的随机试验。评估了依从性测量与研究结果之间的关系。使用数字记录的依从性试验数据,对统计能力和样本量的潜在改进进行了估计。
87项随机对照试验纳入22173名参与者。67项试验未报告依从性评估(n=13 931,363 %)。报告依从性的研究采用了一系列自我报告和主观方法。没有一项研究对依从性进行了客观评估。研究报告坚持显著降低了1秒内用力呼气量(FEV)的汇总方差1)与那些没有评估依从性的患者相比:s2= 0.144升2与年代2= 0.168升2(p < 0.0001)。检测FEV临床相关变化的能力1在报告依从性评估的试验中显着更高(平均功率达到59%与49%)。建模表明,FEV的方差高达50%1结果可归因于未检测到的依从性变化。控制这些变化可能会使所需的样本量减半。
很少有附加疗法的试验监测维持吸入疗法的依从性,导致试验结果差异较大,且不足以确定疗效。
摘要
对严重哮喘的附加疗法的试验不包括对维持疗法的充分评估。结果,它们遭受统计能力的显著损失,导致样本量和相关成本大大增加.http://ow.ly/ZCyH30nSFHc
简介
单独吸入皮质类固醇(ICS)或联合长效β治疗2-激动剂(LABA)通常足以控制哮喘症状。然而,相当一部分患者的哮喘即使在高剂量ICS/LABA治疗后仍未得到控制,可能需要“附加”治疗。由于已知严重哮喘患者对吸入治疗和吸入器技术的依从性较差,全球哮喘倡议(GINA)指南建议,在开额外治疗之前,应优化患者的依从性和吸入器技术,以避免不必要的治疗[1,2].在实践中,由于评估吸入器依从性的客观方法尚未广泛应用,因此很少实现这一目标。
最近,已经出现了几种可以客观量化依从性的数字技术[3.,4吸入疗法。年代ulaimanet al。[5]使用数字记录技术评估中重度哮喘患者(GINA 3-4期)对ICS/LABA治疗的依从性。患者意识到主动监测。作者报告的基线平均依从率显著低于其他假设(平均±sd64±28%),在参与者水平上具有显著的变异性(坚持率的平均每月变化为30%)。因此,在参加附加疗法试验的患者中,对吸入疗法的不稳定坚持可能是一个混杂因素,这可能会从几个方面影响研究终点。在磨合期和整个研究过程中,未能客观评估维持性ICS/LABA治疗的依从性,这意味着在肺功能等客观指标上的显著差异来源没有得到重视。
我们假设,在对严重、不受控制的GINA 3/4期哮喘患者进行附加药物治疗的临床试验中,对维持性ICS/LABA治疗的依从性评估不足,报道也很少。因此,我们对严重哮喘附加疗法的临床试验进行了系统回顾,以确定在相关干预之前和干预期间评估维持ICS/LABA的坚持程度。基于本综述中已发表的试验结果,我们模拟了维持ICS/LABA依从性变化对研究结果的潜在影响,以确定改善ICS/LABA依从性监测可能对研究能力产生的影响。
方法
系统综述
本系统综述采用Cochrane方法学[6].在普洛斯彼罗的国际前瞻性系统评价注册(CRD42015029611)中纳入了预先指定的资格标准。研究流程图如图所示图1.
简单地说,以英文撰写的全文出版物报道的平行和交叉随机对照试验(rct)有资格纳入。具体而言,纳入了对年龄≥12岁的青少年或接受GINA步骤3-4治疗的严重哮喘成年患者进行附加治疗的随机对照试验。审查文章、未发表的研究、案例报告、审计、指南、社论、会议摘要、信件、未发表的研究、评论和只有摘要可用的研究被排除在外。
搜索策略
两名独立作者检索了Cochrane中央对照试验注册(Central)、MEDLINE、EMBASE、护理和相关健康文献累积索引(CINAHL)、Web of Science和PsycINFO,以确定1995年1月1日至2017年6月30日发表的研究。中显示了相关数据库的搜索策略的细节附录1.电子检索于2015年11月25日进行,并于2017年6月30日更新。
选择标准和数据提取
两名独立作者对标题、摘要和描述符进行了审查,以确定可能与综述相关的试验。审查了文本和参考书目,以确定其他研究。两位综述作者独立筛选了全文研究出版物,并选择了纳入的试验。意见分歧通过与第三位作者协商一致解决。使用系统评价和元分析(PRISMA)首选报告项目流程图记录选择过程[7]使用网上系统检讨软件(www.covidence.org).从试验中提取的数据包括研究特征、研究干预措施和结果。如果可能的话,通过直接联系作者获得缺失数据和/或www.clinicaltrials.gov或其他登记处,如果试验已注册。
评估纳入研究的偏倚风险
两名作者使用Cochrane偏倚风险工具根据以下领域独立评估了每个试验的偏倚风险:随机序列生成、分配隐藏、参与者和人员的盲化、结果评估的盲化、不完整的结果数据、选择性结果报告和其他偏倚。
结果
主要结果是对ICS/LABA治疗依从性的评估和报告以及依从性的测量。主观测量包括自我报告的依从性;半客观措施包括使用诸如称吸入器,药店补充或参与者是否填写每日日记等措施;一个客观的测量方法是,如果受试者被要求使用一个启用的吸入器,该吸入器会在使用时进行数字记录。
数据分析
描述性统计用于报告主要结果。采用RevMan5软件进行随机效应荟萃分析,比较研究结果[6].报告结果的平均差异和95%置信区间的汇总估计。
评估ICS/LABA治疗依从性对临床结果的影响
我们推导了由未监测的ICS/LABA依从性变化引入的额外方差对系统综述中纳入的研究结果的潜在影响的模型。虽然纳入研究中最常见的主要结果是年化急性加重率,但在急性加重的定义和报告方面存在巨大差异,以及缺乏基线急性加重率的数据,因此无法准确模拟依从性变化对急性加重率的影响。相反,我们关注的是1秒的用力呼气量(FEV)1),这是第二个最常报告的结果,通常在基线和研究结束时进行测量,以便在研究期间对依从性变化的影响进行准确建模。然而,当我们专注于FEV1在本建模研究中,类似的推理适用于病情加重的情况,其中由于ICS/LABA依从性而导致的基线率变化可能会影响试验的效力。这将在中进一步讨论附录5.
粘附变化对FEV的影响1
使用已发表的依从率分布和ICS/LABA治疗对FEV的影响的估计1,我们估计了研究结果中可归因于ICS/LABA依从性变化的方差比例。
在三种可能的情况下,未能客观评估依从性可能会影响临床试验:
场景1:在磨合期间或整个试验期间没有客观的依从性监测。我们模拟了正常的每月依从性变化的影响。
场景2:在磨合期间进行了依从性筛查,但在整个研究过程中没有进行客观监测。我们建立了“均值回归”效应的模型。
场景3:在研究期间监测依从性,但在磨合期间不监测。我们建立了一个假想的“霍桑效应”模型。
对依从性的分布和依从性的每月变化的估计是由Sulaiman等.[5],对100例严重哮喘患者的ICS/LABA治疗依从性进行了3个多月的电子监测[5].ICS/LABA对FEV影响的估计1是从Shapiro等.[8]吸入氟替卡松/沙美特罗与安慰剂比较。因为年代hapiro等.[8没有进行客观的依从性评估,依从性率被假定与Sulaiman等.[5].报告的效应量进行了调整,以获得预期的“真实效应”,给予完美的依从性(附录4).
图2显示了三个模型场景的示意图。下面简要描述了这些场景。详情见附录4.
场景1:每月变化
年代ulaiman等.[5]发现,虽然每月的平均依从性变化可以忽略不计(0.8%),但却有很大的变化sd(31.3%),表明学科内部差异很大。在缺乏对依从性的任何客观监测的情况下,这种变异可能会在生理结果中引入大量额外的变异成分。FEV中的额外方差1可估计为: 在哪里 是均值和 的sdICS/LABA处理的效果 是均值和 的sd依从性的变化。
使用S报告的值ulaiman等.[5],估计了S .的ICS/LABA效应hapiro等.[8],我们估计了FEV的预期额外方差10.083 L2.
情景2:回归均值
一些纳入的研究筛查了参与者在磨合阶段对ICS/LABA的依从性,但没有评估研究期间的依从性。在这种情况下,在磨合阶段有良好依从性的患者被认为在整个研究中有良好的依从性。然而,以这种方式进行筛查可能会导致平均效应的回归,即纳入依从性高于正常水平的参与者,随后恢复到平均依从率。
来自S的数据ulaiman等.[5]显示,在研究第1个月有良好依从性(>80%)的患者在研究期间的依从性显著下降(从第1个月到第3个月的平均变化为−8.5±21.2%)。使用与场景1中相同的公式,我们估计FEV中的附加方差1通过仅评估基线依从性介绍如下:
情景3:“霍桑效应”
在这种情况下,我们考虑在研究期间监测依从性的情况,而不是在之前的磨合期。在这种情况下,有可能出现“霍桑效应”,即患者在参与研究后提高了对维持治疗的依从性。我们建立了一个效应模型,即患者先前的依从性与Sulaiman等.[5],但随后改善至符合标准研究纳入指南(通常为>80%的依从性)。我们得出了平均值的估计值 和方差 关于这项改变(附录4).
利用对FEV影响的估计1和以前一样,我们得到了FEV中附加方差的估计1: 我们从系统综述中的所有研究中提取了报告的方差,并通过减去由于依从性变化引起的方差估计来获得调整后的方差估计。构建森林图和元分析,将结果与使用未校正方差值的结果进行比较。
结果
研究描述
在文献检索中确定的8686篇文章中,对329篇全文进行了资格评估,共有87项随机对照试验,涉及22173名参与者[9- - - - - -95]符合资格准则(图1).详细回顾了87项试验的设计、持续时间、纳入和排除标准以及收集的数据附录2.在大多数试验(n=83)中,研究设计为平行组设计,只有4项试验为交叉设计[13,33,49,80].试验持续时间从2周到52周不等;平均研究时间为27±16.1周。研究之间存在相当大的异质性。所有纳入研究的偏倚风险总结见附录3的补充表S1.
纳入的研究报告了ICS和LABA联合治疗的依从性
在纳入系统评价的87项rct中,有20项报告了对ICS/LABA依从性的评估。其中11人(5578名参与者,25%)报告了半客观的依从性测量,而9人(2664名参与者,12%)仅使用主观的自我报告方法。12例仅在筛选或磨合阶段评估依从性,5例在试验期间评估依从性,另外3例未提供评估时间的信息。所有纳入的研究均未在整个研究期间进行客观评估。依从性评估的方法和时间显示在表1而且2.
次要临床结果
一项荟萃分析仅限于进行生物疗法与安慰剂试验的研究,以比较11项使用半客观方法评估哮喘维持疗法依从性的研究与未评估依从性的研究的结果。在采用多种给药方案的交叉研究中,每种方案的结果作为单独的研究纳入荟萃分析。
对对照组基线变化的荟萃分析显示,主观结果,如哮喘生活质量问卷(AQLQ)和哮喘控制问卷(ACQ)的评分显示出显著的安慰剂效应;AQLQ和ACQ的加权平均差分别为0.48 (95% CI 0.28-0.68)和−0.57 (95% CI−0.63 - −0.51)。生理指标,如FEV1对照组的呼气流量峰值与基线相比没有显著变化。因此,支气管扩张剂前的FEV1用于进一步分析。
评估ICS/LABA依从性的研究显示FEV差异减少1并获得更高的统计功率
对报告FEV的研究进行了进一步分析1作为研究结果。为了一致性,我们只考虑了20项生物疗法的研究,这些研究报告了与基线FEV的差异1在升。研究报告FEV1百分比的人预测或没有报告基线FEV1都被省略了。FEV的总体汇总平均差异1为0.09 L (95% CI 0.06-0.11;n = 6036) (图3).其中,10名患者使用主观和半客观混合方法报告了对ICS/LABA的依从性,而其他10名患者没有报告依从性。两组研究报告了相似的FEV加权平均差异1主动与控制之间:FEV的变化10.09 L (95% CI 0.06-0.11;N =2938)用于报告依从性的试验(图4一)和0.09 L (95% CI 0.06-0.13;N =3094)用于未报告依从性的研究(图4 b).
相比之下,报告坚持ICS/LABA的研究显著降低了FEV的汇总方差1(年代2= 0.144升2)与那些没有评估依从性(s2= 0.168升2;p < 0.0001)。由于方差的差异,报告依从性的试验获得了相当高的检测FEV预期差异的能力1尽管样本量略低。检测FEV差异的能力1为每项研究计算0.1 L。未报告依从性的试验的效力范围为20%-70%(平均效力49%,平均样本量309),而报告依从性的试验的效力范围为25%-81%(平均效力59%,平均样本量293)。
虽然两组研究均为同质性,但未评估依从性的研究与报告依从性的研究相比,异质性水平更高,但不显著(I2= 26%与我2= 0%;p = 0.21)。因此,当我们考虑FEV的差异时1研究之间的差异最有可能归因于依从性评估,但我们不能排除现有数据存在其他系统性差异的可能性。
对依从性变化对研究结果的影响进行建模
我们设想了三种依从性评估的情景,其中一种是在任何阶段都没有对维持ICS/LABA的依从性进行评估,第二种模型仅估计在磨合期筛查依从性患者的效果,第三种模型估计在研究期间仅评估维持ICS/LABA的依从性的效果(图2).这些模型中的每一个都表明报告的FEV方差的重要组成部分1结果可归因于ICS/LABA依从性的差异。在情景1中,由于依从性变化造成的估计方差为0.083 L2,与未评估依从性的试验的总汇总方差为0.168 L相比2.这意味着对依从性的准确评估可以消除这些研究中高达50%的方差。类似地,在方案2和方案3中,由于依从性变化引起的估计方差为0.04 L20.06 L2分别表明,在每个可能的模型中,超过20%的方差可归因于未监测的依从性变化。
图5说明了在研究前和研究期间调整ICS/LABA依从性的潜在好处。虽然组间的平均差异未受影响,但由于对依从性的校正,结果差异的减少意味着可以更有信心地检测到临床重要差异。
图6在我们没有评估依从性的回顾中,证明了在这些试验中可以实现的改善。基于模型场景1,我们估计FEV的方差减少1如果能控制依从性就能达到。这一缩减应用于已发表的结果,以产生校正结果的森林图。在这种情况下,对依从性进行校正会导致较少的非显著性结果(两个非显著性结果,而原始研究中有五个)和汇总置信区间的显著降低。
虽然在我们的模型中,组间的平均差异没有改变,但减少sd由于对依从性进行了调整,导致meta分析中校正分析的标准化平均差异增加,在未报告依从性的试验中,校正分析的标准化平均差异为0.34 (95% CI 0.16-0.3),而在未校正分析中,标准化平均差异为0.23 (95% CI 0.14-0.32)。
粘附变化对检测0.1 L FEV临床显著差异的能力的影响1据估计。sds表示FEV的变化1系统评价中纳入研究的基线值为0.31至0.55 (图3).使用样本大小和通用值sd系统综述中发现的代表性病例(n=250,汇总sd=0.37 L),我们可以期望功率为55%。基于我们的模型,在整个研究过程中评估依从性可能会导致功率增加到~ 85% (图7).同样,在80%功率下检测0.1 L的平均差值所需的样本量将从450个参与者减少到220个参与者。
讨论
针对严重哮喘的新型附加疗法已经大量涌现。96].然而,其中许多药物都很昂贵,在某些医疗保健系统中可获得性可能有限。这些新药物成本的主要驱动因素之一是药物开发的高成本。第三阶段研究通常必须招募数百名参与者,以证明重要的差异。需要这些大样本量来补偿肺功能等结果测量的大差异。本研究试图评估这种巨大的差异是否可以通过维持治疗依从性的变化来解释。
在这项涉及22 174例不稳定中重度哮喘患者的系统综述中,我们发现只有20项试验评估了维持性ICS/LABA治疗的依从性,其中只有11项采用了半客观方法,而没有一项试验使用了客观的依从性评估(如。电子监控)。此外,尽管吸入器技术是吸入器依从性的重要组成部分,但仅在3项研究中记录和报告了其评估(3%)。这表明,在哮喘附加治疗的随机对照试验之前和期间,这些研究招募的参与者有可能表现出次优的依从性或吸入器技术不佳。
在筛查包括“难以治疗”哮喘患者在内的风险时,未能评估维持性哮喘治疗的依从性,并可能引入与后续更高风险的显著额外差异sdS在临床终点。在附加治疗试验期间,对维持性ICS/LABA治疗的依从性评估不足也有可能增加更大的结果差异,因为患者每月的依从性可能在研究期间发生变化。这些坚持行为模式可能会对研究能力产生显著影响,并可能导致显著的额外成本,因为需要更大的样本量来克服坚持变化引起的额外差异。
S的近期工作ulaiman等.[5]及其他[97]已经确定了几种增加哮喘患者吸入治疗依从性的方法。然而,在现实中,完全将依从性不佳的患者排除在试验之外可能是不可取的,更不用说非常不切实际了。尽管如此,考虑到混淆和力量丧失的巨大潜力,在整个试验过程中,应尽可能努力控制依从性变化。现在有许多电子监测器可用于评估吸入治疗的依从性,如INCA [98]及螺旋桨[99这些设备可以让研究人员纠正依从性变化对试验结果的影响。虽然在漫长的试验中使用这种设备可能会增加研究成本,但所需样本量的潜在减少可能远远超过这一额外费用。
FEV的meta分析1结果显示,评估ICS/LABA依从性的试验显示FEV的方差显著降低1并获得了更强的检测有意义差异的能力。由于这些试验没有报告维持ICS/LABA治疗依从性水平的数据,我们在研究的磨合阶段和试验阶段对评估依从性的影响进行了建模实验。结果表明,结果差异的显著比例可归因于ICS/LABA依从性的差异。这些数据进一步表明,如果在哮喘附加疗法试验之前和试验期间控制对当前疗法的坚持,研究力量可能会翻倍,样本量减半,从而降低药物开发成本。
优势和局限性
据我们所知,这是第一个评估哮喘附加疗法的临床试验系统综述。偏倚风险评估显示,大多数研究的选择、检测和偏倚风险较低。在本综述的时间范围内,纳入了1995年至2017年发表的试验,哮喘指南、哮喘研究结果和随机对照试验报告指南发生了变化,可能导致可用于进一步荟萃分析的信息有限。审查还受到结果报告不一致的限制。特别是,哮喘加重的定义范围广泛,报告中存在严重的不一致性,这使得很难在各个研究中对这一结果进行有意义的比较。为将来的临床试验标准化哮喘临床结果的努力应该在国际上进行比较。例如,评估FEV的绝对变化是否更有用1与预测的百分比变化相比,还是应该报告两个值以提高数据透明度?将客观的依从性测量纳入进行临床试验的方法是具有挑战性的,因为大多数可用的评估依从性的方法还不具备评估吸入器技术的能力。为了克服这些限制,关键的第一步是开发经过验证的客观方法,评估吸入器使用的时机以及吸入器技术。
我们对依从性评估对结果影响的建模也受到了包括的试验中几乎完全缺乏实际依从性数据的限制。因此,虽然我们将方差和研究能力的差异归因于控制依从性的好处,但我们无法参考实际的依从性数据来验证这一假设。同样地,虽然我们认为将FEV的减少归因于此是合理的1依从性评估的差异,我们不能排除有依从性评估和没有依从性评估的试验之间的其他系统差异,这些差异可能解释这种差异。
结论
这项研究的结果表明,在评估哮喘附加疗法的试验中,不到四分之一的试验在随机分组之前评估了ICS/LABA疗法的依从性,或在整个试验过程中监测了依从性。此外,没有一项评估依从性的研究采用了真正客观的方法。在附加治疗的临床试验中纳入客观的吸入器依从性评估,将使研究人员能够控制维持治疗依从性的变化,从而显著降低结果的差异。这最终将使规模更小、成本效益更高的研究得以进行。
补充材料
脚注
这篇文章有补充资料可从www.qdcxjkg.com
作者贡献:M.C. Mokoka, F. Doyle, G. Greene, E. MacHale, B. Cushen和R.W. Costello参与了研究设计。M.C. Mokoka和C. Doherty进行了电子搜索。M.C. Mokoka, S. Cormican和R.W. Costello审阅了摘要和全文。M.C. Mokoka和M.J. McDonnell参与了数据提取和分析。M.C. Mokoka, F. Boland和G. Greene参与了这份手稿的统计分析。G. Greene和M.C. Mokoka进行了建模工作。所有作者都审阅了手稿,并在提交前提供了重要意见。
利益冲突:M.C. Mokoka没有什么可透露的。
利益冲突:M.J.麦克唐奈没有什么可透露的。
利益冲突:E. MacHale没有什么可透露的。
利益冲突:库申没有什么可透露的。
利益冲突:f·博兰没有什么可透露的。
利益冲突:S. Cormican没有什么可透露的。
利益冲突:C. Doherty没有什么可透露的。
利益冲突:f·道尔没有什么可透露的。
利益冲突:R.W.科斯特洛没有什么可透露的。
利益冲突:G. Greene没有什么可透露的。
支持声明:这项工作由卫生研究委员会拨款HRA-DI-2014-683资助。资助机构在这项研究的设计或实施中没有任何作用。本文的资助信息已存入交叉参考基金注册.
- 收到了2018年11月13日。
- 接受2019年2月20日。
- 版权所有©ERS 2019