抽象的
原始慢性呼吸系统问卷(CRQ)是慢性呼吸系统疾病(CRD)中最广泛使用的健康相关生活质量(HRQL)测量方法之一,传统上采用采访者管理(IA),包括个体化的呼吸困难域。本文作者研究了自我管理(SA)和标准化呼吸困难问题对CRQ测量特性的影响。
In a factorial design multicentre trial, 177 patients with CRD (mean age 67.7 yrs; mean forced expiratory volume in one second per cent predicted 44.6%) were randomised to CRQ-IA (n = 86) or CRQ-SA (n = 91), and to initially complete the standardised or individualised items before and after respiratory rehabilitation.
在保持有效性,CRQ-SA被证明更加适应在所有领域中HRQL的变化比CRQ-IA。与标准化的呼吸困难域相比,个性化的呼吸困难域显示更高的响应性。基线分数和分数的变化与其他HRQL工具的相关指示的CRQ-SA的良好的有效性。
总之,自我管理和慢性呼吸问卷的标准化保持相对于面试官管理的慢性呼吸问卷的有效性和响应能力。这些结果提出质疑的假设,面试官填问卷优于老年患者有慢性呼吸道疾病自填问卷。
临床医生和研究人员认识到慢性呼吸系统疾病(CRD)患者临床研究中健康相关生活质量(HRQL)的重要性。慢性呼吸问卷(CRQ)是CRD患者HRQL最广泛使用的测量方法之一1- - - - - -8,曾担任过许多方法HRQL研究模型9- - - - - -13。原始CRQ包括四个领域的20个项目:呼吸困难(五个项目)、疲劳(四个项目)、情绪功能(七个项目)和掌握(四个项目)。完成该工具时,患者以七分制对其体验进行评分,从1分(最大损伤)到7分(无损伤)。
虽然访谈者管理的CRQ (CRQ- ia)可能有助于防止在完成CRQ和其他呼吸调查问卷时出现缺失反应和错误,但它限制了仪器在大型临床研究中的可行性14CRQ的个体化呼吸困难域也可能增加患者和采访者的复杂性和负担14- - - - - -17.在原始的CRQ中,患者选择5项重要的日常活动(个体化呼吸困难项目),并报告他们在进行这些活动时的呼吸困难程度。个性化可能会提高有效性和反应性(CRQ检测重要变化的能力,即使这些变化很小)18.
关于自我管理CRQ (CRQ- sa)的影响的随机研究几乎没有证据与CRQ-IA对HRQL仪器的测量特性,特别是CRD患者的测量特性。两项观察性研究表明,CRQ- sa评分对CRQ的测量特性没有影响19,20..同样的,虽然原始的CRQ已经证明是响应性的和有效的21在美国,很少有人知道个性化问题在多大程度上改善或损害了测量特性。在德语国家进行的一项观察性研究和一项随机研究中,呼吸困难项目的标准化将完成CRQ所需的时间从16分钟减少到8分钟,但损害了CRQ的反应性18,22然而,以前的研究受到小样本和观察设计的限制18- - - - - -20.,以及缺乏测试标准化CRQ-SA有效性所需的其他疾病特异性仪器22.
当前研究的目的是确定两种CRQ的修改,呼吸困难项目的自我管理和标准化,如何影响CRQ测量特性。作者选择了最严格的研究设计来解决这些问题。首先,在几个康复中心进行呼吸康复计划之前和之后,将患者随机分为CRQ-IA或CRQ-SA组。其次,所有患者完成了个体化和标准化版本的呼吸困难领域,但他们完成的顺序是随机的。患者还完成了一些与HRQL相关的其他措施,有助于探索CRQ的效度。选择呼吸康复治疗是因为其在改善患者HRQL方面的有效性23.
方法
患者与研究设计
目前的作者在多伦多,渥太华,汉密尔顿(在加拿大)和布法罗(NY,USA)中,在四所大学呼吸康复计划中进行了随机的多期式试验。符合条件的患者包括2001年9月至2003年9月之间的CRD启动康复的所有住院患者和门诊病人。康复计划的持续时间为8周,包括锻炼组成部分。由于网站调查员的死亡(D. Stubbing),2002年6月在汉密尔顿终止了招聘。由于临时关闭了康复医院,多伦多在多伦多的后续预约证明了在严重的急性呼吸综合征(SARS)爆发中。医院住房多伦多康复设施作为SARS爆发期间早期的主要护理设施之一。
由于语言障碍而无法完成问卷的患者不合格。最初的访谈和问卷的完成是在患者进入该计划期间进行的,后续访谈是在患者进入该计划12周后的一家诊所进行的。在每个地点,一名研究助理在基线和随访时进行或监督访谈。患者对自己的健康状况进行评估,与访谈前2周的情况一致。
当前作者随机化281名患者(多伦多:n = 180;渥太华:n = 21;汉密尔顿:n = 51;和水牛:n = 29)与CRD,大多数人患有慢性阻塞性肺病(COPD),接受CRQ-SA或CRQ-IA。此外,在每组内,所有完成两种形式的呼吸困难结构域的患者都被随机化以首先接收标准化或个体化形式。最后,患者在阶乘设计中随机化为施用感觉温度计的两种不同模式,这是一种可用于测量CRD患者HRQL的变化的仪器。这些后一种数据需要单独的分析和落在本报告的范围之外。随机化在法治中心,中心和八个块中居中进行。中心不知道块大小并收到密封信封的调查问卷。
自我管理的标准化慢性呼吸系统问卷
作者在原始CRQ-IA的基础上开发了CRQ-SA,使用了相同的措辞,但省略了CRQ-IA中用于指导采访者的所有短语或评论18,24.个性化的呼吸困难区域允许患者选择对他们日常生活最重要的五项活动。在随后的CRQ给药过程中,患者根据自己选择的活动对呼吸困难程度进行评估。
目前的作者从患者在以前的试验中经常选择的导致呼吸急促的五种最重要的活动中选择了这五种活动作为标准化的呼吸困难领域18.在欧洲德语国家进行的一项观察性研究和一项小型随机试验中,作者发现这些活动与COPD患者高度相关18,22.这五项活动是:1)情绪,如生气或心烦;2)照顾自己的基本需求,如洗澡、淋浴、吃饭或穿衣;3)行走;4)做家务,如家务、购物或杂货;5)参加社会活动。
标准化题的得分与个性化题的得分相同。个性化和标准化的呼吸困难领域的平均得分是通过将每个呼吸困难问题的得分相加,然后除以已得分的呼吸困难问题的数量来计算的。
其他与健康有关的救生仪器资格
为了验证和评估CRQ-SA的反应性,使用了许多其他HRQL工具。当前作者选择了以下工具,因为它们被广泛使用,并且在CRD患者中已证明有效性和反应性。
圣乔治呼吸系统问卷
圣乔治呼吸问卷(SGRQ)25测量呼吸系统疾病对HRQL和幸福感的影响。对其53个项目的反应可汇总为症状、活动和影响的总分和三个领域得分。对每个项目进行加权,将总权重除以最大可能权重,并将结果表示为百分比,即可得出患者得分。得分范围从0(最好)到100%(最差)。先前的结果证明SGRQ是有效的和响应的,并且发现最小重要差异(MID)是∼4%26,27.目前的作者假设CRQ得分与SGRQ得分高度相关。
此外,使用了几种HRQL通用仪器。作者假设,除非另有说明,否则相关与相应领域的通用工具将是适度的。
医疗结果为36
医疗结果简表36 (SF-36)28评估广泛的健康问题。它包括八个领域,包括身体功能,角色限制——身体,身体疼痛,一般健康,活力,社会功能,角色限制——情感和心理健康。SF-36的得分范围在0-100之间,得分越高表示功能和幸福感越好。SF-36对包括CRD患者在内的各种患者群体的变化都是有效的和敏感的22.
标准的赌博
标准赌博(SG)29为病人提供两种选择,供其作出选择。选择A是患者将保持健康状态(自身健康状态或标记状态)长达t年直至死亡的确定结果。另一种选择,B,是一种假设的治疗方法,有两种可能的结果:1)恢复完全健康(概率p)长达t年,最终死亡;或者2)立即死亡(概率1-p)。无差异概率p*是选择A中从死亡(0)到完全健康(1)区间内健康状态的效用值。被调查者越愿意接受较差结果的风险(如。与其他通用工具相比,SG在CRD患者中的效度和反应性较差,预计SG和CRQ之间的相关性较低30.,31.
感觉温度计
感觉温度计(英尺)29,31是一种以温度计形式呈现的视觉模拟刻度,最佳状态为完全健康(100),最差状态为死亡(0)29.在CRD患者中,FT显示了良好的测量特性,FT的MID为~ 5-727,31.
卫生事业指数3
卫生事业指数(HUI32通过一份15个条目的自我填写问卷收集数据,该问卷的设计目的是对患者的健康状况进行分类,提出最少数量的问题32.患者被要求在访谈前一周回忆自己的健康状况。HUI3多属性效用测度中的八个属性分别是视觉、听觉、言语、行走、灵巧、情感、认知和疼痛。每个题目有五到六个回答选项。根据问卷的回答,在0 - 1范围内计算效用得分,0代表死亡,1代表完全健康。以前对CRD患者的研究表明,它对这些患者的变化是有效的和有反应的27.
在随访时,同一名采访者按照与基线时相同的顺序为每位患者实施或监督器械的使用。患者在监督下自行使用SGRQ、HUI3、FT和SF-36,访谈者使用SG。
统计分析
分析侧重于SA和IA版本的比较,以及标准化和个性化的呼吸困难项目。通过排除缺失反应,计算每个领域的平均得分,如。如果患者只回答了五个呼吸困难问题中的三个,这三个答案的平均得分为分析提供了基础。
测试交互
本文作者测试了CRQ给药技术(自我给药)之间是否存在相互作用与访问者管理)和呼吸困难域法(个别化或标准化的)。进行了重复测量回归,与所述呼吸困难域得分为因变量的变化,和呼吸困难的问题的类型(自身给药与面试官管理),类型(个性化或标准化)和顺序(标准化)与个体化呼吸困难问题首先)的给药和他们的双向和三方交互项作为自变量。没有发现相互作用的证据(最低p为相互作用项p = 0.31)。
鉴别性质
使用基线和随访数据评估标准化和个体化呼吸困难域和其他域的横断面效度。为了进行分析,我们计算了CRQ域与其他CRQ域以及SGRQ、FT、SG、HUI3和SF-36的Pearson相关系数。
评价属性
为了评估CRQ-IA和CRQ-SA的相对反应性,计算基线和随访评分之间的平均变化,以及每种给药方式的相应95%置信区间(CI)。为了确定是否有任何明显的反应性差异可以用偶然性解释,使用非配对t检验将CRQ评分的变化与CRQ版本进行比较。为了比较个体化和标准化的呼吸困难区域,使用配对t检验比较平均分数。为评价CRQ-SA与CRQ-IA的纵向效度,计算两种给药方式的变化得分与验证工具变化的Pearson相关系数。
Bland Altman图用于评估标准化和个人化呼吸困难领域评分之间的差异是否受标准化和个人化评分平均分的影响,或者是否受给药方式的影响。
多个测试
在本研究的效度评估中,使用了许多HRQL工具,有些工具有多个维度。因此,进行了大量的统计检验,从而增加了在没有调整p值的情况下得出统计上重要结论的机会。然而,在本报告中,没有对多次比较进行调整,因为验证工具使用的是相关评分,而且对于如何对这种类型的分析进行调整没有达成共识。
结果
患者特征
本研究共纳入281例患者,其中104例(37.0%)未完成随访(多伦多:n = 72, 40.0%;渥太华:n = 5, 22.7%;汉密尔顿:n = 22.43.1%;水牛:n = 5,17.2%)。图1⇓通过随机研究的每个阶段描述参与者的流程以及排除研究的原因。由于无法阅读(在完成基线访问之前),共有281名患者被随机分为随机。其余279名患者中,102名被排除在外:25名患者陈述了太多工作,没有时间或不舒服的问题;21例患者太病了,继续康复计划;由于多伦多的SARS爆发,17名患者无法随访;12对康复计划不满意;无法达到六次随访;七名患者死亡;三名患者因调查人员负责汉密尔顿康复计划的死亡而停止;三名患者移动; and eight patients did not complete the CRQ or the SGRQ at both visits. The participation rate did not differ within the four centres for all randomised groups. Patients included in the analysis proved similar to those not included, with respect to sex, age, length and type of respiratory diagnosis, smoking history, and employment status in the patients (the lowest p-value for differences between these groups was p = 0.16 for forced expiratory volume in one second (FEV1) % predicted).
表1⇓显示了随机分组到CRQ-SA和CRQ-AI组的患者特征的相似性。两组之间没有明显差异,一般来说,患者年龄更大,几乎所有患者都患有慢性阻塞性肺病。当比较患者的基线特征时,根据他们是否被随机分配完成标准化(n = 88)与首先是个体化(n = 89) CRQ呼吸困难区域,没有观察到重要差异。然而,首先接受标准型呼吸困难区域的患者更有可能独自生活,疾病持续时间更短。
仪器响应
调查员施用与自行填写慢性呼吸系统问卷
表2⇓显示随机分组的基线、随访和平均变化评分。与CRQ-IA相比,CRQ-SA的基线评分在每个区域都持续较低(更严重的功能障碍)。仅掌握领域的差异有统计学意义(p = 0.03)。CRQ-IA与CRQ-SA随访评分差异较小,无统计学意义。
呼吸康复在所有领域均有统计学意义上的改善,且独立于给药形式,但CRQ-SA在每个领域比CRQ-IA的评分变化更大,大多数差异具有统计学意义。
表3⇓显示随机组其他HRQL仪器的基线、随访和平均变化评分。与CRQ-IA相比,CRQ-SA组的基线评分显示每个区域的功能障碍更严重。只有FT的差异有统计学意义(p = 0.03)。在随访时,每个验证工具是相似的,没有统计学意义。呼吸康复导致了统计上显著的改善,在所有领域,独立于随机组。CRQ-SA组变化评分有大于CRQ-IA组变化评分的趋势,但这些差异均无统计学意义。
标准化与个性化的呼吸困难
表2⇑also shows that patients who completed the CRQ-IA had a mean improvement in individualised dyspnoea of 0.65 and in standardised dyspnoea of 0.53 (mean (95% CI) 0.12 (−0.04–0.28); p = 0.13). Patients who completed the CRQ-SA had a mean improvement in individualised dyspnoea of 1.01 and in standardised dyspnoea of 0.77 (0.24 (0.09–0.39); p = 0.002). Because there was no interaction between the mode of administration and whether patients received the individualised or standardised dyspnoea questions first, these data were pooled. The mean improvement in the pooled analysis was 0.84 for the individualised and 0.65 for the standardised dyspnoea domain (0.18 (0.07–0.29); p<0.001).
图中温和的奥特曼情节 2.⇓结果表明,在呼吸困难评分范围内,标准化和个体化评分之间的差异相对稳定,且独立于给药方式。
有效性
访谈者填写慢性呼吸系统问卷与自行填写慢性呼吸系统问卷
表4⇓研究CRQ-IA和CRQ-SA在基线时的横向效度。总的来说,CRQ与其他HRQL测量仪之间存在中到高的相关性,与给药形式无关。CRQ-IA和CRQ-SA没有明显的相关性升高趋势(40个相关系数中有28个CRQ-IA较高)。随访时的相关性与基线时相似(数据未显示)。
表5⇓解决基线访问与CRQ-IA和CRQ-SA结构域之间的改变分数的相关性与其他措施(纵向有效性)。大多数这些相关性都是中等的强度和统计学意义。虽然CrQ-Ia上的三个相关性显着降低(所有用于HUI3),但总体而言,没有明确的趋势与CRQ-IA的相关性降低(40个系数中的18个为CRQ-IA更强)。
丢失的物品数
基线检查时,个体化呼吸困难领域的回答项目多于标准化呼吸困难领域(96.5%)与CRQ-SA的70.9%和98.9%与分别在CRQ-IA的75.8%)。在CRQ-IA和CRQ-SA上分别在97.7和98.9%的患者中完成了至少三种标准化的呼吸困难物品。对标准化的呼吸困难物品的患者的比例与表明患者以大约相同的频率进行活动并没有差异。缺失物品的比例在基线和后续行动中类似。CRQ-SA或CRQ-IA上的疲劳,情感函数和掌握域中没有缺少物品。
讨论
这项大型多中心随机对照研究阐述了一种广泛使用的评估CRD中HRQL的仪器如何在自我治疗中发挥作用与访问者给药格式,并且使用标准化的与个性化呼吸困难的项目。尽管参与研究的患者年龄较大,发病率较高,但自我给药并不影响效度,而且增强了反应性。个体化的呼吸困难格式显示出对标准化的呼吸困难区域的更好的响应性,而标准化的呼吸困难格式显示出更好的横断面效度。
CRQ-SA相对于CRQ-IA的反应性增强很大程度上是由于较低的基线评分,表明更大的功能障碍,并留有更大的改善空间(表2)⇑).在响应的增加可能与病人更加愿意承认严重功能障碍在没有面试官28,33. 然而,这种更愿意承认损害的态度并不影响自我管理和面试官管理的形式的相对有效性,这两种形式在横截面上与其他问卷显示出类似的相关性(表1) 4.⇑)和纵向分析(表5⇑).40个纵向相关性中,自我管理的有3个高于面试者管理的,所有这些差异都在HUI3上。自我管理和面试者管理的纵向效度在HUI3上的差异的一种解释是,HUI3本身就是自我管理的。然而,其他自我填写的问卷并没有显示出同样的差异。这些孤立的结果令人困惑,可能代表了一种偶然现象。
标准化和个体化呼吸困难形式的比较与先前两项较小的研究一致18,22.与标准化问题相比,个性化问题的分数分布更窄,平均分也更低。这可能是由于有机会将注意力集中在他们最重要的活动上,导致患者选择他们经历最麻烦的呼吸困难的个体化项目。标准化方法不允许这种聚焦,当每个患者处理相同的项目时,导致呼吸困难程度分布更广。因此,通过增加人与人之间的差异,呼吸困难域的标准化改善了CRQ呼吸困难域在患者之间的鉴别特性。
这些平均值和分布的差异与测量属性的差异有关。更广泛的分布可能解释了标准化项目和其他HRQL工具之间比个性化项目和相同工具之间更高的横截面相关性(表4)⇑).较高的相关性表明,标准化方法的鉴别效度提高,这是区分患者HRQL损害严重程度的重要测量特性。
在CRQ-SA和CRQ-IA中,个性化问题的反应略高于标准化问题,且前者的差异达到常规的统计学显著性水平。个体化区域反应性增强的一个可能解释是,患者可能会更加关注他们认为最重要的活动的变化。另一种可能是,随着时间的推移,活动模式的变化可能会给标准化的呼吸困难项目增加随机错误。
由于个体化和标准化呼吸困难区域之间的反应性差异很小,因此对样本量要求的相对影响也很小。然而,如果样本大小是一个关键问题,研究人员计划一项新的研究应该考虑使用个性化的CRQ呼吸困难域。
与此同时,改为标准化项目并没有减弱CRQ呼吸困难区域的变化与其他HRQL测量的变化之间的相关性。这表明呼吸困难区域的标准化并不会影响纵向效度。因此,如果样本量的增加是可行的,并且研究者认为标准化项目的更大方便性在他们的研究中是重要的,他们可以选择标准化的方法,而不必担心他们会损害CRQ的效度。
在这里我们观察到标准化的方法导致了呼吸困难区域的大量缺失项。这一发现并不令人惊讶,因为采用个性化方法的患者可以确保他们选择的项目既对他们重要,也对他们在上周进行的项目。这一限制不适用于标准化的呼吸困难项目,这使得应答者更有可能没有在问卷中指定的时间范围内进行活动。
与此同时,患者几乎无一例外地完成了至少三个标准化的呼吸困难项目。由于之前的研究结果表明,将项目数量从5个减少到2个对CRQ的响应性和效度的影响很小,因此标准化CRQ在本研究中保持效度也就不足为奇了34.
当前试验的优势包括随机设计和使用多种验证工具。确保了所有研究程序在各中心的一致性,并对所有采访者进行了培训,以确保遵守研究方案。多中心试验提高了当前研究结果的普遍性。
该研究的局限性包括随访损失相对较高。失访在某种程度上是由于异常事件(SARS流行和一名研究者的死亡),不太可能对当前的研究引入偏差,因为两组之间的参与率没有差异。此外,没有观察到完成试验的患者与未完成试验的患者之间的系统性差异。另一个限制阻止了作者将运动性能测试作为研究方案的附加部分,这将提供额外的验证数据。然而,其他一些研究评估了运动表现与原始CRQ的关系,并发现了中度相关性。
CRQ-SA组的患者倾向于在其他HRQL工具上表现出稍大的改善,因此,CRQ-SA观察到的反应性增加可能是由于随机化的轻微不平衡所致(表1) 3.⇑).然而,CRQ- ia和CRQ- sa组之间的评分变化仅在CRQ上有显著差异,而在其他HRQL工具上没有显著差异。此外,即使CRQ-SA反应性的增强是偏倚的结果,它也不影响CRQ-SA至少保持了测量特性的结论。
总之,目前的作者已经证明了一个标准化的自我管理版本的CRQ的有效性和响应性。研究者选择自我管理而不是面谈管理既不会失去反应性也不会失去有效性,而选择标准化管理既不会失去反应性与个性化的项目是小。调查人员可以处理的,通过调整样本规模的标准化呼吸困难问题,较低的响应,使得CRQ-SA非常适合用于大规模的临床试验中使用。因此,在大多数情况下,资源和耗时面试官的管理方法,使用单片呼吸困难的问题或采访需要管理不再妨碍使用CRQ的。
因为很少有自我管理比较生活的措施,不仅在慢性呼吸系统疾病,而且在其他疾病与健康相关的质量管理面试官随机研究,这项研究增加了患者报告结果评估领域的重要信息。由于大量使用了慢性呼吸问卷,目前的研究结果也有衡量生活的健康质量的慢性呼吸道病有重要意义,无论是在临床设置,如康复方案,并在研究性设置,如随机干预试验。自我管理的标准化慢性呼吸问卷的减少资源和时间要求使得它成为慢性呼吸系统疾病生命健康相关的质量评价一个有吸引力的工具。
- 收到2004年3月9日。
- 接受2004年9月1日。
- ©ERS期刊有限公司