抽象的
慢性阻塞性肺病评估测试(CAT)是一项自我填写的问卷调查,测量与健康相关的生活质量。我们的目的是系统地评估文献的信度、效度、反应性和最低临床重要差异(MCID)。
对慢性阻塞性肺疾病成人CAT的心理计量学特性进行了研究,检索了多个数据库。两位审稿人使用COSMIN检查表独立筛选、选择和提取数据,并评估相关研究的方法学质量。
从确定的792条记录中,包括36项研究。参与者的数量范围为45至6469年,平均年龄为56至73岁,平均呼气量为1秒,从39%预测到98%。内部一致性(可靠性)为0.85-0.98,测试 - 重保持可靠性为0.80-0.96。使用Pearson相关系数的收敛和纵向有效性分别是:SGRQ-C 0.69-0.82和0.63,CCQ 0.68-0.78和0.60,分别为MMRC 0.29-0.61和0.20。分数不同于金阶段,恶化和MMRC等级。肺康复(2.2-3个单位)平均分子降低,并在加剧发作(4.7单位)时增加。只有一种具有足够的方法的研究报告了使用基于锚的方法和基于分配的方法的2个单位和3.3-3.8单位的MCID。大多数研究具有公平的方法论质量。
我们的结论是,这些研究支持CAT的可靠性和有效性,该工具对干预措施是有响应的,尽管MCID仍有争议。
抽象的
研究支持CAT作为HRQoL工具的可靠性、有效性和响应性,但其MCID仍不清楚http://wly/xkvna.
介绍
确定慢性阻塞性肺疾病(COPD)的诊断需要肺活量测定;然而,最近的指南建议仅根据1秒内用力呼气量(FEV)对COPD进行分类1)在报告疾病严重程度时预测的百分比不足[1].评估患者与健康相关的生活质量(HRQoL)允许临床医生做出个性化的患者管理决策;因此,全球慢性阻塞性肺疾病倡议(GOLD)战略文件主张,慢性阻塞性肺疾病管理不再仅仅通过肺活量分类进行分层,而是通过对特定患者属性的多维评估[2,3.].
评估HRQoL的copd特定问卷确实存在(例如圣乔治呼吸调查问卷(SGRQ)或慢性呼吸调查问卷(CRQ)),尽管有些问卷因耗时而不适合临床使用[2].因此,GOLD建议使用改良的英国医学研究委员会(mMRC)呼吸困难量表或COPD评估测试(CAT);然而,优先建议给予CAT,因为它提供了COPD对健康的影响的全面覆盖[2].
CAT使用COPD患者的输入创建,然后使用现代问卷调查方法开发:心理测量分析和项目反应理论使用Rasch分析确定了最适合形成单维仪器的项目[4,5].自我管理的问卷由八个项目组成,评估COPD的各种表现,旨在提供HRQOL的简单量化措施[5].对CAT心理测量特性的初步评估很有希望[5].总结当前关于该工具的性能的知识作为HRQOL测量仪器有价值,因为测试可能在COPD临床实践和研究中具有重要作用。据我们所知,尚未进行对猫问卷的心理学特性的全面审查。
我们这篇综述的目的是系统地搜索文献,评估和总结CAT作为COPD患者HRQoL工具的心理测量特性(信度、效度、反应性和最小临床重要差异(MCID))。
方法
在在线补充材料中可以找到关于在综述中评估的心理测量特性的详细描述,以及完整的系统综述和荟萃分析首选报告项目(PRISMA)清单。
研究选择的资格标准
随机对照试验和观察性研究(例如横断面,队列,等。)包括> 10名参与者。学习参与者需要被诊断为≥40岁的受试者(使用金标准)[2].干预措施可能是任何干预,安慰剂,通常的照顾或时间。评估的结果由CAT可靠性,有效性,响应性或MCID组成。报告至少一个或多个心理测量性能的研究。详细的包含和排除标准可以在线补充材料中找到。
信息来源和搜索
2014年3月10日检索Cochrane Database of Systematic Reviews, the Database of Reviews of Effects, and Clinical Query in PubMed,以确定之前关于该主题的系统综述。检索到的单独评论处理了几个HRQoL工具,有一个广泛的评论问题和有限的搜索策略[6].
2014年3月10日,对Cochrane Central、PubMed Medline、OvidSP Medline、OvidSP Embase和Thomson Reuters ISI Web of Knowledge Web of Science五个电子通用数据库进行结构化检索。数据库搜索是从2009年开始的,因为这是CAT开发的一年。对于英语、法语或西班牙语的文章,我们使用了各种搜索词,包括文本词和数据库特定的主题标题。详细的、特定于数据库的搜索策略可以在在线补充材料中找到。人工检索排名靠前的呼吸系统期刊和ProQuest学位论文数据库。从《禁止化学武器公约》现有叙述性审查的参考书目中寻找可能的研究,以及所有纳入的研究的参考书目。
研究选择,数据收集过程和数据项目
两位审稿人(妮莎·古普塔(Nisha Gupta)和兰斯洛特·m·平托(Lancelot M. Pinto))分别筛选了从搜索中找到的每项研究的标题和摘要。然后以全文形式检索所有可能相关的文章,两位审稿人(Nisha Gupta和Lancelot M. Pinto)在对所选文章的全文进行审查后进行二次筛选。关于纳入或排除某一特定研究的分歧通过达成共识而得到解决。必要时,分歧由第三位审稿人(让·布尔博)解决。保留了一份被排除的研究和排除原因的清单。
使用试点数据提取表格从每个合格的研究中电子提取数据。在进行了试点数据提取之后,对表单进行了修改和改进,以评估审阅者之间的一致性。
两位评审员(Nisha Gupta和Andreea Morogan)独立地从每项纳入研究中提取数据,包括研究特征、人群特征、干预和/或研究事件和结果,以及相应的测试表现指标。数据提取表格可在在线补充材料中找到。
包括研究的质量评估
两位审稿人(Nisha Gupta和Andreea Morogan)使用基于共识的健康测量仪器选择标准(COSMIN)清单独立地对每个研究进行了质量评估,这是一个经过验证的质量评估工具,用于评估评估工具心理测量特性的研究的方法学质量;这是对患者报告的结果进行心理测量特性方法学评估的唯一特定清单[7,8].每个心理测量属性的方法学质量通过多个项目进行评估,并使用“优秀”、“良好”、“一般”和“差”四分制量表进行评分。对每一项心理测量性质进行最低评分(“最差分数计数法”),得出研究方法质量的总体分数[7].清单适用于在线补充材料中的项目列表,评分规则和心理测量属性。
合成结果
本研究采用叙述合成的方法,对CAT的信度、效度、反应性和MCID进行总结。数据通过详细的表格,比较研究的研究特征,人口特征和CAT心理测量特性。数据综合是根据所研究的适当和类似结果提供的,并注意到所使用的具体统计检验。计算某一特定心理测量特性的研究结果的范围(最小值至最大值),评估心理测量特性的强度和充分性。探讨了方法学质量对研究结果的影响,以提供一些评价质量和研究之间的异质性。所有分析均使用STATA 11 (STATA Corporation, College Station, TX, USA)进行。
跨研究偏见的风险
通过使用语言过滤器(英语、法语和西班牙语)或不使用语言过滤器从搜索策略中检索引文,评估语言偏差,并根据过滤后的引文占检索的总引文的百分比,在5个通用数据库中进行平均报告。
结果
研究特征
表格1总结了根据评估的结果数量的研究和群体特征:九(25%)研究评估可靠性(内部一致性和测试 - 重试),32例(89%)研究评估有效性(并发,收敛,纵向和已知群体有效性),10(28%)研究评估响应性和四项(11%)研究评估MCID [5,9- - - - - -43.].
CAT在欧洲、北美、南美、亚洲和非洲的32个国家实施,2012年发表了17项研究,2013年发表了11项研究。在36项研究中,16项是前瞻性队列研究,其余20项是横断面研究。前瞻性队列中评估的干预或事件类型包括肺康复、急性加重发作、急性加重恢复和常规护理;随访时间为2 ~ 24周。被试人数在45 - 6469人之间,女性被试比例在0% - 64.4%之间。平均年龄为55.9 ~ 73.0岁,平均FEV1预测在38.7%到98.0%之间。23项研究指明GOLD等级的人数。
无反应率和地板和天花板效应
只有6项研究报告了完整CAT评分(无缺失项)和缺失项人群的比例[9,15.,17.,21.,26.,41.) (表2.).在两个人群中测量了最小(楼层效应)和最大(天花板效应)的患者的百分比[9,36.) (表2.).
可靠性
8项研究报道了CAT的内部一致性,Cronbach’s α范围为0.85-0.98,表明各项目之间具有高度相关性[5,9,10,14.,15.,18.,19.,21.) (表2.).在五项研究中评估测试重新测试以测量重现性[5,9,10,14.,30.) (表2.),猫在两种不同的场合施用(在基线,然后在1或2周后)进行三项研究[5,10,30.[三个单独的场合(在基线,2周,然后6周后)一项研究[14.].ICC范围为0.80-0.96,证明猫在在稳定的疾病条件下反复施用时生产得分一致。
有效性
三项研究通过比较CAT总分与医疗保健利用率来衡量并行效度[15.,34.,39.].医生咨询的数量与一项研究中的猫总数相关(P <0.001)[34.,但其他的则没有[15.,39.].与使用总猫评分(P <0.001)无关(P <0.001),住院治疗数量与猫分数直接相关(P <0.001)[15.或将CAT分数任意二分(例如<10和≥10)(p <0.001 [34.]和p <0.032 [39.])。同样,急诊室访问的数量与两项研究中的猫分数有关(P <0.001 [15., p<0.001 [34.),但在另一个[39.].
在21项研究中评估了会聚有效性,其中猫与各种调查问卷进行比较[5,9- - - - - -15.,17.- - - - - -20.,22.,23.,25.,27.- - - - - -29.,31.,41.,42.) (表3).衡量该财产的患者均处于稳定状态,除非在研究中未报告。在六项研究中报告了猫纵向有效性,并由肺恢复或从急性加剧中恢复的干预措施或事件[9,11- - - - - -13.,16.,24.) (表3).
19研究报告了已知的群体有效性和HRQOL可能不同的类别变化[5,9,11,14.,17.,20.- - - - - -23.,25.- - - - - -29.,33.,36.,37.,40,43.) (表4.).CAT分数在统计上不同(P <0.05),如下类别:COPD金等级[9,14.,17.,20.,22.,25.,27.,37.];初级护理医生评定的慢性阻塞性肺病黄金级别[20.,22.];健康的个人与被诊断为慢性阻塞性肺病的人士[21.,28.,33.,36.,40];不常见的恶化者与频繁发作者(定义为在过去6个月内没有急性发作与过去6个月急性加剧;0-1,2-4或>每年4恶化;每年<2或≥2℃加剧)[9,23.,26.,33.,43.];恶化状态与稳定状态(5,9,20.];体重指数(BMI)(定义为BMI <18.5千克M.−2, BMI≥18.5,<23 kg·m−2,或bmi≥23kg·m−2)[25.];及mMRC评分[9,27.,37.].猫分数在以下类别中没有统计不同(p≥0.05):性别[11,20.,21.,29.];年龄(定义为≤65岁与> 65岁)[20.,29.];目前的吸烟者与不吸烟者(23.];共病(定义为0、1-2或≥3个共病)[20.,25.].
响应能力
10研究检查了猫的响应性(表5.)[9,11- - - - - -14.,16.,24.,26.,32.,38.].在四项研究中,CAT对肺康复有响应,干预结束时CAT评分的平均变化范围为-3.0 - -2.2个单位[11,12,16.,24.].肺部康复治疗多数患者病情好转,无论持续时间为8周[11,16.,24.或6周[12].从8周干预结束到6个月后重新评估响应能力,并确定康复结束时猫评分略微恶化[16.].
大多数患者的总CAT评分随着病情恶化而恶化:平均CAT评分增加了4.7个单位(p<0.001) [26.].然而,随着治疗后病情加重的恢复,患者的CAT评分在2、4、6或12周后有所改善[9,12,13.,32.,38.) (表5.).患有抑郁症状的患者及其患者的猫分数改善了加剧恢复,但那些没有抑郁症状的患者在6周内患有更大的猫评分[38.].
最小临床重要差异
四项研究试图确定猫的mcid [11,12,14.,35.].三项研究采用基于锚点的方法计算MCID。其中两项研究发现,他们的外部反应范围(例如要好得多,好一点,没有什么不同或更糟;响应者或非反应者)不是由平等的患者使用的;因此,不可能确定MCID [11,12].另一项研究确定了2个单位作为MCID估计的减少[35.].两项研究使用了基于分布的方法,并确定了CAT为3.76单位的MCID [14.]减少3.3至3.8单位[35.].
研究内部和跨研究的偏倚风险
根据COSMIN清单,这些研究的方法学质量大多被评为尚可(30项(83%)研究),其中1项被评为较差,4项被评为良好,1项被评为优秀。对方法学质量较好的研究进行内部一致性、重测、收敛性和已知组效度评价;纵向效度和反应性在方法学质量较好的研究中进行检验;评价MCID的研究是公平和优秀的方法学质量;在方法质量较差和较公平的研究中评估并行效度。在五个通用数据库中,语言偏差最小;英语、法语和西班牙语过滤的引文占总被引量的百分比为95.4%。
讨论
设计HRQOL工具的目标是准确和可靠地测量HRQOL,这篇评论将CAT作为HRQOL仪器的充分性标识。虽然有几篇文章已经发表在猫身上,但这是系统地审查可用文献评估猫在患有COPD患者患者群体中的心理测量性质的可用文献。
CAT的心理测量特性是可接受的和有利的。CAT是可靠的:问卷中8个项目的相关性表明内部一致性高,而反复给药后CAT总分的稳定性证实了其随时间的重现性。此外,CAT通过收敛效度、纵向效度和已知群体效度表现出良好的构效度。很明显,CAT是有反应的,并且能够检测评分随时间的变化:CAT评分随着肺部康复和治疗后加重的恢复而改善,而CAT评分随着加重的开始而恶化。只有一项研究通过基于锚定的方法可靠地确定了MCID估计的减少2个单位。
大多数研究(83%)没有报告猫的缺失数据,在某些研究中,只分析了完整数据的受试者,导致被排除的患者的大量比例。未来的研究需要检查猫的地板和天花板效果,因为它们只在两个人口中得到了解决。总体而言,研究的方法论质量是公平的。除了并发有效性外,所有的心理学属性都被评估为额定公平,良好或优异的方法质量。
尽管所检测的研究的多样性导致了许多COPD群体中的心理学特性检查,但允许概括结果,进一步评估有效性和响应能力,需要在特定的患者人群中完成(例如女性,较年轻的年龄群,轻度疾病)评估猫在这些群体之间区分的能力。它可以评估猫的预测有效性,以确定它是否可以预测未来的临床结果(例如死亡、住院、疾病进展或恶化)。类似地,虽然没有正确的方法来确定MCID,但一些研究必须尝试提供估计,以便多个结果可以结合起来提供真实的值(参见计算MCID方法的在线补充材料)。此外,与调查表的编制有关的是一个基于CAT评分的评分制度,开发小组根据每一种情况提出了潜在的管理考虑。一项关于CAT对COPD患者初级护理会诊质量影响的调查已经在一项随机对照试验中进行,尽管由于该研究的方法学局限性,该领域的研究需要进一步推进[44.].
本综述优势包括多个数据库的详尽搜索策略,独立的研究检索,筛选,数据提取和研究质量评估。数据不足以进行Meta分析:研究的各种结果,方法的异质性和多样化的研究人群阻碍了特定心理学特性的共同综述效果,因此认为荟萃分析不合适。
然而,也有局限性。调查异质性是不可能的,但研究之间的异质性仍然是可以预期的。同样,通过漏斗图评估发表偏倚的正式评估也无法进行。虽然在搜索策略中没有应用语言过滤器,但对语言偏差的评估表明,轻微的语言偏差可能是值得关注的;然而,考虑到CAT的发展是在某些语言中研究的,这些发现似乎是适当的(例如英语)但不在别人。还必须考虑来自附带的研究的数据的限制(例如已知群体有效性的标准偏差未在大多数研究中呈现),尽管它们反映了猫的缺乏文学。
结论
本综述采用严格的方法,以便在COPD患者中全面概述猫的心理学特性。研究支持猫的可靠性和有效性,并且该工具对干预措施响应于干预措施,尽管MCID仍然是可贬值的。由于该猫证明了良好的性能,并且是一种简单而快速的工具,可评估COPD患者的HRQOL,因此对其在临床实践中使用的兴趣日益增长。需要研究来评估使用该问卷的使用,以便在新的金色分类中对COPD患者的症状评估。不能假设猫的行为与不同的患者人口特征类似;因此,研究还必须试图确定猫在女性中的有效性,患有轻度疾病或风险风险的个体和年轻患者。
脚注
对于编辑评论看833页.
这篇文章有补充资料可从www.qdcxjkg.com.
支持声明:本研究得到了麦吉尔大学卫生中心研究所(Guisha Gupta的研究生奖学金奖),协同创新研究基金(CIRF)GSK Canada,加拿大队梗阻性肺病(Cancold)加拿大卫生研究院(CIHR)/ RX&D协作研究计划(IRO-93326),以及Fonds de Rechercheduquébec的呼吸健康网络 - Santé(FRQ)。
利益冲突:披露可以在本文的在线版本旁边找到www.qdcxjkg.com.
- 收到了2014年2月5日。
- 接受2014年5月22日。
- ©2014人队