文摘
选择一个适当的测量结果取决于疾病的方面要解决和研究进行的目的。最基本的属性的任何结果是衡量生物变量下的问题的能力。其他属性,如歧视和评价能力也很重要。
具体结果测量单个生物变量,如在一秒钟用力呼气量或抑郁。此类措施的特异性是有吸引力的,但是需要精确的被测量的定义,及其原因。总结性,结果被用来量化不同的生物过程的整体效果。
最简单的总结性的措施是全球性的问题如“你如何评价你的健康整体吗?“他人和许多项目是复杂的。如果设计和正确使用,这些问卷调查可以提供估计的总体影响疾病或对治疗的反应和索引是否临床反应是值得的。
标准化的测量是很重要的,允许比较患者和研究,使得测量一个人的“生活质量”的困难。“测量健康状况”一词可能更好的指使用标准化的问卷调查。关于临床实用为基础的措施帮助解决问题与统计改进并将结果慢性阻塞性肺病治疗试验中所有的医疗治疗。
慢性疾病通常有三种类型的影响,在慢性阻塞性肺疾病(COPD)是定义如下:主要影响肺,这可能是结构或机械;二次效应在其他器官,如肌肉和血液循环;和高等教育的影响,包括病人和他们的环境之间的交互。
从病人的角度来看,健康与更好的功能,缓解症状和延长寿命1- - - - - -3。然而,生活时间和生活质量本身并不是唯一的重要成果;所有的影响都需要考虑当评估治疗。对肺功能的影响或二次对器官的影响很重要,因为它们可能会降低生活质量或缩短寿命4,5。如果对这些结果肺功能没有影响,这将是小问题1。
对什么标准措施应该判断吗?它是适当的评估结果措施在一秒用力呼气量(FEV吗1),最大耗氧量和扩散能力?大量的研究文献表明,生理结果之间的相关性和措施与健康有关的生活质量(健康状况),但后者不解释方差的生理变量6,7。
然而,一些证据表明健康状况的措施是重要的。例如,它是一个重要的、前瞻性预测晚期肺病患者的死亡率5。此外,改善患者的生活质量是要实现与他们的治疗。当寻求护理,病人想要缓解气短,社区的功能和日常生活的能力来执行活动1。治疗改变生理参数,如FEV1,但并没有生活质量,可能不会成功。
各种各样的措施适用于评估结果是可用的8- - - - - -12。使用哪个测量的选择将取决于方面的疾病正在解决和研究的目的13- - - - - -15。测量结果为COPD患者可能不同于其它慢性病患者和可能涉及更多的重大挑战。为了说明这一点,考虑比较结果对病人治疗慢性阻塞性肺病的患者的髋关节骨关节炎或白内障。髋关节骨关节炎的患者往往用全关节置换手术治疗。许多研究使用泛型和disease-targeted临床改善措施了16- - - - - -20.。大量研究已经评估接受白内障摘除术的病人更换镜头,表现出实质性的变化disease-targeted措施,但只有适度调整使用通用的措施21,22。的髋关节骨关节炎和白内障疾病、手术干预产生实质性的治疗益处。
虽然慢性阻塞性肺病的治疗方法可能不会产生戏剧性的好处全关节置换或白内障替代,一些治疗后的生活质量可以提高慢性阻塞性肺病患者。特别是,一些研究已经证实,改进后的生活质量参与康复项目23。生活质量的措施,比如36-item简式(SF-36)医疗结果的研究24,幸福的质量量表(QWB)25圣乔治呼吸问卷(SGRQ)26和加州大学圣地亚哥气短问卷6对慢性阻塞性肺病患者相对较小的变化很敏感。
分类结果
在呼吸系统药物,许多不同种类的结果可分为两大类:特定的和全球。
具体的结果
具体结果测量单个生物FEV等变量1或抑郁。其属性特征就是他们地址一个一维的构造(例如,气道阻塞的程度或特定情绪干扰)。
使用一个特定的结果是有吸引力的,因为它应该清楚什么是被测量。特异性,但是,需要一个精确的定义被问到的问题。这可能说明了结果的选择用来评估长效支气管扩张剂的影响,代理行为诱导气道平滑肌放松,无法衡量在活的有机体内。确实,值得注意的是即使在生理功能的程度,立即采取行动所产生的结果参数以外的药品必须使用。换句话说,结果在实践中常常使用替代药物的基本生理指标行动。无法直接测量气管平滑肌松弛只是偶尔可能是重要的,因为它是这一过程的结果是临床相关。此外,兴趣并不发生在孤立的过程,而是发生在其他疾病的主要和次要的影响和可能被修改。
可衡量的结果引起的气管平滑肌松弛长效支气管扩张剂包括FEV1,迫使吸气流,吸气量,缓慢的肺活量和呼气肺体积。有些测量气道壁的变化的直接结果,但其他人受到肺容积的影响,可以通过减少自己提高困气体的体积。其他相关生理变量,更难以收集呼气末是动态和end-inspiratory肺容积,然而,这些可能与呼吸困难在运动密切相关比肺活量的测量结果在休息的时候27,28。bronchomotor减少的一些好处,比如那些发生在睡眠中或急性恶化,可能时机——或者具体由各州完成,只有模糊的肺量测定的相关测量白天在实验室和在一个稳定的状态。
选择某一特定的结果应该是依靠研究的目的,临床疗效或机械的解释药物的效果。如果这项研究不是主要针对阐明机制,应该选择一个特定的结果,因为它可以提供病理生理学确认产生的治疗临床效益通过其假设的作用机制。不幸的是,一个特定的机械易于测量的结果是更多的选择,因为比健全科学的原因。
全球的结果
全球或总结性的结果被用来量化整体效果的生物措施29日立即,但他们可能不认可这样的,因为其中的一些测量因素似乎是线性的。一个例子是运动性能,因为这生理的结果是由心脏,肺,血液循环,和外围肌肉功能,结合呼吸困难和疲劳的感觉6,7,30.。甚至连FEV1是慢性阻塞性肺病的总结性测量(相对于哮喘),因为它既反映了疾病的气道壁和肺泡附件由肺气肿引起的损失。这FEV的总结性属性1运用在实践中,因为它是用来定义慢性阻塞性肺病无论潜在的病理生理学的严重性吗9,31日。
健康状况更容易认可作为一个总结性的措施。理论上,很容易概念化的健康作为一个构建,但在实践中,这种测量解决一系列不同的健康和福祉方面的干扰。一些调查问卷,如通用SF-3632,甚至不提供一个总结性整体健康损害的程度,和现在的结果作为一个的成绩或身体或精神总结分数。相反,其他通用的工具,如疾病影响形象33和QWB34,提供一个总分,作为COPD做一些针对疾病的调查问卷,比如SGRQ35。
健康状况问卷调查是复杂的仪器,但全球其他结果,如哮喘严重程度得分上使用日记卡,使用更简单的技术。通常,患者要求整体症状水平使用3至七级分类分级(如。没有,轻度、中度、重度)。类似的技术用于评估的总体疗效治疗患者或医生。这种类型的成绩现在被用于慢性阻塞性肺病的临床试验。与总分从复杂的问卷调查,获得这种结果是纯粹的全球计算成绩因为他们没有反应到多个离散的物品。他们的主要缺点是,它是不清楚一个人做出判断症状的总体水平,健康状况或治疗的效果。
全球的结果提供了一个吸引人的属性的数量。如果设计和正确使用,他们可能会提供一个衡量的总体影响疾病或对治疗的反应2,36- - - - - -39。这可能是特别有用,当治疗有多种有益的行动。全球的结果也可能是比具体的结果对治疗更敏感,因为他们有可能一起聚合多个小的影响。每个治疗效果本身可能不是很大,但时见面成了重要的利益与其他效果。
全球分数可能在另一个方面是有用的。高层的结果,因此他们可能会接近结构相关的病患和医生。因此,概念如“值得的”改善运动耐量或减少症状可能更容易概念化FEV比一个有价值的改善1。后者几乎没有直接或明显的价值一个病人,不像运动性能或降低呼吸困难,每一个都有一个内在价值。因此,FEV的改善1只能被认为是值得的,因为它与其他措施的改善临床结果。
当使用全球测量结果,重要的是要认识到,它的作用是总结和汇总。它可以证明发生了变化,并提供临床评估这一变化是否显著,但它可能不会识别机制。在这方面,它应该用于假设一代而不是假设检验。
计量属性
最基本属性的任何结果是衡量生物的能力或行为变量问题,通常称为有效性。结果必须具备其他重要属性,如果它是有用的,包括病人之间的能力来检测疾病水平的差异(区别的能力)和变化在病人(评价能力)。许多生理测量这两个属性,但似乎这与问卷调查并非总是如此。例如,一些问卷设计在很大程度上区别的特性,如SF-36,医学研究委员会呼吸困难40基线呼吸困难指数41和加州大学圣地亚哥气短问卷6。这些可以定义的患者人群的严重性级别变量下的问题,但可能对有价值的变化。其他调查问卷的设计主要是检测变化,如慢性呼吸道问卷(CRQ)42和过渡呼吸困难指数41。这些仪器敏感变化但可能牺牲为代价的能力区分严重水平在不同的患者。然而,某些措施的结果似乎都有识别力的症状和评价属性,比如SGRQ。
的问卷调查,旨在能够响应治疗干预,仪器的效用取决于三个附加属性:可靠性、仪器的能力来执行相同的方式在不同的设置不同的运营商;重复性、测量时的稳定性测试条件和病人是稳定的;和敏感性,发现变化的能力8,43,44。后者财产可能在一定程度上依赖于另外两个属性之间的权衡。例如,测量是可靠的,因为它有非常广泛的类别的反应和高重复性可能由于缺乏敏感性差精度;它不能检测微小的变化或区分小差异。参数,最清楚地定义了一个结果的有用性是其信噪比(即。灵敏度比可重复性)45。一个高度敏感的结果将只有可靠的实际参考价值。
测量结果的意义
测量结果可以用来提供一个方法,评估治疗的价值或价值。会发生这样的情况,获得的结果与一个结果获得意义。这样的意义需要参考点测量的结果可以比较。可能的最大和最小值提供这样的锚点和额外的指导的价值可能会连接到一个特定的结果46,47。
的根本重要性区分统计学意义和临床意义。前的大小取决于研究的规模效应。小影响可能呈现统计上显著的研究是否足够大。临床意义是一个更加有用的概念但很难定义和测量10。价值判断总是需要在某个阶段建立阈值为临床上显著的影响或最低临床上重要的区别。这样的判断是否需要被验证的结果生活质量得分或生理指标。
为临床意义建立阈值时,有必要prespecify用于评估的标准大小变化的一个结果会是什么判断临床意义重大。这些标准还需要选择其他的结果作为一个参考标准,什么是临床意义10。这些引用包括病人/医生全球判断,临床上重要改变另一个临床变量和预测未来的事件(如。死亡、急性加重和住院)。
这可能并不总是必要的,甚至是一个有价值的企业,生产的阈值为所有结果用于慢性阻塞性肺病的临床意义。虽然它可能会产生可靠的估计FEV临床上重要的阈值的变化1在COPD患者中,这样做值得吗?结果用于建立标准临床显著改善慢性阻塞性肺病本身就可以以一个临床试验,以及FEV之间的关联程度1这些结果仅仅是温和的,这样一个临床FEV的阈值1只会是一个弱代理临床结果的阈值。
问题建立阈值对临床意义是复杂的,详细综述了别处10。阈值的6分钟步行距离48,CRQ49和SGRQ50可用,但重要的是欣赏这些意味着估计获得病人组。这些阈值是有帮助的,但是他们应该只使用指示性值,不是刚性或高精度的界限,这是值得一个病人,这不是10。
测量标准化
测量的目的是对比或在患者测试趋势或治疗效果。这些比较只能是有效的,如果所有测量都在完全相同的方式。
一些生理指标,如FEV1,表达在商定的标准单位和充分性的标准测量。这种标准化的结果,多年的习惯,实践和国际协议。相比之下,心理学有很多尺度测量抑郁,但没有一个是公认的,因此没有标准的计量单位。说,一个或两个抑郁量表现在广泛应用于呼吸系统药物,一个例子是医院焦虑和抑郁量表51。然而,这将是一段时间成为一个特定的规模事实上的标准。
“健康、生活质量测量”的概念提供了一个标准化的挑战2,10。生活也可能是丰富多彩的捕捉标准化在个体生活质量影响,甚至在大多数社会限制的慢性阻塞性肺病患者。例如,不能玩孙子可能是一个重要的因素在许多慢性阻塞性肺病患者的生命,但通常,原因与健康无关可能限制这一活动。结果,一个项目的调查问卷需要措辞的”如果你有适当的岁孙子与你希望玩但是不能这样做仅仅因为呼吸困难或疲劳,请检查这个盒子。“这复杂的项目,条件和具体要求,可能可重复性低,肯定会给开发人员的问卷的问题如何处理“不适用”评分系统反应。此外,项目的存在“不适用”减少了物品的数量,可以使用一些病人,因此,仪器的精度。
在临床试验中,所有的测量应该使用一种乐器,是适当的任务。每个病人必须使用一个标准化的评估问卷适合每一个人都被评估。在这种背景下,标准化意味着所有项目的问卷是很常见的(至少是潜在地)对所有患者的疾病。这个项目选择过程的结果是最终的分数以人群为基础的估值健康或许无法准确地反映任何个人的实际健康损害。这是在没有办法与FEV的使用不同1表示为一个百分比的年龄,性别,身高,race-matched预测值来评估个体病人的气道阻塞程度。这样的估计是基于人口不规范和病人的发病前的状态。以此类推,健康状况问卷的项目是那些反映的COPD患者的疾病在人群中。
标准化也应该适用于测量症状。日记卡已经使用了多年的结果是哮喘和他们现在正在用于慢性阻塞性肺病。这样的日记是用来计算的数据也意味着症状评分和计算派生参数如“无症状日”在哮喘和慢性阻塞性肺病的“糟糕的日子”。都是潜在有价值的测量,但没有共识(也许在一个给定的制药公司除外)关于措辞的响应类别和数量的日记。这很重要,因为最近的一项研究表明,一个日记卡问题,措辞来解决哮喘症状的程度,产生更严重的平均评分超过14天比解决类似的问题在同一个日记哮喘对日常生活的影响52。日记卡也被用来识别前瞻性地发作53,但是,没有共识关于变化的程度和持续时间(或FEV症状1或呼气流量峰值),构成一个恶化。针对这些事件的重要性,增加升值协议识别的方法很快就必须寻求一个恶化的发生。
基于用途的措施
除了进行经济分析54,实用为基础措施解决的一些问题在慢性阻塞性肺病测量结果。比如,他们帮助解决临床的担忧与统计改进42。此外,这些基于用途的措施,使试验结果的所有治疗慢性阻塞性肺病治疗的医疗保健15,55。
实用为基础、健康结果的措施把健康水平连续从死亡(0.0)到完美的健康(1.0)。这些措施代表显著细化传统生存分析,认为每个二进制(活着还是死了)的方式。效用权重可以用来表示沿着这连续的健康水平,通常应用于“质量调整”存活时间29日。基于实用措施融入临床效果通过展示观察差异映射之间的连续最优函数和死亡。例如,慢性阻塞性肺病患者参与康复计划提高0.04∼单位。这是4/100的死亡之间的距离和完美的健康。这些数字可以用来估计质量调整生命年,以及利益的持续时间34。
三种最常用的方法是EuroQol (EQ) 5 d56,卫生公用事业指数(回族)57,QWB25。EQ-5D已经由一个协作组来自西欧称为EuroQol组56。方法验证的邮政调查在英国,瑞典和荷兰。最近版本的EQ-5D现在用于大量的临床和人口研究58,59。
回族,被芬尼发达在加拿大et al。60地图偏好使用多属性模型,972000年可能状态到0.0 - -1.0连续。回族已经使用在许多人口和临床研究。
QWB几个组件集成到一个分数25,61年,62年。患者根据目标水平的功能进行分类,由流动的规模,体育活动和社会活动。一旦可观测的,行为水平的功能分类,每个人是健康的放置在0.0 - -1.0范围内,优化函数和死亡之间的连续体。
这三个方法验证,可用于慢性疾病患者的研究结果。最重要的是,如果研究者打算执行所需的方法是成本效用的研究54。
结论
测量方法与健康有关的生活质量和人口健康测试和进展为COPD患者结果的措施。这些措施有助于人口监测、临床试验和资源分配。
选择一个结果应该反映研究的目的。基本的生理机制的研究或药理功效应该使用特定的结果,评估生物变量尽可能接近的行动或过程。在研究结果感兴趣的多个效果或机制的产物,所选的结果应该收敛点或结束的一系列影响。结果应该是临床相关,并提供一定程度的总体疗效和临床价值的估计。目前,临床结果,如呼吸困难、运动能力和健康状况,可以提供最接近这个理想方法。
几个优秀的生活质量措施是专门为慢性阻塞性肺疾病患者的评估结果。除了这些措施,其他更通用的方法可用于评估结果在临床试验中。基于实用措施提供经济分析导致的额外优势,这些方法应该得到仔细考虑慢性阻塞性肺疾病患者的临床研究。
- 收到了2002年8月21日。
- 接受2003年2月20日。
- ©人期刊有限公司