新五级版本EQ-5D (EQ-5D- 5l)的开发和初步测试

m .牧人^1，2，3.，
c . Gudex⁴，
答:劳埃德⁵，
曼氏金融。詹森⁶，
p .类型⁷，
d·帕金⁸，
g . Bonsel⁹＆
x十二月¹⁰

生活质量研究体积20.，页面1727 - 1736 (2011）引用本文

37 k访问
3279引用
71Altmetric
指标细节

摘要

目的

本文介绍了新型5级EQ-5D (EQ-5D- 5l)健康状态测量仪。

方法

EQ-5D目前在五个维度中使用三个严重程度来衡量健康。EuroQol小组成立了一个工作组，通过增加严重级别来寻找提高仪器灵敏度和减少天花板效应的方法。这项研究在英国和西班牙进行。采用响应标度法确定每个维度5个级别的严重程度标签。焦点小组被用来调查新版本的外观和内容有效性，包括由这些版本生成的假设健康状态。

结果

选择大约25、50和75百分位的标签产生了两个可选的5级版本。焦点小组工作显示，在EQ-5D功能维度中，“轻微-中等-严重”问题的措辞略有偏好，锚定为“没有问题”和“无法做到”。在疼痛/不适和焦虑/抑郁维度中使用了类似的措辞。与会者很好地理解了假设的健康状况，但强调健康状况需要在内部保持一致。

结论

EQ-5D的5级版本已由EuroQol集团开发。需要进一步的测试来确定新版本是否提高了灵敏度并减少了天花板效应。

简介

EQ-5D是描述和评估健康状况的通用工具。它基于一个描述性系统，从5个维度定义健康:行动能力、自我照顾、日常活动、疼痛/不适和焦虑/抑郁[1］．每个维度有3个响应类别，分别对应于没有问题、有些问题和极端问题。该仪器是为自我完成而设计的，受访者还在访谈当天以0-100哈希标记的垂直视觉模拟量表(EQ-VAS)对他们的整体健康状况进行评分。EQ-5D已在普通人群和患者样本中广泛测试和使用，并已被翻译成130多种不同的语言版本[www.euroqol.org］．

EQ-5D的设计目的是测量健康状况的下降。该仪器的大量使用表明，它可能会受到上限效应的影响，特别是在一般人口调查中使用时，但在一些患者群体环境中也是如此[2- - - - - -8］．因此，它在测量健康状况的微小变化方面可能存在问题，特别是在病情较轻的患者中。鉴于这些可能的局限性，并受到临床领域需求的刺激，EuroQol集团决定探索改善EQ-5D测量性能的方法。

2005年，在EuroQol小组内成立了一个工作队，调查提高仪器对中小健康变化的敏感性和减少上限效应的方法。最初的讨论集中在通过增加额外维度来扩展描述性系统，以及扩大每个维度的严重程度级别[9］．工作组决定，新版本的EQ-5D不应该改变维度的数量。使用EQ-5D 25年的经验证明，最初的尺寸选择是合理的，尽管在某些领域所包含的尺寸范围可能不是最佳的[10，11］．此外，EuroQol集团在使用当前五维模型测量和评估健康方面有丰富的经验，保留该模型将使现有EQ-5D更容易过渡到新版本。

就每个维度的级别数量而言，EuroQol集团成员先前发表的研究表明，EQ-5D的5级原型版本可以显著提高可靠性和灵敏度(区分能力)，同时保持可行性并可能减少天花板效应[12- - - - - -15］．5级描述系统的选择也得到大量心理测量学文献的支持[16- - - - - -18］．因此，新版本的EQ-5D应该在现有的五个EQ-5D维度中包括五个严重级别，因此新版本将被称为EQ-5D- 5l。现有的EQ-5D将被重新命名为EQ-5D- 3l，这是它在本文其余部分将被引用的方式。

本研究的目的是为EQ-5D-5L选择严重程度标签，并测试结果仪器的表面和内容效度。这项研究同时在英国和西班牙进行。

方法

EuroQol小组工作组建议并行开发英语和西班牙语版本，它们也可以作为进一步翻译和改编扩展版本的根语言。

这项研究分为两个阶段。在2007年6月至11月进行的第一阶段，确定了新级别的潜在标签池，并在与外行受访者的方便样本进行面对面访谈后，从该池中选择了5级版本的临时标签。在2008年5月至7月进行的第二阶段，在健康参与者和患有慢性疾病的参与者的焦点小组会议上测试了两个备选5级系统的面孔和内容效度。第二阶段还用于测试基于5级版本的一系列健康状态的表面有效性。研究的两个阶段采用了不同的受访者群体。

两个阶段的参与者都被招募，以确保具有广泛的社会人口特征。在反应评估阶段，英国的参与者是通过当地报纸广告、当地社区广告和现有的参与者数据库招募的。西班牙的参与者是从当地学校的家长和患者协会中招募的。患者焦点组主要包括患有关节炎、糖尿病或哮喘的患者。在所有小组中，都要求具备足够的英语或西班牙语的书面和口头流利性。

在研究的两个阶段，所有参与者都获得了书面知情同意。

阶段1:响应扩展

EQ-5D-5L的潜在标签是通过对现有健康相关生活质量仪器的回顾、对反应量表的文献回顾、手工搜索字典和辞典，以及对目标语言母语者的非正式访谈来确定他们如何描述不同严重程度的健康问题。以英文和西班牙文进行了同样的程序，并在可能的情况下设法以这两种语文使用相同的措词。包含在初始池中的标签显然必须符合EQ-5D-3L中使用的词汇结构，例如“我在做我的日常活动时没有问题”和“我在做我的日常活动时有一些问题”。

为了从新水平的标签池中选择标签，面试官管理的响应缩放练习类似于以前的研究中使用的方法[14，19，20.]来估计每个标签所代表的严重程度。在这个练习中，受访者被展示了一个评分量表，其形式是一个垂直的、哈希标记的40厘米视觉模拟量表(VAS)，终点为0和100，用于评分标签严重程度的视觉辅助。对于机动性、自我护理和日常活动维度，使用了同一组标签。面试官在量表的底部(0)放置了一张标签为“没问题”、“没有疼痛/不适”或“没有焦虑/抑郁”的卡片作为下锚，在刻度表的底部(100)放置了一张标签为“无法”、“我能想象到的最严重的疼痛或不适”、“我能想象到的最焦虑或抑郁”的卡片作为上锚。然后，以准随机的顺序向受访者单独展示池中的其他标签，并要求他们在0到100之间分配一个分数，以表明与较低和较高锚相关的标签严重程度。

面试官记录了所有的分数，当受访者对某一特定维度的所有标签进行评分时，面试官将它们与VAS一起按等级顺序排列，并要求受访者审查排名，并做出他或她认为必要的任何更改。如果标签在这一点上被重新排序，被调查者被要求为相关标签分配一个新的分数。最后的分数被记录在一本答案小册子上。对每个维度重复缩放任务。在结束卡片之前，受访者被问及是否有任何标签听起来不寻常，或者不应该用于特定的维度。

受访者在这五个方面都对标签进行了评分。三个功能维度(活动能力、自我照顾和日常活动)总是被疼痛/不适和焦虑/抑郁维度所穿插，因此受访者不会连续地对相同的标签类型进行评分。在对实际标签进行评分之前，受访者根据整体健康水平执行了一项练习任务，以适应研究要求。年龄、受教育程度、主要活动、当前健康问题治疗的使用情况等数据，连同现有的EQ-5D-3L描述系统和EQ-VAS，在响应缩放任务后收集。

在主要响应缩放任务之前，进行了一个试点测试，以测试研究程序和材料。根据初步研究的结果，从初始池中删除了一些标签，以实现响应扩展任务更易于管理的数量。特别是，任何使用额外修饰语的标签，如“非常”或“相当”，以及任何被认为过于口语化或语言水平过高的标签都被删除了。经过初步测试，得出的结论是，对于单个受访者来说，每个维度的可行限制约为10-12个标签。

通过计算平均值和中位数以及相应的标准差和四分位差(IQR)来分析对缩放任务的响应。标签是根据数据收集开始前确定的标准选择进行进一步测试的。其中包括选择接近或位于VAS第25、50和75百分位的标签，以确保各维度的一致性和与描述系统中的措辞的一致性。在决定将哪些标签带入下一阶段时，没有进行标签分数的定量比较;中位数分数被简单地用作指南，以确定哪些标签最接近第25、50和75百分位。标签也必须用口语化语言。在研究过程中，工作队在几次会议上讨论了标签的选择及其适当性。

阶段2:测试备选5级版本的外观和内容有效性

响应缩放任务的结果导致了两个(而不是一个)中间结果，英国英语和西班牙语的替代5级版本(有关解释，请参阅结果)。研究的第二部分旨在评估这两个版本的易用性、理解性、解释性和可接受性，并使用这些结果来决定验证工作的最终确定版本。这部分研究的另一个目的是评估由5级描述系统产生的一些假设健康状态的表面有效性。为此目的，在每个国家的8个焦点小组(共16个小组)对两个替代版本进行了测试;其中4人是健康的参与者，4人正在接受健康状况的治疗。

小组由一位经验丰富的主持人领导，会议录音并转录以供分析。所有组均遵循预先准备的脚本。每个组的所有参与者首先完成EQ-5D-5L的选项1或选项2(取决于他们被分配到的组)，然后是EQ-VAS。然后，参与者被要求回顾他们的答案，以及他们在完成调查时的想法。进一步的问题被用来更详细地探究他们对问卷的反应，特别是他们对所使用的严重标签的反应。然后，参与者在被要求完成补充的替代方案2或替代方案1之前，提供了社会人口信息，之后，他们的反应进行了进一步的小组讨论。最后，参与者被问及他们对替代描述系统的偏好。版本1和版本2的给药顺序在两组之间交替进行，以控制可能的排序效果，并且将组随机分配到不同的顺序。

在焦点小组的最后阶段，参与者讨论了一组假设的健康状态，这些状态是通过使用替代的5级版本将5个维度的不同级别结合起来产生的。表中显示了测试的运行状况状态示例1．参与者回顾了这些状态，并被要求评估它们的表面有效性、可解释性和合理性。其余组也采用了相同的程序，只是不同版本问卷的执行顺序相反。

表1在第二阶段焦点小组中测试的两个健康状态的例子

全尺寸表

焦点小组是使用结构化的“脚本”或指南进行的，因此分析最初是基于分组和对比参与者针对每个具体问题的陈述。专题内容分析[21用来更深入地探讨问题，并检查其他非脚本语句和表达的文本。

结果

响应比例

在西班牙，为了获得40人的最终样本，最初邀请了53人参与。在同意参加面试的40人中，有3人在面试当天没有参加，最后留下了37人的样本。在英国，采用的招募策略得到了公众的良好反应，所以所有有兴趣参与这项研究的人都被邀请参加，直到招募了40名参与者。40名参加者均如期参加面试。在英国和西班牙参加反应量表测试的人的样本特征见表2以及对两国的参考值。在这两个国家中，参与者按年龄和性别平均分布，但就教育水平而言，西班牙的样本中包括更多受教育程度较高的人，在这两个国家中，受教育程度较高的样本比例大大高于一般人口参考值。

表2响应缩放任务中参与者的样本特征与英国和西班牙一般人口数据进行比较

全尺寸表

对机动性、自我护理和日常活动三个维度的响应缩放任务的结果见表3.以及表中疼痛/不适和焦虑/抑郁的维度4．两国在所有维度上的标签排序相似，同一标签的中位数评分在不同维度和两种语言之间基本相似。例如，“轻微”和“水平”在三个功能维度上的中位数得分为15分(除了西班牙在自我护理维度上的得分为20分);同样，“严重”和“严重”在功能维度上的得分都在82到88之间，“温和”和“温和”在两种语言的所有维度上的得分中值都在40到50之间。一些标签的差异更大，比如“mayores”和“major”在功能维度上，“quite”和“bastante”在焦虑/抑郁维度上，但这些标签都不在最终选择的标签之列。在缩放方面，最接近中点的标签是“中等”。从逻辑上讲，“适度”这个标签描述的是问题的性质，而不是问题的数量(例如“少量”)。因此，决定选择与此一致的其他标签。

表3英国和西班牙流动性、自我照顾和日常活动标签的中位数(IQR)得分比较(括号中为西班牙标签)

全尺寸表

表4英国和西班牙疼痛/不适和焦虑/抑郁标签的中位数(IQR)得分比较

全尺寸表

基于这一决定，确定了两个5级版本:在功能维度的情况下，英国测试的替代方案是“没有问题-小问题-中等问题-严重问题-不能”和“没有问题-轻微问题-中等问题-严重问题-不能”。在疼痛/不适和焦虑/抑郁维度中，测试的替代标签是“轻度”和“轻微”作为第二级，“严重疼痛”或“非常疼痛”和“严重”或“非常”焦虑或抑郁作为第四级。西班牙也采用了类似的标签选择过程。

焦点小组

焦点组的样本特征见表5．两国之间的主要区别在于教育水平，英国样本的教育水平要高得多;英国样本中93.3%的健康参与者和66.7%的患者在毕业后继续接受某种形式的高等教育，而西班牙样本中这一比例分别为33.3%和21.0%。

表5焦点组受访者样本特征;健康参与者和患者组，英国和西班牙

全尺寸表

在西班牙和英国，参与者普遍认为这两个替代版本都很容易理解和完整，给出了诸如“问题很好地制定和具体”之类的评论。关于新的严重程度标签，与会者评论说，“它们是非常明确的点，毫无疑问，你在每个维度上都从少到多”，并且“似乎涵盖了所有不同的级别”。一些西班牙受访者认为，有些标签可能很难区分，尤其是在较低端的标签。然而，针对每个标签所反映的问题类型的反应比例测试和评论的结果表明，大多数受访者完全能够区分所使用的不同标签。

不同的版本并不是同样有吸引力，在两个国家的参与者都倾向于选择版本2，它使用“轻微”、“中等”和“严重”作为流动性、自我护理和日常活动维度的中心水平，而不是“轻微”、“中等”和“严重”问题。后者通常被认为不那么口语化。一个典型的评论是，你可能会用它们“和医生或其他人交谈……但我无法想象对一个走路有小问题的朋友或家人说”。“轻微”和“严重”被一名参与者描述为“常见语言”，“不用多想就能引发回应”。少数参与者确实更喜欢“小调”和“大调”，这表明这是“更现代的语言”;其他参与者认为，不同的标签组之间的差异很小。

在疼痛/不适和焦虑/抑郁维度，参与者对标签的偏好不是很清楚。因此，在英国和西班牙版本中，决定保持与功能维度相同的比例(“轻微”，“中等”，“严重”)。

参与者关于他们解释严重程度标签的方式的评论表明，标签在预期的测量水平上运行良好。例如，在描述自我护理方面的“小问题”时，一位患者说:“也许你背部肌肉拉伤，很难洗头。”当提到行动能力的“中度问题”时，参与者解释说，“即使我必须使用拐杖四处走动，我仍然可以自己站起来，我可以四处走动”和“由于我的膝盖，我在走路方面有中度问题。它描述得很好，不多也不少。”另一方面，为了描述这个维度的“严重问题”，例子包括那些因为关节炎或椎间盘突出而在走路时经历巨大疼痛的人。

基于新标签系统的健康状态测试

参与者发现，无论使用哪种版本，都相对容易理解健康状态。事实上，评论更多地集中在健康状况的内容上，特别是他们认为健康状况存在矛盾或缺乏现实主义的地方，而不是健康状况的措辞方式。例如，一位受访者表示，对她来说，“洗衣服是日常活动，因此被包括在日常活动中[所以这两个维度不应该是分开的)”。另一方面，所使用的标签并不妨碍了解健康状况，参与者一般都能很容易地区分健康状况。在这个意义上，5级描述系统的两个替代版本似乎都同样有效，尽管当被明确询问时，大多数参与者在前三个维度上更喜欢“轻微-中等-严重”的替代版本。

讨论

本文报告了为西班牙开发新的5级英语和西班牙语版EQ-5D的过程和结果。通过使用响应规模和焦点小组，有可能开发出英国英语和西班牙语的5级版本，这些版本已经证明了初始内容和表面有效性。反应比例计算的结果表明，所选标签在整个健康连续体中分布良好，在两个国家的分布情况相似。

虽然EQ-5D的5级版本之前已经开发和应用，但它们是由个别小组成员或研究团队准备和测试的实验版本[12- - - - - -15］．这里报告的英国英语和西班牙语版本是EuroQol集团官方倡议的第一个结果，它们应该被认为是最终版本，依赖于进一步的有效性、可靠性和对变化的敏感性测试。会议还利用这个机会协调了文书内的措辞，例如，将行动不便维度中健康状况极差的措辞改为“无法走动”，而不是“卧床不起”。

至于在每个维度中使用5个层次的决定，这个问题被详细讨论，因为它也可以跨领域使用不同数量的层次(事实上，EQ的第一个版本是一个6域仪器，其中3个领域有3个层次，其他有2个层次[22])。两种论点导致选择了统一的五级文书。首先，似乎没有自然或明显的理由来应用不同的等级:当前EQ的所有领域都指的是“不可数”实体，其中所有范围都必须用一般的分级术语来指代。这些可以基于功能障碍/残疾的频率或强度，但原则对所有情商领域是相同的。同样地，我们也没有先验的偏好，试图在一个特定的领域比其他领域更多地(或更少地)歧视。第二，建立一个平等的制度有明显的实用性。自我报告自己的健康状况(用于描述)和权衡任务(用于评估)可以说更容易解释和理解:使用不同数量的级别可能会导致“缺失”级别的问题。跨维度标签选择的一致性(尽可能使用“轻微”、“中度”、“严重”)应通过便利应答者解释、帮助构建健康状况和简化翻译过程来简化使用问卷的操作方面。我们意识到，“轻微”、“中等”和“严重”等术语在解释上可能存在文化内部和文化间的差异，因此，我们修改了5L版本的翻译程序，以更彻底地测试受访者对这些术语的解释。

在英国和西班牙，响应缩放任务的结果基本相似，分配给标签的分数在各个维度上通常只有最小的变化。例如，无论国家和维度如何，“中等”的反应缩放得分总是在40到50之间。这些结果表明在响应缩放评分中有一定的稳健性。

同样，尽管EQ-5D-5L中使用的大多数标签可以被认为是口语化的，但一些焦点小组参与者的评论表明，某些术语(特别是“温和”)在这种情况下听起来不寻常。另一方面，与响应缩放练习获得的结果的一致性表明，受访者实际上在理解所提到的问题的水平方面没有困难。也很难找到任何其他合适的术语接近严重连续体的中心点。新EQ-5D-5L的定量测试将为所选标签的适当性提供额外的证据。

本研究为测试EQ-5D-5L衍生的健康状态的可理解性和表面有效性提供了机会。同样，参与者理解新标签意在描述的问题的水平没有什么困难;相反，大多数评论提到了两国参与者认为不太可能或自相矛盾的健康状况。例如，一些受访者认为，在同样的健康状态下，“洗衣服没有问题”和“不能走路”会让人感到不舒服。然而，这更多的是属性之间关系的问题，而不是属性级别内的描述，因此很可能与EQ-5D的3级和5级版本有关。为了考虑到这类评论，EuroQol小组一直在讨论在未来对5级版本进行估值研究之前使用这种可信性测试和认知汇报。

之所以选择西班牙语和英语作为EQ-5D-5L初始开发的两种语言，是因为它们是世界上使用最广泛的两种语言，而且在一定程度上，它们可以作为翻译成许多其他语言的根语言。法国和中国版本的EQ-5D-5L最近也使用类似的方法开发。

限制

当前研究的一个局限性是，由于实际原因，没有评估反应尺度评分的测试-重测可靠性。此外，我们也注意到，在这类比例测试中，没有一种主要仪器进行了测试-再测试[19，20.］．该研究的另一个局限性可能是使用的反应量表方法，其中标签最初是独立评定的，只有VAS锚点提供上下文。虽然受访者后来有机会纠正他们认为根据他们提供的评级对标签进行排名时不一致的评级，但如果标签最初是在其他标签的背景下进行评级，例如使用配对选择练习，则值可能会有所不同。尽管如此，调查结果在各个维度和国家之间是相当一致的，在焦点小组中具有良好的表面效度，这表明最终的排序是受访者可以接受的。进一步的限制是，我们使用方便样本进行响应标度测试，这些样本不能代表全国人口，而且所使用的样本量相当小，尽管与类似研究一致[20.，23］．这些问题可能会限制研究结果的普遍性。最后，在反应量表测试和焦点小组中，接受过高等教育的参与者比例都很高。这可能会导致更一致的结果和更大的接受措辞的情况下，如果样本包括更多的受访者在较低的教育水平。今后这类研究的目标应该是纳入更均衡、更有代表性的样本。

开发的下一步将是在一般人群和临床样本中现场测试EQ-5D-5L和EQ-5D-3L，以评估EQ-5D-5L的心理测量特性(敏感性，有效性和可靠性)，并将它们与EQ-5D-3L进行比较。还需要进一步的工作来确定严重性标签的跨文化等效程度。为此，需要使用等概率选择方法适当构造样本，这些样本足够大，以研究本文提出的问题。此外，还需要根据新的大规模评估工作为EQ-5D-5L开发价值集。这些估值工作的准备工作正在进行中。

总之，新的EQ-5D-5L的官方版本现在以英国英语和西班牙语存在，并且翻译已经在另外25个国家使用。英国英语和西班牙语的西班牙版本已经显示了初始内容和表面效度，尽管进一步的心理测试不仅需要效度和信度，还需要对EQ-5D-5L的变化进行敏感性测试，这是开发EQ-5D-5L估值集的必要前提。预计EQ-5D-5L将比EQ-5D-3L具有更好的辨别能力和变化敏感性，以及更小的天花板效应。

参考文献

布鲁克斯(1996)。EuroQol:当前的比赛状态。卫生政策,3753 - 72。
PubMed 文章中科院谷歌学者
沙利文，P. W.，劳伦斯，W. F. & Ghushchyan, V.(2005)。一个基于美国慢性病评分的国家偏好目录。医疗、43, 736 - 749。
PubMed 文章谷歌学者
Badia, X.， Schiaffino, A.， Alonso, J. & Herdman, M.(1998)。在加泰罗尼亚一般人群中使用EuroQol 5-D:可行性和构建有效性。生活质量研究，7, 311 - 322。
PubMed 文章中科院谷歌学者
Devlin, N.， Hansen, P.， & Herbison, P.(2000)。自我报告健康状况的差异:来自新西兰的调查结果。新西兰医学杂志113, 517 - 520。
PubMed 中科院谷歌学者
约翰逊，j.a.，皮卡德，a.s.(2000)。加拿大艾伯塔省一般人口调查中EQ-5D和SF-12健康调查的比较医疗、38, 115 - 121。
PubMed 文章中科院谷歌学者
Kind, P.， Dolan, P.， Gudex, C.， & Williams, A.(1998)。人口健康状况的变化:联合王国全国问卷调查的结果。BMJ,316, 736 - 741。
PubMed 文章中科院谷歌学者
罗，N.，约翰逊，J. A.，肖，J. W.，菲尼，D.，库恩斯，S. J.(2005)。美国一般成年人口自我报告的健康状况，由EQ-5D和健康效用指数评估。医疗、43, 1078 - 1086。
PubMed 文章谷歌学者
王，H.，金，D. A. &毛拉希，J.(2005)。中国人口健康相关生活质量的变化:来自中国北京EuroQol研究的结果生活质量研究，14, 119 - 132。
PubMed 文章谷歌学者
李志强，李志刚(2005)。描述系统中的层数。在P.金德、R.布鲁克斯和R.拉宾(编著)中，EQ-5D概念和方法:发展历史(页29-33)。多德雷赫特:施普林格。
章谷歌学者
Espallargues, M.， Czoski-Murray, C. J.， Bansback, N. J.， Carlton, J.， Lewis, G. M.， Hughes, L. A，等(2005)。年龄相关性黄斑变性对健康状况效用值的影响。眼科调查与视觉科学，46, 4016 - 4023。
文章谷歌学者
卡普兰，r.m.，塔利，S.，海斯，r.d.，菲尼，D.，加尼茨，t.g.，帕尔塔，M.等人(2011)。白内障和心力衰竭患者的五个基于偏好的指标对变化的反应并不相同。临床流行病学杂志，64, 497 - 506。
PubMed 文章谷歌学者
杨森，M. F.， Birnie, E.， Haagsma, J. A. & Bonsel, G. J.(2008)。比较标准EQ-5D三级系统和五级版本。健康价值,11, 275 - 284。
PubMed 文章谷歌学者
Pickard, a.s.， De Leon, m.c.， Kohlmann, T.， Cella, D.， & Rosenbloom, S.(2007)。在癌症患者中，标准EQ-5D与5级版本的心理测量比较。医疗、45, 259 - 263。
PubMed 文章谷歌学者
杨森，M. F.，伯尼，E.和邦塞尔，G. J.(2008)。根据2种方法对标准EQ-5D三级系统和五级版本的级别描述符进行量化。生活质量研究，17, 463 - 473。
PubMed 文章中科院谷歌学者
皮卡德，A. S.，科尔曼，T.，杨森，M. F.，邦塞尔，G. J.，罗森布鲁姆，S.和赛拉，D.(2007)。评估响应系统之间的等效性:Rasch模型在3级和5级EQ-5D中的应用。医疗、45, 812 - 819。
PubMed 文章谷歌学者
李西兹，葛林。(2001)。标度点数量对可靠性的影响:蒙特卡罗方法。应用心理学杂志，60, 10 - 13。
文章谷歌学者
西上，S.和鸟居，Y.(1970)。连续正态变量分类对积矩相关性的影响。日本心理学研究，13, 45-49。
谷歌学者
普雷斯顿，C. C. &科尔曼，M.(2000)。评等量表的最佳回应类别数:信度、效度、甄别力、受访者偏好。Acta Psychologica,1041 - 15,。
PubMed 文章中科院谷歌学者
Szabo, S.(1996)。世界卫生组织生活质量(WHOQOL)评估工具。在B. Spilker (Ed.)中，临床试验中的生命质量和生命与药物经济学(页355 - 362)。费城:Lippincott-Raven。
谷歌学者
凯勒，S. D.，威尔，J. E.， Jr.，甘德克，B.，艾伦森，N. K.，阿隆索，J.，阿波隆，G.等人(1998)。测试广泛使用的响应选择标签翻译的等价性:来自IQOLA项目的结果。国际生活质量评估。临床流行病学杂志，51, 933 - 944。
PubMed 文章中科院谷歌学者
Grbich,卡罗。(1999)。卫生定性研究:导论．圣伦纳兹，n.s.w.: Allen & Unwin。
谷歌学者
Rabin, R. & de Charro, F.(2001)。EQ-5D: EuroQol集团的健康状况测量。《医学年鉴》33, 337 - 343。
PubMed 文章中科院谷歌学者
斯凯文顿，S. M. &塔克，C.(1999)。卫生保健中跨文化使用的反应量表设计:来自英国WHOQOL开发的数据。英国医学心理学杂志72(Pt 1)， 51-61。
PubMed 文章谷歌学者

下载参考

致谢

这项研究是由EuroQol基金会资助的。

利益冲突

所有作者目前都是EuroQol集团的成员，目前的研究由EuroQol集团提供资金支持。

188滚球软件

本文根据创作共用署名非商业许可协议发布，该协议允许在任何媒介上进行任何非商业使用、分发和复制，前提是要注明原作者和来源。

作者信息

从属关系

Insight咨询与研究，西班牙Cami Ral 266º7ª，08301,Mataró
m .牧人
CIBER en Epidemiología y Salud Pública (CIBERESP)，巴塞罗那，西班牙
m .牧人
卫生服务研究股，城市研究所'Investigació Mèdica (imim -德尔马医院)，西班牙巴塞罗那
m .牧人
丹麦欧登塞大学医院内分泌科
c . Gudex
牛津成果，牛津，英国
答:劳埃德
EuroQol集团执行办公室，鹿特丹，荷兰
曼氏金融。詹森
联合王国约克大学卫生经济学中心
p .类型
NHS东南海岸，霍利，英国
d·帕金
围产期护理和公共卫生，荷兰鹿特丹伊拉斯谟医疗中心
g . Bonsel
卫生经济学和结果研究，IMS Health s.a.，巴塞罗那，西班牙
x十二月

作者

m .牧人

查看作者出版物

您也可以在PubMed谷歌学者
c . Gudex

查看作者出版物

您也可以在PubMed谷歌学者
答:劳埃德

查看作者出版物

您也可以在PubMed谷歌学者
曼氏金融。詹森

查看作者出版物

您也可以在PubMed谷歌学者
p .类型

查看作者出版物

您也可以在PubMed谷歌学者
d·帕金

查看作者出版物

您也可以在PubMed谷歌学者
g . Bonsel

查看作者出版物

您也可以在PubMed谷歌学者
x十二月

查看作者出版物

您也可以在PubMed谷歌学者

相应的作者

对应到m .牧人．

额外的信息

EQ-5D™是EuroQol集团的商标。所有EQ-5D产品均由EuroQol执行办公室(userinformationservice@euroqol.org)独家分销。

附录1

英国英语和西班牙语为西班牙版本的5级EQ-5D描述系统．

权利和权限

188滚球软件这是一篇开放获取的文章188滚球软件，根据创作共用署名非商业性许可协议(https://creativecommons.org/licenses/by-nc/2.0)，允许在任何媒介上进行非商业使用、分发和复制，前提是要注明原作者和出处。

转载及权限

关于本文

引用本文

赫德曼，M.，古德斯，C.，劳埃德，A.。et al。EQ-5D (EQ-5D- 5l)新五级版本的开发和初步测试。合格人寿保险20.1727 - 1736(2011)。https://doi.org/10.1007/s11136-011-9903-x

下载引用

接受：2011年3月24日
发表：2011年4月9日
发行日期：2011年12月
DOI：https://doi.org/10.1007/s11136-011-9903-x

关键字

与健康有关的生活质量
EQ-5D
发展
5级

摘要

目的

方法

结果

结论

简介

方法

阶段1:响应扩展

阶段2:测试备选5级版本的外观和内容有效性

结果

响应比例

焦点小组

基于新标签系统的健康状态测试

讨论

限制

参考文献

致谢

利益冲突

188滚球软件

作者信息

从属关系

相应的作者

额外的信息

附录1

附录1

权利和权限

关于本文

引用本文

分享本文

关键字