条文本

严重程度量表在预测社区获得性肺炎死亡率中的价值:系统综述和荟萃分析
免费的
  1. 尹k洛克12
  2. 郭俊成1
  3. Alagaratnam Niruban2
  4. Phyo K Myint12
  1. 1东安格利亚大学医学、卫生政策与实践学院,诺维奇,诺福克,英国
  2. 2医学理事会,诺福克和诺维奇大学医院,诺威奇,诺福克,英国
  1. 对应到尹k洛克博士,英国诺福克NR4 7TJ,诺维奇,东安格利亚大学,大臣大道,医学,卫生政策和实践学院;y.loke在{}uea.ac.uk

摘要

背景已有几种评分系统被用于预测社区获得性肺炎患者的死亡率。系统地回顾了常用风险分层量表的性质。

方法检索了MEDLINE和EMBASE(1999年1月- 2009年10月)的前瞻性研究,这些研究报告了放射学证实的社区获得性肺炎患者在4-8周时的死亡率。搜索的重点是肺炎严重程度指数(PSI)和三种主要的遏制(混乱,尿素氮,呼吸频率,血压)量表(遏制-65,遏制,CRB-65),测试性能基于“高风险”类别进行评估,如下:PSI IV/V级,遏制-65(得分≥3),遏制(得分≥2)和CRB-65(得分≥2)。随机效应元分析用于生成测试性能的汇总统计数据,受试者工作特征曲线用于预测死亡率。

结果筛选出402篇文章,检索到23项研究,涉及22 753名参与者(平均死亡率7.4%)。死亡率的诊断优势比分别为10.77 (PSI)、6.40 (CURB-65)、5.97 (CRB-65)和5.75 (CURB)。总体而言,PSI对死亡率具有最高的敏感性和最低的特异性,CRB-65是最特异性(但最不敏感)的试验,而CURB-65/CURB介于两者之间。死亡率的阴性预测值在试验中相似,范围为0.94 (CRB-65)至0.98 (PSI),而阳性预测值范围为0.14 (PSI)至0.28 (CRB-65)。

结论目前的风险分层量表(PSI、CURB-65、CRB-65和CURB)各有优劣。在死亡流行率低的人群中,所有四个量表对死亡率都有良好的负预测值,但在阳性预测值方面用处较小。

  • 临床流行病学
  • 呼吸道感染

数据来自Altmetric.com

请求的权限

如果您希望重用本文的任何或全部内容,请使用下面的链接,该链接将带您到版权清除中心的RightsLink服务。您将能够快速获得价格和即时许可,以多种不同的方式重用内容。

背景

在英国,社区获得性肺炎(CAP)是住院的常见原因,也是死亡的主要原因。1CAP的总死亡率各不相同,被诊断为严重肺炎的患者死亡率较高。2 - 5一种可靠的评估肺炎严重程度的方法可能有助于临床医生确定密切监测和积极治疗是否比保守治疗更合适,从而可能改善患者的分类或初步管理。然而,准确评估肺炎的严重程度可能具有挑战性,因此已经设计了一些基于预后因素的量表,以确定死亡风险高的患者,以及可能不需要密切关注的低风险患者。

最著名的量表是英国胸科学会推荐的CURB-65(意识混乱,尿素氮,呼吸频率,血压,年龄≥65岁)5以及源自美国的肺炎严重指数(PSI)。6CURB-65有不同的迭代版本,包括CRB-65,它可能特别适合社区使用,因为它依赖于临床病史和检查,不需要血液尿素测量,7以及将年龄作为其标准的一部分的CURB评分,从而减少了将实足年龄作为预后因素的强调。8

在本综述中,我们旨在系统地检索和评估PSI和三个主要迭代的遏制评分系统(遏制,CRB-65,遏制-65)的现有数据,以确定每个测试正确预测肺炎患者死亡率的能力。虽然我们知道在不同的环境下有大量的个体研究,但这些量表的比较表现尚未在荟萃分析中总结出来。

方法

搜索策略

使用Ovid SP搜索PubMed和EMBASE从1999年到2009年10月,使用术语(肺炎和(Sever*或Predict*或预后*)和(量表或评分或评估或指数)以及(死亡率或存活或死亡)和(社区获得性)。mp。所收录研究的参考文献被检查是否有其他相关文章,必要时联系作者以获得进一步信息。

合格标准

两名审稿人最初根据以下纳入和排除标准检查标题和摘要。

入选标准

  • 英文刊物出版

  • 最少100人参加

  • 前瞻性研究

  • 使用肺炎严重程度量表后报告患者预后

  • 社区获得性肺炎,可能包括疗养院的居民

  • 任意单一干预组满足纳入标准的随机对照试验;我们没有考虑比较不同抗生素的试验。

排除标准

  • 这项研究的参与者不到100人

  • 以社区为基础(没有放射和实验室检查),或者招募仅限于重症监护室的患者,而不考虑其他住院患者。然而,我们接受了对所有住院患者(重症监护室和普通病房)进行全面报道的研究。

  • 院内肺炎

  • 这些研究着眼于特定类型肺炎(如军团菌或病毒性肺炎)的结果,而不是一般的社区获得性肺炎

  • 完全依赖于特定生物标志物而不使用临床风险分层量表的研究

  • 回顾性研究。

从上面我们获得了可能相关文章的全文版本,并进行了更详细的筛选过程。结合上述标准,只有在以下情况下才纳入研究:

  • 肺炎由体征、症状和胸部x光片确定

  • 报告后4-8周随访死亡率数据

  • 根据严重程度量表(PSI, CURB-65, CRB-65, CURB)参数报告死亡率

  • 在1999年至2009年的10年期间纳入患者(CURB-65及其不同迭代版本在1999年之后才可用,我们希望确保PSI和CURB-65量表的比较基于同一时间段内招募的患者;这是为了减少混淆的可能性,在严重程度量表的任何表现差异可能源于流行病学、微生物学或肺炎治疗方面与时间相关的变化)。

有效性评估

研究效度采用基于已发表的关于预后研究关键组成部分的意见的检查表进行评估。9该清单是根据对下列项目的明确报告编制的:

  • 患者选择标准

  • 肺炎诊断标准

  • 后续损失

  • 用于确定结果的方法

  • 治疗肺炎的管理方案(如抗生素方案)

数据抽象

两名审稿人评估了合格性,并从纳入的研究中提取了数值结果数据。在与团队成员讨论解决任何差异后,审稿人在纳入研究和数据提取方面达成了完全共识。如果有任何需要澄清的项目,请联系作者。

研究特点

记录受试者的地理位置和环境、样本量、年龄和性别、预后量表类型和按严重程度分类的死亡率。

定量数据综合和敏感性分析

根据风险评分对患者进行分类,并提取死亡率数据。每项研究都记录了患者数量和死亡人数,并将“高风险或重度”分为PSI (IV和V类)、CURB-65(得分≥3)、CURB(得分≥2)和CRB-65(得分≥2)。使用R-DiagMeta进行统计分析,10MetaAnalyst11RevMan 5.024(北欧科克伦中心,哥本哈根,丹麦)。合并敏感性、特异性、诊断优势比(OR)和阳性和阴性预测值使用随机效应模型计算(该模型考虑了研究之间的可变性)。12使用二元随机效应方法生成每个严重程度量表的汇总受试者工作特征曲线(SROC)。10采用I2统计,用I2>50%的值表明存在相当大的异质性。13

结果

研究选择流程图见图1.这项分析包括了23项研究,14-33一些研究报告了不止一个风险分层量表。16项研究涉及PSI、12项CURB-65、10项CRB-65和5项CURB。对于同一患者数据集中的严重程度量表的直接比较,7例测试PSI与遏制-65,4例测试PSI与CRB-65, 2例研究PSI与遏制。表1在线表格显示了纳入元分析的研究的特征。

图1

流程图显示肺炎严重程度量表的研究选择。抑制、混乱、尿素氮、呼吸频率、血压;PSI,肺炎严重程度指数。

表1

研究特点

23项研究的总样本量为22 753名参与者,其中1680人死亡,平均死亡率为7.4%。样本量从134人到3181人不等。研究主要在欧洲和北美的急诊科和医院进行,从澳大利亚、香港和巴基斯坦获得的数据比例较小。研究参与者的平均年龄通常在六七十岁左右。对于效度评估,我们发现偏倚风险是确定死亡率的一个特殊问题。23项研究中只有14项给出了用于确认参与者在随访期间是否死亡的方法的细节(见在线表格)。缺乏患者管理方面的信息是另一个主要的潜在偏倚来源,因为关于治疗肺炎所使用的干预措施以及在一项研究内和不同研究之间抗生素使用是否一致的信息很少。

间接和直接比较识别死亡风险患者的能力

每项研究的配对敏感性(被正确分类为“高风险”的患者死亡的比例)和特异性(被正确分类为非“高风险”类别的幸存者的比例)显示在严重程度的SROC曲线中图2一个.直接比较的研究数据见图2B及C7项研究评估PSI与CURB-65, 4项研究比较PSI与CRB-65(由于研究数量较少,其他直接比较的结果未显示)。直接和间接比较一致地表明,在识别那些随后死亡的人方面,PSI比遏制-65、遏制或CRB-65更敏感,但不太具体。

图2

受试者工作特征空间说明评分系统在识别有死亡风险的患者时的表现。(A)灵敏度和特异性与SROC曲线配对,间接比较所有四个评分系统。(B)在头部对头部研究中,PSI与CURB-65在预测死亡率方面的配对特异性和敏感性。(C)在头部对头部研究中,PSI与CRB-65在预测死亡率方面的配对特异性和敏感性。CRB-65,意识模糊,呼吸频率,血压,年龄≥65岁;抑制、混乱、尿素氮、呼吸频率、血压;CURB-65,意识模糊,尿素氮,呼吸频率,血压,年龄≥65岁;PSI,肺炎严重程度指数。

原始数据的森林图和每个研究的估计敏感性和特异性显示在图3模拟.对每个量表测量了敏感性、特异性、诊断or和阳性和阴性预测值的汇总估计,这些结果显示在表2.合并估计具有显著的异质性。

图3

森林图的敏感性和特异性根据研究和预后规模。(A)肺炎严重性指数(PSI)。(B) CURB-65(神志不清,尿素氮,呼吸频率,血压,年龄≥65岁)。(C) CRB-65(意识模糊,呼吸频率,血压,年龄≥65岁)。(D) CURB(神志不清,尿素氮,呼吸频率,血压)。

表2

肺炎风险分层量表的测试性能汇总统计*

由于死亡比例相对较小,所有四种量表的阴性预测值同样令人印象深刻,范围从0.94 (CRB-65)到0.98 (PSI)。死亡率低也是阳性预测值偏低的原因,从0.14 (PSI)到0.28 (CRB-65)不等(表2).

估计每种严重程度的临床影响

评估风险分层的临床影响(如阳性和阴性预测值)取决于肺炎相关的潜在死亡率。图4一根据严重程度,每1000例肺炎患者中假阴性(被错误分类为非严重的患者数量)的绝对数量。PSI的假阴性率最低,这意味着该测试能够正确识别患有非严重肺炎且死亡风险较低的患者。图4 b根据测试,显示每1000名肺炎患者中假阳性(被错误分类为“高风险”的患者数量)的绝对数量。这说明PSI在判断相对更多的幸存者为“高风险”时过于谨慎,而CURB-65及其迭代在正确分类死亡可能性更大的患者方面更加具体。这些数字还证实,检测性能的绝对影响随死亡率而变化,在肺炎相关死亡比例高的人群中,检测之间的差异更加明显。

图4

(A)作为每1000例肺炎患者死亡率的函数,被错误地分类为非严重的患者数量。(B)每1000例肺炎患者中被错误分类为严重的患者数量与死亡率的函数关系。CRB-65,意识模糊,呼吸频率,血压,年龄≥65岁;抑制、混乱、尿素氮、呼吸频率、血压;CURB-65,意识模糊,尿素氮,呼吸频率,血压,年龄≥65岁;PSI,肺炎严重程度指数。

讨论

据我们所知,这是第一个覆盖临床常用肺炎严重程度量表比较测试性能的系统综述和荟萃分析。目前的风险分层量表(PSI, CURB-65, CRB-65和CURB)有不同的权衡,没有一个量表在所有方面都明显优越。PSI是最敏感的测试,假阴性率低(图4一),让临床医生更有信心甄别不需要住院的病人。34相反,与PSI相比,CURB-65、CRB-65和CURB量表更具体,具有更高的阳性预测值,这意味着更大比例的“高风险”患者被正确分类。

从理论上讲,基于curb -65的量表敏感性较差,这意味着一些患者可能会被错误诊断,即使他们实际上面临更高的死亡风险,也可能被视为非严重患者。然而,由于在研究参与者中死亡的比例相对较小(7.4%),这些基于curb -65的试验的阴性预测值与PSI的阴性预测值非常相似,表明试验之间的临床差异可能很小。在不良结果发生率较低的情况下,我们可以更有信心地认为,“非严重”测试结果可靠地预测患者将有良好的结果,但我们也不太确定“严重”评级是否真的预测死亡。35阳性预测值的范围从0.14 (PSI)到0.28 (CRB-65)可以说明这一点。

所选计分制度的实际方面和所涉资源问题也应加以考虑。PSI包括详细的病史、体格检查、静脉血取样、动脉血气测量和胸部x光,因此要求医生从病史和检查中收集总共12个参数,以及从进一步调查中获得的7个参数。6虽然大多数PSI参数在医院里都有,也可以通过基于网络的PSI计算器计算出来,36急诊科中忙碌的临床医生可能会懒得估计PSI,或者可能会不准确地匆忙完成任务。然而,基于curb -65的量表没有在评分中纳入潜在的重要参数,如低氧血症和双侧肺炎,而CRB-65(社区使用的潜在有用量表)省略了尿素测量,因此可能降低敏感性。

检测方法的选择取决于卫生服务提供者对医疗保健和资源使用的态度,以及肺炎相关死亡率。在资源丰富的医疗保健环境中,特别是在肺炎死亡率相对较高的地方,可能首选最敏感和劳动密集型的检测(如PSI)。在某些资源有限且肺炎死亡率相对较低的社区环境中,CRB-65的低敏感性并不是主要缺点,其易用性和较高的特异性可能有助于临床医生关注那些需要更多临床关注的患者。

研究的局限性

在我们的审查中有一些限制。严重程度量表的表现明显存在相当大的异质性,这可能与所评估人群的多样性以及微生物谱和抗生素敏感性的差异有关。这影响了我们作为二次分析提出的汇总估计的有效性,即使我们使用了随机效应模型,将研究水平的可变性纳入元分析。其他研究人员认为,在诊断研究的荟萃分析中,通常可以看到很大程度的异质性。37对我们的Forest图的进一步研究没有显示出任何一致的来源来解释大量的异质性,我们相信每个严重程度量表的数据点实际上相当一致地聚集在SROC平面上。我们还特别选择在同一患者人群中纳入PSI直接面对面评估和curb -65相关评分系统的研究,以便在比较不同严重程度量表时将异质性降到最低。

虽然我们使用了全面的搜索策略,但一些检索到的论文不得不被排除,因为没有提供原始的死亡率数据,或者没有足够的信息让我们从报告的敏感性或特异性中计算出死亡人数。两项值得注意的研究因为不符合我们的资格标准而被排除:第一篇基于psi的文章研究了1989年至1994年的患者,这与1999年左右开始的与curb -65相关的研究时期非常不同,6而德国最近一项对388406名患者的研究仅报道了住院患者的死亡情况,而没有报道4-8周随访时的死亡率。7我们没有资源来评估非英语出版物,所以我们选择只包括同行评议的出版文献。

我们无法正确评估纳入研究的质量,因为在报告中缺乏关键领域的细节,如用于确认结果的方法和抗生素方案。只有少数研究提供了治疗途径的信息,不同的治疗方案可能导致了这里看到的大量异质性。例如,抗生素使用和抗生素耐药性的变化、胸科专家和重症监护床位的可用性可能会影响死亡率结果和严重程度的表现。

结论

我们的研究结果表明,PSI和CURB-65评分系统在识别死亡风险较低的肺炎患者方面表现良好。然而,同样清楚的是,所有四种预后量表都有局限性,在做出管理决策时,只能与仔细的临床判断结合使用。进一步的研究应侧重于识别导致四种评分系统差异的个体特征,以便进一步完善,以实现更准确的肺炎患者风险分类和治疗。

参考文献

补充材料

  • Web Only Data谢谢。2009.134072

    本数据补充文件:

脚注

  • 相关的文章143297133280

  • 相互竞争的利益一个也没有。

  • 出处和同行评审不是委托;外部同行评审。

相关的文章