用于医疗保健专业人员

研究方法和报告

提出临床预测模型用于指导临床设置

BMJ2019年;365年doi:https://doi.org/10.1136/bmj.l737(2019年4月17日出版)引用这个:BMJ2019;365:l737
  1. 劳拉·J Bonnett,终身跟踪的1,
  2. Kym我E斯奈尔在生物统计学研究员2,
  3. 加里·柯林斯年代教授,医学统计数据3,
  4. 理查德·D·莱利生物统计学教授2
  1. 1生物统计学、利物浦大学、利物浦L69 3 gl,英国
  2. 2预后研究中心初级保健和健康科学研究所,基尔大学、英国基尔
  3. 3医学统计中心,纳菲尔德骨科、风湿病和肌肉骨骼,牛津大学,英国牛津大学
  1. 函授:L J BonnettL.J.Bonnett在{}liverpool.ac.uk
  • 接受2019年2月8日

临床预测模型估计现有疾病的风险或未来的结果为一个个体,这是有条件的多个值的预测因素如年龄、性别、和生物标志物。在这篇文章中,Bonnett和他的同事们提供了一个指南,提出临床预测模型,这样就可以实现在实践中,如果合适。他们描述如何创建四个报告格式和讨论每种格式的优点和缺点。利益相关方参与的关键信息是需要来决定最好的表示选择关系的临床使用和目标用户的上下文

总结分

  • 报告格式为临床预测模型认为适合使用很重要,但接收相对有限的注意力在文献中

  • 清楚的预测模型是确保其他研究人员能独立验证的基础模型,这在医疗卫生保健专业人员和其他人可以实现它

  • 表示完整模型的方程是至关重要的。有很多方法可以为最终用户提供预测模型,从点评分系统和计算图表,网站和移动应用程序

  • 最好的演讲是用户和特定的环境,最好是通过利益相关者的参与,包括病人

  • 如果表示需要一个简化版的完整模型生成,然后这个简化模型的预测性能也应进行验证并与完整的模型

介绍

临床预测模型估计现有疾病的风险(诊断预测模型)或未来的结果(预后预测模型)为一个个体,这是有条件的多个值的预测预后或风险因素如年龄、性别、和生物标志物。1大量的预测模型每年发表在《医学文献,2和大多数开发使用回归框架如物流和Cox回归(箱1)。预测模型也被称为风险评分,预后指标,或预后评分。例子包括弗雷明汉风险评分,10年预测冠心病的风险,3和APACHE(评估急性生理和慢性健康评估)分数后死亡率进入重症监护室。45

图1

的图形得分图新原发性胆汁性肝硬化患者死亡的概率(cirr)基于模型派生框2和限制患者用药治疗

透明的报告个人预后和诊断的多变量预测模型(三脚架)声明为作者提供了指导关键信息报告在开发或验证预测模型。188bet手机版188bet手机版67虽然三脚架声明强调模型的演示的重要性,相对较少的信息或实际指导实际上存在于如何提出一个预测模型使用后发展的例子,来帮助实现在临床的设置,如果合适。一个关键资源由Steyerberg书中第18章。8

在选择的格式呈现一个预测模型,研究人员应该仔细考虑目标用户,设置和使用的时机。是很有帮助的问:“谁将访问这种格式的模型,当和设置他们会使用它吗?”表示可以相应地格式化。从根本上说,完整的模型方程总是应该在《华尔街日报》的文章67;这是至关重要的,使独立的外部验证。然而,可能需要额外的报告格式,也许外面的期刊文章,让医护人员使用该模型在一个特定的临床设置(例如,当使用电脑或移动设备是有限的)。同样,格式可能需要裁剪躺在家里人们在使用模型(如哮喘患者决定适当的管理他们的病情检查使用英国哮喘哮喘风险9)提高共享决策。10用户组可以帮助指导选择最好的表示在任何情况下,包括医护人员、患者和公众。病人和公众参与团体和焦点小组是有用的领域;他们强调需要在卫生研究参与者和公共信息和参与。

与完整的模型方程,一系列的报告格式可能需要根据几个因素:不同的介质(纸质和电子),它们的设置模型应用(例如,诊所,床边,或在家),预测的要求的详细程度(例如,近似或圆形的风险估计,或准确的风险评估),和用户友好(简单到复杂格式)。8在这篇文章中,我们总结四个关键的临床预测模型呈现方式可以帮助他们使用在临床实践中,如果合适。我们概述如何创建每个格式和描述他们的优点和缺点与临床的使用,和预期的用户。表1概述不同的表示格式。

表1

例子的格式呈现临床预测模型,使计算结果风险为新个体;这些应该考虑后提出完整的模型方程

把这个表:

我们的文章不是关于如何开发或验证预测模型,811或者如何决定它是否适合临床应用112;相反,我们假设一个模型已经开发和被认为是潜在的用于临床实践,所以研究者需要考虑如何展示模型来帮助实现。为此我们使用模型所示框2说明如何预测死亡率风险随着时间的推移,诊断为原发性胆汁性肝硬化患者。在整篇文章中使用这种生存模式,但表示格式描述也适用于其他风险预测模型开发使用回归,如使用逻辑回归派生。这些模型相关的连续预测的结果(例如,使用线性回归)。

">图2
图2

诺模图使计算预测死亡的概率在一年和三年新患者原发性胆汁性肝硬化。底层的统计模型中描述框2

演示使用点评分系统

描述

在点评分系统,点被分配为个体基于预测的值。总得分点然后映射到一个相应的事件或生存概率的风险。21点评分系统面向的用户是医疗专业人员和病人。这些系统可以呈现在屏幕上(如显示器、平板电脑)的咨询,作为病人带回家表打印,或用于病房作为参考指南。

如何获得一个点评分系统

产生一个点评分系统,首次开发预测模型(例如,使用物流或Cox回归;看到盒1和2),然后分配包括预测的回归系数是整数的分数,可以正面的或者负面的。不幸的是,任何连续预测需要的范畴,因此牺牲了一些预测的准确性。类别不需要相同的大小,并通过非线性可以更妥善处理不平等的类别。开发点评分系统的步骤可以概括:

1。组织连续预测分类和确定每个类别的中点。

2。选择一个参考类别为每个预测(连续、二进制和分类)。

3所示。连续变量,确定每个类别有多远从参考类别,然后乘以每个不同的回归系数,预测来确定“回归单位的差异。“为二进制和分类变量,“回归单位”只是预测的回归系数。

4所示。定义的回归单位数量将对应于1点分评分系统;这个定义通常是基于临床医生的偏好。

5。确定点(四舍五入为最接近的整数)与每个类别的相关预测因子。

6。确定可能的最小值和最大值点总数。

7所示。计算每个点的风险估计总在通过使用范围的原始模型点分数(圆)的预测概率。这估计是一个新的风险预测模型,接近完整的模型。

注意,有时成绩导出基于风险比率或优势比,而不是相应的回归系数。这种方法是不恰当的数学考克斯(或物流)回归模型假设添加日志的危险(或日志赔率)比率。22

与点评分系统,重要的是也存在伴随概率表(绝对风险预测)允许分分数被翻译到预测风险。决定等低、中间或高风险只有基于点总不提供信息的,除非很明显这些决策是如何定义规模预测的绝对风险。

一个完整的附录中提供的例子是工作。看到沙利文和他的同事进一步的细节,包括数学公式关联的风险与每个可能结果总分得分为物流和生存回归模型。21

优点和缺点

点评分系统很容易理解最初的解释和示范后,所以应说明其使用与这些系统。取决于模型的复杂性,包括预测的数量,论文基于点评分系统可以使风险估计比直接输入病人的价值观到在线计算器或出版模式。然而,风险的预测(或生存)是唯一接近实际预测的风险从完整的模型;这是因为连续预测值信息被分类丢弃,和回归单位是圆形的。研究人员必须检查基于简化模型的预测性能点评分系统类似于(和有相同的潜在临床影响)最初的完整模型。

应用程序

表3 a和b说明一个问题得分系统的原发性胆汁性肝硬化的例子。在表3,分数分配给每个预测的类别,已根据15年增加了年龄年龄(即回归系数乘以15);表3 b提出了概率的对应点的结果。举个例子,一个55岁(0分),与肝硬化(3分),白蛋白的34.4 g / dL(0分)和中央胆汁淤积(5分)有分共8;这对应于死亡的概率为0.46和0.90一年三年。这些数字是类似于0.44和0.89的等效估计死亡的风险在一到三年,分别直接从这个人的完整模型方程获得。这些数据表明,简化导致风险的预测只有微小的变化从这个人评分系统。

表3

点评分系统新原发性胆汁性肝硬化患者死亡的概率基于模型派生的框2

把这个表:
表3 b
把这个表:

使用图形得分图表示

描述

图形得分图表是高度简化,颜色分评分系统的编码版本。相似点评分系统,图形分数预测模型图是一种表示格式,当面向的用户是医疗专业人员和病人。可以使用图在屏幕上或打印。使用这种方法的一个例子是分数(冠状风险评价系统)模型预测心血管疾病。23

如何得到一个图形得分图吗

的概率计算结果必须为每一个相关的组合预测盒1中所描述的,并且是基于平均值的类别或个人的小组在开发数据的类别。概率可以列表和颜色编码基于临床重要的风险类别。例如,那些风险较高(接近1)可以预测编码为红色,和那些低风险的预测(接近0)可以被编码为黄色。

优点和缺点

图形得分图表很容易理解和彩色编码可以提高易用性与分评分系统。14此外,决策准则可以耦合到预测;例如,深红色意味着转诊重症监护。这种耦合使患者的快速分层。选择决定阈值需要仔细考虑和评估;特别是,任意的截止值应该被避免。24

本课程通常需要一些简化的模型,因为它只能容纳有限数量的预测,需要连续预测类别。信息预测风险的损失也会发生,因为结果通常表现为预测风险的范围,而不是特定的值。感兴趣的每个时间点都需要自己的图形得分表,这是一个进一步的缺点。相似点评分系统,简化模型基于得分图表应检查其预测性能(在每个时间点的利益)而完整的模型。

应用程序

图1显示一个图形得分图表的原发性胆汁性肝硬化的例子。创建图表中所示使用点评分系统表3 a和b。宽度0.1的死亡风险可能被认为具有临床意义的例如,直到0.3,因此被选为四个颜色类别。根据这个图表,死亡的风险在一年是0.46一个病人是55岁,有肝硬化,中央胆汁郁积,34.4 g / dL的白蛋白,与硫唑嘌呤治疗。这种预测风险类似于0.44从完整的模型估计的价值。

演示用诺模图

描述

诺模图是另一个图形演示格式为临床预测模型(图2)。相似点评分系统,点被分配根据预测的值为特定个体,然后等同于风险事件或生存概率。25面向的用户列线图的医疗保健专业人士。诺模图是最好的作为参考指南,有可能在病房或磋商。类似于图形得分图表、列线图可以颜色编码来帮助解释。26

如何获得诺模图

建立诺模图的步骤是:

1。对于每一个预测,计算模型所产生的最大的变化是线性预测,预测的回归系数乘以最大和最小值之间的差异的预测数据集。订单预测的计算最大的变化。

2。为每个预测分配到100点。首先将100点分配给预测最大的最大的变化确定从步骤1。称之为预测a .然后提供一个点其他预测分数等于100×(最大变化预测/最大变化的预测)。

3所示。计算最小和最大可能的总分基础上的所有可能的组合预测;点投射到概率拟合预测模型的规模箱1总点作为唯一的预测。

列线图可以使用统计软件项目如R(通过哈勒尔的“rms”包)和占据(通过使用逻辑回归“nomolog”和“nomocox”Cox回归)。2728

优点和缺点

列线图的其他报告格式的主要优点是,不需要连续预测指标进行归类,可以包含在单个和多个时间点计算图表,通过融合多尺度概率基于可能的总分。此外,可以判断预测因子的相对重要性在诺模图线的长度。此外,交互和非线性的术语可以被处理。8复杂的模型,例如那些与时间有关的预测,也可以以这种方式了。29日诺模图可以很容易地应用远离电脑,特别是当一个只包含少量的预测模型。

但是,列线图可以出现相对复杂的乍一看,他们需要一个解释,他们应该如何使用(三脚架语句中突出显示6)。此外,他们可以根据不准确的尺寸和分辨率数字出版;更大数量的预测包含在模型中,更具挑战性的诺模图来解释。舍入的系数也可能是必需的。

应用程序

图2显示的列线图与原发性胆汁性肝硬化的例子框2。确定生存概率在指定的时间点,用户标识点得分与每个预测关联值通过阅读从顶部的点规模预测价值。一次分数被分配给每个指标的值,计算总分得分。翻译从总点的概率结果然后由读到相关结果的概率从量表的总分。因此,使用图2,可以看出一个人55岁(24分)、肝硬化(42分),白蛋白的34.4 g / dL(65分)和中央胆汁淤积(62分),与硫唑嘌呤治疗(0分)总得分193点。这相当于一年和三年的死亡概率为0.40和0.85,分别,又类似于获得的0.44和0.89的估计直接从完整的回归模型。如果个人没有治疗(32分),但其他特征不变,总点分数是171,相当于一年和三年死亡的概率为0.25和0.68,分别。

表示在网站和移动应用程序

描述

越来越多的预测模型是通过一个网站可用计算器或在平板电脑或智能手机设备的应用。这些计算器和应用程序通常交互式图形用户界面,提供个性化的风险从一个潜在的预测模型估计,这取决于用户的输入的预测价值。经常访问是免费的,但有时。

如何开发一个网站

网站开发平台或内容管理系统使用建设;他们还需要一个域名和主机。各种网站建设平台存在,包括特定的工具,使统计软件包运行web应用程序示例,闪亮的R和太古占据。30.31日网站和应用程序可用于医疗保健专业人士和公众,他们可以使用感兴趣的个人在世界任何地方。这些网站和应用程序也可以被设计用于在特定情况下,比如要求从注册用户登录细节,或通过国家卫生服务服务器,以确保信息传递给病人通过医疗保健专业。

网站需要明确的目标用户和目标人群,和任何网站或应用程序应该清楚地说明如何使用模型。引用手稿描述了模型开发和后续的验证(和潜在的临床影响评价)也应提供。网站或应用程序计算器应该检查以确保预测概率同意从底层的回归预测模型。模型与连续预测,输入值范围之外(的开发数据集)也应该限制为避免外推,或者至少为用户提供一个警告。

优点和缺点

一个主要优势是,完整的模型方程可以嵌入在幕后,因此不需要近似,任何复杂性是“隐藏”的最终用户。网站和应用程序可以提供一个用户友好界面的复杂的统计模型,其中包括大量的预测,非线性项,和交互。此外,大部分的数据输入可以自动化;例如,在全科患者的年龄和性别可能已经记录在医疗中心的计算机系统。预测模型可以实现在电子健康记录提供实时反馈给临床医生,虽然缺失数据和难以置信的值可能是有问题的。数字应用程序很容易使切换单位实验室结果和人体测量学,例如身高记录在米或脚。

因为任何人都可以创建一个web计算器,目前还没有保证底层模型适合使用,充分开发,或验证的相关群体访问网站。32此外,通常很难知道模型已被翻译成图形工具。此外,目标用户(如医疗保健专业人员或患者)可能不清楚,和公共访问的网站可能会导致过度使用或访问的人来说,该模型不是目的。

显然,需要访问互联网。数据隐私和存储可以是一个问题,特别是如果一个网站的目的是收集和显示数据;这个问题应该在网站上明确标示或应用。此外,附带图形演示等颜色编码的粘人,笑脸,或类似的,显示的人口比例预测结果依赖于目标用户,需要仔细考虑。3334旁边的图形演示,其他指标可用于风险沟通来自预测模型。一个例子就是心脏年龄指标推荐的欧洲心脏病学会。3536最后,该模型可能随着时间的推移被更新以反映底层人口的变化特征。网址也可以改变。有时,这些变化可能没有被跟踪。版本控制是至关重要的,因此,任何模型更新记录的原因。这些变化应该在网站上明确标示。

应用程序

网站是你心中的一个例子来自新西兰的预测工具。37这个工具提供了一个图形设计,比较患者的心血管疾病风险预测与健康人群的年龄相同。因为风险可以病人很难理解,该模型提供了一个图形描绘心脏年龄和未来的预测,取决于个人或不修改他们的预测。其他的例子包括优雅(急性冠脉事件),38ASCVS +(动脉粥样硬化性心血管疾病),39和预测(乳腺癌)。10两个例子的网站对原发性胆汁性肝硬化,但不同的预测比运行在本文的示例中,UK-PBC40和全球。41

总结

报告的格式是一个重要的考虑当一个临床预测模型被认为是适用于临床实践。除了提供完整的方程(这是至关重要的),有很多方法可以呈现模型帮助临床使用,从点评分系统和计算图表,网站和移动应用程序。如果一个模型提出了减少的格式(例如,基于分类值预测即使他们最初连续完整的模型),这减少了模型应该接受相同的验证过程,完整的模型才能被视为适合临床使用。

最好的格式是用户和特定环境,比病人床边医疗专业人士需要不同工具的选择在家里在电脑或平板电脑。出于这个原因,意味着通过利益相关方参与的表现是最好的决定,包括卫生保健专业人员和病人。经验证据现在必须决定是否特定格式促进吸收,使用,或理解。在适当的时候,类似的指导模型将需要使用先进的或替代的造型技术,开发具有里程碑意义和机器学习等。

确认

作者感谢英国医学杂志手稿和同行评议者的援助与发展委员会的手稿。

脚注

  • 贡献者:GSC的想法。他的研究兴趣集中在方法论方面的预测模型开发和验证,和他领导的一个国际协作生产的三脚架共识指导。这篇文章的作者是LJB,反馈和修正的作者。LJB有着丰富的经验的开发和验证预测模型对于患有慢性疾病,和她的模型已经通知司机和车辆许可机构的指导方针为癫痫患者时间开车。LJB的担保人是这项工作。RDR导致预后研究战略,旨在改善预后研究的标准。黄铁矿在预测领域的研究工作和领导培训课程统计方法对风险的预测和预后模型。相应的作者证明了所有作者列出符合作者的标准,没有其他会议的标准被省略了。

  • 资金:本文独立研究起源于博士后奖学金(LJB: pdf - 2015 - 08 - 044)支持的国家健康研究所(www.nihr.ac.uk)。GSC NIHR支持的是生物医学研究中心,牛津。RDR和黄铁矿的资金支持证据合成工作小组,这是由美国国家卫生研究所资助学校初级保健研究NIHR SPCR;项目390号)。黄铁矿还支持由一个NIHR SPCR启动奖学金。中表达的观点不一定是作者和出版的英国国民健康保险制度,国家卫生研究所,或卫生部。

  • 利益冲突:所有作者已经完成了国际统一的披露形式www.icmje.org/coi_disclosure.pdf并宣布:LJB财政支持的国家健康研究所提交工作;所有作者声明没有其他金融关系可能有兴趣的任何组织提交的工作前三年;似乎没有其他关系或活动可能影响提交的工作。

引用