摘要
肺功能部分取决于性别、年龄和身高(Ht)。通常,肺功能表示为一个百分比的预测值(PP),以说明这些影响。
PP法保留了性别、年龄和Ht偏倚,1秒内用力呼气量(FEV)1)以Ht的幂和新的性别特异性下限(FEV)为标准1商(FEV1Q)进行了调查以确定哪种方法最佳预测患者和正常受试者的所有因素死亡率。
多变量分析,FEV1Q是最好的预测因子,最坏十分位的危险比为6.9,而FEV的危险比为4.11单因素分析,风险比分别为18.8和6.1;FEV1·Ht−3是次佳的生存预测因子。以FEV的简单截断值计算中位生存期1q和fev.1·Ht−3.这些生存曲线被精确地拟合(r2= 1.0)1q和fev.1·Ht−3值用多项式表示,因此个人的测试结果可以用来估计生存(与SD.中位生存期分别为0.22和0.61年)。
因此,肺功能损害应以一种新的方式表达,这里称为FEV1Q,或者FEV1·Ht−3,因为这些指标最好地将肺活量肺功能与全因死亡率和生存率联系起来。
从第一次科学记录肺功能数据1,2,得到的值取决于受试者的性别、年龄和身高(Ht)。这导致了试图通过使用预测方程来考虑这些影响的做法,然后将主题的结果与期望值(预测值的百分比(PP))联系起来。在。的第二版疾病中的呼吸功能由贝茨et al。3.有人认为,如果肺功能指数值<80%pred,则可能是异常的。这种方法被广泛接受4但这并不是一个有用的经验法则,原因有很多5,6.欧洲呼吸188bet官网地址学会(ERS)是第一个推荐使用标准化残留(SRs)的组织z-score,用于确定索引是否超出正常范围7.正常(LLN)的下限为-1.645 SRs,这是对低百分位的估计,该方法已被最新的美国胸科协会(ATS)和ERS声明推荐8用于确定结果是否异常,建议使用PP作为表示严重性的方法。
当肺功能与预测值相关时,就需要精确的预测方程来比较受试者的数据。该方程必须从相关的受试者群体中获得,使用类似的设备并采用严格的技术标准。这些人到底有多正常是很难定义的,一个过于纯粹的群体可能没有代表性。即使是最好的预测方程,其预测值也有相当宽的95%置信限,因此,这本身就是一门不精确的科学。另一种方法是使用与Ht的功率关系来标准化肺功能,这有助于解释一些大小和性别差异。弗雷明汉的研究证明了这种方法9,有助于将肺功能数据与随后的生存率联系起来,这是由Fletcher发现的et al。10是评价慢性阻塞性肺疾病(COPD)患者纵向功能下降的最佳方法。
本文的目的是探索这些不同方法的局限性和优势,并探索其他可能更好的方法,以便由其他研究人员进行测试,以帮助确定最好的前进方式。肺功能和全因死亡率之间的关系被用来探索这一点,因为这是现成的信息。以前的研究表明,1秒内的用力呼气量(FEV)1)是一般人群全因死亡率的预测指标9,11- - - - - -13而这种关系在与气流阻塞有关的呼吸系统疾病引起的死亡率方面更为明显11.
数据和方法
数据集
为了帮助探索使用肺活量肺功能数据的各种方法,我们使用了三组数据。一项来自伯明翰大学医院国民健康服务信托(英国伯明翰)进行的常规肺功能测试。这些数据包括11,972名患者(53%的男性)最近的出诊检查结果,这些患者因肺功能检查的任何原因而被转至英国国家卫生服务数据记录,他们的生存记录到2008年10月。对经过验证符合ATS/ERS规范的设备进行了测试14,数据是根据这些测试标准获得的。第二组数据来自哥本哈根城市心脏研究(CCHS)15,由P. Lange(丹麦Hvidovre医院,Hvidovre)提供给我们,以帮助我们探索一种新的使用肺功能数据的方法11.从1976年至1978年期间进入CCHS的受试者的肺函数数据及其2002年12月的生存被释放进行分析。此前描述了该大型项目的方法和背景12,15.FEV1和用力肺活量(FVC)在未进行支气管扩张的情况下,使用维生仪波纹管肺活量计(Maids Moreton,UK)记录。仅包括至少两次测量值在5%以内的受试者,并记录获得的最高值。记录FEV的任何受试者1<0.3 L (n = 4)或谁的FEV1排除超过FVC (n = 19),保留13,900名受试者(46%为男性)的数据进行分析。第三组数据包括1095例COPD患者(41%为男性),他们曾接受过支气管扩张剂后FEV治疗1记录并随访15年,以探索生存的预测因素16.当所有三组数据组合在一起,只有年龄≥20岁的受试者保留时,剩下26,967名受试者进行FEV分析1和生存的预测。
FEV表达方法1损害
FEV1以多种方式表示,如PP(FEV1PP),采用欧洲煤钢共同体(ECSC)参考方程,并作为FEV1除以Ht的平方(FEV1·Ht−2)13,17和ht cubed(fev1·Ht−3)10.FEV1也作为SR (FEV1SR),派生自:
FEV1SR =(观测到的FEV1−预测FEV1) /相对标准偏差
其中RSD是所使用的预测方程的残差标准差7.虽然ECSC参考方程只适用于年龄≤70岁的人群,但在这个年龄之后,它们经常被使用,我们发现这些方程在预测95岁之前的年龄时,与其他更特定年龄的方程一样好18.绘制患者数据显示,无论年龄如何,FEV都有一个平坦的下限1,如图1所示⇓.发现FEV较低的1百分位1在近12,000名受试者的患者组中,性别有差异(男性为0.5 L,女性为0.4 L),但在>50岁时,年龄没有显著变化,更可靠的第1百分位估计是可能的,如图2所示⇓.于是决定将FEV标准化1这个指数被称为FEV1商(FEV1Q)。这是一个指数,表明名义上肺功能下限剩余的周转率,并考虑到肺功能的一些性别和大小差异。当使用单一性别的数据时,FEV1Q没有比原始FEV的优势1.
统计数据
所有分析使用Stata/SE 9.1版本(StataCorp, College Station, TX, USA)进行。预测FEV存活的Cox回归模型1将年龄和性别作为预测因子,然后不使用这些预测因子,因为其目的是确定在临床环境中使用肺功能数据的最佳方法,在该临床环境中,其他因素在决策过程中不会明确考虑。所有模型均被确认遵守比例模型中隐含的假设危险分析。
结果
每一种表达肺功能损害的方法都是依次进行的,结果支持或反对它在此背景下的使用。最后,探讨了在目前的大数据集中的生存结果。
预测值的百分比
PP方法学多年来一直存在,但没有统计学基础,在比较不同肺功能指标时存在误导。图3⇓显示了男性和女性的理想数据,表明真实的LLN在不同年龄的不同PPs,这在性别之间是不同的。它也随温度的变化而变化。因此,如果与预测值关联的过程是试图解释年龄、Ht和性别,那么这种方法确实掩盖了这三个领域中每个领域的影响,这些影响可能会破坏结果。如果希望比较不同指数的结果,PP的问题就会变得更糟,因为根据所考虑的指数,与估计的第5百分位数相关的PP是非常不同的。表1⇓在使用ECSC方程的各种指数中,显示了以PP表示的男女LLN(估计的第5百分位)7.LLN的值从剩余体积的58% pred到FEV的87% pred1的百分比。如果人民党80%掌权3.时,可能会错误地假设残余体积的结果非常低,但FEV1作为全植被覆盖的百分比是可以接受的,而它们实际上是相等的,并且在LLN。这个表显示了使用PP在肺功能指标中寻找异常模式的困难和潜在的误导。
如果PP是表达损伤严重程度的有效方法,那么可以预期FEV最低1不论性别、年龄和Ht,患者的PP大致相同。换个角度看,FEV1PP是一项有效的严重程度,那么患有囊性纤维化的年轻患者将死于较大的原始FEV1因为他们的预测值比老年人的大。图1⇑显示FEV1所有目前患者的数据与年龄标绘成原始FEV1, FEV1PP, FEV1·Ht−2, FEV1SR和FEV.1问:生FEV1令人吃惊的是,不论年龄大小,下界大致相同。对于FEV1PP,年轻受试者的下限低于老科目的下限,即。年轻的实验对象可以通过FEV存活1与年龄较大的受试者相比,这是一个低得多的PP1·Ht−2和FEV1Q,下界是平的,就像原始FEV一样1.图1⇑证实了从临床实践中得到的信息,即。年轻的囊性纤维化患者可以通过绝对的FEV存活1就像70岁的人一样低,所以可以在低得多的PP下生存19.这表明FEV1PP也不是评估严重性的最佳方法。
标准化残差
SRS的使用是ATS和ERS在其建议中认可的方法,以确定个人的肺功能是否超出正常范围7,8.SR通常用于统计分析,术语与A同义z-score,并首次用于研究吸烟者肺功能异常模式的研究20.这种技术的优点是所有类型的指标的单位都是相同的,并且SR表明了一个主题的结果在正态总体的高斯分布中的位置。由于低于预测值的1.645个SRs是对较低的第5个百分位的估计(低于估计的2.5个百分位的1.96个SRs),因此可以决定与预测的偏离程度,以指导临床兴趣。ATS和ERS8建议1.645 低于预测值的SRs是患者用于定义LLN的水平。这意味着5%被认为完全正常的人现在会被认为是不正常的(即。它们是假阳性)。对于患者或有症状的受试者,这可能是可以接受的,但如果对无症状人群的无疾病受试者进行检测,则可能会选择估计的2.5%,以尽量减少假阳性结果的数量。
使用SRs来表示LLN以下的异常程度更有问题,因为年轻受试者的预测值更高,因此,就可降低的rsd数量而言,年轻受试者可以降低rsd。如图3a所示⇑对于男性,A点为25岁男性的1.77米Ht的预测值,B点为同年龄男性的Ht和FEV的预测值10.6 L。C和D点相当于70岁的男性。零FEV的基线1分别比25岁和70岁男性的预测值低8.6和6.1个SRs。FEV1B点比预测值低7.44 SRs, D点代表FEV1比预测值低4.9个SRs。70岁男性不可能有FEV1第7.44段 SRs低于预测值,因为这需要负FEV1,这是荒谬的。如果B组和D组的两名受试者确实同样残疾,表现出同样的症状,有相似的生存预测,那么SR方法似乎不能正确反映损伤的程度。图1证实了这一点⇑,年轻受试者的SRs比老年受试者低得多。
标准化高度的力量
弗雷明汉的研究9表明,FEV1除以Ht给出了一个合理的长期生存预测。弗莱彻et al。10表明,FEV1·Ht−3作为FEV标准化的一种手段1为评价肺功能下降的最佳方法。Ht的这种标准化形式考虑到了一些性别和大小差异,正是这些差异使原始FEV得以利用1有问题的,特别是在考虑两个性别的数据。
对数回归 钒铁1与log Ht相比,CCHS数据的斜率为3.7,但仅为ln FEV方差的0.331用ln Ht来解释。拟合不是很好,两性的这个斜率表明Ht的3或4次方可能提供最好的拟合。图4⇓显示CCHS FEV的直方图1数据表示为fev1PP, FEV1SR, FEV1q和fev.1·Ht−3.由于这些数据是从正常人群中随机获得的有关肺功能的数据,因此两性肺功能表达的满意方法的分布应该是正常的。对于原始数据,直方图确实显示了男性和女性的两个独立分布,它们的大小差异已知(偏度为0.57)。当用PP表示时,分布是负偏态的(-0.27),SRs也是如此(-0.26)。FEV1Q偏度为0.23,FEV偏度为0.231·Ht−2对正态分布拟合较好,偏度为0.15,其中FEV拟合最好1·Ht−3,偏度0.00。
测试肺功能障碍和生存
对肺功能损害进行测试最难的终点是生存,这是一个明确的终点。表2⇓表3显示了这个大数据集中每个组成部分的平均年龄和平均生存期⇓显示受试者的数量,分成10岁年龄组,他们的平均值±SD.FEV1存活率和存活率,以及死亡受试者的百分比。计算受试者工作特征(ROC)曲线,探讨表达FEV的方法1就其本身而言,预测生存率是最好的,而曲线下面积对FEV1Q(0.631(95%置信限0.624-0.637)),与FEV1·Ht−3几乎相同(0.626 (0.619-0.633));其次是FEV1·Ht−2(0.621(0.614-0.628)),其次是原始FEV1(0.606(0.599-0.612))和FEV1PP(0.586(0.579-0.592)),带FEV1SR在0.571时最差。图5.⇓显示FEV的ROC曲线1q和fev.1页,FEV1●更具体,而不是比FEV更少敏感1页。
最好的FEV1多变量分析的生存预测因子是由Cox回归模型确定的,该模型使用每个指标、性别和年龄作为预测因子,肺功能为十分位数。预测生存率的最佳模型是FEV1Q,其次是FEV1·Ht−2, FEV1·Ht−3然后FEV1PP,各模型显著优于下一个(p<0.05(似然比检验)),其风险比结果如表4所示⇓.FEV1表4中的Q列⇓老年人群FEV的危害比较小1q比fev1PP,但与肺功能恶化相关的风险比则相反。这表明年龄本身使用FEV来播放较小的部分以预测模型的生存1Q比FEV模型的Q高1然后将数据分成数据集A,其中12181名受试者进行FEV1SR范围从0.0到-1.645(平均值±SD.-0.82±0.46),以及9630例FEV患者的数据集B1SR <-1.645(平均±1.645)SD.-2.81±0.95),即。都低于LLN。Cox模型是用性别和五分位数的功能和年龄对这两组数据分别生成的,以确定各种FEV的能力1肺功能较好(数据集A)或较差(数据集B)的患者的生存预测指标不同。两组数据中预测生存率的最佳模型均为FEV1Q,然后依次是FEV1·Ht−3, FEV1·Ht−2然后FEV1PP.对于每个数据集,FEV1Q模型明显优于其他三种模型,FEV明显优于Q模型1p<0.001(似然比检验)。模型与FEV1SR是非常糟糕的,几乎没有实用价值。这就是FEV的优越性1Q值在预测生存时不受肺功能范围的影响。
然后将每种表达肺功能的方法分成顶部四分位数,作为正常存活的参考组,然后使用如下衍生的截止水平分为该指数的剩余值分为九个受试者的九个箱。如果XQ是定义上四分位数的值,则在XQ,XQ×9/10,XQ×8/10处定义其他箱。..xq×1/10。组合了最糟糕的两组,因为受试者的数量<10在最低群体中。作为预测因子仅使用这些垃圾箱的回归模型被衍生出没有性或年龄作为预测因子,结果表5所示⇓.再次,FEV1Q和FEV是最好的预测因子1·Ht−3成为下一个最好的。最后,推导了FEV的简单数值截断水平的Cox回归模型1q和fev.1·Ht−3这可能很容易应用于肺功能实验室(<0,1-1.9,2.0-2.9。。。6.0-6.9和≥7.0for fev1q,FEV的截止级别1·Ht−3在数字上是这些的十分之一)。计算各组中位生存期,结果见图6⇓.生存曲线如图6所示⇓预测从FEV1q和fev.1·Ht−3如表所示,每一个都能用多项式函数精确拟合吗 6.⇓.
讨论
本研究表明,目前广泛使用的PP法表达FEV明显低于其他方法1在考虑肺功能与后续生存的关系时。在这种情况下,已经证明使用高温的功率标准化比使用FEV要好得多1页或FEV1老整体FEV1·Ht−3在消除性别和大小偏差方面,Ht的最佳幂次略有优势,并且,在随机正态总体中,该测度是正态分布的。然而,表达损伤的最佳方式是使用FEV1Q是我们提出的一种表达肺功能数据的新方法。像FEV1页,FEV1然而,SR,这取决于性别,因为分母是性依赖性的。在给定环境中选择最佳方法取决于相关的临床护理或管理的方面。我们选择了最适合预测所有原因死亡率的方法,因为这些信息随时可用,并且是一个明确的终点,最终是任何医疗条件中最重要的结果。此处呈现的结果可能对替代端点(例如呼气等症状)不正确,并且该方面需要在其他适当的数据集中进行测试。仅针对呼吸道死亡率的重点可能进一步增强预测;它之前已经显示在一般人群样本中,即FEV的截止水平的危险比1·Ht−2在受影响较严重的受试者中,预测由呼吸系统疾病引起的死亡的概率是全因死亡率的10倍11.
FEV1已经被许多作者发现与一般人群的生存有关9,11- - - - - -13,但具体原因尚不清楚。这种联系可能是因为与肺功能恶化相关的基因在某种程度上与决定癌症或心血管疾病等常见疾病易感性的基因共存。为了支持这一观点,弗雷明汉的研究发现FEV1与老年人的存活率没有关系9.然而,最近的研究表明,肺功能仍然可以预测95岁人群的生存18这表明,肺功能低下可能意味着其他疾病更可能致命,例如中风后易患肺炎,但尚未证实确切的因果关系。
PP方法的问题与该表达式中隐含的比例假设和导致PP保留不想要的年龄、性别和Ht偏差的数字方面有关。另一个问题是,目前对损伤的所有评估都是基于研究对象的性别、年龄和Ht与估计预测值的差距。这个预测值包含了很多不确定性,因此得出的指数也包含了这种不确定性,也许这就是为什么PP方法不是最好的指数的原因。我们选择将这个问题转到另一个角度,专注于研究一个主题在底线之上有多远。使用零值作为底线是不好的,因为对于两性数据,大小差异掩盖了信号。在这方面使用Ht标准化是有效的,从这里的组合数据来看,用Ht的立方进行标准化比使用Ht的低次幂更好。
我们在这里提出一个表达肺活量数据的新概念,这是从图1的观察中向我们提出的⇑FEV有一个绝对的下限1见于实验室测试。然后发现,如果女性和被试的FEV,这一限制略低1通过相关的特定性别下限进行标准化,这给出了FEV的周转次数1留给了这个主题。这个指数,fev1Q是预测生存率的最好的预测因子。对于多变量也是如此(表4)⇑),以及单变量分析(表5⇑)。这代表着思维方式的转变,即关注主体已知的生存功能,而不是他们可能失去的功能。在临床环境中,人们总是意识到患者的年龄和性别,并意识到生存与这两种属性有关。然而,如果一个指数不需要任何额外的操作来考虑这些因素,那么它对临床医生来说可能更有用。含钒铁1q和fev.1·Ht−3,这是可能的,但是,如果FEV1如果要使用PP,则必须对该指标进行复杂函数操作,以考虑受试者的年龄和性别,然后才能准确地用于预测生存潜力。因为FEV中保留了年龄效应1q和fev.1·Ht−3,如果仅关注肺功能异常程度,这些指标可能不太合适本身完全避免任何年龄的影响,或者,如果有研究需要梳理出年龄的确切影响,区别于肺功能,在医学兴趣的一个方面。尽管FEV1PP试图占年龄对肺功能的影响,使用预测方程,该方法引入了其他年龄,性使用的方程和Ht偏见,比例的假设,这些效应引入噪声信号的整体能力,减少研究员预测死亡率。在分析时间相关暴露对肺功能的影响时,如在职业医学中,使用FEV可能有优势1问或FEV1·Ht−3因为它并没有掩盖这种偏见。这里已经证明FEV1q和fev.1·Ht−3是调查全因死亡率的最佳指标,但它们与肺部疾病的症状和其他标志物的关系如何还有待检验。
结果如图所示 6.⇑,仅以肺功能指数简单的分界点为基础,根据表6中适当的多项式预测,可用于临床判断生存情况的严重程度⇑.这表明在未来肺部疾病结局的研究中,对患者开始治疗策略和疾病严重程度分层有潜在的好处。例如,受试者的FEV1将首先进行测试,以确定其是否超出预期范围(例如低于90%置信下限即。钒铁1<-1.645)的SR,然后可以使用估计的FEV的中位生存率来判断任何异常的严重程度1问:如果需要,这种生存可以与预测的FEV的估计生存有关1Q.在研究中可能出现的任何其他测量方法中,使用FEV1Q本身就足够了。表7⇓显示一些例子,肺功能结果可以如何表达使用目前的结果。
FEV的标准化方法1使用最低性别的FEV1(FEV.1Q)是一种避免使用原始FEV困难的方法1因为个体之间的性别和体型差异。这种方法表示个体的FEV1随着换血次数的增加,肺功能的底线水平保持不变。人们发现FEV下降1在正常的实验对象中,男性比女性更大,它的定义是绝对的体积损失21..对于年龄为>50岁的不吸烟者,每年的FEV1估计下降了28% 男性为mL,女性为22 女性的mL22.,男女比例为0.78,这与男女第一百分位FEV的比例大致相同10.8。在哮喘患者中,FEV1下降幅度约为50毫升·年−1在内源性哮喘和~ 23 mL·yr−1在外在的哮喘患者23.~ 32 mL·yr−1在40-60岁和~ 26 mL·yr的哮喘非吸烟者中−1在60岁以上的人群中 年21..这些研究都没有表明这种损失是成比例的。这些纵向研究结果可以很容易地应用于FEV1q数据,因为对于40-60岁的非闻名者来说,FEV的减少11.0的Q值需要∼18 年22..在>60岁的吸烟者中,他们的加速损失等同于FEV的减少1Q每10年为1.021.. FEV的这些估计值1Q下降与性无关,因为雄性与女性之间的肺功能下降的比例差异似乎是近1百分位数的观察性性别差异的近似适合1.
作为FEV1下降,终末期呼吸衰竭的可能性增加,女性FEV的绝对下限更小1可以用两种方式来解释。通气死腔24.,25.和气道的音量26.,这与解剖上的死腔密切相关,女性更小,与她们整体较小的身材有关。其次,女性的基础代谢率也比男性低27.所以有较低的基础通气需求。因此雌性可能能够存活到一个较低的绝对FEV1比男性。
结果表明,FEV是有效的1PP法对于表达肺功能损害并不理想,应该放弃,转而采用一种新的表达FEV的方法1障碍称为FEV1问,FEV1·Ht−3是下一个最好的选择。未来的工作应确定肺功能损害的这些表达与症状的关系,以及其他肺功能指标是否可以以类似的方式管理。
感兴趣的语句
没有宣布。
致谢
我们感谢P. Lange(丹麦Hvidovre医院)和哥本哈根城市心脏研究的研究小组(丹麦哥本哈根Bispebjerg大学医院流行病学研究小组)发布了用于这项分析的肺活量数据。我们感谢A. Dirksen (Gentofte University Hospital, Hellerup, Denmark)纳入了随访15年的1 095名慢性阻塞性肺病患者。
- 收到了2009年2月14日。
- 接受2009年8月27日。
- ©ERS期刊有限公司