摘要
儿童气道疾病包括一组不同的疾病。区分不同表型的尝试通常考虑的疾病维度很少。本研究通过拟合一个统计模型,以代表多种疾病维度的数据,检验了儿童哮鸣和慢性咳嗽的表型。
在一项基于人群的纵向队列研究中,包括了1650名学龄前儿童,319名家长报告有哮鸣或慢性咳嗽。利用两项学龄前儿童调查的症状、皮肤点刺试验、肺功能和气道反应性数据,通过潜类分析确定表型。然后将这些表型与学龄期的结果进行比较。
该模型区分了哮鸣的三种表型和慢性咳嗽的两种表型。随后的喘息、慢性咳嗽和学龄时使用吸入器在这五种表型之间存在明显差异。wheze表型与前面描述的实体共享特征,并部分协调了现有表型标签之间的差异。
这种新颖、多维的方法有潜力识别临床相关的表型,不仅在儿科疾病中,而且在成人阻塞性气道疾病中,表型定义也是同样重要的问题。
人们普遍认为,儿童哮喘包括几种不同的疾病,其特征是常见的哮喘症状1-4..区分这些疾病在临床上是很重要的,因为病因学,病理生理学,治疗的潜力和结果可能不同1那5.那6..同样,有人强调,尽管一些患有慢性咳嗽的儿童可能患有一种变异性哮喘,但将所有慢性咳嗽患者“合并”为“咳嗽变异性哮喘”可能是错误的7..
阻塞性气道疾病显然具有多种尺寸,涉及特拉内,无序肺功能,气道反应性和各种症状。尽管如此,传统的表型定义已经使用简单的区别,例如仅被冷的临床分类,只能受到冷酷的“独家病毒喘息喘息”,并被其他因素触发“多触发喘息”8.,或根据症状病史回顾性分类为“早期短暂性”、“持续性”和“晚发性”哮鸣2那3..由于它们被限制在单一维度,这样的表型定义包含了任意的元素,可能不能恰当地反映潜在的疾病过程。此外,还不清楚不同的表型标签如何相互关联,以及它们是否识别相似的实体。例如,“独家病毒式喘息”是否与“早期短暂喘息”相同?目前仍然缺乏一种能够适当反映潜在疾病过程和潜在治疗反应的商定分类系统。有人提出,统计方法可以解释气道疾病的多个维度,可能有助于识别相关表型9..
潜类分析(LCA)10那11是在社会科学中开发的统计方法,用于识别观察到人群中观察到的异质性的不同子集(类别)。这些类别不是直接观察到的,并且必须从观察到的数据确定。LCA最近用于医学研究以识别疾病表型12那13.本研究的目的是:1)将LCA应用于多变量数据集,结合症状和生理测量,以识别和描述儿童期哮鸣和咳嗽的表型;2)通过评估结果对未来结果的预测程度来探索结果表型的有效性。本文的重点是这种方法在识别阻塞性气道疾病表型方面的潜力。
材料和方法
主题和学习设计
在1990年1990年招募的基于人口的队列研究,英国莱斯特郡莱斯特郡0-5岁招聘14-19在1990年、1998年和2003年,父母完成了关于呼吸道症状、接触和社会人口学特征的邮政问卷。在1992年和1994年之间,795名儿童被邀请进行生理测量和访谈16那17(包括222名儿童患有父母报告的喘息和226名患有慢性咳嗽的儿童)1990年,随机样品为347名以前无症状的儿童。该研究得到了莱切斯特卫生局审查临床研究调查伦理委员会的批准。
表型鉴定基于前两次调查(1990年和1992-1994年)的数据。在第二次调查(1992-1994年)的488名受访者中,分析了319名在1990年或1992-1994年调查中对以下一个或两个问题作出肯定回答的人的数据:“您的孩子曾经有过喘息吗?”以及“除感冒外,他/她通常咳嗽吗?””(无花果。1⇓).
在下一步中,使用当前(IE。最近的两项调查(分别在1998年和2003年进行,当时这些儿童的年龄分别为8-13岁和13-18岁)显示,哮喘、频繁哮喘、使用支气管扩张剂和非感冒咳嗽。所有在前两次调查中无症状的儿童,共169名,作为对照组。
生理测量
在目前的分析中包括的生理测量是年龄和身高标准化的z分数20.0.5 s内强迫呼气量(FEV)0.5)、支气管反应性(刺激浓度的methacholine导致经皮氧张力下降20% (PC20.-P.TC,O.2))21,以及通过皮肤点刺试验评估特异反应。受试者对四种空气过敏原中的一种或多种有反应(猫毛、狗毛、Dermatophagoides pteronyssinus和混合草花粉)被指定为特应性(详情见补充数据)。
统计分析
为了识别表型,在前两次调查期间,对319名儿童的样本进行了一组测量变量的LCA。LCA假设总体是由亚总体(潜在类)组成的,每个亚总体都有其包含变量的独特分布10.如果这些变量代表疾病表现,则可以解释潜在的类别作为临床表型。LCA的应用涉及一些先前的决定:1)变量和2)模型中包含的潜在类的数量。选择要包含的变量时,使用所有可能相关信息之间必须平衡,并且需要限制模型中的参数的数量。在本研究中,所有父母报告的症状数据与咳嗽和喘息有关的咳嗽和喘息,并考虑了所有特性,肺功能和支气管反应性的所有测量。多函数分析22然后用来制作较窄的选择。此外,包括变量年龄和性别(表1⇓和2⇓).为了选择适当数量的潜在类,模型重复装配,其中逐步从1(型号1)到7增加(型号7)。然后使用引导p值进行比较这些模型,以实现似然比(LR)测试和贝叶斯信息标准(BIC)10.
使用Multimix的最大似然估计,旨在适合连续和分类变量的潜在类模型的FORTRAN程序,旨在拟合该模型。24.FEV的变量0.5和记录转换的PC20.-P.TC,O.223被视为与正常分布和所有其他变量连续的分类。该计划适用于处理缺失的数据25有条件的问题,如呼吸急促或症状的季节性,这些问题只问那些曾经有喘息的孩子。有关建模方法的更多细节,请参阅补充数据。
LCA允许计算属于特定表现型的概率,给定对象的观察特征。这是LCA的惯例10,样本中的每个孩子都被分配到其所属概率最高的表型。在目前的研究中,以这种方式分配到不同表现型的儿童群体被称为“表现型群”。双侧Fisher确切试验被用于测试表型簇和预后终点之间的关联。使用bonferroni校正显著性水平来解释多重成对检验。
结果
样本特征
用于表型定义的样本(n = 319)包括189名(59%)曾在1990年和/或1992-1994年报告有哮鸣的儿童和130名(41%)除感冒外咳嗽(但没有哮鸣)的儿童,至少有一次调查报告。样本包括160名(50%)年轻女性,1990年和1992-1994年的中位(范围)年龄分别为3.3(0.3-5.4)岁和6.3(4.1-8.8)岁。健康对照组为169例无症状儿童。
表型鉴定
的两个标准应用于确定的数量表型不同意:LR的引导假定值测试表明五表型(5)模型而BIC首选只有两个模型(模型2)。这种方法探究的和有可能揭示新的表型,作者选择了目前模型5(表1⇑和2⇑),知道数据中的异质性可以通过较少的表型得到充分的体现(参见补充数据表E2-E5中包含2 - 5表型模型的详细结果)。这五个表型的主要特征总结如下(详见表1)⇑和2⇑).为了简化讨论,给每个表现型一个概括标签,描述其最相关的特征。
表型A:持续咳嗽
在这两项调查中,有这种表现型的孩子通常会咳嗽,而不是感冒。wheze比B型更常见,但比C型、D型和e型更少见0.5与无症状儿童相比,这些值略低,而支气管反应性更强。
表型B:短暂咳嗽
咳嗽除了冷酷的情况下只发生在第一次调查中,很少报道喘息。FEV.0.5支气管反应性与无症状儿童相当。
表型C:特应持续喘息
在这两项调查中,喘息的发作都很频繁。发作时有或无感冒,通常伴有呼吸短促。在第二项调查中,几乎有三分之一的这种表现型儿童,夏季是发作更频繁的季节。除了感冒以外的咳嗽和夜间被咳嗽吵醒也是常见的。可能对至少一种过敏原致敏。FEV.0.5与无症状儿童相比,其值通常较低,而支气管反应性较强。
表型D:非特应性持续性哮鸣
在这两项调查中都可能出现喘息发作,尽管不像表型c中那么频繁。发作往往伴有呼吸急促,无论是否感冒均可发生。在第二项调查中,他们通常在夜间更糟糕,在冬季更常见。特应性过敏是罕见的。FEV.0.5与无症状儿童相似,支气管响应性大。
表型E:短暂的病毒喘息
喘息的发作往往发生在第一次调查之前,或者,如果在第一次调查中报告,很少发生。第二次调查后,袭击事件有所减少。气喘往往只在感冒时才出现。FEV.0.5与无症状儿童相似,支气管反应性略大。
对于样本中的每个孩子,计算每个已识别表型的成员概率。然后,孩子们被分配到他们有最高可能性的表型(表型集群)。271名(85%)儿童的最高入会概率为>0.9,表明入会清晰;9名(3%)儿童的最高入会概率为<0.6,表明入会较为模糊。
为了研究分析的顺序步骤(模型1-5)中鉴定的表型之间的关系,确定了从给定模型的表型簇中的儿童的数量与另一种表型更加表型的随后模型的簇中(图2⇓).表型在模型间表现出高度的稳定性。早期被归为一种表现型的儿童,在后期往往又被归为一类。因此,四个表型的five-phenotype模型在本质上是杰出的早期阶段(由模型4 A和B表型(集群4 A和4 B)和表型C和E模型3 (3 B和C)),表现型D作为唯一的“新”出现在第五阶段表型。
通过确定的表型比较预后
1998年8-13岁时(图3)⇓),当前喘息液中的流行率最高,在表型簇C(Atopic持续喘息; 37个(71%)中有52名受访者),表型簇D的表型浓度降低(非含有持续喘息; 14(35%)为40分),随之而来通过(持续咳嗽; 21(25%),其中84个)和E(瞬态病毒喘息;八(24%),其中34个),B中最低(瞬态咳嗽; 72分中七(10%))和在渐近瘤中(17(11%),其中158分)。发现类似的模式对于频繁的喘息(过去12个月至少有四次攻击)和使用支气管扩张剂的结果。
在表型群集之间进行了四种预后终点患病率差异的统计检验。目前的作者对持续咳嗽(表现型A)和无症状儿童之间以及两种咳嗽表现型(A和B)之间的成对比较很感兴趣,因为持续咳嗽代表了一个新的群体(见讨论部分)。与无症状儿童相比,患有慢性咳嗽的儿童(或其中的一个亚组)是否有不同的发生喘息的可能性仍然存在争议。目前的作者还测试了两种更持久的喘息表型(C和D)之间的差异。为了限制多重测试的问题,不再考虑两两比较。这些检验的bonferroni校正显著性水平为0.0042(总体显著性水平(0.05)除以检验数(12))。8-13年的结果(图3)⇑)在簇C中倾向于更普遍,而目前喘息(p = 0.001)和支气管扩张剂(p = 0.002)呈显着差异。哮喘相关结果的预后往往对表型聚类(持续咳嗽)比表型簇B(瞬态咳嗽)和渐近液相色谱有差异,使用支气管扩张剂的显着差异(P <0.001和P = 0.001)。除了8-13 YRS的咳嗽分开咳嗽的患病率较高(44%),而不是B(18%; P = 0.001)和渐近液(12%; P <0.001)。
2003年,13-18岁(图3)⇑),所有四种结果的表型群之间的预后差异在性质上保持相似。尽管在bonferroni校正的水平上没有显著差异,但当前喘息的C和D之间仍然存在显著差异(56相对31%;P = 0.038)和吸入器使用情况(65相对36%;p = 0.013)。除感冒外的咳嗽患病率在A组(41%)和B组(16%;p = 0.002)。
讨论
本研究描述了一种利用LCA对哮喘和咳嗽患儿进行表型识别的新方法。通过将该方法应用于基于人群的儿童队列的呼吸症状和生理测量数据,确定了三种喘息表型和两种咳嗽表型。这些表型可以预测学龄期和儿童后期的结果。这些实体与以前使用的表型的区别在于,它们直接来自数据,而不是定义先天的它们可以解释多种疾病的维度。
LCA作为多维聚类技术
历史上,临床医生通过将复杂的疾病分解成离散的、临床上有用的子集来细化诊断。这些子集被称为疾病表型,提供了一种将患者分类为具有相似疾病特征的个体群体的方法。在目前的研究中,表型被视为未知,并从一个有症状的儿童样本中观察到的异质性。所选择的技术,LCA,可以解释为一种形式的聚类分析。然而,与分层聚类或k-means聚类等算法聚类技术相比,它有重要的优势。首先,它是基于一个正式的统计模型,可以很容易地容纳在不同模式(分类、连续或计数变量)测量的特征。其次,拟合这些模型的典型算法被设计来处理缺失值26.因此,这些模型面临现实流行病学和临床数据的重大挑战。第三,产生的集群不是严格的,每个个体只被分配到一个类。相反,每个人都可以以不同的概率被分配到不同的类别中。这种软形式的分类更接近于临床情况,其中一些患者具有一种以上疾病的共同特征。在目前的研究样本中,大多数儿童可以清楚地划分为一种表型,IE。有很高的可能性,但对少数儿童来说,仍然存在一些不确定性。这种方法的一个可能的缺点是,该方法不能直接为临床环境产生明确的诊断规则。然而,一旦通过这种技术获得的表型定义得到验证,例如通过将模型应用于独立数据集,结果可以转化为简化的诊断算法。
LCA与其他集群技术有一些相同的限制。首先,确定类的数量的问题还没有完全解决10.不同的统计标准可以用来确定类的数量,但可能产生不同的结果,正如本研究的情况。其次,需要事先做出一些决定,例如要包含的变量的类型和数量。因此,这种方法也涉及到一定程度的主观性,尽管比先天的表型定义。在目前的应用中,采用了另一种多元统计方法,即多对应分析,以协助变量选择,降低主观选择的风险。所确定的表型受数据范围的影响。因此,所有被认为与表型定义相关的维度都必须由包含的变量来表示。只要纳入相同的疾病维度,将此方法应用于不同队列的结果应具有可比性,即使代表这些疾病维度的单个变量可能不同(如。皮测试相对特异性免疫球蛋白E测定)。在目前的分析中,作者故意关注临床维度(体征、症状和生理测量),IE。与疾病表现有关而与疾病原因无关的维度。这样做的原因是为了在研究的早期阶段保持方法的简单和透明。通过对统计模型进行适当调整,未来的应用可能会将这一方法扩展到包括吸烟等呼吸障碍的重要风险因素。
用于本研究的数据集从持续的基于人群的群体获得的样本尺寸小,比例相当一部分缺失值(12.8%)。这些问题是典型的临床和流行病学数据。因此,数据设置为新方法提供了合适的试验台。虽然只有11%的个人对所有变量有完整的数据,但所有319个个人都有助于分析。这突出显示使用估计过程的优点,这在尽管有值缺少最佳使用所有可用信息。并非所有目标儿童在调查1(1,422(86%)(1,422(86%)中有1,650个)和调查2(488(61%)(795名))可能引起一些选择偏见。这将主要影响样品中鉴定的表型的患病率,但不太可能影响发现的表型类型。
本研究样本的进一步限制可能是在数据收集时儿童的年龄分布相当大。随着年龄的增长,观察到某些特征(如特应性发作或喘息)的概率会自然变化。这部分是由于模型中包含了年龄,这使得表型中的年龄分布更窄。
表型的喘息
本模型区分了与感冒有关的表型瞬时病毒喘息(表型E),主要影响非植物儿童,以及与多重触发器和特性相关的特应持续喘息(表型C)。这表明先前提出的分类瞬态和持续的喘息2那3.那27和病毒和多触发喘息8.那28那29可能反映了一个单一的表型二分法。表现型E和C似乎调和了这两组标签之间的差异。具有特应性持续性喘息表型的儿童大多是特应性的,具有最高水平的支气管反应性,最低的肺功能和最差的预后,这与其他组的发现一致3.那30..具有短暂性病毒性喘息表型的儿童一般是非特应性的,肺功能正常。这与德国多中心哮喘研究的结果相吻合31但与图森市(AZ, USA)的报告相反2描述了早期短暂性喘息在婴儿期和学龄早期的肺功能受损。
喘息的第三个表型(表型D;图2⇑)被标记为非特应性持续性喘息,其特征是特应性发生率低,类似于图森组标记的表型非特应性喘息27那32.该表型与特应性相关表型的区别在于特应性发生率低和冬季优势。从实验研究可知,一种非特应性的病毒性哮鸣可能以温和的形式持续到成年生活33.表型D还与已被描述为成人呼吸系统药物中的“内在哮喘”的特征34.没有发现明显的晚期发病表型,其特征在于仅在第二调查中报告2那3.那27.因此应用LCA的数据集提供支持1)瞬时和永久喘息的区别,认识到前者与病毒感染有关,后者与其他触发器,和2)三分之一的存在形式的喘息nonatopic但基本上持久。
表型的咳嗽
鉴定的本模型(表型a)的两种止咳表型之一与肺功能降低,增加支气管响应性和后来喘气的风险显着更高,与渐近液和属于其他咳嗽表型的儿童(图3⇑).因此,统计模型似乎已经确定,在非特异性咳嗽的一大群儿童中,有一组表现出“咳嗽变异性哮喘”的特征。很明显,将所有患有慢性咳嗽的儿童都归为这一类别会导致对哮喘的过度诊断7..目前的多维方法可以帮助挑选出可能确实受益于哮喘治疗的儿童亚组。
对研究和临床实践的启示
可靠的表型定义对研究和临床实践很重要。它们有助于描述疾病的自然史,研究潜在的机制以及环境和遗传因素的作用。在临床环境中,将儿童分配到表现型的能力可使父母得到知情的咨询,是表现型特异性治疗的先决条件5.那6..更准确的表型定义可能还有助于解释似乎在时间趋势和哮喘的国际患病率的似乎相互冲突的结果19那35.
在所有这些情况下,表型只有在它们反映真实的病因实体时才有用。设计用于检测多元数据结构的统计技术,如潜在类分析,有潜力识别这些表型。然而,由于这些方法是探索性的,因此验证结果的表型很重要。在目前的研究中,最近的结果数据被用来为早期症状和生理测量确定的表型提供支持。使用独立数据集识别相似的表型是额外的必要验证步骤(外部验证)。该方法的进一步发展和其他队列的应用将有助于增加对表型变异性的理解,不仅在儿童呼吸系统疾病中,而且在成人阻塞性气道疾病中,表型定义也是同样重要的问题9..
支持声明
这项工作由瑞士国家科学基金会资助(Prosper Grant 3233-069348和3200-069349,以及SNF授予823B - 046481)和瑞士气氏术协会。原始数据收集由英国国家哮喘活动资助。后续数据收集由赠款资助:莱斯特NHS信托(研发),莱斯特郡和Rutland Partnership Trust,Medisearch,Trent NHS区域卫生管理局和英国卫生部(授予0020014)。玛丽大学女王和分子科学研究所学院儿科学院学报(伦敦,英国伦敦)学术儿科学院学报(伦敦)学院学术学院学报(伦敦)有助于金融2003年通过联合王国卫生部拨款(第0020014号)。
兴趣表
没有宣布。
致谢
作者想要感谢所有参与这项研究的孩子和他们的父母;T. Davis(莱斯特城西部初级保健信托基金会儿童理事会业务经理),感谢他对莱斯特郡儿童健康数据库的协助;Egger, M-P。Strippoli, M. Brinkhof(都在伯尔尼大学社会和预防医学研究所,伯尔尼大学)和P. Latzin(伯尔尼大学儿科系和社会和预防医学研究所)对手稿的宝贵意见。
脚注
此稿件具有可访问的补充数据www.www.qdcxjkg.com.
- 收到了2007年11月15日。
- 公认2008年1月8日。
- ©ERS期刊有限公司