跳到主要内容

感谢您访问nature.com。您使用的浏览器版本对CSS的支持有限。为了获得最佳体验,我们建议您使用更最新的浏览器(或关闭Internet Explorer的兼容性模式)。与此同时,为了确保继续支持,我们在显示站点时不使用样式和JavaScript。

使用OpenSAFELY分析与covid -19相关死亡相关的因素

摘要

2019冠状病毒病(COVID-19)迅速影响了全世界的死亡率1.了解谁最有可能出现严重后果的紧迫性是前所未有的,这需要新的方法来及时分析大型数据集。我们代表英国国民健康服务体系(NHS)创建了opensafe——一个安全的健康分析平台,覆盖了英国40%的患者,并将患者数据保存在一家主要初级保健电子健康记录供应商的现有数据中心中。在这里,我们使用OpenSAFELY来检查与covid -19相关死亡相关的因素。17278,392名成年人的初级保健记录与10926例与covid -19相关的死亡有关。与covid -19相关的死亡与以下因素相关:男性(风险比(HR) 1.59(95%可信区间1.53-1.65);更大的年龄和贫困(两者都有很强的梯度);糖尿病;严重哮喘;还有其他各种疾病 Compared with people of white ethnicity, Black and South Asian people were at higher risk, even after adjustment for other factors (HR 1.48 (1.29–1.69) and 1.45 (1.32–1.58), respectively). We have quantified a range of clinical factors associated with COVID-19-related death in one of the largest cohort studies on this topic so far. More patient records are rapidly being added to OpenSAFELY, we will update and extend our results regularly.

主要

2020年3月11日,在114个国家报告了11.8万例病例和4291例死亡后,世界卫生组织(世卫组织)将由严重急性呼吸综合征冠状病毒2型(SARS-CoV-2)引起的covid -19定性为大流行2.截至2020年5月6日(本研究获得最新数据的日期),全球病例已超过350万例,24万多人死于该病毒1.同一天,英国有206715例COVID-19确诊病例,30615例COVID-19相关死亡病例3.

年龄和性别是公认的导致COVID-19严重后果的风险因素:在英国,与COVID-19相关的死亡中,90%以上为60岁以上的人,60%为男性4.各种既存状况也与风险增加有关。例如,中国疾病预防控制中心在一项涉及44,672人(1,023人死亡)的研究中报告称,心血管疾病、高血压、糖尿病、呼吸系统疾病和癌症与死亡风险增加有关5;然而,修正与年龄的关系是不可能的。英国一项针对16749名COVID-19住院患者的横断面调查显示,患有心脏病、肺病和肾病以及癌症、痴呆和肥胖的患者死亡风险更高(经年龄和性别校正后的hr为1.19-1.39)。6.在法国重症监护队列中,肥胖与治疗升级相关7n= 124)和纽约医院的报告队列8n= 3615)。与吸烟有关的风险尚不清楚91011.黑人和少数族裔群体因COVID-19出现不良结果的风险增加,原因尚不清楚1213

病人护理通常通过电子健康记录进行管理,这在研究中通常使用。然而,分析电子健康记录的传统方法依赖于对历史数据小样本的间歇性提取。评估迅速出现的新死因需要新的方法。因此,我们着手在主要电子健康记录供应商的数据中心内提供一个安全的分析平台,覆盖大量NHS患者的完整、关联和化名电子健康记录,以确定与英格兰covid -19相关死亡相关的因素。

与covid -19相关死亡的关系

总共包括17,278,392名成年人(图。1;表中队列描述1).11%的个人(1,851,868)的种族记录为混合、南亚、黑人或其他种族(下称黑人和少数民族,BAME)。身体质量指数数据缺失(3,751,769;22%)、吸烟状况(720,923人;4%),种族(4,560,113;26%)和血压(1,715,095;10%)。研究人群中有10926人的关联死亡登记数据记录了与covid -19相关的死亡。

图1队列流程图。
图1

该图表显示了个体的数量(n)在不同阶段排除,并确定病例作为主要终点。

表1按患者特征划分的队列描述及COVID-19死亡人数

在研究开始90天后,18-39岁的人群中与covid -19相关的总累计死亡率低于0.01%,而在80岁及以上的男性和女性中分别上升至0.67%和0.44%(图。2).

图2:covid -19相关死亡Kaplan-Meier图。
figure2

图表按年龄和性别显示了与covid -19相关的死亡。

患者水平因素与covid -19相关死亡风险之间的关系见表2和无花果。3..年龄增长与风险密切相关,80岁或以上的人与50 - 59岁的人相比,风险增加20倍以上(完全调整HR 20.60;95%置信区间(CI) 18.70-22.68)。用弹性样条拟合年龄,观察到近似对数线性关系(扩展数据图。1).男性的风险高于女性(完全调整HR 1.59(1.53-1.65))。这些发现与在世界各地和英国的小型研究中观察到的模式一致14

表2 covid -19相关死亡的风险比和95%置信区间
图3:从多变量Cox模型估计每个患者特征的风险比。
图3

危险比以对数刻度表示。误差条表示风险比95%置信区间的极限。多重剥夺指数;肥胖I类,BMI 30-34.9;II类肥胖,BMI 35-39.9;肥胖III类,BMI≥40;OCS,口服皮质类固醇;Ref,引用组。所有风险比都根据除种族外列出的所有其他因素进行了调整。种族估计来自一个独立的模型,在那些有完整种族数据的个体中进行,并充分调整了其他协变量。 Totaln非种族模型= 17,278,392,种族模型= 12,718,279。

所有BAME群体的人比白人种族的人风险更高。仅按年龄和性别进行调整时,与白人相比,黑人、南亚人和混合种族的风险比从1.62-1.88不等,在调整所有纳入因素后降至1.43-1.48(更详细类别的结果见扩展数据表)1).此前已发现,BAME族裔与COVID-19感染风险增加和预后不良有关121315.我们的研究结果表明,在过度风险中,只有一小部分是由BAME人群中心血管疾病或糖尿病等医疗问题的较高发病率,或由于贫困程度较高所造成的。

我们发现,贫困程度越高,风险就越高,贫困程度最高的五分之一人群与贫困程度最低的人群相比,风险比为1.79,这与最近的国家统计数据一致16.同样,在这种增加的风险中,很少有可以用先前存在的疾病或临床因素来解释的,这表明其他社会因素也有重要作用。

随着肥胖的增加(完全调整HR 1.92(1.72-2.13)体重指数(BMI;公斤米−2)超过40),大多数共病与covid -19相关死亡风险较高相关,包括糖尿病(最近测量的糖化血红蛋白(HbA1c)水平至少为58 mmol mol的患者风险比更高−1)、严重哮喘(定义为近期使用口服皮质类固醇的哮喘)、呼吸道疾病、慢性心脏病、肝病、中风、痴呆、其他神经系统疾病、肾功能下降(估计肾小球滤过率较低的风险比较大;eGFR)、自身免疫性疾病(类风湿性关节炎、狼疮或银屑病)和其他免疫抑制条件(表2).那些最近(也就是最近5年)有血液系统恶性肿瘤病史的患者,其患病风险至少增加2.5倍,5年后这种风险略有下降。对于其他癌症,风险比较小,风险增加主要与最近的诊断有关。在二次分析中添加透析或终末期肾功能衰竭的病史与增加的风险相关(HR 3.69(3.09-4.39))。这些发现与其他数据基本一致,包括英国国际严重急性呼吸道和新发感染联盟(ISARIC)对英国住院的covid -19患者的研究,该研究表明,死于心脏、肺和肾脏疾病、恶性肿瘤、肥胖和痴呆的风险增加6中国的一项大型研究表明,心血管疾病、高血压、糖尿病、呼吸系统疾病和癌症与死亡率增加有关,尽管该研究缺乏年龄校正5.我们的研究结果表明,严重哮喘与更高的风险相关,这是值得注意的,因为早期数据表明,在住院或有严重后果的COVID-19患者中,哮喘的比例不足1718

吸烟与高血压的事后分析

在仅按年龄和性别进行调整的模型中,当前吸烟和以前吸烟都与较高的风险相关,但在完全调整的模型中,当前吸烟与较低的风险相关(完全调整HR 0.89(0.82-0.97)),这与此前在中国COVID-19患者中观察到的低于预期的吸烟流行率相一致10、法国11和美国19.通过在年龄、性别和吸烟模型中单独添加协变量,我们对这一问题进行了更深入的研究,发现危险比的变化主要是由对慢性呼吸道疾病的调整驱动的(调整后HR 0.98(0.90-1.06))。这和其他共病可能是吸烟的后果,强调完全调整的吸烟危害比不能被解释为因果关系,因为包括了可能调解吸烟影响的因素。因此,我们拟合了一个仅考虑人口统计学因素(年龄、性别、贫困和种族)的模型,该模型显示当前吸烟的正危险比不显著(HR 1.07(0.98-1.18))。这并不支持尼古丁的任何保护作用920.但这表明,目前吸烟带来的风险可能很小,需要随着疫情的发展和更多数据的积累来澄清。

我们同样调查了高血压风险比的变化(从1.09(1.05-1.14)调整到包括所有协变量的0.89(0.85-0.93)),发现糖尿病和肥胖是这一降低的主要原因(HR 0.97(0.92-1.01)调整到年龄、性别、糖尿病和肥胖)。考虑到血压和年龄之间的紧密联系,我们随后检查了这些变量之间的相互作用;这揭示了相互作用的有力证据(P< 0.001), 70岁以下的高血压风险较高,70岁以上的高血压风险较低(18-39岁、40-49岁、50-59岁、60-69岁、70 - 79岁和80岁及以上的年龄调整后的HRs分别为3.10(1.69-5.70)、2.73(1.96-3.81)、2.07(1.73-2.47)、1.32(1.17-1.50)、0.94(0.86-1.02)和0.73(0.69-0.78))。在老年人中,高血压和死亡率之间的负相关的原因尚不清楚,需要进一步的研究,包括对该年龄组的虚弱、共病和药物暴露的详细检查。

模型检验和灵敏度分析

平均c统计值(衡量模型区分与covid -19相关死亡的患者和没有死亡的患者的能力的指标)为0.93,范围从0(无能力)到1(完全能力)。当仅使用完整记录分析处理缺失数据或使用多重imputation(敏感性分析;扩展数据表2).在初级模型中检测到非比例危害(P< 0.001)。根据2020年4月6日较早的行政审查(在此之前,死亡率不应受到英国3月底推出的社会距离政策的影响),一项敏感性分析显示,没有非比例风险的证据(P= 0.83)。一些协变量的风险比相似,但在量级上有些大,而与剥夺程度增加的关联似乎较小(扩展数据表2).

讨论

这一安全分析平台涵盖1700多万名成人和600万名儿童的NHS患者记录,用于确定、量化和分析与covid -19相关死亡相关的因素,这是迄今为止任何国家就这一主题开展的最大规模队列研究之一。大多数共病与风险增加相关,包括心血管疾病、糖尿病、呼吸系统疾病(包括严重哮喘)、肥胖、血液系统恶性肿瘤史或近期其他癌症、肾、肝和神经系统疾病以及自身免疫性疾病。南亚人和黑人与covid -19相关的死亡风险远远高于白人,这只是部分归因于共病、剥夺或其他因素。剥夺和风险之间的强烈关联也只能部分由共病或其他因素解释。

我们的分析为关键人口统计学特征和一系列共病——这些被先天选择为与covid -19相关的疾病——如何与不良预后共同关联提供了初步图景。这些初步结果可用于预测模型的开发。我们警告不要将我们的估计解释为因果效应。例如,经过充分调整的吸烟危害比没有考虑到吸烟的因果影响,因为纳入了可能调解吸烟对与covid -19相关死亡的任何影响的共病(例如,慢性阻塞性肺病)。我们的研究强调,有必要进行精心设计的分析,专门关注吸烟对covid -19相关死亡的因果影响。同样,也需要进行分析,探讨所观察到的高血压与covid -19相关死亡之间的关联的因果关系。

优点和缺点

这项研究的最大优势在于它的规模和进行的速度。通过建立一个安全的分析平台,将日常收集的实时临床数据存储在原地,我们已经从目前大约40%的英国人口的NHS记录中得出了及时的结果。这项大规模的研究使得对罕见的曝光和多种因素的研究更加精确,同时也使得对重要信号的快速检测成为可能。随着时间的推移,我们的平台将不断扩展,提供更新的分析。另一个优点是我们使用了开放的方法:我们预先指定了我们的分析计划,并共享了我们的完整分析代码和代码列表,以供评审和重用。我们从完整的匿名纵向初级保健记录中确定了患者的人口统计数据、药物和共病情况,这些记录比住院记录的数据提供了更多的细节,并考虑了总人口而不是在医院就诊的特定个体子集。我们使用英国国家统计局(ONS)的数据审查了其他原因造成的死亡。分析按地区分层,考虑到COVID-19发病率的已知地理差异。

这项研究也有一些重要的局限性。在我们的结果定义中,我们包括了COVID-19的临床疑似(非实验室确认)病例,因为并不总是进行检测,特别是在养老院的老年患者中。然而,这可能导致一些患者被错误地识别为COVID-19。此外,一些与covid -19相关的死亡可能被错误归类为非covid -19死亡,特别是在大流行的早期阶段;然而,随着死亡人数的增加,这种不准确性很可能会迅速减少,而且在一定程度上的结果不确定——如果它与患者特征无关——不应该对我们的危险比产生偏差。由于结果罕见,观察到的关联将主要由纳入病例的患者特征驱动。我们的发现反映了个人感染的风险和一旦感染死亡的风险。我们将在opensafe平台的未来研究中考虑更详细的患者轨迹。

我们庞大的人口可能并不完全具有代表性。由于电子健康记录系统的选择在地理上存在很大差异,我们只纳入了伦敦17%的全科医生——许多早期的COVID-19病例都发生在伦敦。电子健康记录的用户界面可能会影响某些药物的处方20.2123因此,不同系统之间的编码可能是不同的。

初级保健记录是详细的和纵向的,但患者特征的数据可能是不完整的。大约26%的患者没有种族差异,但具有广泛的代表性24;关于肥胖和吸烟的数据也有所缺失。敏感性分析发现,我们的估计对缺失数据的假设是稳健的。

非比例的危险可能是由于非常大的数字或未测量的协变量。然而,社会行为的迅速变化(社交距离、屏蔽)和感染负担的变化也可能对患者群体产生不同的影响。在早期审查(在社会距离和屏蔽政策出台后不久)的敏感性分析中,几个协变量的风险比更大,这与风险更大的患者更遵守这些政策一致。相比之下,与剥夺相关的风险可能会随着时间的推移而增加。进一步的分析将探讨实施围绕COVID-19的国家举措前后的变化。

政策影响及解释

英国有一项政策,建议对根据既往健康状况被确定为对COVID-19极其脆弱的群体进行屏蔽(一直呆在家里,避免任何面对面接触)25.我们能够评估大多数这些情况与COVID-19死亡之间的关联,并证实死亡风险增加,支持有针对性地对这些人群使用额外的保护措施。我们已经证明,在BAME群体和生活在较贫困地区的人群中,与covid -19相关的死亡风险大幅增加,其中只有一小部分可归因于现有疾病。迫切需要改进保护这些群体的战略26.这些可包括在屏蔽准则和工作场所政策中对BAME群体的具体考虑。需要进行研究,以调查我们无法检查的其他因素的相互作用,包括就业、获得个人防护设备和接触感染的相关风险,以及家庭密度。

英国有大量非常详细的纵向患者数据,特别是通过初级保健,我们相信英国对全球社会有责任充分利用这些数据。OpenSAFELY在非常大的范围内证明了这是可以安全、透明和快速完成的。我们将加强开放安全平台,进一步为全球应对COVID-19紧急情况提供信息。

未来的研究

BAME人群和贫困地区人群中与covid -19相关死亡风险较高的根本原因需要进一步调查。我们建议收集有关职业暴露和生活条件的数据作为第一步。我们的方法提供的统计力量意味着,随着大流行的进展,可以更详细和尽可能早地对与较不常见因素的关联进行强有力的评估。因此,随着时间的推移,随着新病例的出现,我们将更新我们的调查结果,并针对较小的风险群体。OpenSAFELY上的开源可重用代码库支持新分析的快速、安全和协作开发;我们目前正在加速研究各种医疗和人口干预措施对COVID-19感染风险、入住重症监护病房和死亡的影响,以及其他观察分析。opensafe可以快速扩展,将更多的NHS患者记录纳入其中,新的数据来源也在不断发展。

总之,在全球突发卫生事件的背景下,我们利用1700万名NHS患者的详细初级保健记录,在保持隐私的情况下,初步了解了与covid -19相关死亡相关的因素。

方法

研究设计

我们使用与covid -19相关死亡数据相关的全国初级保健电子健康记录数据进行了一项队列研究(见“数据源”)。队列研究从2020年2月1日开始,这一天被选为第一例报告的与covid -19相关的死亡数周前和第二例实验室确诊病例后的第二天27;于2020年5月6日结束。队列研究检查了普通人群的风险,而不是在感染了SARS-COV-2的人群中。因此,无论任何SARS-COV-2检测结果如何,所有患者都被纳入。没有进行随机分组。结果评估是作为常规保健的一部分进行的,因此没有尝试任何类型的失明。然而,研究人员没有参与结果评估。

数据源

我们使用了全科医生(GP)记录中的患者数据,这些数据由全科医生软件提供商凤凰伙伴关系(TPP)管理,与英国国家统计局的死亡数据相关联。国家统计局的数据包括所有死亡信息,包括与COVID-19相关的死亡(定义为死亡证明上任何地方提到的COVID-19 ICD-10代码)和非COVID-19死亡,这些信息被用于审查。

使用opensafe访问、链接和分析了数据,opensafe是一个新的数据分析平台,创建该平台是为了解决与英国COVID-19流行病学和治疗有关的紧急问题。OpenSAFELY提供了一个安全的软件接口,允许对已驻留在电子健康记录供应商高度安全的数据中心中的匿名初级保健患者详细记录进行近实时分析,以最大限度地减少数据转移到异地时的重新识别风险;其他较小的数据集使用从NHS号码派生的匹配假名链接到相同环境中的这些数据。更多信息可以在https://opensafely.org/

OpenSAFELY分析的数据集基于使用TPP SystmOne电子健康记录系统的全科医生诊所的约2400万注册患者(约占英国人口的40%)。systemmone是一个安全的集中式电子健康记录系统,自1998年以来一直在英国临床实践中使用;它记录了全科医生和执业人员在日常初级保健中输入的数据(实时)。该系统在国家医疗服务体系(nhs)批准的全科实践系统框架下得到认可2829.从TPP SystmOne中提取的数据以前曾作为ResearchOne数据集的一部分用于医学研究30.31.从这些电子健康记录中,opensafe创建了一个匿名数据集,包含200亿行结构化数据;例如,包括对化名患者的诊断、用药、生理参数和既往调查(扩展数据图。2所有opensafe数据处理都在TPP的服务器上进行;外部数据提供者安全地传输了伪对称数据(例如从ONS传输的与covid -19相关的死亡),以连接到opensafe(扩展数据图)。2,第2级);和在GitHub上用Python开发的研究定义被拉入opensafe基础设施,用于创建每个患者一行的研究数据集(扩展数据图)。2使用合成数据开发统计代码,用于分析研究数据集;这包括检查数据范围、检查数据列的一致性和产生与预期疾病流行率进行比较的描述性统计数据的代码,以确保有效性,以及适合我们的分析模型的代码。只有两位作者(K.B.和A.J.W.)访问OpenSAFELY来运行代码;没有从TPP基础设施中删除化名的患者级数据;只有聚合的、匿名的、人工检查的研究结果才被发布发表(扩展数据图。2所有用于数据管理和分析的代码都在线存档(参见“代码可用性”)。

研究人群和观察期

我们的研究人群包括所有成年人(男性和女性,18岁及以上),目前在2020年2月1日在英国一家TPP全科医生诊所注册为活跃患者。为了参与研究,参与者被要求在全科医生执业前至少有一年的随访,以确保能够充分捕捉到患者的基本特征,并记录性别、年龄和贫困程度32(见“共”)。从2020年2月1日起对患者进行观察,并随访至患者死亡日期(无论是与covid -19相关的还是由于其他原因)或研究结束日期(2020年5月6日)的第一个日期。在这项分析中,国家统计局的死亡数据截至2020年5月11日,但我们使用了较早的审查日期,以考虑到报告可用数据最后几天的延迟。

结果

结果是与covid -19相关的死亡;这是根据英国国家统计局的死亡证明数据确定的,记录中出现了与COVID相关的ICD-10代码U071或U072。

协变量

特征包括:联合王国关于“高风险”群体指南中列出的健康状况33;先天或通过药物治疗可能导致免疫缺陷的其他常见疾病(癌症和常见自身免疫疾病);以及导致COVID-19病例严重后果的新风险因素(如血压升高)。

年龄、性别、BMI (kg m−2)和吸烟状况也包括在内。在分类中,年龄群体是:18-39岁,40-49岁,50-59岁,60-69岁,70-79岁和80岁以上。BMI是根据过去10年的体重测量确定的,限制在患者超过16岁时。肥胖的分类来源于世界卫生组织的BMI分类:没有肥胖的证据,BMI < 30;肥胖I类,BMI 30-34.9;II类肥胖,BMI 35-39.9;III类肥胖,BMI 40+。吸烟状况分为现在吸烟、以前吸烟和从不吸烟。

还考虑了以下共病:哮喘、其他慢性呼吸系统疾病、慢性心脏病、糖尿病、慢性肝病、慢性神经系统疾病、常见的自身免疫性疾病(类风湿性关节炎、系统性红斑狼疮或银屑病)、实体器官移植、脾萎、其他免疫抑制疾病、癌症、肾功能下降的证据、血压升高或高血压诊断。

疾病分组遵循关于流感感染风险的国家指南34,因此“慢性呼吸道疾病(哮喘除外)”包括慢性阻塞性肺疾病、纤维性肺疾病、支气管扩张或囊性纤维化;“慢性心脏病”包括慢性心力衰竭、缺血性心脏病和可能需要终身随访的严重瓣膜或先天性心脏病。慢性神经疾病被分为可能由心血管原因引起的疾病(中风、短暂性缺血发作、痴呆)和呼吸功能可能受损的疾病,如运动神经元疾病、重症肌无力、多发性硬化、帕金森病、脑瘫、四肢瘫痪或偏瘫和进行性小脑疾病。无脾包括脾切除术或脾功能障碍,包括镰状细胞病。其他免疫抑制疾病包括人体免疫机能丧失病毒(艾滋病毒)或已确诊的诱发永久性免疫机能丧失的疾病,或过去一年内记录的再生障碍性贫血或暂时性免疫机能丧失。血液系统恶性肿瘤与其他癌症分开考虑,以反映与血液系统恶性肿瘤相关的免疫抑制及其治疗。根据最新的血清肌酐测量确定肾功能,并使用慢性肾脏疾病流行病学协作(CKD-EPI)方程将其转换为eGFR35肾功能降低分组为eGFR 30 - 59.9或<30 ml min−1每1.73米2.对肾透析史和终末期肾功能衰竭史分别进行二次分析。血压升高定义为先前的高血压诊断或最近的收缩压≥140 mm Hg或舒张压≥90 mm Hg的记录。

哮喘是根据口服皮质类固醇作为严重程度的指示进行分组的。糖尿病根据最近15个月的糖化血红蛋白(Hba1c < 58 mmol mol)进行分组−1;Hba1c≥58 mmol mol−1;或者没有最新的测量方法)。癌症是根据第一次诊断以来的时间分组的(去年;1 - 4.9年前;5年多以前)。

其他被认为是潜在上游因素的协变量是贫困和种族。剥夺是通过多重剥夺指数(IMD,以五分位数为单位,数值越高表示剥夺越大)来衡量的,该指数来源于患者在较低的超输出区水平的邮政编码,具有较高的精确度。种族分为白人、黑人、南亚人、混血儿或其他。在敏感性分析中,对种族进行了更详细的分组。患者全科医疗的可持续性和转型伙伴关系(STP,一个NHS行政区域)被纳入,作为全国各地感染率地理差异的额外调整。

通过搜索TPP SystmOne记录的特定编码数据,从初级保健记录中获得所有协变量的信息。TPP SystmOne允许用户使用smed - ct代码的GP子集,使用smed - ct临床术语。这个子集映射到构建SystmOne的本机Read版本3 (CTV3)临床编码系统。药品的输入或处方格式符合NHS药品和器械词典(dm+d)36, SNOMED英国本地扩展图书馆。特定基础条件和药物的编码列表是从各种来源汇编的。其中包括来自OpenPrescribing.net的英国国家处方库(BNF)代码,该代码是哮喘的公开代码列表373839、免疫抑制404142、牛皮癣43系统性红斑狼疮44类风湿性关节炎4546和癌症4748以及“阅读代码2”列表,这些列表专门用来描述流感感染风险增加的人群18.Read Code 2列表添加了SNOMED代码,并与NHS质量和结果框架(QOF)寄存器进行交叉检查,然后用手动管理将其翻译为CTV3。每个代码列表的决定都被记录下来,最终列表至少由两名作者审阅。关于每个代码列表的编译和源代码的详细信息可在以下网站获得https://codelists.opensafely.org/这些列表可供更广泛的研究团体检查和重用。

统计分析

病人编号在流程图中描述(图。1).Kaplan-Meier失效函数按年龄组和性别进行估计。针对每个患者特征,拟合Cox比例风险模型,以研究天数为时间尺度,按地理区域(STP)分层,并使用限制性三次样条对性别和年龄建模进行调整。通过在缩放的Schoenfeld残差中检验零斜率,探索了比例风险假设的违例。所有患者的特征,包括年龄(再次建模为样条曲线)、性别、BMI、吸烟、IMD五分位数和上面列出的共病,然后被纳入一个单一的多变量Cox比例风险模型,并按STP分层。年龄和性别调整模型和完全调整模型的风险比以95%的置信区间报告。模型也以年龄组作为分类变量进行改装,以获得年龄组的风险比。

在初步分析中,那些BMI缺失的人被假设为不肥胖,而那些没有吸烟信息的人被假设为不吸烟,假设肥胖和吸烟都有可能被记录下来。在只有完整的BMI和吸烟数据的人群中进行敏感性分析。由于26%的个体数据缺失,种族被从主要的多变量模型中遗漏;因此,从一个单独的模型中只获得完整的种族数据的个体中获得种族的危险比。我们还从该模型中获得了其他患者特征的风险比(根据种族进行了调整),并在敏感性分析中进行了展示,以便评估初级模型中的估计是否因种族而扭曲。我们进行了一个附加的敏感性分析,使用人口校正的归责方法来处理缺失的种族4950,英格兰九个大地理区域(东部、东米德兰兹、伦敦、东北、西北、东南、西南、西米德兰兹、约克郡和亨伯)内每个种族群体的边际比例,取自年度人口调查(APS)数据(汇总2014-2016年)51.结合鲁宾规则,建立了5个估算风险比的数据集。

计算c统计量作为模型辨别的度量。由于计算时间的关系,这是通过随机抽样5000名有和没有结果的患者,并使用随机样本计算c统计量来估计的,重复10次,取平均c统计量。采用权重来解释抽样56

所有P所呈现的值是双面的。

资讯管治与诚信

NHS英格兰是数据控制者;TPP是数据处理器;opensafe的主要研究人员代表英国国民健康服务体系。opensafe的实现在TPP环境中托管,该环境通过ISO 27001信息安全标准认证,并符合NHS IG Toolkit5253;使用行业标准加密哈希技术对患者数据进行了匿名分析和链接;所有为链接到OpenSAFELY而传输的匿名数据集都是加密的;该平台通过虚拟专用网络(VPN)连接访问,仅限于一小部分研究人员,他们的具体机器和IP地址;研究人员与英国国民医疗服务体系(NHS)签订了合同,只能访问该平台启动数据库查询和统计模型;记录所有数据库活动;只有汇总的统计输出遵循最佳实践离开平台环境,以匿名化结果,例如对低单元数的统计披露控制54.open安全地研究平台遵循英国2018年数据保护法案和欧盟2016年通用数据保护条例(GDPR)的数据保护原则。2020年3月,卫生和社会保障大臣利用《2002年英国卫生服务(患者信息控制)条例》(COPI)赋予的权力,要求各组织处理机密患者信息,以保护公众健康,向公众提供医疗服务,并监测和管理COVID-19疫情和接触事件55.总之,这些为在opensafe平台上链接患者数据集提供了法律基础。获得初级保健数据的全科医生被要求分享相关卫生信息,以支持公共卫生应对大流行,并已被告知OpenSAFELY分析平台。本研究得到了健康研究管理局(REC参考文献)的批准20./LO/0651)和伦敦卫生和热带医学学院(LSHTM)伦理委员会(参考文献21863)。牛津大学不需要进一步的伦理或研究治理批准,但批准文件的副本被审查并存档。担保人:B.G.和L.S.

患者和公众的参与

患者没有正式参与开发这个特定的研究设计。我们开发了一个公众网站(https://opensafely.org/),允许任何患者或公众成员就这项研究或更广泛的OpenSAFELY项目与我们联系。这些反馈将被用来完善和优先考虑我们的opensafe活动。

报告总结

关于研究设计的进一步信息可在自然研究报告摘要链接到这篇论文。

数据可用性

所有数据都在opensafe平台内安全连接、存储和分析(https://opensafely.org/).详细的假名患者数据可能是可识别的,因此不共享。在没有事先供资的情况下,我们迅速交付了opensafe数据分析平台,以便在全球COVID-19卫生突发事件背景下对紧急研究问题进行及时分析:现在平台已经建立,我们正在开发一个正式流程,供外部用户与英国国家医疗服务体系(NHS)合作请求访问。这一过程的细节将很快在OpenSAFELY网站上公布。

代码的可用性

使用Python 3.8和SQL进行数据管理,使用Stata 16.1和Python进行分析。所有代码都在MIT开放许可下公开共享,以供评审和重用。所有用于数据管理和分析的代码都在线存档在https://github.com/opensafely/risk-factors-research.所有临床和药物代码列表均可公开用于检查和重用https://codelists.opensafely.org/

参考文献

  1. 1.

    谁。2019冠状病毒病疫情报告。https://www.who.int/emergencies/diseases/novel-coronavirus-2019/situation-reports(2020)。

  2. 2.

    谁。世卫组织总干事2020年3月11日在2019冠状病毒病(COVID-19)疫情媒体通报会上的开幕词https://www.who.int/dg/speeches/detail/who-director-general-s-opening-remarks-at-the-media-briefing-on-covid-19---11-march-2020(2020)。

  3. 3.

    英格兰社会关怀和公共卫生部。英国冠状病毒(COVID-19)病例数量和风险。https://web.archive.org/web/20200501084711/https://www.gov.uk/guidance/coronavirus-covid-19-information-for-the-public(2020)。

  4. 4.

    英国国民健康保险制度。COVID-19日死亡人数。https://web.archive.org/web/20200501094237/https://www.england.nhs.uk/statistics/statistical-work-areas/covid-19-daily-deaths/(2020)。

  5. 5.

    邓刚,尹明,陈晓霞,曾峰。44,672例COVID-19患者病死率的临床决定因素。暴击。护理24, 179(2020)。

    文章谷歌学者

  6. 6.

    Docherty, A. B.等。使用ISARIC世卫组织临床特征规程对16749名英国住院COVID-19患者的特征进行了研究。预印在medRxivhttps://doi.org/10.1101/2020.04.23.20076042(2020)。

  7. 7.

    等。需要有创机械通气的严重急性呼吸综合征冠状病毒-2 (SARS-CoV-2)患者的高肥胖率肥胖28, 1195-1199(2020)。

    中科院文章谷歌学者

  8. 8.

    莱特,J.等。60岁以下患者的肥胖是COVID-19住院的一个危险因素。中国。感染。说2020, ciaa415(2020)。

    谷歌学者

  9. 9.

    Simons, D., Shahab, L., Brown, J.和Perski, O.吸烟状况与SARS-CoV-2感染、住院和COVID-19死亡率的关系:一项活体快速证据综述。Qeioshttps://doi.org/10.32388/UJR2AW.2(2020)。

    文章谷歌学者

  10. 10.

    关,W.-J。et al。2019冠状病毒病的临床特征心血管病。j .地中海382, 1708-1720(2020)。

    中科院文章谷歌学者

  11. 11.

    Miyara, M.等。有症状的COVID-19患者每日主动吸烟发生率低。Qeioshttps://doi.org/10.32388/WPP19W.3(2020)。

    文章谷歌学者

  12. 12.

    Khunti, K, Singh, A. K, Pareek, M. & Hanif, W.种族与covid-19的发病率或结局有关吗?Br。地中海J。369, m1548(2020)。

    文章谷歌学者

  13. 13.

    财政研究所。是否有些民族比其他民族更容易感染2019冠状病毒病?https://web.archive.org/web/20200502130148/https://www.ifs.org.uk/inequality/chapter/are-some-ethnic-groups-more-vulnerable-to-covid-19-than-others/(2020)。

  14. 14.

    英国公共卫生部。COVID-19风险和结果的差异。https://assets.publishing.service.gov.uk/government/uploads/system/uploads/attachment_data/file/889195/disparities_review.pdf(2020)。

  15. 15.

    重症监护国家审计和研究中心。COVID-19报告。https://web.archive.org/web/20200425133758/https://www.icnarc.org/Our-Audit/Audits/Cmp/Reports(2020)。

  16. 16.

    国家统计局。英格兰和威尔士每周登记的死亡人数,暂定:截至2020年4月17日的一周。https://web.archive.org/web/20200430191844/https://www.ons.gov.uk/peoplepopulationandcommunity/birthsdeathsandmarriages/deaths/bulletins/deathsregisteredweeklyinenglandandwalesprovisional/weekending17april2020(2020)。

  17. 17.

    Halpin, D. M. G, Faner, R., Sibila, O., Badia, J. R. & Agusti, A.慢性呼吸道疾病或其治疗是否影响SARS-CoV-2感染的风险?和出版的《柳叶刀》杂志上。地中海8, 436-438(2020)。

    中科院文章谷歌学者

  18. 18.

    Boddington, n.l.等。英国COVID-19:前几百例(FF100)病例的流行病学和临床特征:描述性病例系列和病例对照分析。预印在medRxivhttps://doi.org/10.1101/2020.05.18.20086157(2020)。

  19. 19.

    Rentsch, c.t.等人。2026,227名54-75岁的美国退伍军人进行Covid-19检测、住院和重症监护。预印在medRxivhttps://doi.org/10.1101/2020.04.09.20059964(2020)。

  20. 20.

    Farsalinos, K, Barbouni, A. & Niaura, R.吸烟、电子烟和COVID-19住院。Qeioshttps://doi.org/10.32388/Z69O8A.13(2020)。

  21. 21.

    麦肯纳,B.等人。电子健康记录界面设计对环孢素、他克莫司和地尔硫卓不安全处方的影响:英国NHS初级保健的队列研究。J. Med. Internet Res。https://doi.org/10.2196/17003(2020)。

  22. 22.

    Opondo, d等。荷兰老年人共开非甾体抗炎药和胃保护药的质量及其与电子病历的关系《公共科学图书馆•综合》10, e0129515(2015)。

    文章谷歌学者

  23. 23.

    Ghost品牌仿制药:为什么仿制阿托伐他汀的成本不同?循证医学DataLabhttps://web.archive.org/web/20200502135915/https://ebmdatalab.net/ghost-branded-generics-why-does-the-cost-of-generic-atorvastatin-vary%ef%bb%bf/(2018)。

  24. 24.

    马瑟,R.等。英国初级保健和医院数据库中种族数据的完整性和可用性。J.公共卫生36, 684-692(2014)。

    文章谷歌学者

  25. 25.

    英国公共卫生部。关于屏蔽和保护临床上极易感染COVID-19的人群的指导意见。https://web.archive.org/web/20200501090127/https://www.gov.uk/government/publications/guidance-on-shielding-and-protecting-extremely-vulnerable-persons-from-covid-19/guidance-on-shielding-and-protecting-extremely-vulnerable-persons-from-covid-19(2020)。

  26. 26.

    Marmot, M., Friel, S., Bell, R., Houweling, t.a.和Taylor, S.用一代人的时间缩小差距:通过对健康的社会决定因素采取行动实现健康公平。《柳叶刀》372, 1661-1669(2008)。

    文章谷歌学者

  27. 27.

    英国政府。英国冠状病毒(COVID-19)病例。https://web.archive.org/web/20200502045059/https://coronavirus.data.gov.uk/(2020)。

  28. 28.

    NHS的数字。GP系统的选择。https://digital.nhs.uk/services/gp-systems-of-choice(2020)。

  29. 29.

    NHS的数字。未来GP IT系统和服务。https://digital.nhs.uk/services/future-gp-it-systems-and-services(2020)。

  30. 30.

    克莱格,A.等。利用常规初级保健电子健康记录数据开发和验证电子脆弱指数。年龄老化45, 353-360(2016)。

    文章谷歌学者

  31. 31.

    哈科特,S.等。利用国家综合征监测数据估计英国乙型脑膜炎球菌疫苗接种后婴儿发烧的初级保健出勤率。疫苗36, 565-571(2018)。

    文章谷歌学者

  32. 32.

    Lewis, J. D, Bilker, W. B, Weinstein, R. B. & Strom, B. L.全科医学研究数据库中自注册以来的时间与测量发病率之间的关系。Pharmacoepidemiol。药物Saf14, 443-451(2005)。

    文章谷歌学者

  33. 33.

    英国公共卫生部。英国所有人保持社交距离的指南。https://web.archive.org/web/20200429043059/https://www.gov.uk/government/publications/covid-19-guidance-on-social-distancing-and-for-vulnerable-people/guidance-on-social-distancing-for-everyone-in-the-uk-and-protecting-older-people-and-vulnerable-adults(2020)。

  34. 34.

    英国公共卫生部。英国免疫时间表:绿皮书,第11章。https://www.gov.uk/government/publications/immunisation-schedule-the-green-book-chapter-11(2013)。

  35. 35.

    列维,A. S.等。估计肾小球滤过率的新方程。安。实习生。地中海150, 604-612(2009)。

    文章谷歌学者

  36. 36.

    麦坎娜,b, dm+d是多少?英国国家医疗服务体系药物和器械词典。循证医学DataLabhttps://web.archive.org/web/20200502143707/https://ebmdatalab.net/what-is-the-dmd-the-nhs-dictionary-of-medicines-and-devices/(2019)。

  37. 37.

    尼森,F.等。临床实践研究数据链(CPRD)中哮喘记录的验证。BMJ开放7, e017474(2017)。

    文章谷歌学者

  38. 38.

    Morton, C. & Douglas, I. OpenSAFELY代码列表:哮喘诊断。https://codelists.opensafely.org/codelist/opensafely/asthma-diagnosis/(2020)。

  39. 39.

    麦克南,B.和道格拉斯,I. OpenSAFELY编码:哮喘口服泼尼松龙药物。https://codelists.opensafely.org/codelist/opensafely/asthma-oral-prednisolone-medication/(2020)。

  40. 40.

    格林特,D. J.等。在英国的一项观察队列分析中,无意中给免疫抑制的个体注射带状疱疹活疫苗的安全性。BMJ开放10, e034886(2020)。

    文章谷歌学者

  41. 41.

    McDonald, H. & Smeeth, L. OpenSAFELY编码:永久性免疫抑制。https://codelists.opensafely.org/codelist/opensafely/permanent-immunosuppression/(2020)。

  42. 42.

    Smeeth, L.和McDonald, H. OpenSAFELY编码:暂时性免疫抑制。https://codelists.opensafely.org/codelist/opensafely/temporary-immunosuppression/(2020)。

  43. 43.

    黄,施密特,s.a.j . &兰根,S.临床代码表-银屑病-阅读代码[数据收集]。https://doi.org/10.17037/DATA.00001255(伦敦卫生与热带医学学院,2019年)。

  44. 44.

    福布斯,H.等人。临床代码表- SLE代码[数据收集]。https://doi.org/10.17037/DATA.162(伦敦卫生与热带医学学院,2014)。

  45. 45.

    Pujades-Rodriguez等人。类风湿关节炎与12种心血管疾病初始表现的发病率:英国一项人口记录关联队列研究《公共科学图书馆•综合》11, e0151245(2016)。

    文章谷歌学者

  46. 46.

    Morton, C.和Tomlinson, L. Open SAFELY代码列表:RA/SLE/牛皮癣。https://codelists.opensafely.org/codelist/opensafely/ra-sle-psoriasis/(2020)。

  47. 47.

    斯壮曼,H.等人。20例成人癌症幸存者特定心血管疾病的中长期风险:一项基于人群的队列研究,使用多个关联的英国电子健康记录数据库。《柳叶刀》394, 1041-1054(2019)。

    文章谷歌学者

  48. 48.

    莫顿,C.和沃克,A.开放安全代码列表:癌症不包括肺癌和血液病。https://codelists.opensafely.org/codelist/opensafely/cancer-excluding-lung-and-haematological/(2020)。

  49. 49.

    卡朋特律师事务所和肯沃德律师事务所。多重归责法及其应用(John Wiley & Sons, 2012)。

  50. 50.

    范,T. M.,卡彭,J. R.,莫里斯,T. P.,伍德,a . M.和彼得森,I.类别回归模型中二元/类别协变量的人口校正多重imputation。地中海统计。38, 792-808(2019)。

    MathSciNet文章谷歌学者

  51. 51.

    国家统计局。人口特征研究表。https://web.archive.org/web/20200513113451/https://www.ons.gov.uk/peoplepopulationandcommunity/populationandmigration/populationestimates/datasets/populationcharacteristicsresearchtables(2019)。

  52. 52.

    NHS的数字。BETA——数据安全标准。https://digital.nhs.uk/about-nhs-digital/our-work/nhs-digital-data-and-technology-standards/framework/beta---data-security-standards(2020)。

  53. 53.

    NHS的数字。数据安全和保护工具包。https://digital.nhs.uk/data-and-information/looking-after-information/data-security-and-information-governance/data-security-and-protection-toolkit(2018)。

  54. 54.

    NHS的数字。ISB1523:公布卫生和社会保健数据的匿名化标准。https://digital.nhs.uk/data-and-information/information-standards/information-standards-and-data-collections-including-extractions/publications-and-notifications/standards-and-collections/isb1523-anonymisation-standard-for-publishing-health-and-social-care-data(2019)。

  55. 55.

    卫生和社会福利部。冠状病毒(COVID-19):通知各组织共享信息。https://web.archive.org/web/20200421171727/https://www.gov.uk/government/publications/coronavirus-covid-19-notification-of-data-controllers-to-share-information(2020)。

  56. 56.

    Sanderson, J, Thompson, s.g., White, I.R, Aspelund, T. & Pennells, L.利用病例队列数据推导和评估风险预测模型。BMC医学方法13, 113(2013)。

    文章谷歌学者

下载参考

确认

所有作者均来自The OpenSAFELY Collaborative。我们非常感谢TPP技术运营团队在整个工作过程中提供的所有支持;从英国国家医疗服务体系(NHS England)和英国国家医疗服务中心(NHSX)的信息治理和数据库团队获得帮助;并与H. Drysdale、B. Nicholson、N. DeVito、W. Hulme、I. Lipska、J. Morley、J. Quint和T. Pham就疾病表征、编码和方法学进行进一步讨论。这项工作还没有获得专门的资金。太平洋合作伙伴组织在国家紧急情况下无偿提供其数据中心的技术专门知识和基础设施。b.g关于更广泛地在医疗保健方面更好地利用数据的工作目前得到以下机构的部分资助:国家卫生研究所牛津生物医学研究中心、国家卫生研究所牛津和泰晤士河谷应用研究合作机构、莫恩-西湖基金会、英格兰国民保健制度和健康基金会;所有数据实验室的工作人员都得到了b.g的资助。L.S.报告了Wellcome、MRC、NIHR、UKRI、英国文化协会、GSK、英国心脏基金会和英国糖尿病协会在这项工作之外的资助;K.B.拥有由惠康和皇家学会联合资助的亨利·戴尔爵士奖学金; H.I.M. is funded by the NIHR Health Protection Research Unit in Immunisation (a partnership between Public Health England and LSHTM); A.Y.S.W. holds a fellowship from BHF; R.M. holds a Sir Henry Wellcome fellowship funded by the Wellcome Trust; E.J.W. holds grants from MRC; R.G. holds grants from NIHR and MRC; I.J.D. holds grants from NIHR and GSK; and H.F. holds a UKRI fellowship. The views expressed are those of the authors and not necessarily those of the NIHR, NHS England, Public Health England or the Department of Health and Social Care. The funders had no role in the study design; the collection, analysis and interpretation of data; the writing of the report; and the decision to submit the article for publication.

作者信息

从属关系

作者

贡献

B.G.构思了平台和方法;B.G.和L.S.领导整个项目,是担保人;S.B.负责软件;E.J.W和K.B.领导了统计分析;C.E.M.和A.J.W.负责代码列表和实现;A.M.领导信息治理。贡献如下:数据策划、C.B、J.P、J.C、S.H、S.B、D.E、P.I.和C.E.M.;分析,e.j.w., k.b., A.J.W.和C.E.M.;融资收购,B.G.和L.S.;信息治理:a.m.、b.g.、C.B.和J.P.; methodology, E.J.W., K.B., A.J.W., B.G., L.S., C.B., J.P., J.C., S.H., S.B., D.E., P.I., C.E.M., R.G., D.H. and R.P.; disease category conceptualization and codelists, C.E.M., A.J.W., P.I., S.B., D.E., C.B., J.C., J.P., S.H., H.J.C., K.B., S.B., A.M., B.M., L.T., I.J.D., H.I.M., R.M. and H.F.; ethics approval, H.J.C., E.J.W., L.S. and B.G.; project administration, C.E.M., H.J.C., C.B., S.B., A.M., L.S. and B.G.; resources, B.G., L.S. and F.H.; software, S.B., D.E., P.I., A.J.W., C.E.M., C.B., F.H., J.C. and S.H.; supervision, B.G., L.S. and S.B.; writing (original draft), H.J.C., E.J.W., K.B., B.M., C.E.M., A.M., B.G. and L.S.; and writing (review and editing), C.B., C.E.M., H.J.C., E.J.W., K.B., S.B., A.M., B.M., L.T., I.J.D., H.I.M., R.M., A.J.W. and S.J.W.E. All authors were involved in design and conceptual development and reviewed and approved the final manuscript.

相应的作者

对应到Ben Goldacre

道德声明

相互竞争的利益

所有作者已在www.icmje.org/coi_disclosure.pdf上完成国际医学期刊编辑委员会(ICMJE)统一披露表。C.B, J.P, F.H, J.C.和s.h是TPP的雇员。A.M.是2019年4月至9月NHS数字部门的临时首席医疗官(左为2020年1月底的NHS数字部门),2014-2015年英国NHS数字临床冠军。所有其他作者都没有相互竞争的利益。

额外的信息

同行评审信息自然感谢David Christiani, Jeffrey Morris和其他匿名审稿人对这项工作的同行评审所做的贡献。同行评审报告可用。

出版商的注意施普林格自然对出版的地图和机构附属的管辖权要求保持中立。

扩展的数据图和表

图1估计的对数转换危险率按年龄年。

从主要的完全调整模型包含一个四结三次样条年龄,并调整表中列出的所有协变量2除了种族。

图2 opensafe平台中的数据流示意图。

opensafe平台体系结构概述。电子健康记录。

扩展数据表1详细种族类别的调整风险比
表2敏感性分析的风险比和95%置信区间

补充信息

权利与权限

转载及权限

关于本文

通过CrossMark验证货币和真实性

引用本文

威廉森,e.j.,沃克,a.j.,巴斯卡兰,K。et al。使用OpenSAFELY分析与covid -19相关死亡相关的因素。自然584年,430 - 436(2020)。https://doi.org/10.1038/s41586-020-2521-4

下载引用

进一步的阅读

评论

通过提交评论,您同意遵守我们的条款而且社区指导原则.如果您发现一些滥用或不符合我们的条款或指导方针,请标记为不适当。

搜索

快速链接

自然简报

报名参加自然简报时事通讯——关于科学的重要信息,每天免费发送到您的收件箱。

在你的收件箱里免费获取每日最重要的科学报道。 注册《自然简报》