在2000年至2015年之间,非洲的儿童成长失败

  我们的研究遵循准确和透明的健康估计报告(收集)的指南。我们的分析提供了基于单变量生长标准标准,对5岁以下儿童(扩展数据1)的患病率估计了,该标准的年龄特定年龄和体重是针对健康参考人群的同一年龄的儿童的基准标准的4,5。发育迟缓,浪费和体重不足定义为Z分别低于参考年龄(HAZ),重量高(WHZ)和重量年龄(WAZ)的参考中位数的两个或多个标准偏差。我们的主要目标是以高分辨率提供整个非洲大陆的普遍预测,我们已经使用方法来提供最佳的样本外预测性能,但以推理理解为代价。我们以2000年至2015年的年度决议在51个国家 /地区的51个国家 /地区的5×5公里网格上对每个指标的普遍性进行了建模。这包括非洲大陆的所有48个国家,以及我们拥有的岛屿,包括马达加斯加,科莫罗斯,科莫罗斯,科莫罗斯和tométomé和Príncipe。我们没有估计无法为岛上提供可用的调查数据的岛屿国家,包括毛里求斯,塞舌尔和佛得角。在协调数据之后,我们实现了一个集合建模框架,该框架将其输入具有相关时空误差的贝叶斯广义线性模型。我们从合适的后验分布中获得了1,000张抽奖,并将抽奖合并为1,000个候选者5×5公里的分辨率图,这些图用于生成我们所有的最终结果。分析步骤及其局限性将在下面进行详细描述,并在补充信息中找到其他细节。   我们从家庭调查系列中提取了5岁以下儿童的个人级别的身高,体重和年龄数据,包括人口统计和健康调查(DHS),多个指标集群调查(MICS),生活水平测量研究和核心福利指标调查表(CWIQ)(CWIQ),以及其他国家特定的儿童和营养Surveys Surveys 24,51,51,51,51,51,51,52。每个单独的记录都与一个集群,一群邻近家庭或充当主要采样单元的“村庄”相关联。一些调查包括该调查中每个群集的地理坐标或精确地点名称(50,142个发育迟缓的簇,浪费49,564个,体重不足50,078)。在没有地理坐标的情况下;每个群集的坐标,我们将数据分配给调查中最小的可用行政区域单元,同时纠正调查样本设计53,54。这些管理单元的边界信息是直接从调查中作为ShapeFiles获得的,或通过与全球管理单元层中的Shapefile进行匹配44数据库或全球管理区域的数据库55。对于某些案例,使用调查管理员提供的ShapeFiles或根据调查文档创建自定义ShapeFiles。在相关区域上,这些面积数据通过人口加权采样方案重新采样至每个角度观察的10,000个坐标位置49。在采样位置上的K-均值聚类将采样的点减少到一组k-均值的质心,充当社区位置的代理,每个集群中的点数数量都会告知给出点的权重。这些质心被视为观察的地理位置,并且在可能的评估中,伪观察的次数下降,以说明我们在观察的确切位置中的不确定性。按样本量加权, GPS置换的集群至少贡献了每个指标总数据的47.4%,并且重新采样的Areal数据贡献了其余部分。扩展数据图5,6显示了从2000年到2015年按类型和国家 /地区按类型和国家 /地区的发育率供应。浪费和体重不足数据可用性可在补充图2、3中找到。   使用每个人的身高,体重和年龄数据,使用年龄,性别和指标特定的LMS值从2006年WHO儿童生长标准中计算出来,该值考虑使用MU参数的分布中心以及使用Sigma参数的分布分布的lambda参数来考虑分布分布偏斜。LMS方法允许进行高斯Z分数计算,并将比较应用于偏斜的非高斯分布上56。然后将这些微数据折叠成中度发育迟缓,浪费和体重不足的集群级或面积级别的患病率(Haz <-2s.d.,whz <-2s.d.和Waz <-2s.d。提供了索马里粮食安全和营养分析单位的数据,因为已经崩溃了集群级别的患病率(使用WHO 2006年标准)。   出于以下原因而排除了某些数据源:面向数​​据的调查权重,性别变量缺失,年龄粒度不足(以月为单位),用于0-2岁儿童的HAZ和WAZ计算,不完整的采样(例如,只有0-3岁的儿童为0-3岁),或者是不受欢迎的数据(如调查量或通过user -seruse seluse ofersectiontor的确定)。在每个来源中,排除了样本量的多边形调查簇。由于此处描述的原因,不信任的数据专门指的是六个调查。两个数据集,分别是2009 - 2010年加纳社会经济小组调查和2005年的布基纳Faso CWIQ,被排除在外,因为根据一个或多个指标所报告的全国性流行价值是基于在其他七个加纳和其他Burkina Faso Sources中看到的国家 /地区级别的趋势。此外,数据仅解决到第一个管理细分。这与非常粗糙的空间分辨率相结合,使我们的地理空间目的的少量使用数据。另外两个来源,分别是2014年的MICS KENYA KAKAMEGA和BUNGOMA调查,是因为根据调查文件,“人体测量数据对体重和身高都具有数字偏好为重量”,这意味着测量值是对某些数字的偏好,以相当大的偏见。排除了2015年埃塞俄比亚生活水平的测量研究 - 对农业的综合调查被排除在外,因为奥加登地区儿童生长失败的低患病率被确定为儿童营养领域的专家是不现实的。最后,由于旨在估计肝炎的患病率和某些其他非传染性疾病危险因素,因此2015年埃及特殊DHS被排除在外,因为非比例样本分配旨在估计调查抽样不等于其余的调查。   我们估计了从2000年到2015年的发育迟缓,浪费和体重不足的患病率,该模型使我们能够考虑随着时间的推移不断测量的数据点。因此,该模型还可以使我们可以在每月或更精细的时间分辨率上预测。但是,我们在计算上受到时空时间协变量的时间分辨率的限制。为了说明观察每一年内的季节性,通过GBD57定义的区域将周期性的花纹拟合到数据(扩展数据图2)。   由于浪费的急性性质及其相对的时间瞬时,因此可以预处理浪费数据,以说明观察到的每一年的季节性。使用面试的月份和国家级的固定效果作为解释变量,将广义添加剂模型(GAM)安装在浪费数据中,而WHZ作为响应。使用了12个月的面试月定期样条,以及在数据集和国家 /地区级随机效果的整个过程中平滑的样条。GAMS由GBD57定义的区域(图7扩展数据)安装到数据中,以允许整个非洲大陆57的季节性调整。拟合模型后,仅使用周期性样条的拟合来调整单个WHZ观测值,以便每个测量与代表周期性样条中平均一天的一天一致。季节性调整引入了原始数据相对较小的变化。该分析无法在缺少访谈日期的来源上进行,这些日期被排除在浪费数据之外。有关更多详细信息,请参见补充信息,并在补充图5、6中显示了调整。   为了利用观察到的位置到整个时空结构域的强度,我们编制了几个5×5公里的栅格层,包括非洲CGF可能的社会经济和环境相关性(参见补充表3和补充表3和补充图4)。在审查了有关其影响的证据和合理的假设之后,这些协变量是根据对CGF指标进行预测的潜力而选择的。为了最好地匹配我们的观察值,从而预测CGF指标的动态变化,因此优先考虑对时间动态数据集的获取。在包括的37个协变量中,有23个是动态的,在每个估计期间或中期年度估计值中被重新格式化为概要平均值。其余14个协变量层是静态的,并且在所有建模年份都均匀地应用。此外,我们还使用了许多在每个国家和年份内都持续不变的协变量:具有改进的厕所类型的人口百分比,并且人均延迟分配收入,如20161年GBD 20161中CGF的预测性。国家 /地区级别的年龄级别的死亡率是由于GBD 2016所造成的,因为GBD 2016年造成的饥荒也包括在该模型中。可以在补充信息中找到更多信息,包括所有协变量的图。   为了选择协变量并捕获它们之间可能的非线性效应和它们之间的复杂相互作用28。对于每个区域,将三个子模型安装在我们的数据集中,使用我们的所有协变量数据作为解释性预测指标:GAM,增强回归树和Lasso回归。使用五倍的交叉验证拟合每个子模型,以避免过度拟合,并且从五个持有物中的样本外预测汇编成该模型的一组全面的预测集。此外,还使用100%的数据运行相同的子模型,并创建了一套样本中的预测。在执行模型拟合时,将五组样本外模型预测作为解释性协变量送入完整的地统计模型。使用拟合的完整地统计学模型生成预测时,从子模型中的样本内预测用作协变量。最近的一项研究表明,这种整体方法可以将预测有效性提高高达25%的型号28。可以在补充方法中找到集合协变量建模的更多详细信息,可以在补充图11中找到示例预测抹布。   二项式计数数据是在贝叶斯分层模型框架内使用logit链接函数以及在空间和时间上显式分层的概括性线性回归模型中建模的,以适应我们每个指标在非洲五个区域的普遍性,这些指标在GBD57中定义为gbd57(“ Northern”,“ northern”,“ sestern”,“ southern”,“'',“中央”,'和east'和easter's eSters'和easter'和easters'和easters'和easter's east; see east; see east; easter's east; easter's east; easters'';GBD研究设计试图基于两个主要标准创建区域:流行病学同质性和地理连续性57(参见扩展数据图7)。对于每个GBD区域,我们明确地编写了定义贝叶斯模型的层次结构,如下所示:   对于每个指标和区域,我们在样本量Ni中对群集I的儿童数量进行了建模,这些NI在二项式计数数据中受到指标,CI。我们抑制了符号,但是计数(CI),概率(PI),来自三个子模型(XI)的预测和残留项都在时空时间坐标处进行索引。概率(PI)既代表了时空 - 时间位置的年龄,也代表了单个孩子与风险因素折磨的可能性,因为他们生活在该特定位置。我们指标的年度患病率(PI)的逻辑被建模为三个子模型(GAM,增强回归树和Lasso回归),XI,相关的时空误差术语()和独立的块状效应的线性组合。子模型上的系数(β)代表其在平均logit链接中的各自的预测性加权,并将其限制在1中。为了使这种约束以任何意义,我们确保在没有链接空间(logit)中输入INLA(集成嵌套的Laplace近似值)中的子模型的预测(link logit)28,而无需中心。联合误差项()说明了在考虑子模型协变量的预测效应和块()的预测效应后仍然存在的单个数据点之间的残留时空自相关,而块()是每个数据点的独立误差项,代表该观察结果的不可减至误差。残差()在时空中以零为中心的时空中的三维高斯过程建模,并具有由空间和时间协方差内核的Kronecker构建的协方差矩阵。空间协方差(σ空间)是使用各向同性和固定的Matérn函数和时间协方差(σTime)建模的 作为在模型中代表的16年中的年度自回旋订单-1功能。这种方法利用数据的残余相关结构更准确地预测了没有数据的位置的普遍性估计,同时还可以传播数据对不确定性估计的依赖性59。使用r inla60,61中的计算有效且准确的近似值拟合后验分布,随机部分微分方程62近似与高斯过程残差。像素级的不确定性间隔是由1,000个抽奖(即统计上合理的候选地图)生成的63由建模参数的后验估计分布创建的。关于地统计模型和估计过程的其他细节可以在补充方法中找到。   为了将像素级估计值转换为一系列对广泛的潜在用户社区有用的信息,这些估计是从1,000个候选地图到第二个行政分区,第一个行政细分和国家级使用人口加权条件模拟的国家级的汇总。这种汇总还可以对2000、2005、2010和2015年国家GBD 20161估算的估计进行校准。有关校准的更多详细信息可以在“估算后”部分中找到。   尽管该模型可以预测可用的栅格协变量所覆盖的所有位置,但所有最终模型输出被归类为“贫瘠或稀疏植被”的所有最终模型输出,均根据最近可用的MODIS MODIS卫星数据(2013)掩盖,以及总人口密度少于10个个人的总人口密度少于1×1-km的数据,并在2015年中宣布了该速度的数据。决策者。   为了利用2016年GBD中包含的国家级别数据,但在我们当前的地理空间建​​模框架的范围之外,并确保这些估计值和GBD 2016年国家级估算之间的完美校准,我们对1,000个候选人MAPS1中的每个估计进行了事后校准。对于每次后抽签,我们将人口加权的像素聚合计算为国家一级,并将这些国家的估计值与类似且可用的GBD 20161国家 /地区估计(2000年,2005年,2010年和2016年的所有国家)进行了比较。为了产生2015年的国家水平估计,用于校准2015年5×5公里地图,我们在2010年至2016年之间进行了线性插值。我们将耙开因子定义为GBD 20161估计与我们目前的估计值与我们目前的估计与线性插值因素之间的比率,在一个可用的年份之间,所有国家 - 近年对产生了耙开因子。最后,我们将每个像素在一个国家 - 年对乘以其相关的耙子因子。这确保了我们的地理空间估计值和GBD 20161年国家水平估计之间的完美校准,同时保留了我们估计的国内地理空间和时间变化。   所有三个指标的耙开因子比率中位数为0.999(四分位数范围为0.920–1.096),表明与GBD 20161年估计非常紧密一致。在补充图40-42中可以找到该分析中的国家水平估计与GBD 20161估计的散点图。   使用空间分层的五倍截面交叉验证对模型进行验证。为了通过尊重数据中的某些空间相关性来提供更严格的分析,通过在不同的空间分辨率上组合空间连续数据的集合来创建保留集,例如,第一个管理细分。通过计算偏差(平均误差),总方差(根平方误差)和95%的数据覆盖范围来进行验证,以及观察到的数据和预测之间的相关性。所有验证指标均根据五倍交叉验证的样本外预测进行计算。我们比较了五个不同的模型公式(有或没有空间时间误差的堆叠集合,带有和没有空间时间误差的原始卫星协变量,以及使用样本外预测指标的高斯过程空间 - 没有任何协变量的高斯过程误差)。结果显示在补充方法的“模型验证”部分中,其中我们表明,使用堆叠的集合协变量与时空误差一致地在所有三个指标上均超过其他模型。   在可能的情况下,将这些模型的结果与其他现有估计值进行了比较,例如补充图43所示。此外,检查了空间和时间自相关的测量,以验证数据中的正确识别,拟合和计算数据中复杂的时空相关结构,以验证正确的识别和拟合数据。我们发现,在数据观察位置的后验平均预测与观察到的患病率比例分别为0.70、0.66和0.76之间的样本大小的加权皮尔逊的相关性分别为0.70、0.66和0.76,分别在像素水平上分别在国家级别,在国家级别分别在像素水平上分别为0.98、0.96和0.99。在像素水平上分别浪费,浪费和体重分别为0.63、0.58和0.69,在像素水平上分别为0.63、0.58和0.69,在国家一级分别为0.96、0.95和0.98。我们还使用各种样本外验证策略来评估模型的拟合度。例如,对于stughting,我们证明,在五年内汇总到国家水平的模型平均平均均值误差较小(0.020,0.020,从0.017到0.023),平均平均误差很小,平均误差很小(0.0175,0.001-0.012)(0.001-0.012),平均覆盖率良好的95%覆盖率(93.25%的平均覆盖率)(93.25%的平均覆盖率)。与现有的小面积估计值(补充图31)。所有模型验证程序和相应的结果均在补充方法中提供。   为了将过去15年中CGF患病率提高的估计提高率与满足WHO GNT所需的改进率相比,我们使用适用于估计的最后一年的AROC进行了简单的预测。由于我们许多协变量缺乏可用的预测,因此无法获得完整的预测。   对于每个CGF指标i,我们通过logit转换我们的16年后平均患病率估计,并计算每对相邻年之间的年度变化率,从2001年开始,我们计算了每个像素J处的日志添加年度变化率,并计算了16年的后验均值估计值。   然后,我们通过在多年来取得加权平均值来计算每个指标 - 像素的加权AROC,在该平均值中,较新的AROC在平均值中的权重更大。我们将权重定义为:   多年来,可以选择γ的重量不同。对于这组投影,我们选择了γ= 1,从而产生了一种线性加权方案,该方案已经过测试和审查,用于投影与健康相关的SDGS9。对于任何指标和任何像素,我们然后计算出平均AROC为:   最后,我们通过在我们的平均2015年平均患病率估计中应用每个像素的年度变更率的十年来计算预测:   该投影方案类似于GBD 2016年测量进度和预计与健康相关的可持续发展目标9中使用的方法。可以在补充方法中找到对投影方法和所涉及的隐含假设的评估。   WHO GNT由相对组成(例如,相对于2010年的发育迟缓降低了40%)和固定(例如,浪费少于5%)。为了将我们的建模结果与亲戚进行比较,我们在2010年GBD 20161年的20161年总体上计算了所有估计的国家的总体汇总患病率。然后,我们为模型域中的每个像素设定了一个固定的目标,以基于2010年大陆级的汇总流行率的减少。对WHON GNT的这种解释被用来在整个空间上设定固定的目标,同时确保已经表现出色的位置被认为是由于早期和持续的较低的流行率而被落后于速度以达到目标的背后。这产生了阻碍的患病率目标24.2%,体重不足目标患病率为13.5%。   应在全面确认数据和方法论局限性中评估这项工作。虽然我们目前的研究得到了209个来源(总计129万儿童)的告知,但不确定性最大的领域(图1F,2F和扩展数据图2F)通常对应于需要较新和/或更新信息的区域(图5、6和补充图2、3)。扩展到其他国家和指标强调了增强数据收集的需求(同样重要的是,回顾性数据检索),因为我们迭代地更新了对全球目标的进度的测量。虽然不是这项研究的重点,但CGF指标患病率的幅度(图1C,2C和扩展数据图2C),其估计的不确定性(图1F,2F和扩展数据图2F)以及我们对国家调查的覆盖率的了解(我们对图5、6和补充的范围都可以识别图5、6),并且可以识别图5、6),并且可以识别图2,3)。枚举。   该分析中使用的数据有局限性,因此可以进行未来的改进。例如,由于设备校准或用户错误,可能已经错误地测量或记录了儿童的身高或体重,或者是基于测量年幼的孩子而不是站立的困难而不是站立65。这些调查数据中的“缺失”水平也可能很高,这是由于召回孩子的生日错误。鉴于增长标准是年龄和性别特定的,因此没有详细的年龄信息的儿童被排除在分析之外(请参阅补充信息)。此外,必须在家中出现一个孩子,以便接受调查者记录测量值。鉴于只有在调查时还活着的儿童才能计算出来,因此未衡量因营养不良或其他原因而死亡的5岁以下儿童将无法衡量。由于安全和安全问题,某些国家或地区的冲突区域也可能被排除在调查之外。所有这些偏见的方向是低估了CGF。   此外,我们的估计并未按性,财富或任何其他社会经济指标进行分层。这可能掩盖了测量区域内亚种群中存在的CGF较高的率,尽管这项工作为儿童生长失败的全面地理空间估计提供了非常出色的规模,但5×5公里的分辨率仍然太粗糙,无法考虑城市贫民窟和其他超特定空间差异。同样,跨时间采取的相对粗糙的AROC可能会掩盖时间序列中的更高频率变化,并且在研究和总结空间相关的时间趋势方面进行了更多的研究。尽管全面,但由于缺乏高分辨率的空间数据,我们包含的协变量并不能涵盖所有CGF驱动程序和混杂因素。在建模方面,我们试图通过各种建模阶段来传播尽可能多的不确定性,但是仍然存在一些传播,例如将儿童模型合奏拟合中的不确定性纳入不确定性,证明是计算上不可行的。未来的研究还正在进行开发计算方法,以更好地将点和面积数据与各种指标的大陆尺度映射研究更好地进行地分解整合。这些地统计工具主要由不经常报道的国家调查数据驱动,因此可以很好地监测和评估多年的进度,但不适合对CGF脆弱性的日常评估。但是,我们表明,有很大的余地可以通过将预警努力的注意力集中在最脆弱和最不重要的人群上来进行这种努力。66。   这些分析使用的所有代码均在http://ghdx.healthdata.org/record/record/africa-child-growth-failure-geospatial-estimates-2015上在线公开获取。   这项研究的发现得到了公共在线存储库中可用的数据的支持,这些数据可应数据提供商的要求公开可用的数据,以及由于数据提供商的限制而无法公开可用的数据,这些数据已在当前研究的许可下使用,但可以根据作者的合理要求和数据提供商提供。详细的数据源表和可用性表可以在补充表2中找到。   从全球行政单位层(GAUL)数据集检索了行政边界,该数据集由粮农组织在国家 /地区和农业市场信息系统(AMIS)项目中实施44。由NASA EOSDIS土地工艺分布在线数据库(LP DAAC),USGS/Earth Resources观察与科学(EROS)中心45的陆上数据库。从全球湖泊和湿地数据库(GLWD),世界野生动物基金会和卡塞尔大学环境系统研究中心提供的湖泊。人口从WorldPop48,49中取回。

本文来自作者[lejiaoyi]投稿,不代表言希号立场,如若转载,请注明出处:https://www.lejiaoyi.cn/zixun/202506-1267.html

(6)
lejiaoyi的头像lejiaoyi签约作者

文章推荐

发表回复

作者才能评论

评论列表(3条)

  • lejiaoyi的头像
    lejiaoyi 2025年06月19日

    我是言希号的签约作者“lejiaoyi”

  • lejiaoyi
    lejiaoyi 2025年06月19日

    本文概览:  我们的研究遵循准确和透明的健康估计报告(收集)的指南。我们的分析提供了基于单变量生长标准标准,对5岁以下儿童(扩展数据1)的患病率估计了,该标准的年龄特定年龄和体重是针对健...

  • lejiaoyi
    用户061906 2025年06月19日

    文章不错《在2000年至2015年之间,非洲的儿童成长失败》内容很有帮助

联系我们

邮件:言希号@gmail.com

工作时间:周一至周五,9:30-17:30,节假日休息

关注微信