Memo_What Have We Learned about Mortality Patterns over the Past 25 Years?

Van Raalte A.A., 2021, “What Have We Learned about Mortality Patterns over the Past 25 Years?”, Population Studies, 75(sup1), 105-132.
Raalte系德国马普所人口学“寿命不平等”研究小组的领导学者,2011年博士毕业于马普所。这篇论文衔接了Preston 1996年的综述,精彩地概述了其后25年间死亡研究的发展。与Preston(1996)其时不同,尽管Population Studies仍然是人口学的死亡研究方面的顶尖刊物,但Raalte认为,由于学科界限的日益模糊,死亡研究在保险精算、流行病学、老年学、健康经济学等期刊也大量增长,因此,尽管这篇综述单独列了一节以介绍Population Studies刊发的死亡研究论文,但其主体部分将不仅局限于此,而尽可能囊括此廿五年间死亡研究的主要代表性工作。
相对其他学科而言,Raatle认为人口学家的死亡研究,更侧重在总体水平(Population-Level)的死亡年龄模式,但由于研究愈发细化,当代人口学家对总括性理论的关注越来越少,各种细化机制的相对重要性仍不清楚,这其实阻碍了我们理解很多最基本的人口问题,比如群间死亡差异的真实原因。因此,Raatle不仅事实上回溯了理论与经验研究的进展,更重要地是,她在回溯中发现了大量研究存在着的普遍性问题,即陷入细枝末节而无力回答基本问题,由此,其对当前人口研究方法进行了深刻反思,提醒人口学家们要谨慎对待因果推断方法,并重申了已往人口学家描述性工作的重要性。

一、背景

Raalte首先简述了最近廿五年死亡率的一些新变化,一方面全球预期寿命、个人最高预期寿命均在不断增长;另一方面,受艾滋病影响的撒哈拉以南非洲、受苏联解体影响的中欧与东欧、受暴力影响的东地中海地区、加勒比地区及拉丁美州,均出现了较大的预期寿命波动,以及最近美国、英格兰和威尔士中年死亡率与预期寿命的增长开始停滞,乃及受新冠疫情影响。死亡研究始终是人口研究中的重要部分。

二、死亡率理论

(一)生命历程理论

生命历程理论强调生命早期或其他关键时期发生的事件,以及有害健康行为或风险的暴露如何影响晚年死亡率。Raalte复述了Preston(1998)总结的生命历程理论的四个主要机制,前两个与晚期死亡率正相关,后两个与晚期死亡率负相关。其一,死亡疤痕(Mortality Scarring)或群体发病表型(Cohort Morbidity Phenotype),认为早期疾病负荷对晚期死亡产生影响;其二,环境影响(Correlated Environments)或童年的长臂(Long Arm of Childhood),认为早期不良社会条件削弱个体向上流动机会及与之相关的低死亡率机会。其三,获得性免疫(Immunity),认为队列会因其童年遭遇毒株,而使晚年的流感易感性存在差异。其四,死亡的选择(Selection),认为脆弱个体会早死,老年留存的是更健康的个体。
对上述机制的检验往往存在两个问题。其一是横向的,一方面难以分离各个机制的净效应,另一方面各机制有时互相抵消,如死亡疤痕与死亡选择。其二是纵向的,上述机制与代际差异的关系,由于队列与宏观环境有强相关,代际研究需要考虑宏观环境的变化,但是代际的行为差异指标很难确定,目前对队列吸烟模式与死亡率的讨论已有一定共识,另有队列肥胖模式与死亡率的讨论则存在争议,肥胖可能与多种疾病相关,以及饮酒行为同时存在短期风险与长期风险。最近十年,一些学者则直接用生物指标进行讨论,如与循环疾病直接相关的心血管功能、代谢功能。
总体而言,过去廿五年间,学界已对生命历程理论进行了大量测试,尤其是个体或群内的生存差异,但这些测试在帮助我们理解国别、地方间、代际的死亡差异则收获甚微,换言之,生命历程机制在多大程度上导致了人群间的死亡率差异、哪些机制与哪些疾病最相关、哪些机制在哪些年龄段起作用等等,如何将之与总体死亡模式(Aggregate-Level)相连接是未来研究的重点。

(二)宏观经济条件与社会不平等

讨论宏观经济条件、社会经济地位差异对死亡率的影响历史悠久。在1990年代,学界涌现了一批争论,如收入不平等对预期寿命的影响,如英国白厅报告二期的死亡率的社会经济梯度(Socio-economic Gradients)问题(公务员),如高收入国家的死亡率的教育梯度问题,如低收入国家儿童死亡率的社会不平等问题,如Link和Phelan在1995年提出了基本原因理论(Theory of Fundamental Causes)来解释社会不平等在死亡率不平等的影响。这些争论一直延续至今。可以被分为两个面向,其一,宏观经济条件的讨论,其二,社会经济地位差异的讨论。
就宏观经济条件而言,Preston 1975年在Population Studies讨论的国民总收入与预期寿命之间的Preston曲线,开创了后续一系列国民收入与健康间因果关系、以及内生因素与外生因素在解释上述关系中的相对重要性的研究。其中代表性机制如营养论、基础设施论、知识扩散论等,后来研究进一步批评了营养论,而支持了后两者。随后的研究可以被分为两个脉络,其一是收入不平等的影响,其二是经济周期的影响。
第一,就收入不平等的影响而言。Rodgers在1979年发现收入不平等与死亡率有关,Wilkinson、Marmot等人在千禧年后,进一步提出收入不平等会通过物质和社会心理对健康产生负面影响,但该机制存在争议,有支持有反对,还有观点认为该机制存在分年龄段的差异性作用,更多作用年轻人而非老年人。
第二,就经济周期的影响而言。早期研究认为,总体层面,经济衰退增加死亡率,个体层面,长期失业增加死亡率。但Ruhm在2000年颠覆了上述观点,认为死亡率是顺周期(Procyclical)的,即正相关,劳动时间的增加会使吸烟增加、锻炼减少,其与经济繁荣时期增加的交通事故率一并,增加了死亡率。随后,Edwards在2007年进一步发现,美国受教育程度较高者是顺周期死亡率、受教育程度较低者是逆周期死亡率,体现了个人资源在承担经济危机时的保护作用。
就社会经济地位差异而言。学界共识是尽管各国都有死亡率的社会经济梯度,但程度不一,欧美的低学历群体预期寿命差异极大,但高学历群体差异很小,这表明各国间的死亡不平等主要是各国在多大程度上能够保护其弱势群体免于早期死亡。其可以被分为两个脉络,其一是机制讨论,其二是寿命不平等的描述。
第一,就机制讨论而言。死亡率的社会决定因素的理论主要有行为因素(Behavioural Determinants)、物质主义解释(Material Explanations)、心理社会因素(Psychosocial Factors)、生命历程的累积劣势(Cumulative Life Course Adversity)。这些理论已被检验,但我们并不清楚这些理论在生命不同时段的具体作用大小,且世界各地的社会经济梯度方向仍然存在争议。此外,社会政策的作用也令人困惑,比如再分配极强的北欧却仍然有很高的社会不平等,这被称为北欧悖论(Nordic Paradox)。
第二,就寿命不平等(Lifespan Variation or Lifespan Inequality)而言。处于不利地位的社会经济群体往往会经历死亡年龄的更大变异,或者说死亡时间的个体不确定性更强、人口健康的异质性更强。目前研究认为,无论预期寿命如何变化,社会经济群体间的寿命不平等在分化,主要是早期死亡率下降停滞的原因,换句话说,优势群体正在经历更长、更可预测的生活,而劣势群体尽管平均预期寿命在增加,但达到平均预期寿命的可能性在下降。

(三)老年死亡率的讨论

20世纪学界对老年死亡率的研究很少,主要是因为两个原因。其一,当时学界认为医学进步很难令老年死亡降低,其二,统计数据将85岁及以上汇总,也难以监测高龄死亡率变动。直至20世纪90年代,学界才发现老年死亡率降幅很大。这一时期的老年死亡率研究可以分为两个面向,一是建立高质量死亡数据库,并概括老龄死亡率函数;二是对老龄死亡率的减速趋势进行解释。
第一,由于90年代以前的老年死亡率数据存在较大问题,国际学界首先致力于高质量数据的整理,代表如Kannisto–Thatcher数据库与国际长寿数据库(International Database on Longevity)。其后,学界对老年死亡率研究产生了共识,Kannisto函数被用以描述老年死亡率,该函数后成为HMD的标准函数。
第二,Vaupel(1979)等学者观察到死亡率随年龄增长的指数速度,在老龄段开始放缓,这暗示了死亡选择理论与死亡异质性理论,即死亡率的相对平稳期是因为脆弱人群已经退出。事实上,这一死亡率规律在各个昆虫、蠕虫等物种也有体现。后续研究不断讨论这一现象,最新的研究是Barbi(2018)认为,死亡率增速从80岁开始减速,直至105岁。当然,是否减速仍然存在争议,死亡选择与死亡率减速的关系非常复杂,如多个死亡率减速甚至加速可能与队列死因成份的变化有关。

(四)寿命的遗传性

最后,1990年代以后兴起了寿命的遗传研究。早期是通过比较同卵双胞胎(基因相同)和异卵双胞胎(共享50%的基因),认为基因遗传大约可以解释1/4的寿命差异。随后,研究沿家族基因进一步讨论,如百岁老人的兄弟姐妹的死亡率很低,其兄弟人群同样成为百岁老人,男性、女性分别大约是一般人群的17倍、8倍,且这一差异并没有像社会经济地位一样,随着年龄增长而趋同。因此,学界认为可能长寿与共同环境、共同行为、共同基因共同决定,这三个机制是目前解释衰老(Aging)的主要议题。
为了回应这三个机制,人类基因组计划致力于解释基因与长寿的关系,但后期研究认为没有任何一个单一基因能够导致寿命的巨大变化,相反,其一,可能是很多小的突变共同产生的长寿,其二,基因可能只会影响特定年龄以上的死亡率。因此,近期研究开始讨论基因与环境的互动,如糖尿病、肥胖均与社会行为十分相关,而非基因单一的决定。同时,考虑到现代人类在很短的时间内就有巨大的死亡率下降,基因差异与人口水平的死亡率差异的关联可能很小。

三、死亡率模型

与理论相对,死亡率模型因属于数理人口学范畴,更具连续性与累积性。

(一)数据有限地区的估计模型

援引Clark(2019),目前全球仍有10亿人缺乏成人死亡率的数据登记,尤其是撒哈拉以南非洲,这些地区的人口死亡率估计依赖家庭调查数据、模型生命表与部分跨国监测点数据。
在二十世纪,经典模型生命表如Coale-Demony被广为应用,但该模型有两个问题,其一是无法捕捉儿童死亡率低于50‰至60‰后,儿童死亡率与成人死亡率的关系,其二是无法捕捉高艾滋病率国家的成人死亡模式。由于艾滋病肆虐的地区缺乏登记数据,人口学家通过多来源数据、直接估计与间接估计多方法对死亡率进行估计,但因数据源与模型方法不同,这些估计有持续性争论。
因此,在估计方法上,近廿五年有两个主要面向,其一,模型生命表改进,尤其是与低儿童死亡率、以及高艾滋病率适配的模型,其二,大量的结合贝叶斯统计,结合已知先验信息,量化估计本身的不确定性。我们仅就模型生命表改进作具体介绍。
其一,针对儿童死亡率较低时的死亡模式,代表如Murray(2003)改进Logit模型、基于HMD数据的Wilomth(2012)对数二次项模型;其二,针对小区域修匀或预测,de Beer(2012)提出了TOPALS(Tool for projecting age-specific rates using linear splines)关系模型。其三,针对高艾滋病率地区,Sharrow等人(2013;2014)开发了八参数Heligman–Pollard方法的贝叶斯估计版、Clark(2019)开发了通用奇异值分解(SVD)以结合特定协变量来校正模型生命表。

(二)数据充足地区的死亡模式

与数据有限地区相对,数据充足地区更多聚焦在死亡模式的讨论上。这当中开创性论文是Oeppen and Vaupel’s (2002)对女性预期寿命增加的讨论,全球的女性预期寿命每10年增长2.5岁,该增长违背了已往学界认为预期寿命存在限制的观点。此后,争论集中在未来能否复刻20世纪的增长,分为悲观派与乐观派。悲观派代表是Olshansky等人,认为20世纪死亡率下降集中在婴幼儿,但婴幼儿已经达到极低死亡率,慢性病、肥胖导致的死亡率很难下降;乐观派如Horiuchi、Wilomth等人,认为死亡率下降逐渐过渡至老年段,仍然可以继续下降。
虽然该争论仍在继续,但后续研究发展了两个主要面向,其一,死亡率的平均变化趋势,其二,死亡率的变异变化趋势。
第一,死亡率的平均变化趋势。Vallin和Meslé(2004)通过死因数据认为,每个地区人口死亡率趋势都可以反映在一系列发散与收敛(Divergence and Convergence)的过程中,发散或收敛受技术扩散与死因变化的影响。
第二,死亡率的变异变化趋势,则由学界发展为一系列指标来讨论,如寿命/寿命不平等(Lifespan/Length-of-Life Inequality)或寿命变化(Lifespan Variation)、生存曲线的矩形化(Rectangularization of the Survival Curve)、死亡率压缩(Mortality Compression)。扼要上述指标,其一,过去150年间,寿命变化与预期寿命始终高度负相关,且其对成人早期死亡率十分敏感。其二,死亡时的年龄模式(Modal Age at Death)指标被认为可以很好地捕捉老年死亡率变化。
对死亡率的变异讨论,尤其聚焦在讨论老年死亡率的压缩、扩张或转移,这主要是来自于早期Fries(1980)认为人类预期寿命存在一个极限,因此随着预期寿命接近上限,死亡率的下降会使越来越多的死亡人口集中在阈值附近,也就是所谓的压缩。后续研究可以进一步扼要如下。
一方面,使用死亡时年龄模型这个指标或方法。学界认为,尽管自20世纪50年代中期以来,大多数国家都存在长期的死亡率压缩,但这伴随着相当大的死亡率扩张或转变的子时期。另一方面,使用寿命变化衍生出的阈值年龄(Threshold Age)指标,该指标即超过这个年龄,死亡率下降会导致寿命变异增加,Vaupel(2011)认为自1840年以来,HMD国家超过阈值年龄的死亡率经历了适度的压缩。但总体而言,目前尚没有证据表明我们正在逼近一个所谓的极限寿命。

(三)人口学分解方法

除上述生命表方法外,人口分解也取得了较大发展。
对预期寿命的分解有两个脉络,其一是沿着Kitagawa(1955)方法,将速率的变化分解为直接成分和组成成分,Vaupel和Canudas-Romo(2002;2003)将之发展为更通用的方法。其二是沿着Arriage(1984)等90年代分年龄与分死因去分解预期寿命,Beltrán-Sánchez(2008)讨论了死因退出生命表与人口分解方法之间的关系,Andersen等人(2013)进一步发展了不需要假定死因之间独立性即可分解的方法。
对预期寿命以外死亡率汇总指标的分解,如寿命变化,亦在千禧年后发展了两个通用方法,其一是Andreev等人(2002)逐步分解法、其二是Caswell(1996)、Horiuchi等人(2008)的连续变化法。

(四)死亡率预测

最后,与Preston(1996)时代不同,过去廿五年间死亡率预测有极大进展。
1990年代以来,学界普遍从确定性的、基于情景的预测转向概率预测方法,以Lee and Carter(1992)点方法为代表。但Lee-Carter模型往往低估预期寿命的增长,在于其假设死亡率下降的固定年龄模式,而老年死亡率事实上下降很快,一系列扩展模型被开发。
2000年代以来,学界逐渐放弃了Lee-Carter方法,并探索其他死亡率的外推(Extrapolation)模型,如外推预期寿命、死亡密度,使用如成分数据分析(Compositional Data Analysis)或广义加性模型(Generalized Additive Models),以及最近的探索开发讨论队列死亡率的惩罚复合链路模型(Penalized Composite Link Model)等。

四、Population Studies有关死亡率的研究概述

Population Studies进行回溯可以发现,其一,各年龄段研究而言,如Preston(1996)预测的,千禧年后死亡研究整体从对儿童死亡率的讨论过渡至成人、老人死亡率的讨论,目前Population Studies仅有1/4的死亡率研究关于婴幼儿,这与发达国家人口结构的老化有关。其二,主题而言,死亡研究的主题主要包括如下,中低收入国家相对侧重死亡率模式不平等的社会经济、性别、区域描述,家庭构成或环境对其自身或儿童死亡率的影响等,高收入国家相对侧重生育史、离婚、丧亲、移民史、婚姻状态等生命历程,以及社会经济地位对死亡率的影响,此外,有15%的死亡模式研究讨论了极端事件(如流行病、种族灭绝)、城市化或现代化的影响。其三,方法而言,对数据有限地区的新估计方法或模型比20世纪要少,虽然Murray(2003)、Wilmoth(2012)以及Sharrow(2018)的经典方法论文被刊登,对数据充足地区的死亡率模式则十分丰富,如时期与队列死亡率的关系、老龄化调查、新的死亡率汇总指标(尤其是死亡年龄的变异)等。
但如前面已经提到的,Population Studies不再是主要的死亡研究刊物,各学科的界限已经日益模糊,人口学家必须关注其他学科的研究进展。

五、讨论与总结

最后,Raalte在文末回溯并展望了人口学家们在死亡研究的贡献,一方面,更开源的数据、代码推动了学术健康发展,另一方面,Raalte批评了当前人口学界的研究面貌,过于丰富的数据让学者日益陷入细枝末节的讨论,忽略了早期人口研究中试图提出更广泛、更重要的模式的努力。
如已故芝加哥大学人口学家Evelyn Kitagawa讨论的,学术要致力于量化所讨论的组成部分的变化,对人口学相关率指标的影响。如何结合宏观、微观讨论,比如连接死亡风险、人口结构变化与死亡率的群间差异,或更具体的,如预期寿命增长速度在多大程度由教育扩张驱动,不同时期、队列的人口有何不同?家庭安排(生活安排、生育安排等)哪些变化对预期寿命增长最重要?不同因素能否解释不同地区的差异性增长情况?
Raalte进一步批评当前的因果研究取向,教育确实能降低死亡率,但是教育对死亡率的影响,在不同时期、对不同人群有什么差异?或者说,教育与健康有因果关系,应该进一步询问,在什么情况下有关系?由于因果推断极其复杂,Raalte认为必须对结论外推的讨论持警惕态度,比如一些流行病学家讨论健康的影响因素并预测,这其实假定被抽样的当代人与未来人受相同大小的影响,如果建模更为复杂,则涉及的假定就会更多。如果不同人群的影响大小不同,且以不可预测的方式变化,因果推断是否真的能比简单的描述带来更多的理解?事实上,Raalte潜在区别了人口学家更惯用的外推(Extrapolation)与社会学家、经济学家更惯用的推断(Inference),具体讲,外推是对已知值范围之外的某个函数的值的估计,而推断是通过推理或归纳进行推理的行为或过程,二者并不存在谁高谁低。