2007高教社杯全国大学生数学建模竞赛A题评阅要点 模型的建立必须考虑我国近年来人口发展的总趋势。例如,老龄化进程加速、出生人口性别比持续升高、乡村人口城镇化等因素。以下几点供阅卷参考。
1.分析数据(据此做出合理的假设):
对于一个地区或一类人群而言:
人口的自然增长率 = 出生率-死亡率;而
出生率 = 育龄妇女的生育率 × 育龄妇女在总人口中所占的比例。 利用附录2中数据对上述相关参数进行分析,可以看到:
(1) 生育率:城镇和农村育龄妇女的生育率有下降趋势,但农村总体数据偏高,因此有必要将城镇人口和农村人口(或比例)分离开来考虑;
(2) 出生人口的男女性别比:通常应当是105 : 100左右,但数据分析表明远超过了这个比例,且农村出生人口的性别比例又超过城市。这影响到未来育龄妇女在总人口中的比例以及出生率。因此有必要将男女性别比的因素考虑进去。
(3) 死亡率:不同年龄段的死亡率都是不同的:0——3岁孩子死亡率较高,3——50岁死亡率较低的幼青壮年期,50岁以上的人死亡率不断升高。可以把3——50岁年龄段人口的死亡率看成是接近于零。
(4) 人口的年龄分布:从某一年(比如2005年)分年龄段的人口数量分析,并结合死亡率的观察,可以看出在过去50年的人口出生的变化情况,也可以看出中国人口未来的老龄化趋向。
(5) 在《中国人口统计年鉴》(附录2)中的人口数据都是按市、镇和乡(或县)给出的。但按“报告”(附录1),市和镇放在一起,称为“城镇”,而乡单列,称为“乡村”或“农村”。本题“城镇化”也可以这样理解。这时就需要对“城镇”的每个要用到数据进行加工,即按附录2最右边给出的每年人口的抽样调查数据进行换算。
(6) 附录2中给出的数据都是抽样数据,因此都是相对的。如需要用到每年各类人口的总数据,可在政府网站上查到。比如,在政府公布的《中国人口现状》
http://www.gov.cn/test/2005-07/26/content_17363.htm
中就有2005年的详细数据。从中也可以看出,附录2中给出的2005年人口数据就是大约1%的抽样调查数据。从网上及文献中还可以查到更多数据,这里不一一列出。
(7) 在本题的数据说明中曾指出“个别数据有异常,原文如此,可酌情处理。”实际上,这些异常数据在个别年份才会出现,如果把他们从总体上进行拟合,对整个模型的建立应该是没有很大影响的。而且一些异常通过查阅其他资料也可得到纠正。附录2中最大的异常是关于2003年育龄妇女的生育率数据,这里按原《年鉴》中说法以千分比计,实际应该是百分比,相差十倍(在该附录最后几行给出的总生育率中已把它们恢复正常)。正如一开始及下面所强调的,本题的重点是要根据我国近年来人口发展的总趋势和特点来建立模型,因此,必须从总体上来把握数据。
(8) 如果有学生考虑人口分布的地区和产业等差别,也是可以的,但需要自己补充相关数据。
2.建立模型
(1) 基本假设:从中国人口增长的特点出发,可以提出如下假设作为建立模型的依据:老龄化进程加速;农村育龄妇女的生育率明显高于城镇;出生人口的男女性别比持续升高;农村人口不断城镇化。根据这些假设,区分模型中的状态变量和参数。
(2) 状态变量的设置:根据上述假设和数据分析,可以把城镇人口与农村人口,及男女性别区分开来。另一方面,注意到育龄妇女的生育率是决定人口增长的主要因素,可以对人口的年龄分布按不同年龄段进行简化,以减少状态变量。
(3) 老龄化的影响:数据分析表明,在每一类人(比如城镇妇女)中,老年人口在该类总人口中的比例逐年上升,而青壮年和幼年人口比例逐年下降。可以通过对人口矩阵的迭代,或用其他模型方法,找出他们上升或下降的一般规律。
(4) 农村人口以一定规律转化为城镇人口。
(5) 人口增长有迟滞效应。在附录1中提到“由于20世纪80年代至90年代第三次出生人口高峰的影响”,导致在2005-2020年出生人口数量会“出现一个小高峰”,这就是迟滞效应。如果在模型中适当引进迟滞项,就可预测到这种“小高峰”现象。当然,此时的初值应当是一个近几十年来的人口变化函数。这个函数可以从网上搜索到,也可以用1(4)提示的方法找出。当然,这可能有一定难度,不一定作为必须要考虑的要求。如果有同学考虑到这种迟滞效应,应该说是有创意的。
(6) 由上述 (1) 至 (4),即可建立起关于中国人口增长的数学模型。它可以是微分方程组或差分方程组的初值问题。如果还考虑到(5),则会是迟滞微分方程组。方程组中出现的各个参数和用到的初值可以通过附录2中给出的数据,并参考上面1(6)的说明,来确定。 |