机器学习实现各国人口预测
实验结果,实验数据,实验图解详见(ipynb文件):项目源码
项目展示ppt:ppt地址
项目报告:报告地址
项目背景
人口增长可以描述人口规模是如何随时间变化的。有几个原因值得研究。这项研究可以帮助科学家更好地预测未来人口规模和增长率的变化。因此,政府可以制定相应的政策,将未来人口控制在合理的范围内范围。例如,中国的计划生育政策是基于对未来人口增长和中国土地资源的预测,而土地资源很好地控制了人口增长。此外,研究人口增长可以让科学家洞察人与环境之间的关系。科学家还可以利用这些结果进一步解释影响人口增长的因素
项目描述
本项目的目的是建立一个机器学习模型,根据各国政府收集的人口统计数据对新加坡和中国的人口进行预测。我们将主要使用线性回归建立未来总人口的估计器,并通过几个性能指标对模型进行评估并对我们的预测做一些分析
项目进行
-
初始数据的获取
在网络上下载中国和新加坡人口的数据,并保存在本地data目录下存储为csv文件
选择2013年之前的数据作为培训数据
-
使用线性回归进行预测
使用线性回归建立了新加坡未来总人口的估计值
计算R2系数,发现非常接近1,可以证明我们的拟合效果很好
再次计算均方误差,也可以证明我们的拟合效果非常好
-
预测2013年之后的数据
我们通过这种方式预测了2013年之后的人口,并与真实数据进行对比
我们可以看到两组数据之间存在一些细微差异。为了减少差异,我们使用SVM模型重试
-
使用SVM重新进行预测
得到结果和真实数据相差明显减小
因此我们可以使用这种方法
-
预测2030和2050年的人口
将两个年份分别带入即可得到预测结果
-
绘制增长率分布图
最后,我们绘制了新加坡2020年人口增长率与年数的关系图和人口年龄分布图。
实验结论
我认为人口预测是合理的,新加坡未来的人口增长模式将以移民为主,自然增长为辅。根据《2020年新加坡人口白皮书》,新加坡政府宣布仍有100万人口的差距,这表明大量移民将面临失业此外,由于新冠病毒19型的逐步控制,新加坡的人口将在未来30年内稳步增长
实验改进方案
我发现移民和人口老龄化都是影响新加坡总人口的因素。但是,我们不能将它们分开处理。这两个因素可以相互影响。
因此,我们可以减少人口老龄化不利因素的权重,以便更好地预测未来人口。