上海市第三产业从业人数预测研究_中国第三产业从业人数
摘要:人数预测的统计方法有多种,但利用ARIMA模型进行单指标短期预测工作,可以预测非平稳序列,对提高预测的准确性方面有比较明显的效果。文章利用SAS软件工具采用ARIMA模型对上海市第三产业从业人员进行预测,从预测结果来看,ARIMA模型用于上海市第三产业从业人数预测的理论和方法都是适用的。
关键词:ARIMA模型;预测;第三产业从业人数
自从上世纪90年代以来,上海产业发展方针发生了重大变化,不断进行从业结构调整,即从强化城市综合功能、建设国际大都市一直到“三、二、一”产业发展方针,从而使产业结构实现了从适应性调整到战略性调整的重大转变。尤其是第三产业获得了快速发展,其对上海经济社会发展的深远影响是巨大的。
具体表现在:从2010年开始,全市在业人口快速向第三产业转移。按三次产业划分,2010年第一产业在业人口占在业人口总数的比重为2.9%,第二产业占42.6%,第三产业占54.5%①。第三产业的长足快速发展,促进了上海市产业结构的进一步优化,且经济运行质量也大大提高,使得上海的经济稳定性大大增强,这在一定程度上减缓了经济增长的波动幅度。这也使得上海经济发展已进入相对稳定的增长周期;第三产业的快速崛起,使上海从原材料、产成品的集聚,发展到资金流、信息流的集聚扩散,城市功能定位发生重大变化,向着建设四个中心的目标前进;另外,第三产业成为了解决就业问题的主要渠道,为上海市的繁荣稳定奠定了坚实的基础,同时,第三产业对于上海市的节能减排工作也大有帮助。因此预测未来上海市第三产业从业人数的变化,为上海市政府相关部门制定决策提供依据。
一般来说,大部分经济变量在一定的时期内是相对稳定的,因此可以假设各经济因素对预测指标的影响及这些经济因素本身的变动趋势是保持不变。因此,只要外推时间不长(具体多长,需要根据具体的预测项目而定),利用经济变量的历史数据进行预测是能够能够保证一定精度。本文将采用ARIMA模型对上海市第三产业从业人数进行短期预测,由于处理的数据较多,因此需要使用SAS软件。
ARIMA与计量经济其他预测模型相比,具有自身特点:ARIMA只考虑预测序列本身历史数据,不需要直接考虑其他相互因素的变动,几乎不直接考虑其他相关指标的信息;ARIMA预测方法简单实用,适合用于指标数量不太大,但预测频度较高的工作,而且其预测精度也能够保证。
一、 ARIMA模型简介
ARIMA模型全称为差分自回归移动平均模型。该模型是由博克思和詹金斯在70年代初所提出,这是在时间序列预测方法方面的重大创新,因此也称为博克思-詹金斯法。其中ARIMA(p,d,q)称为差分自回归移动平均模型,AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。
ARIMA模型的基本思想是:将预测对象随时间推移而形成的数据序列视为一个随机序列,用一定的数学模型来近似描述这个序列。这个模型一旦被识别后就可以从时间序列的过去值及现在值来预测未来值。具体思路是:
步骤一:识别。找出适当的p、d、和q值。通过相关图和偏相关图可以解决。
步骤二:估计。估计模型周所含自回归和移动平均项的参数。有时可以用最小二乘法,有时候需要用非线性估计方法。(软件可以自动完成)
步骤三:诊断(检验)。看计算出来的残差是不是白噪音,是,则接受拟合;不是,则重新在做。
步骤四:预测。短期更为可靠。
其模型表达式如下:
设Xt是平稳随机序列(EXt=0),且满足下面的差分方程:
Xt+?渍1Xt-1+…+?渍pXt-p=?兹0?着t+?兹1?着t-1+…+?兹q?着t-q(1)
其中多项式
都是实系数多项式,Et是标准的白噪声序列,Eεt =0, Eε2t =σ2,Eεtεs=σγ,其中γ=t-s,则称{Xt,t =0,±1,…}为ARMA(p,q)序列,即自回归滑动平均模型。
给定的时间序列,如随机电报信号Xt,就可以利用编好的计算机软件程序,对这些数据进行处理。首先要进行模型识别,即看序列Xt是否满足自回归滑动平均模型的要求。若Xt满足要求,则可以确定模型的形式(即p,q的大 小)、估计参数?渍i,(i=1,...,p),?渍j,(j=1,...,q)等。然后就可以在一定的标准下(如估计形式线性与否、均方差最小等等)进行预测。
但ARMA(p,q)模型对时间序列的要求相对较高,它要求{Xt}是一个平稳的时间序列,即均值、均方差为常数,协方差只是时滞Γ的函数。而在现实生活中,尤其是对一些经济变量,一般不满足平稳性要求,而是呈现出明显的趋势性或季节性。对于这样一些时间序列,我们无法直接利用ARMA(p,q)模型对其进行模拟,而需要进行简单处理,即令:
Xt=μt+Yt
其中μt表示随时间t变化的均值,而Yt表示零均值平稳过程,可以用ARIMA模型拟合。
所谓ARIMA方法就是通过某种处理,得到平稳序列Yt,然后对Yt计算出预测值,最后再反算推出Xt值的方法。
上式分别为一阶差分,二阶差分,……,D阶差分,则我们可以做出下面的定义:若时间序列{Xt},经过D阶差分后变为平稳时间序列,则称{Xt}为ARIMA(p,d,q)序列。
对于ARIMA(p,d,q)序列{Xt},我们可以进行D阶差分,Zt=?塄dXt然后利用ARIMA(p,q)模型对Zt进行拟合、预测,最后将拟合、预测结果经适当反算即可得到真正的预测值Xt。
二、 ARIMA模型预测的基本流程
ARIMA模型原理是:将预测对象随时间变化而形成的数据序列视为一个随机序列,用某个数学模型来表示这个序列。这个模型被识别后,从时间序列的过去值及现在值再来预测未来值。
ARIMA模型预测的基本流程:
(1)对序列进行平稳性识别。根据时间序列的自相关函数和偏自相关函数图,利用ADF单位根检验其方差、趋势及其季节性变化规律,实现对序列的平稳性检验。一般来讲,经济运行的时间序列基本都不是平稳序列。
