计量经济模型的实例 计量经济分析案例
影响房价的相关因素分析
选题背景
进入21世纪以来,住房愈炒愈热,房价一路飙升。就算在2008年的金融危机下,房价也从未低头。近几年来,国内生产总值有了较大幅度的增长,城乡居民收入不断增加。但房价的涨幅似乎不亚于任何一项经济指数的增量。由于衣食住行向来是中国人衡量生活质量的四大指标。房价的大幅上涨,使人们感觉到了持久性受到了威胁, 房价成了当下的热点话题。那么究竟是什么在刺激着我们的房价?带着这个疑惑,我们开始了调查与探讨。
在我看来,在中国百姓的消费观念中,如果居民消费品长期稳定处于低位,那老百姓就敢
把钱拿出来买房子,甚至贷款也不怕。但如果吃饭贵起来,人心就慌了,买房的意愿就会大大降低。如果居民消费价格持续上张,买房意源将会归零。因为到那时候连生存都是问题了,
谁还有闲着想着住好房,投资升值之类的事情?
在生活中, 影响房价的因素可能很多, 如收入水平、商品价格水平、利率水平、收入分配状况、消费者偏好、家庭财产状况、消费信贷状况、消费者年龄构成、制度、风俗习惯等等。但考虑到样本数据的可收集性和一些实际情况, 选择了GDP, 城镇居民收入,及CPI 的相关指数做了分别调查,如物价综合指数,食物价格,衣着指数,交通和通讯指数,医疗指数进行了相关探讨。GDP 是衡量一个国家经济实力, 也是世界银行划分高收入、中等收入、低收入国家的主要标志, 一般来说, 人均GDP 高的国家, 表明该国经济实力强, 人民消费水平高, 同时在我国, 居民消费是在国内生产总值经过初次分配和再次分配后形成的, 由此选择了人均GDP; 根据衡阳实际情况,衡阳了消费指数CPI 中的几个重点指数也就是医疗,衣着,交通和通讯指数。通过对这些变量的分析,我们了解到了,到底哪些因素对我们当下的房价波动造成了影响,哪些因素的影响比较大,是否有上面我们想象的那么明显。因此,我们便对上述相关指数进行了探讨。并对此做出相关政策性个建议。
摘要:房价是当今老百姓最关心的话题,本文在分析影响衡阳市房价的几个消费因素的
基础上, 选择几个主要因素建立衡阳市房价的计量模型。通过EVIEWS 软件的实证分析,可以看出房衡阳市价确实与百姓生活中的日常消费存在一定内在的联系,同时居民的GDP, 城镇居民收入等,对房价也有很大程度的影响。据此,并提出了关于稳定衡阳市房价及观察衡阳市房价的相关建议,以引导居民理性消费,理性投资。
关键词:房价 物价指数 医疗指数 交通通讯指数 GDP 城镇居民收入 调查时间:2009年4月——2011年4月
调查目的:从消费指数看房价波动情况及趋势;判断房价未来趋势。
HOUSEPRICE:房价 ALLPRICE :价格总指数 FOOD :食品价格指数 CLOTH:衣着价格指数 MEDICAL:医疗价格指数 TRIFFIC:交通和通讯价格指数
Dependent Variable: HOUSEPRICE
Method: Least Squares
Date: 06/15/11 Time: 17:58 Sample: 2009M04 2011M04 Included observations: 25
Variable Coefficient Std. Error
t-Statistic
Prob.
C FOOD MEDICAL R-squared Adjusted R-squared
S.E. of regression Sum squared resid
Log likelihood Durbin-Watson stat
22259.34 9036.783 2.463193 64.41331 18.66945 3.450198 -125.9150 54.31978 -2.318033 0.798738 Mean dependent var 0.745774 S.D. dependent var 130.6864 Akaike info criterion 324499.7 Schwarz criterion -153.8630 F-statistic 2.097290 Prob(F-statistic)
0.0235 0.0027 0.0318 2792.958 259.1914 12.78904 13.08157 15.08086 0.000005
HOUSEPRICE = 22259.338- 39.589*CLOTH + 11.751*ALLPRICE + 64.413*FOOD - 125.915*MEDICAL - 106.924*TRIFFIC
t = (2.463193) (-1.150724) (0.276236) (3.450198)
(-2.318033) (-1.763982)
R 2=0.745774 F=15.08086 N=25
该模型大致说明:该五个变量对房价的解释能力为74.6%。具有较好的解释能力。在假定α=0.05的条件下,T 检验中有3个变量未通过检验。说明该三个变量对房价的的影响不是很显著。在F 检验中, Prob(F-statistic)=0.000005,通过检验。
序列相关性检验
原假设不存在序列相关 H0 没有序列自相关 H1 存在序列自相关 给定显著水平为0.05 Breusch-Godfrey Serial Correlation LM Test:
F-statistic 0.734864 Probability 0.494199
Test Equation: Dependent Variable: RESID Method: Least Squares Date: 06/21/11 Time: 22:08 Presample missing value lagged residuals set to zero.
Variable
C FOOD CLOTH ALLPRICE MEDICAL TRIFFIC RESID(-1) RESID(-2)
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
Durbin-Watson stat Coefficient
6422.654 -3.312699 -17.16609 15.40555 -41.53981 -17.25271 -0.362071 -0.178204
0.079575 -0.299424 132.5491 298677.6 -152.8265 1.730513 Std. Error
10791.21 20.11075 37.72113 45.19447 65.11256 64.90198 0.307576 0.305275
Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic
Prob(F-statistic)
t-Statistic
0.595175 -0.164723 -0.455079 0.340873 -0.637969 -0.265827 -1.177177 -0.583749
Prob.
0.5596 0.8711 0.6548 0.7374 0.5320 0.7936 0.2553 0.5671
5.07E-13 116.2791 12.86612 13.25616 0.209961 0.978354
根据LM 检验,原假设的概率正确的概率接近36.98%。因此不能拒绝原假设,因此该序列不存在序列相关性
异方差检验
原假设不存在异方差:H0:不存在异方差。H1:不存在异方差 White Heteroskedasticity Test:
F-statistic 0.739067 Probability Obs*R-squared 8.637725 Probability
Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/15/11 Time: 18:08 Sample: 2009M04 2011M04 Included observations: 25
Variable Coefficient Std. Error t-Statistic
C 93771457 1.09E+08 0.862808 CLOTH 453043.5 424979.0 1.066037 CLOTH^2 -2196.070 2085.814 -1.052860 ALLPRICE -294229.2 659973.2 -0.445820
Prob. 0.4028 0.3044 0.3102 0.6625
ALLPRICE^2
FOOD FOOD^2 MEDICAL MEDICAL^2 TRIFFIC TRIFFIC^2
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
Durbin-Watson stat
1402.823 75189.66 -344.2014 -1374773. 6853.501 -743674.1 3750.749 0.345509 -0.121985 20577.45 5.93E+09 -276.5245 1.936776 3204.575 0.437756 191850.4 0.391918 907.9998 -0.379077 1307115. -1.051761 6446.566 1.063124 1654360. -0.449524 8324.828 0.450550 Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion F-statistic
Prob(F-statistic)
0.6682 0.7010 0.7103 0.3107 0.3057 0.6599 0.6592
12979.99 19426.65 23.00196 23.53827 0.739067 0.679993
可知图中画横线的数据可知,不存在异方差的概率为56.7%。因此该模型不存在异方差
多重共线问题
CLOTH FOOD MEDICAL
ALLPRICE 0.577735 0.947695 -0.093450 CLOTH 1.000000 0.505820 -0.644474 FOOD 0.505820 1.000000 -0.104817 MEDICAL -0.644474 -0.104817 1.000000 TRIFFIC
0.391107 0.877340 -0.024794 由此可以看出在个解释变量中,食物价格,及交通指数对所有价格指数的解释程度很高,交通和通讯对食物的解释程度也很高。这在一方面说明各解释变量之间有一定的相关系数,存在严重的多重共线性。另一方面也可以大致说明衡阳的居民所有消费中,食品和交通通讯消费占很大一部分比例
修正多重共线性
以食品价格FOOD 为基础,逐渐增加变量。分别对各个变量做一元回归结果。依照R 2由大到小排序得
依次加入变量ALLPRICE 、TRIFFIC 、CLOTH 、MEDICAL 加入Allprice 得
HOUSEPRICE = -118.3638209 + 65.05550845*FOOD - 37.92783098*ALLPRICE
t =(-0.063318) (3.241726) ( -1.039727)
R*2=0.699
t 参数值显著,且该参数的P 值为0.309,未通过t 检验。R*2的变化很少。所剔除该变量 加入TRIFFIC 得
HOUSEPRICE = 6968.211718 + 67.29164017*FOOD - 112.4359115*TRIFFIC t =(1.545474) (5.348051) ( -1.993838) R*2=0.732
t 参数值显著且R*2变化明显,所以予以保留
加入CLOTH 得
HOUSEPRICE = -3427.03876 + 42.41170578*FOOD + 17.71926455*CLOTH t =(-1.639952) (5.648334) (0.755586 ) R 2=0.692
因为t 参数值不显著且R*2变化不明显,所以予以剔除
加入MEDICAL 得
HOUSEPRICE = 7111.976817 + 43.82578362*FOOD - 87.93311486*MEDICAL t =(1.829117) (7.433921) (-2.355717 ) R 2=0.748
因为t 参数值不显著且R*2变化明显,所以予以保留
以FOOD MEDICAL为基础。加入TRIFFIC 得
HOUSEPRICE=13777.642 - 78.70468641*MEDICAL+62.808*FOOD-96.186*TRIFFIC
t =(2.654726) (-2.196040) (5.326313 ) (-1.829546)
R 2=0.782392 t 参数值显著且R 2变化明显,所以予以保留
Dependent Variable: HOUSEPRICE
Method: Least Squares
Date: 06/25/11 Time: 08:09 Sample: 2009M04 2011M04 Included observations: 25
Variable Coefficient
C 13777.64 FOOD 62.80780
Std. Error 5189.855 11.79198
t-Statistic 2.654726 5.326313
Prob. MEDICAL -78.70469 35.83936 -2.196040 TRIFFIC -96.18657 52.57402 -1.829546
R-squared 0.782392 Mean dependent var 2792.958 Adjusted R-squared 0.751305 S.D. dependent var 259.1914 S.E. of regression 129.2571 Akaike info criterion 12.70713 Sum squared resid 350855.2 Schwarz criterion 12.90215 Log likelihood -154.8391 F-statistic Durbin-Watson stat 1.980648 Prob(F-statistic) 所以最终模型为
HOUSEPRICE=13777.642 - 78.70468641*MEDICAL+62.808*FOOD-96.186*TRIFFIC
t =(2.654726) (-2.196040) (5.326313 ) (-1.829546) R 2=0.751 F=25.16789 N=25
由于我们的数据有限,可能数据不太精确,因此我们取a=0.1。查表得t a=0.1=1.323。因此当a=0.1是,所有数据均通过t 检验。F 检验也明显通过。拟合系数也比较大。所以,该模型对解释变量基本符合。
由改模型,我们可以得出一些结论:
1.医疗,交通通讯及食品对房价的解释能力达到了75.1%。且根据F 检验可知,影响显著。
2.这个模型中我们可以看到,房价与医疗价格指数呈负相关关系。这与我们的社会实际情况相吻合。如果医疗的价格过高,势必居民没有过多的钱买房。特别是在衡阳这种三四线城市在,居民的生活质量一般,居民在医疗上花费过多,对他们投资房地产确有很大负的影响。
3.由模型可以看出,居民交通与通讯价格指数,在很大程度上影响了衡阳市的总体房价。房价与交通通讯指数呈负相关关系,这与社会实际情况相符合。因为交通和通讯是居民的必须消费。对一般衡阳市大部分居民而言,是基本是不可变动的。如果汽油价格上涨,导致交,通费用上涨,或者通讯费用上涨。居民也不会减少在着些方面是支出,因此交通通讯指数的变化势必也会反映房价的变动。
4.在模型中,物价综合指数和衣着指数已在检验多重共线性时被剔除,说明衡阳市明在衣着上的花费很好,其对房价的影响可以忽略不计。而物价综合指数也因为与其他指数存在很大相关性,因此可以被剔除。反映衡阳市民的消费中,除了食品,医疗,交通通讯几个重要变量外,其他基本可以忽略。也可以大致反映衡阳居民的恩格尔系数相当高。
5.与食品价格指数呈正相关关系。这衡阳实际情况相符。因为对衡阳市居民而言,恩格
尔系数是如此的高,普通居民的大部分消费是食品,食品价格上涨势必会引起房价的上涨。这个结果与前面的选题背景假设想符。
建议:就衡阳市而言,如果想从控制消费方面着手控制房价的话,应从控制食物价格着手,
其次是医疗和交通通讯。鉴于此,政府可以先控制居民日常消费的食用油,蔬菜,肉类,大米等物品的价格。从而控制房价跟随上涨。居民在投资房产或购买房屋时,可以参考当期的物价水平,预期下期的物价水平,从而避免买亏。
由于数据量有限及时间上的不一致。不能进行太多的多元线性回归,因此,只能单个回归。另由于高新区的数据收集不全,因此去掉了高新区。
各区房价与衡阳市整体房价的关系
调查时间:2009年第一季度——2011年第一季度
调查目的:衡阳市哪个区对整体房价影响最显著?哪个区最能反映总体的房价走向趋势? 各区房价与衡阳市总平均房价的关系
ZXQ:蒸湘区 ZHQ :珠晖区 SGQ :石鼓区 YFQ :雁峰区 Dependent Variable: HYS
Method: Least Squares Date: 06/24/11 Time: 21:16 Sample: 2009M01 2011M04 Included observations: 28
Variable Coefficient Std. Error t-Statistic Prob.
C 314.7740 187.0280 1.683031 0.1059 ZXQ 0.615739 0.064625 9.527900 ZHQ 0.062084 0.049398 1.256817 YFQ 0.120871 0.032594 3.708380 SGQ 0.068209 0.019415 3.513234 R-squared 0.896190 Mean dependent var 2733.437 Adjusted R-squared 0.878136 S.D. dependent var 300.7277 S.E. of regression 104.9809 Akaike info criterion 12.30587 Sum squared resid 253482.9 Schwarz criterion 12.54376 Log likelihood -167.2821 F-statistic 49.63979 Durbin-Watson stat 1.581220 Prob(F-statistic) 0.000000
HYS = 314.774 + 0.068*SGQ + 0.121*YFQ + 0.062*ZHQ + 0.616*ZXQ (187.028) (0.0194) (0.033) (0.049398) (0.064625) t= (1.683) (3.513) (3.708) (1.257) (9.528) R2=0.878136 F=49.63979 N=28 T 检验和F 检验均通过 多重共线性检验
YFQ
ZHQ ZXQ
SGQ YFQ ZHQ ZXQ
SGQ 1.000000 -0.110449 0.213793 0.328692
-0.110449 1.000000 0.413210 0.201219 0.213793 0.413210 1.000000 0.160601 0.328692 0.201219 0.160601 1.000000
由图可知,相关系数非常小,不存在多重共线性
异方差检验
White Heteroskedasticity Test:
F-statistic 2.014628 Probability 0.100379 Test Equation: Dependent Variable: RESID^2 Method: Least Squares Date: 06/24/11 Time: 21:25 Sample: 2009M01 2011M04 Included observations: 28
Coefficien
Variable t Std. Error t-Statistic Prob.
C -307008.1 271050.2 -1.132661 0.2714 ZXQ 514.8120 214.0912 2.404638 0.0265 ZXQ^2 -0.094096 0.040618 -2.316589 0.0318 ZHQ -296.4071 102.6015 -2.888915 0.0094 ZHQ^2 0.045605 0.015943 2.860464 0.0100 YFQ 47.94584 43.11546 1.112034 0.2800 YFQ^2 -0.006359 0.006268 -1.014594 0.3230 SGQ 0.829686 23.05480 0.035988 0.9717 SGQ^2 -4.81E-05 0.002361 -0.020366 0.9840
R-squared 0.458952 Mean dependent var 9052.962 Adjusted R-squared 0.231142 S.D. dependent var 20987.88 S.E. of regression 18403.12 Akaike info criterion 22.73352 Sum squared resid 6.43E+09 Schwarz criterion 23.16173 Log likelihood -309.2693 F-statistic 2.014628 Durbin-Watson stat 1.368179 Prob(F-statistic) 0.100379
由 Obs*R-squared =12.85065 Probability = 0.117092>0.05。说明原模型不存在异方差
序列相关性检验
Breusch-Godfrey Serial Correlation LM Test:
F-statistic 0.472667 Probability Obs*R-squared 1.206149 Probability
Test Equation: Dependent Variable: RESID Method: Least Squares Date: 06/24/11 Time: 21:48 Presample missing value lagged residuals set to zero.
Coefficien
Variable t Std. Error t-Statistic Prob.
C -11.07608 192.0676 -0.057668 0.9546 SGQ 0.000161 0.020224 0.007962 0.9937 YFQ -0.000627 0.035232 -0.017801 0.9860 ZHQ 0.014498 0.052732 0.274933 0.7861 ZXQ -0.010592 0.068245 -0.155204 0.8781 RESID(-1) 0.221261 0.234844 0.942161 0.3568 RESID(-2) -0.080841 0.232572 -0.347596 0.7316
R-squared 0.043077 Mean dependent var 2.44E-14 Adjusted R-squared -0.230330 S.D. dependent var 96.89302 S.E. of regression 107.4740 Akaike info criterion 12.40469 Sum squared resid 242563.7 Schwarz criterion 12.73774 Log likelihood -166.6657 F-statistic 0.157556 Durbin-Watson stat 1.910527 Prob(F-statistic) 0.985236
原假设不存在序列相关 H0 没有序列自相关 H1 存在序列自相关 给定显著水平为0.05,根据LM 检验,原假设的概率正确的概率接近54.7%%。因此不能拒绝原假设,因此该序列不存在序列相关性 该模型的最终方程为:
HYS = 314.774 + 0.068*SGQ + 0.121*YFQ + 0.062*ZHQ + 0.616*ZXQ (187.028) (0.0194) (0.033) (0.049398) (0.064625) t= (1.683) (3.513) (3.708) (1.257) (9.528) R 2=0.878136 F=49.63979 N=28
结论
1.由个数据的t 检验可知,所有仅珠晖区的t 检验为通过,说明珠晖区的房价对衡阳市的整体房价没有显著影响,其他各区房价对衡阳市整体房价均有影响。且该四个区的房价反映了87.8%的衡阳市房价。且根据F 检验可知,结果显著。
2.在所有的解释变量中,蒸湘区的房价对衡阳市的整体房价影响最为显著,其后依次为雁峰区,石鼓区,珠晖区。
3.由此,我们可以判断在衡阳房地产也,目前蒸湘区发展得最好。
建议:如果要投资衡阳市房产或观察衡阳市的房产走向,可以重点观察蒸湘区,以此作为
参照模板,来正确投资其他地区。对政府来说,如果要抑制房价上涨,也应重点抓蒸湘区。总的来说,蒸湘区是衡阳房价变化的领衔主演。
缺陷
1.数据量太少,计算不太准确。
2. 模型的设计存在问题。消费者指数本身蕴涵了同期房价因素。
3. 模型F 检验不显著。模型线性设计有些错误。
参考资料
庞皓.2010. 计量经济学. 北京:科学出版社
百度百科
衡阳市统计局
谢荷锋老师课件
谢谢老师的辛苦指导! 11
