实例1——中国粮食生产函数
根据理论和经验分析,影响粮食生产(Y)的主要因素有农业化肥施用量(X1)、粮食播种面积(X2)、成灾面积(X3)、农业机械总动力(X4)和农业劳动力(X5),其中成灾面积的符号为负,其余均应为正。下表给出了1983——2000中国粮食生产的相关数据,拟建立中国粮食生产函数。
年份 粮食产量Y化肥施用量X1播种面积X2成灾面积X3农业机械总动力X4农业劳动力(万吨) (万千克) (千公顷) (公顷) (万千瓦) X5(万人) 1983 38728.0 1659.8 114047.0 16209.3 18022.0 31645.1 1984 40731.0 1739.8 112884.0 15264.0 19497.0 31685.0 1985 37911.0 1775.8 108845.0 22705.3 20913.0 30351.5 1986 39151.0 1930.6 110933.0 23656.0 22950.0 30467.0 1987 40208.0 1999.3 111268.0 20392.7 24836.0 30870.0 1988 39408.0 2141.5 110123.0 23944.7 26575.0 31455.7 1989 40755.0 2357.1 112205.0 24448.7 28067.0 32440.5 1990 44624.0 2590.3 113466.0 17819.3 28708.0 33330.4 1991 43529.0 2806.1 112314.0 27814.0 29389.0 34186.3 1992 44264.0 2930.2 110560.0 25894.7 30308.0 34037.0 1993 45649.0 3151.9 110509.0 23133.0 31817.0 33258.2 1994 44510.0 3317.9 109544.0 31383.0 33802.0 32690.3 1995 46662.0 3593.7 110060.0 22267.0 36118.0 32334.5 1996 50454.0 3827.9 112548.0 21233.0 38547.0 32260.4 1997 49417.0 3980.7 112912.0 30309.0 42016.0 32434.9 1998 51230.0 4083.7 113787.0 25181.0 45208.0 32626.4 1999 50839.0 4124.3 113161.0 26731.0 48996.0 32911.8 2000 46218.0 4146.4 108463.0 34374.0 52574.0 32797.5 (1)建立Y对所有解释变量的回归模型,结果如下:
Y = -12815.75 + 6.213*X1 + 0.421*X2 - 0.166*X3 - 0.098*X4 - 0.028*X5
Variable Coefficient Std. Error t-Statistic Prob.
C -12815.75 14078.90 -0.910280 0.3806 X1 6.212562 0.740881 8.385373 0.0000 X2 0.421380 0.126925 3.319919 0.0061 X3 -0.166260 0.059229 -2.807065 0.0158 X4 -0.097770 0.067647 -1.445299 0.1740 X5 -0.028425 0.202357 -0.140471 0.8906 R-squared 0.982798 Mean dependent var 44127.11
Adjusted R-squared 0.975630 S.D. dependent var 4409.100 S.E. of regression 688.2984 Akaike info criterion 16.16752 Sum squared resid 5685056. Schwarz criterion 16.46431 Log likelihood -139.5077 F-statistic 137.1164 Durbin-Watson stat 1.810512 Prob(F-statistic) 0.000000
大连海事大学交通运输管理学院
1
计量经济学讲课提纲
2
从计算结果看,R较大并接近于1,而且F=137.11>F0.05=3.11,故认为粮食生产量与上述所有解释变量间总体线性相关显著。但是,同时,X4 、X5 前参数未通过t检验,而且符号的经济意义也不合理,故认为解释变量间存在多重共线性。为了进一步检验多重共线性,进行下面操作。 (2)计算解释变量间的两两相关系数,得到简单相关系数矩阵如下:
X1 X2 X3 X4 X5
X1 1
0.011823 0.640175 0.960278 0.54545
X2 X3 X4
X5
1
-0.45491 1
-0.03848 0.689565 1 0.182359 0.3557353 0.454169
1
从相关分析结果来看,部分解释变量间确实存在相关,尤其X1 与X4之间高度相关。为了处理多重共线性,正确选择解释变量,进行逐步回归,首先选择最优的基本方程。 (3)分别做粮食生产量对各个解释变量的回归,得
A.Y对X1回归结果:
Variable
C X1 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
Durbin-Watson stat
Coefficient Std. Error t-Statistic
30867.31 1206.364 25.58706 4.576115 0.398199 11.49202
0.891941 Mean dependent var 0.885187 S.D. dependent var 1493.984 Akaike info criterion 35711799 Schwarz criterion -156.0465 F-statistic
1.855174 Prob(F-statistic)
Prob.
0.0000 0.0000 44127.11 4409.100 17.56072 17.65965 132.0666 0.000000
B.Y对X2回归结果:
Variable
C X2
R-squared
Adjusted R-squared S.E. of regression
Coefficient Std. Error t-Statistic Prob.
-33822.41 68409.15 -0.494414 0.6277 0.698880 0.613273 1.139590 0.2712
0.075073 Mean dependent var 44127.11 0.017265 S.D. dependent var 4409.100 4370.873 Akaike info criterion 19.70775
大连海事大学交通运输管理学院
2
计量经济学讲课提纲
Sum squared resid 3.06E+08 Schwarz criterion
19.80668
Log likelihood
-175.3698 F-statistic
1.298665 Durbin-Watson stat
0.118043 Prob(F-statistic)
0.271231
C.Y对X3回归结果
Variable
Coefficient Std. Error t-Statistic
Prob.
C 35712.86 4926.583 7.249012 0.0000
X3 0.349978 0.200802 1.742906
0.1005 R-squared
0.159563 Mean dependent var 44127.11
Adjusted R-squared 0.107036 S.D. dependent var 4409.100 S.E. of regression 4166.457 Akaike info criterion 19.61196 Sum squared resid 2.78E+08 Schwarz criterion 19.71089 Log likelihood
-174.5076 F-statistic
3.037721 Durbin-Watson stat
0.935587 Prob(F-statistic)
0.100533
D.Y对X4回归结果:
Variable
Coefficient Std. Error t-Statistic
Prob.
C 31918.72 1828.715 17.45418 0.0000 X4 0.379967 0.054448 6.978587
0.0000 R-squared
0.752707 Mean dependent var 44127.11
Adjusted R-squared 0.737252 S.D. dependent var 4409.100 S.E. of regression 2260.060 Akaike info criterion 18.38861 Sum squared resid 81725964 Schwarz criterion 18.48754 Log likelihood
-163.4975 F-statistic
48.70067 Durbin-Watson stat
1.109488 Prob(F-statistic)
0.000003
E.Y 对X5回归结果:
Variable
Coefficient Std. Error t-Statistic
Prob.
C -28260.02 27240.49 -1.037427 0.3150
X5 2.239614 0.842352 2.658762
0.0172 R-squared
0.306429 Mean dependent var 44127.11
Adjusted R-squared 0.263081 S.D. dependent var 4409.100 S.E. of regression 3784.948 Akaike info criterion 19.41989 Sum squared resid 2.29E+08 Schwarz criterion 19.51882 Log likelihood
-172.7790 F-statistic
7.069018 Durbin-Watson stat
0.357079 Prob(F-statistic)
0.017160
大连海事大学交通运输管理学院
3
计量经济学讲课提纲
(4)逐步回归,
A、Y对X1、X4回归结果:
Variable
C X1 X4 R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
Durbin-Watson stat
Coefficient Std. Error t-Statistic
31164.92 1137.219 27.40451 6.925938 1.331502 5.201597 -0.221178 0.120350 -1.837792
0.911800 Mean dependent var 0.900040 S.D. dependent var 1394.000 Akaike info criterion 29148555 Schwarz criterion -154.2188 F-statistic
1.992572 Prob(F-statistic)
Prob.
0.0000 0.0001 0.0860 44127.11 4409.100 17.46875 17.61715 77.53409 0.000000
从回归结果看,拟合优度虽然上升,但X4的系数不显著,因此,存在共线性,而相比较而言,X1更重要,因此剔除X4(从相关分析也有助于这个结论)。
B、Y对X1、X5回归结果:
Variable
C X1 X5
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
Durbin-Watson stat
Coefficient Std. Error t-Statistic
24133.84 12406.48 1.945261 4.431559 0.485883 9.120625 0.221289 0.405706 0.545442
0.894042 Mean dependent var 0.879914 S.D. dependent var 1527.902 Akaike info criterion 35017273 Schwarz criterion -155.8697 F-statistic
1.839712 Prob(F-statistic)
Prob. 0.0707 0.0000 0.5935
44127.11 4409.100 17.65219 17.80059 63.28281 0.000000
拟合优度升高不显著,修正的拟合优度略微下降,且X5系数不显著,因此,剔除X5.
C、Y对X1、X3回归结果:
Variable Coefficient Std. Error t-Statistic Prob.
C 35065.01 1064.612 32.93688 0.0000 X1 5.654330 0.312199 18.11132 0.0000 X3 -0.304546 0.056452 -5.394803 0.0001
大连海事大学交通运输管理学院
4
计量经济学讲课提纲
从回归结果看,拟合优度提高,X1和X3的系数显著,因此接受X3.
D、Y对X1、X2、X3回归结果:
Variable Coefficient Std. Error t-Statistic Prob.
C -11978.18 14072.92 -0.851151 0.4090 X1 5.255935 0.268595 19.56828 0.0000 X2 0.408432 0.121974 3.348522 0.0048 X3 -0.194609 0.054533 -3.568637 0.0031
R-squared 0.979593 Mean dependent var 44127.11 Adjusted R-squared 0.975220 S.D. dependent var 4409.100 S.E. of regression 694.0715 Akaike info criterion 16.11616 Sum squared resid 6744293. Schwarz criterion 16.31402 Log likelihood -141.0454 F-statistic 224.0086 Durbin-Watson stat 1.528658 Prob(F-statistic) 0.000000
从回归结果看,拟合优度提高,X1、X2和X3的系数显著,因此接受X2. 即,回归方程为:
Y = -11978.18057 + 5.255935121*X1 + 0.408432175*X2 - 0.1946087795*X3
R-squared
Adjusted R-squared S.E. of regression Sum squared resid Log likelihood
Durbin-Watson stat
0.963248 Mean dependent var 0.958348 S.D. dependent var 899.8443 Akaike info criterion 12145797 Schwarz criterion -146.3400 F-statistic
1.728340 Prob(F-statistic)
44127.11 4409.100 16.59333 16.74173 196.5723 0.000000
实例2
我国1988年-1998年的城镇居民人均全年耐用消费品支出、人均全年可支配收入以及耐用消费品价格指数的统计资料如下表,试建立城镇居民人均全年耐用消费品支出Y关于人均全年可支配收入x1和耐用消费品价格指数X2的回归模型,并进行回归分析。
Y01X12X2u,根据经验和对经济现实的分析,设定模型为二元线性回归模型,理论形式为:
(1)数据如下表,
年份 1988 1989 1990 1991 1992 1993 1994 人均全年可支配收入X1(元) 1181.4 1375.7 1501.2 1700.6 2026.6 2577.4 3496.2 大连海事大学交通运输管理学院
耐用消费品价格指数X2(1987) 115.96 133.35 128.21 124.85 122.49 129.86 139.52 人均耐用消费品支出Y(元) 137.16 124.56 107.91 102.96 125.24 162.45 217.43 5
计量经济学讲课提纲
1995 1996 1997 1998 4283 4838.9 5160.3 5425.1 140.44 139.12 133.35 126.39 253.42 251.07 285.85 327.26 (2)Eviews的输出结果(下表)写出回归方程为:
EXPENSEY = 158.5398355 + 0.04940379666*INCOMEX1 - 0.911684216*PRINDEX2
Variable Coefficient Std. Error t-Statistic Prob.
C 158.5398 121.8071 1.301564 0.2293 INCOMEX1 0.049404 0.004684 10.54786 0.0000 PRINDEX2 -0.911684 0.989546 -0.921316 0.3838
R-squared 0.947989 Mean dependent var 190.4827 Adjusted R-squared 0.934986 S.D. dependent var 79.29127 S.E. of regression 20.21757 Akaike info criterion 9.077982 Sum squared resid 3270.001 Schwarz criterion 9.186499 Log likelihood -46.92890 F-statistic 72.90647 Durbin-Watson stat 1.035840 Prob(F-statistic) 0.000007
(3)检验
①从经济意义来看,可支配收入前的系数为0.0494,正的,介于0和1之间,符号、大小与理论符合;价格指数
前的系数为-0.91,大小和符号符合经济理论; ②从统计角度看,
R-squared=0.947989,Adjusted R-squared=0.934986,从多元回归修正的判定系数看,回归方程较好地拟合了散点,被解释变量的变异中有93%以上可以由方程来解释;
从F统计量的结果来看,F=72.90647>F0.05(2,8)=4.46,而且F=72.90647>F0.01(2,8)=8.65,可见方程总体来看,无论在0.05还是0.01水平上都显著,即在我国城镇居民人均全年耐用消费品支出与人均全年可支配收入和耐用消费品价格指数之间存在显著的线性关系。这一点结论由F统计量的精确显著性水平Prob=0.000007也可得到。
t统计量结果来看,可支配收入incomex1的系数,t值=10.54786>t0.05(8)=2.306,系数显著,可支配收入对耐用消费品支出有显著影响,变量x1保留;而对于耐用消费品价格指数prindex2的系数,t值=-0.921316,其绝对值小于t0.05(8),可以接受系数为零的原假设,剔除X2。以上结论由Eviews输出结果中系数的精确显著性水平Prob也可以直接得到。
(4)预测:点预测和区间预测 若已知2000年,我国城镇居民家庭人均可支配收入为5800元,耐用消费品价格指数为135,对2000年我国城镇居民家庭人均耐用消费品支出进行预测。
①点预测,将x1=5800,X2=135代入估计方程,EXPENSEY = 158.5398 + 0.0494*5800 - 0.9117*135,
得到Y的估计值=321.9803(教材中是按照小数点后保留4位数字后的样本回归方程计算得到的,而Eviews
大连海事大学交通运输管理学院 6
计量经济学讲课提纲
软件的估计值是322.0045)。(也可可以在Eviews中调整扩大数据范围至2000,再将解释变量的数据输入,再利用Equation窗口下的forecast进行预测,估计值即保存在EXPENSEYf序列中。)
②区间预测
E(Y0)的区间预测
21ˆ)SX(XX)X Y的估计值的Y0的方差估计为,Var(Y000已知X2000矩阵为:
X200015800则X2000矩阵的转置矩阵为:
135,
X200015800, 135而解释变量X矩阵为:
1181.4 115.96
1 1375.7 133.35 1 1501.2 128.21 1 1700.6 124.85 1 2026.6 122.49 1 2577.4 129.86 1 3496.2 139.52 1 4283 140.44 1 4838.9 139.12
133.35 1 5160.3
11×3 1 5425.1 126.39
1
X矩阵的转置矩阵为:
1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 1.000000 1181.400 1375.700 1501.200 1700.600 2026.600 2577.400 3496.200 4283.000 4838.900 5160.300 5425.100 115.9600 133.3500 128.2100 124.8500 122.4900 129.8600 139.5200 140.4400 139.1200 133.3500 126.3900
3×11
S2X0(XX)1X0S2*X0*@inverse(XX)*X0155.5708(其中残差的方差可由输
ˆ的标准差估计值为出结果计算得到,其它各项可由矩阵运算得到。)从而得到Yˆ)因此,Var(Y02000ˆ)155.570812.4728,于是,对于给定的显著性水平0.05,计算得到E(Y0)的95%置信区S(Y2000间为:
ˆt(nk)S(Yˆ),Yˆt(nk)S(Yˆ))(321(Y,98032.306*12.4728,321.98032.306*12.4728)200020002000200022(293.218,350.7426)
同理可计算Y0的预测区间为
ˆ)S2(1X(XX)1X)S2*(1XVar(Y2000Y*@inverse(XX)*X20002000200020002000)564.3221,
ˆ)的标准差估计值为S(YYˆ)564.322123.7555,于是,对于给定的显著Y从而得到(Y2000200020002000大连海事大学交通运输管理学院 7
计量经济学讲课提纲
性水平0.05,计算得到Y0的95%置信区间为:
22ˆt(nk)S(YYˆ),Yˆt(nk)S(YYˆ))(321(Y,98032.306*23.7555,321.98032.306*200020002000200020002000(267.2001,376.7605)习题1(数据来源:张晓峒,《计量经济学基础》,P85,3)
题干:经研究发现,学生用于购买书籍及课外读物的支出与本人受教育年限和其家庭收入水平有关,对18名学生进行调查的统计资料如下表所示。 数据:
学生序号 购买书籍及课外读物支出Y(元/年) 受教育年限X1(年) 家庭月可支配收入X2(元/月) 1 450.5 4 171.2 2 507.7 4 174.2 3 613.9 5 204.3 4 563.4 4 218.7 5 501.5 4 219.4 6 781.5 7 240.4 7 541.8 4 273.5 8 611.1 5 294.8 9 1222.1 10 330.2 10 793.2 7 333.1 11 660.8 5 366 12 792.7 6 350.9 13 580.8 4 357.9 14 612.7 5 359 15 890.8 7 371.9 16 1121 9 435.3 17 1094.2 8 523.9 18 1253 10 604.1 问题:
(1) 试求出学生购买书籍及课外读物的支出Y与受教育年限X1和家庭收入水平X2的估计回归方程:
ˆˆXˆX; ˆY01122(2) 对1、2的显著性进行t检验; (3) 计算R和R;
(4) 假设有一学生的受教育年限X1=10年,家庭月可支配收入X2=480元/月,试预测该学生全年购买书籍及
课外读物的支出,并求出相应的预测区间(0.05)。
22大连海事大学交通运输管理学院 8
因篇幅问题不能全部显示,请点此查看更多更全内容