Excel功能强大,利用它的分析工具和函数,可以进行各种试验数据的多元线性回归分析。本文就从最简单的一元线性回归入手.
在数据分析中,对于成对成组数据的拟合是经常遇到的,涉及到的任务有线性描述,趋势预测和残差分析等等。很多专业读者遇见此类问题时往往寻求专业软件,比如在化工中经常用到的Origin和数学中常见的MATLAB等等。它们虽很专业,但其实使用Excel就完全够用了。我们已经知道在Excel自带的数据库中已有线性拟合工具,但是它还稍显单薄,今天我们来尝试使用较为专业的拟合工具来对此类数据进行处理。
文章使用的是2000版的软件,我在其中的一些步骤也添加了2007版的注解.
1 利用Excel2000进行一元线性回归分析
首先录入数据.
以连续10年最大积雪深度和灌溉面积关系数据为例予以说明。录入结果见下图(图1)。
图1
第二步,作散点图
如图2所示,选中数据(包括自变量和因变量),点击“图表向导”图标;或者在“插入”菜单中打开“图表(H)(excel2007)”。图表向导的图标为据变为蓝色(图2)。
。选中数据后,数
1
图2
点击“图表向导”以后,弹出如下对话框(图3):
图3
在左边一栏中选中“XY散点图”,点击“完成”按钮,立即出现散点图的原始形式(图4):
2
灌溉面积y(千亩)605040302010001020图4
灌溉面积y(千亩)30
第三步,回归
观察散点图,判断点列分布是否具有线性趋势。只有当数据具有线性分布特征时,才能采用线性回归分析方法。从图中可以看出,本例数据具有线性分布趋势,可以进行线性回归。回归的步骤如下:
⑴ 首先,打开“工具”下拉菜单,可见数据分析选项(见图5)(2007为”数据”右端的”数据分析”):
图5
用鼠标双击“数据分析”选项,弹出“数据分析”对话框(图6):
3
图6
⑵ 然后,选择“回归”,确定,弹出如下选项表:
图7
进行如下选择:X、Y值的输入区域(B1:B11,C1:C11),标志,置信度(95%),新工作表组,残差,线性拟合图。
或者:X、Y值的输入区域(B2:B11,C2:C11),置信度(95%), 新工作表组,残差,线性拟合图。
注意:选中数据“标志”和不选“标志”,X、Y值的输入区域是不一样的:前者包括数据标志:
最大积雪深度x(米) 灌溉面积y(千亩)
后者不包括。这一点务请注意。
4
图8-1 包括数据“标志”
图8-2 不包括数据“标志”
⑶ 再后,确定,取得回归结果(图9)。
5
图9 线性回归结果
⑷ 最后,读取回归结果如下:
截距:a2.356;斜率:b1.813;相关系数:R0.989;测定系数:
;F值:F371.945。 R20.979
⑸ 建立回归模型,并对结果进行检验
ˆ2.3561.813x 模型为:y至于检验,R、R2和F值可以直接从回归结果中读出。实际上,R0.9894160.632R0.05,8,检验通过。有了R值,F值和t值均可计算出来。F值的计算公式和结果为:
FR21(1R2)nk10.98941621(10.9894162)1011371.9455.32F0.05,8
当F检验通过时,意味着方程中至少有一个回归系数是显著的,但是并不一定所有的回归系数都是显著的,这样就需要通过T检验来验证回归系数的显著性。 F分布的表示:F α (回归自由度,残差自由度) 如何查F分布临界值表
1. 置信度:若置信度为95%,则查阅α=0.05 2. 回归自由度=变量数
3. 残差自由度 = 样本数 - 变量数 – 1
显然与表中的结果一样。t值的计算公式和结果为:
6
tR1Rnk120.97941610.979416101119.2862.306t0.05,8
如何查t分布表
1.残差自由度 = 样本数 - 变量数 - 1
2.置信度:若置信度为95%,则查阅α=0.05(双侧)
回归结果中给出了残差(图10),据此可以计算标准离差。首先求残差的平方
ˆi),然后求残差平方和Si(yiy离差为
22n10i12i1.7240.17416.107,于是标准
s于是
n1116.1072ˆ(yy)S1.419 iink1i1v8s1.4190.038810~15%0.1~0.15 y36.53图10 y的预测值及其相应的残差等
进而,可以计算DW值(参见图11),计算公式及结果为
DW(i2nini1)22ii1(1.9111.313)2(0.4170.833)20.751
(1.313)2(1.911)20.4172取0.05,k1,n10(显然v10118),查表得dl0.94,du1.29。显然,DW=0.751dl0.94,可见有序列正相关,预测的结果令人怀疑。
7
图11 利用残差计算DW值
最后给出利用Excel快速估计模型的方法:
⑴ 用鼠标指向图4中的数据点列,单击右键,出现如下选择菜单(图12):
图12
⑵ 点击“添加趋势线(R)”,弹出如下选择框(图13):
8
图13
⑶ 在“分析类型”中选择“线性(L)”,然后打开选项单(图14):
图14
⑷ 在选择框中选中“显示公式(E)”和“显示R平方值(R)”(如图14),确定,立即得到回归结果如下(图15):
9
图表标题6050y = 1.8129x + 2.3564R2 = 0.978940灌溉面积y(千亩)30线性 (灌溉面积20y(千亩))1000102030图15
在图15中,给出了回归模型和相应的测定系数即拟合优度。
10
因篇幅问题不能全部显示,请点此查看更多更全内容