统计案例易错点分类
1.某产品的广告费用x与销售额y的不完整统计数据如表: 广告费用x(万元) 销售额y(万元) 3 22 4 28 5 m 若已知回归直线方程为=9x﹣6,则表中m的值为( ) A.40 B.39 C.38 D.37
2.广告投入对商品的销售额有较大影响.某电商对连续5个年度的广告费和销售额进行统计,得到统计数据如表(单位:万元): 广告费x 销售额y 2 29 3 41 4 50 5 59 6 71 由表可得到回归方程为=10.2x+,据此模型,预测广告费为10万元时的销售额约为( ) A.101.2
B.108.8
C.111.2
D.118.2
3.已知变量x与y的取值如表所示,且2.5<n<m<6.5,则由该数据算得的线性回归方程可能是( )
x y A.
=0.8x+2.3 B.
2 6.5 =2x+0.4
C.
3 m =﹣1.5x+8 D.
4 n =﹣1.6x+10
5 2.5 4.设某中学的高中女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,3,„,n),用最小二乘法近似得到回归直线方程为结论中不正确的是( ) A.y与x具有正线性相关关系 B.回归直线过样本的中心点
,则下列
C.若该中学某高中女生身高增加1cm,则其体重约增加0.85kg D.若该中学某高中女生身高为160cm,则可断定其体重必为50.29kg 5.以下四个命题中,其中真命题的个数为( )
①在回归分析中,可用相关指数R的值判断模型的拟合效果,R越大,模拟的拟合效果越好; ②两个随机变量的线性相关性越强,相关系数越接近于1;
③若数据x1,x2,x3„,xn的方差为1,则3x1,3x2,3x3„,3xn的方差为3;
④对分类变量x与y的随机变量的观测值k来说,k越小,判断“x与y有关系”的把握程度越大. A.1
B.2
C.3
D.4
1 更多进步 少走弯路
2
2
2
6.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是( )
A.若K的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系;那么在100个吸烟的人中必有99人患有肺病
B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病
C.若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误 D.以上三种说法都不正确
7.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,算得
,
=20,
=184,
=720.
2
1)求家庭的月储蓄y关于月收入x的线性回归方程;
2)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.
附:回归直线的斜率和截距的最小二乘法估计公式分别为:=,=.
8.某气象站观测点记录的连续4天里,AQI指数M与当天的空气水平可见度y(单位cm)的情况如下表1: M y 900 0.5 700 3.5 300 6.5 100 9.5 哈尔滨市某月AQI指数频数分布如下表2:
M [0,200] (200,400] 频数 (1)设x=
3 6 (400,600] 12 (600,800] 6 (800,1000] 3 ,根据表1的数据,求出y关于x的回归方程;
(参考公式:;其中,)
2 更多进步 少走弯路
(2)小张开了一家洗车店,经统计,当M不高于200时,洗车店平均每天亏损约2000元;当M在200至400时,洗车店平均每天收入约4000元;当M大于400时,洗车店平均每天收入约7000元;根据表2估计小张的洗车店该月份平均每天的收入.
9.某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费x(单位:千元)对年销售量y(单位:吨)的影响,对近8年的年宣传费x1和年销售量yi(i=1,2,3,..8)数据作了初步处理,得到下面的散点图及一些统计量的值. (xi﹣)2(wi﹣)2(xi﹣)(yi﹣) (wi﹣)(yi﹣) 1469 108.8 46.6 566.289.8 1.6 3 8 表中:w1=
,=
wi
,哪一个适宜作为年销售量y关于年宣传费x的回归方程
(Ⅰ)根据散点图判断,y=a+bx与y=c+d类型(给出判断即可,不必说明理由);
(Ⅱ)根据(I)的判断结果及表中数据,建立y关于x的回归方程;
(Ⅲ)根据(Ⅱ)中的回归方程,求当年宣传费x=36千元时,年销售预报值是多少?
附:对于一组数据(u1 v1),(u2 v2)„..(un vn),其回归线v=α+βu的斜率和截距的最小二乘估
计分别为:=,=﹣.
3 更多进步 少走弯路
10.某学校高三年级有学生500人,其中男生300人,女生200人,为了研究学生的数学成绩是否与性别有关,现采用分层抽样的方法,从中抽取了100名学生,先统计了他们期中考试的数学分数,然后按性别分为男、女两组,再将两组学生的分数分成5组:[100,110),[110,120),[120,130),[130,140),[140,150]分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中分数小于110分的学生中随机抽取2人,求两人恰好为一男一女的概率;
(2)若规定分数不小于130分的学生为“数学尖子生”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“数学尖子生与性别有关”? P(K≥k0) 0.100 k0 附:K=
220.050 3.841 0.010 6.635 .
0.001 10.828 2.706 4 更多进步 少走弯路
参考答案
1.解:由题意,回归方程过样本平均数点(,),可求出=4 代入得;=36﹣6=30, 则30=故选:A.
2.解:由题意,=4,=50.
∴50=4×10.2+,解得=9.2.∴回归方程为=10.2x+9.2. ∴当x=10时,=10.2×10+9.2=111.2. 故选:C.
3.解:由题意,=3.5,=
∈(3.5,5.5),
,∴m=40.
由2.5<n<m<6.5,可得为负相关,排除A,B,代入选项C,D, 可得D满足. 故选D.
4.解:由于线性回归方程中x的系数为0.85,因此y与x具有正的线性相关关系,A正确; 由线性回归方程必过样本中心点
,因此B正确;
由线性回归方程中系数的意义知,x每增加1cm,其体重约增加0.85kg,C正确; 当某女生的身高为160cm时,其体重估计值是50.29kg,而不是具体值,因此D错误. 故选:D.
5.解:(1)用相关指数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好,故(1)正确;
(2)若两个随机变量的线性相关性越强,则相关系数r的绝对值越接近于1,故(2)错误;
(3)若统计数据x1,x2,x3,…,xn的方差为1,则3x1,3x2,3x3…,3xn的方差为9,故(3)错误;
(4)对分类变量x与y的随机变量k2的观察值k2来说,k越小,判断“x与y有关系”的把握程度越大.错误; 故选:A.
5 更多进步 少走弯路
6.解:若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系;而不是在100个吸烟的人中必有99人患有肺病,故不正确;
从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,是指吸烟与患肺病有关系的概率,而不是吸烟人就有99%的可能患有肺病,故不正确;
若从统计量中求出有95% 的把握认为吸烟与患肺病有关系,是指有5% 的可能性使得推判出现错误,正确; 故选C.
7.解:1)由题意知n=10,
,
又,,
由此得,=2﹣0.3×8=﹣0.4,
故所求线性回归方程为=0.3x﹣0.4.
2)将x=7代入回归方程,可以预测该家庭的月储蓄约为=0.3×7﹣0.4=1.7(千元). 8.解:(1)=(9+7+3+1)=5,=(0.5+3.5+6.5+9.5)=5, 则=
=5﹣(﹣1.05)×5=10.25, 故
.
=0.1, =﹣1.05,
(2)由表2知AQI指数不高于200的频率为AQI指数在200至400的频率为AQI指数大于400的频率为0.7. 设每月的收入为X,则X的分布列为 X ﹣2000 P 0.1 0.2 0.7 4000 7000 =0.2,
则X的数学期望为E(X)=﹣2000×0.1+4000×0.2+7000×0.7=5500, 即小张的洗车店该月份平均每天的收入为5500.
6 更多进步 少走弯路
9.解:(Ⅰ)由散点图可以判断:y=c+d程类型; (Ⅱ)令ϖ=
适宜作为年销售量y关于年宣传费x的回归方
,先建立y关于ω的线性回归方程,
由于===68,
=﹣=563﹣68×6.8=100.6,
∴y关于ω的线性回归方程为:=100.6+68ω; (Ⅲ)由(Ⅱ)知:当x=36时,年销售量y的预报值 =100.6+68
=508.6,
故年宣传费x=36千元时,年销售预报值是508.6吨.
10.解:(1)由已知得,抽取的100名学生中,男生60名,女生40名, 分数小于等于110分的学生中,
男生人有60×0.05=3(人),记为A1,A2,A3; 女生有40×0.05=2(人),记为B1,B2;…(2分)
从中随机抽取2名学生,所有的可能结果共有10种,它们是: (A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2), (A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2);
其中,两名学生恰好为一男一女的可能结果共有6种,它们是: (A1,B1),(A1,B2),(A2,B1),
(A2,B2),(A3,B1),(A3,B2);…(4分) 故所求的概率为P=
=…(6分)
(2)由频率分布直方图可知,
在抽取的100名学生中,男生 60×0.25=15(人),女生40×0.375=15(人);…(7分) 据此可得2×2列联表如下:
数学尖子生 15 15 30 非数学尖子生 45 25 70 合计 60 40 100 男生 女生 合计 7 更多进步 少走弯路
(9分) 所以得K2=因为1.79<2.706,
所以没有90%的把握认为“数学尖子生与性别有关”…(12分)
=
≈1.79;…(11分)
8 更多进步 少走弯路
因篇幅问题不能全部显示,请点此查看更多更全内容