(时间:120分钟 满分:160分)
一、填空题(本大题共14小题,每小题5分,共70分)
^
1.若线性回归方程为y=2-3.5x,则变量x增加一个单位,变量y平均________. 答案 减少3.5个单位
^
^
解析 由线性回归方程可知b=-3.5,则变量x增加一个单位,y减少3.5个单位,即变量y平均减少3.5个单位.
2.四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:
^
①y与x负相关且y=2.347x-6.423;
^
②y与x负相关且y=-3.476x+5.648;
^
③y与x正相关且y=5.437x+8.493;
^
④y与x正相关且y=-4.326x-4.578. 其中一定不正确的结论的序号是________. 答案 ①④
解析 ①中,回归方程中x的系数为正,不是负相关;④方程中的x的系数为负,不是正相关,所以①④一定不正确.
3.下列语句表示的事件中的因素不具有相关关系的是________.(填序号) ①瑞雪兆丰年;②名师出高徒;③吸烟有害健康;④喜鹊叫喜,乌鸦叫丧. 答案 ④
解析 “喜鹊叫喜,乌鸦叫丧”是一种迷信说法,它们之间无任何关系. 4.下列结论正确的是________.(填序号) ①函数关系是一种确定性关系; ②相关关系是一种非确定性关系;
③回归分析是对具有函数关系的两个变量进行统计分析的一种方法; ④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法. 答案 ①②④
5.独立性检验中,假设H0:变量X与变量Y没有关系,则在H0成立的情况下,P(χ2≥6.635)≈0.010表示的意义说法正确的序号为________.(填序号)
①变量X与变量Y有关系的概率为1%; ②变量X与变量Y有关系的概率为99.9%;
③变量X与变量Y没有关系的概率为99%; ④变量X与变量Y有关系的概率为99%. 答案 ④
解析 由题意得变量X与变量Y没有关系的概率约为0.01,即可认为变量X与变量Y有关系的概率为99%.
6.下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份x 用水量y 1 4.5 2 4 3 3 4 2.5 ^
由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归方程是y=
^
^
-0.7x+a,则a=________.
答案 5.15
^
解析 样本点的中心为(2.5,3.5),将其代入线性回归方程可解得a=5.25.
7.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的线性回
^
^
归方程的回归系数为b,回归截距是a,那么必有________.(填序号)
^
^
①b与r的符号相同;②a与r的符号相同;
^
^
③b与r的符号相反;④a与r符号相反. 答案 ①
^
nxi-i=1
xyi-y
x
2
解析 b=
nxi-i=1
,
nxi-i=1
xyi-yxnyi-y
i=1
^2
r=
nxi-i=1
2
,b和r的分母均大于0,分子相同,
^
∴b和r的符号相同.
8.如下图所示,有5组(x,y)数据,去掉数据________后,剩下的四组数据的线性相关系数最大.
答案 D
9.在一组样本数据(x1,y1),(x2,y2),„,(xn,yn)(n≥2,x1,x2,„,xn不全相等)的
1
散点图中,若所有样本点(xi,yi)(i=1,2,„,n)都在直线y=x+1上,则这组样本数据的样
2本相关系数为________.
答案 1
10.在两个学习基础相当的班级实行某种教学措施的实验,测试结果见下表,则在犯错误的概率不超过0.005的前提下推断实验效果与教学措施________(填“有关”、“无关”).
实验班 对比班 总计 答案 有关
100×48×12-38×22
解析 χ=≈8.306>7.879,则在犯错误的概率不超过0.005的前
50×50×86×14
2
优、良、中 48 38 86 差 2 12 14 总计 50 50 100 提下认为“实验效果与教学措施有关”.
11.考古学家通过始祖鸟化石标本发现:其股骨长度x(cm)与肱骨长度y(cm)的线性回
^
归方程为y=1.197x-3.660,由此估计,当股骨长度为50cm时,肱骨长度的估计值为________cm.
答案 56.19
^
解析 根据线性回归方程y=1.197x-3.660,将x=50代入,得y=56.19,则肱骨长度的估计值为56.19cm.
12.下面是一个2×2列联表:
x1 x2 总计 则b-d=________. 答案 8
解析 ∵a=70-21=49, c=30-5=25,
∴b=49+5=54,d=21+25=46, ∴b-d=8.
13.为了探究电离辐射的剂量与人体的受损程度是否有关,用两种不同剂量的电离辐射照射小白鼠.在照射14天内的结果如表所示:
死亡 存活 总计 y1 a 5 b y2 21 c d 总计 70 30 100 第一种剂量 第二种剂量 总计 14 6 20 11 19 30 25 25 50 进行统计分析时的统计假设是________. 答案 小白鼠的死亡与剂量无关
解析 根据独立性检验的基本思想,可知类似于反证法,即要确认“两个分量有关系”这一结论成立的可信程度,首先假设该结论不成立.对于本题,进行统计分析时的统计假设应为“小白鼠的死亡与剂量无关”.
14.某调查者从调查中获知某公司近年来科研费用支出x(万元)与公司所获得利润y(万元)的统计资料如下表:
序号 1 2 3 4 5 6 总计 科研费用支出xi 5 11 4 5 3 2 30 利润yi 31 40 30 34 25 20 180 xiyi 155 440 120 170 75 40 1000 x2i 25 121 16 25 9 4 200 则利润y对科研费用支出x的线性回归方程为________. ^
答案 y=2x+20
^
^
^
解析 设线性回归方程为y=a+bx. 1000-6×5×30由表中数据得,b==2,
200-6×52^
^
^
∴a=y-bx=30-2×5=20,
^
∴线性回归方程为y=2x+20.
二、解答题(本大题共6小题,共90分)
15.(14分)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了4次试验,得到数据如下:
零件的个数x(个) 加工的时间y(小时) 2 2.5 3 3 4 4 5 4.5 (1)在给定的坐标系中画出表中数据的散点图;
^
^
^
(2)求y关于x的线性回归方程y=bx+a; (3)试预测加工10个零件需要的时间.
解 (1)散点图如图所示: 2+3+4+5
(2)x==3.5,
4y=4i=14
2.5+3+4+4.5
=3.5,
4
∑xiyi=2×2.5+3×3+4×4+5×4.5=52.5,
2∑xi=4+9+16+25=54, =
^
i1
52.5-4×3.5×3.5∴b==0.7,
54-4×3.52^
a=3.5-0.7×3.5=1.05,
^
∴所求线性回归方程为y=0.7x+1.05.
^
(3)当x=10时,y=0.7×10+1.05=8.05, ∴预测加工10个零件需要8.05小时.
(14分)电视传媒公司为了了解某地区电视观众对某类体育节目的收视情况,随机抽
取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.
根据已知条件完成下面的2×2列联表,并据此资料,你是否认为“体育迷”与性别有关?
男 女 合计 非体育迷 体育迷 10 合计 55 解 (1)由所给的频率分布直方图知, “体育迷”人数为100×(10×0.020+10×0.005)=25. “非体育迷”人数为75,则据题意完成2×2列联表:
男 女 合计 非体育迷 30 45 75 体育迷 15 10 25 合计 45 55 100 将2×2列联表的数据代入公式计算: 100×30×10-45×152χ=≈3.030>2.706.
75×25×45×55
2
所以在犯错误的概率不超过0.10的前提下可以认为“体育迷”与性别有关.
(14分)在海南省第二十四届科技创新大赛活动中,某同学为研究“网络游戏对当代
青少年的影响”作了一次调查,共调查了50名同学,其中男生26人,有8人不喜欢玩电脑游戏,而调查的女生中有9人喜欢玩电脑游戏.
(1)根据以上数据建立一个2×2的列联表;
(2)根据以上数据,在犯错误的概率不超过0.025的前提下,能否认为“喜欢玩电脑游戏与性别有关系”?
解 (1)2×2列联表
性别 游戏态度 男生 女生 总计 喜欢玩电脑游戏 不喜欢玩电脑游戏 总计 50×18×15-8×92(2)χ=≈5.06,
27×23×24×26
2
18 8 26 9 15 24 27 23 50 又P(χ2≥0.025)=5.024<5.06,故在犯错误的概率不超过0.025的前提下,可以认为“喜欢玩电脑游戏与性别有关系”.
18.(16分)某校团对“学生性别与是否喜欢韩剧有关”作了一次调查,其中女生人数是112
男生人数的,男生喜欢韩剧的人数占男生人数的,女生喜欢韩剧的人数占女生人数的.
263若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则男生至少有多少人?
解 设男生人数为x,依题意可得列联表如下:
男生 女生 总计 喜欢韩剧 x 6x 3x 2不喜欢韩剧 5x 6x 6x 总计 X x 23x 2若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有关,则χ2>3.841, 3xxx5xx2××-×2666332
由χ==x>3.841,
xx8x×××x22解得x>10.24,
xx
∵,为整数,∴若在犯错误的概率不超过0.05的前提下认为是否喜欢韩剧和性别有26关,则男生至少有12人.
(16分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽多少之间的关系
进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下资料:
日期 温差x(℃) 发芽数y(颗) 12月1日 10 23 12月2日 11 25 12月3日 13 30 12月4日 12 26 12月5日 8 16 该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.
(1)求选取的2组数据恰好是不相邻2天数据的概率;
(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数
^
^
^
据,求出y关于x的线性回归方程y=bx+a;
(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得的线性回归方程是否可靠?
解 (1)设事件A表示“选取的2组数据恰好是不相邻2天的数据”,则A表示“选取的数据恰好是相邻2天的数据”.
基本事件总数为10,事件A包含的基本事件数为4. ∴P(A)=
42=, 105
3
∴P(A)=1-P(A)=. 5
(2)x=12,y=27,∑xiyi=977,∑x2i=434, ==
i1
i1
3^
i=1
3
3
∴b=
∑xiyi-3x y
i1
2
∑xi-3x=32
=977-3×12×27
434-3×122=2.5,
^
^
a=y-bx=27-2.5×12=-3,
^
∴y=2.5x-3.
^
(3)由(2)知:当x=10时,y=22,误差不超过2颗;
^
当x=8时,y=17,误差不超过2颗. 故所求得的线性回归方程是可靠的.
(16分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为
研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布直方图.
(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概率;
(2)规定日平均生产件数不少于80件者为“生产能手”,请你根据已知条件完成2×2列联表,并判断是否有90%的把握认为“生产能手与工人所在的年龄组有关”?
P(χ2≥k) k
nad-bc2(注:χ=)
a+bc+da+cb+d
2
0.100 2.706 0.050 3.841 0.010 6.635 0.001 10.828 解 (1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名. 所以,样本中日平均生产件数不足60件的工人中,25周岁以上组工人有60×0.05=3(人),
记为A1,A2,A3;25周岁以下组工人有40×0.05=2(人),记为B1,B2.
从中随机抽取2名工人,所有的可能结果共有10种,它们是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).
其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们是:(A1,B1),(A1,7B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率P=.
10
(2)由频率分布直方图可知,在抽取的100名工人中,“25周岁以上组”中的生产能手60×0.25=15(人),“25周岁以下组”中的生产能手40×0.375=15(人),据此可得2×2列联表如下:
25周岁以上组 25周岁以下组 合计 nad-bc2所以得χ= a+bc+da+cb+d
2
生产能手 15 15 30 非生产能手 45 25 70 合计 60 40 100 100×15×25-15×452=≈1.79.
60×40×30×70因为1.79<2.706.
所以没有90%的把握认为“生产能手与工人所在的年龄组有关”.
因篇幅问题不能全部显示,请点此查看更多更全内容