【创新方案】2015高考数学一轮复习(知识回扣+热点突破+能力提升)变量间的相关关系与统计案例 理 北师大版

第三节

变量间的相关关系与统计案例

1.会作两个相关变量的散点图,会利用散点图认识变量之间的相关关系. 2.了解最小二乘法的思想,能根据给出的线性回归系数公式建立线性回归方程. 3.了解独立性检验(只要求 2×2 列联表)的基本思想、方法及其简单应用. 4.了解回归分析的基本思想、方法及其简单应用.

1.相关性 (1)线性相关: 若两个变量 x 和 y 的散点图中,所有点看上去都在一条直线附近波动,则称变量间是线 性相关的,此时可用一条直线来近似. (2)非线性相关: 若两个变量 x 和 y 的散点图中,所有点看上去都在某条曲线(不是一条直线)附近波动, 则称此相关为非线性相关,此时可用一条曲线来拟合. (3)不相关 如果所有的点在散点图中没有显示任何关系,则称变量间是不相关的. 2.最小二乘法 (1)最小二乘法: 如果有 n 个点(x1,y1),(x2,y2),??,(xn,yn),可以用下面的表达式来刻画这些点与 2 2 2 直线 y=a+bx 的接近程度:[y1-(a+bx1)] +[y2-(a+bx2)] +??+[yn-(an+bxn)] 使得 上式达到最小值的直线 y=a+bx 即所求直线,这种方法称为最小二乘法. (2)线性 回归方程:

?x y
i ?1 n i

n

i

? nx y ? nx
2

线性回归方程为 y=bx+a,其中 b=

?x
i ?1

2

i



a= y -b x .
3.相关系数 r

? ( x ? x)( y ? y)
i ?1 i i

n

(1)r=

? ( x ? x) ? ( y
2 i ?1 i i ?1

n

n

i

? y)

2

? x y ? nx y

i ?1 i i

n

?x
i ?1

n

2 i

? nx

2

?y
i ?1

n

.
2 i

? ny

2

(2)当 r>0 时,称两个变量正相关. 当 r<0 时,称两个变量负相关. 当 r=0,称两个变量线性不相关. r 的绝对值越接近于 1,表明两个变量之间的线性相关程度越高;r 的绝对值越接近于 0, 表明两个变量之间的线性相关程度越低. 4.独立性检验 (1)2×2 列联表:

-1-



设 A,B 为两个变量,每一个变量都可以取两个值,变量 A:A1,A2=A1;变量 B:B1,B2


=B1,通过观察得到下表所示的数据:

B A A1 A2
总计

B1 a c a+c

B2 b d b+d

总计

a+b c+d n=a+b+c+d

其中,a 表示变量 A 取 A1,且变量 B 取 B1 时的数据;b 表示变量 A 取 A1,且变量 B 取 B2 时的数据;c 表示变量 A 取 A2,且变量 B 取 B1 时的数据;d 表示变量 A 取 A2,且变量 B 取 B2 时的数据. (2)独立性判断方法: n?ad-bc?2 2 选取统计量 χ = ,用它的大小来检验变量之间是否 ?a+b??c+d??a+c??b+d? 独立. 2 ①χ ≤2.706 时,没有充分的证据判定变量 A,B 有关联,可以认为变量 A,B 是没有关 联的; 2 ②χ >2.706 时,有 90%的把握判定变量 A,B 有关联; 2 ③当 χ >3.841 时,有 95%的把握判定变量 A,B 有关联; 2 ④当 χ >6.635 时,有 99%的把握判定变量 A,B 有关联. 相关关系和函数关系有何异同点? 提示:(1)相同点:两者均是指两个变量的关系. (2)不同点:①函数关系是一种确定的关系,而相关关系是一种非确定的关系;②函数关 系是一种因果关系,而相关关系不一定是因果关系,也可能是伴随关系.

1.已知 x,y 的取值如下表,从散点图可以看出 y 与 x 线性相关, 且回归方程为 y=0.95x +a,则 a=( ) x 0 1 3 4 y 2.2 4.3 4.8 6.7

B.2.6 C.2.2 D.0 - - - - 解析:选 B x =2, y =4.5,因为回归方程经过点( x , y ),所以 a=4.5-0.95×2= 2.6. 2.若回归直线方程为 y=2-1.5x,则变量 x 增加一个单位,y ( ) A.平均增加 1.5 个单位 B.平均增加 2 个单位 C.平均减少 1.5 个单位 D.平均减少 2 个单位 解析:选 C 因为回归直线方程为 y=2-1.5x,所以 b=-1.5,则变量 x 增加一个单位, y 平均减少 1.5 个单位. 3.下表提供了某厂节能降耗技术改造后在生产 A 产品过程中记录的产量 x(吨)与相应的 生产能耗 y(吨)的几组对应数据:
-2-

A.3.25

x 3 4 5 6 y 2.5 t 4 4.5 根据上表提供的数据,求出 y 关于 x 的线性回归方程为 y=0.7x+0.35,那么表中 t 的值
为 ( ) D.4.5 11+t? ? 解析:选 A 样本点的中心( x , y ),即?4.5, ?. 4 ? ? 11+t 因为回归直线过该点,所以 =0.7×4.5+0.35, 4 解得 t=3. 4. 某商品销售量 y(件)与销售价格 x(元/件)负相关, 则其回归方程可能是 ( ) A.y=-10x+200 B.y=10x+200 C.y=-10x-200 D.y=10x-200 解析:选 A 由于销售量 y 与销售价格 x 负相关,因此回归方程中的系数 b<0,故排除选 项 B,D;选项 C 中,当 x=0 时,y=-200,与实际问题不符合,故排除选项 C. 5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是 ( ) 2 A.若 χ 的值为 6.635,我们有 99%的把握认为吸烟与患肺病有关系,那么在 100 个吸烟 的人中必有 99 人患有肺病 B.从独立性检验可知,有 99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么 他有 99%的可能患有肺病 C.若从统计量中求出有 95%的把握认为吸烟与患肺病有关系,是指有 5%的可能性使得推 断出现错误 D.以上三种说法都不正确 解析:选 C 根据独立性检验的思想知 C 项正确. A.3 B.3.15 C.3.5

考点一 [例 1]

相关关系的判断

(1)在一组样本数据(x1,y1),(x2,y2),?,(xn,yn)(n≥2,x1,x2,?,xn 1 不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,?,n)都在直线 y= x+1 上,则这 2 组 样 本 数 据 的 样 本 相 关 系 数 为 ( ) 1 C. D.1 2 (2)(2013·湖北高考)四名同学根据各自的样本数据研究变量 x,y 之间的相关关系,并 求得回归直线方程,分别得到以下四个结论: ①y 与 x 负相关且 y=2.347x-6.423; ②y 与 x 负相关且 y=-3.476x+5.648; ③y 与 x 正相关且 y=5.437x+8.493; ④y 与 x 正相关且 y=-4.326x-4.578. 其中一定不正确 的结论的序号是 ( ) ... A.-1 B.0 A.①② B.②③ C.③④ D.①④ [自主解答] (1)所有样本点均在直线上,则样本相关系数最大即为 1. (2)由回归直线方程 y=bx+a,知当 b>0 时,x 与 y 正相关,当 b<0 时,x 与 y 负相关, 所以①④一定错误. [答案] (1)D (2)D

-3-

【方法规律】 判定两个变量正、负相关性的方法 (1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下 角,两个变量负相关. (2)相关系数:r>0 时,正相关;r<0 时,负相关. (3)线性回归直线方程中:b>0 时,正相关;b<0 时,负相关. 1.对变量 x,y 有观测数据(xi,yi)(i=1,2,?,10),得散点图(1);对变量 u,v 有观 测数据(ui,vi)(i=1,2,?,10),得散点图(2).由这两个散点图可以判断( )

A.变量 x 与 y 正相关,u 与 v 正相关 B.变量 x 与 y 正相关,u 与 v 负相关 C.变量 x 与 y 负相关,u 与 v 正相关 D.变量 x 与 y 负相关,u 与 v 负相关 解析:选 C 由正、负相关的定义知,x 与 y 负相关,u 与 v 正相关. 2.变量 X 与 Y 相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5); 变量 U 与 V 相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1 表示变 量 Y 与 X 之间的线性相关系数,r2 表示变量 V 与 U 之间的线性相关系数,则( ) A.r2<r1<0 B.0<r2<r1 C.r2<0<r1 D.r2=r1 解析:选 C 对于变量 Y 与 X 而言,Y 随 X 的增大而增大,故 Y 与 X 正相关,即 r1>0;对 于变量 V 与 U 而言,V 随 U 的增大而减小,故 V 与 U 负相关,即 r2<0,所以有 r2<0<r1.

考点二 [例 2]

线性回归方程及其应用

(2013·重庆高考)从某居民区随机抽取 10 个家庭,获得第 i 个家庭的月收入

xi(单位:千元)与月储蓄 yi(单位:千元)的数据资料,算得
=184,

? xi =80, ? yi =20, ? xi yi
i ?1 i ?1 i ?1

10

10

10

?x
i ?1

10

2

i

=720.

(1)求家庭的月储蓄 y 对月收入 x 的线性回归方程 y=bx+a; (2)判断变量 x 与 y 之间是正相关还是负相关; (3)若该居民区某家庭月收入为 7 千元,预测该家庭的月储蓄.

?x y
i ?1 n i

n

i

? nx y ? nx
2

附:线性回归方程 y=bx+a 中,b= 均值. [自主解答] (1)依题意得:

?x
i ?1

2

i

- - - - ,a= y -b x ,其中 x , y 为样本平

-4-

?x y
i ?1 n i

n

i

? nx y ? nx
2

b=

?x
i ?1

2

i



184-10×8×2 2 =0.3, 720-10×8

- - a= y -b x =2-0.3×8=-0.4, 故所求回归方程为 y=0.3x-0.4. (2)由于变量 y 的值随 x 的值增加而增加(b=0.3>0),故 x 与 y 之间是正相关. (3)将 x=7 代入回归方程可以预测该家庭的月储蓄为 y=0.3×7-0.4=1.7(千元). 【互动探究】 若该家庭月储蓄为 2.3 千元,求该家庭月收入大约为多少千元. 解:依题意有:2.3=0.3x-0.4,得 x=9, 即该家庭月收入大约为 9 千元. 【方法规律】 最小二乘法估计的三个步骤 (1)作出散点图,判断是否线性相关. (2)如果是,则用公式求 a,b,写出回归方程. (3)根据方程进行估计. - - 提醒:回归直线方程恒过点( x , y ). 某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销, 得到如下数据: 单价 x(元) 8 8.2 8.4 8.6 8.8 9 销量 y(件) 90 84 83 80 75 68 - - (1)求回归直线方程 y=bx+a,其中 b=-20,a= y -b x ; (2)预计在今后的销售中, 销量与单价仍然服从(1)中的关系, 且该产品的成本是 4 元/件, 为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本) - 1 解:(1)由于 x = ×(8+8.2+8.4+8.6+8.8+9)=8.5, 6 - 1 y = ×(90+84+83+80+75+68)=80, 6 - - 所以 a= y -b x =80+20×8.5=250,从而回归直线方程为 y=-20x+250. (2)设工厂获得的利润为 L 元,依题意得 2 2 L=x(-20x+250)-4(-20x+250)=-20x +330x-1 000=-20(x-8.25) +361.25. 当且仅当 x=8.25 时,L 取得最大值. 故当单价定为 8.25 元时,工厂可获得最大利润. 高频考点 考点三 独立性检验的基本思想及其应用

1.独立性检验是一种统计案例,是高考命题的一个热点,多以解答题的形式出现,试题 难度不大,多为中档题. 2.高考中对独立性检验的考查主要有以下几个命题角度: (1)已知分类变量数据,判断两类变量的相关性;
-5-

(2)已知某些数据,求分类变量的部分数据; 2 (3)已知 χ ,判断几种命题的正确性. [例 3] (2013·梅州模拟)为调查某地区老年人是否需要志愿者提供帮助, 用简单随机抽 样方法从该地区调查了 500 位老年人,结果如下: 性别是否需要志愿者 男 女 总计 需要 40 30 70 不需要 160 270 430 总计 200 300 500 (1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例; (2)能否有 99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提 供帮助的老年人的比例?说明理由. [自主解答] (1)调查的 500 位老年人中有 70 位需要志愿者提供帮助,因此该地区老年 70 人中,需要志愿者提供帮助的老年人的比例的估计值为 =14%. 500 2 500×?40×270-30×160? 2 (2)χ = ≈9.967. 200×300×70×430 由于 9.967>6.635,所以有 99%的把握认为该地区的老年人是否需要志愿者提供帮助与性 别有关. (3)由(2)的结论知,该地区老年人是否需要志愿者提供帮助与性别有关,并且从样本数 据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先 确定该地区老年人中男、女的比例,再把老年人分成男、女两层,并采用分层抽样方法,比 采用简单随机抽样方法更好. 独立性检验问题的常见类型及解题策略 2 (1)已知分类变量的数据,判断两类变量的相关性.可依据数据及公式计算 χ ,然后作 出判断. (2)已知某些数据,求分类变量的部分数据.可依据已知条件列表即可求出. 2 (3)已知 χ ,判断几种命题的正确性.可由临界值,分别作出判断,然后再得出结论. (2014·聊城模拟)近年来,随着我国经济的飞速发展,在生产车间中,由于保护不当, 对生产工人造成伤害的事件也越来越多.某矿石粉厂当生产一种矿石粉时,在数天内即有部 分工人患职业性皮肤炎(注:检查为阳性则为患皮肤炎),在生产季节开始时,随机抽取 75 名 车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,检查两组工人的皮肤 炎患病人数的结果如下: 阳性例数 阴性例数 总计 新 5 70 75 旧 10 18 28 总计 15 88 103 问这种新防护服对预防工人患职业性皮肤炎是否有效?并说明你的理由. 解:提出假设 H0:新防护服对预防工人患职业性皮肤炎无效. 2 n?ad-bc? 2 2 将表中数据代入 χ = ,得 χ ≈13.826,查表可知: ?a+c??b+d??a+b??c+d? 2 P(χ ≥10.828)≈0.001,而 13.826>10.828,故有 99.9%的把握认为新防护服对预防这种职业 性皮肤炎有效. ——————————[课堂归纳——通法领悟]———————————— ?1 种求法——相关关系的判定和线性回归方程的求法 (1)函数关系一种理想的关系模型,而相关关系是一种更为一般的情况.
-6-

(2)如果两个变量不具有线性相关关系,即使求出回归直线方程也毫无意义,而且用其 进行估计和预测也是不可信的. (3)回归直线方程只适用于我们所研究的样本的总体.样本的取值范围一般不超过回归 直线方程的适用范围,否则就没有实用价值. ?1 个难点——独立性检验思想的理解 独立性检验的思想类似于反证法,即要确定“两个变量 X 和 Y 有关系”这一结论成立 的可信度,首先假设结论不成立,即它们之间没关系,也就是它们是相互独立的,利用概率 2 的 乘 法 公 式 可 推 知 , (ad - bc) 接 近 于 零 , 也 就 是 随 机 变 量 χ = 2 n?ad-bc? 2 2 应该很小, 如果计算出的 χ 不是很小, 通过查表 P(χ ≥k) ?a+b??c+d??a+c??b+d? 的概率很小.又根据小概率事件不可能发生,由此判断假设不成立,从而可以肯定地断言 X 与 Y 之间有关系.

答题模板(九) 概率与统计的综合问题 [典例] (2013·福建高考)(12 分)某工厂有 25 周岁以上(含 25 周岁)工人 300 名,25 周 岁以下工人 200 名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法, 从中抽取了 100 名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25 周岁 以上(含 25 周岁)”和“25 周岁以下”分为两组,再将两组工人的日平均生产件数分成 5 组: [50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到如图所示的频率分布 直方图.

(1)从样本中日平均生产件数不足 60 件的工人中随机抽取 2 人,求至少抽到一名“25 周 岁以下组”工人的概率; (2)规定日平均生产件数不少于 80 件者为“生产能手”,请你根据已知条件完成 2×2 列 联表,并判断是否有 90%的把握认为“生产能手与工人所在的年龄组有关”? 2 P(χ ≥k) 0.100 0.050 0.010 0.001 k 2.706 3.841 6.635 10.828 2 n?n11n22-n12n21? 2 附 : χ = n1+n2+n+1n+2 2 n?ad-bc? ?注:此公式也可以写成K2= ? ? ?a+ b ??c+ d??a+c??b+d?? ? ?

-7-

[快速规范审题] 第(1)问 1.审结论,明解题方向 观 察 所 求 结 论 : 求 至 少 抽 到 一 名 “25 周 岁 以 下 组 ” 工 人 的 概 率 应先求出所有抽取结果,与抽到25周岁以下工人的结果 ― ― → 求它们的比值即可. 2.审条件,挖解题信息 观察条件:25 周岁以上工人 300 名,25 周岁以下工人 200 名,分层抽样抽取 100 人 可据分层抽样的定义 ― ― → 样 本 中 25 周 岁 以 上 工 人 有 60 人 , 25 周 岁 以 下 工 人 有 40 人 由频率分布直方图及抽样比 ― ― → 生产件数不足 60 件的工人中“25 周岁以上组”工人有 3 人, “25 周岁以下组”有 2 人. 3.建联系,找解题突破口 至少抽到一名“25周岁以下组”工人的结果数 概率= 所有可能结果数 设“25 周岁以上组”3 人为 A1,A2,A3;“25 周岁以下组”2 人为 B1,B2.则共有(A1,A2), (A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2), 10 种结果,其中至少抽到一名“25 周岁以下组”有(A1,B1),(A1,B2),(A2,B1),(A2,B2), (A3,B1),(A3,B2),(B1,B2),共 7 种结果.即问题解决. 第(2)问 1.审结论,明解题方向 观察所求结论:判断是否有 90% 的把握认为“生产能手与工人所在的年龄组有关”? 2 即计算χ 的值 2 ― ― → 问题转化为 χ 与 2.706 的大小比较. 2.审条件,挖解题信息 可据频率分布直方图 观察条件:平均生产件数不少于 80 件者为生产能手 ― ― → “25 周岁以上 组”生产能手 15 人,“25 周岁以下组”生产能手 15 人. 3.建联系,找解题突破口 2 n?ad-bc? 2 χ = ,而 a=15,b=45,c=15,d=25,n=100, ?a+b??c+d??a+c??b+d? 查表得出结论.,[准确规范答题] 易将频率弄错,误认为纵轴上的值即为频率 (1)由已知得, 样本中有“25 周岁以上组” 工人 60 名,“25 周岁以下组”工人 40 名. 所以,样本中日平均生产件数不足 60 件的工人中,“25 周岁以上组”工人有 60×0.05 =3(人),记为 A1,A2,A3;“25 周岁以下组”工人有 40×0.05=2(人),记为 B1,B2.?2 分 从中随机抽取 2 名工人,所有的可能结果共有 10 种,它们是:(A1,A2),(A1,A3),(A2, A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).?4 分 其中,至少抽到一名“25 周岁以下组”工人的可能结果共有 7 种,它们是(A1,B1),(A1, 7 B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2).故所求的概率 P= .?6 分 10 (2)由频率分布直方图可知,在抽取的 100 名工人中,“25 周岁以上组”中的生产能手有 60×0.25=15(人),“25 周岁以下组”中的生产能手有 40×0.375=15(人),据此可得 2×2 列联表如下: 生产能手 非生产能手 合计 25 周岁以上组 15 45 60 25 周岁以下组 15 25 40 合计 30 70 100 ?8 分 2 公式应用易出错,其原因是 a,b,c,d 的值易弄错所以得 χ =
-8-

n?ad-bc? ?a+b??c+d??a+c??b+d? 2 100×?15×25-15×45? = 60×40×30×70 25 = ≈1.79.?10 分 14 因为 1.79<2.706, 所以没有 90%的把握认为“生产能手与工人所在的年龄组有关”. [答题模板速成] 解决概率与统计综合问题的一般步骤: 第一步 审清题意 弄清题意,理顺条件和结论找到关键数量的关系 ? 第二步 找数量关系 把图形语言转化为数字,将图表中的数字转化为公式中的字母 ? 第三步 建立解决方案 找准公式,找到数量关系或据图表代入公式计算数值 ? 第四步 作出判断得结论 依据数据,借助数表作出正确判断

2

?12 分

[全盘巩固] 1.(2014·泸州模拟)为研究变量 x 和 y 的线性相关性,甲、乙二人分别做了研究,利用 回归分析的方法得到回归直线 l1 和 l2,两人计算得 x 相同, y 也相同,下列结论正确的是 ( )

A.l1 与 l2 重合 B.l1 与 l2 一定平行 C.l1 与 l2 相交于点( x , y ) D.无法判断 l1 和 l2 是否相交 解析:选 C 因为回归直线经过样本点的中心( x , y ),故两直线都经过点( x , y ), 而 x , y 相同不能得到 a,b 一定相同,故选 C. 2.(2014·抚州模拟)下列说法: ①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②设有一个回归方程 y=3-5x,变量 x 增加 1 个单位时,y 平均增加 5 个单位; - - ③线性回归方程 y=bx+a 必过( x , y ); 2 ④在一个 2×2 列联表中,由计算得 χ 的观测值 k=13.079,则在犯错误的概率不超过 0.001 的前提下认为这两个变量间有关系. 本题可以参考独立性检验临界值表 P(K2 0.5 0.40 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001 ≥k0) k0 0.455 0.708 1.323 2.072 2.706 3.841 5.024 6.635 7.879 10.82
-9-

8 其中错误的个数是 A.0 B.1 C.2 D.3 解析:选 B 只有②错误,应该是 y 平均减少 5 个单位. 3.(2013·福建高考)已知 x 与 y 之间的几组数据如下表: x y 1 0 2 2 3 1 4 3 5 3 6 4 ( )

假设根据上表数据所得线性回归直线方程为 y=bx+a,若某同学根据上表中的前两组数 据 (1,0) 和 (2,2) 求 得 的 直 线 方 程 为 y = b′x + a′ , 则 以 下 结 论 正 确 的 是 ( ) A.b>b′,a>a′ B.b>b′,a<a′ C.b<b′,a>a′ D.b<b′,a<a′ - 21 7 - 13 解析:选 C x = = , y = , 6 2 6 -- ?xiyi-6 x y
i=1
6

代入公式求得 b=
2 i-6 x ?x2 6



i=1

7 13 58-6× × 2 6 5 = = , ?7?2 7 91-6×? ? ?2? 1 - - 13 5 7 a= y -b x = - × =- , 6 7 2 3 而 b′=2,a′=-2,∴b<b′,a>a′. 4.(2014·广州调研)为了解儿子身高与其父亲身高的关系,随机抽取 5 对父子的身高数 据如下: 父亲身高 x(cm) 174 176 176 176 178 儿子身高 y(cm) 175 175 176 177 177 则 y 对 x 的线性回归方程为( ) A.y=x-1 B.y=x+1 1 C.y= x+88 D.y=176 2 - - - - 解析:选 C 由已知得 x =176, y =176,因为点( x , y )必在回归直线上,代入选项验 证可知 C 正确. 5.对某台机器购置后的运行年限 x(x=1,2,3,?)与当年利润 y 的统计分析知 x,y 具备 线性相关关系,回归方程为 y=10.47-1.3x,估计该台机器最为划算的使用年限为( ) A.7 B.8 C.9 D.越长越划算 解析:选 B 当年利润小于或等于零时应该报废该机器,当 y=0 时,令 10.47-1.3x=0, 解得 x≈8,故估计该台机器最为划算的使用年限为 8 年. 6.(2014·绵阳模拟)在 2014 年 1 月 1 日,某市物价部门对本市的 5 家商场的某商品的 一天销售量及其价格进行调查, 5 家商场的售价 x 元和销售量 y 件之间的一组数据如下表所示: 价格 x 9 9.5 10 10.5 11
- 10 -

销售量 y 11 10 8 6 5 由散点图可知,销售量 y 与价格 x 之间有较好的线性相关关系,其线性回归直线方程是: y=-3.2x+a(参考公式:回归方程 y=bx+a,a= y -b x ),则 a=( A.-24 C.40.5 B.35.6 D.40 9+9.5+10+10.5+11 =10,销售量的平均数是 y = 5 )

解析:选 D 价格的平均数是 x =

11+10+8+6+5 =8,由 y=-3.2x+a 知 b=-3.2,所以 a= y -b x =8+3.2×10=40, 5 故选 D. 7.(2014·唐山模拟)考古学家通过始祖鸟化石标本发现:其股骨长度 x(cm)与肱骨长度 y(cm)的线性回归方程为 y=1.197x-3.660,由此估计,当股骨长度为 50 cm 时,肱骨长度的 估计值为________cm. 解析:根据线性回归方程 y=1.197x-3.660,将 x=50 代入得 y=56.19,则肱骨长度的 估计值为 56.19 cm. 答案:56.19 8.经调查某地若干户家庭的年收入 x(万元)和年饮食支出 y(万元)具有线性相关关系, 并得到 y 关于 x 的线性回归直线方程:y=0.245x+0.321,由回归直线方程可知,家庭年收 入每增加 1 万元,年饮食支出平均增加________万元. 解析:x 变为 x+1,y=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入 每增加 1 万元,年饮食支出平均增加 0.245 万元. 答案:0.245 9.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取 50 名学生,得到 如下 2×2 列联表: 理科 文科 总计 男 13 10 23 女 7 20 27 总计 20 30 50 2 2 已知 P(K ≥3.841)≈0.05,P(K ≥5.024)≈0.025. 2 50×?13×20-10×7? 2 根据表中数据, 得到 K = ≈4.844.则认为选修文科与性别有关系 23×27×20×30 出错的可能性约为________. 2 解析:由题意知 K ≈4.844,这表明小概率事件发生.根据独立性检验的基本思想,应该 断定“是否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为 5%. 答案:5% 10.某企业上半年产品产量与单位成本资料如下: 月份 产量(千件) 单位成本(元) 1 2 73 2 3 72 3 4 71 4 3 73 5 4 69 6 5 68 且已知产量 x 与单位成本 y 具有线性相关关系. (1)求出线性回归方程; (2)指出产量每增加 1 000 件时,单位成本平均变动多少? (3)假定产量为 6 000 件时,单位成本为多少元? - - 解:(1)n=6, x =3.5, y =71,

? xi =79, ? xi yi =1 481,
2 i ?1 i ?1

6

6

- 11 -

1 481-6×3.5×71 b= ≈-1.82, 2 79-6×3.5 - - a= y -b x =71+1.82×3.5=77.37, 则线性回归方程为 y=bx+a=-1.82x+77.37. (2)因为单位成本平均变动 b=-1.82<0,且产量 x 的计量单位是千件,所以根据回归系 数 b 的意义有产量每增加一个单位即 1 000 件时,单位成本平均减少 1.82 元. (3)当产量为 6 000 件,即 x=6 时,代入线性回归方程, 得 y=77.37-1.82×6=66.45(元). 即当产量为 6 000 件时,单位成本大约为 66.45 元. 11.(2014·郑州模拟)有甲乙两个班级进行数学考试,按照大于等于 85 分为优秀,85 分 以下为非优秀统计成绩后,得到如下的列联表. 优秀 10 非优秀 30 105 总计

甲班 乙班 总计

2 已知在全部 105 人中随机抽取 1 人为优秀的概率为 . 7 (1)请完成上面的列联表; (2)根据列联表的数据,若按 95%的可靠性要求,能否认为“成绩与班级有关系”; (3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的 10 名学生从 2 到 11 进 行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到 6 或 10 号的概率. 2 n?ad-bc? 2 参考公式:χ = ?a+b??c+d??a+c??b+d? 2 P(χ ≥k0) 0.10 0.05 0.025 0.010 k0 2.706 3.841 5.024 6.635 解:(1) 优秀 非优秀 总计 甲班 10 45 55 乙班 20 30 50 总计 30 75 105 2 105×?10×30-20×45? 2 (2)根据列联表中的数据,得到 K = ≈6.109>3.841, 55×50×30×75 因此有 95%的把握认为“成绩与班级有关系”. (3)设“抽到 6 或 10 号”为事件 A, 先后两次抛掷一枚均匀的骰子, 出现的点数为(x, y). 所有的基本事件有(1,1)、(1,2)、(1,3)、?、(6,6),共 36 个. 事件 A 包含的基本事件有:(1,5)、(2,4)、(3,3)、(4,2)、(5,1)、(4,6)、(5,5)、(6,4), 8 2 共 8 个,∴P(A)= = . 36 9 12.某学生对其亲属 30 人的饮食习惯进行了一次调查,并用茎叶图(如下图所示)表示 30 人的饮食指数.(说明:图中饮食指数低于 70 的人,饮食以蔬菜为主;饮食指数高于 70 的人, 饮食以肉类为主)

- 12 -

(1)根据茎叶图,帮助这位学生说明其亲属 30 人的饮食习惯; (2)根据以上数据完成下列 2×2 的列联表: 主食蔬菜 主食肉类 总计 50 岁以下 50 岁以上 总计 (3)能否有 99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析. 解:(1)在 30 位亲属中,50 岁以上的人饮食多以蔬菜为主,50 岁以下的人饮食多以肉类 为主. (2)完成 2×2 的列联表如下: 主食蔬菜 主食肉类 总计 50 岁以下 4 8 12 50 岁以上 16 2 18 总计 20 10 30

30×?4×2-8×16? 2 (3)因为 K 的观测值 k= =10>6.635, 12×18×20×10 所以有 99%的把握认为其亲属的饮食习惯与年龄有关. [冲击名校] 1.已知回归直线的斜率的估计值是 1.23,样本点的中心为(4,5),则回归直线的方程是 ( ) A.y=1.23x+0.08 B.y=0.08x+1.23 C.y=1.23x+0.04 D.y=0.04x+1.23 解析:选 A 设回归直线的方程为 y=bx+a.由已知回归直线的斜率的估计值是 1.23,即 b=1.23,且回归直线过样本点的中心(4,5),可解得 a=0.08,故回归直线的方程为 y=1.23x +0.08. 2.已知 x,y 之间的一组数据如下表: x 2 3 4 5 6 y 3 4 6 8 9

2

对于表中数据,现给出如下拟合直线: 8 2 3 ①y=x+1;②y=2x-1;③y= x- ;④y= x. 5 5 2 则根据最小二乘法的思想求得拟合程度最好的直线是________(填序号). - - 解析:由题意知 x =4, y =6,

? xi yi =136, ? xi =90,
2 i ?1 i ?1

5

5

- 13 -

8 2 - - ∴b= ,∴a= y -b x =- , 5 5 8 2 ∴y= x- ,∴填③. 5 5 答案:③ [高频滚动] (2014·昆明模拟)根据市场统计,某商品的日销售量 X(单位:kg)的频率分布直方图如图 所示,则由频率分布直方图得到该商品日销售量的中位数的估计值为( )

A.35 B.33.6 C.31.3 D.28.3 解析: 选 B 设中位数为 x,则有 0.02×(25-15)+0.035(x-25)=0.5,解得: x=33.6.

- 14 -


相关文档

【创新方案】2015高考数学一轮复习(知识回扣+热点突破+能力提升)不等关系与不等式 理 北师大版
【创新方案】2015高考数学一轮复习(知识回扣+热点突破+能力提升)直线与圆、圆与圆的位置关系 理 北师大版
【创新方案】2015高考数学一轮复习(知识回扣+热点突破+能力提升)解三角形应用举例 理 北师大版
【创新方案】2015高考数学一轮复习(知识回扣+热点突破+能力提升)直接证明与间接证明 理 北师大版
【创新方案】2015高考数学一轮复习(知识回扣+热点突破+能力提升)指数与指数函数 理 北师大版
【创新方案】2015高考数学一轮复习(知识回扣+热点突破+能力提升)函数及其表示 理 北师大版
【创新方案】2015高考数学一轮复习(知识回扣+热点突破+能力提升)简单线性规划 理 北师大版
【创新方案】2015高考数学一轮复习(知识回扣+热点突破+能力提升)用样本估计总体 理 北师大版
【创新方案】2015高考数学一轮复习(知识回扣+热点突破+能力提升)导数的应用一 理 北师大版
【创新方案】2015高考数学一轮复习(知识回扣+热点突破+能力提升)曲线与方程 理 北师大版
电脑版