2020版高中数学第二章统计章末复习课件新人教B版必修3_图文

第二章 统 计
章末复习

学习目标
1.会根据不同的特点选择适当的抽样方法获得样本数据. 2.能利用图、表对样本数据进行整理分析,用样本和样本的数字 特征估计总体. 3.能利用散点图对两个变量是否相关进行初步判断,能用回归直 线方程进行预测.

内容索引

知识梳理 题型探究 达标检测

知识梳理

1.抽样方法 (1)用随机数表法抽样时,对个体所编号码位数要相同,当问题所给 位数不同时,以位数较多的为准,在位数较少的数前面添“0”,凑 齐位数. (2)用系统抽样法时,如果总体容量 N 能被样本容量 n 整除,抽样间隔
为 k=Nn;如果总体容量 N 不能被样本容量 n 整除,先用简单随机抽样 剔除多余个体,抽样间隔为 k=Kn(其中 K=N-多余个体数).

(3)三种抽样方法的异同点

类别 共同点

各自特点

相互联系 适用范围

简单随机

抽样

抽样过

从总体中逐个抽取

总体中的个 体数较少

程中每 将总体平均分成几部分,在起始部分抽样

总体中的个

系统抽样 个个体 按事先确定的规则分别 时,采用简单随

体数较多

被抽到 在各部分中抽取

机抽样

的可能

在各层抽样时采 总体由差异

将总体分成几层,按各

分层抽样 性相同

用简单随机抽样 明显的几部

层个体数之比抽取

或系统抽样 分组成

2.用样本估计总体 (1)用样本估计总体 用样本频率分布估计总体频率分布时,通常要对给定的一组数据作频 率分布表 与频率分布直方图 .当样本只有两组数据且样本容量比较小时, 用茎叶图刻画数据比较方便. (2)样本的数字特征 样本的数字特征可分为两大类:一类是反映样本数据集中趋势的,包 括 众数 、中位数 和平均数;另一类是反映样本波动大小的,包括_方__差_ 及 标准差 .

3.变量间的相关关系

(1)两个变量之间的相关关系的研究,通常先作变量的散点图 ,根据散点

图判断这两个变量最接近于哪种确定性关系(函数关系).

(2)求回归直线方程的步骤:

n

n

①先把数据制成表,从表中计算出 x , y ,∑x2i ,∑xiyi;

i=1

i=1

②计算回归系数a^ ,b^ .公式为??????b^ =i∑=ni∑1=nx1iyxi2i--nnxx 2 y ,

?^

^

??a= y -b x .

③写出回归直线方程y^=b^ x+a^ .

题型探究

题型一 用样本的频率分布估计总体
例1 某制造商生产一批直径为40 mm的乒乓球,现随机抽样检查20个, 测得每个球的直径(单位:mm,保留两位小数)如下: 40.03 40.00 39.98 40.00 39.99 40.00 39.98 40.01 39.98 39.99 40.00 39.99 39.95 40.01 40.02 39.98 40.00 39.99 40.00 39.96

(1)完成下面的频率分布表,并画出频率分布直方图;

分组 [39.95,39.97) [39.97,39.99) [39.99,40.01) [40.01,40.03]
合计

频数

频率

解答

(2)假定乒乓球的直径误差不超过0.02 mm为合格品.若这批乒乓球的总数 为10 000,试根据抽样检查结果估计这批产品的合格个数. 解 ∵抽样的20个产品中在[39.98,40.02]范围内的有17个, ∴合格品频率为2107×100%=85%. ∴10 000×85%=8 500. 故根据抽样检查结果,可以估计这批产品的合格个数为8 500.
解答

反思与感悟 总体分布中相应的统计图表主要包括:频率分布表、 频率分布直方图、频率分布折线图等.通过这些统计图表给出的相应 统计信息可以估计总体.

跟踪训练1 为了了解某校高三学生的视力

情况,随机地抽查了该校100名高三学生的

视力情况,得到频率分布直方图如图,由

于不慎将部分数据丢失,但知道后5组频数

和为62,视力在4.6到4.8之间的学生数为a,

最大频率为0.32,则a的值为

√ A.64 B.54

C.48

D.27

解析 [4.7,4.8)之间频率为0.32,[4.6,4.7)之间频率为1-0.62-0.05-0.11

=1-0.78=0.22,

∴a=(0.22+0.32)×100=54.

解析 答案

题型二 用样本的数字特征估计总体的数字特征 例2 某市共有50万户居民,城市调查队按千分之一的比例进行入户调 查,抽样调查的结果如表:

家庭人均

[800, [1 100, [1 400,

[200,500) [500,800)

合计

月收入/元

1 100) 1 400) 1 700]

工作人员数 20

60

200 80

40 400

管理人员数

5

10

50

20

15 100

求:(1)工作人员家庭人均月收入的估计值 x 1 及方差的估计值 s21;
解答

(2)管理人员家庭人均月收入的估计值 x 2 及方差的估计值 s22; 解 x 2=1100×(5×350+10×650+50×950+20×1 250+15×1 550) =1 040, s22=1100×[5×(350-1 040)2+10×(650-1 040)2+50×(950-1 040)2+ 20×(1 250-1 040)2+15×(1 550-1 040)2]=90 900.
解答

(3)总体人均月收入的估计值 x 及总体方差的估计值 s2.

解 x =5100×(25×350+70×650+250×950+100×1 250+55×1 550)

=1 004,

s2



1 500

×[25×(350



1

004)2 + 70×(650 - 1

004)2 + 250×(950 - 1

004)2 +

100×(1 250-1 004)2+55×(1 550-1 004)2]=85 284.

解答

反思与感悟 样本的数字特征分为两大类:一类是反映样本数据集中趋 势的特征数,例如平均数;另一类是反映样本数据波动大小的特征数, 例如方差和标准差.通常我们用样本的平均数和方差(标准差)来近似代替 总体的平均数和方差(标准差),从而实现对总体的估计.

跟踪训练2 对甲、乙的学习成绩进行抽样分析,各抽5门功课,得到 的观测数据如下:
甲 60 80 70 90 70 乙 80 60 70 80 75 问:甲、乙谁的平均成绩好?谁的各门功课发展较平衡?
解答

题型三 用回归直线方程对总体进行估计

例3 某车间为了制定工时定额,需要确定加工零件所花费的时间,为 此做了四次试验,得到的数据如下:

零件的个数x(个) 2 3 4 5

加工的时间y(小时) 2.5 3 4 4.5

n
?xiyi-n x y

i=1
(注:b^ =

, a^ = y -b^ x )

n
?x2i -n x 2

i=1

(1)在给定的坐标系中画出表中数据的散点图; 解 散点图如图.
解答

(2)求出 y 关于 x 的回归直线方程y^=b^ x+a^,并在坐标系中画出回归直线;
4
解 由表中数据得: ?xiyi=52.5,
i=1 4
x =3.5, y =3.5, ?x2i =54,
i=1
∴b^ =0.7,∴a^ =1.05, ∴y^ =0.7x+1.05,回归直线如图所示.
解答

(3)试预测加工10个零件需要多少小时? 解 将x=10代入回归直线方程, 得y^ =0.7×10+1.05=8.05, 故预测加工10个零件约需要8.05小时.
解答

反思与感悟 对两个变量进行研究,通常是先作出两个变量之间的散点 图,根据散点图直观判断两个变量是否具有线性相关关系,如果具有, 就可以应用最小二乘法求回归直线方程.由于样本可以反映总体,所以 可以利用所求的回归直线方程,对这两个变量所确定的总体进行估计, 即根据一个变量的取值,预测另一个变量的取值.

跟踪训练3 理论预测某城市2020到2024年人口总数与年份的关系如下表

所示:

年份202x(年)

012 3

4

人口数y(十万)

5 7 8 11 19

(1)请画出上表数据的散点图;

解 数据的散点图如图:

解答

(2)指出x与y是否线性相关; 解 由散点图可知,样本点基本上分布在一条直线附近,故x与y呈线 性相关.
解答

(3)若 x 与 y 线性相关,请根据上表提供的数据,用最小二乘法求出 y 关于 x 的回归直线方程y^=b^ x+a^ ;

解 由表知 x =15×(0+1+2+3+4)=2, y =15×(5+7+8+11+19)=10.

5
?xiyi-5 x y

i=1
∴b^ =

=3.2,a^ = y -b^ x =3.6,

5
?x2i -5 x 2

i=1

∴回归直线方程为y^ =3.2x+3.6.

解答

(4)据此估计2025年该城市人口总数. (参数数据:0×5+1×7+2×8+3×11+4×19=132,02+12+22+32+ 42=30) 解 当 x=5 时,y^=19.6(十万)=196 万. 故2025年该城市人口总数约为196万.
解答

达标检测

1.10个小球分别编有号码1,2,3,4,其中1号球4个,2号球2个,3号球3

个,4号球1个,则数0.4是指1号球占总体分布的

A.频数 频率
C. 组距

√B.频率
D.以上都不对

12345

答案

2.现有10个数,其平均数是4,且这10个数的平方和是200,那么这组数的

标准差是

A.1

√B.2

C.3

D.4

解析 设这10个数为a1,a2,…,a10,

则有 a21+a22+…+a210=200,且a1+a2+…+a10=40,

所以?a1-4?2+?a2-41?02+…+?a10-4?2

=a21+a22+…+a210-8?1a01+a2+…+a10?+160
=200-8×1040+160=4,∴标准差为 4=2.
12345

解析 答案

3.某班50名学生的一次数学质量测验成绩的频率分布直方图如图所示,则 成绩不低于70分的学生人数是_3_5___.

解析 低于70分的频率为(0.012+0.018)×10=0.3, 所以不低于70分的频率为0.7, 故不低于70分的人数为50×0.7=35.
12345

解析 答案

4.某农田施肥量x(单位:kg)与小麦产量y(单位:kg)之间的回归直线方程
^
是 y=4x+250,则当施肥量为50 kg时,可以预测小麦的产量为_4_5_0_kg.
^
解析 直接将 x=50 代入回归直线方程中,可得y=4×50+250=450.

12345

解析 答案

5.从某学校的800名男生中随机抽取50名测量身高,被测学生身高全部介于155 cm和195 cm之间,将测量结果按如下方式分成八组;第一组[155,160),第 二组[160,165),…,第八组[190,195].如图是按上述分组方法得到的频率分 布直方图的一部分,已知第一组与第八组的人数相同,第六组的人数为4. (1)求第七组的频率; 解 第六组的频率为540=0.08, 所 以 第 七 组 的 频 率 为 1 - 0.08 - 5×(0.008×2 + 0.016 + 0.04×2 + 0.06)=0.06.

12345

解答

(2)估计该校的800名男生的身高的中位数以及身高在180 cm以上(含 180 cm)的人数.

12345

解答

规律与方法
1.用频率分布直方图解决相关问题时,应正确理解图中各个量的意义,识 图掌握信息是解决该类问题的关键.频率分布直方图有以下几个特点: ?1?纵轴表示频率/组距;?2?频率分布直方图中各小长方形高的比就是相应 各组的频率之比;?3?直方图中各小长方形的面积是相应各组的频率,所 有的小长方形的面积之和等于1,即频率之和为1. 2.平均数、中位数、众数与方差、标准差都是重要的数字特征,利用它们 可对总体进行一种简明的描述,它们所反映的情况有着重要的实际意义, 平均数、中位数、众数可描述总体的集中趋势,方差和标准差可描述波动 大小.


相关文档

2019-2020高中数学第二章统计模块复习课课件新人教B版必修3
2020版高中数学第二章统计章末复习学案(含解析)新人教B版必修3
2020版高中数学第二章统计章末复习课课件新人教B版必修3
高中数学第二章统计章末复习课件新人教B版必修3
2018版高中数学第二章统计章末复习提升课件新人教A版必修3
2020版高中数学第二章统计章末复习课课件新人教B版
18版高中数学第二章统计章末复习课件新人教B版必修3
2020版高中数学第一章算法初步章末复习课件新人教B版必修3
【新】高中数学第二章统计章末复习提升课课件新人教A版必修3
2020版高中数学第二章统计章末复习课件新人教B版
电脑版