2.2.1用样本的频率分布估计总体的分布 课件 (共33张PPT)_图文

2.2.1 用样本的频率分布估计 总体分布

频率分布
样本中所有数据(或数据组)的频数和 样本容量的比,叫做该数据的频率。 所有数据(或数据组)的频数的分布 变化规律叫做样本的频率分布。

频率分布的表示形式有:
①样本频率分布表 ②样本频率分布图 样本频率分布条形图 样本频率分布直方图 ③样本频率分布折线图

1、抛掷硬币的大量重复试验的结果: 频率分布表:
实验结果 正面向上 反面向上 频数 36 124 35 964 频率 0.501 1 0.498 9

频率分布条形图
0.7 0.6

频率

结论:当试验次数 “正面向上”记为0 无限增大时,两种试验 “反面向上”记为1 结果的频率大致相等。

0.5 0.4
0.3 0.2 0.1

0

1

注意: ① 各长方形长条的宽度要相同。 ②相邻长条的间距要适当。 试验结果 ③长方形长条的高度 表示取各值的频率。

例 1. 为检测某种产品的质量,抽取了一个容量为 30的样本, 检测结果为一级品5件,二级品8件,三级品13件,次品4件. (1) 列出样本的频率分布表; (2) 画出表示样本频率分布的条形图; (3)根据上述结果,估计此种产品为二级品或三级品的概率 约是多少.
产品 频数 0.5 5 一级品 0.4 ( 1 )样本的频率分布表为: 8 二级品 (2)样本频率分布 0.3 三级品 13 的条形图为: 0.2 0.1 4 次品
0.6

解: 解:

0.7

频率

频率 0.17 0.27 0.43 0.13 产品

一级品 二级品 三级品 次品

(3)此种产品为二级品或三级品的概率约为 0.27+0.43=0.7.

知识探究(一):频率分布表 【问题】 我国是世界上严重缺水的国
家之一,城市缺水问题较为突出,某市 政府为了节约生活用水,计划在本市试 行居民生活用水定额管理,即确定一个 居民月用水量标准a,用水量不超过a的 部分按平价收费,超出a的部分按议价 收费.通过抽样调查,获得100位居民 2007年的月均用水量如下表(单位: t):

3.1 3.4 3.2 3.3 3.2 3.0 2.5 2.6 2.5 2.8

2.5 2.6 2.7 2.8 2.9 2.9 2.8 2.7 2.6 2.5

2.0 2.2 2.3 2.3 2.4 2.4 2.3 2.4 2.3 2.2

2.0 2.2 2.1 2.2 2.3 2.4 2.3 2.1 2.1 2.0

1.5 1.5 1.6 1.7 1.8 1.9 1.8 1.7 1.6 1.5

1.0 1.2 1.2 1.3 1.4 1.3 1.3 1.4 1.0 1.0

1.6 0.2 3.7 3.6 3.5 1.4 1.3 1.2 1.0 1.2

1.8 0.4 1.5 1.7 1.9 1.8 1.6 1.5 1.7 1.8

1.9 0.3 0.5 0.6 0.8 0.7 0.9 0.5 0.8 0.6

1.6 0.4 3.8 4.1 4.3 2.0 2.3 2.4 2.4 2.2

显然:这个例子与前面抛掷硬币的问题是不同的,这 里的总体可以在一个实数区间取值,称为连续型总体。 样本的频率分布表示形式有: 频率分布表和频率分布直方图

画频率分布直方图的步骤 1.极差:样本数据中的最大值和最小 值的差称为极差 0.2~4.3
2.确定组距,组数:.如果将上述 100个数据按组距为0.5进行分组, 那么这些数据共分为多少组? (4.3-0.2)÷0.5=8.2

3 将数据分组,决定分点:以组距为 0.5进行分组,上述100个数据共分为9组, 各组数据的取值范围可以如何设定? [0,0.5),[0.5,1),[1,1.5), ?,[4,4.5]. 4 画频率分布表:如何统计上述100个数 据在各组中的频数?如何计算样本数据 在各组中的频率?你能将这些数据用表 格反映出来吗?

分 组 [0,0.5) [0.5,1) [1,1.5) [1.5,2) [2,2.5) [2.5,3) [3,3.5) [3.5,4) [4,4.5] 合计

频数 4 正 8 正 正 正 15 正 正 正 正 22 正 正 正 正 正 25 正 正 14 正 一 6 4 2 100

频数累计

频率 0.04 0.08 0.15 0.22 0.25 0.14 0.06 0.04 0.02 1.00

知识探究(二):频率分布直方图

5 画频率分布直方图 为了直观反映样本 数据在各组中的分布情况,我们将上述 频率分布表中的有关信息用下面的图形 表示: 频率
组距

0.5 0.4 0.3 0.2 0.1
O

0.5 1 1.5 2 2.5 3 3.5 4 4.5

月均用水量/t

频率 组距
0.5 0.4 0.3 0.2 0.1
O

宽度:组距
高度:
频率 组距

0.5 1 1.5 2 2.5 3 3.5 4 4.5

月均用水量/t

上图称为频率分布直方图,其中横轴 表示月均用水量,纵轴表示频率/组距. 频率分布直方图中各小长方形的宽度 和高度在数量上有何特点?

图形的意义:频率分布直方图中各小长 方形的面积表示什么?各小长方形的面 积之和为多少? 频率 宽度:组距 组距
0.5 0.4 0.3 0.2 0.1
O

高度:
0.5 1 1.5 2 2.5 3 3.5 4 4.5

频率 组距

月均用水量/t

各小长方形的面积=频率 各小长方形的面积之和=1

思考: 频率分布条形图和频率分布直方图是两个 相同的概念吗? 有什么区别?
频率分布的条形图和频率分布直方图的区别

两者是不同的概念; 横轴:两者表示内容相同 纵轴:两者表示的内容不相同 频率分布条形图的纵轴(长方形的高)表示频率 频率分布直方图的纵轴(长方形的高)表示 频率与组距的比值, 其相应组距上的频率等于该组距上长方形的面积。
频率 ?长方形的面积= ? 组距 ? 频率 组距

3 分析例题:频率分布直方图非常直观 地表明了样本数据的分布情况,使我们 能够看到频率分布表中看不太清楚的数 据模式,但原始数据不能在图中表示出 来.你能根据上述频率分布直方图指出居 民月均用水量的一些数据特点吗? 频率
组距 0.5 0.4 0.3 0.2 0.1
O

0.5 1 1.5 2 2.5 3 3.5 4 4.5

月均用水量/t

频率 组距
0.5 0.4 0.3 0.2 0.1
O

0.5 1 1.5 2 2.5 3 3.5 4 4.5

月均用水量/t

(1)居民月均用水量的分布是“山峰”状的,而 且是“单峰”的;
(2)大部分居民的月均用水量集中在一个中间值 附近,只有少数居民的月均用水量很多或很少; (3)居民月均用水量的分布有一定的对称性等.

频率分布直方图如下:
频率

组距

连接频率分布直方图 中各小长方形上端的 中点,得到频率分布折 线图

0.50 0.40 0.30 0.20 0.10 月均用水量 /t 4.5

0.5

1 1.5 2 2.5 3

3.5 4

利用样本频率分布对总体分布进行相应估计

(1)上例的样本容量为 100,如果增至1000, 其频率分布直方图的情况会有什么变化?假如增

至10000呢?

(2)样本容量越大,这种估计越精确。

总体密度曲线
当样本容量无限增大,分组的组距无限缩小,那么 频率分布折线图就会无限接近一条光滑曲线——总体密 度曲线. 总体密度曲线
频率 组距

月均用 水量/t

a

b

(图中阴影部分的面积,表示总体在 某个区间 (a, b) 内取值的百分比)。

小结

画频率分布直方图的步骤

1、求极差(即一组数据中最大值与最小值的差) 知道这组数据的变动范围4.3-0.2=4.1 2、决定组距与组数(将数据分组) 组距:指每个小组的两个端点的距离,组距 组数:将数据分组,当数据在100个以内时, 按数据多少常分5-12组。 组数= 极差 ? 4.1 ? 8.2 3、 将数据分组(8.2取整,分为9组)

组距

0.5

4、列出频率分布表.(填写频率/组距一栏) 5、画出频率分布直方图。

1、一个容量为20的样本数据.分组后.组距与频 数如下:(0,20] 2;(20,30] 3, (30,40] 4; (40,50] 5; (50,60] 4; (60,70] 2 。则样 本在(-∞,50]上的频率为: 7/10 ,
(2002,江西)

2.为了了解某地区高三学生的身体发育情况,抽 查了该地区100名年龄为17.5岁-18岁的男生体重 (kg) ,得到频率分布直方图如下:
0.07 0.05 0.03 体重(kg) 频率/组距

根据上图可得这100名学生中体重在[56.5,64.5] 的学生人数是( C ) A. 20 B. 30 C. 40 D. 50

54.5 58.5

62.5

66.5

70.5

74.5

3、观察新生婴儿的体重,其频率分布直方图

如图所示,则新生婴儿体重(2700,3000)的频
率为: y 0.3 ;

0.001
2400 2700 3000 3300 3600 3900

X

体重

4.为了了解小学生的体能情况,抽取了某小学同年级部分 学生进行跳绳测试,将所得数据整理后,画出频率分布直 方图如图,已知图中从左到右前三个小组的频率分别是 0.1,0.3,0.4,第一小组的频数为5. (1)求第四小组的频率; (2)问参加这次测试的学生人数是多少? (3)问在这次测试中,学生跳绳次数的中位数落在第几小 组内?

【解】 (1) 第四小组的频率= 1 - (0.1 + 0.3 + 0.4) = 0.2. (2)n =第一小组的频数÷第一小组的频率= 5÷0.1 = 50. (3) 因 为 0.1×50 = 5,0.3×50 = 15,0.4×50 = 20,0.2×50=10. 即第一、第二、第三、第四小组的频数分别为 5,15,20,10. 所以学生跳绳次数的中位数落在第三小组内.
解本题的关键是准确掌握频率、频数、样本容量(数据总数) 之间的关系及中位数的概念.

变式训练 为了了解高一学生的体能情况,某校抽 取部分学生进行一分钟跳绳次数测试,将所得数据整 理后,绘制出频率分布直方图 (如图所示),图中从左到 右各小矩形的面积之比为 2 ∶ 4 ∶ 17 ∶ 15 ∶ 10 ∶ 2 ,第 二小组频数为12. 1)第二小组的频率是多少? 样本容量是多少? (2)若次数在110以上(含110次) 为达标,试估计该校全体高一 学生的达标率是多少?
解:(1)第二小组的频率是 10×0.008=0.08, 样本容量是12÷0.08=150. (2)达标率为(0.034+0.030+0.020 +0.004)×10 =0.088×10=88%.

频率分布表、频率分布直方图和折线图 的主要作用是表示样本数据的分布情况,此 外,我们还可以用茎叶图来表示样本数据的 分布情况.

一般地, 画出一组样本数据的茎叶图的步骤如 何?
第一步,将每个数据分为 “茎”(高位)和 “叶” (低位)两部分; 第二步, 将最小的茎和最大的茎之间的数按大 小次序排成一列,写在左(右)侧;

第三步, 将各个数据的叶按大小次序写在茎右 (左)侧 .

对于样本数据:3.1,2.5,2.0,0.8,1.5,1.0, 4.3,2.7,3.1,3.5,用茎叶图如何表示?





0 8 1 0 5 2 0 5 7 3 1 1 5 4 3

甲运动员得分:13,51,23,8,26,38,16, 33,14,28,39; 乙运动员得分:49,24,12,31,50,31,44, 36,15,37,25,36,39.
甲 乙

0 4 5 1 1 1 6 6 7 9 2 4 9 3 0 4 2 5 1 5 你能理解这个图是如何记录这些数据的吗? 你能通过该图说明哪个运动员的发挥更稳定 吗?

8 6 4 3 8 6 3 9 8 3

用茎叶图表示数据的分布情况是一种好方法, 你认为茎叶图有哪些优点?

当样本数据较少时,用茎叶图表示数据的效果较好
(1)保留了原始数据,没有损失样本信息; (2)数据可以随时记录、添加或修改 .

练习:某中学高一(2)班甲,乙两 名同学自高中以来每场数学考试成 绩情况如下: 甲的得分:95,81,75,91,86, 89,71,65,76,88,94 乙的得分:83,86,93,99,88, 96,98,98,79,85,97 画出两人数学成绩茎叶图,请根据 茎叶图对两人的成绩进行比较。

小结
表示样本分布的方法: (1)频率分布表优点是在数量表示上比较确切,缺点
是不够直观、形象,分析数据分布的总体态势不太方便.

(2)频率分布图(包括直方图和条形图)
优点:易表示大量数据 ,直观地表明分布地 情况 ;
缺点:丢失一些信息。

(3)频率分布折线图优点是它反映了数据的变化趋
势.

(4)茎叶图优点:(1)保留了原始数据,没有损失样
本信息;(2)数据可以随时记录、添加或修改.缺点:只能 处理样本容量较小数据

表示样本的分布的方法: 3.频率分布折线图 1.频率分布表 样本频率分布中, 分组 个数累计 频数 频率 当样本容量无限增 大,组距无限缩小
2.频率分布直方图
频率/组距

4.样本频率分布直方图接 近于一条光滑曲线——总 体密度曲线,反映了总体 分布。 产品尺寸(mm) 5.茎叶图


相关文档

第2章 2.2.1 用样本的频率分布估计总体分布(2) 教师配套用书课件(共33张ppt)
人教版《2.2.1用样本的频率分布估计总体》PPT课件4
人教版《2.2.1用样本的频率分布估计总体》PPT课件5
高中数学人教A版必修三配套课件: 2.2.1 用样本的频率分布估计总体分布(2) 教师配套用书课件(共33张ppt)
2.2.1用样本的频率分布估计总体分布ppt课件
人教版《2.2.1用样本的频率分布估计总体》PPT课件3
2.2.1 用样本的频率分布估计总体分布(共54张PPT)—公开课一等奖课件
人教版高中数学课件2.2.1 用样本的频率分布估计总体分布(共54张PPT)
2.2.1 用样本的频率分布估计总体分布ppt课件
高中数学 必修三 2.2.1《用样本的频率分布估计总体分布(1)》ppt课件
电脑版