高中数学 3.1回归分析的基本思想及其初步应用第2课时教案 新人教版选修2-3

§3.1 回归分析的基本思想及其初步应用(2) 【学情分析】 : 教学对象是高二理科学生,学生已掌握建立线性回归模型的知识,并能用所学知识解决一些简单的实 际问题。在教学中,要结合实例,让学生了解随机误差产生的原因。初步了解可以通过求回归模型的相关 指数或利用残差分析不同的回归模型的拟合精确度。在起点高的班级中通过让学生观察、思考与讨论,进 一步体会回归分析中的数理计算,及运用相关指数与残差分析来刻画模型拟合效果,初步形成运用统计方 法解决实际问题的基本思想,认识统计方法在决策中的作用。 【教学目标】 : ( 1 ) 知 识 与 技 能 : 了解求线形回归方程的两个计算公式的推导过程, 、回归平方和;了解随机误差产 生的原因;了解判断刻画模型拟合效果的方法——相关指数和残差分析;了解非线 性模型通过变换转化为线性回归模型。 ( 2 )过 程 与 方 法 :本节内容先从大学中女大学生的甚高和体重之间的关系入手,求出相应的回归直线 方程,从中也找出存在的不足,从而有进行回归分析的必要性, 进而学习相关指数, 用相关指数来刻画回归的效果。 ( 3 )情 感 态 度 与 价 值 观 :从实际问题中发现自己已有知识的不足之处,激发学生的好奇心和求知欲, 培养学生不满足于已有知识,勇于求知的良好个性品质,引导学生积极进 取。 【教学重点】 : 1. 了解判断刻画模型拟合效果的方法——相关指数和残差分析; 2. 通过探究使学生体会有些非线性模型通过变换可以转化为线性回归模型。 【教学难点】 : 1. 了解随机误差产生的原因,用残差平方和衡量回归方程的预报精度; 2. 了解判断刻画模型拟合效果的方法——相关指数和残差分析。 【教学过程设计】 : 教学环节 一、 创设情 境 教学活动 设计意图 1.由例 1 知,体重的值受身高或随机误差的影响。 引入回归分析 2. 问题一: 身高 172cm 的女大学生的体重一定是 60.316kg 吗?如果不是, 的效果评价的三个 其原因是什么? 统计量 解答问题一: 70 65 60 55 50 45 40 150 155 160 165 170 175 180 二、 探究新 知 结合实例由结 果分析残差图是否 异常,养成从实际 问题出发,抽象为 数学问题中的线性 回归问题,从而指 导实际问题的解 决。 显然, 身高 172cm 的女大学生的体重不一定是 60.316kg, 但一般可以 认为她的体重接近于 60.316kg.上图 3.1-2 中的样本点和回归直线的相互 位置说明了这一点. 由于所有的样本点不共线,而只是散布在某一条直线的附近,所以身 高和体重的关系可用下面的线性回归模型来表示: y=bx+a+e ~ (3) 这里 a 和 b 为模型的未知参数,e 是 y 与 y ? bx ? a 之间的误差。通常 e 为随机变量,称为随机误差,它的均值 E(e)=0,方差 D(e)= ? 线性回归模型的完整表达式为: 2 ? 0 .这样 ? y ? bx ? a ? e ? 2 ? E (e) ? 0, D(e) ? ? (4) 在线性回归模型(4)中,随机误差 e 的方差 ? 越小,通过回归直线 2 y ? bx ? a ~ (5) ^ 预报真实值 y 的精度越高。 随机误差是引起预报值 y 与真实值 y 之间的误 差的原因之一,大小取决于随机误差的方差。 另一方面,由于公式(1)和(2)中 a 和 b 为截距和斜率的估计值, 它们与真实值 a 和 b 之间也存在误差, 这种误差是引起预报值 y 与真实值 y 之间误差的另一个原因。 思考 1、产生随机误差项 e 的原因是什么? 答:实际上,从上例中,一个人的体重值除了受身高的影响外,还受 到许多其它因素的影响。例如饮食习惯、是否喜欢运动、度量误差等。另 外,我们选用的线性模型往往只是一种近似的模型。所有这些因素都会导 致随机误差项 e 的产生。 ~ ^ ^ ^ 学生思考,回答 问题二、在线性回归模型中,e 是用 y 预报真实值 y 的误差,它是一个不 可观测的量,那么应该怎样研究随机误差?如何衡量预报的精度? 解答问题二: 因为随机误差是随机变量, 因此可以通过这个随机变量的数字特征来 刻画它的一些总体特征。均值是反映随机变量取值平均水平的数字特征, 方差是反映随机变量集中于均值程度的数字特征, 而随机误差的均值为 0, 因此可以用方差 ? 来衡量随机误差的大小。 2 为了衡量预报的精度,需要估计 ? 的值。一个自然的想法是通过样 2 本方差来估计总体方差。如何得到随机变量 e 的样本呢?由于模型(3)或 (4)中的 e 隐含在预报变量 y 中,我们无法精确地把它从 y 中分离出来, 因此也就无法得到随机变量 e 的样本。 解决问题的途径是通过样本的估计值来估计 ? 。根据截距和斜率的 2 估计公式(1)和(2) ,可以建立回归方程 y ?bx?a 因此 y 是(5)中 y 的估计量。由于随机误差 e ? y ? y ,所以 e ? y ? y 是 e 的估计量,对于样本点 ^ ~ ~ ^ ^ ^ ^ ^ ( x1 , y1 ), ( x2 , y2 ), … , ( xn , y n ) 而言,相当于它们的随机误差为 ~ ei ? yi ? y i ? yi ? bxi ? a ,i=1,2, …,n, 其估计值为 ^ ^ ^ ^ e ? yi ? y i ? yi ? b xi ? a ,i=1,2, …,n, e i 称为相应于点 ( xi , yi ) 的残差(residual) 。 类比样本方差估计总体方差 的思想,可以用 ^ ^ 1 n ^ 1 ? ? e ? Q ( a , b) i ? n ? 2 i ?1 n?2 ^ 2 2 ^ (n>2) ^ ^ 作为 ? 的估计量,其中 a 和 b 由公式(1) (2)给出, Q ( a , b ) 称为残差 2

相关文档

高中数学 3.1回归分析的基本思想及其初步应用(第2课时)教案 新人教版选修2-3
高中数学3.1回归分析的基本思想及其初步应用第2课时教案新人教版选修2_3
高中数学 3.1回归分析的基本思想及其初步应用(第3课时)教案 新人教版选修2-3
高中数学 3.1回归分析的基本思想及其初步应用第3课时教案 新人教版选修2-3
高中数学3.1回归分析的基本思想及其初步应用第3课时教案新人教版选修2_3
高中数学 3.1回归分析的基本思想及其初步应用(第1课时)教案 新人教版选修2-3
高中数学 3.1回归分析的基本思想及其初步应用第1课时教案 新人教版选修2-3
高中数学 3.1回归分析的基本思想及其初步应用第1课时教案 新人教版选修2-3 (2)
电脑版