高考数学总复习 9-5 变量间的相关关系与统计案例课件 苏教版_图文

第 5节 变量间的相关关系与统计案例 【知识梳理】 1.相关关系的定义 自变量取值一定时,因变量的取值带有一定随机性 的两个变量 之间的关系叫相关关系. 2.散点图 作法:将样本中 n 个数据点(xi,yi)(i=1,2,…,n)描在平面直角 坐标系中,以表示具有 相关关系 的两个变量的一组数据的图形叫做 散点图. 散点图形象地反映了数据的密切程度,更能清楚地看出两变量是否 有相关关系. 3.两个变量的线性相关 (1)正相关 在散点图中,点散布在从左下角 到 右上角的区域.对于两个变 量的这种相关关系,我们将它称为正相关. (2)负相关 在散点图中,点散布在从 左上角到右下角 的区域,两个变量的 这种相关关系称为负相关. (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在 一条直线附近,就称 这两个变量之间具有线性相关关系,这条直线叫做回归直线. 4.回归直线 (1)一般地,设 x 与 y 是具有相关关系的两个变量,且对应于 n 个观测值的 n 个点大致分布在一条直线的附近,若所求的直线方程 为^ y =^ b x+^ a ,则 我们将这个方程叫做回归直线方程,a、b 叫做回归系数,相应 的直线叫做回归直线. (2)最小二乘法 2 2 使总体偏差平方和 Q= (y1-bx1-a) +(y2-bx2-a) +…+(yn- bxn-a)2为最小 的方法,叫做最小二乘法. 5. 回归分析 (1)定义: 对具有 相关关系 的两个变量进行统计分析的一种常用 方法. (2)随机误差:线性回归模型用 y=bx+ a+ e 表示,其中 a 和 b 为模 型的 未知参数 , e称为随机误差. (3)样本点的中心 在具有线性相关关系的数据(x1,y1),(x2,y2),…,(xn,yn)中, 用最小二乘估计模型 y=bx+a+e 中的未知参数 a 和 b,则^ b= ,^ a= . 其中 x = (4)相关系数 ,y= ,( x , y )称为样本点的中心. ①r= ; ②当 r>0 时,表明两个变量正相关; 当 r<0 时,表明两个变量负相关. r 的绝对值越接近于 1,表明两个变量的线性相关性 越强 .r 的 绝对值越接近于 0 时,表明两个变量之间几乎不存在线性相关关 系.通常|r|大于 0.75 时,认为两个变量有很强的线性相关性. 6.2×2 列联表的独立性检验 (1)分类变量:变量的不同“值”表示个体所属的不同类别 这类 变量称为分类变量. (2) 列联表:列出的两个或两个以上的分类变量的 频数 表称为列联 表.由两个分类变量的样本频数列联表称为 2×2列联表. (3)独立性检验 ①独立性检验一般采用 列联表 的形式,每个因素可以分为两个 或两个以上的类别.当列联表是 2×2列联表 的形式时,独立性检验 的公式如下: 2 n ? ad - bc ? K2= ?a+b??a+c??b+d??c+d? (其中 n=a+b+c+d). 2×2 列联表 y1 x1 x2 总计 a c a+c y2 b d b+d 总计 a+b c+ d a+b+c+d ②用 K2 的大小可以决定是否拒绝原来的统计假设 H0,若 K2 值 较大,就拒绝 H0,即拒绝事件 A 与 B 无关. (4)利用以下数据来确定“X 与 Y 有关系”的可信程度. 如果 k>10.828,就有 99.9%的把握认为“X 与 Y 有关系”; 如果 k>7.897,就有 99.5%的把握认为“X 与 Y 有关系”; 如果 k>6.635,就有 99%的把握认为“X 与 Y 有关系”; 如果 k>5.024,就有 97.5%的把握认为“X 与 Y 有关系”; 如果 k>3.841,就有 95%的把握认为“X 与 Y 有关系”; 如果 k>2.706,就有 90%的把握认为“X 与 Y 有关系”; 如果 k≤2.706,就认为没有充分的证据显示“X 与 Y 有关系”. 【基础自测】 1.若 y 与 x 之间的一组数据为: x y 0 1 1 3 2 5 3 5 4 6 则拟合这 5 对数据的回归直线一定经过的点是________. 答案:(2,4) 2.(2013· 淮安第二次调研)已知 x、y 取值如下表: x y 0 1.3 1 1.8 4 5 6 7.4 8 9.3 5.6 6.1 从所得的散点图分析可知,y 与 x 线性相关,且^ y =0.95x+a, 则 a=________. 1 1 解析:依题意得, x = ×(0+1+4+5+6+8)=4, y = ×(1.3 6 6 +1.8+5.6+6.1+7.4+9.3)=5.25.又直线^ y =0.95x+a 必过样本中心 点 (- x ,- y ),即点(4,5.25),于是有 5.25=0.95×4+a,由此解得 a= 1.45. 答案:1.45 3.(2012· 高考课标全国卷)在一组样本数据(x1,y1),(x2,y2),…, (xn,yn)(n≥2,x1,x2,…,xn 不全相等)的散点图中,若所有样本点 1 (xi,yi)(i=1,2,…,n)都在直线 y= x+1 上,则这组样本数据的样 2 本相关系数为________. 解析:所有点均在直线上,则样本相关系数最大即为 1. 答案:1 4.(2011· 高考辽宁卷)调查了某地若干户家庭的年收入 x(单位: 万元)和年饮食支出 y(单位:万元),调查显示年收入 x 与年饮食支出 ^ y 具有线性相关关系, 并由调查数据得到 y 对 x 的回归直线方程: y= 0.254x+0.321.由回归直线方程可知,家庭年收入每年增加 1 万元, 年饮食支出平均增加________万元. 解析:以 x+1 代替 x,得^ y =0.254(x+1)+0.321,与^ y =0.254x +0.321 相减可得,年饮食支出平均增加 0.254 万元. 答案

相关文档

【金版学案】高考数学一轮复习 9.5变量间的相关关系、统计案例课件 理
2016届高考数学文科一轮复习课件:9-5变量间的相关关系、统计案例
【名师一号】高考数学一轮总复习 9.4变量间的相关关系与统计案例课件
高考数学(理科)大一轮复习课件:第9章-第3节变量间的相关关系、统计案例
高考数学(理)(全国)一轮复习课件:9.4变量间的相关关系与统计案例
电脑版