kl800.com省心范文网

高中全程复习方略配套课件:10.3相关性、最小二乘估计、回归分析与 独立性检验


第三节

相关性、最小二乘估计、回归分析与
独立性检验

点击进入相应模块

三年9考

高考指数:★★★

1.会作两个有关联变量的数据的散点图,并利用散点图认识变
量间的相关关系.

2.了解最小二乘法的思想,能根据给出的线性回归方程系

数公
式建立线性回归方程(不记公式). 3.了解独立性检验的基本思想、方法及其初步应用. 4.了解回归分析的基本思想、方法及其简单应用.

1.线性回归方程的建立及应用和独立性检验的应用是考查重点; 2.题型以选择题和填空题为主,主要是求线性回归方程的系数 或利用线性回归方程进行预测,在给出临界值的情况下判断两 个变量是否有关.

1.相关性 变量 (1)散点图:在考虑两个量的关系时,为了对_____之间的关系 变量所对应 有一个大致的了解,人们通常将______________的点描出来, 这些点就组成了变量之间的一个图,通常称这种图为变量之间 的散点图. 存在着某 (2)曲线拟合:从散点图上可以看出,如果变量之间_________ 种关系 集中 ________,这些点会有一个_____的大致趋势,这种趋势通常可

光滑的曲线 以用一条___________来近似,这种近似的过程称为曲线拟合.

(3)线性相关:若在两个变量x和y的散点图中,所有点看上去

一条直线 都在__________附近波动,则称变量间是线性相关的.此时,
一条直线 我们可以用___________来近似. 某条曲线 (4)非线性相关:若散点图上所有点看上去都在__________ (不是一条直线) _______________附近波动,则称此相关为非线性相关.此时, 一条曲线 可以用___________来拟合. 没有显示任何关系 (5)不相关:如果所有的点在散点图中_________________,则 称变量间是不相关的.

【即时应用】

(1)思考:相关关系与函数关系有什么异同点?
提示:相同点:两者均是指两个变量的关系. 不同点:①函数关系是一种确定的关系,相关关系是一种非确 定的关系.②函数关系是一种因果关系,而相关关系不一定是 因果关系,也可能是伴随关系.

(2)判断下列各关系是否是相关关系.(请在括号内填“是”或 “否”) ①路程与时间、速度的关系; ②加速度与力的关系; ( ( ) )

③产品成本与产量的关系;
④圆周长与圆面积的关系;

(
(

)
)

⑤广告费支出与销售额的关系.

(

)

【解析】①②④是确定的函数关系,成本与产量,广告费支出
与销售额是相关关系.

答案:①否

②否

③是

④否

⑤是

2.回归直线方程与相关系数 (1)最小二乘法

如果有n个点(x1,y1),(x2,y2),?,(xn,yn),可以用下面的表达
式来刻画这些点与直线y=a+bx的接近程度: [y1-(a+bx1)]2+[y2-(a+bx2)]2+?+[yn-(a+bxn)]2. _____________________________________________________ 最小值 使得上式达到_________的直线y=a+bx就是我们所要求的直线, 这种方法称为最小二乘法.

(2)线性回归方程 假设样本点为(x1,y1),(x2,y2),?,(xn,yn),则
b= x1y1 +x 2 y2 +…+x n y n -nxy x +x 2 +…+x n -nx
2 1 2 2 2

,a=y-bx.

直线方程y=a+bx称为线性回归方程,a、b是线性回归方程的 系数 ________.

(3)相关系数r



r=

lxy lxx lyy
n

? (x -x)(y -y)
i i

n

=

i=1

? (x i -x)
i=1 i i

n

2

(yi -y) 2 ?
i=1

n

? x y -n x y
=
i=1

?x
i=1

n

2 i

-nx

2

?y
i=1

n

.
2 i

-ny

2

正相关 ②当r>0时,称两个变量___________. 负相关 当r<0时,称两个变量___________. 线性不相关 当r=0时,称两个变量_____________. r的绝对值越接近于1,表明两个变量之间的线性相关程度越

高;r的绝对值越接近于0,表明两个变量之间的线性相关程度
越低.

【即时应用】 (1)由一组样本数据(x1,y1),(x2,y2),?,(xn,yn)得到回 归直线方程y=a+bx,判断下面说法是否正确.(请在括号内打 “√”或“×”)

①任何一组观测值都能得到具有代表意义的回归直线方程;
( )

②直线y=a+bx至少经过点(x1,y1),(x2,y2),?,(xn,yn)
中的一个点; ( )

③直线y=a+bx的斜率 b=

? x y -nxy
i i i=1 n

n

? x 2i -nx
i=1



(

)

2

④直线y=a+bx和各点(x1,y1),(x2,y2),?,(xn,yn)的偏 差
[ ? y -(bx +a)]
2 i i i=1 n

是该坐标平面上所有直线与这些点的偏差

中最小的.

(

)

(2)已知回归方程y=4.4x+838.19,则可估计x与y的增长速度

之比约为_________.

【解析】(1)任何一组观测值都能利用公式得到直线方程,但 这个方程可能无意义,①不正确;回归直线方程y=bx+a经过
y) 样本点的中心 (x, ,可能不经过(x1,y1),(x2,y2),?,

(xn,yn)中的任何一点,这些点分布在这条直线附近,②不正

确;③正确;④正确.
(2)x与y的增长速度之比即约为回归方程的斜率的倒数
1 10 5 ? ? . 4.4 44 22

答案:(1)①×

②×

③√

④√

5 (2) 22

3.独立性检验 (1)2×2列联表 设A,B为两个变量,每一个变量都可以取两个值,变量A:A1, A2= A1 ;变量B:B1,B2= B, 通过观察得到如表所示的数据: 1

B
A A1 A2 总计

B1
a

B2
b d b+d

总计
a+b c+d n=a+b+c+d

c a+c

(2)独立性判断方法
n(ad-bc) 2 ? = (a+b)(c+d)(a+c)(b+d) 选取统计量________________________,用它的大小来检验
2

变量之间是否独立. ≤2.706 ①当χ 2__________时,没有充分的证据判定变量A,B有关联, 可以认为变量A,B是没有关联的; >2.706 ②当χ 2__________时,有90%的把握判定变量A,B有关联; >3.841 ③当χ 2__________时,有95%的把握判定变量A,B有关联; >6.635 ④当χ 2__________时,有99%的把握判定变量A,B有关联.

【即时应用】 (1)下面是一个2×2列联表 y1 y2 总计

x1
x2

a
2

21
25

73
27

总计 b 46 则表中a、b处的值分别为_____________.

(2)在一项打鼾与患心脏病的调查中,共调查了1 671人,经过 计算χ 2的观测值为27.63,根据这一数据分析,我们有理由认

为打鼾与患心脏病是___________的(填“有关”或“无关”).
【解析】(1)∵a+21=73,∴a=52.

又∵a+2=b,∴b=54.
(2)∵27.63>6.635, ∴有99%的把握认为“打鼾与患心脏病有关”. 答案:(1)52、54 (2)有关

相关关系的判断 【方法点睛】利用散点图判断相关关系的技巧 利用散点图判断两个变量是否有相关关系是比较简便的方法:

(1)在散点图中如果所有的样本点都落在某一函数的曲线上,就
用该函数来描述变量之间的关系,即变量之间具有函数关系;

(2)如果所有的样本点都落在某一函数的曲线附近,变量之间 就有相关关系; (3)如果所有的样本点都落在某一直线附近,变量之间就有线 性相关关系.

【例1】关于人体的脂肪含量(百分比)和年龄关系的研究中, 得到如下一组数据: 年龄 脂肪 含量 23 27 39 21.2 41 45 49 50 51

9.5 17.8

25.9 27.5

26.3 28.2 29.6

判断它们是否有相关关系.

【解题指南】判断有无相关关系,一种常用的简便方法就是绘 制散点图.

【规范解答】本题涉及两个变量:年龄与脂肪含量,可以以年
龄为自变量,考查脂肪含量的变化趋势,分析相关关系通常借

助散点图.

以年龄作为x轴,脂肪含量作为y轴,可得相应的散点图如图所 示.

由散点图可知,两者之间具有相关关系.

【反思·感悟】粗略判断相关性,可以观察一个变量随另一个 变量变化而变化的情况.画出散点图能够更直观的判断是否相 关,相关时是正相关还是负相关.

线性回归方程及其应用 【方法点睛】求样本数据的线性回归方程的步骤 第一步,计算平均数 x,y; 第二步,求和

? x y ,? x
i i i=1
n

n

n

2 i

;
n

i=1

第三步,计算 b=
a=y-bx;

? (x -x)(y -y) ? x y -nxy
i i i i i=1

? (x -x)
i i=1

n

=
2

i=1 n

?x
i=1

,
2 i

-nx

2

第四步,写出回归方程y=bx+a.

【提醒】对于任意一组样本数据,利用上述公式都可以求得
“回归方程”,如果这组数据不具有线性相关关系,即不存在 回归直线,那么所得的“回归方程”是没有实际意义的.因此, 对一组样本数据,应先作散点图,在具有线性相关关系的前提 下再求回归方程.

【例2】(1)(2011·广东高考)某数学老师身高176 cm,他爷爷、 父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的 身高与父亲的身高有关,该老师用线性回归分析的方法预测他 孙子的身高为__________cm. (2)测得某国10对父子身高(单位:英寸)如下:
父亲身 高(x) 60 62 64 65 66 67 68 70 72 74

儿子身 63.6 高(y)

65.2

66 65.5

66.9 67.1 67.4

68.3 70.1 70

①画出散点图,说明变量y与x的相关性; ②如果y与x之间具有线性相关关系,求线性回归方程. (已知: x=66.8,y=67.01,x 2 =4 462.24,y 2 ≈4 490.34,

?x
i=1

10

2 i

=44 794,

?y
i=1

10

2 i

=44 941.93,

?x y
i i=1

10

i

=44 842.4)

【解题指南】(1)求出回归方程,代入相关数据求得; (2)①根据散点图判断相关性. ②根据已知数据和提示的公式数据求解,写出线性回归方程. 【规范解答】(1)由题设知:设相对的父亲的身高为x,相对的 儿子的身高为y,它们对应的取值如表所示 x y 173 170 170 176
0 +(-3) +3

176 182

0 ? (-6)+(-3) ? 0+3 ? 6 于是有 x=173, y=176,b= =1, 2 2 2

a=176-173×1=3,得回归方程为y=x+3,所以当x=182时,y=185. 答案:185

(2)①散点图如图所示:

观察散点图中点的分布可以看出:这些点在一条直线的附近分 布,所以变量y与x之间具有线性相关关系.

②设回归方程为y=bx+a.
由 b=

? x y -10x
i i i=1 10

10

y =
2

?x
i=1

2 i

-10x

44 842.4-44 762.68 79.72 = ? 0.464 6. 44 794-44 622.4 171.6

a=y-bx =67.01-0.464 6×66.8≈35.974 7.

得所求的线性回归方程为y=0.464 6x+35.974 7.

【反思·感悟】求线性回归方程,主要是利用公式,求出回归

系数b,a,求解过程中注意计算的准确性和简便性.利用回归
方程预报,就是求函数值.

独立性检验的基本思想及其应用 【方法点睛】利用统计量χ 2进行独立性检验的步骤 (1)根据数据列出2×2列联表; (2)根据公式计算χ 2的值;

(3)比较χ 2与临界值的大小关系,作出统计推断.

【例3】某企业为了更好地了解设备改造前后与生产合格品的 关系,随机抽取了180件产品进行分析,其中设备改造前的合 格品有36件,不合格品有49件,设备改造后生产的合格品有65 件,不合格品有30件.根据所给数据:

(1)写出2×2列联表;
(2)判断产品是否合格与设备改造是否有关.

【解题指南】列表后利用χ2的值进行检验.

【规范解答】(1)由已知数据得 合格品 设备改造后 设备改造前 合计
2

不合格品 30 49 79

合计 95 85 180

65 36 101

180 ? (65 ? 49 ? 36 ? 30) 2 (2)∵ ? = ≈12.38. 101? 79 ? 85 ? 95

由于12.38>6.635,所以有99%以上的把握认为产品是否合格与 设备改造有关.

【反思·感悟】准确计算χ2的值是关键.能有多大的把握认为 两个变量有关,应熟悉常用的几个临界值.

【满分指导】线性回归方程解答题的规范解答 【典例】(12分)(2011·安徽高考)某地最近十年粮食需求量逐

年上升,下表是部分统计数据:
年份 需求量(万吨) 2002 236 2004 246 2006 257 2008 276 2010 286

(1)利用所给数据求年需求量与年份之间的回归直线方程 y=bx+a; (2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.

【解题指南】将数据进行处理,把数据同时减去一个数代入公 式计算;利用公式求回归直线方程,并进行预测. 【规范解答】(1)由所给数据看出,年需求量与年份之间是近 似直线上升,下面来求回归直线方程,先将数据预处理如下: 年份-2006 需求量-257 -4 -21 -2 -11 0 0 2 19 4 29

?????????????????????????2分

对预处理的数据,容易算得

??????????????????4分 x=0, y=3.2,
b= (-4) ? (-21)+(-2) ? (-11)+2 ?19+4 ? 29 (-4)2 +(-2)2 +22 +42 260 = =6.5, ??????????????????6分 40

a=y-bx=3.2. 由上述计算结果,知所求回归直线方程为

y-257=b(x-2 006)+a=6.5(x-2 006)+3.2.?????8分
即y=6.5(x-2 006)+260.2.???????????10分

(2)利用所求得的直线方程,可预测2012年的粮食需求量为 6.5×(2 012-2 006)+260.2=6.5×6+260.2=299.2(万吨). ????????????????12分

【阅卷人点拨】通过高考中的阅卷数据分析与总结,我们可以

得到以下失分警示和备考建议:
失 分 警 在解答本题时有两点容易造成失分: (1)不知道回归直线必过中心点,求不出回归直线方 程;



(2)应用回归直线进行预测时对回归系数理解错误.

解决回归分析问题时,还有以下几点容易造成失分,

在备考时要高度关注:
备 考 建 议 (1)没有对变量间的相关性判断,求出的回归方程无 意义;

(2)公式中的系数计算失误;
另外要注意联系实际,结合生活中的经验解决相关 问题.

1.(2011·江西高考)为了解儿子身高与其父亲身高的关系,随
机抽取5对父子身高数据如下 父亲身高x(cm) 儿子身高y(cm) 174 175 ) (B)y=x+1
1 x 2

176 175

176 176

176 177

178 177

则y对x的线性回归方程为( (A)y=x-1 (C)y=88+

(D)y=176

【解析】选C.由表中数据知回归直线是上升的,首先排除D.
y) x ? 176, ? 176, 由线性回归性质知:点 (x, =(176,176) y

一定在回归直线上,代入各选项检验,只有C符合,故选C.

2.(2011·陕西高考)设(x1,y1),(x2,y2), ?,(xn,yn)是变量x和y的n个样本点, 直线l是由这些样本点通过最小二乘法 得到的线性回归直线(如图),以下结 论正确的是( )

(A)直线l过点 (x, y) (B)x和y的相关系数为直线l的斜率

(C)x和y的相关系数在0到1之间
(D)当n为偶数时,分布在l两侧的样本点的个数一定相同

【解析】选A. 选项 A 具体分析 结论 正确

回归直线l一定过样本点的中心 (x, ;由回归直 y)
线方程的计算公式 a=y-bx 可知直线l必过点 (x, y) 相关系数用来衡量两个变量之间的相关程度,直

B

线的斜率表示直线的倾斜程度;它们的计算公式 也不相同

不正确

选项

具体分析 相关系数的值有正有负,还可以是0;当相关系

结论

C

数在0到1之间时,两个变量为正相关,在-1到0 之间时,两个变量负相关

不正确

D

l两侧的样本点的个数分布与n的奇偶性无关,
也不一定是平均分布

不正确

3.(2011·辽宁高考)调查了某地若干户家庭的年收入x(单位:
万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮 食支出y具有线性相关关系,并由调查数据得到y对x的回归直 线方程:y=0.254x+0.321.由回归直线方程可知,家庭年收入 每增加1万元,年饮食支出平均增加___________万元. 【解析】由于y=0.254x+0.321,当x增加1万元时,年饮食支出y 增加0.254万元.

答案:0.254


【高三总复习】10-3 相关关系、回归分析与独立性检验(人教B版) 含解析

回归分析与独立性检验(人教B版) 含解析_数学_高中...与 l2 : y = 2 x + 2 ,利用最小二乘法判断...相关的,若该生的 物理成绩达到 115 分,请你估计...

2013高考第一轮复习课件和测试(10.3相关关系、回归分析)

2013 年高考数学总复习 10-3 相关关系、回归分析与独立性检验但因为测试 新人教...y= x+1 与 l2:y= x+ ,利 3 2 2 用最小二乘法判断拟合程度更好的...

2014版高中数学复习方略课时提升作业:9.4相关性、最小二乘估计、回归分析与独立性检验(北师大版 理 通用)]

2014版高中数学复习方略课时提升作业:9.4相关性最小二乘估计回归分析与独立性检验(北师大版 理 通用)]_高中教育_教育专区。2014版高中数学复习方略课时提升作...

高考数学总复习 10-3 相关关系、回归分析与独立性检验

高考数学总复习 10-3 相关关系、回归分析与独立性检验_高三数学_数学_高中教育...y= x+1 与 l2:y= x+ ,利 3 2 2 用最小二乘法判断拟合程度更好的...

【2016届走向高考】高三数学一轮(人教A版)基础巩固:第10章 第3节 相关关系、回归分析与独立性检验

基础巩固:第10章 第3节 相关关系、回归分析与独立性检验_数学_高中教育_教育...,n),用最小二乘法建立的回归方程为y=0.85x-85.71,则下列 结论中不正确 ...

数学教师用书配套习题:课时提升作业(六十一) 9.4相关性、最小二乘估计、回归分析与独立性检验

数学教师用书配套习题:课时提升作业(六十一) 9.4相关性最小二乘估计回归分析与独立性检验_数学_高中教育_教育专区。课时提升作业(六十一) 相关性、最小二...

回归分析与独立性检验

回归分析与独立性检验_数学_高中教育_教育专区。回归...线性相关,从而可利用我们学 过的最小二乘估计思想...相关指数 = 10.某农场对单位面积化肥用量 下: 15...

第十章第3讲变量间的相关关系、统计案例

第十章第3讲变量间的相关关系、统计案例_数学_高中...称为非线性回归分析. 4.独立性检验 假设有两个...最小二乘估计个步骤 (1)作出散点图,判断是否...

回归分析与独立性检验

回归分析与独立性检验_数学_高中教育_教育专区。龙源...难点:回归分析中残差变量的解释与分析,相关系数、...附:回归直线的斜率和截距的最小二乘估计公式分别为...