kl800.com省心范文网

【步步高】届高三数学大一轮复习 统计案例学案 理 新人教A版


学案 59

统计案例

导学目标: 1.了解回归分析的基本思想、方法及其简单应用.2.了解独立性检验(只要 求 2×2 列联表)的基本思想、方法及其简单应用.

自主梳理 1.回归分析 (1)回归直线 一组具有线性相关关系的数据(x1,y1),(x2,y2),?,(xn,yn),其回归方程的截距和 斜率的最小二乘估计分别为
^ ^

a =__________________________,b =______________________________________, 其中 x =____________________, y =_____________________________________, ________________称为样本点的中心. (2)相关系数 r
n

①r=

∑ ? i= 1
n i=1

xi- x ? xi- x ?
2

?
n i=1

yi- y ? ; yi- y ?
2

∑ ?

∑ ?

②当 r>0 时,表明两个变量________; 当 r<0 时,表明两个变量________. r 的绝对值越接近于 1,表明两个变量的线性__________;r 的绝对值越接近于 0 时, 表明两个变量之间________________________________. 通常, 当 r 的绝对值大于________ 时认为两个变量有很强的线性相关关系. 2.独立性检验 (1)列联表:列出的两个分类变量的________,称为列联表. (2)2×2 列联表:假设有两个分类变量 X 和 Y,它们的取值分别为{x1,x2}和{y1,y2}, 其样本频数列联表(称为 2×2 列联表)为 2×2 列联表 y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 2 构造一个随机变量 K =________________________________, 其中 n=__________为样 本容量. (3)独立性检验 利用随机变量________来判断“两个分类变量________”的方法称为独立性检验. 自我检测
^ ^ ^ ^

(

1 .对有线性相关关系的两个变量建立的回归直线方程 y = a + b x 中,回归系数b ) A.可以小于 0 B.小于 0 C.能等于 0 D.只能等于 0 2.(2011·天津模拟)下面是 2×2 列联表: y1 a 22 y2 21 25 合计 73 47
1

x1 x2

合计

b

46

120

则表中 a,b 的值分别为( ) A.94,72 B.52,50 C.52,74 D.74,52 3.如果有 95%的把握说事件 A 和 B 有关系,那么具体计算出的数据( ) 2 2 A.K >3.841 B.K <3.841 C.K2>6.635 D.K2<6.635 4.(2011·绍兴月考)某高校“统计初步”课程的教师随机调查了选该课的一些学生情 况,具体数据如下表: 专业 非统计专业 统计专业 性别 男 26 20 女 14 40 则可判断约有________的把握认为“主修统计专业与性别之间有关系”.

探究点一 独立性检验 2 例 1 (2011·湛江模拟)利用统计变量 K 的观测值来判断两个分类变量之间的关系的 可信程度. 考察小麦种子经灭菌与否跟发生黑穗病的关系,经试验观察,得到数据如下表所示 种子灭菌 种子未灭菌 合计 黑穗病 26 184 210 无黑穗病 50 200 250 合计 76 384 460 试按照原试验目的作统计分析推断.

变式迁移 1 对 196 个接受心脏搭桥手术的病人和 196 个接受血管清障手术的病人进行 了 3 年的跟踪研究,调查他们是否又发作过心脏病,调查结果如下表所示: 又发作过心脏病 未发作心脏病 合计 心脏搭桥手术 39 157 196 血管清障手术 29 167 196 合计 68 324 392 试根据上述数据比较这两种手术对病人又发作心脏病的影响有没有差别.

2

探究点二 线性回归分析 例 2 一个车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了 10 次试验,测得的数据如下: 零件数 x (个) 10 20 30 40 50 60 70 80 90 100 加工时间 y(分) 62 68 75 81 89 95 102 108 115 122 (1)y 与 x 是否具有线性相关关系? (2)如果 y 与 x 具有线性相关关系,求回归直线方程; (3)根据求出的回归直线方程,预测加工 200 个零件所用的时间为多少?

变式迁移 2 一台机器使用时间较长,但还可以使用.它按不同的转速生产出来的某机 械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器运转的速度而变化,下表为 抽样试验结果: 转速 x(转/秒) 16 14 12 8 每小时生产有缺点的 11 9 8 5 零件数 y(件) (1)对变量 y 与 x 进行相关性检验; (2)如果 y 与 x 有线性相关关系,求回归直线方程.

探究点三 综合应用 例 3 (2010·辽宁)为了比较注射 A,B 两种药物后产生的皮肤疱疹的面积,选 200 只 家兔做试验,将这 200 只家兔随机地分成两组,每组 100 只,其中一组注射药物 A,另一组 2 注射药物 B.表 1 和表 2 分别是注射药物 A 和药物 B 后的试验结果.(疱疹面积单位:mm ) 表 1:注射药物 A 后皮肤疱疹面积的频数分布表 疱疹面积 [60,65) [65,70) [70,75) [75,80) 频数 30 40 20 10 表 2:注射药物 B 后皮肤疱疹面积的频数分布表 疱疹面积 [60,65) [65,70) [70,75) [75,80) [80,85) 频数 10 25 20 30 15 完成下面 2×2 列联表,并回答能否有 99.9%的把握认为“注射药物 A 后的疱疹面积与 注射药物 B 后的疱疹面积有差异”.
3

表 3: 疱疹面积 2 小于 70 mm a= c= 疱疹面积 2 不小于 70 mm b= d= . 合计

注射药物 A 注射药物 B 合计 2 n? ad-bc? 2 附:K = ? a+b? ? c+d? ? a+c? ?

n= b+d?

变式迁移 3 某市对该市一重点中学 2010 年高考上线情况进行统计,随机抽查 244 名 学生,得到如下表格: 语文 数学 英语 综合科目 上线 不上线 上线 不上线 上线 不上线 上线 不上线 总分上线 201 人 174 27 178 23 176 25 175 26 总分不上线 43 人 30 13 23 20 24 19 26 17 总计 204 40 201 43 200 44 201 43 试求各科上线与总分上线之间的关系,并求出哪一科目与总分上线关系最大?

1.回归方程只适用于我们所研究的样本的总体,而且一般都有时间性.样本的取值范 围一般不能超过回归方程的适用范围,否则没有实用价值. 2.利用图形来判断两个变量之间是否有关系,可以画出二维条形图,但从图形上只可 以粗略地估计两个分类变量的关系, 还要结合所求的数值来进行比较. 作图应注意单位 统一、图形准确,但它不能给出我们两个分类变量有关或无关的精确的可信程度,若要 作出精确的判断,可以作独立性检验的有关计算.

(满分:75 分) 一、选择题(每小题 5 分,共 25 分) 1.对于独立性检验,下列说法中错误的是( ) A.K2 的值越大,说明两事件相关程度越大 B.K2 的值越小,说明两事件相关程度越小 C.K2≤3.841 时,有 95%的把握说事件 A 与 B 无关 D.K2>6.635 时,有 99%的把握说事件 A 与 B 有关 2.下列说法中正确的有:①若 r>0,则 x 增大时,y 也相应增大;②若 r<0,则 x 增大 时,y 也相应增大;③若 r=1 或 r=-1,则 x 与 y 的关系完全对应(有函数关系),在散点 图上各个点均在一条直线上( )
4

A.①②

B.②③

C.①③

D.①②③

3.(2011·天津汉沽一中月考)甲、乙、丙、丁四位同学各自对 A、B 两变量的线性相关 性作试验,并用回归分析方法分别求得相关系数 r 与残差平方和 m 如下表: 甲 乙 丙 丁 r 0.82 0.78 0.69 0.85 m 115 106 124 103 则哪位同学的试验结果体现 A、B 两变量更强的线性相关性?( ) A.甲 B.乙 C.丙 D.丁 4.下列命题中正确的个数为( ) ①线性相关系数 r 越大,两个变量的线性相关性越强;反之,线性相关性越弱; ②残差平方和越小的模型,模型拟合的效果越好; 2 2 ③用相关指数 R 来刻画回归效果,R 越小,说明模型的拟合效果越好. A.1 B.2 C.3 D.0 5.(2010·济南模拟)有两个分类变量 x,y,它们的值域分别为{x1,x2}和{y1,y2},其 样本频数列联表如下: y1 y2 总计 x1 132 18 150 x2 114 36 150 总计 246 54 300 则两个分类变量 x 和 y 有关系的可信度为( ) A.95% B.97.5% C.99% D.99.5% 二、填空题(每小题 4 分,共 12 分) 6.为了判断高中三年级学生是否选修文科与性别有关系,现随机抽取 50 名学生,得到 如下 2×2 列联表: 理科 文科 男 13 10 女 7 20 2 2 已知 P(K ≥3.841)≈0.05,P(K ≥5.024)≈0.025. 2 50×? 13×20-10×7? 2 根据表中数据,得到 K = ≈4.844. 23×27×20×30 则认为选修文科与性别有关系出错的可能性为______. 7.(2011·银川模拟)下列说法: ①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;
^

②设有一个回归方程y =3-5x,变量 x 增加一个单位时,y 平均增加 5 个单位;
^ ^ ^

③线性回归方程y =b x+a 必过点( x , y ); ④曲线上的点与该点的坐标之间具有相关关系; 2 ⑤在一个 2×2 列联表中, 由计算得 K =13.079, 则其两个变量间有关系的可能性是 90%. 其中错误 的命题是 ________ . .. 8.若两个分类变量 x 和 y 的列联表为: y1 y2 x1 5 15 x2 40 10 则 x 与 y 之间有关系的概率约为________. 三、解答题(共 38 分) 9.(12 分)在一次飞机航程中调查男女乘客的晕机情况,其 2×2 列联表如下,试判断 晕机与性别是否有关? 晕机 不晕机 合计 男 10 70 80
5

女 合计

10 20

20 90

30 110

10.(12 分)(2011·武汉模拟)为了考察某种药物预防疾病的效果,进行动物实验,得 到如下的列联表 患病 未患病 总计 服用药 10 45 55 没服用药 20 30 50 总计 30 75 105 请问能有多大把握认为药物有效?

11.(14 分)(2010·全国)为调查某地区老年人是否需要志愿者提供帮助,用简单随机 抽样方法从该地区调查了 500 位老年人,结果如下: 性别 男 女 是否需要志愿者 需要 40 30 不需要 160 270 (1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例. (2)能否有 99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关? (3)根据(2)的结论, 能否提出更好的调查方法来估计该地区的老年人中, 需要志愿者提 供帮助的老年人的比例?说明理由. 附:

n? ad-bc? 2 K= ? a+b? ? c+d? ? a+c? ?

2

b+d?

6

学案 59 自主梳理
n ^

统计案例

1.(1) y -b x

∑ ? i=1

xi- x ?
n

?

yi- y ?
2

∑ ? i=1

xi- x ?

1n ∑ xi ni=1

1n ∑ yi ni=1

(x,y)

(2)②正相

关 负相关 相关性越强 几乎不存在线性相关关系 0.75 2.(1)频数表 2 n? ad-bc? 2 (2) a+b+c+d (3)K 有关系 ? a+b? ? c+d? ? a+c? ? b+d? 自我检测
^ ^

1.A [b =0 时,得 r=0,这时不具有线性相关关系,但b 能大于 0,也能小于 0.] 2.C [∵a+21=73,∴a=52.又 a+22=b, ∴b=74.] 2 2 2 3.A [比较 K 的值和临界值的大小,有 95%的把握则 K >3.841,K >6.635 约有 99%的 把握.] 4.99.5% 2 100×? 26×40-14×20? 2 解析 因为 K = ≈9.689>7.879, 40×60×46×54 所以有 99.5%的把握认为“主修统计专业与性别之间有关系”. 课堂活动区 例 1 解题导引 利用已知条件来判断两个分类变量是否具有关系,可以先假设两个 2 2 变量之间有关系,再计算 K 的值,K 的值越大说明两个变量间有关系的可能性越大,再参考 临界值,从而判断两个变量有关系的可信程度. 解 由列联表知:a=26,b=184,c=50,d=200. ∴a+b=210,c+d=250,a+c=76, b+d=384,n=a+b+c+d=460. 2 n? ad-bc? 2 ∴K = ? a+b? ? c+d? ? a+c? ? b+d? 2 460×? 26×200-184×50? = ≈4.804. 210×250×76×384 2 ∵K ≈4.804>3.841. ∴有 95%的把握认为种子灭菌与否与小麦发生黑穗病是有关系的. 变式迁移 1 解 假设做过心脏搭桥手术与又发作心脏病没有关系. 由于 a=39,b=157,c=29,d=167,a+b=196, c+d=196,a+c=68,b+d=324,n=392, 2 由公式可得 K 的观测值为 2 n? ad-bc? k= ? a+b? ? c+d? ? a+c? ? b+d? 2 392×? 39×167-157×29? = ≈1.78, 196×196×68×324 因为 k≈1.78<2.706,所以我们没有理由说心脏搭桥手术与又发作心脏病有关系. 例 2 解题导引 这是一个回归分析问题, 应先进行线性相关检验或作散点图来判断 x 与 y 是否线性相关,如果线性相关,才可以求解后面的问题,否则就使得求回归直线方程没

7

n

有意义,要作相关性检验,应先利用 r=

∑xiyi-n x i=1
n i=1 n

y 求出样本相关
2 i 2 i=1

∑ ?

x -n x ?

2 i

2

?

∑y -n y ?

系数 r.利用当 r>0 时,两个变量正相关,当 r<0 时,两个变量负相关.r 的绝对值越接近于 1,表明两个变量的线性相关性越强,r 的绝对值越接近于 0,表明两个变量之间几乎不存在 线性相关关系,通常当|r|大于 0.75 时,认为两个变量有很强的线性相关关系,因而求回归 直线方程才有意义. 解 (1)列出下表 i 1 2 3 4 5 6 7 8 9 10 xi 10 20 30 40 50 60 70 80 90 100 yi 62 68 75 81 89 95 102 108 115 122 xiyi 620 1360 2250 3240 4450 5700 7140 8640 10350 12200 x =55, y =91.7,
10 2 10 2 10

∑xi=38 500,∑ yi=87 777,∑ xiyi=55 950, i=1 i=1 i=1
10

因此 r= ? =

∑xiyi-10 x i=1
10 10 2 2

y
2

∑ xi-10 x ? i=1
2

?

i=1

∑y2i-10 y ?
2

55 950-10×55×91.7

? 38 500-10×55 ? ×? 87 777-10×91.7 ? ≈0.999 8, 由于 r=0.999 8>0.75,因此 x 与 y 之间有很强的线性相关关系.
^ ^ ^

(2)设所求的回归直线方程为y=bx+a 则有
10

∑xiyi-10 x y 55 950-10×55×91.7 i=1 b = 10 = ≈0.668. 2 38 500-10×55 2 2 ∑ x - 10 x i i=1
^ ^ ^

a = y -b x =91.7-0.668×55=54.96.
^

因此,所求的回归直线方程为y =0.668x+54.96. (3)当 x=200 时,y 的估计值为
^

y =0.668×200+54.96=188.56≈189, 因此,加工 200 个零件所用的工时约为 189 分. 变式迁移 2 解 (1) x =12.5, y =8.25,
4

∑xiyi=438,4 x i=1
4 2 i=1 4 2 4

y =412.5,

∑xi=660,∑ yi=291, i=1 ∑xiyi-4 x i=1
4 4

y

所以 r=

2? ? 2 2 ?∑x2 ∑ yi-4 y ? ?i=1 i-4 x ??i ? =1



438-412.5 ?

660-625? ×? 291-272.25? 25.5 25.50 = ≈ ≈0.995 3. 656.25 25.62 因为 r>0.75, 所以 y 与 x 有很强的线性相关关系.
8

n

∑xiyi-n x y i=1 (2)由(1)知:b= n 2 2 ∑ xi-n x i=1
^



^ ^ 438-412.5 2≈0.7286,a = y -b x =-0.8575. 660-4×12.5 ^

∴回归直线方程为y=0.728 6x-0.857 5. 例 3 解题导引 分类变量的独立性检验是建立在 2×2 列联表基础之上的,因而根据 题目提示的分类标准设计 2×2 列联表是独立性检验的关键所在. 解 列联表如下: 疱疹面积 疱疹面积 合计 2 2 小于 70 mm 不小于 70 mm 注射药物 A a=70 b=30 100 注射药物 B c=35 d=65 100 合计 105 95 n=200 2 200× ? 70×65-35×30 ? 2 K= ≈24.56. 100×100×105×95 2 由于 K >10.828,所以有 99.9%的把握认为“注射药物 A 后的疱疹面积与注射药物 B 后 的疱疹面积有差异”. 2 2 2 2 变式迁移 3 解 对于上述四个科目,分别构造四个随机变量 K1,K2,K3,K4. 由表中数据可以得到 2 244×? 174×13-27×30? 语文:k1= 201×43×204×40 ≈7.294>6.635, 2 244×? 178×20-23×23? 数学:k2= 201×43×201×43 ≈30.008>10.828, 2 244×? 176×19-25×24? 英语:k3= 201×43×200×44 ≈24.155>10.828, 综合科目: 2 244×? 175×17-26×26? k4= 201×43×201×43 ≈17.264>10.828, 所以,有 99%的把握认为语文上线与总分上线有关系,有 99.9%的把握认为数学、英语、 综合科目上线与总分上线有关系,数学上线与总分上线关系最大. 课后练习区 2 1.C [在独立性检验中,随机变量 K 的取值大小可说明两个变量关系的程度.一般地 2 2 随机变量 K 的值越大,两变量的相关程度越大,反之就越小.K >6.635 说明有 99%的把握认 为二者有关系.] 2.C [若 r>0,表示两个相关变量正相关,x 增大时,y 也相应增大,故①正确.r<0, 表示两个变量负相关,x 增大时,y 相应减小,故②错误.|r|越接近 1,表示两个变量相关 性越高,|r|=1 表示两个变量有确定的关系(即函数关系),故③正确.] 3.D [因为 r>0 且丁最接近 1,残差平方和最小,所以丁相关性最高.] 4.A [①r 有正负,应为|r|越大,相关性越强; ②正确; 2 ③R 越大,拟合效果越好.] 2 300×? 132×36-114×18? 2 5.C [由公式得 K = ≈7.317, 246×54×150×150 因为 7.317>6.635,所以我们有 99%的把握认为两个分类变量 x 与 y 有关系.]
9

6.5% 2 解析 ∵K ≈4.844, 这表明小概率事件发生. 根据假设检验的基本原理, 应该断定“是 否选修文科与性别之间有关系”成立,并且这种判断出错的可能性约为 5%. 7.②④⑤ 解析 根据方差的计算公式, 可知①正确; 由线性回归方程的定义及最小二乘法的思想, 知③正确,②④⑤不正确. 8.0.999 2 ? 5+15+40+10? ? 5×10-40×15? 2 解析 K = ? 5+15? ? 40+10? ? 5+40? ? 15+10? 2 ≈18.822,查表知 P(K ≥10.828)≈0.001, ∴x 与 y 之间有关系的概率约为 1-0.001=0.999. 2 110×? 10×20-70×10? 2 9.解 K = ≈6.366>5.024, 20×90×30×80 (5 分) 故有 97.5%的把握认为“晕机与性别有关”.(12 分) 10.解 a=10,b=45,c=20,d=30, a+b=55,c+d=50,a+c=30,b+d=75,n=105,(2 分) 2 n? ad-bc? 2 K= (4 分) ? a+b? ? c+d? ? a+c? ? b+d? 2 105×? 10×30-45×20? = ≈6.11,(8 分) 55×50×75×30 2 因为 K =6.11>5.024,从而有 97.5%的把握认为药物有效.(12 分) 11. 解 (1)调查的 500 位老年人中有 70 位需要志愿者提供帮助, 因此该地区老年人中, 70 需要志愿者提供帮助的老年人的比例的估计值为 ×100%=14%.(4 分) 500 2 500×? 40×270-30×160? 2 (2)K = ≈9.967. 200×300×70×430 由于 9.967>6.635 ,所以有 99% 的把握认为该地区的老年人是否需要帮助与性别有 关.(10 分) (3)由(2)的结论知, 该地区老年人是否需要帮助与性别有关, 并且从样本数据能看出该 地区男性老年人与女性老年人中需要帮助的比例有明显差异, 因此在调查时, 先确定该地区 老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法,比采用简单随机 抽样方法更好.(14 分)

10


赞助商链接

高中数学 第一章统计案例学案 新人教A版选修1-2

高中数学 第一章统计案例学案 新人教A版选修1-2_数学_高中教育_教育专区。§1.1.1 回归分析的基本思想及其初步应用(一)学习目标 1. 通过典型案例的探究,...

高三数学理科统计案例总复习教学案

高三数学理科统计案例总复习学案_数学_高中教育_...高三数学专题复习学案概... 201人阅读 2页 1下载...【步步高】届高三数学大... 183人阅读 10页 免费...

高中数学人教A版选修2-3《统计案例》章末复习精品学案

高中数学人教A版选修2-3《统计案例》章末复习精品学案_数学_高中教育_教育专区。高中数学人教A版选修2-3《统计案例》章末复习精品学案 ...

...2.6新背景下的概率统计问题及统计案例教学案理

新课标版备战2018高考数学轮复习难点2.6新背景下的概率统计问题及统计案例学案理_高考_高中教育_教育专区。新背景下的概率、统计问题,及统计案例概率统计是历年...

...与统计案例103变量间的相关关系、统计案例学案理!

(通用)2018年高考数学轮复习第十章统计与统计案例103变量间的相关关系、统计案例学案理!_高考_高中教育_教育专区。§10.3 考纲展示? 变量间的相关关系、统计...

(通用)2018年高考数学一轮复习第十章统计与统计案例102...

(通用)2018年高考数学轮复习第十章统计与统计案例102用样本估计总体学案理_高考_高中教育_教育专区。§10.2 考纲展示? 用样本估计总体 1.了解分布的意义和作用...

...案例3.1回归分析的基本思想及其初步应用4学案无答案新人教A版...

高中数学第三章统计案例3.1回归分析的基本思想及其初步应用4学案无答案新人教A版选修2_3 - 3.1 回归分析的基本思想及其初步应用 第 4 课时 习题课 【学习目标】...

2017-2018学年高中数学选修2-3教学案(人教A版) 复习课(...

2017-2018学年高中数学选修2-3教学案(人教A版) 复习课(三) 统计案例 Word版 含答案_高二数学_数学_高中教育_教育专区。2017-2018学年高中数学选修2-3教学案...

...章统计案例章末小结与测评创新应用学案新人教A版选...

2017_2018学年高中数学第一章统计案例章末小结与测评创新应用学案新人教A版选修1_2(含答案)_高二数学_数学_高中教育_教育专区。2017_2018学年高中数学学案新人教...

统计案例学案用

统计案例学案用_高二数学_数学_高中教育_教育专区。...A. 解释变量解对总效应的贡献是 11% B. 解释...即 H 0 成立的条件下进行推 推理 推出有利于...