kl800.com省心范文网

陕西省吴堡县吴堡中学高中数学 第一章 统计案例 独立性检验的基本思想及初步应用素材 北师大版选修1-2


独立性检验的基本思想及初步应用
一.基础概念的梳理与理解 1.分类变量的描述性说明:对于宗教信仰来说,其取值为信宗教信仰与不信 宗教信仰两种. 象这样的变量的不同值表示个体所属的不同类别的变量称为分类变 量.例如性别变量其取值为男女两种,吸烟变量其取值为吸烟与不吸烟两种; 2.两个分类变量:是否吸烟与患肺癌于否,性别男和女与是否喜欢数学课程 等等,这是我们所要关心的; 3. 2 ? 2 列联表:列出的两个分类变量 X 和 Y ,它们的取值分别为 {x1 , x2 } 和

{y1, y2} 的样本频数表称为 2 ? 2 列联表 1
分类

y1

y2

总计

x1
x2
总计

a

b

a?b

c

d b?d

c?d a?b?c?d

a?c

二.两个分类变量是否有关的粗略估计

1.三维柱形图:如果列联表 1 的三维柱形图如下图 由各小柱形表示的频数可见,对角线上的 频数的积的差的绝对值 | ad ? bc | 较大,说明两 分类变量 X 和 Y 是有关的,否则的话是无关的.

c

d

a

b
图1

重点: 一方面考察对角线频数之差, 更重要的一方面是提供了构造随机变量进行独立 性检验的思路方法。 2.二维条形图(相应于上面的三维柱形图而画)

由深、浅染色的高可见两种情况下所占比例,由数据可知

a c 要比 小得多, c?d a?b

由于差距较大,因此,说明两分类变量 X 和 Y 有关系的可能性较大,两个比值相差越大两 分类变量 X 和 Y 有关的可能性也越的.否则是无关系的.

d

c

b

a
a
图2 重点: 通过图形以及所占比例直观地粗略地观察是否有关, 更重要的一方面是提供了 构造随机变量进行独立性检验的思想方法。

3.等高条形图(相应于上面的条形图而画) 由深、浅染色的高可见两种情况下的百分比;另一方面,数据

a c 0 ? 0 小得多,因此,说明两分类变量 X 和 Y 有关系的可能性较大, ? 0 0 要比 c?d a?b
否则是无关系的.

d

b

c

a

图3 重点:直观地看出在两类分类变量频数相等的情况下,各部分所占的比例情况,是在图 2 的基础上换一个角度来理解。 三.独立性检验的基本思想 上面通过分析数据与图形, ,得出这个估计是粗略的,因为我们说的“大得多” 、 “小

得多” ,到底是有多大的差距?也就是说得到的结论是直观上的印象,其实与是否有关还是 有较大的差距的.但是上面的分析给了我们一种重要的思想方法. 下面从理论上说明两类分类变量是否有关,请同学们从中体会其思想方法 1.基本思想与图形的联系 假设两类分类变量是无关的,由上面的条形图 2 可知如下的比应差不多。

a c ? ? | ad ? bc |? 0 a?b c?d
(这里可以结合三位柱形图的对角线再加以理解) 构造随机变量 K 2 ?

n(ad ? bc)2 (其中 n ? a ? b ? c ? d ) (a ? b)(c ? d )(a ? c)b ? d )

(此公式如何记住,其特点是什么?结合 2 ? 2 列联表 1 理解) 显然所构造的随机变量与 | ad ? bc |? 0 大小具有一致性. 2.独立性检验的思想方法 如果 K 的观察值较大,说明其发生(无关系)的概率很小,此时不接受假设,也就 是两分类变量是有关系的(称小概率事件发生) ;如果 K 的观察值较小,此时接受假设, 说明两分类变量是无关系的.其思想方法类似于数学上的反证法。 3.得到 K 的观察值 k 常与以下几个临界值加以比较: 如果 如果 如果
2 2 2

k ? 2.706 ,就有 90 0 0 的把握因为两分类变量 X 和 Y 是有关系; k ? 3.841 k ? 6.635
就有 95 0 0 的把握因为两分类变量 X 和 Y 是有关系; 就有 99 0 0 的把握因为两分类变量 X 和 Y 是有关系;

如果低于 k ? 2.706 ,就认为没有充分的证据说明变量 X 和 Y 是有关系. 象这样利用随机变量来确定在多大程度上可以因为 “两个分类变量有关系” 的方法称 为两个分类变量的独立性检验。 例题: 在一次恶劣气候的飞行航行中调查男女乘客在机上晕机的情况如下表所示, 据 此资料你是否因为在恶劣气候飞行中男性比女性更容易晕机?

分类 男性

晕机 23

不晕机 32

合计 55

女性 合计

9 32

25 57

34 89

89 ? (23 ? 25 ? 32 ? 9) 2 ? 2.149 解答;由公式 K ? 55 ? 34 ? 32 ? 57
2

因为 2.149 ? 2.706,我们没有理由说晕机与否跟男女性别有关. 解答评注:尽管这次航班中男性晕机的比例(

23 9 )比女性晕机的比例( ) 55 34

高,但是我们不能因为在恶劣气候飞行中男性比女性更容易晕机. 可见,这里只有 K 的观察值才能准确地分析和解释两分类变量是否有关系,图 形及比例一方面给出了随机变量 K 构造的可行性及思路,另一方面,可以供我们对 是否有关仅供参考. 教材中此节的内容前后联系性较强, 体现了推理的逻辑性以及思想方法, 寓意深 刻,请同学们感悟其知识的形成. (注:3841 为妇女节与愚人节,6635 为 6 ? 6 与 6 ? 6 少 1,上面的数就不难记了)
2 2


赞助商链接

相关文档