2018-2019学年人教A版选修1-2 §1.2 独立性检验的基本思想及其初步应用 学案
2018-2019学年人教A版选修1-2     §1.2 独立性检验的基本思想及其初步应用 学案第2页

梳理 (1)分类变量

变量的不同"值"表示个体所属的不同类别,像这样的变量称为分类变量.

(2)列联表

①定义:列出的两个分类变量的频数表,称为列联表.

②2×2列联表

一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为下表.

y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d

知识点二 等高条形图

1.与表格相比,图形更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.

2.如果通过计算或等高条形图发现和相差很大,就判断两个分类变量之间有关系.

知识点三 独立性检验

1.定义:利用随机变量K2来判断"两个分类变量有关系"的方法称为独立性检验.

2.K2=.

其中n=a+b+c+d为样本容量.

3.独立性检验的具体做法

(1)根据实际问题的需要确定容许推断"两个分类变量有关系"犯错误概率的上界α,然后查表确定临界值k0.

(2)利用公式计算随机变量K2的观测值k.

(3)如果k≥k0,就推断"X与Y有关系",这种推断犯错误的概率不超过α;否则,就认为