1.2 独立性检验
1.2.2 独立性检验
1.2.3独立性检验的基本思想
1.2.4 独立性检验的应用
自主整理
1.两个变量是否相关联,可通过对这一问题的调查数据,进行_______________.
2.统计学选取统计量_______________的大小来检验变量之间是否独立.
高手笔记
1.变量的不同值表示个体所属的不同类别,这样的变量叫作分类变量,可以用列联表来表示.
2.在统计中,用以下结果对变量的独立性进行判断:其中χ2=.
(1)当χ2≤2.706时,没有充分的证据判定变量A、B有关联,可以认为变量A、B是没有关联的.
(2)当χ2>2.706时,有90%的把握判定变量A、B有关联.
(3)当χ2>3.841时,有95%的把握判定变量A、B有关联.
(4)当χ2>6.635时,有99%的把握判定变量A、B有关联.
3.一般地,假设两个分类变量A和B,它们的值域分别为{x1,x2},{y1,y2}.其样本频数列联表如下:
y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 可以利用独立性检验来计算出χ2的值来判断A与B的有关系的可能性大小,独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量A、B有关系,这个结论成立的可信程度,首先假设该结论不成立,即假设结论"两个分类变量没有关系"成立.在该假设下我们构造的随机变量χ2应该很小,如果由观测数据计算得到的χ2很大,则在一定程度上说明假设不合理.根据随机变量χ2的含义,可以通过P(χ2≥6.635)≈0.01来评价假设不合理的程度,由实际计算出χ2>6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信度为99%.
名师解惑
为什么统计学中用χ2=的大小来检验变量之间是否独立呢?
剖析:设A、B为两个变量,每个变量都可以取两个值.
变量A:A1,A2=,变量B:B1,B2=.
通过观察得到数据为
A B1 B2 总计 A1 a b a+b A2 c d c+d 总计 A+c b+d n=a+b+c+d