2019-2020学年北师大版选修1-2 独立性检验的基本思想及其初步应用 学案
2019-2020学年北师大版选修1-2     独立性检验的基本思想及其初步应用 学案第2页

  一个矩形中都有两种颜色,观察下方颜色区域的高度,如果两个高度相差比较明显,就判断两个分类变量之间有关系.

  (2)独立性检验及其基本思想.

  ①独立性检验.

  利用随机变量K2来确定在多大程度上可以认为"两个分类变量有关系"的方法称为两个分类变量的独立性检验.

  利用上诉公式求出K2的观测值为

  k=.

  再得出X与Y有关系的程度,通常用到以下数据:

  (i)如果k>6.635,在犯错误的概率不超过0.01的前提下认为X与Y有关系;

  (ii)如果k>2.706,在犯错误的概率不超过0.1的前提下认为X与Y有关系;

  值得注意的是:观察值k越大,越有利于结论"X和Y有关系",越小越有利于结论"X和Y没有关系".因此,可以建立一定的规则:当k≥k0时就说X与Y有关系,k<k0时就说X和Y没有关系,故求得观测值后只要与建立的规则进行比较即可得出结论.

  ②独立性检验的基本思想.

  独立性检验的基本思想是要确认"两个分类变量有关系"这一结论成立的可信程度,首先假设该结论不成立,即假设"两个分类变量没有关系"成立,在该假设下我们构造的随机变量K2应该很小,如果由观察数据计算得到K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(k≥6.635)≈0.01来评价假设不合理的程度,由实际计算出k>6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信度为99%,不合理的程度可查下表得出: