吸烟 不吸烟 合计 学生活动:让学生利用上述字母来表示对应概率,并化简整理。
思考交流:越小,说明患肺癌与吸烟之间的关系越 (强、弱)?
(2)构造随机变量(其中)
由此若成立,即患肺癌与吸烟没有关系,则K2的值应该很小。把表中的数据代入计算得K2的观测值k约为56.632,统计学中有明确的结论,在成立的情况下,随机事件P(K2≥6.635)≈0.01。由此,我们有99%的把握认为不成立,即有99%的把握认为"患肺癌与吸烟有关系"。
上面这种利用随机变量K2来确定是否能以一定把握认为"两个分类变量有关系"的方法,称为两个分类变量的独立性检验。
说明:估计吸烟者与不吸烟者患肺癌的可能性差异是用频率估计概率,利用K2进行独立性检验,可以对推断的正确性的概率作出估计,观测数据取值越大,效果越好。在实际应用中,当均不小于5,近似的效果才可接受。
(2)这里所说的"患肺癌与吸烟有关系"是一种统计关系,这种关系是指"抽烟的人患肺癌的可能性(风险)更大",而不是说"抽烟的人一定患肺癌"。
(3)在假设成立的情况下,统计量K2应该很小,如果由观测数据计算得到K2的观测值很大,则在一定程度上说明假设不合理(即统计量K2越大,"两个分类变量有关系"的可能性就越大)。
3、对于两个分类变量A和B,推断"A和B有关系"的方法和步骤为:
①利用三维柱形图和二维条形图;
②独立性检验的一般步骤:
第一步,提出假设:两个分类变量A和B没有关系;
第二步,根据2×2列联表和公式计算K2统计量;
第三步,查对课本中临界值表,作出判断。
4、独立性检验与反证法:
反证法原理:在一个已知假设下,如果推出一个矛盾,就证明了这个假设不成立;
独立性检验原理:在一个已知假设下,如果一个与该假设矛盾的小概率事件发生,就推断这个假设不成立。
四、数学运用
例1 在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175名秃顶. 分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?
① 第一步:教师引导学生作出列联表,并分析列联表,引导学生得出"秃顶与患心脏病