②通过直接计算或观察等高条形图发现a+b(a)和c+d(c)相差很大,就判断两个分类变量之间有关系.
(4)独立性检验
定义 利用随机变量K2来判断"两个分类变量有关系"的方法称为独立性检验 公式 K2=(a+b(n(ad-bc),
其中n=a+b+c+d 具体
步骤 ①确定α,根据实际问题的需要确定容许推断"两个分类变量有关系"犯错误概率的上界α,然后查表确定临界值k0.
②计算K2,利用公式计算随机变量K2的观测值k.
③下结论,如果k≥k0,就推断"X与Y有关系",这种推断犯错误的概率不超过α;否则,就认为在犯错误的概率不超过α的前提下不能推断"X与Y有关系",或者在样本数据中没有发现足够证据支持结论"X与Y有关系" [问题思考]
(1)有人说:"在犯错误的概率不超过0.01的前提下认为吸烟和患肺癌有关,是指每100个吸烟者中就会有99个患肺癌的."你认为这种观点正确吗?为什么?
提示:观点不正确.犯错误的概率不超过0.01说明的是吸烟与患肺癌有关的程度,不是患肺癌的百分数.
(2)应用独立性检验的基本思想对两个变量间的关系作出的推断一定是正确的吗?
提示:不一定.所有的推断只代表一种可能性,不代表具体情况.
(3)下面是2×2列联表.
y1 y2 总计 x1 33 21 54 x2 a 13 46 总计 b 34 则表中a,b处的值应为多少?