通过案例理解分类变量、列联表、独立性检验的含义,利用列联表的独立性检验进行估计.
独立性检验的基本思想,随机变量K2的含义.
(1)直观分析的两种方法.
①频率分析.
通过对样本的每个分类变量的不同类别和事件发生的频率的大小比较来分析变量之间是否有关系,通常通过列联表列出两个分类变量进行分析.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:
y x y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d 在列联表中,如果两个分类变量没有关系,则应该满足ad-bc≈0.因此|ad-bc|越小,说明两个分量之间的关系越弱;|ad-bc|越大,说明两个分类变量之间的关系越强.
②图形分析.
利用等高条形图来分析两分类变量之间是否具有相关关系,形象、直观地反映两个分类变量之间的总体状态和差异大小,进而推断它们之间是否有关系.
a.绘制等高条形图时,列联表的行对应的是高度,两行的数据不相等,但对应的条形图的高度是相同的,两列的数据对应不同颜色.b.等高条形图中有两个高度相同的矩形,