1.分类变量和列联表
(1)分类变量:
变量的不同"值"表示个体所属的 ,像这样的变量称为分类变量.
(2)列联表:
①定义:列出的两个分类变量的 称为列联表.
②2×2列联表.
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
总计 总计 从列表中,依据与的值可直观得出结论:两个变量是否有关系.
2.等高条形图
(1)等高条形图和表格相比,更能直观地反映出两个分类变量间是否 ,常用等高条形图表示列联表数据的 .
(2)观察等高条形图发现 和 相差很大,就判断两个分类变量之间有关系.
3.独立性检验
(1)定义:利用随机变量来判断"两个分类变量有关系"的方法称为独立性检验.
(2)公式:,其中 为样本容量.
(3)独立性检验的具体步骤
①确定,根据实际问题的需要,确定容许推断"两个分类变量有关系"犯错误概率的上界,然后