[核心必知]
1.预习教材,问题导入
根据以下提纲,预习教材P10~P15的内容,回答下列问题.
阅读教材P10"探究"的内容,思考:
(1)是否吸烟、是否患肺癌是什么变量?
提示:分类变量.
(2)吸烟与患肺癌之间的关系还是前面我们研究的线性相关关系吗?
提示:不是.
(3)如何研究吸烟是否对患肺癌有影响?
提示:独立性检验.
2.归纳总结,核心必记
(1)分类变量
变量的不同"值"表示个体所属的不同类别,像这样的变量称为分类变量.
(2)列联表
①定义:列出的两个分类变量的频数表称为列联表.
②2×2列联表
一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
y1 y2 总计 x1 a b a+b x2 c d c+d 总计 a+c b+d a+b+c+d (3)等高条形图
①图形与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.