y1),(x2,y2),...,(xn,yn)的回归方程,其中 , 是待定参数。
\o(b,\s\up10(^\o(∑,\s\up10(n
3.回归分析
(1)定义:对具有相关关系的两个变量进行统计分析的一种常用方法。
(2)样本点的中心
对于一组具有线性相关关系的数据(x1,y1),(x2,y2),...,(xn,yn)中(,)称为样本点的中心。
(3)相关系数
当r>0时,表明两个变量正相关;
当r<0时,表明两个变量负相关。
r的绝对值越接近于1,表明两个变量的线性相关性越强。r的绝对值越接近于0,表明两个变量之间几乎不存在线性相关关系。通常|r|大于0.75时,认为两个变量有很强的线性相关性。
4.独立性检验
(1)分类变量:变量的不同"值"表示个体所属的不同类别,像这类变量称为分类变量。
(2)列联表:列出两个分类变量的频数表,称为列联表。假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为
2×2列联表
y1 y2 总计 x1 a b a+b