化程度之和,其中这个变化与解释变量和随机误差(即残差平方和)有关的程度是由相关指数R2的值决定的.在线性回归模型中,R2表示解释变量对预报变量变化的贡献率.R2越接近于1,表示解释变量和预报变量的线性相关性越强;反之,R2越小,说明随机误差对预报变量的效应越大.
(2)R2与r的关系
①相关系数可较好地反映变量的相关性及正相关或负相关,而R2反映了回归模型拟合数据的效果;
②R2是相关系数的平方,其变化范围为[0,1],而相关系数的变化范围为[-1,1];
③当相关系数|r|接近于1时说明两变量的相关性较强,当|r|接近于0时说明两变量的相关性较弱,而当R2接近于1时,说明线性回归方程的拟合效果较好.
1.判一判(正确的打"√",错误的打"×")
(1)残差平方和越小,线性回归方程的拟合效果越好.( )
(2)在画两个变量的散点图时,预报变量在x轴上,解释变量在y轴上.( )
(3)R2越接近于1,线性回归方程的拟合效果越好.( )
答案 (1)√ (2)× (3)√
2.做一做
(1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为________.
(2)在残差分析中,残差图的纵坐标为________.
(3)如果发现散点图中所有的样本点都在一条直线上,则残差平方和等于________,解释变量和预报变量之间的相关系数等于________.
答案 (1)正相关 (2)残差 (3)0 1或-1
解析 (1)从散点图上看,点散布在从左下角到右上角的区域内,两个变量的这种相关关系称为正相关.
(2)由残差图的定义知道,作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重的估计值等,这样作出的图形称为残差图.
(3)设样本点为(xi,yi),i=1,2,3,...,n,回归直线为\s\up6(^(^) =\s\up6(^(^) x+\s\up6(^(^) ;若散点图中所有的样本点都在一条直线上,则此直线方程就是回归直线方程.所以有yi=\s\up6(^(^) i;残差平方和ni=1 (yi-\s\up6(^(^) i)2=0;解释变量和预报变量之间的相关系数R