残差 把随机误差的估计值^(e)i称为相应于点(xi,yi)的残差 残差图 作图时纵坐标为残差,横坐标可以选为样本编号,或身高数据,或体重估计值等,这样作出的图形称为残差图 残差图法 残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,这样的带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高 残差
平方和 残差平方和为 (n)(yi-^(y)i)2,残差平方和越小,模型拟合效果越好 相关
指数R2 R2=1-(n),R2表示解释变量对于预报变量变化的贡献率,R2越接近于1,表示回归的效果越好 [问题思考]
(1)通过教材P2中的例1计算出的回归方程^(y)=0.849x-85.712可以预报身高为172 cm的女大学生的体重为60.316 kg.请问,身高为172 cm的女大学生的体重一定是60.316 kg吗?为什么?
提示:不一定.从散点图可以看出,样本点散布在一条直线的附近,而不是在一条直线上,所以不能用一次函数y=bx+a表示.
(2)下列说法正确的有哪些?
①在线性回归模型中,e是bx+a预报真实值y的随机误差,它是一个可观测的量;②残差平方和越小的模型,拟合的效果越好;③用R2来刻画回归效果,R2越小,拟合的效果越好;④在残差图中,残差点比较均匀地落在水平的带状区域中,说明选用的模型比较合适,带状区域的宽度越窄,说明模型拟合精度越高,回归方程的预报精度越高.
提示:e是一个不可观测的量,故①不正确;R2越小,残差平方和越大,即模型的拟合效果越差,故③不正确;②④是正确的.
[课前反思]
(1)回归分析的定义是什么?如何求回归直线方程?
(2)线性回归模型是什么?