问题三:思考例1:从某大学中随机选取8名女大学生,其身高和体重数据如表所示。求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为172cm的女大学生的体重。
编号 1 2 3 4 5 6 7 8 身高/cm 165 165 157 170 175 165 155 170 体重/kg 48 57 50 54 64 61 43 59 题目中表达了哪些信息?
师:读例1的要求,引导学生理解例题含义。
(例题含义:①数据体重与身高之间是一种不确定性的关系
②求出以身高为自变量x,体重为因变量y的回归方程。
③由方程求出当x = 172时,y的值。
生:思考、讨论、叙述自己的理解,归纳出题目中的信息。
根据以前所学的知识,让学生自己动手求出回归方程
求解过程如下:
①画出散点图,判断身高x与体重y之间存在什么关系(线性关系)?
②列表求出相关的量,并求出线性回归方程
代入公式有
所以回归方程为
③利用回归方程预报身高172cm的女大学生的体重约为多少?
当时,
引导学生复习总结求线性回归方程的步骤:
第一步:作散点图-→第二步:求回归方程-→第三步:代值计算 问题四:身高为172cm的女大学生的体重一定是60.316kg吗?
(不一定,但一般可以认为她的体重在60.316kg左右.)
师:提出问题,引导学生比较函数模型与线性回归模型的不同,并引出相关系数的作用。
生:思考、讨论、解释
解释线性回归模型与一次函数的不同
从散点图可观察出,女大学生的体重和身高之间的关系并不能用一次函数来严格刻画(因为所有的样本点不共线,所以线性模型只能近似地刻画身高和体重的关系). 在数据表中身高为165cm的3名女大学生的体重分别为48kg、57kg和61kg,如果能用一次函数来描述体重与身高的关系,那么身高为165cm的3名女在学生的体重应相同. 这就说明体重不仅受身高的影响还受其他因素的影响,把这种影响的结果(即残差变量或随机变量)引入到线性函数模型中,得到线性回归模型,其中残差变量中包含体重不能由身高的线性函数解释的所有部分. 当残差变量恒等于0时,线性回归模型就变成一次函数模型. 因此,一次函数模型是线性回归模型的特殊形式,线性回归模型是一次函数模型的一般形式.
问题五:如何衡量两个变量之间线性相关关系的强弱呢?
相关系数:
相关系数的绝对值越接近于1,两个变量的线性相关关系越强,它们的散点图越接近一条直线,这时用线性回归模型拟合这组数据就越好,此时建立的线性回归模型是有意义;相关系数的绝对值越接近于0,两个变量的线性相关关系几乎不存在,它们的散点图越离散,通常当大于时,认为两个变量有很强的线性相关关系。
问题六:例1中由体重与身高建立的线性相关关系有无意义?
生:动手计算本例中两个变量之间的相关系数,,表明体重与身高有很强的线性相关关系,从而表明我们建立的回归模型是有意义的。 1. 假设关于某设备的使用年限x和支出的维修费用y(万元),有如下表的统计资料。试求:
使用年限x 2 3 4 5 6 维修费用y 2.2 3.8 5.5 6.5 7.0 ⑴画出数据的散点图;
⑵若x与y呈线性相关关系,求线性回归方程
y = bx + a 的回归系数a、b;
⑶估计使用年限为10年时,维修费用是多少?
答案:⑴散点图如图:
⑵由已知条件制成下表:
1 2 3 4 5 2 3 4 5 6 2.2 3.8 5.5 6.5 7.0 4.4 11.4 22.0 32.5 42.0 4 9 16 25 36 ; ;
; 于是有
⑶ 回归直线方程是,
当时,(万元)
即估计使用10年时维修费用是12.38万元。