目标三导 学做思一:新课总结
二、讲授新课:
1. 教学总偏差平方和、残差平方和、回归平方和:
(1)总偏差平方和:所有单个样本值与样本均值差的平方和,即
残差平方和:回归值与样本值差的平方和,即
回归平方和:相应回归值与样本均值差的平方和,即
(2)学习要领:
①注意的区别;②预报变量的变化程度可以分解为由解释变量引起的变化程度与残差变量的变化程度之和,即使
③当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好;④对于多个不同的模型,我们还可以引入相关指数R来刻画回归的效果,,它表示解释变量对预报变量变化的贡献率,的值越大,说明残差平方和越小,也就是说模型拟合的效果越好
学做思二:师生互动(讨论)
例题示范:关于x与y的数据如下:
x 2 4 5 6 8 y 30 40 60 50 70 对于x与y的线性关系,进行统计分析,现有两种模型,
,试比较哪一种模型的拟合效果比较好。
解答:既可分别求出两种模型下的总偏差平方和、残差平方和、回归平方和,也可分别求出两种模型下的相关指数,然后再进行比较,从而得出结论
所以选择前一种效果比较好。
2.在对人们休闲方式的一次调查中,共调查了124人,其中女性70,男性54人,女性中有43人要的休闲方式是看电视,另外27人主要的休闲方式是运动,男性中有21人主要的休闲方式是看电视,另外33人的主要休闲方式是运动,(1)根据以上数据建立一个2*2的列联表,(2)判断性别与休闲是否有关系。
解k=6.201,即有97.5%的把握认为"休闲方式与性别有关
学做思三:方法步骤
关于如何判断回归效果问题,我们可以从统计量SST,SSE,SSR,R来进行判断 达标检测 巩固练习
一台机器使用的时间较长,但还可以使用,它按不同的转速生产出来的某机械零件有一些会有缺点,每小时生产有缺点零件的多少,随机器的运转的速度而变化,下表为抽样试验的结果:
转速 16 14 12 8 每小时生产有缺点的零件数 11 9 8 5 (1)变量y对x进行相关性检验; (2)如果y对x有线性相关关系,求回归直线方程;(3)若实际生产中,允许每小时的产品中有缺点的零件最多为10个,那么机器的运转速度应控制在什么范围内?
解(1)r=0. 995,所以y与x有线性性相关关系
(2)y=0.7286x-0.8571
(3)x小于等于14.9013 反思总结 分清总偏差平方和、残差平方和、回归平方和,初步了解如何评价两个不同模型拟合效果的好坏
课后练习