2017-2018学年人教A版必修3 2.3.2两个变量的线性相关 教案
2017-2018学年人教A版必修3  2.3.2两个变量的线性相关 教案第4页

推导公式①的计算比较复杂,这里不作推导.但是,我们可以解释一下得出它的原理.

假设我们已经得到两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),...,(xn,yn),

且所求回归方程是=bx+a,

其中a、b是待定参数.当变量x取xi(i=1,2,...,n)时可以得到=bxi+a(i=1,2,...,n),

它与实际收集到的yi之间的偏差是yi-=yi-(bxi+a)(i=1,2,...,n).

这样,用这n个偏差的和来刻画"各点与此直线的整体偏差"是比较合适的.由于(yi-)可正可负,为了避免相互抵消,可以考虑用来代替,但由于它含有绝对值,运算不太方便,所以改用Q=(y1-bx1-a)2+(y2-bx2-a)2+...+(yn-bxn-a)2 ②

来刻画n个点与回归直线在整体上的偏差.

这样,问题就归结为:当a,b取什么值时Q最小,即总体偏差最小.经过数学上求最小值的运算,a,b的值由公式①给出.

通过求②式的最小值而得出回归直线的方法,即求回归直线,使得样本数据的点到它的距离的平方和最小,这一方法叫做最小二乘法(method of least square).

(7)利用计算机求回归直线的方程.

根据最小二乘法的思想和公式①,利用计算器或计算机,可以方便地求出回归方程.

以Excel软件为例,用散点图来建立表示人体的脂肪含量与年龄的相关关系的线性回归方程,具体步骤如下:

①在Excel中选定表示人体的脂肪含量与年龄的相关关系的散点图(如下图),在菜单中选定"图表"中的"添加趋势线"选项,弹出"添加趋势线"对话框.

②单击"类型"标签,选定"趋势预测/回归分析类型"中的"线性"选项,单击"确定"按钮,得到回归直线.

③双击回归直线,弹出"趋势线格式"对话框.单击"选项"标签,选定"显示公式",最后单击"确定"按钮,得到回归直线的回归方程=0.577x-0.448.