选择怎样的直线近似地表示热茶销量与气温之间的关系?
我们有多种思考方案:
(1)选择能反映直线变化的两个点,例如取这两点的直线;
(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;
(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;
..................
怎样的直线最好呢?
三、建构数学
1、最小平方法:
用方程为的直线拟合散点图中的点,应使得该直线与散点图中的点最接近.那么怎样衡量直线与图中六个点的接近程度呢?
我们将表中给出的自变量x的六个值代入直线方程,得到相应的六个值:
它们与表中相应的实际值应该越接近越好.
所以,我们用类似于估计平均数时的思想,考虑离差的平方和
是直线与各散点在垂直方向(纵轴方向)上的距离的平方和,可以用来衡量直线与图中六个点的接近程度。
所以,设法取的值,使达到最小值.这种方法叫做最小平方法(又称最小二乘法) 。
2、线性相关关系:
像这样能用直线方程近似表示的相关关系叫做线性相关关系。
3、线性回归方程:
一般地,设有n个观察数据如下: