说明:不要认为两个变量间除了函数关系,就是相关关系,事实是,两个变量间可能毫无关系.比如地球运行的速度与某个人的行走速度就可认为没有关系.
某小卖部为了了解热茶销售量与气温之间的关系,随机统计并制作了某6天卖出热茶的杯数与当天气温的对照表:
气温/C 26 18 13 10 4 杯数 20 24 34 38 50 64 如果某天的气温是,你能根据这些数据预测这天小卖部卖出热茶的杯数吗?
为了了解热茶销量与气温的大致关系,我们以横坐标表示气温,纵坐标表示热茶销量,建立直角坐标系,将表中数据构成的个数对所表示的点在坐标系内标出,得到下图,今后我们称这样的图为散点图(scatterplot).
从下图可以看出,这些点散布在一条直线的附近,故可用一个线性函数近似地表示热茶销量与气温之间的关系.
选择怎样的直线近似地表示热茶销量与气温之间的关系?
我们有多种思考方案:
(1)选择能反映直线变化的两个点,例如取这两点的直线;
(2)取一条直线,使得位于该直线一侧和另一侧的点的个数基本相同;
(3)多取几组点,确定几条直线方程,再分别算出各条直线斜率、截距的平均值,作为所求直线的斜率、截距;
......
怎样的直线最好呢?
三、建构数学
1.最小平方法:
用方程为的直线拟合散点图中的点,应