阐释回归分析的基本思想
在客观世界中,变量间总是相互联系、相互依存的。变量之间的关系大致可以分为两类:一类是具有确定性的函数关系,另一类是非确定性的关系。非确定性的关系在统计学中称为相关关系。回归分析就是通过分析、判断来确定相关变量之间的内在关系的一种统计方法,即寻找相关关系中非确定性关系的某种确定性。
1 相关关系与函数关系的异同点:
相同点:均是指两个变量的关系。
不同点:函数关系是一种确定的关系;而相关关系是一种非确定关系;函数关系是自变量与因变量之间的关系,这种关系是两个非随机变量的关系;而相关关系是非随机变量与随机变量的关系。
2 散点图:表示具有相关关系的两个变量的一组数据的图形,叫做散点图,散点图形象地反映了各对数据的密切程度。
3 求回归直线方程的思想方法:
设所求的直线方程为 ,其中a、b是待定系数,
则 ,于是得到各个偏差
,
显见,偏差 的符号有正有负,若将它们相加会造成相互抵消,所以它们的和不能代表几个点与相应直线在整体上的接近程度,故采用n个偏差的平方和
表示n个点与相应直线在整体上的接近程度。
记
上述式子展开后,是一个关于a、b的二次多项式,采用配方法,可求出使Q为最小值时的a、b的值,即