考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本数据到平均数的一种平均距离,一般用s表示.
样本数据的标准差的算法:
1.算出样本数据的平均数.
2.算出每个样本数据与样本数据平均数的差:
3.算出(2)中的平方.
4.算出(3)中n个平方数的平均数,即为样本方差.
5.算出(4)中平均数的算术平方根,,即为样本标准差.
其计算公式为:
显然,标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较小.
〖提问〗:标准差的取值范围是什么?标准差为0的样本数据有什么特点?
从标准差的定义和计算公式都可以得出:.当时,意味着所有的样本数据都等于样本平均数.
(在课堂上,如果条件允许的话,可以给学生简单的介绍一下利用计算机 计算标准差的方法.)
2.方差
从数学的角度考虑,人们有时用标准差的平方(即方差) 代替标准差,作为测量样本数据分散程度的工具:
在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差.
【例题精析】
〖例1〗:画出下列四组样本数据的直方图,说明他们的异同点.
(1)5,5,5,5,5,5,5,5,5
(2)4,4,4,5,5,5,6,6,6
(3)3,3,4,4,5,6,6,7,7