(1)在频率分布直方图中,按照分组原则,在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.
(2)当样本容量不断增大时,样本中落在每个区间内的样本数的频率会越来越稳定于总体在相应区间内取值的概率.也就是说,一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确.
(3)随着样本量的增大,所划分的区间数也可以随之增多,而每个区间的长度则会相应随之减小,相应的频率折线图就会越来越接近于一条光滑曲线.
二、用样本的平均数、方差与标准差估计总体的数字特征
利用随机抽样得到样本,从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差,而只是总体的一个估计,但这个估计是合理的,特别是当样本容量很大时,它们确实反映了总体的信息.
n个样本数据x1,x2,...,xn的平均数
=(x1+x2+...+xn),则有n=x1+x2+...+xn.
设样本的元素为x1,x2,...,xn,样本的平均数为,则样本的方差s2=[(x1-)2+(x2-)2+...+(xn-)2] .
样本方差的算术平方根即为样本的标准差,即s=
.
思考:在频率分布直方图中,如何求众数、中位数、平均数?
[提示] ①在频率分布直方图中,众数是最高矩形中点的横坐标;
②中位数左边和右边的直方图的面积应该相等;
③平均数的估计值等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
1.当收集到的数据量很大时,比较合适的统计图是( )