第二章 统计
2.2 用样本估计总体
1.用样本的频率分布估计总体分布
(1)频率分布直方图
频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布,频率分布直方图的绘制步骤如下:
①求极差(即一组数据中_________与_________的差).
②决定组距与组数.组距与组数的确定没有固定标准,需要一个尝试与选择的过程.组数与样本容量有关,一般样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分成5 12组.
为方便起见,组距的选择应力求"取整"..
③将数据分组.通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.
④列频率分布表.落在各小组内的数据的个数叫做频数,每小组的频数与数据总数的比值叫做这一小组的频率.计算各小组的频率,作出频率分布表.
⑤画频率分布直方图:依据频率分布表画频率分布直方图,其中纵坐标(小长方形的高)表示频率与组距的比值,其相应组距上的频率等于该组上的小长方形的面积,即.这样,频率分布直方图就以面积的形式反映了数据落在各个小组的频率的大小,各个小长方形面积的总和等于__________.
(2)总体密度曲线
①频率分布折线图:连接频率分布直方图中各小长方形上端的__________,就得到频率分布折线图.
②总体密度曲线:随着样本容量的增加,作频率分布直方图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.
(3)茎叶图
①概念:统计中有一种被用来表示数据的图叫做茎叶图.茎是指基本不变或变化不大的位,叶就是从