2.2.1 用样本的频率分布估计总体的分布
目的要求
通过实例体会分布的意义和作用,在表示数据的过程中,学会列出频率分布表、画频率分布直方图、频率折线图、茎叶图,体会它们各自的特点。
教学过程
1.实例引课
为了解某地区女中学生的身体发育情况,不仅要了解其平均身高,还要了解身高在哪个范围内的学生多,哪个范围内的学生少.
为了解某次考试成绩,不仅应知道平均成绩,还应知道90分以上占多少,80分~90分占多少,......,不及格占多少等.
要解决上面的两个问题,需要从总体中得到一个包含大量数据的样本,并且把这些数据形成频率分布,就可以比较清楚地看出样本数据的特征,从而估计总体的分布情况。
2.引出课题:用样本的频率分布估计总体的分布
看下面的例子
某钢铁加工厂生产内径为25.40mm的钢管,为了掌握产品的生产状况,需要定期对产品进行检测。又由于产品的数量巨大,不可能一一检测所有的钢管,因而通常采用随机抽样的办法。如果把这些钢管的内径看成总体,我们可以从中随机抽取的100件钢管进行检测,把这100件钢管的质量分布情况作为总体的质量分布情况来看待。根据规定,钢管内径的尺寸在区间25.325~25.475内为优等品,我们特别希望知道所有生产的钢管中优等品所占的比例,这时就可以用样本的分布情况估计总体的分布情况。
下面的数据是一次抽样中的100件钢管的内径尺寸:(幻灯示).
25.39 25.36 25.34 25.42 25.45 25.38 25.39 25.42 25.47 25.35
25.41 25.43 25.44 25.48 25.45 25.43 25.46 25.40 25.51 25.45
25.40 25.39 25.41 25.36 25.38 25.31 25.56 25.43 25.40 25.38
25.37 25.44 25.33 25.46 25.40 25.49 25.34 25.42 25.50 25.37
25.35 25.32 25.45 25.40 25.27 25.43 25.54 25.39 25.45 25.43
25.40 25.43 25.44 25.41 25.53 25.37 25.38 25.24 25.44 25.40
25.36 25.42 25.39 25.46 25.38 25.35 25.31 25.34 25.40 25.36
25.41 25.32 25.38 25.42 25.40 25.33 25.37 25.41 25.49 25.35
25.47 25.34 25.30 25.39 25.36 25.46 25.29 25.40 25.37 25.33
25.40 25.35 25.41 25.37 25.47 25.39 25.42 25.47 25.38 25.39
上面的100个数据有点散乱,从中很难看出产品质量的分布情况,必须对样本数据用统计的方法加以概括和整理。下面我们列出这组样本数据的频率分布表、频率分布直方图,步骤如下:
(1)计算级差(一组数据中最大值与最小值的差)
25.26-25.24=0.32
(2)决定组距与组数(样本容量不超过100时,组数常分为5~12组)
如果组距定为0.03,那么
级差/组距=0.32/0.03=10 2/3
于是应将样本数据分成11组(组距还可以定为其他的数值)