在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直方图的面积应该相等.由此可以估计出中位数的值为2.02.
(2)可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02 t.
利用频率分布直方图估计众数、中位数、平均数:
估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)
估计中位数:中位数把频率分布直方图分成左右两边面积相等.
估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(2)课中反思:
教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是2.25 t(最高的矩形的中点),它告诉我们,该市的月均用水量为2.25 t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.
问题1:请大家翻回到课本看看原来抽样的数据,有没有2.25 这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?
这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差.
问题2: 2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?
原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了
问题3: 中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?
样本数据收集有个别差错不影响中位数;大学毕业生凭工资中位数找单位可能收入较低.平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值.
问题4: 在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用"去掉一个最高分,去掉一个最低分"的方法,说说这种方法的好处。
去掉一个最高分,去掉一个最低分,是用平均数来表示一个数据的集中趋势,如果数据中出现一两个极端数据,那么平均数对于这组数据所起的代表作用就会削弱,为了消除这种现象,可将少数极端数据去掉,只计算余下的数据的平均数,并把所得的结果作为全部数据的平均数。所以,在评定某些赛事时,常常采用在评分数据中分别去掉一个(或两个)最