思考:中位数不受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)
对极端值不敏感有利的例子:考察课本中表21中的数据,如果把最后一个数据错写成22,并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据.
对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况.
同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的月均用水量的平均值为2.02 t.
显示了居民月均用水量的平均数,它是频率分布直方图的"重心".由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相差太多了.
利用频率分布直方图估计众数、中位数、平均数:
估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)
估计中位数:中位数把频率分布直方图分成左右两边面积相等.
估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的平均水平,是一组数据的"重心".
应用示例
思路1
例1 (1)若M个数的平均数是X,N个数的平均数是Y,则这M+N个数的平均数是___________;
(2)如果两组数x1,x2,...,xn和y1,y2,...,yn的样本平均数分别是x和y,那么一组数x1+y1,x2+y2,...,xn+yn的平均数是___________.
活动:学生思考或交流,教师提示,根据平均数的定义得到结论.
解:(1);
(2).
例2 某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150分),试确定这次考试中,哪个班的语文成绩更好一些.
甲班:
112 86 106 84 100 105 98 102 94 107
87 112 94 94 99 90 120 98 95 119
108 100 96 115 111 104 95 108 111 105