样本数据的频率分布直方图把原始的一些数据给遗失了.
探究3:平均数是频率分布直方图的"重心",在下面的频率分布直方图中,各个小矩形的重心在哪里?从直方图估计总体在各组数据内的平均数分别为多少?
分析:根据在频率分布直方图中获取众数与中位数的方法类比寻求解题思路.
平均数:样本数据的估计平均数就是将频率分布直方图中每个小矩形的面积与小矩形底边中点的横坐标之积相加. 由此估计总体的平均数就是:
0.25×0.04+0.75×0.08+1.25×0.15+1.75×0.22+2.25×0.25+2.75×0.14+3.25×0.06+3.75×0.04+4.25×0.02=2.02(t).
图2.2-5显示,大部分居民的月均用水量在中部(2.02t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的.
思考4:这个平均数的估计值,与样本的平均数值1.973不一样,你能解释其中的原因吗?
原因同上,样本数据的频率分布直方图把原始的一些数据给遗失了.
探究4:样本中位数不受少数几个极端值的影响,它一定是个优点吗?
一组数据的中位数一般不受少数几个极端值的影响,在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点.我们一起看一下下面这个例子:一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万.这时,年收入的平均数会比中位数大的多.尽管这时中位数比平均数更合理些,但是这个企业的老板到人才市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问.你认为"我们单位的收入水平比别的单位高"这句话应当怎样理解?
分析:"我们单位的收入水平比别的单位高"这句话显然说的是单位人员的平均工资,由于经理层次的人对平均数影响较大,所以单位人员工资的平均数远远要比中位数要大.所以在招聘会上如果打着平均工资的旗号去招聘工人显然是对工人的一种"欺骗".
【设计意图】设计此探究目的是通过此实际问题进一步加深学生对平均数与中位数的理解.谨防利用人们对统计术语的模糊认识进行误导、蒙骗,使学生能够正确理解在日常生活中像"我们单位的收入水平比别的单位高"这类话的模糊性,培养学生拿起数学武器去思考问题的能力.
四、 理解新知:
平均数、众数、中位数都是描述数据的"集中趋势"的"特征数",但对于同一组考察对象来说,平均数、众数、中位数一般不一样.他们各自的特点如下:
1.众数是一组数据中出现次数最多的那个数,(一组数据中可以有多个众数)频率分布直方图中最高的矩形的中点,它体现了样本数据的"最大集中点",因此用众数作为一组数据的代表,可靠性就差了,但众数有一个好处,就是不受极端数据的影响,并且求法简便.所以,当一组数据中个别数据变动较大时,适宜选择中位数来表示这组数据的"集中趋势".
2.中位数作为一组数据的代表,可靠性也比较差,但中位数也不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.
3.由于平均数与每一个样本的数据有关,所以任何一个样本数据的改变都会引起平均数的改变,这是众
数、中位数都不具有的性质.与众数、中位数比较起,平均数可以反映出更多的关于样本数