1.频率分布直方图和茎叶图
(1)作频率分布直方图的步骤
①求极差(即一组数据中最大值与最小值的差);②决定组距与组数;③将数据分组; ④列频率分布表;⑤画频率分布直方图.
(2)频率分布折线图和总体密度曲线
频率分布折线图 连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图 总体密度曲线 随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线
(3)茎叶图的优点
茎叶图的优点是可以保留原始数据,而且可以随时记录,这对数据的记录和表示都能带来方便.
2.众数、中位数、平均数
数字特征 定义与求法 优点与缺点 众数 一组数据中重复出现次数最多的数 众数体现了样本数据的最大集中点,不受极端值的影响.但显然它对其他数据信息的忽视使得无法客观地反映总体特征 中位数 把一组数据按从小到大的顺序排列,处在中间位置的一个数据(或两个数据的平均数) 中位数等分样本数据所占频率,它不受少数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点 平均数 如果有n个数据x1,x2,...,xn,那么这n个数的平均数\s\up6(-(-)= 平均数与每一个样本数据有关,可以反映出更多的关于样本数据全体的信息,但平均数受数据中的极端值的影响较大,使平均数在估计总体时可靠性降低 3.标准差、方差
(1)标准差:样本数据到平均数的一种平均距离,一般用s表示,s= n(1,n).
(2)方差:标准差的平方s2=[(x1-\s\up6(-(-))2+(x2-\s\up6(-(-))2+...+(xn-\s\up6(-(-))2],其中xi(i=1,2,3,...,n)是样本数据,n是样本容量,\s\up6(-(-)是样本平均数.