直方图(Histogram)的最主要用途在推测制程能力、计算不良率、调查是否有混入两种以上不同群体,也可以用来测知有无假数据、设计的管制界线是否适用于实际制程管制,并藉以订定规格与规格界限或表准值比较。
直方图基本上是一种次数分配表,沿着横轴以各组组界为分界,组距为底边,以各组的次数为高度,依序在固定的间距上画出矩形高度所绘制而成之图形。
早期没有电脑的时候,制作直方图是有点麻烦,因为拿到手的原始资料通常非常地凌乱,甚至没有顺序,必须要自己先统计然后再手动计算其间距与各组数据的数量,不小心的话还很容易出错。现在有了电脑的辅助,可以使用Excel之类的软体来分组并自动统计各分组的数量,也容易微调各组的计数位置。
长条图与直方图的差异
虽然有人将长条图(Bar Chart,各长条中间不相连接)与直方图(Histogram,各相邻长条中间彼此相连接)两者分得非常清楚,但个人觉得其实相邻长条之间有无间隔应该无伤大雅。
持此论者认为这两者最大的差异应该是长条图的长条类别可以任意调换位置,比如说居住地区的人口数、性别资料等属于不连续的资料。而直方图的长条则必须依照原来的顺序排列,通常代表连续的资料,比如班级内的身高统计属于连续的资料。
不过真的有几人可以如此分得清楚呢?那销售业绩、营业绩效应该属于条图或直方图呢?连续的资料应该是直方图啰!可是又不是很像?算了吧!更正188金宝搏苹果下载 如果你有比较好的看法。
直方图的绘制技巧
老实说,直方图算是最常出现在你我生活中的统计图表之一了,举凡班级成绩分佈、考试成绩分佈、年龄分佈等几乎都是以直方图来表示的。不过统计中的直方图因为统计的是某个规定尺寸或某个规定重量,只要统计的数量够多,就会出现所谓的常态分佈。
现在我们就来看看如何由数据制作直方图吧。
《例子》假设有一铁板的厚度测得200组数据如下,单位为mm。
8.8 | 8.8 | 8.4 | 8.2 | 8.3 | 9.3 | 8.6 | 8.4 | 9.0 | 9.7 |
8.4 | 8.5 | 9.0 | 8.7 | 9.4 | 8.9 | 8.7 | 8.7 | 8.6 | 8.7 |
8.4 | 8.4 | 8.5 | 8.8 | 8.9 | 9.6 | 8.4 | 7.9 | 8.1 | 8.4 |
8.8 | 8.3 | 8.4 | 8.5 | 9.3 | 8.1 | 8.7 | 8.3 | 8.9 | 8.7 |
8.1 | 9.1 | 9.0 | 8.6 | 8.3 | 9.0 | 8.7 | 9.0 | 8.6 | 8.6 |
7.8 | 9.2 | 9.8 | 7.4 | 8.8 | 8.1 | 9.0 | 7.8 | 8.6 | 8.7 |
8.8 | 9.4 | 9.0 | 8.8 | 8.5 | 8.7 | 9.0 | 7.8 | 9.2 | 8.7 |
8.8 | 7.9 | 8.0 | 8.0 | 7.9 | 8.2 | 8.6 | 8.4 | 8.6 | 8.3 |
9.0 | 9.0 | 8.3 | 8.4 | 9.5 | 8.4 | 9.7 | 8.9 | 9.2 | 9.0 |
8.4 | 8.1 | 8.4 | 9.9 | 9.9 | 8.6 | 8.5 | 7.9 | 8.7 | 7.8 |
9.3 | 8.4 | 8.8 | 8.5 | 9.1 | 8.9 | 8.4 | 8.8 | 8.9 | 9.7 |
8.3 | 9.0 | 9.3 | 8.7 | 9.0 | 9.2 | 9.1 | 7.0 | 7.9 | 7.3 |
9.7 | 8.9 | 7.8 | 8.3 | 8.7 | 9.0 | 8.4 | 7.6 | 8.1 | 8.2 |
8.5 | 8.5 | 8.1 | 8.3 | 7.6 | 7.7 | 9.0 | 7.9 | 8.3 | 9.0 |
8.9 | 8.6 | 8.4 | 8.9 | 8.3 | 8.0 | 8.0 | 8.0 | 8.9 | 8.3 |
9.0 | 7.7 | 7.9 | 8.3 | 8.5 | 8.5 | 8.9 | 8.4 | 8.3 | 9.5 |
8.8 | 8.7 | 8.1 | 9.1 | 8.9 | 8.4 | 7.9 | 8.6 | 7.8 | 8.9 |
8.1 | 7.7 | 7.3 | 8.5 | 8.0 | 7.7 | 7.8 | 8.3 | 7.5 | 8.3 |
9.4 | 7.0 | 7.5 | 7.7 | 8.3 | 7.9 | 8.6 | 8.9 | 8.4 | 9.9 |
8.3 | 9.4 | 8.4 | 9.3 | 8.5 | 7.9 | 8.4 | 8.8 | 8.3 | 8.0 |
使用Excel计算及绘图直方图
- 使用Min()函数计算最小值=7.0
- 使用Max()函数计算最大值=9.9。
- 一般建议分成10组左右。所以间距就是将(最大值-最小值 )/ 10,最后得出间距为(9.9-7.0)/9=0.29,四捨五入的结果,所以间距取0.3。
- 各组中心值为7.15, 7.45, 7.75, 8.05, 8.35, 8.65, 8.95, 9.25, 9.55, 9.85。
- 使用COUNTIFS()函数计算并统计各组的次数分配可得下表
间距 7.15 7.45 7.75 8.05 8.35 8.65 8.95 9.25 9.55 9.85 数量 2 5 14 26 44 38 43 13 7 8 - 将以上数值绘制成Excel图表如下:
上面图表看起来似乎怪怪的,并不是我们一般熟知的常态分佈曲线的正常形状,这是因为取间距及刻度的关系所造成的,我们稍微移动一下间距的中心点位置,组数从10组变为11组,重新计算其统计的数据如下:
间距 | 7.05 | 7.35 | 7.65 | 7.95 | 8.25 | 8.55 | 8.85 | 9.15 | 9.45 | 9.75 | 10.05 |
数量 | 2 | 3 | 9 | 24 | 31 | 46 | 40 | 25 | 11 | 6 | 3 |
再用Excel绘制一次直方图表后就变成下面的分佈曲线的样子,是不是比较像常态分佈的图形了呢。
所以,取间距及中心值的时候就显得非常重要,有时候可能得稍微挪移一下,以得到较正确的图形。
延伸阅读:
特性要因分析图(Cause & effect Analysis)介绍
柏拉图分析 (Pareto Chart)介绍
如何使用Excel2007制作柏拉图(Pareto chart)
标准差与常态分佈的关系(six sigma)
如何使用Excel2007建立常态分布曲线图表
贊助商广告
PayPal
欧付宝
你好 想询问如何算次数?
Reply
个人想协助188金宝搏苹果下载 补充说明一下组界范围
组界范围包含 :下限值 + 区间范围值 + 上限范围值
组界范围会根据资料笔数而定
>50 ~ 100笔 (经验可取 5 ~ 10组 )
>100 ~ 1000笔 (经验可取 10 ~ 15 组 )
>1000笔 (经验可取10 ~20 组 )
实际工作最常用经验 约 10 ~ 15 组 最多可能会到20组
这里200笔大约会取10 ~ 15组
——————————————————————-
事实上我们还可用log或开根号去求组界范围
以log计算 大概分为9 ~ 10组
不过依照200笔数据计算 计算约9组 (四捨五入)
若以10组计算 其实没包含上限值9.9这一组
绘制直方图看起来较不正确 因此分为11组较为恰当)
但如果以开根号来分组数 200笔数据大概会分到15~17组
以经验来看 < 100笔数据可直接开根号求组界
经验大约分为8 ~ 10 组
Reply
感谢 刘育佐 的补充说明。
Reply