标准差与原始数据的量纲相同,在两组数据的均数相差不大、度量单位相同时,从标准差的大小就可以直接比较两个样本的变异程度。然而,有时我们需要对均数相差较大或单位不同的几组观察值的变异程度进行比较,这时直接使用标准差就不再适宜。在这种情况下可以使用变异系数(coefficient of variation),简称CV,其计算公式为
变异系数公式
与标准差相比,使用变异系数的好处是不需要参照数据的平均值。需要注意:实际中在进行数据统计分析时,如果变异系数比较大时(如CV≥0.20),则要查找引起变异的原因。变异系数的缺点是当平均值接近于0的时候,微小的变化可能对变异系数产生较大的影响。
优点
比起标准差来,变异系数的好处是不需要参照数据的平均值。变异系数是一个无量纲量,因此在比较两组量纲不同或均值不同的数据时,应该用变异系数而不是标准差来作为比较的参考。
缺陷
当平均值接近于0的时候,微小的扰动也会对变异系数产生巨大影响,因此造成精确度不足。
变异系数无法发展出类似于均值的置信区间的工具。