离散程度
离散程度,英文名Measures of Dispersion,也称为统计变异性(statistical variability),简称变异、变差(variation)、变率,是指一个分布或随机变量的拉伸或压缩程度。它是通过随机地观测变量各个取值之间的差异程度,用来衡量风险大小的指标。
意义
1. 通过对随机变量取值之间离散程度的测定,可以反映各个观测个体之间的差异大小,从而也就可以反映分布中心的指标对各个观测变量值代表性的高低。
2. 通过对随机变量取值之间离散程度的测定,可以反映随机变量次数分布密度曲线的瘦俏或矮胖程度。
3. 离散程度与集中趋势相对,因此,离散度就是指各个变量值与集中趋势的偏离程度。
衡量
衡量离散程度的值通常是非负实数:当衡量值取零时,表示分布集中在同一个值上;随着衡量值的增加,随机变量的取值越来越分散。部分描述离散程度的量是带单位的,并且,这些量的单位与随机变量本身的单位相同。例如,如果随机变量的单位是米或秒,则这些量的单位也是米或秒。这些量包括标准差、四分位距、全距、平均绝对偏差和绝对差中位数。此外,也有一些无量纲量,如变异系数、四分位离散系数、基尼系数和。还有一些带单位的量,但是他们的单位和随机变量本身的单位不同,如方差和离散指数。
测度指标
可用来测度观测变量值之间差异程度的指标有很多,在统计分析推断中最常用的主要有极差、平均差和标准差等几种。
极差
极差又称全距,是观测变量的最大取值与最小取值之间的离差,也就是观测变量的最大观测值与最小观测值之间的区间跨度。
极差的计算公式为:
R=Max(xi) −Min(xi)
平均差
平均差是总体各单位标志对其算术平均数的离差绝对值的算术平均数。它综合反映了总体各单位标志值的变动程度。平均差越大,则表示标志变动度越大,反之则表示标志变动度越小。
标准差是随机变量各个取值偏差平方的平均数的算术平方根,是最常用的反映随机变量分布离散程度的指标。标准差既可以根据样本数据计算,也可以根据观测变量的理论分布计算,分别称为样本标准差和总体标准差。
标准差是一组数值自平均值分散开来的程度的一种测量观念。一个较大的标准差,代表大部分的数值和其平均值之间差异较大;一个较小的标准差,代表这些数值较接近平均值。
例如,两组数的集合 {0, 5, 9, 14} 和 {5, 6, 8, 9} 其平均值都是 7 ,但第二个集合具有较小的标准差。
标准差可以当作不确定性的一种测量。例如在物理科学中,做重复性测量时,测量数值集合的标准差代表这些测量的精确度。当要决定测量值是否符合预测值,测量值的标准差占有决定性重要角色:如果测量平均值与预测值相差太远(同时与标准差数值做比较),则认为测量值与预测值互相矛盾。这很容易理解,因为值都落在一定数值范围之外,可以合理推论预测值是否正确。