偏斜度与峰度计算 python 与 numpy 实现
偏斜度:偏斜度是对统计数据分布偏斜方向及程度的度量。统计数据的频数分布有的是对称的,有的是不对称的,即呈现偏态。在偏态分布中,当偏斜度为正值时,分布正偏,即众数位于算术平均数的左侧;当偏斜度为负值时,分布负偏,即众数位于算术平均数的右侧。我们可以利用众数、中位数和算术平均数之间的关系判断分布是左偏态还是右偏态,但要度量分布偏斜的程度,就需要计算偏斜度了。 其计算公式可以表示为
即数据的三阶矩,描述了数据的偏斜程度。
峰度:峰度(peakedness;kurtosis)又称峰态系数。表征概率密度分布曲线在平均值处峰值高低的特征数。直观看来,峰度反映了峰部的尖度。样本的峰度是和正态分布相比较而言统计量,如果峰度大于三,峰的形状比较尖,比正态分布峰要陡峭。反之亦然。
在统计学中,峰度(Kurtosis)衡量实数随机变量概率分布的峰态。峰度高就意味着方差增大是由低频度的大于或小于平均值的极端差值引起的。
其计算公式可表示为
其中μ4是四阶中心矩,σ是标准差。
现通过python中的numpy库进行偏斜度与峰度的计算。
代码如下
import numpy as npR = np.array([1, 2, 3, 4, 5, 6]) #初始化一组数据R_mean = np.mean(R) #计算均值R_var = np.var(R) #计算方差R_sc = np.mean((R - R_mean) ** 3) #计算偏斜度R_ku = np.mean((R - R_mean) ** 4) / pow(R_var, 2) #计算峰度print([R_mean, R_var, R_sc, R_ku])