最近在做分段数据统计的时候,发现某些情况下,离群数据严重干扰了数据统计,所以一直在想办法对离群数据进行处理。
最典型的离群数据,莫过于单根峰了,在气显示相对活跃,特别是钻遇过裂缝的井里,频繁出现因为停泵引起的后效气测异常,这些异常不是地层含气性的真实反映,理应不参与数据统计。平常其实没有太多注意这类现象,但是有的井实在太频繁,并且单根峰与正常的气测值差异太大,有的已经达到10倍左右了,不处理对数[......]
最近在做分段数据统计的时候,发现某些情况下,离群数据严重干扰了数据统计,所以一直在想办法对离群数据进行处理。
最典型的离群数据,莫过于单根峰了,在气显示相对活跃,特别是钻遇过裂缝的井里,频繁出现因为停泵引起的后效气测异常,这些异常不是地层含气性的真实反映,理应不参与数据统计。平常其实没有太多注意这类现象,但是有的井实在太频繁,并且单根峰与正常的气测值差异太大,有的已经达到10倍左右了,不处理对数[......]
一直很关注数据的平滑滤波,尤其是在数据应用过程中,很多时候数据波动极大,头疼不已。 曾经长期使用的一个处理方法是N点移动平均算法,公式非常简单,以5点平滑为例,就是把距离这个数据点最近(包括这个数据点)的5个数据加起来除以5。 =(x[i-2]+x[i-1]+x+x[i+1]+x[i+2])/5 所以excel就可以做了,简单粗暴,一直引以为豪。 上[......]