标签归档:离群数据

处理离群数据的一些想法

最近在做分段数据统计的时候,发现某些情况下,离群数据严重干扰了数据统计,所以一直在想办法对离群数据进行处理。

最典型的离群数据,莫过于单根峰了,在气显示相对活跃,特别是钻遇过裂缝的井里,频繁出现因为停泵引起的后效气测异常,这些异常不是地层含气性的真实反映,理应不参与数据统计。平常其实没有太多注意这类现象,但是有的井实在太频繁,并且单根峰与正常的气测值差异太大,有的已经达到10倍左右了,不处理对数[......]

Read more

《R语言实战》第二版碎碎念之二:回归与诊断

1、最小二乘(OLS)回归法。 数据满足统计假设: 正态性,对于固定的自变量值,因变量值成正太分布 独立性,Yi(因变量)之间相互独立 线性,因变量与自变量之间为线性相关 同方差性,因变量的方差不随自变量的水平不同而变化。也可称作不变方差。 做多元线性回归前,最好先用car包里的spm()函数查看一下变量的相关性。 library(car) scat[......]

Read more