所有由ttang发布的文章

处理离群数据的一些想法

最近在做分段数据统计的时候,发现某些情况下,离群数据严重干扰了数据统计,所以一直在想办法对离群数据进行处理。

最典型的离群数据,莫过于单根峰了,在气显示相对活跃,特别是钻遇过裂缝的井里,频繁出现因为停泵引起的后效气测异常,这些异常不是地层含气性的真实反映,理应不参与数据统计。平常其实没有太多注意这类现象,但是有的井实在太频繁,并且单根峰与正常的气测值差异太大,有的已经达到10倍左右了,不处理对数[......]

Read more

win10下Rstudio里的一个奇怪的乱码问题

在Rstudio里,中文注释显示是正常的,读入中文路径下的文件也是正常的,但直接查看的数据,中文或者罗马数字是乱码,但是存为csv文件,罗马数字又是对的,部分中文有乱码。

直接用read.csv读入数据,加了 encoding = 'UTF-8',最后都有乱码。

win10本来是中文版,安装了英文语言包,win界面是英文显示,但我在其他软件里,输入中文,显示中文,罗马数字没有任何问题。[......]

Read more

用R统计参数的结果

应用场景:一堆数据,也可能是几堆数据,需要按不同的数据段来求取最大值最小值和平均值,这个当然不是难事,但一个一个的去手动求取,excel拉过来拉过去,挺烦的,搜索了小半天数据透视表,也没有找到同时求得这三个数值的办法。深受数据统计的折磨,然后有了这一小段代码。

首先设定工作路径setwd("G:/课题/项目/资料")

tidyverse真是好用,library(tidyverse)

分别读取[......]

Read more

Paradigm的geolog之xplot

xplot就是交汇图,常用的功能都有,和excel差不多的感觉,但定制了很多有用的功能,特别有意思的是 User Function Editor,有很多个高频应用功能。

insert polygon,可以在交汇图上手动绘制polygon,按岩性符号库里的对应名字命名polygon,如果polygon有重叠,重叠的部分会以后面的一个polygon为准,然后根据polygon计算岩性

在parad[......]

Read more

瞎说神经网络&深度学习

还没有搞定机器学习,又开始惹上深度学习,反正二者有太多一样的思维。

很多人把深度学习称为神经网络的别名,也不是没有道理,基本上后面起作用的都是神经网络算法,数学家真是牛,能把那么复杂的现实问题,转化为数学问题,更重要的是,这些数学问题得到了解决。

最近买了本《深度学习的数学》,号称用excel就可以实践,很是诱人。买回来发现书很小,居然是32开本的,看了一下页数,二百来页,难怪,内容不够丰富。[......]

Read more