用R统计参数的结果

应用场景:一堆数据,也可能是几堆数据,需要按不同的数据段来求取最大值最小值和平均值,这个当然不是难事,但一个一个的去手动求取,excel拉过来拉过去,挺烦的,搜索了小半天数据透视表,也没有找到同时求得这三个数值的办法。深受数据统计的折磨,然后有了这一小段代码。

首先设定工作路径setwd("G:/课题/项目/资料")

tidyverse真是好用,library(tidyverse)

分别读取数据文件,读取的时候加上stringsAsFactors =F这个参数,避免读入的数据成为因子类型。中途遇到一个问题,用read.table的时候忘记了设定head=TRUE,导致把列名读入成内容,没有办法summary求取结果,查了半天也没有发现问题所在。

当然还有一个重要的数据集,就是最终的评价结果的深度数据需要单独读入,作为后续数据分段统计的分段依据。

其实就是一个for循环的事。

for (i in 1:分段的总数) {}

这个循环的重点是用apply(data,2,summary),提取data的summary作为矩阵

file1 =apply(filter(data1,depth大于result[i,数据分段标志1] 并且depth小于result[i,数据分段标志2]),2,summary)

不止一个数据集需要处理,需要多少个,就写几条语句,不知道还有没有更简洁的写法。。。

数据处理完以后, 用cbind和rbind合并数据集

cbinddata=cbind(file1,file2,。。。)

outdata=rbind(outdata,cbinddata)

最后把结果写入csv文件后输出。

发表评论

电子邮件地址不会被公开。 必填项已用*标注