《R语言实战》第二版碎碎念之三:重抽样与自助法

重抽样与自助法。数据抽样于未知或混合分布、样本量过小、存在离群点、基于理论分布设计合适的统计检验过于复杂且数学上难以处理等情况,基于随机化和重抽样的统计方法可派上用场。 (1)置换检验,也称为随机化检验或重随机化检验。coin包对于独立性问题提供了一个非常全面的置换检验的框架,而lmPerm包专门用来做方差分析和回归分析的置换检验。lmPerm包需要用RTools安装。 暂时没搞懂。。[......]

Read more

《R语言实战》第二版碎碎念之二:回归与诊断

1、最小二乘(OLS)回归法。 数据满足统计假设: 正态性,对于固定的自变量值,因变量值成正太分布 独立性,Yi(因变量)之间相互独立 线性,因变量与自变量之间为线性相关 同方差性,因变量的方差不随自变量的水平不同而变化。也可称作不变方差。 做多元线性回归前,最好先用car包里的spm()函数查看一下变量的相关性。 library(car) scat[......]

Read more

《R语言实战》第二版碎碎念之一:基础杂烩

查回归诊断的时候,无意发现一个帖子,从[《R语言实战》第二版](https://book.douban.com/subject/26785199/)里搬过来的。这本书躺在我硬盘里很久了,包括第一版,汗颜。捡起来翻了一下,才发现这本书是多么的有意思,也许是到我现在这个境况,对R的认知程度,才发现这本书的有趣之处。 随手记录下一些碎碎念,主要是我以前没有注意,又老是犯错误的地方吧,就不讲究格式了[......]

Read more

页岩里到底是什么气

2018年第一期的[石油实验地质](http://www.sysydz.net/)是涪陵专刊,这是焦石坝页岩气投产4年多来,罕见刊出的专刊,抱着浓厚的兴趣,把[这一期](http://www.sysydz.net/CN/volumn/volumn_1350.shtml)的多数文章读了一遍,然后就发现了一些关于含气量的有意思的现象。 长期以来,国内外学者都坚定的认为页岩气有游离气、吸附气等多种[......]

Read more

R语言里不带引号保存csv文件

R里保存csv文件很简单,一个是自带的write.csv函数,还有一个hardly大神写的write _ csv。平时感觉用哪个都差不多,用自带的函数似乎速度更快,别的没有太多的感受。 最近用SMT加载数据,惊讶的发现用R处理后的csv文件里,每个数据都带了一个引号,我用excel打开csv文件又什么都看不到,然后重新用excel保存为csv文件,再用SMT加载的时候就没有问题了。这个问题真[......]

Read more

春光无限好,希望不加班

异常忙碌的春天。 自从春节后,似乎就没有歇息一下,甚至都来不及喘口气。 为了争取到某个高级别的科研课题,领导们高度重视,大佬一个接一个的出马,让我这个干活的小兵压力异常的大。高层们这么重视,期望如此高,弄砸了没法交代,同时也为了今年和明年能有事做,从春节收假以来,我几乎全部精力都投入进去了。是的,全部,每天下班以后,每个周末,都在高强度的加班,然后最后也免不了熬了两个通宵,最后带着熬夜[......]

Read more