重抽样与自助法。数据抽样于未知或混合分布、样本量过小、存在离群点、基于理论分布设计合适的统计检验过于复杂且数学上难以处理等情况,基于随机化和重抽样的统计方法可派上用场。 (1)置换检验,也称为随机化检验或重随机化检验。coin包对于独立性问题提供了一个非常全面的置换检验的框架,而lmPerm包专门用来做方差分析和回归分析的置换检验。lmPerm包需要用RTools安装。 暂时没搞懂。。[......]
分类目录归档:R
《R语言实战》第二版碎碎念之二:回归与诊断
1、最小二乘(OLS)回归法。 数据满足统计假设: 正态性,对于固定的自变量值,因变量值成正太分布 独立性,Yi(因变量)之间相互独立 线性,因变量与自变量之间为线性相关 同方差性,因变量的方差不随自变量的水平不同而变化。也可称作不变方差。 做多元线性回归前,最好先用car包里的spm()函数查看一下变量的相关性。 library(car) scat[......]
《R语言实战》第二版碎碎念之一:基础杂烩
查回归诊断的时候,无意发现一个帖子,从[《R语言实战》第二版](https://book.douban.com/subject/26785199/)里搬过来的。这本书躺在我硬盘里很久了,包括第一版,汗颜。捡起来翻了一下,才发现这本书是多么的有意思,也许是到我现在这个境况,对R的认知程度,才发现这本书的有趣之处。 随手记录下一些碎碎念,主要是我以前没有注意,又老是犯错误的地方吧,就不讲究格式了[......]
R语言里不带引号保存csv文件
R里保存csv文件很简单,一个是自带的write.csv函数,还有一个hardly大神写的write _ csv。平时感觉用哪个都差不多,用自带的函数似乎速度更快,别的没有太多的感受。 最近用SMT加载数据,惊讶的发现用R处理后的csv文件里,每个数据都带了一个引号,我用excel打开csv文件又什么都看不到,然后重新用excel保存为csv文件,再用SMT加载的时候就没有问题了。这个问题真[......]
奇怪的R的警告信息
在Rstudio里,无论干什么,都是跳出警告信息 Warning message: In strsplit(code, “\n”, fixed = TRUE) : input string 1 is invalid in this locale 只是见了鬼了,咨询了一圈也没有人搭理,试用了一下bing的国内和国际搜索,似乎也没有找到答案,真是怪了,自从知道有事要搜索以来,这种人品问题极少遇[......]
重温《统计学习导论》之一
几年前学过Data Analysis and Statistical Inference[课程](https://class.coursera.org/statistics-001),使用的教材是An introduction to statistical learning with application in R。为了逼自己学下去,还硬头皮写[读书笔记](http://oiltang.com/[......]