标签归档:R语言

《R语言实战》第二版碎碎念之五:主成分分析与因子分析

主成分分析(PCA)是一种数据降维技巧,能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分,并能尽可能的保留原始数据集的信息。 探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法。它通过寻找一组更小的、潜在的或隐藏的结构来解释已观测到的、显式的变量间的关系。经验表明,因子分析需要5-10倍于变量数的样本数。 R中的基础包princomp()函数提供PCA分[......]

Read more

《R语言实战》第二版碎碎念之四:广义线性模型

广义线性模型 广义线性模型扩展了线性模型的框架,包含了非正态因变量的分析。logisitic回归的因变量为类别型,比如二值变量(是/否、通过/未通过)和多分类变量(好/中/差)。泊松回归因变量是计数型,比如一周交通事故的数目,每天酒水消耗的数量等,都是非负的有限值,而且均值和方差通常是相关的(正态分布变量间是相互独立的)。 (1)glm()函数拟合广义线性模型 glm(formu[......]

Read more

R语言里不带引号保存csv文件

R里保存csv文件很简单,一个是自带的write.csv函数,还有一个hardly大神写的write _ csv。平时感觉用哪个都差不多,用自带的函数似乎速度更快,别的没有太多的感受。 最近用SMT加载数据,惊讶的发现用R处理后的csv文件里,每个数据都带了一个引号,我用excel打开csv文件又什么都看不到,然后重新用excel保存为csv文件,再用SMT加载的时候就没有问题了。这个问题真[......]

Read more