多元自适应回归样条

多元自适应回归样条(Multivariate Adaptive Regression Splines,简称MARS)是机器学习算法中的一种,属于能自适应处理高维数据的样条回归方法。

优点:

样条在实质上是一种具有一定光滑度的分段多项式,各相邻段上的多项式之间又具有某种连接性质,因而它既保持了多项式的简单性和逼近的可行性,又在各段之间保持了相对独立的局部性质。

由于mars方法应用过程中,不需要人工确定基函数(张积的变量的个数以及变量的分割点)和基函数的个数,也不需要太多的数据预处理以及变量的筛选。

不仅适用于处理高维问题,而且能够捕捉变量之间的非线性和交互作用。

调优参数的确定:

MARS方法需要设定预测变量的阶数(degree)和保留的特征的项数(nprune)。Hastie推荐:1≤degree≤3,2≤nprune≤小于min(200,max(20,2×ncol(输入变量))。

目前发现的适用业务: 岩石中包含的元素种类多,不同元素之间存在多重共线性等复杂的关系,因此从理论上分析,mars方法较多元线性回归等常用方法更具有优势。

mars属于惠而不费的一种算法,后续应当多关注一下。

发表评论

电子邮件地址不会被公开。 必填项已用*标注