月度归档:2022年11月

从线性代数的投影角度看线性回归

最近在读一本很有意思的书:[矩阵力量](https://github.com/Visualize-ML)

从多个角度来分析线性代数的基本概念。回归这一块,第一次领悟到线性代数的威力。

所谓的线性回归,实际是从原始的数据维度,投影到另外一个维度,回归系数就是投影到新维度上的系数,残差就是两个维度带来的误差。

多项式回归更有意思,设计矩阵X实际可以写成多个列向量,第一列全为1,第二列为因变量x,[......]

Read more

河道砂体识别及实现路径

摘自邓懋平老师的ppt。

第一:识别沉积间歇面:沉积间歇面是指在纵向上沉积层序中一期连续稳定沉积结束到下一期连续稳定沉积开始之间形成的有别于上下邻层的特征岩性。 沉积间歇面存在以下三种类型:

1)泥质夹层及过渡性岩性----在多期河道沉积叠加砂岩中泥质夹层代表一期河道沉积结束到下期河道沉积开始之间短暂的细粒物质沉积,是识别两期河流沉积的重要标志。 这种夹层在横向上往往不稳定,原因: 其一是侧向[......]

Read more

UMAP数据降维方法

开展数据降维的主要目的是更易于数据可视化,并识别高维数据集中的关键结构,将它们保存在低维嵌入中,减轻维数灾难,减少共线性带来的影响。常见的数据降维算法分为线性与非线性两大类。主成分分析(PCA)算法是 应用最为广泛的线性降维算法之一,能够快速寻找到原始变量的线性组合,通过保留少量的主成分,表征原始数据的主要特征。但是,PCA等线性算法不能处理高维到低维数据的非线性映射。

t-SNE(t-dist[......]

Read more