2021-09-08 0eb98971f8b7965b646875b43430b474 99+ 6 m 1.0 k0 visits

降维

1.意义

1.高纬空间样本具有稀疏性，容易欠拟合

2.可视化

3.维度过大导致训练时间长，预测慢

2.分类

大致分为线形降维度和非线性降维，线形降维包括PCA，LDA等，非线性降维包括LLE，t-SNE，auto encoder等。

3.PCA系列

3.1 PCA

假设矩阵$x\in \mathbb{R}^{ n}$，假设有$M$个样本，将原始数据按列组成$M$ 行$ n $列矩阵$ X\in \mathbb{R}^{M\times n}$，PCA的使用过程为：

1.计算协方差矩阵$G_t \in \mathbb{R}^{n \times n}$

$G_t=\frac{1}{M}\sum_{j=1}^{M}(X-\overline{X})^T(X-\overline{X})$

注意，其中$\overline{X}\in \mathbb{R}^{n}$为列的均值，$X-\overline{X}$表示将$ X$ 的每一列进行零均值化，即减去这一列的均值

2.求出协方差矩阵的特征值及对应的特征向量

$(U,\sum,V)=SVD(G_t)$

3.将特征向量按对应的特征值大小排列，取前 $k$ 列组成矩阵 $P\in \mathbb{R}^{n \times k} $

$P=U(:,1:k)$

4.实现数据降维

$y_{[1\times k]}=x_{[1\times n ]}P_{[n\times k]}$

局限：

a. PCA只能针对1D的向量，对于2D的矩阵而言，比如图片数据，需要先flatten成向量

3.2 2DPCA

将2D的矩阵flatten成向量其实丢失了行列的位置信息，为了直接在2D的矩阵上实现降维，提出了2DPCA。

假设有原始矩阵$A\in\mathbb{R}^{m \times n }$，使用过程如下：

1.计算协方差矩阵

$G_t=\frac{1}{M}\sum_{j=1}^{M}(A_j-\overline{A})^{T}(A_j-\overline{A}) \\\overline{A}=\frac{1}{M}\sum_{j=1}^{M}A_j$

2.求出协方差矩阵的特征值及对应的特征向量

$(U,\sum,V)=SVD(G_t)$

3.将特征向量按对应的特征值大小排列，取前 $k$ 列组成矩阵

$X=U(:,1:k)$

4.实现数据降维

$Y_{[m\times k]}=A_{[m\times n ]}X_{[n\times k]}$

3.3 （2D）2PCA

作者证明了2DPCA只是在行上工作，然后提出了Alternative 2DPCA可以工作在列上，最后将其结合得到（2D）2PCA，使其可以同时在行列工作

假设有原始矩阵$A\in\mathbb{R}^{m \times n }$，使用过程如下：

1.计算协方差矩阵

$G_x=\frac{1}{M}\sum_{k=1}^{M}\sum_{i=1}^{m}(A_k^{(i)}-\overline{A}^{(i)})^{T}(A_k^{(i)}-\overline{A}^{(i)})$

其中$A_k=[(A_k^{(1)})^{T} \ (A_k^{(2)})^{T} \ …\ (A_k^{(m)})^{T}]^{T},\overline{A}=[(\overline{A}^{(1)})^{T} \ (\overline{A}^{(2)})^{T} \ …\ (\overline{A}^{(m)})^{T}]^{T}, \ A_k^{(i)}, \overline{A}^{(i)}$表示$A_k,\overline{A}$的第$i$行

$\\G_z=\frac{1}{M}\sum_{k=1}^{M}\sum_{j=1}^{n}(A_k^{(j)}-\overline{A}^{(j)})(A_k^{(j)}-\overline{A}^{(j)})^{T}$

其中$A_k=[(A_k^{(1)}) \ (A_k^{(2)}) \ …\ (A_k^{(n)})],\overline{A}=[(\overline{A}^{(1)}) \ (\overline{A}^{(2)}) \ …\ (\overline{A}^{(n)})],A_k^{(j)},\overline{A}^{(j)}$表示$A_k,\overline{A}$的第$j$列

2.求出协方差矩阵的特征值及对应的特征向量

$(U_x,\sum x,V_x)=SVD(G_x) \\(U_z,\sum z,V_z)=SVD(G_z)$

3.将特征向量按对应的特征值大小排列

$X=U_x(:,1:k) \in \mathbb{R}^{n\times k} \\Z=U_z(:,1:q) \in \mathbb{R}^{m\times q}$

4.实现数据降维

$C_{[q\times k]}=Z^{T}_{[q\times m]}A_{[m\times n ]}X_{[n\times k]}$

4.t-SNE

4.1 原理

可以参考 https://blog.csdn.net/scott198510/article/details/76099700

4.2代码

from sklearn.manifold import TSNE
from matplotlib import pylab
import  torch
import  pandas as pd


embdding=torch.load(path1)
words = pd.read_csv(path2)

words_embedded = TSNE(n_components=2).fit_transform(embdding)

pylab.figure(figsize=(20, 20))
for i, label in enumerate(words):
  x, y = words_embedded[i, :]
  pylab.scatter(x, y)
  pylab.annotate(label, xy=(x, y), xytext=(5, 2), textcoords='offset points',
                 ha='right', va='bottom')
pylab.show()

5.auto encoder

AutoEncoder在优化过程中无需使用样本的label，通过最小化重构误差希望学习到样本的抽象特征表示z，这种无监督的优化方式大大提升了模型的通用性。

参考

https://zhuanlan.zhihu.com/p/68903857

https://blog.csdn.net/scott198510/article/details/76099700

降维

http://example.com/2021/09/08/dimension-reduction/

Author

Lavine Hu

Posted on

2021-09-08

Updated on

2022-05-31

降维

1.意义

2.分类

3.PCA系列

3.1 PCA

3.2 2DPCA

3.3 （2D）2PCA

4.t-SNE

4.1 原理

4.2代码

5.auto encoder

参考

Author

Posted on

Updated on

Licensed under

Like this article? Support the author with

Recents

Categories

Archives

Tags

Subscribe for updates