局部线性嵌入LLE

[1]/pinard/p/6266408.html
[2]Graph Embedding Techniques, Applications, and Performance: A Survey
主要参考和图片来源[1]

LLE推导算法流程

局部线性嵌入(Locally Linear Embedding,LLE)，一种重要降维方法，与PCA、LDA相比，更注重保持样本局部线性特征，常用语图像识别、高维数据可视化等。

数学意义上的流形：一个不闭合曲面，曲面上数据分布均匀，特征比较稠密，流形降维就是把流形从高维到低维的降维过程，并在降维中保留流形高维的特征。

我的理解：数据分布于高维的一个曲面，流行学习就是将这个曲面降维展开表达出来

LLE

LLE假设数据在较小的局部是线性的，即样本x1x1可以由K个近邻样本x2,x3,x4x2,x3,x4线性表示

x1=w12x2+w13x3+w14x4x1=w12x2+w13x3+w14x4

则希望降维之后依然保持这种线性关系

x′1≈w12x′2+w13x′3+w14x′4x1′≈w12x2′+w13x3′+w14x4′

由于只考虑了局部线性关系，所以复杂度低很多

LLE推导

首先设定邻域大小k，然后寻找某个样本与近邻样本的线性关系，即权重系数。

假设有m个n维样本{x1,x2,...,xm}{x1,x2,...,xm}，则有损失函数

J(w)=∑i=1m‖xi−∑j=1kwijxj‖22J(w)=∑i=1m‖xi−∑j=1kwijxj‖22

对权重系数有归一化限制

∑j=1kwij=1∑j=1kwij=1

对损失函数矩阵化

J(W)=∑i=1m‖xi−∑j=1kwijxj‖22=∑i=1m‖∑j=1kwijxi−∑j=1kwijxj‖22=∑i=1m‖∑j=1kwij(xi−xj)‖22=∑i=1mWTi(xi−xj)T(xi−xj)WiJ(W)=∑i=1m‖xi−∑j=1kwijxj‖22=∑i=1m‖∑j=1kwijxi−∑j=1kwijxj‖22=∑i=1m‖∑j=1kwij(xi−xj)‖22=∑i=1mWiT(xi−xj)T(xi−xj)Wi

其中Wi=(wi1,wi2,...,wik)TWi=(wi1,wi2,...,wik)T

表示局部协方差Zi=(xi−xj)T(xi−xj)Zi=(xi−xj)T(xi−xj)

则简化为

J(W)=∑i=1mWTiZiWiJ(W)=∑i=1mWiTZiWi

对约束有

∑j=1kwij=WTi1k=1∑j=1kwij=WiT1k=1

其中1k为k维全1向量

则拉格朗日乘子法：

L(W)=∑i=1mWTiZiWi+λ(WTi1k−1)L(W)=∑i=1mWiTZiWi+λ(WiT1k−1)

对W求导取0得

2ZiWi+λ1k=02ZiWi+λ1k=0

则