1 min read

Fisher的一个矩阵预算

我找到论文看了下,这个损失函数我看懂了,这个无监督的话,分类还是很有用,我看到比一般的KMeans效果好。

公式推导部分,我看了是矩阵运算,他大致的计算我看了下,跟着推了一遍,后面就比较直观了。

可能矩阵这个地方有点问题解释一下。

J(w)=EF

这里理解为,E表示的是每个行星离太阳的距离,F表示各自卫星离行星的距离,J越高形容聚合效果越好,这几个行星就是样本空间中的质心。

其中,

E=i=1CNi(Y¯(i)Y¯)2

就是每个质心到太阳的举例。

Y¯(i)=1Nij=1NiYij

Y¯=1NNiCNiY¯(i)

F=i=1Cj=1Ni(YijY¯(i))2

矩阵计算的规则,

假设列向量YT=[y1,y2,...,yn], 那么 Y=[y1yn]

因此,

Y1×nT×Yn×1=[y1,y2,...,yn]×[y1yn]

Y1×nT×Yn×1=[y12+y22++yn2]=i=1nyi2

因此,

E=i=1CNi(Y¯(i)Y¯)2=i=1CNi(Y¯(i)Y¯)T(Y¯(i)Y¯)=i=1CNi(X¯(i)wX¯w)T(X¯(i)wX¯w)=i=1CNiwT(X¯(i)X¯)T(X¯(i)X¯)w=i=1CwTBw

其中,Ni在公式里面是常数,不需要考虑矩阵运算的位置。 Y¯(i)C×1C是质心数,这里不是样本数,这里很好理解,因为均值数量肯定等于样本数。

B=Ni(X¯(i)X¯)T(X¯(i)X¯)