1 min read

softmax函数

这篇文章,其实解释了怎么从逻辑回归用到的统计模型,过渡到多分类模型Softmax函数。

其实道理很简单。

回想逻辑回归的定义。

P(Y=1|X)=exp(Xβ)1+exp(Xβ)

所以,

P(Y=0|X)=1P(Y=1|X)=1exp(Xβ)1+exp(Xβ)=11+exp(Xβ)

形象理解为

exp(Xβ)1分别为P(Y=1|X)P(Y=0|X)在公式中的权重

因此推广, 如果Y=1,2,3,...,j,...,n

那么有特定的分类。

P(Y=j|X)=exp(Xβj)j=1nexp(Xβj)

这就是Softmax函数的思想。 R中有包,softmaxreg.pdf