对于通用的计算交叉熵的公式如下:
但是对于0-1分布的交叉熵计算公式则可以简化为如下:
刚开始的时候不理解为什么这么改动,以为蕴含着什么深层次的概念和技巧了,其实很简单,0-1分布就是二分类,可以将二分类问题看作是有两种类别的分类问题,知道了一个事件概率p,则另一个事件的概率为1-p,因此预测的一个类别的概率为q,则另一个事件的概率应该为1-q。因此改动成上面的计算公式也就是顺理成章了。
对于通用的计算交叉熵的公式如下:
但是对于0-1分布的交叉熵计算公式则可以简化为如下:
刚开始的时候不理解为什么这么改动,以为蕴含着什么深层次的概念和技巧了,其实很简单,0-1分布就是二分类,可以将二分类问题看作是有两种类别的分类问题,知道了一个事件概率p,则另一个事件的概率为1-p,因此预测的一个类别的概率为q,则另一个事件的概率应该为1-q。因此改动成上面的计算公式也就是顺理成章了。