在这里插入图片描述

其中 i i i为每一个类别。

针对类别不均衡问题,增加权重项:

在这里插入图片描述

多标签分类时,BCE损失结合sigmoid来使用,经过classifier分类过后的输出为(batch_size,num_class)为每个数据的标签,标签不是one-hot的主要体现在sigmoid(output)之后进行bceloss计算的时候:sigmoid输出之后,仍然为(batch_size,num_class)大小的,但是是每个类别的分数,对于一个实例xi,它的各个label的分数加起来不一定要等于1,为实例计算一个bceloss,这个bceloss这个实例在每个类上的cross entropy loss加和求平均得到,这里就体现了多标签的思想。batch的loss是否需要求平均可以根据实际情况确定,如果不求均值的话,就是所有实例的加和,这样进行梯度回传的时候就会加大参数的更新步长,就类似于在learning rate上乘了batch size。

Logo

腾讯云面向开发者汇聚海量精品云计算使用和开发经验,营造开放的云计算技术生态圈。

更多推荐