这是一个创建于 900 天前的主题,其中的信息可能已经有所发展或是发生改变。
loss1=CrossEntropyLoss(a*f1(x)+b*f2(x))和 loss2=a*CrossEntropyLoss(f1(x))+b*CrossEntropyLoss(f2(x)),这两个东西一样吗,为什么我推导出来是不一样的,但是论文的代码确当成一样在用,论文里讲的是后者,代码写的是前者
1 条回复 • 2021-11-05 00:36:50 +08:00
|
|
1
kilasuelika 2021-11-05 00:36:50 +08:00 via Android
要看作者使用的是哪个公式,不同的地方有细微区别。 如果取-∑p*ln(q),q 是真实的概率,p 是预测的概率,那就是关于 p 线性。两种就是一样的。
|