なにをしたいか

nn.KLDivLossの引数を確認する

Kullback-Leibler Divergence

２つの分布の距離を表現できる。
分布Pと分布Qがどれくらい離れているかを評価する場合はこのように表現する

D_{KL}(P || Q) = \int_{-\infty}^{\infty}P(x)\log\biggl(\frac{P(x)}{Q(x)}\biggr)dx

離散確率分布であればシグマに置き換えればいい

D_{KL}(P || Q) = \sum_{x\in X}P(x)\log\biggl(\frac{P(x)}{Q(x)}\biggr)

nn.KLDivLoss

PとQの値

import torch
P = torch.Tensor([0.36, 0.48, 0.16])
Q = torch.Tensor([0.333, 0.333, 0.333])

普通に計算する場合

(P * (P / Q).log()).sum()
# tensor(0.0863)

nnから呼ぶ場合

import torch.nn as nn
kldiv = nn.KLDivLoss(reduction="sum")
kldiv(Q.log(), P)
# tensor(0.0863)

nn.functionalから呼ぶ場合

import torch.nn.functional as F
F.kl_div(Q.log(), P, None, None, 'sum')
# tensor(0.0863)
# 第3、4引数は、deprecatedなのでほっておいて、第5引数で設定する。

reductionの値は、デフォルトはmean。
- 'none': no reduction will be applied
- 'batchmean': the sum of the output will be divided by the batchsize
- 'sum': the output will be summed
- 'mean': the output will be divided by the number of elements in the output

References

(1) KL Divergence for two probability distributions in PyTorch
(2) Kullback–Leibler divergence
(3) KLDivLoss
(4) kl_div

nn.KLDivLossの引数で迷ったのでメモ

なにをしたいか

Kullback-Leibler Divergence

nn.KLDivLoss

References