主题
我们设定两个概率分布分别为 P 和 Q,有:
在设定为连续随机变量的前提下,他们对应的概率密度函数分别为 p(x) 和 q(x)。使用 q(x) 去近似 p(x),有:
若是离散的情况:
注意:
JS 散度是 KL 散度的对称修正版本: