Перекрёстная энтропия

В теории информации перекрёстная энтропия между двумя распределениями вероятностей измеряет среднее число бит, необходимых для опознания события из набора возможностей, если используемая схема кодирования базируется на заданном распределении вероятностей $q$ , вместо «истинного» распределения $p$ .

Перекрестная энтропия для двух распределений $p$ и $q$ над одним и тем же вероятностным пространством определяется следующим образом:

$\mathrm{H}(p, q) = \mathrm{E}_p[-\log q] = \mathrm{H}(p) + D_{\mathrm{KL}}(p \| q)\!$ ,

где $H(p)$ — энтропия $p$ , и $D_{\mathrm{KL}}(p || q)$ — Расстояние Кульбака — Лейблера от $q$ до $p$ (также известная как относительная энтропия).