当前位置: 首页 > news >正文

KL散度

有两个概率分布:真实分布 P(x):世界的真实规律;模型分布 Q(x):我们模型预测的结果。

KL 散度衡量的就是这两个分布之间的“距离”:\(D_{KL}(P||Q) = \sum_{x}^{}{P(x)log\frac{P(x)}{Q(x)}}\).

越接近 0 → 模型越接近真实分布.

假设你在猜天气:
真实情况 P:晴天 80%,下雨 20%;
你的预测 Q:晴天 50%,下雨 50%。

计算:\(D_{KL}(P||Q) = 0.8log\frac{0.8}{0.5} + 0.2log\frac{0.2}{0.5}\)

取自然对数ln:

\(D_{KL} = 0.8 * 0.47 + 0.2 * (-0.92) = 0.376 - 0.184 = 0.192\)

KL 散度 = 0.192 nats
(如果用 log₂,就是约 0.277 bits)

意思是:你这个预测方案,每次猜天气,平均“浪费了” 0.277 bits 的信息。

注意,KL散度并非对称:

\(D_{KL}(P||Q) \neq D_{KL}(Q||P)\).

严格来说,KL散度不是距离,而是一种信息差异。表示“用模型分布 Q 近似真实分布 P 时,多浪费了多少信息”。

http://www.zskr.cn/news/24682.html

相关文章:

  • 随便记
  • [fastgrind] 一个轻量级C++内存监控及可视化开源库
  • Appium 3.0:跨平台移动自动化测试框架全面解析
  • 德国州政府全面弃用微软办公套件,改用开源方案
  • [KaibaMath]1011 关于收敛数列保号性的证明
  • 塔吊施工人员操作合规性监测!思通数科 AI 卫士实时守护作业安全
  • 题解:P1073 [NOIP 2009 提高组] 最优贸易
  • 吩咐
  • 互评五
  • C++ std::forwardT 的使用
  • Agilent E363x 系列
  • 迈向零信任存储:基于RustFS构建内生安全的数据架构
  • 得到的眼泪学会了哭泣 得到的悲伤缓慢摧残肉体 被所爱之人踩在地
  • 框架架构的多维赋能——论其对自然语言处理深层语义分析的影响与启示
  • 路径规划算法学习Day1:深度优先搜索算法(DFS)
  • 顺天地之自然
  • 详细介绍:Vue Router路由
  • 《青云志》
  • AVR 单片机批量编程脚本(.bat)
  • 软工问题总结10.19
  • tryhackme-预安全-网络基础知识-OSI模型-06
  • AI元人文构想研究:理论溯源、跨学科审视与技术路径探析
  • NPM(更新中)
  • 使用DAO模式改造学生信息管理系统
  • 第1章 人工智能项目概述
  • Linux反弹shell解析
  • 2025-10-18 MX-S 模拟赛 赛后总结【MX】
  • clickhouse搭建单机版和集群版本
  • 零基础Linux快速上手-01
  • securecrt linux版本安装