当前位置: 首页 > news >正文

偏导数

🧮 偏导数:直观理解与核心用法

偏导数是多变量函数里的 “变化率”,它的核心思想是:只看一个变量的变化对函数值的影响,同时把其他变量都固定住


1. 从普通导数到偏导数

  • 普通导数:适用于单变量函数,比如 y=f(x),导数 dxdy​ 表示当 x 变化时,y 变化的快慢。
  • 偏导数:适用于多变量函数,比如 z=f(x,y),偏导数 ∂x∂z​ 表示:固定 y 不变时,x 变化一点点会导致 z 变化多少

生活例子

假设你的成绩 z 由学习时间 x 和睡眠时长 y 共同决定:z=f(x,y)。

  • ∂x∂z​:固定睡眠时长 y,看学习时间 x 增加 1 小时,成绩 z 能提升多少。
  • ∂y∂z​:固定学习时间 x,看睡眠时长 y 增加 1 小时,成绩 z 能提升多少。

2. 数学定义与计算

对于函数 z=f(x,y):

∂x∂z​=limΔx→0​Δxf(x+Δx,y)−f(x,y)​

∂y∂z​=limΔy→0​Δyf(x,y+Δy)−f(x,y)​

计算规则

计算 ∂x∂z​ 时,把 y 当成常数,只对 x 求导;

计算 ∂y∂z​ 时,把 x 当成常数,只对 y 求导。

例子

z=x2+3xy+y3

  • 对 x 求偏导(把 y 看作常数):

    ∂x∂z​=2x+3y

  • 对 y 求偏导(把 x 看作常数):

    ∂y∂z​=3x+3y2


3. 偏导数在深度学习里的作用

在神经网络中,损失函数 Q(w) 是所有权重 w1​,w2​,…,wn​ 的函数。

  • 偏导数 ∂wi​∂Q​ 表示:固定其他所有权重不变时,权重 wi​ 变化一点点会导致损失 Q 变化多少
  • 这个值的正负告诉我们:增大 wi​ 会让损失变大还是变小;绝对值大小告诉我们影响的程度。
  • 所有偏导数组成的向量,就是梯度 ∇Q(w)。

反向传播的本质

就是用链式法则,逐层计算损失函数对每一个权重的偏导数,最终得到整个梯度向量。


4. 关键区别

普通导数 偏导数
单变量函数 多变量函数
符号:dxdy​ 符号:∂x∂z​
描述一个变量的变化率 描述 “一个变量变化、其他固定” 时的变化率

🧠 示例:简单的两层神经网络

我们用一个非常直观的例子来拆解反向传播的每一步。

1. 网络结构

  • 输入:x=2
  • 隐藏层权重:w1​=0.5,偏置:b1​=0.1
  • 激活函数:sigmoid σ(z)=1+e−z1​
  • 输出层权重:w2​=0.3
  • 真实标签:y=1

2. 前向传播(计算预测值与损失)

  1. 隐藏层输入

    z=w1​⋅x+b1​=0.5×2+0.1=1.1

  2. 隐藏层输出(激活后)

    a=σ(z)=1+e−1.11​≈0.7503

  3. 最终预测值

    y^​=w2​⋅a=0.3×0.7503≈0.2251

  4. 损失函数(均方误差)

    Q=(y^​−y)2=(0.2251−1)2≈0.6006


3. 反向传播(计算每个权重的偏导数)

我们的目标是求出 ∂w2​∂Q​ 和 ∂w1​∂Q​,这就是损失对权重的偏导数。

步骤 1:计算损失对输出层权重 w2​ 的偏导数

∂w2​∂Q​=∂y​∂Q​⋅∂w2​∂y​​

  • ∂y​∂Q​=2(y​−y)≈2(0.2251−1)=−1.5498

  • ∂w2​∂y^​​=a≈0.7503

  • 所以:

    ∂w2​∂Q​≈−1.5498×0.7503≈−1.1628


步骤 2:计算损失对隐藏层权重 w1​ 的偏导数

这一步需要多层链式法则:

∂w1​∂Q​=∂y​∂Q​⋅∂a∂y​​⋅∂z∂a​⋅∂w1​∂z​

  • ∂y^​∂Q​≈−1.5498(已算)
  • ∂a∂y^​​=w2​=0.3
  • ∂z∂a​=σ(z)(1−σ(z))≈0.7503×(1−0.7503)≈0.1873
  • ∂w1​∂z​=x=2

代入计算:

∂w1​∂Q​≈−1.5498×0.3×0.1873×2≈−0.1764


4. 梯度与权重更新

现在我们得到了梯度向量:

∇Q=[∂w1​∂Q​,∂w2​∂Q​]≈[−0.1764,−1.1628]

假设学习率 η=0.1,用梯度下降公式更新权重:

w1new​=w1​−η⋅∂w1​∂Q​≈0.5−0.1×(−0.1764)=0.5176

w2new​=w2​−η⋅∂w2​∂Q​≈0.3−0.1×(−1.1628)=0.4163

嘿嘿,还是没看懂

http://www.zskr.cn/news/1537978.html

相关文章:

  • ASP.NET Core项目开发实战:从场景到落地
  • Mysql:实用工具:解密【.mylogin.cnf】的python小工具
  • PostgreSQL 技术日报 (6月16日)|Neon 自动化再进一步,逻辑复制冲突日志迎来 v50 更新
  • 京东 E 卡回收流程完整攻略|正规礼品卡回收平台推荐 + 避坑干货 - 资讯快报
  • 2026年6月最新天梭中国官方售后电话地址服务热线客服网点 - 资讯快报
  • 2026武汉空调维修-中央空调维修加氟安装正规服务商推荐( 全武汉可上门)-修乐家 - 资讯快报
  • 2026南昌高净值人群离婚财产纠纷解决方案:8位资深婚姻家事律师专业推荐 - 资讯快报
  • 2026年线上投票工具实测:5款平台对比,按需挑选更省心
  • 嵌入式网络设备实战:Linux流量整形与JFFS2闪存文件系统部署
  • 晋中漏水检测维修权威推荐:卫生间-厨房-阳台-屋顶天花板漏水维修:靠谱防水补漏公司团队TOP5推荐(2026最新深度调研实测榜单) - 即刻修防水
  • 生产级多维聚合:金融场景下的可落地数据操作指南
  • RoboTwin:5分钟掌握双臂机器人数字孪生平台终极指南
  • CARLA快速启动包:解决Ubuntu+GPU环境安装失败的核心方案
  • YSR态塞曼分裂抑制现象的量子特性与实验观测
  • 2026年6月最新爱彼中国官方售后电话地址服务热线客服网点 - 资讯快报
  • 5个关键突破:让QuantStats成为你的量化投资决策引擎
  • 2026年6月最新宝珀中国官方售后电话地址及客户服务网点查询 - 资讯快报
  • USDPAA LPM IPFwd:基于DPAA硬件加速的高性能IPv4转发实现
  • 技术博文标题规范:如何写出可深度拆解的项目标题
  • 深入解析MPC8308:PowerQUICC II Pro架构、外设集成与嵌入式通信系统设计实践
  • 温州空调快修|全城 24 小时上门,空调故障一键报修 - 资讯快报
  • 2026跨境电商流量转化导师/机构中立测评榜单:卖家全域选型干货指南 - 品牌2026推荐
  • ControlNet-v1-1 FP16 Safetensors 高级技术解析与最佳实践指南
  • 模态对话框与浏览器后退键的协同设计原理
  • 2026年爱彼官方售后解析:原厂配件保障与标准化服务体系 - 资讯快报
  • 广州中小企业注意了!这款工作手机帮你守住销售客户资源 - 资讯快报
  • 客户端检测方法论:分层抽象与责任分离设计
  • 华为GaussDB数据库客户端TPDSS下载安装与连接配置全指南
  • 燧原科技科创板 IPO 过会,各轮次及老股投资人收益几何?
  • 2026年 广东小吃盒厂家推荐排行榜:环保材质与创意设计并重的口碑之选 - 品牌发掘