当前位置: 首页 > news >正文

实用指南:12-机器学习与大模型开发数学教程-第1章1-4 导数与几何意义

在机器学习里,导数(Derivative)几乎无处不在:

  • 优化算法:梯度下降靠导数来确定“往哪边走”。
  • 神经网络训练:反向传播就是在大规模应用链式法则计算导数。
  • 损失函数分析否有极小值。就是:通过导数能知道函数

换句话说:不会导数 → 不懂梯度下降 → 无法理解深度学习是怎么“学”的


从生活例子看“导数”

想象你开车:

  • 平均速度 = 总路程 ÷ 总时间。
  • 但你真正关心的是某一瞬间的速度(比如雷达测速仪测你开多快)。

数学上,这个“瞬时速度”就是一个极限:

v=lim⁡Δt→0ΔsΔtv = \lim_{\Delta t \to 0} \frac{\Delta s}{\Delta t}v=limΔt0ΔtΔs

这就是 导数的定义:函数的“瞬时变化率”。


导数的正式定义

如果函数 f(x)f(x)f(x) 在点 x=ax=ax=a附近存在极限:

f′(a)=lim⁡h→0f(a+h)−f(a)hf'(a) = \lim_{h \to 0} \frac{f(a+h) - f(a)}{h}f(a)=limh0hf(a+h)f(a)

那么我们称 f(x)f(x)f(x)x=ax=ax=a处可导,导数为f′(a)f'(a)f(a)

直观意义:


几何意义:切线的斜率

曲线在某点的切线斜率。就是在几何上,导数就

  • 若是导数是正的:曲线在该点上升。
  • 如果导数是负的:曲线在该点下降。
  • 如果导数是 0:曲线在该点“水平”,可能是极值点。
函数曲线 y=f(x)
某点 (a, f(a))
切线: 斜率 f'(a)

说明:曲线 y=f(x)y=f(x)y=f(x) 在点 (a,f(a))(a,f(a))(a,f(a))处的导数,就是切线的斜率。


机器学习中的导数应用

  1. 梯度下降(Gradient Descent)

    类比:站在山坡上,斜率告诉你“哪边更陡”,顺着下坡方向走,就能更快到山谷。


  1. 损失函数的最小值

    例子:


  1. 神经网络的反向传播


技术延伸:导数与可解释性

  • 在可解释 AI 中,导数还能用来衡量“输入的微小变化对输出的影响”。
  • 比如在图像分类中,如果一个像素的导数很大,说明模型对这个像素专门敏感。
  • 这就是 Saliency Map(显著性图) 的原理。

小结

http://www.zskr.cn/news/49834.html

相关文章:

  • docker登录容器镜像仓库
  • 吴恩达深度学习课程二: 改善深层神经网络 第三周:超参数调整,批量标准化和编程框架(一)超参数调整
  • 恭喜自己,挑战成功! - Ghost
  • 如何在测试覆盖不足后补充验证
  • 完整教程:PDFBox - PDDocument 与 byte 数组、PDF 加密
  • Web应用模糊测试完全指南
  • 【HT-086-Div.2】错乱的集合
  • WEditor的使用方法
  • 感情粉末沿着试管边缘 在祝福中逐渐分解 加热认知离子重新排列 于底部悲伤沉淀
  • flask: 抛出异常
  • 雪地奔驰全等级提升所需经验一览
  • 2025皮肤亚健康管理品牌最新专业推荐:科技赋能健康美新生态
  • 深入解析:Vue3 路由配置和使用与讲解(超级详细)
  • HubSpot如何规模化推进AI编码助手应用
  • 完整教程:OpenHarmony内核基础:LiteOS-M内核与POSIX/CMSIS接口
  • 常量指针 和 指针常量 - const pointer and pointer to const
  • 11.14模拟赛
  • 实用指南:云计算生态及学习方向和就业领域方向
  • 2025年11月徐州AI GEO平台综合评测与权威推荐
  • 2025年国内徐州宣传片公司品牌权威推荐榜单
  • 好题集 (2) - LG P4550 收集邮票
  • 腾讯元宝如何导出内容为文档
  • 洛谷 P4242. 树上的毒瘤
  • Number Theory
  • 实用指南:【STM32】RTC实时时钟
  • 探索乐泰胶水:性能与适用场景全解析
  • 【System Beats!】第七章 链接
  • 实用指南:接口测试 | 使用Postman实际场景化测试
  • 应用程序建立的数据库连接,也就是非交互式连接 是什么时候开始的?什么时候结束?连接结束后 会影响应用程序操作db失败吗? 还有就是如果连接关闭了 会立马重新建立新的连接吗?
  • #题解#洛谷P1884#二维离散化#