当前位置: 首页 > news >正文

分类器案例 - -一叶知秋

模型复杂程度

一、常见衡量指标

  1. 参数数量(Number of Parameters)
    • 模型包含的可学习参数越多,复杂度越高。
    • 例如:
      • 线性回归:参数个数 = 特征维数 + 1
      • 深度神经网络:每层权重矩阵大小 × 层数
    • 例子:ResNet-18(约1100万参数) vs. GPT-3(1750亿参数)
  2. 模型容量(Model Capacity)
    • 表示模型拟合各种函数的能力。
    • 高容量模型可以逼近更复杂的数据分布,但也更容易过拟合
  3. VC维(Vapnik–Chervonenkis Dimension)
    • 理论上衡量模型的表达能力:能将多少样本点任意划分。
    • VC维越高,模型越复杂。
  4. 网络深度与宽度(Depth & Width)
    • 深度:层数增加 → 表达更复杂的特征组合。
    • 宽度:每层神经元数量多 → 捕获更多模式信息。
  5. 正则化强度(Regularization Strength)
    • L1/L2正则、Dropout、权重衰减等会有效降低模型复杂度

二、复杂度与性能的关系

复杂度 优点 缺点
低(简单模型) 易解释、训练快、泛化强 可能欠拟合
适中 拟合能力强、泛化良好 需要调参
高(复杂模型) 强拟合能力、可逼近复杂函数 易过拟合、计算量大

三、调控模型复杂度的方法

  1. 减少/增加网络层数或神经元数
  2. 使用正则化(L1、L2、Dropout、早停等)
  3. 特征选择或降维(PCA、特征重要性筛选)
  4. 模型剪枝或量化(减少冗余参数)
  5. 交叉验证确定合适复杂度

四、形象理解

可以把模型复杂度比作“画画的笔”:

  • 一支简单的笔(线性模型)只能画直线;
  • 一套彩笔(多层神经网络)可以画出复杂图案;
  • 但笔太多又乱用,就容易“涂花”(过拟合)。

训练过程

定义模型

根据观察,宝可梦比数码宝贝的线条要简单,所有将图片转换成线条,根据线条的白色像素多少来判断

image-20251024100646403

Loss 函数

这次为什么选择 Error rate ,因为简单直观,正确输出 0 ,错误输出 1

image-20251024104148795

$h^{all}$ 在Data(all)上一定小于 $h^{train}$ ,因为 all 是所有数据训练出来的,train 只是抽出来的部分数据,但是在其他数据集上不一定比 $h^{train}$小

image-20251024105945810

找到一个 h 在Data(train) 和Data(all)上的Loss差不多,两个就会比较接近

image-20251024113407934

训练资料好坏

这个理论不常用,因为这个是个上限,一般 H 都会很大,算出来的一般都会大于 1

N 训练集数

H 参数能选择的个数

$\epsilon$ 自己定义的参数

image-20251024115554936

|H| 越小,N 越大,训练集越好

但是H很小的时候,All 里面不一定有很好的 h 了,虽然痕接近,但是都很差

N一般收集到的资料有限

image-20251024122620506

http://www.zskr.cn/news/29206.html

相关文章:

  • 最大流
  • 最长路(topsort+DP算法)
  • 缩点(Tarjan 算法)
  • 常见概念
  • CNCF项目记录2025-10
  • 代理
  • 双碳目标下,MyEMS 为何成为制造企业的 “刚需工具”?
  • 树上路径交
  • 点分治 / 树的重心
  • 树论大封装(直径+重心+中心)
  • 书评-谋杀黄昏
  • 徐州信息技术服务管理体系认证渠道口碑榜:聚焦机构资质、服务案例及合规性评估
  • 完整教程:【汽车篇】AI深度学习在汽车零部件外观检测——铝铸件中的应用
  • 附加数据文件失败:操作系统错误 5:“5(拒绝访问。)”。 CREATE DATABASE 失败。无法创建列出的某些文件名
  • 20251024- 使用shell脚本分库定时备份MySQL数据
  • 2025年口碑好的食品级贴体盒,榴莲贴体盒实力源头
  • 2025年诚信的液压水渠成型机,全自动水渠成型机厂家最新权威推荐榜
  • 2025年10月扬州公考面试机构全景解析报告,基于专业测评的技术、性能及市场优势深度分析
  • 2025年耐用的陶瓷纤维异性件,硅酸铝纤维陶瓷纤维实力源头加工
  • 2025年口碑好的空气能地暖管,德国品牌地暖管厂家最新TOP推荐榜
  • 2025 年接触角测量仪厂家最新推荐榜:聚焦企业专利技术、品质管控及知名客户合作案例的权威解析
  • 2025年诚信的不锈钢网片,304不锈钢网片厂家最新推荐排行榜
  • 2025年耐用的美狮台球杆推荐TOP生产厂家
  • 2025年知名的光伏储能柜,智能储能柜推荐TOP品牌厂家
  • ISCSI技术原理与运维实践指南
  • 2025 年搅拌机设备厂家最新推荐排行榜:聚焦磁混凝系统 / 发酵罐 / 刮泥机 / 推进式 / 脱硫侧搅拌机,精选优质企业品牌
  • 山海鲸列表组件常用功能分享
  • MyEMS 的 “智慧大脑”:能耗建模、异常预警与优化策略的技术逻辑
  • 2025 年厌氧胶源头厂家最新推荐榜,技术实力与市场口碑深度解析的优质品牌合集
  • 2025年靠谱的智能沙发,家用沙发批发销售