当前位置: 首页 > news >正文

【人工智能】特征处理

【人工智能】特征处理

特征工程

有时因输入特征不够全面,仅靠现有的特征并不能完美的表达问题规则。因此,可以利用直觉,通过对原有特征的转化组合,创造出新的特征和模型参数,以增强模型的准确性。

使用特征工程的最好案例就是多项式回归模型的实现。

特征选择

用于训练模型的特征并不是越多越好,过多的特征可能导致过拟合。因此发生过拟合时的一种解决方法就是考虑减少输入特征,只保留一些关键特征。

特征缩放

(似乎使用自适应学习率(如 adam 之类)就不需要使用该方法了)

在多元线性回归中,当输入特征大小差异过大时,其生成的模型参数也会差异过大,因此在成本函数的等高线图中会呈现类似椭圆形的效果,对这种形状的函数做梯度下降速度会很慢(下降过程中部分参数出现弹跳)。此时便需要进行输入特征缩放,从而使模型参数在做梯度下降时的取值范围统一,这样可以显著加快梯度下降的速度。

注意:由于特征被缩放,因此训练得出的模型参数也是被缩放的,所以最终需要对这些参数反缩放,以得到适用于原始数据集的模型参数。

最大值归一化

将输入特征的最大值全部缩放到 1。

\[x^{(i)}=\frac{x^{(i)}}{max(x)} \]

均值归一化

将输入特征缩放到-1 到 1,并将中心点置于 0。

\[x^{(i)}=\frac{x^{(i)}-average(x)}{max(x)-min(x)} \]

Z 分数归一化

\[x^{(i)}=\frac{x^{(i)}-average(x)}{\sigma(x)} \]

  • \(\sigma\):标准差
http://www.zskr.cn/news/143469.html

相关文章:

  • 东方博宜OJ 1307:数的计数 ← 递归(内含显示的循环结构设计)
  • 谷歌发布Gemma Scope 2,钉钉推出AI操作系统与硬件,苹果初代智能眼镜细节曝光
  • Chromebook也能跑!GPT-4o驱动的个性化学习路径生成器,初中数学推荐准确率达89%
  • 挑企业微信 SCRM 迷茫?从私域转化需求切入,微伴助手凭什么是第一选择
  • gb_蓝桥杯_基础语法_数据容器_字典
  • override
  • 【人工智能】机器学习
  • 【人工智能】机器学习
  • 020.二叉树匹配问题
  • 9 个降AI率工具推荐,研究生必备!
  • Solution Set
  • 真香,一款Windows系统监控绝配工具!
  • 2026卫生资格考试注意事项 ,实用干货合集 - 资讯焦点
  • CF1051G
  • 【生活杂谈】关于我对数学和世界的感悟
  • 整洁架构小文档
  • 大健康行业品牌营销战略咨询怎么做?奇正沐古解决行业难题 - 资讯焦点
  • 一次架构调整,让人工介入减少了一半
  • Rhino 8.18 超详细下载安装教程!附激活教程+下载渠道(亲测有效)
  • 苏州牙科哪里好?补牙、拔牙、美白、矫正、种植,一站式攻略请收好 - 品牌日记
  • Leetcode 84 水果成篮 | 删除子数组的最大得分
  • AI开发者的“救命稻草“:RAG、知识库和Embedding,让大模型无所不知!
  • 【Unity】未来技术路线
  • 个人总结
  • 传统算法vs大模型应用开发工程师,零基础转行选谁?
  • Sonatype Nexus Repository Manager —— 详细、系统性介绍
  • 【AI革命】Deep Research深度研究:大模型如何实现复杂任务推理?零基础也能学会的多智能体技术!
  • Java毕设选题推荐:基于SpringBoot的闲置物品循环交易保障系统的设计与实现基于springboot的二手物品交易系统的设计与实现【附源码、mysql、文档、调试+代码讲解+全bao等】
  • 负载越来越大,传统互感器为什么开始拖企业用电管理的后腿?
  • 1.1 Python的前世今生