当前位置: 首页 > news >正文

软件工程学习日志2025.11.12

一、基本概念回顾

信息论基础公式

信息熵:度量样本集合纯度的指标

H(D) = -Σ(p_k × log₂p_k)

信息增益:特征A对数据集D划分带来的信息提升

Gain(D,A) = H(D) - Σ(|Dᵛ|/|D| × H(Dᵛ))

信息增益率:解决信息增益对多值特征的偏好问题

Gain_ratio(D,A) = Gain(D,A) / H_A(D)

二、关键技术对比分析

  1. 划分准则优缺点对比

准则 优点 缺点 适用场景

信息增益 计算简单,直观易懂 对多值特征有偏好 特征取值较均匀时

信息增益率 减少多值特征偏好 可能倾向选择取值少的特征 特征取值数量差异大时

  1. 剪枝策略优劣分析

预剪枝(提前停止树生长):
• ✅ 训练效率高,模型简洁

• ❌ 可能因贪心而欠拟合

后剪枝(生成完整树后修剪):
• ✅ 泛化能力更强,决策更准确

• ❌ 计算开销大,训练时间长

三、算法终止条件总结

决策树停止生长的三种情况:

  1. 纯度达标:当前节点样本属于同一类别
  2. 特征耗尽:无剩余特征可用,或所有样本特征值相同
  3. 样本为空:当前节点无样本可划分

四、实战案例:贷款审批决策树构建

基于提供的贷款申请数据(15个样本),演示ID3算法完整流程:

数据特征分析

• 特征维度:年龄、工作、房产、信贷情况

• 目标变量:是否批准贷款(二分类)

关键计算步骤

  1. 基准熵计算:H(D) = 0.971

  2. 各特征信息增益:
    • 有自己的房子:0.420 ✓(最优)

    • 信贷情况:0.363

    • 有工作:0.324

    • 年龄:0.083

生成的决策树逻辑

根节点:有自己的房子?
├─ 是 → 直接批准(纯度100%)
└─ 否 → 次级判断:有工作?
├─ 是 → 批准贷款
└─ 否 → 三级判断:信贷情况
├─ 一般/好 → 拒绝
└─ 非常好 → 批准

五、核心洞察与学习心得

  1. 特征选择的重要性:房产状况成为首要判断标准,符合金融风控直觉
  2. 算法与实际业务的结合:决策树的可解释性在金融领域极具价值
  3. 过拟合与泛化的平衡:需要通过剪枝等技术保证模型实用性
http://www.zskr.cn/news/47822.html

相关文章:

  • NLTK库用法示例:Python自然语言处理入门到实践 - 实践
  • 2025人形机器人产业链全景分析报告:核心技术与市场趋势|附130+份报告PDF、数据、可视化模板汇总下载
  • 2025履带式/机场/智能驱鸟机器人系统推荐榜:申昊科技以AI赋能,破解多场景鸟害难题
  • 2025室外/攀爬/绳网/公园/景区/户外游乐设施企业口碑榜:全场景覆盖 + 实力出圈,这4家企业成采购优选
  • 2025年邦顿商用空气能厂家新实力榜:聚焦邦顿商用变频/商用变频冷暖/商用变频热泵/模块化应用优势!
  • 实用指南:OmniSteward:LLM Agent 赋能,语音文字随心控,智能家居与电脑的超级管家
  • 例子:vue3+vite+router创建多级导航菜单,菜单收缩展开优化
  • CF1984F Reconstruction
  • IDM超详细安装下载教程,一次安装免费使用 Internet Download Manager
  • 详细介绍:微信小程序开发实战指南(三)-- Webview访问总结
  • flask: 用flask-cors解决跨域问题
  • Linux小课堂: 用户管理与权限控制机制详解 - 实践
  • 分享一个MySQL万能备份脚本
  • 解码LVGL 布局与多界面编程
  • FreeSql自动分表
  • SAP SQL 加法不生效问题
  • 2025-11-12 早报新闻
  • linux版本微信打开关闭快捷键
  • Linux《网络基础》 - 教程
  • 如何构建可信智能 Data Agent?推荐 Aloudata Agent 分析决策智能体
  • Machine Learning - SVM Part 2: The Radial Kernel
  • redis stream介绍
  • Java 线性表、栈、队列和优先队列
  • 2025/11/11
  • 植物大战僵尸修改器下载教程:图文详解与实用技巧
  • 微服务——注册中心
  • 2025年软像套电缆订做厂家权威推荐榜单:补偿电缆/矿物质电缆/电力电缆源头厂家精选
  • 一些水题
  • list对象 集合 和 String 互转
  • 西林瓶灌装加塞机:驻马店适用,低噪运行约65分贝