当前位置: 首页 > news >正文

kettle插件-kettle数据清洗插件,轻松处理脏数据

前面我们已经介绍了很多kettle插件,每个kettle插件都它的使用场景,我们在做数据同步ETL的过程中,势必要处理一些脏数据,把数据质量提高。今天我们一起来学习这这款数据清洗插件。

1、转换设计

1)生成记录 模拟数据输入

2)数据清洗 选择具体的数据清洗规则对数据进行清洗

3)写日志 输出清洗前和清洗后的数据

8125eb43-3fce-42f6-abed-1e65f707ffeb

 2、生成记录

简单填写三个字段,id,engName,chnName,如下图所示

a2f0457e-34c7-4ea4-b065-8038913a88a3

 3、清洗插件设置

1)选择待清洗的插件

2)设置规则

3)根据需求填写输出字段名

从图中可以看到,这里预设了20多个常用的清洗规则,根据需求自行选择,不满足需求,可以进行扩展。

截屏2025-09-14 22.07.57

 4、保存&运行

保存转换文件,点击运行按钮,运行正常。

1)id 字段,规则不做任何操作,原样输出。

2)engName=xiaojigang,规则单词首字母大写,输出Xiaojingang。

3)chnName=小金刚,规则汉子转手拼,输出XJG。

 

写在最后

今天,我们团队已经研发了将近100+款插件,360度无死角覆盖常见的业务场景,朋友们,老铁们,你们还缺什么功能的kettle插件,欢迎评论区留言探讨。

 

http://www.zskr.cn/news/8560.html

相关文章:

  • Java 如何在 Excel 中添加超链接?使用 Spire.XLS for Java 轻松实现 - 教程
  • RocketMQ vs RabbitMQ vs Kafka - 教程
  • 实用指南:设计模式概述
  • web应用程详解part1
  • 软工第二次作业之个人项目——论文查重
  • 对实体类Id自增
  • 深入解析:InnoDB存储引擎-锁
  • 20231326王荣盛《密码系统设计》第二周预习报告
  • Gitflow 工作流程
  • 魔改chromium真正通杀全网debugger检测
  • 【截稿倒计时、高录用、稳检索】2025年教育创新与信息技术国际学术会议(EIIT 2025)
  • hashcat高效爆破Wi-Fi密码方法(比aircrack-ng快)
  • 更新到macOS Sequoia后,chrome无法用ip访问192.168.*
  • Typora标题自动显示序号,大纲中也显示序号
  • 【IEEE出版、格林威治大学主办】第六届信息科学与并行、分布式处理国际学术会议(ISPDS 2025)
  • 【2025-09-18】工作情绪
  • Ubuntu 系统部署 LNMP 环境详细教程(附shell脚本一键部署↓) - 指南
  • 详细介绍:7HTMLCSS高级
  • C++学习笔记之输入输出流 - 教程
  • 使用Inno Setup打包安装程序exe流程
  • XXL-JOB-源码分享(1)
  • WPF 字符竖向排列的排版格式(直排)表明控件
  • 深入解析:HSA35NV001美光固态闪存NQ482NQ470
  • YOLO实战应用 1YOLOv5 架构与模块
  • SpringBoot整合RustFS:全方位优化文件上传性能
  • windows使用es-client插件
  • AI学习日记 - 实践
  • es中的索引
  • VIVADO的IP核 DDS快速采用——生成正弦波,线性调频波
  • 深入解析:C语言---判断语句