当前位置: 首页 > news >正文

python学习第十三天(自用)

数据清洗

查看缺失值,若有缺失就是True,isnull()

删除缺失值,索引为4的结果消失了,删除缺失值所在行,dropna

删除缺失值所在列,所在城市这一列直接消失了,dropna

填充缺失值

指定填充值,fillna

用前一行数据填充,ffill

用后一行数据填充‘,bfill

查看重复值,duplicated

指定列查看重复值,duplicated(),subset用来指定列

根据目标列删除重复值,drop_duplicates,默认保留第一个重复值

Keep表示保留哪一个值,first/last/false,第一个/最后一个/全都删了

异常值处理

可以看到单价有-29的,属于异常数据

查看异常值,就是过滤

删除异常值,传入索引以删除目标值,可以看到索引为6的值消失了,drop(.index)

修复异常值,这里取绝对值来修改结果

数据格式处理,看到这里的订单日期与正常格式不同,需要处理格式

这里的replace是整体替换,没办法这样局部替换

因此可以利用series的str方法将这列转为字符串,然后利用字符串的replace方法来替换,会统一的进行替换,发现替换成功

数据排序与分组

排序sort_values,ascending表示升序

多列排序,列表与列表之间一一对应,只有前一个值完全相同才会按照后面的进行排序

数据分组操作

将数据按照不同的特征进行分组,其中想要一次性进行分组操作可以使用agg来进行统一操作,groupby就是将目标内容分组

统计行数,即按目标列统计个数,count

指定目标列,选择没有缺失值的列才能统计正确,随便选哪列都可以,因为是统计数量,只要没有缺失值,那么都是一样的

统计内容和,sum,将相同的内容的目标值进行累加计算

综合运用统计金额数,先添加新的列,然后再统计累加

统计最小值,min

统计最大值,max

统计平均值,mean

综合,agg,将要统计的目标填入agg里,以列表的形式填入,返回的表格将会按照你填的内容进行排版

统计多列的内容,以字典的形式传入

Matplotlib介绍,将我们统计好的数据进行可视化的转化的工具,就是画图工具

绘制折线图,x要和y一一对应

Matplotlib图标详情

上述的名词介绍也就对应了方法

设置画布,figure,一定要在plot之前设置画布,因为plot会默认给你生成画布,你在后面生成则会生成一个新的画布

标题设置,title,也可以设置字体大小

其中要设置中文题目还要配置好项目,否则就是乱码

设置x轴标签,y轴标签

X轴刻度较为稀疏,没办法详细看具体数据,因此可以设置刻度,xtick

也可以隔一个刻度展示一下,因为x是列表,所以可以进行切片操作

设置y的刻度

绘制网格线,grid,也可以自定义表格样式

绘制双折线,就是再创建一个y轴数据,然后再绘制即可

显示图例,就是给线标上名字,让人知道哪条是哪条线,但这样是一一对应显示的,就是第一个创建的对应第一个,修改起来很麻烦

推荐方法,为曲线加上标签label以便于区分,并且legend也无需指定内容,图例可以指定位置,legend具有loc方法可以改变位置

柱状图

创建子图,就是创建两个图,nrows代表行,1就是1行,如果为2,那么就是相当于在中间砍一刀,然后均分。ncols代表列,这里2表示2列,就是竖着切一刀,然后axes接收到的是返回的数组,因此访问不同的图可以利用列表的访问形式来访问

其中bar就是柱状图,pie就是饼状图

Dpi是像素值

子图的设置

添加数据

设置图表属性

http://www.zskr.cn/news/1450401.html

相关文章:

  • 如何用Obsidian笔记模板快速搭建个人思考系统:5步告别信息混乱
  • 岳阳母婴除甲醛CMA甲醛检测治理公司2026深度测评:森氧家环保稳居榜首 - 诚信金利回收
  • Quartus II 13.0 保姆级安装与和谐指南(附Cyclone器件库配置)
  • 3种方法突破平台限制:WorkshopDL一站式跨平台Steam创意工坊下载终极指南
  • 工业机器人运动控制工程师晋升CTO都要经历哪些职位和薪资?
  • 从SQL到自然语言分析只差1个API?:揭秘OpenAI Function Calling + DuckDB + Streamlit 实现分钟级AI分析看板的完整链路
  • 终极音乐歌词解决方案:告别听歌没歌词的烦恼
  • SpringBoot+Vue 在线拍卖系统 | 毕业设计完整源码 | 前后端分离
  • 上饶CMA甲醛检测治理公司深度测评:绿居净环保稳居榜首 - 五金回收
  • 【电赛保姆级教程】只会红外循迹?小车/无人机自主导航与激光雷达避障硬核避坑指南(附里程计源码)
  • Windows 11自带的Hyper-V到底香不香?实测对比VMware,聊聊我的真实体验
  • ppt模板_0064_黑色方格
  • XR新手避坑指南:手把手配置Unity Locomotion System,解决移动眩晕和碰撞失效
  • ppt模板_0065_黑色绿带
  • 云浮母婴除甲醛CMA甲醛检测治理公司深度测评:清醛卫士稳居榜首 - 诚信金利回收
  • 苹果WWDC 2026前瞻:Siri AI终于要翻身了?iOS 27这些新功能太炸了
  • WindowsCleaner:让C盘重获新生的智能系统管家
  • 从编辑器到游戏:揭秘Godot拖放API的3个实战坑与高效避坑指南
  • 模型推理为什么一上 Grouped Query Attention 就开始显存更省却注意力质量下降:从 KV Head Share 到 Attention Preserve 的工程实战
  • 备战蓝桥杯国赛【Day 24】
  • 利用大模型 SSE 流式输出优化 v0自动生成前端界面的应用落地交互体验的延迟调优策略
  • 2026Q2全国浮叶植物供应基地综合实力排行:人工浮岛、水生植物种植基地、水生植物种植施工、沉水植物、浮岛种植水生植物选择指南 - 优质品牌商家
  • 浏览器音乐解锁工具:3分钟解决你的加密音乐播放难题
  • 焦作母婴除甲醛CMA甲醛检测治理公司2026深度测评:森氧家环保稳居榜首 - 五金回收
  • 【顶刊】基于ESO+MFPCC+ADRC,二阶三阶ESO扩展状态观测器的PMSM驱动器无模型预测电流电机控制算法
  • 2026年薪酬设计五步法:从零搭建公平激励体系
  • 【Redis从入门到精通】第37篇:Redis服务器启动全流程——从redis-server到ready to accept
  • WarcraftHelper完整使用教程:魔兽争霸3性能优化终极指南
  • 打破音乐枷锁:3分钟掌握开源音频解密核心技术
  • Linux 组调度的 cfs_bandwidth 结构体:带宽控制的核心配置