文章目录
- 模块一:AI 基础设施与虚拟化底座(零基础·全景版)
- 📚 模块导论:什么是 AI 运维?
- 第一部分:硬件认知篇(懂原理,知敬畏)
- 第二部分:系统部署篇(会操作,能落地)
- 第三部分:虚拟化进阶篇(提效率,控成本)
- 第四部分:网络与存储篇(通血脉,保数据)
- 第五部分:综合实战篇(验成果,练面试)
- 🎓 模块结业标准
模块一:AI 基础设施与虚拟化底座(零基础·全景版)
课程总时长预估:40-50 学时(含实验)
教学目标:让零基础学员不仅能“看懂”AI 服务器,还能独立完成“上架—部署—虚拟化—交付”的全流程,达到企业初级 AI 运维工程师的入职标准。
📚 模块导论:什么是 AI 运维?
核心概念:解释为什么传统的 Linux 运维不够用了?
- 区别:传统运维管“服务可用性”,AI 运维管“算力利用率”和“训练成功率”。
- 痛点:算法同学说“代码跑不起来”、“训练太慢”、“显存爆了”,你需要能独立排查硬件、驱动、虚拟化和资源分配问题。
- 职业路径:IT 运维 -> 云计算运维 ->AI 基础设施运维 (AI Infra)。
第一部分:硬件认知篇(懂原理,知敬畏)
教学重点:消除对昂贵硬件的陌生感,建立“算力即资产”的概念。
| 序号 | 课程名称 |
|---|