当前位置: 首页 > news >正文

保姆级教程:从零到一,用Prometheus+Grafana监控你的Linux服务器、MySQL和Redis

零基础搭建企业级监控系统:Prometheus+Grafana实战指南

当你第一次面对服务器监控任务时,是否曾被各种指标、端口和配置文件搞得晕头转向?别担心,本文将带你从零开始,用Prometheus和Grafana构建一套完整的监控系统,覆盖Linux服务器、MySQL和Redis三大核心组件。不同于简单的工具堆砌,我们将深入每个配置背后的原理,让你真正掌握监控系统的搭建精髓。

1. 环境准备与基础架构解析

在开始安装之前,我们需要先理解Prometheus和Grafana的协作机制。Prometheus作为时序数据库数据采集器,负责从各个目标收集指标数据;而Grafana则是可视化平台,将枯燥的数字转化为直观的图表。

典型监控架构组成

  • 数据采集层:各类Exporter(node_exporter、mysqld_exporter等)
  • 存储计算层:Prometheus Server
  • 展示层:Grafana
  • 告警层:Alertmanager(本文暂不涉及)

对于CentOS 7系统,需要特别注意以下前置条件:

# 确保系统已安装基础工具 sudo yum install -y wget tar vim

提示:生产环境建议使用专用用户运行监控服务,而非直接使用root

2. Prometheus服务端部署详解

2.1 二进制安装与验证

从官网下载最新稳定版(当前为2.25.0):

wget https://github.com/prometheus/prometheus/releases/download/v2.25.0/prometheus-2.25.0.linux-amd64.tar.gz tar xf prometheus-2.25.0.linux-amd64.tar.gz -C /usr/local mv /usr/local/prometheus-2.25.0.linux-amd64 /usr/local/prometheus

验证安装是否成功:

/usr/local/prometheus/prometheus --version # 应输出类似内容: # prometheus, version 2.25.0 (branch: HEAD, revision: a6be548...)

2.2 核心配置文件解析

prometheus.yml是核心配置文件,主要包含三大模块:

配置段作用关键参数示例
global全局设置scrape_interval: 15s
rule_files告警规则文件- "first_rules.yml"
scrape_configs监控目标定义targets: ['localhost:9090']

一个最小化的监控自身配置示例:

global: scrape_interval: 15s evaluation_interval: 15s scrape_configs: - job_name: 'prometheus' static_configs: - targets: ['localhost:9090']

2.3 系统服务化配置

创建systemd服务文件/etc/systemd/system/prometheus.service

[Unit] Description=Prometheus Monitoring System After=network.target [Service] User=prometheus Group=prometheus ExecStart=/usr/local/prometheus/prometheus \ --config.file=/usr/local/prometheus/prometheus.yml \ --storage.tsdb.path=/var/lib/prometheus/data \ --web.listen-address=:9090 Restart=on-failure [Install] WantedBy=multi-user.target

启用服务:

sudo systemctl daemon-reload sudo systemctl start prometheus sudo systemctl enable prometheus

3. 监控Linux主机实战

3.1 node_exporter部署

node_exporter是采集主机指标的官方组件,安装步骤如下:

wget https://github.com/prometheus/node_exporter/releases/download/v1.1.2/node_exporter-1.1.2.linux-amd64.tar.gz tar xf node_exporter-*.tar.gz -C /usr/local/ mv /usr/local/node_exporter-* /usr/local/node_exporter

创建专用用户并设置权限:

useradd -M -s /bin/false prometheus chown -R prometheus:prometheus /usr/local/node_exporter

3.2 配置systemd服务

创建/etc/systemd/system/node_exporter.service

[Unit] Description=Node Exporter After=network.target [Service] User=prometheus ExecStart=/usr/local/node_exporter/node_exporter \ --collector.systemd \ --collector.systemd.unit-whitelist="(docker|sshd|nginx).service" Restart=on-failure [Install] WantedBy=multi-user.target

关键参数说明:

  • --collector.systemd:启用systemd服务监控
  • --collector.systemd.unit-whitelist:指定监控的服务列表

3.3 Prometheus服务发现配置

修改prometheus.yml添加新job:

scrape_configs: - job_name: 'node' static_configs: - targets: ['192.168.1.100:9100'] labels: instance: 'web-server-01' env: 'production'

重启Prometheus后,可以通过http://<prometheus-ip>:9090/targets验证状态。

4. MySQL监控方案实现

4.1 mysqld_exporter安装

wget https://github.com/prometheus/mysqld_exporter/releases/download/v0.12.1/mysqld_exporter-0.12.1.linux-amd64.tar.gz tar xf mysqld_exporter-*.tar.gz -C /usr/local/ mv /usr/local/mysqld_exporter-* /usr/local/mysqld_exporter

4.2 数据库权限配置

创建监控专用账户:

CREATE USER 'exporter'@'localhost' IDENTIFIED BY 'StrongPassword' WITH MAX_USER_CONNECTIONS 3; GRANT PROCESS, REPLICATION CLIENT, SELECT ON *.* TO 'exporter'@'localhost';

配置文件/usr/local/mysqld_exporter/.my.cnf

[client] user=exporter password=StrongPassword

4.3 启动与验证

/usr/local/mysqld_exporter/mysqld_exporter \ --config.my-cnf=/usr/local/mysqld_exporter/.my.cnf \ --web.listen-address=:9104

在Prometheus中添加配置:

- job_name: 'mysql' static_configs: - targets: ['192.168.1.100:9104'] labels: db_role: 'master'

5. Redis监控配置指南

5.1 redis_exporter部署

wget https://github.com/oliver006/redis_exporter/releases/download/v1.15.0/redis_exporter-v1.15.0.linux-amd64.tar.gz tar xf redis_exporter-*.tar.gz -C /usr/local/ mv /usr/local/redis_exporter-* /usr/local/redis_exporter

5.2 启动参数说明

/usr/local/redis_exporter/redis_exporter \ -redis.addr redis://192.168.1.100:6379 \ -web.listen-address :9121

如果Redis需要认证:

-redis.addr redis://:password@192.168.1.100:6379

5.3 Prometheus集成

- job_name: 'redis' static_configs: - targets: ['192.168.1.100:9121'] labels: redis_mode: 'standalone'

6. Grafana可视化配置艺术

6.1 安装与初始化

sudo yum install -y https://dl.grafana.com/oss/release/grafana-7.5.7-1.x86_64.rpm sudo systemctl start grafana-server sudo systemctl enable grafana-server

访问http://<server-ip>:3000,默认账号admin/admin。

6.2 数据源配置

  1. 左侧菜单 → Configuration → Data Sources
  2. 选择Prometheus
  3. URL填写http://localhost:9090
  4. 点击Save & Test验证连接

6.3 仪表板导入推荐

以下是经过验证的优秀仪表板:

监控对象Dashboard ID特点
Linux主机8919全面的系统指标展示
MySQL7362包含查询性能分析
Redis11835可视化命令统计

导入方法:

  1. 左侧菜单 → Create → Import
  2. 输入Dashboard ID
  3. 选择对应的Prometheus数据源

7. 生产环境优化建议

7.1 安全加固措施

  • 为Prometheus和Grafana配置HTTPS
  • 使用防火墙限制访问IP
  • 为各组件配置独立运行账户

7.2 性能调优参数

# prometheus.yml优化示例 global: scrape_interval: 30s evaluation_interval: 30s scrape_timeout: 10s storage: tsdb: retention: 30d wal_compression: true

7.3 常见问题排查

Grafana面板无数据?

  1. 检查Prometheus目标状态(Status → Targets)
  2. 验证时间范围选择是否正确
  3. 确认指标名称是否匹配

node_exporter指标不全?

  1. 检查启动参数是否启用了对应收集器
  2. 查看/metrics端点输出
  3. 检查SELinux和防火墙设置

在实际运维中,我发现最耗时的往往不是搭建过程,而是后期的指标梳理和告警规则配置。建议先从小范围���点开始,逐步完善监控体系。

http://www.zskr.cn/news/1463936.html

相关文章:

  • AI驱动简历优化实战手册(附GPT-4+ATS双校验工作流)
  • MoveIt与Gazebo联调避坑指南:详解`follow_joint_trajectory` Action连接失败的全流程排查
  • 2026年当下,剖析北京化妆师培训市场:谁才是靠谱之选? - 2026年企业资讯
  • AI - MCP(Model Context Protocol,模型上下文协议)
  • Matlab图像修复三法实操:插值/OMP/K-SVD一键对比与结果图自动生成
  • 查看mysql数据库容量大小方法
  • 【普中STM32F1xx开发攻略--标准库版】-- 第 43 章 触摸屏实验
  • 2026年潍坊市可靠的智能装车机实力厂家业内推荐与选购解析 - 2026年企业资讯
  • MIT 6.1810: xv6 book Chapter5: Page faults 笔记
  • 别再用API硬连AI工具了!信贷中台智能编排引擎(IPA)上线72小时内完成OCR/NLP/评分卡全链路自治闭环
  • 2026 年跨境行业全新变局,亚马逊、tiktok、Shopee、速卖通迎来合规整改。 - Zhou6
  • 告别PHP 5!CentOS 7下用Remi仓库一键升级PHP 8.2(附Apache/Nginx重启命令)
  • 保姆级教程:用Hugging Face Transformers库快速上手TabTransformer(PyTorch版)
  • 欧盟Chat Control提案与社交机器人隐私风险分析
  • 影刀RPA店群自动化运维实战:Python协同异常聚类与根因定位系统设计
  • 手把手教你用Dell服务器主板自带SATA控制器组Raid(无阵列卡版)
  • 用 LLM 做自动化测试,结果 AI 自己修改了数据库生产数据——沙箱没做好
  • 2026年涂塑复合钢管按需定制靠谱吗 - mypinpai
  • 2026年IOS版乘务派班系统口碑,哪家好 - mypinpai
  • 015、Analog Gain vs Digital Gain:两种增益的噪声差异与工程应用边界
  • Django学生管理实战项目:考勤+成绩双功能系统(含MySQL建表脚本与完整源码)
  • Graph RAG 社区检测跑了一周没出结果:参数 explosion 的惨痛教训
  • 《剑与翼》官方手游正版下载指南:新手快速安装入坑!
  • 互联网的顶级指挥官:不只会“翻译”的 DNS 到底有多强大?
  • 告别Logcat丢失!手把手教你用NDK C++封装一个带文件回滚的日志库(支持Android Studio)
  • 2026年阳离子交换树脂多少钱?河北利江生物价格合理 - mypinpai
  • Vatee:从公开信息出发,归纳多语言支持与市场覆盖
  • 华为健康数据终极转换指南:3步解锁TCX文件,让运动数据自由流动
  • 2026年,口碑好的资质齐全的美术艺考培训机构排名 - mypinpai
  • 2026 年深圳全屋定制上门测量报价全攻略:这样做不花冤枉钱 - 产品测评官