【云原生】Prometheus监控Docker指标并接入Grafana

目录

一、前言

二、docker监控概述

2.1 docker常用监控指标

2.2 docker常用监控工具

三、CAdvisor概述

3.1 CAdvisor是什么

3.2 CAdvisor功能特点

3.3 CAdvisor使用场景

四、CAdvisor对接Prometheus与Grafana

4.1 环境准备

4.2 docker部署CAdvisor

4.2.2 docker部署CAdvisor服务

4.2.3 访问界面

4.2.4 访问metrics

4.3 配置Prometheus

4.3.1 修改Prometheus配置文件

4.3.2 重启Prometheus服务

4.3.3 访问Prometheus控制台

4.4 接入Grafana

4.4.1 Grafana官网找一个模板

4.4.2 Grafana配置dashboard模板

五、写在最后


一、前言

docker的规模化使用已经成为当下的趋势,尤其是云原生技术的发展让docker的重要性得到进一步的提升,使用docker部署一些常规的中间件非常方便,不仅大大降低了环境搭建的成本,也能够在一定程度上节省了不少的资源,但是随之而来,也同时出现另一个问题就是尽管docker部署方便,但是一旦机器上部署的docker容器越来越多,如何对它们进行监控呢,毕竟docker也是要吃机器资源的,本文将通过实际案例来说明下如何解决这个问题。

二、docker监控概述

2.1 docker常用监控指标

 

在监控Docker容器时,以下是一些常用的监控指标:

  • CPU使用率

    • 描述:容器的CPU使用百分比。

    • 用途:监控容器是否超出CPU资源限制,识别高负载问题。

  • 内存使用量

    • 描述:容器使用的内存总量和内存限制。

    • 用途:监控内存使用情况,防止内存泄漏或过度使用。

  • 网络流量

    • 描述:容器的网络流入和流出流量。

    • 用途:检测网络瓶颈或异常流量模式。

  • 磁盘I/O

    • 描述:容器的磁盘读写操作量。

    • 用途:监控磁盘性能,避免I/O瓶颈。

  • 文件系统使用量

    • 描述:容器文件系统的总使用空间和可用空间。

    • 用途:确保容器有足够的磁盘空间。

  • 容器状态

    • 描述:容器的运行状态(运行中、停止、重启等)。

    • 用途:监控容器的健康状态,识别崩溃或重启事件。

  • 进程数量

    • 描述:容器内部运行的进程数量。

    • 用途:检测进程异常,防止资源耗尽。

  • 容器日志

    • 描述:容器内部应用程序或系统产生的日志信息。

    • 用途:排查应用程序问题,查看错误和警告信息。

  • 运行时间

    • 描述:容器自启动以来的运行时间。

    • 用途:监控容器的稳定性和正常运行时间。

  • 负载平均值

    • 描述:容器的系统负载平均值。

    • 用途:评估系统负载情况,识别潜在的性能问题。

利用上面这些指标,可以帮助运维人员全面了解容器的健康状况和性能表现,从而进行有效的管理和优化。

2.2 docker常用监控工具

目前市面上也陆陆续续出现了不少关于docker的监控方案,下面列举一些docker常用监控工具

  • cAdvisor

    • Google开发的开源项目,用于收集、聚合、分析容器的资源使用和性能数据。

  • Prometheus

    • 开源的系统和服务监控系统,可与Grafana等配合使用,支持Docker容器的监控和告警。

  • Grafana

    • 开源的数据可视化和监控平台,支持多种数据源,可以与Prometheus等监控工具集成,用于实时监控和数据展示。

  • Datadog

    • 云监控和安全平台,提供Docker容器监控功能,支持自定义仪表盘、告警设置等。

  • Sysdig

    • 提供容器和云环境的监控解决方案,支持Docker和Kubernetes集成,提供实时和历史性能数据。

利用这些工具可以帮助管理员监视Docker容器的资源使用情况、性能指标、日志和事件,有助于优化和管理容器化环境。

三、CAdvisor概述

3.1 CAdvisor是什么

cAdvisor(Container Advisor)是一个由Google开发的开源项目,专为监控Docker容器而设计。它提供了容器级别的资源使用情况和性能指标,帮助用户深入了解每个运行中的容器的运行状态和资源消耗情况。

3.2 CAdvisor功能特点

CAdvisor具有下面的功能特点:

  • 资源使用情况监控

    • cAdvisor能够监控CPU、内存、磁盘和网络的使用情况,并提供实时的性能指标。

  • 容器级别视角

    • 与传统的宿主机监控工具不同,cAdvisor专注于每个独立容器的监控,提供更精细化的数据。

  • 跨平台支持

    • 支持多种容器运行时,如Docker和Kubernetes等,以及多种操作系统。

  • 轻量级和易集成

    • 作为一个轻量级的容器内部监控工具,cAdvisor可以与其他监控系统集成,如Prometheus和Grafana,实现更复杂的监控和报告。

  • Web界面和API支持

    • 通过Web界面和API,用户可以直观地查看和管理监控数据,支持数据的导出和自定义查询。

3.3 CAdvisor使用场景

cAdvisor广泛应用于容器化环境中,特别是Docker和Kubernetes集群中,用于实时监控和性能优化,其功能和特性使其在以下场景中特别有用:

  • 性能调优

    • 通过监控资源使用情况,帮助用户识别和解决性能瓶颈,优化容器应用的性能。

  • 资源管理

    • 确保容器在资源限制下正常运行,避免资源竞争和耗尽问题,提高整体资源利用率。

  • 容器健康检查

    • 监控容器的运行状态和行为,及时发现和处理异常情况,保证容器的可靠性和稳定性。

  • 集成与监控系统

    • cAdvisor作为一个轻量级的容器内部监控工具,能够与其他监控系统(如Prometheus和Grafana)集成,支持更复杂的监控需求和定制报告。

  • 实时监控和报告

    • 通过Web界面和API直观地查看和管理监控数据,支持数据的导出和自定义查询,帮助用户实时了解容器的运行状况和性能表现。

总体来说,cAdvisor为用户提供了深入了解和有效管理容器的能力,是现代容器化部署中不可或缺的重要组成部分。

四、CAdvisor对接Prometheus与Grafana

4.1 环境准备

  • prometheus服务;

    • 参考相关的资料提前部署prometheus;

  • grafana服务;

    • 参考相关的资料提前部署grafana;

  • docker环境;

    • 提前安装docker,可以再在docker中部署几个服务;

4.2 docker部署CAdvisor

为了能够获取到docker容器的运行状态,用户可以通过docker的stats命令获取到当前主机上运行的容器统计指标信息,有点像linux的top命令信息展示,通过这个命令可以查看容器的cpu利用率,内存使用量,网络IO以及磁盘IO等信息。

docker stats

除了使用命令外,还可以通过docker提供的HTTP api查看容器详细统计的监控信息。

4.2.2 docker部署CAdvisor服务

CAdvisor是Google开源的一款用于展示和分析容器运行状态的可视化工具,通过在主机上运行CAdvisor,用户可以轻松获取到当前主机上容器的运行统计信息,并以图表的形式向用户呈现。

执行如下的docker命令安装CAdvisor

docker run -d \
--name=cadvisor \
--volume=/:/rootfs:ro \
--volume=/var/run:/var/run:rw \
--volume=/sys:/sys:ro \
--volume=/var/lib/docker/:/var/lib/docker:ro \
--publish=8080:8080 \
google/cadvisor:latest

4.2.3 访问界面

容器启动成功后,可以在浏览器通过:IP:8080进行访问,效果如下

往下翻也可以看到一些更详细的图形化指标信息

4.2.4 访问metrics

CAdvisor也暴露了metrics的指标端点,可以在访问的url上添加/metrics查看,如下:

不难理解,既然暴露出了metrics的端点指标接口,就可以通过Prometheus接入之后进行监控

4.3 配置Prometheus

4.3.1 修改Prometheus配置文件

找到Prometheus的yml配置文件,在job的配置中添加CAdvisor的配置job信息,如下:  

- job_name: "cadvisor"scrape_interval: 10smetrics_path: '/metrics'static_configs:- targets: ["公网IP:8080"]

 

4.3.2 重启Prometheus服务

4.3.3 访问Prometheus控制台

浏览器访问Prometheus的监控页面,可以看到CAdvisor就接入进来了

也可以通过链接点进去进一步查看监控的指标信息,和上面看到效果是一致的

4.4 接入Grafana

如何将上述的指标信息更好的呈现出来呢,可以通过在Grafana上配置dashboard,从而以更直观的方式展现,下面看具体的操作步骤;

4.4.1 Grafana官网找一个模板

登录到Grafana官网,搜索docker,找一个关于docker的dashboard,拷贝模板ID,下面会用到:

Grafana dashboards | Grafana Labs

比如这里我拷贝的是11600这个模板ID

4.4.2 Grafana配置dashboard模板

添加导入一个模板

跳转到下面的界面之后,拷贝上面的ID到下面的框中

点击右侧的load按钮,跳转到下面的页面之后,选择本机的Prometheus

最后点击Import按钮进行加载,来到下面的监控页面

这个页面上清楚展示了主机上的容器信息,比如运行中的容器数量,具体某个容器的内存占用情况等,一目了然的可以直观的看到各类关于容器的指标信息。

 

五、写在最后

本文通过操作实践详细接受了使用prometheus监控docker的完整流程,如果正好你的项目中有使用到docker进行服务部署需要做监控的时,可以作为参考,本文到此结束感谢观看。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1474438.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Java 基础知识之 switch 语句和 yield 关键字

传统 switch 语句 传统的 switch 语句我们已经写了一万遍了,以下是一个典型的 switch 语句: int dayOfWeek 3; switch (dayOfWeek) {case 1:System.out.println("星期一");break;case 2:System.out.println("星期二");break;case…

【VUE基础】VUE3第一节—vite创建vue3工程

什么是VUE Vue (发音为 /vjuː/,类似 view) 是一款用于构建用户界面的 JavaScript 框架。它基于标准 HTML、CSS 和 JavaScript 构建,并提供了一套声明式的、组件化的编程模型,帮助你高效地开发用户界面。无论是简单还是复杂的界面&#xff0…

MPS---MPQ86960芯片layout设计总结

MPQ86960 是一款内置功率 MOSFET 和栅极驱动的单片半桥。它可以在宽输入电压 (VIN) 范围内实现高达 50A 的连续输出电流 (IOUT),通过集成MOSFET 和驱动可优化死区时间 (DT) 并降低寄生电感,从而实现高效率。 MPQ86960 兼容三态输出控制器,另…

ctfshow-web入门-文件上传(web151-web160)

目录 1、web151 2、web152 3、web153 4、web154 5、web155 6、web156 7、web157 8、web158 9、web159 10、web160 1、web151 试了下前端只能传 png 后缀的 将一句话木马改成 png 后缀,上传后用 burpsuite 抓包 绕过前端检测后,改回 php 后缀&am…

亚信安全发布2024年6月威胁态势,高危漏洞猛增60%

近日,亚信安全正式发布《2024年6月威胁态势报告》(以下简称“报告”),报告显示,6月份新增信息安全漏洞 1794个,高危漏洞激增60%,涉及0day漏洞占67.67%;监测发现当前较活跃的勒索病毒…

【python】python客户信息审计风险决策树算法分类预测(源码+数据集+论文)【独一无二】

👉博__主👈:米码收割机 👉技__能👈:C/Python语言 👉公众号👈:测试开发自动化【获取源码商业合作】 👉荣__誉👈:阿里云博客专家博主、5…

仿写Spring IOC

文章目录 IOC思路手写代码思路一些杂七杂八(可跳过) IOC思路 手写代码思路 手写代码的思路: 自定义一个MyAnnotationConfigApplicationContext,构造器中传入要扫描的包。获取这个包下的所有类。遍历这些类,找出添加了Component注…

智慧水利的变革之路:如何通过大数据、物联网和人工智能构建高效、智能、可持续的水利管理新模式

目录 一、引言:智慧水利的时代背景与意义 二、大数据:水利管理的数据基石 (一)数据收集与整合 (二)数据分析与挖掘 三、物联网:水利管理的感知神经 (一)智能感知与监…

14-22 剑和远方2 - 深度神经网络中的学习机制

概论 在第一部分中,我们深入探讨了人工智能的兴衰简史以及推动人工智能发展的努力。我们研究了一个简单的感知器,以了解其组件以及简单的 ANN 如何处理数据和权重层。在简单的 ANN 中,不会对数据执行特定操作。ANN 中的激活函数是一个线性函…

【面试八股文】java基础知识

引言 本文是java面试时的一些常见知识点总结归纳和一些拓展,笔者在学习这些内容时,特地整理记录下来,以供大家学习共勉。 一、数据类型 1.1 为什么要设计封装类,Integer和int区别是什么? 使用封装类的目的 对象化:…

MPC学习资料汇总

模型预测控制MPC学习资料汇总 需要的私信我~ 需要的私信我~ 需要的私信我~ 【01】课件内容 包含本号所有MPC课程的课件,以及相关MATLAB文档。 【02】课件源代码 本号所有MPC课程的源代码。 【03】MPC仿真案例 三个MPC大型仿真案例: 1)…

纯前端低代码开发脚手架 - daelui/molecule

daelui/molecule低代码开发脚手架:分子组件开发、预览、打包 页面代码示例、大屏代码示例预览 可开发页面组件 可开发大屏组件 项目git地址:https://gitee.com/daelui/molecule 在线预览:http://www.daelui.com/daelui/molecule/app/index.…

Codeforces Round 955 E. Number of k-good subarrays【分治、记忆化】

E. Number of k-good subarrays 题意 定义 b i t ( x ) bit(x) bit(x) 为 x x x 的二进制表示下 1 1 1 的数量 一个数组的子段被称为 k − g o o d k-good k−good 的当且仅当:对于这个子段内的每个数 x x x,都有 b i t ( x ) ≤ k bit(x) \leq k…

ubuntu24.04按关键字卸载不需要的apt包

使用的时候发现一个imagemagic无法正常读取文件,试图卸载 man apt经过尝试后,发现list的一个神奇关键字,用来显示已安装的软件包 sudo apt list --installed | grep image按image关键字过滤: 之后按软件名卸载即可 sudo apt pu…

30多款简洁个人博客网站网页模板演示学习

30多款个人博客个人网站divcss,html在线预览,静态页面模板免费下载.这些简洁和优雅的博客网页模板,为那些想成为创建博客的个人或媒体提供灵感设计。网页模板可以记录旅游、生活方式、食品或摄影博客等网站。 http://www.bokequ.com/blog/1/ http://www.bokequ.com/blog/2/ htt…

vue事件处理v-on或@

事件处理v-on或 我们可以使用v-on指令(简写)来监听DOM事件,并在事件触发时执行对应的Javascript。用法:v-on:click"methodName"或click"hander" 事件处理器的值可以是: 内敛事件处理器&#xff1…

无人机有哪些关键技术?

一、控制技术 无人机的核心还是在控制上,飞控系统的可靠性、稳定性及可扩展性是其中重要的指标。可靠性上,除了器件选型之外,目前主要靠多余度来增加;稳定性主要体现在多场景下仍能保持良好的工作状态,主要靠算法来进…

轻松创建对象——简单工厂模式(Java实现)

1. 引言 大家好,又见面了!在上一篇文章中,我们通过Python示例介绍了简单工厂模式,今天,我们继续深入这个话题,用Java来实现简单工厂模式。 2. 什么是简单工厂模式 简单工厂模式(Simple Facto…

6、Redis系统-数据结构-04-Hash

四、哈希表(Hashtable) 哈希表是一种高效的键值对数据结构,通过散列函数将键映射到表中的位置,实现快速的插入、删除和查找操作。Redis 广泛使用哈希表来实现 Hash 对象和数据库的键值存储。以下将从结构设计、哈希冲突与链式哈希…

力扣考研经典题 反转链表

核心思想 头插法: 不断的将cur指针所指向的节点放到头节点之前,然后头节点指向cur节点,因为最后返回的是head.next 。 解题思路 1.如果头节点是空的,或者是只有一个节点,只需要返回head节点即可。 if (head null …