一文上手skywalking【上】

一、skywalking预览

1.1 skywalking 概述


Apache SkyWalking, 适用于分布式系统的应用程序性能监控工具,专为微服务、云原生和基于容器的 (Kubernetes) 架构而设计。官方地址: https://skywalking.apache.org/
SkyWalking功能预览

  • 适用于分布式系统的应用程序性能监控工具,专为微服务、云原生和容器 (Kubernetes) 的架构而设计
  • 多数互联网公司里面用的技术,分布式架构下链路分析和性能定位最佳方案之一
  • 微服务架构下,链路性能和调用耗时分析是至关重要环节,Skywalking是必杀技之一
  • 在多数互联网公司中,Skywalking占有率很高,是近几年大量流行

1.2 为什么需要链路追踪?

观察下列链路调用关系,思考一下.
业务调用

  • 服务调用链路出现了问题怎么快速排查?
  • 服务调用链路耗时长怎么定位到是哪个服务?

分布式应用架构虽然满足了应用横向扩展的需求,但是运维和诊断的过程变得越来越复杂,例如会遇到接口诊断困难、应用性能诊断复杂、架构分析复杂等难题,传统的监控工具并无法满足,分布式链路系统由此诞生.

1.3 APM系统

Application Performance Management 【应用程序性能管理】, 简称APM系统.APM系统是可以对帮助系统的行为做性能分析的工具.APM系统,它是由谷歌公开的论文提到的,而到后面,许多的技术公司就基于这边论文的原理,开发出来很多出色的APM框架,比如:skywalking、zipkin等等.
skywalking是一款国产的开源框架,在2015年开源使用,在2017年的时候加入了Apache孵化器.skywalking是分布式应用程序的性能监控工具,专门是为了微服务(spring cloud)、云原生架构与容器架构(docker/k8s)而设计的.Skywalking作为APM工具,它具有分布式追踪、性能指标分析、应用和服务依赖分析等功能.
除了skywalking之外, Zipkin是由Twitter开源的链路分析分析工具,在springcloud sleuth得到了广泛的使用,具有轻量,部署简单的特点, 在实际开发当中也有着较为广泛的应用. 此次我们主要学习skywalking的基本用法.

二、skywalking环境搭建、配置

2.1 skywalking特点

skywalking具有多种监控手段,可以通过语言探针来获取监控数据.

  • 具有多种语言的自动探针。它包括了Java、net、node等
  • 具有轻量有高效的特点,不占用大量的服务器资源
  • 清晰的模块化,UI、存储、集群管理都有许多种机制供选择
  • 支持告警,具有优秀的可视化解决方案
  • 可以在多种环境下运行,例如:像注册中心Eureka和RPC dubbo等

2.2 skywalking整体架构

  • 注: 下图来源于官网
    skywalking架构
    整个架构分库四个部分,上下左右,这里考虑到描述更加简单直观,所以舍弃掉了Mtrics性能指标相关的东西,只关注Tracing链路相关功能.
  • 相关概念
  • skywalking-agent: 主要负责从应用程序中收集链路信息,然后把链路信息发送给skywalking OAP处理.OAP是指Observability Analysis Platform 即【可观测性分析平台】
  • skywalking OAP: 负责接收从skywalking-agent发送过来的Tracing数据信息,然后把数据信息给Analysis Core进行分析,把分析到的数据存储到外部的存储器当中,最后面把数据信息给Query Core提供查询数据的功能.
  • skywalking ui: 负责给用户查看链路等信息.
  • 上部分 Agent :负责从应用中,收集链路信息,发送给 SkyWalking OAP 服务器。目前支持 SkyWalking、Zikpin、Jaeger 等提供的 Tracing 数据信息。而我们目前采用的是,SkyWalking Agent 收集 SkyWalking Tracing 数据,传递给服务器。
  • 下部分 SkyWalking OAP :负责接收 Agent 发送的 Tracing 数据信息,然后进行分析(Analysis Core) ,存储到外部存储器( Storage ),最终提供查询( Query )功能。
  • 右部分 Storage :Tracing 数据存储。目前支持 ES、MySQL、Sharding Sphere、TiDB、H2 多种存储器。而我们目前采用的是 ES ,主要考虑是 SkyWalking 开发团队自己的生产环境采用 ES 为主。
  • 左部分 SkyWalking UI :负责提供控台,查看链路等等。

2.3 组件介绍

  • 数据存储,可以使用h2、mysql、es等
  • skywalking-OAP-server, 安装到服务器
  • skywalking ui
  • skywalking-agent 【由项目引入】

相关操作环境为centos7,也可以考虑使用虚拟机.

2.4 安装ES7

  • centos7
  • docker
mkdir -p /mydata/es/config
mkdir -p /mydata/es/data
chmod 777 -R /mydata/es
echo "http.host: 0.0.0.0" >> /mydata/es/config/elasticsearch.ymldocker run -d --name rj_es7 -p 9200:9200 -p 9300:9300 \-e "discovery.type=single-node" -e ES_JAVA_OPTS="-Xms256m -Xmx256m" \-v /mydata/es/config/elasticsearch.yml:/usr/share/elasticsearch/config/elasticsearch.yml \-v /mydata/es/data:/usr/share/elasticsearch/data \-v /mydata/es/plugins:/usr/share/elasticsearch/plugins elasticsearch:7.6.2

参数说明:

  • -e "discovery.type=single-node" 表示设置为设单节点启动
  • -e ES_JAVA_OPTS="-Xms128m -Xmx128m" 设置ES的初始内存和最大内存,如果云服务器内存足够大的情况下,可忽略,如果云服务器内存不宽裕,设置一下,防止ES启不来

安装成功之后,可以访问

http://your ip/_cat/nodes?v=true&pretty

es

2.5 安装skywalking-OAP-server

直接通过docker安装即可,如下所示:

docker run --name rj_oap --restart always -d -e TZ=Asia/Shanghai -p 12800:12800 -p 11800:11800 --link rj_es7 -e SW_STORAGE=elasticsearch7 -e SW_STORAGE_ES_CLUSTER_NODES=rj_es7:9200 apache/skywalking-oap-server:8.5.0-es7

参数说明

  • --link <name or id>:alias ,添加到另一个容器的链接,可以添加别名或者不加
  • --link后面的参数和elasticsearch容器名一致
  • SW_STORAGE=elasticsearch7 是固定写法,使用es7;
  • SW_STORAGE_ES_CLUSTER_NODES:rj-es7也可改为es服务器部署的Ip地址,比如ip:9200
  • 对于rj-es7这个容器名称,如果跟本文不同,则要修改为自己的es的容器名称

2.6 安装skywalking-ui

基于docker进行安装即可.

docker run -d --name rj_skywalking_ui \
--restart=always \
-e TZ=Asia/Shanghai \
-p 8080:8080 \
--link rj_oap \
-e SW_OAP_ADDRESS=rj_oap:12800 \
apache/skywalking-ui:8.5.0
  • 这里需要注意的是容器名称, 必须跟我们安装的oap容器名称匹配上.

安装完成之后,直接访问即可: ip:8080
skywalking-ui
查看es全部索引

http://ip:9200/_cat/indices?v=true&pretty

es索引

三、skywalking常见概念、性能指标说明

3.1 概念说明

示例图

  • 服务【service】

    • 就是服务,譬如说商品微服务
  • 实例【Instance】

    • 就是部署微服务的机器: 192.168.200.112
  • 端点【Endpoint】

    • 微服务对外提供的接口: /api/v1/user/list就是端点

3.2 性能指标

  • 用户的满意程度【service apdex】

    • 全称 Application Performance Index,最大值就是 1, 是一个不断优化的方向.
  • 分3个指标,T 值代表着用户对应用性能满意的响应时间界限或者说是期望值,假如T是0.5秒
  • 【满意】: 这样的响应时间让用户感到很愉快,响应时间少于 T 秒钟, 即 0.5秒内;
  • 【容忍】: 慢了一点,但还可以接受,继续这一应用过程,响应时间 T~4T 秒,即0.5~2秒内;
  • 【失望】: 太慢了,受不了了,用户决定放弃这个应用,响应时间超过 4T 秒,即大于2秒;
  • SLA
    • 服务等级协议,全称:service level agreement,为保障服务的性能和可用性
      • 9越多代表全年服务可用时间越长服务更可靠,候机时间越短
1= 365= 8760小时
99.9 = 8760 * 0.1% = 8760 * 0.001 = 8.76小时
99.99 = 8760 * 0.0001 = 0.876小时 = 0.876 * 60 = 52.6分钟
99.999 = 8760 * 0.00001 = 0.0876小时 = 0.0876 * 60 = 5.26分钟
根据以上的计算来看,只有全年停机5.26分钟,才能达到99.999%
  • CPM

    • 全称: call per minutes, 是吞吐量【throughput】指标, 每分钟请求调用的次数
  • RT

    • Response Time 表示请求响应时间,对于用户来说,响应时间最好不要超过2秒
  • Percent Response 百分位数统计

    • 表示采集样本中某些值的占比,skywalking 有 “p50、p75、p90、p95、p99” 等一系列值
    • 举例说明: “p99:360” 表示 99% 请求的响应时间在360ms以内

四、skywalking rocketbot ui介绍

4.1 skywalking ui控制栏

  • 仪表盘:查看被监控服务的运行状态
  • 拓扑图:以拓扑图的方式展现服务的关系
  • 追踪:以接口的形式查看调用链路
  • 性能剖析:对端点进行采样分析,分析性能瓶颈
  • 日志:可查看服务日志,包括我们自己打印的日志
  • 告警:触发告警的告警列表,包括了服务的失败率,超时等待
  • ui控制栏

4.2 Global

global

  • Services load:服务每分钟请求数
  • Slow Services:慢响应服务,单位ms
  • Un-Health services(Apdex): Apdex性能指标,1为满分
  • Slow Endpoint:慢响应端点,单位是ms
  • Global Response Latency:百分比响应延时,不同百分比的延时时间,单位ms
  • Global Heatmap:服务响应时间热力分布图,根据时间段内不同响应时间的数量显示颜色深度

4.3 Service

service

  • Service Apdex(数字):当前服务的性能评分
  • Service Apdex(折线图):不同时间的Apdex评分
  • Service Avg Response Times:平均响应延时,单位是ms
  • Service Response Time Percentile:百分比响应延时
  • Successful Rate(数字):请求成功率
  • Successful Rate(折线图):不同时间的请求成功率
  • Servce Load(数字):每分钟请求数
  • Servce Load(折线图):不同时间的每分钟请求数
  • Servce Instances Load:每个服务实例的每分钟请求数

4.4 Instance

instance

  • Service instance load:当前实例的每分钟请求数
  • Service Instance Successful Rate:当前实例的请求成功率
  • Service Instance Latency:当前实例的响应延时
  • JVM CPU:JVM占用CPU的百分比
  • JVM Memory:JVM内存占用大小,单位M
  • JVM GC Time:JVM垃圾回收时间,包含YGC和OGC
  • JVM GC Count:JVM垃圾回收次数,包含YGC和OGC
  • JVM Thread Count:JVM线程数量

监控CPU、内存等,Promethus是个更好的选择哦.

4.5 EndPoint

EndPoint

  • Endpoint Load in Current Service:每个端点的每分钟请求数
  • Slow Endpoints in Current Service:每个端点的最慢请求时间,单位ms【毫秒】
  • Successful Rate in Current Service:每个端点的请求成功率
  • Endpoint Load:当前端点每个时间段的请求数据
  • Endpoint Avg Response Time:当前端点每个时间段的请求行响应时间
  • Endpoint Response Time Percentile:当前端点每个时间段的响应时间占比
  • Endpoint Successful Rate:当前端点每个时间段的请求成功率

4.6 拓扑图

拓扑图

此页面当中,必须得有服务和数据之后才能查看到结果.

4.7 链路追踪

链路追踪

这里先提供数据之后才能展示出相关的结果.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/1549724.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

Humans or LLMs as the Judge? A Study on Judgement Bias

文章目录 题目摘要引言相关作品论法官的偏见实验方案结果与讨论欺骗LLM法官结论 题目 人类还是LLMs作为裁判&#xff1f;判断偏差研究 论文地址&#xff1a;https://arxiv.org/pdf/2402.10669 摘要 采用人类和大型语言模型(LLM)作为评估LLM性能的评判者(也称为人类和LLM-as-a…

Java语法-类和对象之抽象类和接口

1.抽象类 1.1 抽象类的概念 一个类中没有足够的信息来描述一个具体的对象,这样的类就是抽象类 比如: 从图中我们可以看出,只有继承了的类,我们产生的实例,调用的draw方法都是他们本身重写的draw方法,不会调用父类Shape的draw()方法,因此我们可以不管父类里面的draw()方法里面的…

第十四届蓝桥杯真题Java c组A.求和(持续更新)

博客主页&#xff1a;音符犹如代码系列专栏&#xff1a;蓝桥杯关注博主&#xff0c;后期持续更新系列文章如果有错误感谢请大家批评指出&#xff0c;及时修改感谢大家点赞&#x1f44d;收藏⭐评论✍ 【问题描述】 求1(含)至 20230408(含)中每个数的和。 【答案提交】 这是一道结…

24年下重庆事业单位考试报名超详细流程

&#x1f388;提交报考申请 考生通过重庆市人力资源和社会保障局官网&#xff08;rlsbj.cq.gov.cn&#xff09;“热点服务”中“人事考试网上报名”栏进行报名。报名时间为2024年8月12日9:00—8月17日9:00。 &#x1f388;网上缴费 资格初审合格后&#xff0c;考生应在2024年8…

flink设置保存点和恢复保存点

增加了hdfs package com.qyt;import org.apache.flink.api.java.functions.KeySelector; import org.apache.flink.api.java.tuple.Tuple2;import org.apache.flink.runtime.state.storage.FileSystemCheckpointStorage;import org.apache.flink.streaming.api.datastream.Dat…

精通推荐算法32:行为序列建模总结

1 行为序列建模总体架构 2 行为序列整体总结 用户行为序列建模是推荐算法中至关重要的一环&#xff0c;也是目前较为核心和前沿的研究方向。其主要分为短序列建模和长序列建模两大方向。短序列建模又主要分为池化和序列化两种方式&#xff0c;其中池化包括Sum-Pooling、Averag…

信道衰落的公式

对于天线&#xff1a; 对于天线的面积计算&#xff1a; 天线的接收功率密度&#xff1a; 天线的接收功率&#xff1a; 移动无线信道&#xff08;I&#xff09; (xidian.edu.cn)https://web.xidian.edu.cn/zma/files/20150710_153736.pdf 更加常用的考虑了额外的信道衰落pathlo…

甘肃辣椒油:舌尖上的热辣诱惑

&#x1f4a5;宝子们&#xff0c;今天必须要给你们安利甘肃食家巷的辣椒油&#x1f336;️&#xff01;✨甘肃辣椒油&#xff0c;那可是有着独特魅力的美食瑰宝&#x1f60d;。它以其鲜艳的色泽、浓郁的香气和醇厚的辣味&#xff0c;瞬间点燃你的味蕾&#x1f525;。&#x1f3…

《Spring Boot应用进阶:打造优雅的错误处理机制与全局异常拦截器》

文章目录 自定义异常类AppException封装业务有关的枚举类AppExceptionCodeMsg全局异常拦截器Handler响应类模板Resp案例展示 || Demo项目结构pom依赖DemoController实际执行结果 Demo案例Git地址 | Gitee 本文主要介绍自己在工作中在处理抛出异常类和封装响应类处理的模板总结。…

【matlab画多纵坐标图像】

一 、什么是多纵坐标图像 多纵坐标图像是一种在同一个坐标系中&#xff0c;使用多个纵坐标轴来表示不同的数据指标的图像。在多纵坐标图中&#xff0c;每个纵坐标轴可以有不同的刻度和单位&#xff0c;用于表示不同的数据范围。这样可以方便地比较不同指标的变化趋势&#xff0…

【C语言】单片机map表详细解析

1、RO Size、RW Size、ROM Size分别是什么 首先将map文件翻到最下面&#xff0c;可以看到 1.1 RO Size&#xff1a;只读段 Code&#xff1a;程序的代码部分&#xff08;也就是 .text 段&#xff09;&#xff0c;它存放了程序的指令和可执行代码。 RO Data&#xff1a;只读…

供应链 | 顶刊POMS论文精读:交易成本经济学(TCE)——供应链效率理论

编者按 供应链效率提升指南&#xff1a;不可不知的TCE理论视角 本文为Production and Operations Management 期刊论文&#xff0c;原文信息&#xff1a; Ketokivi, M., & Mahoney, J. T. (2020). Transaction cost economics as a theory of supply chain efficiency. …

自然资源部最新Nature正刊!!!

2024年8月21日&#xff0c;国际顶级期刊《Nature》发表了自然资源部第二海洋研究所李家彪院士为通讯作者&#xff0c;张涛为第一作者的论文“超慢速扩张加克洋中脊的高变化岩浆增生”。这一成果颠覆了国际海洋学术界半个多世纪以来一直认为的超慢速扩张洋中脊岩浆供给极度贫瘠的…

9.28 Qt界面

#include "widget.h"Widget::Widget(QWidget *parent): QWidget(parent) {this->setWindowTitle("Plane");this->setWindowIcon(QIcon("C:/Users/EDY/Desktop/递送发送.png"));QPushButton *btn1new QPushButton;this->setFixedSize(64…

[SAP ABAP] 锁对象

在SAP中使用锁对象&#xff0c;用于避免在数据库中插入或更改数据时出现不一致的情况 1.创建锁对象 数据准备 学校表(ZDBT_SCH_437) 使用事务码SE11创建锁对象 点击"锁对象"单选按钮&#xff0c;输入以E开头的锁定对象的名称&#xff0c;然后点击创建按钮 锁对象名…

施工现场安全帽监控预警#YOLO视觉 ai视频识别安全帽监测系统

在建筑工地上&#xff0c;安全始终是首要任务。为了提高工地安全&#xff0c;引入了安全帽监控预警系统&#xff0c;这是一项创新技术&#xff0c;利用人工智能和视频识别技术来监测工地上的安全帽佩戴情况。 这个系统的主要工作原理是在工地高危区域门口部署安全帽识别系统&a…

前端使用xlsx-js-style导出Excel,带样式,并处理合并单元格边框显示不全和动态插入表头解决

一、在学习之前&#xff0c;先给出一些学习/下载地址&#xff1a; xlsx-js-style下载地址 https://github.com/gitbrent/xlsx-js-style 或者 https://www.npmjs.com/package/xlsx-js-style SheetJS中文教程&#xff1a; https://xlsx.nodejs.cn/docs/csf/cell 二、先看样…

图文深入理解Oracle Network配置管理(二)

本篇图文深入介绍Oracle Network配置管理。 Oracle网络配置的目的 为了方便对Oracle 数据库进行管理&#xff0c;一般以下情况应该对Oracle进行网络配置。 • 在客户端对服务器端数据库进行管理&#xff08;网络客户端管理&#xff09; • 在一台服务器上管理多个数据库&…

fmql之Linux内核定时器

内容依然来自于正点原子。 Linux内核时间管理 内容包括&#xff1a; 系统频率设置节拍率&#xff1a;高节拍率的优缺点全局变量jiffies绕回的概念&#xff08;溢出&#xff09;API函数&#xff08;处理绕回&#xff09; HZ为每秒的节拍数 Linux内核定时器 内容包括&#xf…

基于python的爱心代码游戏实现 面试最常见问题(源码+内容介绍)

开头附上工作招聘面试必备问题噢~~包括综合面试题、无领导小组面试题资源文件免费&#xff01;全文6000干货。 工作招聘无领导小组面试全攻略最常见面试题&#xff08;第一部分&#xff09;共有17章可用于国企私企合资企业工作招聘面试面试必备心得面试总结资源-CSDN文库https…