IT系统可观测性

在这里插入图片描述

什么是可观测性

可观测性(Observability)是指能够从系统的外部输出推断出系统内部状态的能力。在IT和云计算领域,它涉及使用软件工具和实践来收集、关联和分析分布式应用程序以及运行这些应用程序的硬件和网络产生的性能数据流。这样做可以更高效地监控、诊断和调试应用程序和网络,满足客户体验期望、服务级别协议(SLA)和其他业务需求。

可观测性通常关注三种主要的遥测数据类型:

  1. 日志:记录应用程序事件的详细时间戳记。
  2. 指标:基本测量数据,如内存使用量或CPU容量。
  3. 跟踪:记录每个用户请求的端到端过程。

通过这些数据,团队可以更有效地监控现代系统,找到并解决问题的根本原因,从而提高系统性能。可观测性的实践对于云原生环境中的应用开发和运维尤为重要,因为它们支持快速迭代和动态部署的需求。

可观测性开源工具有哪些

可观测性的开源软件工具有很多,这里是一些例子:

  1. HoloInsight:蚂蚁集团开源的智能可观测平台,提供日志监控、业务指标监控和AIOps的前沿探索。
  2. Prometheus:一个开源监控解决方案,提供强大的指标、洞察力和警报。
  3. OpenTelemetry (OTel):一个供应商中立的开源可观察性框架,用于检测、生成、收集和导出遥测数据。
  4. Jaeger:一个开源的端到端分布式跟踪平台,帮助进行分布式事务监控和性能优化。
  5. Grafana:一个开放的监控和可观察性平台,可帮助可视化数据。
  6. ELK Stack:由Elasticsearch、Logstash和Kibana组成的强大的Kubernetes可观察性工具组合。
  7. Fluentd/Fluent Bit:一个开源项目,旨在将不兼容的日志记录格式和过程转换为统一的日志记录层。
  8. Kindling:一个基于eBPF的云原生可观测性开源工具,帮助用户理解应用从内核层到代码层的行为。
  9. OpenObserve:一个开源的云原生可观测性平台,显著降低运营成本,并提高了易用性。

这些工具可以帮助团队更有效地监控和管理系统,提高可观测性和故障排查的能力。选择哪个工具取决于具体的需求和环境。你可以访问它们的官方文档或社区,了解更多关于安装和使用的信息。

全新的可观测开源组件grafana agent

Grafana Agent 是一个灵活、高性能的遥测数据收集器,它与多个生态系统兼容,如 Prometheus 和 OpenTelemetry。它的主要功能包括:

  • 收集数据:可以收集指标、日志、追踪和连续性分析数据。
  • 数据转换:能够对收集的数据进行处理和转换。
  • 数据发送:将处理后的数据发送到 Prometheus 生态系统、OpenTelemetry 生态系统以及 Grafana 开源生态系统(如 Loki、Grafana、Tempo、Mimir、Pyroscope)。
  • 编程观测性管道:通过组件连接,形成可编程的观测性管道,用于遥测数据的收集、处理和传递。
  • 灵活性和性能:设计上注重灵活性和性能,支持在多种平台上部署,包括 Linux、Windows 和 macOS。

Grafana Agent 提供了多种运行模式,包括静态模式、Kubernetes 操作员模式和流模式,每种模式都有其特定的功能和使用场景。此外,Grafana Agent 还支持与 Grafana Cloud 的集成,提供官方的供应商支持和云集成选项²。它是一个“电池包含”的解决方案,意味着它预装了与多个系统(如 MySQL、Kubernetes 和 Apache)集成的功能,可以立即提供有用的遥测数据。

与grafana agent集成的服务

Grafana Agent 通常与多种服务集成,以便收集和发送遥测数据。这些服务包括但不限于:

  • Apache HTTP: 收集Apache服务器的性能指标。
  • Node Exporter: 从Unix系统收集硬件和操作系统指标。
  • Process Exporter: 监控系统进程的资源使用情况。
  • MySQLD Exporter: 从MySQL服务器收集数据库性能指标。
  • Redis Exporter: 从Redis实例收集性能指标。
  • Elasticsearch Exporter: 从Elasticsearch集群收集性能指标。
  • Memcached Exporter: 从Memcached服务器收集性能指标。
  • MSSQL: 从Microsoft SQL Server收集数据库性能指标。
  • Postgres Exporter: 从PostgreSQL数据库收集性能指标。
  • SNMP Exporter: 通过简单网络管理协议收集网络设备的指标。
  • Consul Exporter: 从Consul服务网格收集服务发现和配置数据。
  • Windows Exporter: 从Windows系统收集性能指标。
  • Kafka Exporter: 从Apache Kafka集群收集性能指标。
  • MongoDB Exporter: 从MongoDB数据库收集性能指标。
  • CloudWatch Exporter: 从Amazon CloudWatch收集云资源的指标。
  • Azure Exporter: 从Microsoft Azure收集云资源的指标。
  • GCP Exporter: 从Google Cloud Platform收集云资源的指标。

Grafana Agent 的具体角色和任务包括:

  • 收集: 从集成的服务中收集遥测数据,如指标、日志、追踪和性能剖析数据。
  • 转换: 处理和转换收集到的数据,以便它们可以被后端系统理解和存储。
  • 发送: 将处理后的数据发送到不同的目的地,如Prometheus、OpenTelemetry和Grafana开源生态系统(例如Loki、Grafana、Tempo、Mimir、Pyroscope)。
  • 配置: 提供灵活的配置选项,允许用户根据自己的需求定制数据收集和处理的行为。
  • 扩展: 支持通过插件和集成来扩展功能,以便与更多的服务和应用程序集成。

Grafana Agent 的设计旨在灵活、高效,并且与多种生态系统兼容,使其成为一个功能丰富、性能优异、不受供应商限制的遥测数据收集器。它可以部署在任何数量的机器上,收集数百万个活跃序列和TB级别的日志,是一款经过实战测试的工具。

grafana agent和tempo分工

grafana tempo
Grafana Agent 和 Grafana Tempo 是 Grafana 生态系统中的两个不同组件,它们在追踪数据的处理和管理方面有不同的职责:

Grafana Agent:

  • 它是一个轻量级的遥测数据收集器,专门设计用于收集指标、日志和追踪数据。
  • Grafana Agent 可以配置为接收来自多种系统的追踪数据,例如 Jaeger、Kafka、OpenCensus、OTLP 和 Zipkin。
  • 它使用与 Prometheus 相同的经过实战检验的代码,并且可以节省内存使用。
  • Grafana Agent 支持将收集到的追踪数据发送到不同的后端,包括 Grafana Tempo。

Grafana Tempo:

  • Tempo 是一个易于操作、高规模且成本效益高的分布式追踪系统。
  • 它只需要对象存储来运行,并且与 Grafana、Mimir、Prometheus 和 Loki 深度集成。
  • Tempo 用于存储和查询追踪数据,支持开源追踪协议,如 Jaeger、Zipkin 或 OpenTelemetry。

简而言之,Grafana Agent 主要负责收集和转发追踪数据,而 Grafana Tempo 则专注于追踪数据的存储和查询。Agent 可以将数据发送到 Tempo,但 Tempo 负责管理这些数据的长期存储和检索。
在这里插入图片描述
在这里插入图片描述

其他开源追踪工具

Jaeger

Jaeger 是一个开源的分布式追踪系统,它主要用于监控和故障排除微服务架构中的事务。Jaeger 可以帮助开发者理解服务之间的请求流程,找出性能瓶颈,以及优化系统的可靠性。它通过图形化的方式展示服务调用的轨迹,使得开发者能够快速定位问题所在。

Jaeger 的主要特点包括:

  • 分布式上下文传播:追踪请求在不同服务之间的流转。
  • 事务监控:记录事务的详细信息,包括调用时间和结果。
  • 性能分析:分析每个服务的响应时间,识别性能瓶颈。
  • 错误分析:记录错误信息,帮助快速定位故障原因。
  • 服务依赖分析:展示服务之间的依赖关系,帮助理解系统架构。

Jaeger 支持多种数据收集和存储方式,兼容 OpenTracing API,适用于各种规模的微服务系统。它是云原生计算基金会(CNCF)的一部分,由 Uber 开源,并得到了广泛的社区支持和贡献。Jaeger 的设计目标是提供一个易于使用、可扩展的追踪系统,以适应现代软件应用的需求。

Zipkin

Zipkin 是一个开源的分布式追踪系统,它帮助收集服务架构中的定时数据,以解决延迟问题。Zipkin 的特点包括数据的收集和查询,它允许你通过跟踪 ID 直接跳转到特定的追踪信息,或者基于服务、操作名称、标签和持续时间等属性进行查询。

主要功能包括:

  • 数据收集:收集微服务架构中的请求和事件数据。
  • 数据查找:通过跟踪 ID 或其他条件查询追踪数据。
  • 性能分析:分析服务调用的时间,识别延迟问题。
  • 错误分析:汇总错误信息,帮助定位问题。
  • 依赖关系图:展示服务之间的调用关系和请求流量。

Zipkin 支持多种数据上报方式,如 HTTP 或 Kafka,并且可以与多种后端存储系统集成,例如 Apache Cassandra 或 Elasticsearch。它通常需要与应用程序进行“instrumentation”配置,以报告追踪数据到 Zipkin。这使得 Zipkin 成为微服务架构中识别性能问题的重要工具。

关于eBPF非侵入式监控

开源eBPF工具有很多,它们提供了不同的功能来帮助进行系统性能分析、监控和安全。以下是一些流行的开源eBPF工具:

  • Tracee: 用于实时监控系统调用和其他系统事件的轻量级追踪工具。
  • bpftrace: 高级追踪工具和语言,用于采集内核和程序运行信息并展示。
  • Falco: 用于检测异常活动的开源系统行为监控程序。
  • Cilium: 提供网络连接和应用程序工作负载之间的负载平衡和透明保护。
  • Katran: Facebook开源的高性能第4层负载均衡器。
  • Elkeid: 字节跳动开源的内核事件捕获工具。
  • kubectl-trace: kubectl插件,帮助用户在Kubernetes集群中安排执行BPF程序。
  • Kindling: 基于eBPF的云原生可观测性开源项目,帮助用户理解应用程序行为。

这些工具利用eBPF技术在内核级别进行数据捕获和分析,而不需要修改应用程序代码,从而实现了对应用程序性能的深入洞察,同时保持了系统的稳定性和安全性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.kler.cn/a/273025.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

2024年发布jar到国外maven中央仓库最新教程

2024年发布jar到国外maven中央仓库最新教程 文章目录 1.国外sonatype仓库的版本1.1老OSSHR账号注册说明1.2新账号注册说明 2.新账号注册(必选)3.新账号登录创建Namespace3.1创建Namespace的名字的格式要求(必选)3.2发布一个静态网站(可选&…

后端工程师快速使用axios

文章目录 01.AJAX 概念和 axios 使用模板目标讲解代码解析案例前端后端结果截图 02.URL 查询参数模板目标讲解案例前端后端结果截图 03.常用请求方法和数据提交模板目标讲解案例前端后端结果截图 04.axios 错误处理模板目标讲解案例前端后端结果截图 01.AJAX 概念和 axios 使用…

旅游管理系统|基于SpringBoot+ Mysql+Java+Tomcat技术的旅游管理系统设计与实现(可运行源码+数据库+设计文档+部署说明+视频演示)

推荐阅读100套最新项目 最新ssmjava项目文档视频演示可运行源码分享 最新jspjava项目文档视频演示可运行源码分享 最新Spring Boot项目文档视频演示可运行源码分享 目录 前台功能效果图 用户功能 管理员功能登录前台功能效果图 系统功能设计 数据库E-R图设计 lunwen参考 …

数据的响应式:实现动态数据驱动的技巧

🤍 前端开发工程师、技术日更博主、已过CET6 🍨 阿珊和她的猫_CSDN博客专家、23年度博客之星前端领域TOP1 🕠 牛客高级专题作者、打造专栏《前端面试必备》 、《2024面试高频手撕题》 🍚 蓝桥云课签约作者、上架课程《Vue.js 和 E…

弗洛伊德-华沙算法求任意两点之间的最短路径算法

对于弗洛伊德-华沙算法首先是要假设研究的图中是不包含有负边的,对于所给的图中的任意亮点v1,vm,假设两点之间存在一条连通路径,对于该路径中去掉头和尾节点,也就是v1,vm,剩下的节点也就称之为这…

【嵌入式学习收徒,高薪offer等你来!!!】

有粉丝问了一个问题,说他今年要毕业了,投了好多简历都石沉大海,感觉好多公司都不招人了,想问一下现在究竟是不是如此,不清楚我当年毕业的时候是怎么样的。 我先不直接回答这个问题,先来看一组数据&#xf…

Windows11安装Msql8.0版本详细安装步骤!

文章目录 前言一、下载Mysql二、安装Mysql三、登录验证三、环境变量配置总结 前言 每次搭建新环境的时候,都需要网上搜寻安装的步骤教程!为了以后方便查阅!那么本次就记录一下Windows11安装Msql8.0的详细步骤!也希望能帮助到有需…

在浏览器中使用websocket协议

在浏览器中使用websocket协议 浏览器中提供了 WebSocket 类,我们可以直接使用: new WebSocket((url: string | URL, protocols?: string | string[] | undefined))url:指定连接的 URL,只支持 ws、wss 协议,否则会提…

类与对象题目

第一题 该题说明了静态方法不依靠对象访问,所以即使是null也能正常运行,当然正确访问应该是通过类型访问,不应该用null去访问(用null也不会报错,也能使用静态方法)。 第二题 局部变量不允许被static修饰&am…

swagger使用手册

1.导入依赖 <!--引入swagger--><dependency><groupId>io.springfox</groupId><artifactId>springfox-swagger2</artifactId><version>2.7.0</version></dependency><dependency><groupId>io.springfox</…

【DFS深度优先搜索专题】【蓝桥杯备考训练】:迷宫、奶牛选美、树的重心、大臣的旅费、扫雷【已更新完成】

目录 1、迷宫&#xff08;《信息学奥赛一本通》&#xff09; 2、奶牛选美&#xff08;USACO 2011 November Contest Bronze Division&#xff09; 3、树的重心&#xff08;模板&#xff09; 4、大臣的旅费&#xff08;第四届蓝桥杯省赛Java & C A组&#xff09; 5、扫…

Window部署AgileConfig

AgileConfig&#xff1a;分布式配置中心 github&#xff1a;GitHub - dotnetcore/AgileConfig: 基于.NET Core开发的轻量级分布式配置中心 / .NET Core lightweight configuration server 下载部署包&#xff1a;Releases dotnetcore/AgileConfig GitHub 版本&#xff1a;…

传统电力运维企业的数字化转型案例

一. 传统电力运维企业面临的主要问题 上海某电力集团企业下属有成套设备公司、电力工程公司&#xff0c;依托于自身的设备制造和工程服务能力&#xff0c;以及多年积累的终端客户资源&#xff0c;几年前该公司成立了电力运维服务公司进入用户侧电力托管运维服务行业。 该公司…

滑块验证码

1.这里针对滑块验证给了一个封装的组件verifition&#xff0c;使用直接可以调用 2.组件目录 3.每个文件的内容 3.1 Api文件中只有一个index.js文件&#xff0c;用来存放获取滑块和校验滑块结果的api import request from /router/axios//获取验证图片 export function reqGe…

算法之前缀和

题目1: 【模板】一维前缀和&#xff08;easy&#xff09; 方法一: 暴力解法, 时间复杂度O(n*q), 当n10^5, q 10^5, 时间复杂度为O(10^10), 会超时. 方法二: 前缀和: 快速求出数组中某一段连续区间的和. 第一步: 预处理出来一个前缀和数组dp: 1. dp[i]表示区间[1,i]里所有元…

TypeScript中的 K、T 、V

文章目录 前言泛型类型链接关系K、T、V 含义自动类型推断泛型的应用场景容器类和数据结构函数和方法接口和类类型约束和扩展常用的工具类型 前言 在 TypeScript 的泛型里经常会碰到一些字母&#xff0c;比如 K、T、V&#xff0c;是不是觉得很奇怪&#xff1f; 泛型类型 图中的…

全基因集GSEA富集分析

原文链接&#xff1a;一文完成全基因集GSEA富集分析 本期内容 写在前面 我们前面分享过一文掌握单基因GSEA富集分析的教程&#xff0c;主要使用单基因的角度进行GSEA富集分析。 我们社群的同学咨询&#xff0c;全基因集的GSEA如何分析呢&#xff1f;&#xff1f;其实&#x…

基于Andriod的连锁药店管理系统(源码|论文)

一、系统架构 前端&#xff1a;vue | uni-app 后端&#xff1a;spring | springmvc | mybatis 环境&#xff1a;jdk1.8 | mysql | maven | node 二、代码及数据库 三、功能介绍 01. 登录页 02. 管理后台-首页 03. 管理后台-个人中心-修改密码 04. 管理后台-个人中心-个…

npm WARN config init.license Use `--init-license` instead.

背景&#xff1a;近期升级本地node版本&#xff08;v14.15.4 --> v18.19.1&#xff09;&#xff0c;npm -v报警 npm WARN config init.license Use --init-license instead. npm WARN config init.author.name Use --init-author-name instead. 分析&#xff1a; npm高版本…

Python爬虫从基础到入门:script标签中的数据

上一篇文章: Python爬虫从基础到入门:script标签中的数据 1. 分析需要抓取的数据的在哪?2. 获取数据、解析数据3. 下载视频、音频文件4. 参考代码1. 分析需要抓取的数据的在哪? 本篇博文以B站视频为例,B站视频在用户没有登录的状态下,只能观看视频尺寸为360流畅,在登录…
最新文章