Observability:实现 OpenTelemetry 原生可观察性的商业价值
作者:来自 Elastic David Hope
利用开放标准和简化的数据收集转变组织的可观察性策略。
现代组织面临着前所未有的可观察性挑战。随着系统变得越来越复杂和分散,传统的监控方法难以跟上步伐。由于数据量每两年翻一番,系统跨越多个云和技术,组织需要一种新的方法来保持对其运营的可见性。挑战不仅在于收集更多数据,还在于使这些数据在整个组织中具有可操作性和价值。
工具孤岛和碎片化可观察性的成本
碎片化可观察性的隐性成本远远超出了工具许可证和基础设施费用。组织正在努力应对复杂的监控工具网络,每个工具都有自己的代理、仪表板和数据格式。这种碎片化造成了巨大的运营开销,团队花费宝贵的时间来维护和关联不同系统的数据,而不是推动创新。
考虑一下这个典型的企业场景:当事件发生时,团队必须浏览多种工具来拼凑发生的事情。一个团队在他们的应用程序性能监控 (application performance monitoring - APM) 工具中检查应用程序性能指标;另一个团队在另一个系统中检查基础设施指标;其他团队在另一个平台上挖掘日志。这种碎片化不仅会减慢事件响应速度,而且会使预防问题变得更加困难。
这对团队生产力的影响是巨大的。工程师通常需要在多个工具之间切换上下文来解决问题,从而延长解决问题的时间并增加运营成本。此外,缺乏标准化数据使得跨系统关联信息变得困难,从而产生盲点,可能导致服务中断和客户不满。
为什么 OpenTelemetry 和开放标准会改变一切
OpenTelemetry (OTel) 代表了组织处理可观察性方式的根本转变。作为继 Kubernetes 之后第二活跃的云原生计算基金会项目,OTel 正在打破长期困扰可观察性解决方案的供应商锁定障碍。通过提供标准化的方式来收集和传输遥测数据,OTel 使组织能够选择最适合其需求的工具,而不受专有格式的限制。
这种标准化充当了创新的催化剂。当团队不再需要担心底层的仪表机制时,他们可以专注于从数据中提取有意义的见解。社区驱动标准的力量确保 OTel 继续随着行业需求而发展,并得到 Elastic、Microsoft 和 Google 等主要贡献者的支持。
该项目的惊人增长说明了它自己的故事。凭借超过 9,160 名贡献者、55,640 多个代码提交和 1,100 多家贡献公司,OpenTelemetry 已成为可观察性仪表的事实标准。广泛的采用确保了长期可持续性和持续创新。
OpenTelemetry 带来的实际业务成果
采用 OpenTelemetry 的组织在其运营中看到了切实的好处。通过整合工具和简化维护可以降低成本,而标准化数据收集可以更快地解决问题并提高服务可靠性。当每个人都使用相同的可观察性语言时,团队可以更有效地协作,从而更快地交付功能并改善客户体验。
以下是实践中的情况。
财务影响:
- 通过整合监控解决方案降低工具成本
- 通过标准化实践降低培训和入职成本
- 通过更好的资源利用率(运行更少的代理)降低基础设施成本
运营效率:
- 平均解决时间 (MTTR) 减少 40%–60%
- 简化部署和配置管理
- 减少警报噪音和误报
创新加速:
- 通过内置可观察性加快功能部署
- 改进实验能力
- 通过全面的数据分析做出更好的决策
随着组织对其整个技术堆栈有了清晰的了解,资源分配变得更加高效。这种全面的视角可以实现更好的容量规划和更明智的投资决策,最终带来更好的业务成果。
OpenTelemetry 成功之路
成功采用 OpenTelemetry 始于专注的方法。从一个可以快速展示价值的试点项目开始,无论是检测关键服务还是解决特定的可观察性挑战。培养内部冠军也至关重要——确定了解标准化可观察性的技术和业务优势的团队成员。
采用过程中的关键里程碑
1. 评估阶段:
- 评估当前可观察性成本和痛点
- 确定高价值的初始用例
- 设定明确的成功指标
2. 试点实施:
- 为初始部署选择有界上下文
- 实施基本检测
- 测量和记录早期结果
3. 扩展阶段:
- 在团队之间扩展成功模式
- 制定内部最佳实践
- 构建自动化部署流程
4. 优化阶段:
- 微调数据收集和采样
- 实施高级用例
- 分享成功案例和经验教训
为你的可观察性策略做好未来准备
可观察性的未来正受到不断增加的系统复杂性和数据量的塑造。OpenTelemetry 等开放标准确保组织能够适应这些变化,而不会被锁定在特定的供应商解决方案中。Elastic 对 OpenTelemetry 生态系统的承诺 —— 体现在其作为前三大贡献者的地位和捐赠,包括 Elastic Common Schema 和 Universal Profiling —— 有助于确保组织拥有成功所需的工具。
OpenTelemetry 有能力解决的新兴趋势:
- 边缘计算和物联网可观察性要求
- AI/机器学习 (ML) 系统监控需求
- 跨云服务网格可观察性
- 安全遥测集成
采取下一步行动
首先,通过考虑以下因素来评估你当前的可观察性实践在整个组织中的可访问性:
- 有多少不同的团队需要了解你的遥测数据?
- 对于尝试使用可观察性数据的团队来说,存在哪些专业知识障碍?
- 你当前的数据收集管道有多统一?
- 维护当前可观察性工具所需的总工作量是多少?
通过以下方式衡量你的进度:
- 提高团队间可观察性数据的可访问性
- 减少维护多种收集机制所花费的时间
- 改善不同类型遥测数据之间的相关性
- 加快新团队加入可观察性实践
- 降低遥测管道的复杂性
过渡到 OpenTelemetry 不仅是为了更好的工具,还在于让组织中的每个人都可以访问和使用可观察性。通过现在采用开放标准和简化的管道,你可以让你的团队专注于最重要的事情:构建和改进你的应用程序。立即开始你的旅程,加入不断壮大的组织社区,让可观察性为每个人服务。
准备好让可观察性更容易实现了吗?访问 elastic.co/observability 了解 Elastic 和 OpenTelemetry 如何简化你的可观察性实践。
本文中描述的任何特性或功能的发布和时间均由 Elastic 自行决定。任何当前不可用的特性或功能可能无法按时交付或根本无法交付。
原文:OpenTelemetry: The key to modern enterprise observability | Elastic | Elastic Blog