gydtep 发表于 2021-12-19 14:22:20

特殊场景:除了场景的公司内通用场景外,针对不同的行业属性,也可以衍生出特定行业的观测场景与应用,例如阿里云的城市大脑,就是通过观测道路拥堵、信号灯、交通事故等信息,通过控制不同红绿灯时间、出行规划等手段降低城市整体拥堵率。

gydtep 发表于 2021-12-19 19:26:03

Traces:Jaeger、Zipkin、SkyWalking、OpenTracing、OpenCensus
Logs:ELK、Splunk、SumoLogic、Loki、Loggly

gydtep 发表于 2021-12-19 19:50:42

数据不互通:虽然是同一个业务组件,同一个系统,产生的数据由于在不同的方案中,数据难以互通,无法充分发挥数据价值

gydtep 发表于 2021-12-20 08:12:56

统一的系统:拒绝割裂,能够在一个系统中支持Traces、Metrics、Logs的统一存储与分析
数据可关联:每种数据内部可以互相关联,也支持跨数据类型的关联,能够用一套分析语言把各类数据进行融合分析

gydtep 发表于 2021-12-20 09:35:01

上图展示了我们兼容外部协议、Agent的整体进度:

Traces:除了内部的飞天Trace、鹰眼Trace外,开源的包括Jaeger、OpenTracing、Zipkin、SkyWalking、OpenTelemetry、OpenCensus等。

gydtep 发表于 2021-12-20 11:02:23

对于存储引擎,我们的设计目标的第一要素是统一,能够用一套引擎存储各类可观测的数据;第二要素是快,包括写入、查询,能够适用于阿里内外部超大规模的场景(日写入几十PB)。

gydtep 发表于 2021-12-20 13:18:26

上述这些数据都在同一个进程内实现,大大降低运维、部署代价
整个存储引擎基于纯分布式框架实现,支持横向扩展,单个Store最多支持日PB级的数据写入

gydtep 发表于 2021-12-20 15:54:30

数据加工:也就是大数据ETL(extract, transform, and load)中T的功能,能够帮我们把非结构化、半结构化的数据处理成结构化的数据,更加容易分析。

gydtep 发表于 2021-12-20 16:36:10

全链路的可观测性一直都是DevOps环节中的重要步骤,除了通常的监控、告警、问题排查外,还承担用户行为回放/分析、版本发布验证、A/B Test等功能,下图展示的是阿里内部某个产品内部的全链路可观测架构图:

gydtep 发表于 2021-12-20 18:01:27

收集云上每个产品(虚拟机、网络、存储、数据库、SaaS类等)的费用,包括详细的计费信息
收集每个产品的监控信息,包括用量、利用率等
页: 1 2 [3] 4 5 6 7 8 9 10 11 12
查看完整版本: 【腾讯云】云产品限时秒杀,爆款2核4G云服务器首年74元