指标图101:摘要图

  

这是有关监视数据可视化的系列文章中的第二篇。这篇文章着重于摘要图。

  

在本系列的第一部分中,我们讨论了时间序列图——显示基础结构指标随时间变化的可视化效果。在本文中,我们将介绍摘要图,这些摘要图是将特定时间段<强>展平以提供基础架构摘要窗口的可视化效果:

  
      <李>单值汇总李   <李>排行榜李   <李>变更图表   <李>主机地图   <李>发行版   
  

对于每种图形类型,我们将说明其工作方式和使用时间。但是首先,我们将快速讨论理解基础结构摘要图所必需的两个概念:跨时间聚合(您可以将其视为“时间变平”或“快照”)和跨空间聚合。

  

跨时间汇总

  

为了提供指标的摘要视图,可视化必须通过将时间维度压缩到视线范围之外,将时间序列展平为单个值。这种跨时间的聚合可能意味着仅显示度量查询返回的最新值,或者更复杂的聚合以在移动时间窗口内返回计算值。

  

例如,您可能不希望显示度量标准查询的最新报告值,而是希望显示每个主机在过去60分钟内报告的最大值,以解决有问题的峰值:

  

(指标图101:摘要图

  

跨空间聚合

  

并非所有指标查询都有意义,可以按主机,容器或其他基础结构单元划分。因此,您通常需要跨空间进行一些聚合,以创建可合理反映您的基础结构的度量可视化。这种聚合可以采用多种形式:通过消息队列,数据库表,应用程序或主机本身的某些属性(操作系统,可用性区域,硬件配置文件等)来聚合度量。

  

跨空间的聚合使您可以对基础架构进行切片和分割,以准确地隔离可观察关键系统的指标。

  

与上面的示例中列出的主机级别的复述,峰值延迟相比,查看基于复述,构建的每个内部服务的峰值延迟可能更有用。或者,您只能显示基础结构中任何主机报告的最大值:

  

![复述,延迟图)跨空间聚合:按服务名称对主机进行分组(顶部)或将主机列表压缩为单个值(底部)

  

时间序列图中的跨空间聚合也很有用。例如,很难理解网络请求的主机级图表,但是当按可用性区域汇总指标时,可以轻松解释相同的数据:

  

![复述,延迟图)从未聚合的(折线图,顶部)到跨空间的聚合(堆叠的面积图,底部)

  

标记指标的主要原因是启用跨空间聚合。

  

单值汇总

  

单值摘要使用条件格式(例如绿色/黄/色红色背景)显示给定度量查询的当前值,以传达该值是否在预期范围内,单值摘要显示的值不必表示瞬时测量。窗口小部件可以显示报告的最新值,或者显示在整个时间窗口内根据所有查询值计算得出的汇总值。这些可视化为您的基础架构提供了一个狭窄但明确的窗口。

  

(指标图101:摘要图

  

何时使用单值摘要

           什么   为什么   例               给定系统的<>强工作指标   使关键指标立即可见   每秒Web服务器请求指标图101:摘要图”>
  
  
  关键<强>资源指标</强>
  概览资源状况和健康状况
  负载均衡器背后的健康主机<img src=指标图101:摘要图