监控指标
更新时间:2025-05-29
查看集群监控
- 选择对应集群名称进入集群管理,从侧边导航找到监控并单击即可查看集群各项指标监控信息。Palo 根据节点类型的不同,展示不同的监控项。
- 用户可以先在节点类型中选择 Leader Node 或 Compute Node,在监控对象中勾选希望查看的实例(最多勾选10个),然后选择相关的监控项进行查看。
监控指标说明
表一 公共指标说明
指标项 | 指标说明 |
---|---|
CPU使用率 | 以百分比显示CPU使用率,数值越高,表示CPU负载越高 |
内存使用量 | 以 GB 为单位显示内存使用量 |
内存使用率 | 以百分比显示内存使用率,数值越高,表示节点当前消耗内存越大 |
磁盘空间使用量 | 以 GB 为单位显示节点整体的磁盘使用量 |
磁盘使用率 | 以百分比显示节点整体的磁盘使用率。当前不支持显示单独某个磁盘的使用率 |
CPU Stolen | 以百分比显示 CPU stolen 的比率。该值高于 10%,则说明可能该节点的 CPU 资源可能被抢占严重 |
表二 Leader Node 独有监控指标
指标项 | 指标说明 |
---|---|
当前连接数 | 显示当前通过 Mysql 端口连接到 Leader Node 的连接数 |
当前元数据日志id | 显示当前 Leader Node 元数据同步的最新日志id。该监控项的具体数据没有意义,只需查看各个 Leader Node 的最新日志id保持同步即可 |
每秒查询数 | 显示每秒处理的查询量(QPS)。该数据仅统计通过 Mysql 协议连接并发起的查询请求数量 |
每秒请求数 | 显示每秒处理的请求量(RPS)。该数据仅统计通过 Mysql 协议连接并发起的请求数量。请求包括查询、DDL、DML 等所有请求 |
每秒查询错误数 | 显示每秒发生的错误查询的数量。该数据仅统计通过 Mysql 协议连接并发起的查询出现错误的数量 |
JVM Old 区使用率 | 以百分比显示 JVM Old 区的使用率,数值越高,说明 JVM 内存使用量越高 |
JVM Young 区使用率 | 以百分比显示 JVM Young 区的使用率 |
表三 Compute Node 独有监控指标
指标项 | 指标说明 |
---|---|
当前线程数 | 显示 Compute Node 中,进程的线程数 |
文件句柄数 | 显示 Compute Node 中,进程所打开的文件句柄数 |
写入速率 | 以字节显示每秒的写入速率。这里统计的是通过导入命令,实际写入到 Palo 中的数据写入速率 |
读取速率 | 以字节显示每秒的读取速率。这里统计的是查询时产生的读取速率 |
监控指标图例说明
根据选择的监控指标会以图例的方式进行展示和查看,不同的监控指标会以不同的颜色在图例中显示。点击图例中对应的节点,则可以单独显示某一个节点的监控指标。监控页右上角还可以选择需要显示的监控时间范围。
图一 监控指标图例
业务指标监控
采集集群粒度指标数据,进行监控,展示到业务指标分类中。页面可查看当前实例状态,单击报警详情可跳转BCM报警策略页面。展示的指标项具体如下:
- 慢查询数,单位:个
- 仅支持1.1以上集群版本
- 如果集群版本在1.1以上但未开启审计日志插件,请先到查询分析页面开启审计日志插件
- 单副本表,单位:个
- 异常tablet个数,单位:个
- 仅支持1.1以上集群版本