应用性能监控

更新时间：2025-06-23

应用概览页

应用概览页显示单个应用核心的模型调用、Token用量、会话数、用户数等数据。

面板	说明
LLM模型调用次数趋势图	展示LLM模型调用次数调用趋势图
LLM模型调用操作类型分布图	展示不同操作类型的分布次数和占比情况，包含Embedding、Agent、LLM、Task、Took、Workflow、Rerank七种操作类型
LLM模型调用次数排行Top5	展示LLM模型调用次数Top5模型，支持趋势图显示

模型调用分析详细展示了单个应用的LLM大模型调用相关的数据。

面板	说明
LLM模型调用次数	展示应用在指定时间段内调用大模型的次数
LLM模型调用QPS	展示应用在指定时间段内调用大模型的QPS
LLM模型调用错误数	展示应用在指定时间段内调用大模型的错误数
LLM模型调用错误率	展示应用在指定时间段内调用大模型的错误率
LLM模型调用平均耗时	展示应用在指定时间段内调用大模型的平均耗时时间
LLM模型调用首Token平均耗时	展示应用在指定时间段内调用首Token平均耗时，其中首Token耗时是指在每个请求里，用户输入Query点发送键开始到最后一次请求大模型，首Token开始输出的耗时时间

面板	说明
LLM模型调用次数调用趋势图	默认展示LLM模型调用次数调用趋势图可切换LLM模型调用QPS 可切换Avg LLM call per request 表示每次用户请求平均LLM模型调用次数
LLM模型调用错误数趋势图	默认LLM模型调用错误数趋势图，可切换LLM模型调用错误率趋势图
LLM模型调用耗时趋势图	展示LLM模型调用耗时趋势图，支持Avg、P90、P95、P99耗时
LLM模型调用首Token耗时趋势图	展示LLM模型调用首Token耗时趋势图，支持Avg、P90、P95、P99耗时

面板	说明
LLM模型调用次数排行 Top5模型	基于应用对大模型的调用，统计LLM调用次数Top5的大模型，支持切换趋势图可切换LLM模型调用QPS的Top5模型，支持切换趋势图可切换Avg call per LLM request的Top5模型
LLM模型调用错误数排行 Top5模型	基于应用对大模型的调用，统计LLM调用错误的Top5的大模型，支持切换趋势图可切换LLM调用错误率的Top5的模型，支持切换趋势图
LLM模型调用平均耗时 Top5模型	基于应用对大模型的调用，统计LLM调用平均耗时的Top5的大模型，可切换其他耗时指标p90、p95、p99耗时，支持切换趋势图
LLM模型调用首Token平均耗时 Top5模型	基于应用对大模型的调用，统计LLM调用首Token平均耗时的Top5的大模型，可切换其他耗时指标，支持切换趋势图

LLM操作详细展示了单个应用的LLM操作相关的数据，操作类型包含Embedding、Agent、LLM、Task、Took、Workflow、Rerank七种操作类型。

面板	说明
xx操作调用次数调用趋势图	展示xx操作调用次数调用趋势图
xx操作调用错误数趋势图	展示xx操作调用错误数趋势图，可切换xx操作调用错误率趋势图
xx操作调用耗时趋势图	展示xx操作调用耗时趋势图，支持Avg、P90、P95、P99耗时

面板	说明
xx操作调用次数调用Top5	统计xx操作调用次数Top5模型或具体操作名称，分别展示调用次数Top5的Embedding模型、LLM模型、Agent、Tool、Task、Rerank模型、Workflow的名称
xx操作调用错误数Top5	统计xxx错误的Top5，下拉切换xxx错误率的Top5
xx操作调用耗时Top5	统计xxx平均耗时的Top5，下拉切换P90、P95、P99耗时

Token分析展示单个应用的Token相关数据，支持模型筛选，查看具体一个模型相关的Token数据。

面板	说明
Token用量	展示应用在指定时间段使用的Token用量，可查看input 和output
Avg Tokens per request	展示应用在指定时间段每次用户请求平均使用的Token用量，可查看input 和output
Avg Tokens per LLM call	展示应用在指定时间段每次LLM调用平均使用的Token用量，可查看input 和output
平均首Token耗时 per request	展示应用在指定时间段每次用户请求平均首Token耗时，其中首Token耗时是指在每个请求里，用户输入Query点发送键开始到最后一次请求大模型，首Token开始输出的耗时时间

面板	说明
Token用量趋势	展示应用在指定时间段使用的Token用量趋势，可查看input 和output
Avg Tokens per request趋势	展示应用在指定时间段每次用户请求平均使用的Token用量趋势
Avg Tokens per LLM call趋势	展示应用在指定时间段每次LLM调用平均使用的Token用量趋势
Token输出速度 per request趋势	展示应用在指定时间段每次用户请求Token输出速度趋势，输出速度为每次请求Token输出数量/每次请求耗时
首Token耗时 per request趋势	展示应用在指定时间段每次用户请求首Token耗时，可查看Avg、P90、P95、P99耗时

面板	说明
Token用量 Top5会话	统计Token用量Top5的会话（Session），支持切换趋势图
Token用量 Top5用户	统计Token用量Top5的用户，支持切换趋势图
Token用量 Top5模型	统计Token用量Top5的大模型，支持切换趋势图
Avg Tokens per LLM call Top5模型	统计 "Avg Tokens per LLM call" Top5的大模型，支持切换趋势图

接口监控、日志分析、异常分析、调用链分析模块同APM应用性能监控。

评价此篇文章

有帮助没帮助