Skip to content

用量统计

用量统计页面用于集中查看各 API Key、各模型的调用次数与 Token 消耗情况,帮助您核对账单、追踪业务调用趋势以及及时定位异常。本文介绍页面结构、主要指标及常见分析方法。

页面概览

  • 筛选条件:顶部提供 API Key调用模型类型统计周期 等筛选器,可快速定位到单个 Key 或全部模型的数据。支持自定义时间区间及「近 1 天 / 3 天 / 7 天」快捷按钮。
  • 查询按钮与清空按钮:设置筛选条件后点击「查询」更新数据,如需返回默认视图可点击「清空」。

指标卡片

页面上方展示一组核心指标,便于即时掌握资源消耗情况:

  • 调用模型累计次数:当前筛选范围内的 API 总调用量。
  • 调用服务次数:当集成多种服务或自研模型时,可查看服务级调用次数。
  • 内部管基调调用次数:用于区分平台内部调用与业务调用,帮助核算成本。
  • 调用 Token 总数:所有请求的 Token 消耗总和。
  • 输入 Token 总数 / 输出 Token 总数:分别显示提示词与生成内容消耗,便于分析场景特征。

用量趋势图

下方「用量趋势」模块支持切换以下视图:

  1. 请求量:按天展示每个模型的调用次数,可快速发现流量峰值。
  2. Token 总数:观察整体 Token 消耗趋势,判断费用变化。
  3. 输入 Token 数 / 输出 Token 数:拆分输入与输出占比,有助于优化提示词策略或限制输出长度。

图例可显示每个模型(如 cltech/deepseek-r1-32bdeepseek-r1-distill-llama-70b 等),点击可临时隐藏某个模型,以便聚焦关键数据。

常见使用场景

  1. 成本核算:结合 Token 消耗与价格策略,估算对应费用。
  2. 容量规划:观察高峰期的请求量变化,评估是否需要扩容 API Key 或限流。
  3. 异常排查:若出现调用暴增或 Token 异常,可通过时间筛选与模型图例迅速定位问题来源。
  4. 多 Key 管理: 选择不同 API Key 对比调用习惯,制定限额或分配策略。

使用建议

  • 定期下载或截图保存关键时间段的数据,留存审计记录。
  • 配合「API Key 管理」页面设置限额或禁用异常 Key,防止失控调用。
  • 对于即将到期或超配额的 Key,可提前在页面顶部切换时间窗口,模拟不同区间内的趋势。

若需要导出更详细的调用明细或接入自定义监控,请联系技术支持以获取开放能力。