用量统计

用量统计页面用于集中查看各 API Key、各模型的调用次数与 Token 消耗情况，帮助您核对账单、追踪业务调用趋势以及及时定位异常。本文介绍页面结构、主要指标及常见分析方法。

页面概览

筛选条件：顶部提供 API Key、调用模型类型、统计周期 等筛选器，可快速定位到单个 Key 或全部模型的数据。支持自定义时间区间及「近 1 天 / 3 天 / 7 天」快捷按钮。
查询按钮与清空按钮：设置筛选条件后点击「查询」更新数据，如需返回默认视图可点击「清空」。

指标卡片

页面上方展示一组核心指标，便于即时掌握资源消耗情况：

调用模型累计次数：当前筛选范围内的 API 总调用量。
调用服务次数：当集成多种服务或自研模型时，可查看服务级调用次数。
内部管基调调用次数：用于区分平台内部调用与业务调用，帮助核算成本。
调用 Token 总数：所有请求的 Token 消耗总和。
输入 Token 总数 / 输出 Token 总数：分别显示提示词与生成内容消耗，便于分析场景特征。

用量趋势图

下方「用量趋势」模块支持切换以下视图：

请求量：按天展示每个模型的调用次数，可快速发现流量峰值。
Token 总数：观察整体 Token 消耗趋势，判断费用变化。
输入 Token 数 / 输出 Token 数：拆分输入与输出占比，有助于优化提示词策略或限制输出长度。

图例可显示每个模型（如 cltech/deepseek-r1-32b、deepseek-r1-distill-llama-70b 等），点击可临时隐藏某个模型，以便聚焦关键数据。

常见使用场景

成本核算：结合 Token 消耗与价格策略，估算对应费用。
容量规划：观察高峰期的请求量变化，评估是否需要扩容 API Key 或限流。
异常排查：若出现调用暴增或 Token 异常，可通过时间筛选与模型图例迅速定位问题来源。
多 Key 管理: 选择不同 API Key 对比调用习惯，制定限额或分配策略。

使用建议

定期下载或截图保存关键时间段的数据，留存审计记录。
配合「API Key 管理」页面设置限额或禁用异常 Key，防止失控调用。
对于即将到期或超配额的 Key，可提前在页面顶部切换时间窗口，模拟不同区间内的趋势。

若需要导出更详细的调用明细或接入自定义监控，请联系技术支持以获取开放能力。