从零搭建 New API 监控看板:SQLite 非时序数据的 Grafana 实践

本文记录了作者将 New API 接入 Grafana 监控的完整实践,采用访问层(Nginx + Loki/Promtail)与业务层(SQLite exporter)双轨架构。核心踩坑包括:SQLite 非时序特性导致 Grafana 时间切片困难,通过在 exporter 中预计算固定时间窗口解决;历史模型过多淹没看板,采用 Top 10 限制;`channel_name` 字段为空,需 JOIN 渠道表补全;以及误将流式调用当全部调用导致数据失真。最终看板实现了 QPS、模型调用量、Token 消耗、首字用时(TTFB)、失败率及缓存命中率等核心指标的可视化。经验总结:非时序数据库硬套时序监控体系时,需提前评估时间切片能力、历史数据噪音及维度字段可信度。