Skip to content

服务监控

概览

服务监控页面为管理员提供服务器运行状态的实时观测面板,包含任务队列、ML 索引覆盖和服务能力三个维度。页面入口仅在用户角色为管理员时显示在侧边栏中。

注意

此页面仅对管理员可见。

页面通过 ?tab= 参数在三个标签页间切换,数据自动轮询刷新(每 5 秒)。

队列

队列标签页展示后端任务处理管线的实时状态,包含聚合统计和按队列维度的详细分解。

聚合统计

页面顶部的三个统计卡片概览整体健康状况:

  • 活跃任务 — 待处理、已调度和正在运行的任务总数。有正在运行的任务时数字旁显示旋转动画。
  • 已完成 — 总处理任务数及成功率百分比。
  • 异常 — 可重试、已取消和已丢弃的任务总数。各项数量分别列出,为零时显示"一切正常"。

队列明细

下方按队列类型逐行展示详细状态。每个队列包含:

  • 名称和描述 — 队列的显示名称及其功能说明。
  • 状态标记 — 空闲 / 工作中 / 有待处理 / 需关注 / 已稳定。
  • 进度条 — 已处理任务占总任务数的百分比。
  • 指标 — 总计、已处理、剩余、需关注、平均运行时间、平均延迟。
  • 最近活动最早剩余 的相对时间戳。

如果队列中有需关注的任务,可展开错误详情面板,查看最近的错误样本(最多 5 条),每条包含错误信息、任务 ID、尝试次数和时间戳。支持一键复制诊断信息到剪贴板。

ML

ML 标签页展示各机器学习任务的索引覆盖情况。

仓库筛选

顶部下拉菜单可选择要查看的仓库,统计数据仅限于该仓库范围。

统计卡片

  • 已有照片 — 该仓库中已索引的照片总数。
  • 等待 ML 任务 — 所有 ML 任务的排队总数。
  • 重建索引任务 — 当前的重建索引请求数量。

按任务覆盖

每个 ML 任务以卡片形式展示:

任务说明
图像语义分析图片内容的语义嵌入索引
OCR 文字识别图像文字识别索引
人物识别人物识别索引
BioCLIP 物种识别BioCLIP 物种识别索引

每张卡片显示已索引数量、剩余数量和排队任务数,以及覆盖百分比进度条。剩余数量大于零时,显示「重建索引」按钮。

重建索引

点击「重建索引」打开确认弹窗:

  • 提示当前是否有正在进行的重建索引任务。
  • 可选择仅重建索引缺失的(默认)或全部重建索引。
  • 确认后提交请求,完成后显示提示。

能力

能力标签页展示服务端的运行时能力和节点健康状态,每 5 秒自动刷新。

统计卡片

  • 发现的节点 — ML 工作节点总数,副标题显示活跃节点数。
  • 任务可用性 — 可用 ML 任务数 / 总任务数。
  • LLM 状态 — 已启用 / 已禁用标记,以及当前使用的服务商名称。

ML 任务详情

以表格形式列出 5 项 ML 任务及其启用/可用状态:

  • 图像语义分析
  • 文本语义分析
  • BioCLIP 物种识别
  • OCR 文字识别
  • 人物识别

每项任务显示是否已启用(配置开关)和是否当前可用(服务节点在线)。

LLM 详情

展示语言模型的配置状态:代理开关、是否已配置、服务商名称、模型名称。

链接

  • 设置 → AI — ML 功能和 LLM 代理的配置入口
  • 管理库 — 仓库管理,影响 ML 索引的数据范围