test/skills/auto-target-tracker/SKILL.md
2026-03-24 04:04:58 +00:00

7.7 KiB
Executable File
Raw Blame History

name description
auto-target-tracker 自动目标进度追踪器。在对话中检测到目标相关图片(笔记、进度、截图、记录)时,自动调用 VLM 识别关键信息并记录到目标日记。适用于学习管理、健身追踪、工作进度、习惯养成、创作记录等所有目标管理场景。

自动目标进度追踪器

触发条件

当对话中出现以下条件时自动触发:

  1. 用户发送了图片(特别是学习笔记、进度截图、健身记录、任务清单、创作作品等)。
  2. 用户在设定的目标时间段(如 08:30, 10:00, 20:00发送了图片。
  3. 用户明确说"帮我记一下"、"看下进度"、"打卡"、"更新一下"等。

工作流程

1. 检测图片

当检测到图片时,检查:

  • 图片文件名是否包含目标关键词progress, goal, task, workout, note等
  • 图片内容是否包含目标元素(进度条、文字、代码、图表、计划表等)
  • 是否在预定的目标提醒时间附近
  • 用户最近的对话上下文是否涉及目标的执行

2. 调用 VLM 识别

使用 vlm 工具识别图片:

通用 prompt 模板

"识别图片中的关键信息,根据目标类型提取以下内容:
- 核心任务/内容
- 完成进度或数量
- 关键数据(如时间、重量、字数等)
- 给出一段简短的执行反馈"

目标类型专用 prompt

目标类型 Prompt
学习 "识别学习笔记,提取知识点、完成度"
健身 "识别健身记录,提取运动类型、组数、次数、重量"
工作 "识别工作进度,提取完成任务、完成率"
创作 "识别创作作品,提取创作类型、进度、关键元素"
习惯 "识别打卡记录,提取打卡内容、连续天数"

3. 解析目标信息

从 VLM 返回的结果中提取:

  • 任务/内容清单:识别出的具体行动或任务
  • 完成度:基于图片内容的进度估算
  • 关键数据:时间、数量、重量、字数等量化指标
  • 认知反馈:对当前目标状态的简评

4. 记录到目标日记

调用edit_daily工具将识别结果记录到当天的日常笔记中

5. 反馈给用户

向用户确认识别结果:

已记录你的目标打卡:

📝 识别结果:
核心内容:你拍的是今天的英语单词表,一共记了 15 个新词。
进度估算:今天的单词任务全部搞定,进度打败了 80% 的学习党。
建议:有两个单词的拼写有点模糊,明天复习的时候记得多看两眼。

记录准确吗?要帮你存进今天的目标日记里吗?

记录格式

目标日记条目示例

## 20:00 打卡记录

**目标类型**: 📚 学习

**图片**: ![目标图片](path/to/image.jpg)

**VLM识别结果**:

| 任务/内容 | 进度/数量 | 状态 |
|----------|----------|------|
| 英语单词 (Unit 1) | 15 个 | 已完成 |
| 数学练习 (第3章) | 80% | 进行中 |

| **总计** | | **今日达成 2/3** |

**关键数据**:
- 学习时长: 2小时
- 专注度: 高

**备注**: 自动识别,用户确认正确

---

## 10:30 健身打卡

**目标类型**: 🏃 健身

**图片**: ![健身记录](path/to/gym.jpg)

**VLM识别结果**:

| 运动类型 | 组数 | 次数 | 重量 | 状态 |
|---------|------|------|------|------|
| 卧推 | 4 | 12 | 60kg | ✅ 完成 |
| 深蹲 | 4 | 10 | 80kg | ✅ 完成 |
| 引体向上 | 3 | 8 | 自重 | ⚠️ 少一组 |

| **总计** | | | **今日达标** |

**关键数据**:
- 总重量: 2640kg
- 训练时长: 45分钟

**备注**: 引体向上少完成一组,下次补上

与目标系统的集成

每日汇总

在每天晚上 22:00 的汇总中,包含:

  • 今日所有打卡记录
  • 目标达成率分析
  • 与目标的对比(如果设置了目标)

周/月报告

在周报告中,包含:

  • 本周有效执行时长
  • 目标覆盖范围
  • 连续打卡天数
  • 动态难度调整建议:如果连续达标,则建议提升下周任务量

常见使用场景

场景1学习打卡

用户行为:发送手写笔记照片

自动识别

  • 提取知识点
  • 计算学习进度
  • 记录到学习日志

反馈示例

📚 识别到学习笔记:
- 机器学习监督学习算法(已完成)
- 梯度下降优化器(进行中)
- 正则化防过拟合(未开始)

进度33% | 预计还需 2 小时完成

场景2健身打卡

用户行为:发送健身记录照片

自动识别

  • 提取运动类型
  • 统计组数、次数、重量
  • 计算训练量

反馈示例

🏃 健身记录已识别:
- 卧推 60kg × 12 × 4组 ✅
- 深蹲 80kg × 10 × 4组 ✅
- 引体向上 自重 × 8 × 3组 ✅

总训练量2640kg | 时长45分钟

场景3工作进度

用户行为:发送项目进度截图

自动识别

  • 提取已完成任务
  • 计算完成百分比
  • 识别剩余任务

反馈示例

💼 工作进度已识别:
- 需求文档(已完成)✅
- 原型设计(已完成)✅
- 前端开发(进行中)🔄 80%
- 后端开发(未开始)⏳

项目总进度67%

场景4创作打卡

用户行为:发送创作作品照片

自动识别

  • 提取创作类型
  • 识别关键元素
  • 估算完成度

反馈示例

🎨 创作记录已识别:
类型:插画创作
元素:人物角色、背景场景
完成度线稿100%上色60%

建议:今天完成了角色线稿,明天可以开始背景上色

场景5习惯打卡

用户行为:发送打卡日历截图

自动识别

  • 提取连续打卡天数
  • 识别今日打卡状态
  • 计算打卡率

反馈示例

✅ 习惯打卡已识别:
早起:连续 15 天 | 打卡率 100%
阅读:连续 8 天 | 打卡率 73%
运动:连续 21 天 | 打卡率 100%

🎉 运动已连续打卡 3 周,继续保持!

Scope

This skill ONLY:

  • 识别目标相关图片并提取关键信息
  • 记录打卡数据到日常笔记文件
  • 提供进度反馈和建议

This skill NEVER:

  • 自动执行任何基于识别结果的操作
  • 上传图片到外部服务(除 VLM API
  • 访问用户未授权的图片资源
  • 修改用户的目标计划(仅记录进度)

Security & Privacy

Data that stays local:

  • 识别后的结构化结果
  • 记录到 日常笔记或长期记忆 和 USER.md 的内容
  • 打卡历史数据

This skill does NOT:

  • 分享目标进度或打卡数据给第三方
  • 自动发布打卡信息到社交平台
  • 访问用户的其他图片资源

注意事项

  1. 隐私保护: 图片和识别结果仅存储在本地,不会上传到云端(除了调用 VLM API 进行识别)
  2. 准确性: VLM 识别的内容仅供参考,可能因字迹模糊、图片质量等原因有所偏差
  3. 及时确认: 建议用户在记录后及时确认识别结果,如有偏差可手动修正
  4. 目标类型识别: 系统会根据图片内容自动判断目标类型,如有误可手动调整
  5. 进度估算: 进度百分比基于图片内容估算,可能不准确,建议用户定期手动更新

集成建议

与 SOUL.md 配合

将自动追踪器整合到目标管理日常工作流中:

### 2. 智能记录与估算 (Logging & Estimation)

- 当用户发送任何与目标相关的图片时:
  1. 自动调用 auto-target-tracker 识别内容
  2. 提取关键信息并估算进度
  3. 立刻记录到日常笔记中
  4. 同步更新 USER.md 的目标进度

与 HEARTBEAT.md 配合

在心跳检查中包含:

## 每日汇总
- 22:00 自动读取今日所有打卡记录
- 生成目标进度报告
- 发送给用户