My Digital Worker
导言
Agent 概念与 OpenClaw 的爆火,本质上反映了人们对个人数字员工(Digital Worker)能力的期待:它不只是一个对话式 AI,而是一个可以在真实工作流中长期运行、承担任务、放大个人生产力的“虚拟员工”。
我真正关心的问题是:如何为自己的具体工作场景配置合适的数字员工,使其在时间与认知两个维度上对个人效率形成倍增效应。
一、总体目标¶
1. 最终目标¶
- 数字员工可 24 小时持续处理任务, (开源案例:AutoResearchInSleep)
- 白天:我在线时,通过 AI IDE / Agent 加速高价值工作
- 夜晚:数字员工自动运行,完成信息收集、初步分析与准备性工作
核心思想是:把人类最稀缺的清醒时间,用在判断、决策和创造上。
2. 拆解目标¶
-
每日自动完成:
- AI / 技术前沿信息汇总
- 金融与宏观相关信息收集
- 结果结构化写入数据库,形成可查询、可回放的数据资产
-
充分利用夜间时间,形成“睡后工作”能力
二、总体思路与路径¶
1. 自动化思路¶
- 打通“最后一公里自动化”,逐步接管每日重复、低价值但必要的工作
-
将个人时间从:
- 信息搬运
- 初级整理
- 机械执行
转移到:
* 竞争性判断
* 方向选择
* 关键决策
数字员工的定位不是“炫技智能”,而是稳定、可控、可复用的工作单元。
2. 阶段性目标(由浅入深)¶
阶段 1:基础执行型 Agent¶
-
接管终端,能够:
- 拉起、调通程序
- 执行固定脚本
-
自动浏览:
-
GitHub Trending
- 重点项目的 PR / Issue
- 对明确问题给出可复用的模板化回复或草稿
阶段 2:信息理解与整理¶
-
阅读并总结:
- 技术报告
- 博客文章
- 社区讨论
-
输出:
-
趋势总结
- 优先级排序
- 初步结论与不确定性标注
阶段 3:决策辅助与前置分析¶
-
针对潜在方向,输出:
- ROI 初步估计
- 实现路径拆解
- 开发人力与成本假设
-
自动生成:
-
需求分析初稿
- 设计文档骨架
三、数字员工的“能力培养”问题¶
1. Agent 的 taste¶
数字员工并不是一开始就“懂你”,需要被逐步训练工作品味(taste),包括:
- 什么信息值得关注
- 什么是噪声
- 哪类结论对决策有帮助
这依赖于:
- 长期一致的反馈
- 可回放的数据与决策链路
- 明确的偏好编码(而不是模糊指令)
2. 数据与工具接入¶
-
数据源:
-
爬虫接入(技术社区、资讯站点)
-
结构化与非结构化混合
-
工具能力:
-
开源工具优先
-
API 接入需考虑:
- 价格
- 稳定性
- 智能水平差异
四、Agent 开发风格与工程约束¶
为了避免“看起来很聪明,但不可靠”的情况,必须采用强工程化约束:
1. 设计原则¶
-
不发呆、不死锁:
- 所有任务必须有超时、失败路径
-
低危险性:
-
禁止不可逆操作
- 高风险操作需人工确认
-
强监管:
-
全链路日志
- 中间结果可审计
-
易回放:
-
每一次决策与执行都可重现
2. Agent 的 TDD 风格¶
-
任务先定义:
- 输入
- 期望输出
- 校验规则
- LLM 只是其中一个组件
- 最终结果必须通过 强校验,而不是“感觉还行”
五、关于 LLM 的现实判断¶
1. 当前策略¶
-
暂不自建 LLM:
- 硬件成本高
- 系统复杂度过大
- 优先使用 API 形态的模型
2. 对 API 型 LLM 的定位¶
-
视为:
- 短上下文
- 可执行简单任务的智能组件
-
必须配合:
-
强约束提示
- 明确任务说明
- 严格结果校验
稳定性优先于“看起来更聪明”。
对“数字员工智能边界”的反思
当前 LLM 能在大量任务上取得优秀表现,毫无疑问具备智能性。
但如果将其视为可以直接替代真实员工的个体,它仍然缺乏关键能力:
- 稳定一致的长期记忆
- 单一、连贯的人格与目标
- 对现实后果的真正理解
在现阶段,它更像是:
一个拥有极高智力、但多重人格、记忆混乱的精神病天才。
因此,数字员工不是“放权”,而是“托管”:
- 用工程手段约束智能
- 用系统设计放大价值
- 用人类负责最终判断
——这才是当前阶段最现实、也最具生产力的路径。