My Digital Worker

导言

Agent 概念与 OpenClaw 的爆火，本质上反映了人们对个人数字员工（Digital Worker）能力的期待：它不只是一个对话式 AI，而是一个可以在真实工作流中长期运行、承担任务、放大个人生产力的“虚拟员工”。

我真正关心的问题是：如何为自己的具体工作场景配置合适的数字员工，使其在时间与认知两个维度上对个人效率形成倍增效应。

一、总体目标¶

1. 最终目标¶

数字员工可 24 小时持续处理任务, (开源案例：AutoResearchInSleep)
白天：我在线时，通过 AI IDE / Agent 加速高价值工作
夜晚：数字员工自动运行，完成信息收集、初步分析与准备性工作

核心思想是：把人类最稀缺的清醒时间，用在判断、决策和创造上。

2. 拆解目标¶

每日自动完成：
- AI / 技术前沿信息汇总
- 金融与宏观相关信息收集
- 结果结构化写入数据库，形成可查询、可回放的数据资产
充分利用夜间时间，形成“睡后工作”能力

二、总体思路与路径¶

1. 自动化思路¶

打通“最后一公里自动化”，逐步接管每日重复、低价值但必要的工作
将个人时间从：
- 信息搬运
- 初级整理
- 机械执行

转移到：

* 竞争性判断
* 方向选择
* 关键决策

数字员工的定位不是“炫技智能”，而是稳定、可控、可复用的工作单元。

2. 阶段性目标（由浅入深）¶

阶段 1：基础执行型 Agent¶

接管终端，能够：
- 拉起、调通程序
- 执行固定脚本
- 自动浏览：
- GitHub Trending
- 重点项目的 PR / Issue
- 对明确问题给出可复用的模板化回复或草稿

阶段 2：信息理解与整理¶

阅读并总结：
- 技术报告
- 博客文章
- 社区讨论
- 输出：
- 趋势总结
- 优先级排序
- 初步结论与不确定性标注

阶段 3：决策辅助与前置分析¶

针对潜在方向，输出：
- ROI 初步估计
- 实现路径拆解
- 开发人力与成本假设
- 自动生成：
- 需求分析初稿
- 设计文档骨架

三、数字员工的“能力培养”问题¶

1. Agent 的 taste¶

数字员工并不是一开始就“懂你”，需要被逐步训练工作品味（taste），包括：

什么信息值得关注
什么是噪声
哪类结论对决策有帮助

这依赖于：

长期一致的反馈
可回放的数据与决策链路
明确的偏好编码（而不是模糊指令）

2. 数据与工具接入¶

数据源：
爬虫接入（技术社区、资讯站点）
结构化与非结构化混合
工具能力：
开源工具优先
API 接入需考虑：
- 价格
- 稳定性
- 智能水平差异

四、Agent 开发风格与工程约束¶

为了避免“看起来很聪明，但不可靠”的情况，必须采用强工程化约束：

1. 设计原则¶

不发呆、不死锁：
- 所有任务必须有超时、失败路径
- 低危险性：
- 禁止不可逆操作
- 高风险操作需人工确认
- 强监管：
- 全链路日志
- 中间结果可审计
- 易回放：
- 每一次决策与执行都可重现

2. Agent 的 TDD 风格¶

任务先定义：
- 输入
- 期望输出
- 校验规则
- LLM 只是其中一个组件
- 最终结果必须通过 强校验，而不是“感觉还行”

五、关于 LLM 的现实判断¶

1. 当前策略¶

暂不自建 LLM：
- 硬件成本高
- 系统复杂度过大
- 优先使用 API 形态的模型

2. 对 API 型 LLM 的定位¶

视为：
- 短上下文
- 可执行简单任务的智能组件
- 必须配合：
- 强约束提示
- 明确任务说明
- 严格结果校验

稳定性优先于“看起来更聪明”。

对“数字员工智能边界”的反思

当前 LLM 能在大量任务上取得优秀表现，毫无疑问具备智能性。

但如果将其视为可以直接替代真实员工的个体，它仍然缺乏关键能力：

稳定一致的长期记忆
单一、连贯的人格与目标
对现实后果的真正理解

在现阶段，它更像是：

一个拥有极高智力、但多重人格、记忆混乱的精神病天才。

因此，数字员工不是“放权”，而是“托管”：

用工程手段约束智能
用系统设计放大价值
用人类负责最终判断

——这才是当前阶段最现实、也最具生产力的路径。