两周 OpenClaw 试用:我把定时任务关了
春节前我开始试用 OpenClaw,前后折腾了差不多两周。
这段时间里我最大的收获,是我第一次比较清晰地体会到,OpenClaw 这类东西和 ChatGPT 在本质上确实不太一样。
ChatGPT 更像一个很聪明的“顾问”。它告诉我应该怎么做、帮我找信息、帮我写文字或写代码,但它通常不会替我把事做完。
OpenClaw 则更像一个“个人 AI 助手的雏形”。因为你可以把一台电脑的权限交给它,理论上你能在电脑上完成的事情,它也能替你完成。
当然,这个“理论上”后面有很多坑。于是这两周我给自己定了个小目标。我不看营销故事,只看它能不能在我这台 Mac mini 上把事做完。
因为我刷到的标题常常是这种风格。
- OpenClaw 帮我维护 20 个网站,SEO 自动起飞,一个月赚了 20000 美金
- 我把电脑交给 OpenClaw,第二天醒来它已经把工作都做完了
- 不写一行代码,用 OpenClaw 搭了个 24 小时自动赚钱系统
- OpenClaw + XXX,日更简报自动发布,流量自己来
- 一个提示词让 OpenClaw 替我打工:从此再也不用加班
- 一个 AI 助手顶一个团队:个人助理时代来了
标题写得很热闹,我也会心动。但如果没有证据,我读完通常只会更焦虑,好像别人都在用 AI 捞钱,只有我还在写 TODO。耳听为虚,我准备亲手一探究竟。
第一天我干的事情很简单。我在 Mac mini 上把 OpenClaw 装起来,按照官方文档里的 pnpm 安装方式一步一步操作和配置。
装好之后就得配置模型。OpenClaw 的 token 消耗很猛,我那时就想把成本压下来。正好我有一个 Antigravity Pro 的账号。Antigravity 是 Google 推出的 AI 编程编辑器,我当时用它的 OAuth 授权方式接入模型。我一开始就选了 Opus。
前两天用下来,我对 Opus 的体感很明确。它做事干练,说完就干。用了两天之后突然提示模型需要 cooldown。我起初以为只是用量到了,等等就好。结果一直不可用,我才意识到事情没这么简单。回头一看,Antigravity 账号已经被封了。
原因我就不细写了,总之和我折腾反代之类的配置有关,踩到了 Google 的政策红线。教训也很直接。在成本压力下走“省钱捷径”,学费可能会用更贵的方式交。
后来我把模型切换成 Codex。Codex 的体感更磨磨叽叽一点,像是欲拒还迎。
模型这边先稳定下来之后,我把它接到 Telegram 机器人,然后给它发了一条很朴素的指令。
把我当前的电脑屏幕截屏给我。
它真的把截图发回来了。
听起来很小儿科,但那一刻我突然明白了。它做的是动作,截图就是结果。从那一秒开始,我才把它当成一种不同于聊天工具的东西。
兴奋感很快就被现实按住了。为了让它更像“真的能操作电脑”,我还装了 peekaboo 这类技能。peekaboo 的作用很直白。它可以通过截图理解界面,再用 macOS 辅助功能去点按钮、输入内容。但很快我就发现,UI 操作远比命令操作更消耗 token,也更脆。
这套链路的天花板不在“会不会点”,而在“会不会点歪”。只要 UI 有一点点变化,或者它识别错了一个控件,就可能出现各种微妙的失败。
所以我后来给自己的偏好很朴素。能用命令完成的,就尽量别让它点 UI;真要点,也把预期放低。它更多是在“帮我尝试”,很难做到“稳定代劳”。
接下来我做了一次更“硬核”的验证。我想看看它到底能不能把一条链路跑完。光在对话框里给我“看起来很对”的建议,对我来说不算。于是我让它定时抓取 Hacker News、GitHub Trends 和几个 remote job 平台,对内容做分析和总结,生成页面,并部署到 Vercel。最后的成果是一个小站,链接在 这里。
我更在意的是它能不能把整条流程跑完,这个站本身反而没那么重要。传统做法里,如果我自己用 Python 写抓取,第一步就得人工打开网页看结构,比如哪些页面特征是稳定的、分页怎么走、限流和反爬怎么处理。抓完之后还要写清洗和抽取规则,再把内容变成可读的摘要,最后才轮到渲染页面、部署、定时跑。光想到这串活,就已经够我拖上好几天了。
而这一次,它确实做到了。抓取、分析、编写代码、提交代码,都是它自己定时完成的。
它有没有让我“月入两万刀”?当然没有。我也从来不指望这种故事。
但它至少给了我一个足够实的证据。对我来说,这类个人 AI 助手,并不是只能停留在“聊一聊”或者“写写代码片段”。在一定条件下,它是可以把工作当成工作去做的。
然后我又想试试它能不能当“外置记忆”。为了避免主账号 A 被它误操作,我在这台 Mac mini 上用了 Apple 账号 B。我的设想很简单。我想让它把内容写进 B 的 Apple Notes,再用共享功能把 Notes 共享给 A,这样我在手机和电脑上都能看到。
Apple Notes 这条路“能走通”,但不够自动。我最典型的一次需求大概是这样。
复盘一下最近的聊天,把重要事件汇总成一个简报记录下来。
我等了很久,怎么也没在共享的 Apple Notes 里看到。后来我登录到这台 Mac mini 上,点开 Apple Notes 才发现,它没有写到 iCloud 的共享目录里,而是写在了本地的某个目录里——其他设备当然看不到。
更麻烦的是,它写完之后也不会“记得自己写过什么”。如果我希望它更新原来的内容,往往得先提醒它重新读一遍,才能勉强对上上下文。
我当时有点失望,因为我期待的是那种更省心的体验。我说“你帮我把 xxx 记录下来”,或者“把这两天聊到的 xxx 汇总一下更新原来的那份”,它就能自己找到正确的共享目录,写出对的内容,并且知道下一次该往哪更新。
但现实没那么省心。它更像一个“会写字的实习生”,你得反复告诉它文档在哪、格式是什么、更新规则是什么。
也许更现实的解法,是我应该专门让它做一个“记录用的 skill”。让它固定只往那个共享目录写,固定一套格式,每次更新前先读一遍旧内容再动笔。这样它就不需要我每次都从头提醒。
做完这些实践后,我把日更定时任务都关了。原来我每天会跑三类东西,科技新闻分析、GitHub trends 分析、remote job 分析。
原因很简单。我对这几个任务并没有实际需求,当时更多是想看看它能跑到哪一步。模型用量也很快要见顶了,我浅尝辄止之后就把这些定时任务停掉了。没必要为了“尝试”每天烧 token。
从理性角度看,科技新闻完全可以直接看别人已经做好的简报;GitHub trends 也有很多人会做分析;remote job 平台更是现成的信息源。我并不需要为这些“已经有人做得很好”的事情,再额外花一份钱让 OpenClaw 重新做一遍。
所以我现在的做法是,日更任务先关掉,特定场景需要它出手时再用它。
这里我想补一句。我把定时任务停掉,主要是我这段时间确实没什么值得它每天接管的需求。OpenClaw 在我测试的范围内是可用的。
相反,它已经给出了一个个人 AI 助手的雏形。AI 不仅仅局限在聊天和编写代码,它是可以延伸到“接管一台电脑、跑完一条流程”的。
目前它仍然受限于模型能力、响应速度、稳定性,以及最现实的成本,而不能达到我想象中的预期。
如果有一天这些限制被进一步推开,比如 token 不再敏感、权限边界更清晰、模型响应足够快、记忆足够可靠,那么类似的个人助理就可能从“我偶尔拿来用”变成“我日常真的离不开”。
到那时,AI 也许会更自然地进入那些更具体、更生活化的场景,比如用 IoT 控制设备、定时巡检摄像头、自动开窗、自动喂食、自动施肥……
我不知道那一天离现在还有多远,但这两周至少让我确认了一件事。这个方向不是营销故事,它确实有一条可以跑通的路。