关于OpenClaw使用体验

Table of Contents

openclaw-hero

前言

前段时间有一个很火的项目,最开始发布的时候叫做Clawdbot,后来被Claude投诉名字读音一样,于是改名成MoltBot,最后又改成OpenClaw。这个项目之所以火爆,是因为这个OpenClaw可以接入各种LLM,具有较高的权限,且24小时在线。

ChatGPT是一个典型的问答AI,用户问一个问题,得到一个回答,当然也可以通过上下文给予GPT各式的角色,但终究是一问一答的形式。GPT有个AI编码工具,叫做Codex,这个工具能够分析用户的指令,自动完成复杂的编码任务。如此一来,就把一个聊天的工具,变成了用户可以得到实际产物的生产工具。

诸如目前最前沿的AI代码工具,Codex、Claude Code、Cursor等,他们的运行和操作往往限制在一个文件夹中,没有更高的权限来操纵系统文件,所以这些工具上限就是辅助代码工具,在用户的指令下,修改代码文件。

OpenClaw有什么不同呢?总的来讲,如果说Claude Code、Cursor是一个工具的话,那OpenClaw就是一个工具加一台电脑,这就意味着他不仅仅可以在我们的指令下修改文件,还可以自己独立的开发项目并主动与我们交互。OpenClaw的运行需要一台电脑,OpenClaw有权限能访问和修改这台电脑的几乎所有文件和内容,能够自己调用浏览器访问网页,能够在Apple Reminders里增加提醒事项等。

OpenClaw有一个核心的机制,叫做Heartbeat(心跳),每一次心跳都会启动LLM,检查定时的任务和激活相应的工作。有了这个机制,OpenClaw就不再是一问一答的形式,而是可以主动的推送消息,这样,我们就可以为其配置很多的定时任务。从另一个层面来讲,心跳机制就改变了传统的AI一问一答的死板交互方式,增加了AI的主动性,使其更像一个人。

(插一点,Heartbeat真的是本人认为很牛的一个创新。LLM一个问题就是缺乏主动性,所有的输出都需要输入,设置Heartbeat,每次定时的激活一下LLM,对自身所有的内容进行一个自省,非常妙的做法。就像人一样,需要心跳来驱动每一个生理活动。)

OpenClaw可以连接飞书、钉钉、Discord等,以机器人的身份加入群聊或和用户私聊。这样一来,通过配置OpenClaw,我们就有了一个虚拟的助理角色。

我的OpenClaw配置过程

配置OpenClaw目前主流的有两种方式,一种是在Mac Mini上装OpenClaw,它将接管整个Mac系统;另一种是在VPS上配置。

Mac Mini配置的好处是可以可视化的观察到OpenClaw的自动工作过程,你可以观察到它将自动打开浏览器,访问网页,这个过程很神奇。此外,在Mac Mini的macOS系统上,OpenClaw可以直接连接Apple的Notes、Reminders等生态软件。

当然更加推荐使用VPS来安装OpenClaw,为了装这个而去买个Mac Mini,有点不太划算,如果发现在VPS上使用得很不错,可以再考虑入手Mac Mini。另外就是VPS更加安全、远程访问更加稳定。

我购买了一台Hetzner的服务器,性价比挺高的,3 CPU 4GB内存一个月只需9.9刀,而且我感觉4GB有点多了,2GB足够了。

hetzner

安装的话,用Claude Code一键安装即可,有了AI之后,这种粗活就不用我们插手了。

消息入口的话,因为我不用飞书和钉钉,所以我接了Discord和Telegram,主要用Discord。这里不得不说Discord的channel、thread划分,就是一个天然爆好用的LLM上下文容器,可以非常方便的做上下文隔离,不会导致各个任务的混淆。

我配置了如下的channel,它们都有各自的作用:

对于具体的任务,我会在#chat里直接让我的AI助理(名为阿伯特,英文名为Abot)创建task,每个task是一个帖子,独立的thread。

discord-tasks

OpenClaw能做什么?

第一,推送。心跳机制加上定时任务,就可以让LLM主动进行推送。例如每天早上推送当天的天气,热点新闻,如果自己有RSS订阅源的话,可以每天早上推送并简述更新的博客。推送提醒事项,只需要跟他说什么时候提醒你做什么事,他就会在规定时间提醒。所有的推送任务都不需要自己设置,一切只需要跟Abot对话即可,例如:“每天晚上提醒我吃鱼油”,然后他就会记住。

daily-feed

第二,无文件夹的即时对话任务。使用过Claude Code的都知道,如果需要此类工具完成一些稍微复杂的任务(这里指的是通过代码辅助),都需要建立一个文件夹,甚至有的代码还需要配置相应的环境。这个过程比较繁琐,尤其是没有电脑在身边时,几乎无法在手机上完成。与OpenClaw对话就不需要考虑这个问题,直接跟他说你要做什么,所有的附属代码文件,都会自动在云端储存,如果需要他输出文件的话,他也会直接发送附件到Discord或者飞书,手机端就可以直接看。举个例子,如果我配置了专门画图的模型,例如nanobanana模型,我就可以直接跟OpenClaw对话画图,然后返回图片附件给我。

draw

第三,长尾跟踪任务。对于一些需要长时间运作的任务,OpenClaw可以非常好的胜任,例如你需要它实时检测股票的涨跌情况,实时推送给你,或者需要蹲点等都可以让OpenClaw完成。只要触发指令,它就会将消息推送到Discord等软件。

第四,多agent玩法。可以建立多个agent,类似于多个员工,例如编程手、规划师、设计师等,每个agent都是一个角色,都有自己的名字和上下文,可以拉到一个群聊里,让他们互相协作完成任务,这个就真有点一人一公司的感觉了。

我对OpenClaw的想象

LLM是一个东西,可以想象成一个魔法盒子,这个盒子能够接受输入的文字,生成输出的文字。现在这个盒子越来越厉害,输出的内容越来越接近我们输入文字中想要的东西。对于这样一个强大的盒子,就有很多人想着怎么让他变得更加厉害,更加自动化,更加自主化,能够大大解放人的脑力劳动。就像蒸汽机发明之后,我们会去想怎么解放人的体力劳动一样。

如何利用好LLM这个魔法盒子?Claude Code等为LLM赋予了工具,使之不再是一个只会输出文字的盒子,而是可以自主阅读、检索、运行命令的小机器人,在人类的指令下完成复杂的编码工作,大大解放了程序员的脑力劳动。

更进一步,不满足于小机器人,我们希望LLM成为一个像钢铁侠中贾维斯一样的超级助理。不仅仅是在我们的指令下完成工作,而且能够完全脱离我们的指令,全流程自动完成任务,我们需要做的就是告诉他需要什么即可。不仅如此,这个贾维斯应当具有极强的记忆能力,知道主人的所有喜好、性格、生活习惯等,可以说是除自己以外最了解自己的存在。

目前OpenClaw已经几乎能够实现对主人的全方位了解,在我们通过编辑或者足够多的交流之后,OpenClaw会形成自己的个人文档,这些就是对主人的记忆。

OpenClaw还没有达到贾维斯的这种水平,但这是一个光明的方向,我觉得很快会到来,随着LLM的技术突破,更快的token输出速度,更低能耗,OpenClaw会慢慢发展逼近贾维斯。在贾维斯的更上一层,数字生命终会到来,现在已经有人在尝试使用LLM来构建自己的数字生命。同样的,这需要LLM技术的进步,目前的LLM在token上下文、输出速度上还不能达到数字生命的效果,至少在体验上还与想象远有差距。