搜 索

🦞 油炸小龙虾 —— OpenClaw 个人助手使用方法

  • 4阅读
  • 2026年02月11日
  • 0评论
首页 / AI/大数据 / 正文

在2026年1月的 AI 浪潮中,有个爆火的项目在短短几周内因为版权问题被迫改了三次名(Clawdbot → Moltbot → OpenClaw)。开发者 Peter Steinberger 用了 Molt(脱壳) 这个词,寓意像龙虾一样为了成长不断蜕皮,作为使用者只要记住它最新的名字好了OpenClaw。

现在OpenClaw(GitHub ⭐ 208k+,12,380+ commits)被公认为继 ChatGPT 之后 AI 领域的又一个里程碑。如果说 ChatGPT 是一个"博学但没手"的顾问,OpenClaw 就是那个真正能帮你干活的数字管家 —— 而且它住在你自己的机器上,听你一个人的话。

笔者上个月就尝试写这篇文章了,但是一直都不太满意,最终经过一段时间的探索使用,最近才完成。


一、OpenClaw 是什么?

OpenClaw 是一个开源的个人 AI 智能体(Agent)框架,由 Peter Steinberger 和社区共同打造,采用 MIT 协议。它运行在你的本地设备上,通过 API 连接大模型(Claude、GPT-4 等)作为"大脑",并直接接管你操作系统的权限来执行任务。

用一句话总结:Gateway 是控制平面,产品是助手本身。

核心能力一览

  • 全平台消息通道: WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage(通过 BlueBubbles)、Microsoft Teams、WebChat,甚至 Matrix、Zalo 等扩展通道。你用哪个聊天工具,它就出现在哪里。
  • 主动执行 + 心跳机制: 具备 Cron 触发器,能定时巡检。例如每小时检查 Gmail,发现重要合同自动下载并归档。
  • 持久记忆: 拥有一套 Workspace + Skills 体系,包含 memory.mdSOUL.mdIDENTITY.md 等模板文件,能持续学习和记住你的偏好。
  • 浏览器接管: 可选启用 Browser 控制(基于 Chromium),像真人一样点击、登录、填表、抓数据。
  • 语音交互: 支持 macOS/iOS/Android 语音输入输出,macOS 甚至支持 Voice Wake 唤醒。
  • Canvas 渲染: 能渲染一个你可以实时操控的 Live Canvas 界面。

二、架构与工作流程

整体架构图

graph TD User((👤 用户)) -- "发指令:Telegram / WhatsApp / Slack / ..." --> Gateway["🦞 OpenClaw Gateway
(控制平面)"] Gateway -- "解析意图" --> LLM["🧠 LLM 大脑
Claude Opus 4.6 / GPT-4"] LLM -- "返回执行计划" --> Agent["⚡ OpenClaw Agent
(Agent Loop)"] Agent -- "执行操作" --> LocalOS["💻 本地 OS / 浏览器 / Shell"] Agent -- "沙盒执行
(非主会话)" --> Docker["🐳 Docker Sandbox"] LocalOS -- "结果反馈" --> Agent Docker -- "结果反馈" --> Agent Agent -- "记录日志 + 记忆" --> Workspace["📂 Workspace
memory.md / Skills"] Agent -- "结果通知" --> User

通道接入矩阵

graph LR subgraph 主流通道 WA[WhatsApp] TG[Telegram] SL[Slack] DC[Discord] GC[Google Chat] SG[Signal] iM[iMessage] MT[MS Teams] WC[WebChat] end subgraph 扩展通道 BB[BlueBubbles] MX[Matrix] ZL[Zalo] ZP[Zalo Personal] end GW[🦞 Gateway] WA & TG & SL & DC & GC & SG & iM & MT & WC --> GW BB & MX & ZL & ZP --> GW

三、如何使用 OpenClaw?

1. 环境要求

项目要求
运行时Node.js ≥ 22
包管理器npm / pnpm / bun 均可
推荐模型Anthropic Claude Opus 4.6(Pro/Max 订阅)
操作系统macOS、Linux、Windows(通过 WSL2,强烈推荐)
可选依赖Docker(用于沙盒模式)、signal-cli(Signal 通道)、BlueBubbles Server(iMessage)

2. 推荐安装:Onboarding Wizard

最推荐的方式是使用官方引导向导,它会一步步带你配置 Gateway、Workspace、通道和技能:

# 全局安装
npm install -g openclaw@latest
# 或者
pnpm add -g openclaw@latest

# 运行引导向导(自动安装守护进程)
openclaw onboard --install-daemon

向导会自动安装 Gateway 守护进程(macOS 上是 launchd,Linux 上是 systemd user service),确保它常驻后台运行。

3. 快速启动

# 启动 Gateway
openclaw gateway --port 18789 --verbose

# 发送一条消息
openclaw message send --to +1234567890 --message "Hello from OpenClaw"

# 与助手对话(可投递到任意已连接通道)
openclaw agent --message "帮我整理下载文件夹里所有 2025 年的 PDF 发票" --thinking high

4. 最小配置文件

Gateway 的核心配置文件位于 ~/.openclaw/openclaw.json

{
  "agent": {
    "model": "anthropic/claude-opus-4-6"
  },
  "channels": {
    "telegram": {
      "botToken": "123456:ABCDEF"
    },
    "whatsapp": {
      "allowFrom": ["+8613800138000"]
    }
  },
  "browser": {
    "enabled": true
  }
}

5. 从源码构建(开发者)

git clone https://github.com/openclaw/openclaw.git
cd openclaw
pnpm install
pnpm ui:build    # 首次运行自动安装 UI 依赖
pnpm build
pnpm openclaw onboard --install-daemon

# 开发热重载
pnpm gateway:watch

6. 使用流程

flowchart LR A[安装 OpenClaw] --> B[运行 onboard 向导] B --> C[配置 API Key
Anthropic / OpenAI] C --> D[连接消息通道
Telegram / WhatsApp / ...] D --> E[启动 Gateway 守护进程] E --> F[通过聊天工具
下达指令] F --> G["🦞 享受龙虾服务!"]

四、为什么它会大火?(核心创新点)

OpenClaw 在不到半年内斩获 208k+ GitHub Stars,原因在于它打破了 AI 的"沙盒隔离",真正实现了 AI → 行动 的闭环。

创新点对比

维度传统 AI 助手(Siri / ChatGPT)OpenClaw
执行权限仅限 App 内部或特定插件系统级权限,可执行 Shell 命令、修改文件、操控浏览器
交互入口必须打开特定网页或 App全平台覆盖,通过你日常使用的聊天软件即可操控
主动性问一句动一句自主巡检,支持 Cron 触发器和 Webhook,主动发现并处理任务
部署模式纯云端,数据归大厂本地优先(Local-first),数据和记忆存在你自己的硬盘上
记忆系统会话结束即遗忘(或有限记忆)Workspace 持久记忆,SOUL / IDENTITY / MEMORY 多层记忆体系
安全模型由平台统一管控DM Pairing 机制,默认需配对码验证,未知用户无法交互
扩展性封闭生态Skills 插件体系,社区可贡献技能脚本

为什么说它是"一人公司"的标配?

graph TB subgraph 传统模式 Boss1[老板] --> Assistant[行政助理] Boss1 --> IT[IT 运维] Boss1 --> CS[客服] end subgraph OpenClaw 模式 Boss2[你] --> OC["🦞 OpenClaw"] OC --> Task1[自动整理文件] OC --> Task2[定时检查邮件] OC --> Task3[浏览器自动化] OC --> Task4[消息分发与回复] OC --> Task5[数据抓取与报表] end

一个人 + 一个配置良好的 OpenClaw = 一个初级助理 + 一个运维工程师 + 半个客服。这就是 "One-person Company" 时代的基础设施。


五、安全模型详解

OpenClaw 连接的是真实的消息通道,这意味着安全不是可选项,而是必需品。

DM Pairing 机制

默认行为:所有通道(Telegram / WhatsApp / Signal / iMessage / Discord / Slack 等)均采用 Pairing 模式。未知发送者会收到一个配对码,助手不会处理他们的消息

# 审批配对请求
openclaw pairing approve <channel> <code>

如需开放公共 DM,必须显式设置 dmPolicy="open" 并在 allowFrom 中包含 "*"

沙盒隔离

graph TD Main["主会话
(你自己)"] -- "直接运行在主机" --> Host["💻 Host OS"] Group["群组/通道会话
(他人)"] -- "隔离到 Docker" --> Sandbox["🐳 Docker Sandbox
per-session"] Sandbox -- "白名单工具:bash, read, write, edit..." --> Allow[✅ 允许] Sandbox -- "黑名单工具:browser, canvas, cron..." --> Deny[❌ 拒绝]

配置 agents.defaults.sandbox.mode: "non-main" 即可让非主会话自动在 Docker 沙盒中运行。

# 运行安全检查
openclaw doctor

六、缺陷与不足

尽管 OpenClaw 势头迅猛,但它目前仍处于"高级发烧友"阶段,以下问题值得关注:

1. 🔴 安全隐患(最致命)

给予 AI 系统级权限 = 把家门钥匙交给一个"聪明但偶尔犯糊涂"的机器人。核心风险是 Prompt Injection(提示词注入):一封精心构造的恶意邮件可能诱导你的 AI 执行危险命令。

建议: 务必在 Docker 容器或虚拟机中运行,并严格配置 allowFrom 白名单。

2. 🟡 部署门槛较高

虽然有 Onboarding Wizard,但用户仍然需要:

  • 熟悉终端操作和 Node.js 生态
  • 理解 API Key、Bot Token 等概念
  • 处理网络穿透(如通过 SSH Tunnel 或 Tailnet 实现远程访问)

对于非技术背景的用户,这条路走起来并不轻松。

3. 🟡 运行成本

为了支撑 Agent 的"思考-反思-记忆"循环,OpenClaw 在对话中会消耗大量 Token。官方推荐的 Claude Opus 4.6 是目前最强也是最贵的模型。如果频繁使用 --thinking high 模式,每月 API 账单可能达到数百美元。

提示: 官方推荐使用 Anthropic Pro/Max 订阅($100/$200/月)以获得更稳定的速率限制和成本控制。

4. 🟠 浏览器自动化稳定性

由于网页 UI 频繁更新,Browser 控制偶尔会"翻车":在复杂的弹窗、验证码、动态加载页面面前,AI 可能陷入死循环或无限重试。

5. 🟠 生态仍在早期

Skills 插件体系虽然灵活,但社区生态还在建设中。很多高级场景(如复杂的多步骤工作流)仍需要用户自己编写 Skill 脚本。


七、发展通道与更新策略

OpenClaw 提供三个发布通道:

graph LR S["🟢 stable
tagged releases
npm: latest"] B["🟡 beta
prerelease tags
npm: beta"] D["🔴 dev
main 分支 HEAD
npm: dev"] S --- B --- D
# 切换通道
openclaw update --channel stable|beta|dev

# 健康检查 & 升级诊断
openclaw doctor

八、总结

OpenClaw 代表了 AI 助手从"对话工具"到"执行引擎"的范式转变。它的核心哲学很简单:

你的助手应该住在你的机器上,听你的指令,通过你熟悉的通道工作,并且永远记得你是谁。
适合人群不适合人群
有一定技术背景的独立开发者完全不懂终端的普通用户
想打造"一人公司"效率体系的创业者对数据安全要求极高但不愿折腾的企业
喜欢折腾自托管服务的极客预算有限且只需要基础 AI 对话的用户
需要跨平台统一消息管理的重度用户对 AI 权限扩张持保守态度的人

一个人 + 一只龙虾 🦞 = 一整个团队。 这就是 OpenClaw 描绘的未来。

评论区
暂无评论
avatar