🦞 油炸小龙虾 —— OpenClaw 个人助手使用方法

文章	评论	标签
131	0	226

在2026年1月的 AI 浪潮中，有个爆火的项目在短短几周内因为版权问题被迫改了三次名（Clawdbot → Moltbot → OpenClaw）。开发者 Peter Steinberger 用了 Molt（脱壳）这个词，寓意像龙虾一样为了成长不断蜕皮，作为使用者只要记住它最新的名字好了OpenClaw。

现在OpenClaw（GitHub ⭐ 208k+，12,380+ commits）被公认为继 ChatGPT 之后 AI 领域的又一个里程碑。如果说 ChatGPT 是一个"博学但没手"的顾问，OpenClaw 就是那个真正能帮你干活的数字管家 —— 而且它住在你自己的机器上，听你一个人的话。

笔者上个月就尝试写这篇文章了，但是一直都不太满意，最终经过一段时间的探索使用，最近才完成。

一、OpenClaw 是什么？

OpenClaw 是一个开源的个人 AI 智能体（Agent）框架，由 Peter Steinberger 和社区共同打造，采用 MIT 协议。它运行在你的本地设备上，通过 API 连接大模型（Claude、GPT-4 等）作为"大脑"，并直接接管你操作系统的权限来执行任务。

用一句话总结：Gateway 是控制平面，产品是助手本身。

核心能力一览

全平台消息通道： WhatsApp、Telegram、Slack、Discord、Google Chat、Signal、iMessage（通过 BlueBubbles）、Microsoft Teams、WebChat，甚至 Matrix、Zalo 等扩展通道。你用哪个聊天工具，它就出现在哪里。
主动执行 + 心跳机制： 具备 Cron 触发器，能定时巡检。例如每小时检查 Gmail，发现重要合同自动下载并归档。
持久记忆： 拥有一套 Workspace + Skills 体系，包含 memory.md、SOUL.md、IDENTITY.md 等模板文件，能持续学习和记住你的偏好。
浏览器接管： 可选启用 Browser 控制（基于 Chromium），像真人一样点击、登录、填表、抓数据。
语音交互： 支持 macOS/iOS/Android 语音输入输出，macOS 甚至支持 Voice Wake 唤醒。
Canvas 渲染： 能渲染一个你可以实时操控的 Live Canvas 界面。

二、架构与工作流程

整体架构图

graph TD User((👤 用户)) -- "发指令：Telegram / WhatsApp / Slack / ..." --> Gateway["🦞 OpenClaw Gateway
(控制平面)"] Gateway -- "解析意图" --> LLM["🧠 LLM 大脑
Claude Opus 4.6 / GPT-4"] LLM -- "返回执行计划" --> Agent["⚡ OpenClaw Agent
(Agent Loop)"] Agent -- "执行操作" --> LocalOS["💻 本地 OS / 浏览器 / Shell"] Agent -- "沙盒执行
(非主会话)" --> Docker["🐳 Docker Sandbox"] LocalOS -- "结果反馈" --> Agent Docker -- "结果反馈" --> Agent Agent -- "记录日志 + 记忆" --> Workspace["📂 Workspace
memory.md / Skills"] Agent -- "结果通知" --> User

通道接入矩阵

graph LR subgraph 主流通道 WA[WhatsApp] TG[Telegram] SL[Slack] DC[Discord] GC[Google Chat] SG[Signal] iM[iMessage] MT[MS Teams] WC[WebChat] end subgraph 扩展通道 BB[BlueBubbles] MX[Matrix] ZL[Zalo] ZP[Zalo Personal] end GW[🦞 Gateway] WA & TG & SL & DC & GC & SG & iM & MT & WC --> GW BB & MX & ZL & ZP --> GW

三、如何使用 OpenClaw？

1. 环境要求

项目	要求
运行时	Node.js ≥ 22
包管理器	npm / pnpm / bun 均可
推荐模型	Anthropic Claude Opus 4.6（Pro/Max 订阅）
操作系统	macOS、Linux、Windows（通过 WSL2，强烈推荐）
可选依赖	Docker（用于沙盒模式）、signal-cli（Signal 通道）、BlueBubbles Server（iMessage）

2. 推荐安装：Onboarding Wizard

最推荐的方式是使用官方引导向导，它会一步步带你配置 Gateway、Workspace、通道和技能：

# 全局安装
npm install -g openclaw@latest
# 或者
pnpm add -g openclaw@latest

# 运行引导向导（自动安装守护进程）
openclaw onboard --install-daemon

向导会自动安装 Gateway 守护进程（macOS 上是 launchd，Linux 上是 systemd user service），确保它常驻后台运行。

3. 快速启动

# 启动 Gateway
openclaw gateway --port 18789 --verbose

# 发送一条消息
openclaw message send --to +1234567890 --message "Hello from OpenClaw"

# 与助手对话（可投递到任意已连接通道）
openclaw agent --message "帮我整理下载文件夹里所有 2025 年的 PDF 发票" --thinking high

4. 最小配置文件

Gateway 的核心配置文件位于 ~/.openclaw/openclaw.json：

{
  "agent": {
    "model": "anthropic/claude-opus-4-6"
  },
  "channels": {
    "telegram": {
      "botToken": "123456:ABCDEF"
    },
    "whatsapp": {
      "allowFrom": ["+8613800138000"]
    }
  },
  "browser": {
    "enabled": true
  }
}

5. 从源码构建（开发者）

git clone https://github.com/openclaw/openclaw.git
cd openclaw
pnpm install
pnpm ui:build    # 首次运行自动安装 UI 依赖
pnpm build
pnpm openclaw onboard --install-daemon

# 开发热重载
pnpm gateway:watch

6. 使用流程

flowchart LR A[安装 OpenClaw] --> B[运行 onboard 向导] B --> C[配置 API Key
Anthropic / OpenAI] C --> D[连接消息通道
Telegram / WhatsApp / ...] D --> E[启动 Gateway 守护进程] E --> F[通过聊天工具
下达指令] F --> G["🦞 享受龙虾服务!"]

四、为什么它会大火？（核心创新点）

OpenClaw 在不到半年内斩获 208k+ GitHub Stars，原因在于它打破了 AI 的"沙盒隔离"，真正实现了 AI → 行动 的闭环。

创新点对比

维度	传统 AI 助手（Siri / ChatGPT）	OpenClaw
执行权限	仅限 App 内部或特定插件	系统级权限，可执行 Shell 命令、修改文件、操控浏览器
交互入口	必须打开特定网页或 App	全平台覆盖，通过你日常使用的聊天软件即可操控
主动性	问一句动一句	自主巡检，支持 Cron 触发器和 Webhook，主动发现并处理任务
部署模式	纯云端，数据归大厂	本地优先（Local-first），数据和记忆存在你自己的硬盘上
记忆系统	会话结束即遗忘（或有限记忆）	Workspace 持久记忆，SOUL / IDENTITY / MEMORY 多层记忆体系
安全模型	由平台统一管控	DM Pairing 机制，默认需配对码验证，未知用户无法交互
扩展性	封闭生态	Skills 插件体系，社区可贡献技能脚本

为什么说它是"一人公司"的标配？

graph TB subgraph 传统模式 Boss1[老板] --> Assistant[行政助理] Boss1 --> IT[IT 运维] Boss1 --> CS[客服] end subgraph OpenClaw 模式 Boss2[你] --> OC["🦞 OpenClaw"] OC --> Task1[自动整理文件] OC --> Task2[定时检查邮件] OC --> Task3[浏览器自动化] OC --> Task4[消息分发与回复] OC --> Task5[数据抓取与报表] end

一个人 + 一个配置良好的 OpenClaw = 一个初级助理 + 一个运维工程师 + 半个客服。这就是 "One-person Company" 时代的基础设施。

五、安全模型详解

OpenClaw 连接的是真实的消息通道，这意味着安全不是可选项，而是必需品。

DM Pairing 机制

默认行为：所有通道（Telegram / WhatsApp / Signal / iMessage / Discord / Slack 等）均采用 Pairing 模式。未知发送者会收到一个配对码，助手不会处理他们的消息。

# 审批配对请求
openclaw pairing approve <channel> <code>

如需开放公共 DM，必须显式设置 dmPolicy="open" 并在 allowFrom 中包含 "*"。

沙盒隔离

graph TD Main["主会话
(你自己)"] -- "直接运行在主机" --> Host["💻 Host OS"] Group["群组/通道会话
(他人)"] -- "隔离到 Docker" --> Sandbox["🐳 Docker Sandbox
per-session"] Sandbox -- "白名单工具：bash, read, write, edit..." --> Allow[✅ 允许] Sandbox -- "黑名单工具：browser, canvas, cron..." --> Deny[❌ 拒绝]

配置 agents.defaults.sandbox.mode: "non-main" 即可让非主会话自动在 Docker 沙盒中运行。

# 运行安全检查
openclaw doctor

六、缺陷与不足

尽管 OpenClaw 势头迅猛，但它目前仍处于"高级发烧友"阶段，以下问题值得关注：

1. 🔴 安全隐患（最致命）

给予 AI 系统级权限 = 把家门钥匙交给一个"聪明但偶尔犯糊涂"的机器人。核心风险是 Prompt Injection（提示词注入）：一封精心构造的恶意邮件可能诱导你的 AI 执行危险命令。

建议： 务必在 Docker 容器或虚拟机中运行，并严格配置 allowFrom 白名单。

2. 🟡 部署门槛较高

虽然有 Onboarding Wizard，但用户仍然需要：

熟悉终端操作和 Node.js 生态
理解 API Key、Bot Token 等概念
处理网络穿透（如通过 SSH Tunnel 或 Tailnet 实现远程访问）

对于非技术背景的用户，这条路走起来并不轻松。

3. 🟡 运行成本

为了支撑 Agent 的"思考-反思-记忆"循环，OpenClaw 在对话中会消耗大量 Token。官方推荐的 Claude Opus 4.6 是目前最强也是最贵的模型。如果频繁使用 --thinking high 模式，每月 API 账单可能达到数百美元。

提示： 官方推荐使用 Anthropic Pro/Max 订阅（$100/$200/月）以获得更稳定的速率限制和成本控制。

4. 🟠 浏览器自动化稳定性

由于网页 UI 频繁更新，Browser 控制偶尔会"翻车"：在复杂的弹窗、验证码、动态加载页面面前，AI 可能陷入死循环或无限重试。

5. 🟠 生态仍在早期

Skills 插件体系虽然灵活，但社区生态还在建设中。很多高级场景（如复杂的多步骤工作流）仍需要用户自己编写 Skill 脚本。

七、发展通道与更新策略

OpenClaw 提供三个发布通道：

graph LR S["🟢 stable
tagged releases
npm: latest"] B["🟡 beta
prerelease tags
npm: beta"] D["🔴 dev
main 分支 HEAD
npm: dev"] S --- B --- D

# 切换通道
openclaw update --channel stable|beta|dev

# 健康检查 & 升级诊断
openclaw doctor

八、总结

OpenClaw 代表了 AI 助手从"对话工具"到"执行引擎"的范式转变。它的核心哲学很简单：

你的助手应该住在你的机器上，听你的指令，通过你熟悉的通道工作，并且永远记得你是谁。

适合人群	不适合人群
有一定技术背景的独立开发者	完全不懂终端的普通用户
想打造"一人公司"效率体系的创业者	对数据安全要求极高但不愿折腾的企业
喜欢折腾自托管服务的极客	预算有限且只需要基础 AI 对话的用户
需要跨平台统一消息管理的重度用户	对 AI 权限扩张持保守态度的人

一个人 + 一只龙虾 🦞 = 一整个团队。 这就是 OpenClaw 描绘的未来。