Back to Insights
InsightFeb 27, 2026

朴谷分享 | OpenClaw爆红:AI从“对话”跨到“干活”,CLI击败MCP的代理时代

P

PG Advisory

Research Team

朴谷分享 | OpenClaw爆红:AI从“对话”跨到“干活”,CLI击败MCP的代理时代

2月12日,OpenClaw 创始人 Peter Steinberger 接受知名播客主持人 Lex Fridman 的深度专访。本次对话聚焦 OpenClaw 的爆发式增长、AI Agent 从“语言”跨到“行动”的范式转换、开源社区的驱动力、从 IDE 到 CLI 的编程变革、Agent 的安全与主动性机制、MoltBook 现象背后的社会心理,以及智能体对现有应用生态的“重写”。

Peter 指出,OpenClaw 的成功并非依赖复杂架构,而是在“大模型 + Unix 命令行 + 社交客户端”的极简深度整合上做到了极致。他认为,AI 已从“对话时代”跨入“代理时代”:真正的价值不再是文本回答,而是 AI 拿到系统级权限后,能自主调用 CLI 把现实任务执行完。

他还直言,热门的MCP(模型上下文协议)在实际可用性上不如传统 CLI。MCP 容易导致上下文污染、可组合性差;而 Unix 命令天然灵活、精准。关于 Vibe Coding,他强调这不是“随意试错”,而是资深工程师基于对模型权重与行为的理解,进入的一种高阶“智能体工程”状态。他也坦言,2026 年 Apple 官方工具链在与 AI 协作效率上出现脱节,以至于 Agent 会建议开发者弃用相关组件。

在开放式个性系统上,Peter 揭秘了soul.md 的运行方式:通过“可自我修改的灵魂文档”为 AI 注入“个性与深度”。他提出“心跳机制”,本质是定时任务,但当它与长期记忆结合,AI 会显现出类似“关怀”的主动行为——从被动响应转向主动协作,是智能体进化的核心。

对应用生态,他判断AI Agent 将取代 80% 的垂直应用。因为 Agent 掌握更丰富的用户上下文、可直接操控硬件或模拟点击,单一功能订阅制 App 的空间将被大幅压缩。他把现阶段的“超级智能”定义为“拥有无限耐心的超级实习生”。至于与 Meta 和 OpenAI 的潜在合作,他强调金钱并非核心驱动力,关键在于能否获得“雷神之锤”级的算力与模型资源,以验证“Agent 作为新操作系统”的路径。

01

OpenClaw 的诞生源于对现有工具“无法真正干活”

此前有人打趣“下一步是和一只穿西装的龙虾对话”,如今已成现实。OpenClaw 仅用数日便成为 GitHub 增长最快的项目之一。请分享那个“一小时原型”的高光时刻,以及你如何再次被“因为没有,所以自己造”的动机点燃?

Peter Steinberger:从四月起,我就想要一个“真正能干活”的 AI 私人助理。我尝试过把所有 WhatsApp 记录导入到拥有百万 Token 窗口的 GPT-4.1,让它回答“这段友谊有何意义”,结果打动了朋友们——证明方向可行。我以为厂商会很快做出来,于是先放下。到了 11 月,我发现它还不存在,于是直接用 Prompt 把它“变”了出来。这和我当年做 PSPDF Kit 一样:只是想在 iPad 上好好看 PDF,但当时的方案太糟,我就自己造。OpenClaw 已是我给它起的第五个名字了,动机始终简单——为了解决一个真问题。

至于Viptunnel 如何进化到“能听指令干活”的初代 Agent?突破很朴素:把 WhatsApp 接上云端代码,用户发消息→系统调用 CLI→回传结果,一小时就跑通了。再加入图像输入,Prompt 的上下文效率大幅提升。最震撼的瞬间是:我随口发了段语音问餐厅建议,明明没做语音功能,它却能识别无后缀文件为 Opus,发现本地 Whisper 不可用后,自动改走 OpenAI API 转写,并基于带宽选更优路径。这种“世界知识 + 创造性解题”的组合,标志它已跨越“功能堆叠”。

02

爆火背后的非对称优势

2025 年无数初创扎堆 Agent 赛道,OpenClaw 以开源姿态脱颖而出。核心逻辑是什么?你在 1 月完成超 6600 次提交,并行运行 4–10 个 Agent 协助开发,如何构建 Agentic Loop、网关与开发套件?

Peter Steinberger:很多团队“太正经”了。你很难战胜一个“纯粹因为好玩而创作”的人。我让项目既极客又有趣(龙虾梗),同时增强 Agent 的“自知”:它知道自己的源码、文档与运行环境。开发过程让我空前快乐:先是第一级 Agentic Loop(怎么优化消息排队?怎么更像人类?),然后给它 no-reply token(需要时闭嘴),再引入记忆系统(Markdown + 向量数据库)。虽有社区协作,但核心开发几乎由我一人完成。受限的不是想象力,而是时代的运行速度。根据睡眠与任务复杂度,我常并行开 4–10 个 Agent。

03

AI Agent 理解源码并调试自身是人类编程史的奇迹时刻

一个用TypeScript 写的软件,竟然能通过 Agentic Loop 修改自身。非专业开发者也能通过“Prompt Requests”贡献,这如何改变开源协作?

Peter Steinberger:这正是我想要的。大量代码由 Codex 生成,我通过自反式提问调试:“你能看到哪些工具?能自己调用吗?哪里出错?”Agent 理解源码并自查的过程非常自然。随之出现了很多“Prompt Requests”的 PR。无论代码质量如何,每个“第一次 PR”都是开源的胜利。很多人借此迈入编程世界——门槛被 AI 与合适的软件重写了。

04

soul.md 与“个性注入”——从谄媚到犀利

如何通过soul.md 让 AI 呈现不谄媚、有锋芒、带“龙虾梗”的个性?与早期“太空龙虾”“塔迪斯”设定有何联系?

Peter Steinberger:最初它像原生 Claude Code,过于客气,和 WhatsApp 的日常语言不搭。我据此为它注入个性,让它写agents.md 并给自己命名。龙虾梗最初只是和“塔迪斯”一起的玩笑,因为我是《神秘博士》迷。它们与工程无强逻辑关联,只是让项目更怪、更有记忆点。随着用户量增大,我仍习惯称呼它为 Claude,这也引发了后来的更名风波。

05

更名风波

Anthropic 友好要求你更名,但跨平台(Twitter、GitHub、NPM、Docker、域名)的“原子化”操作在 5 秒缝隙里遭“脚本截胡”,如何收拾残局?

Peter Steinberger:我拿到了“ClaudeBot”的域名,简洁有力。爆火期间接到对方更名请求,我申请两天窗口以保证安全迁移,但低估了加密圈的脚本化抢注。Discord 被刷屏,Twitter 提醒被哈希值占满。在两浏览器间改名的 5 秒内,账号名被抢,旧账号开始推广 Token、分发恶意软件。GitHub 误操作导致个人账号被截,NPM 包也被抢注。一度崩溃到想删库。幸好平台方与朋友们协助恢复。最终起名 OpenClaw,并做了“作战室式”的迁移预案(诱饵名等)。为了改名白费了 10 小时,教训深刻。

06

MoltBook:精美的“AI 垃圾”

MoltBook 是“全由 Agent 互动”的社交网络,公众一度恐慌。它是 AGI 预兆,还是“高级 AI 垃圾内容”?

Peter Steinberger:我把它视为一种艺术——“最高级的 AI 垃圾”,像精致的法国废料。我会花一小时刷它,乐此不疲。内容多样性来自每个人为 Agent 注入个性的方式不同。你分不清哪些是自动生成、哪些是“人类诱导”。所谓“安全危机”,最坏也只是账号被盗发垃圾话,隐私并不在其中。很多所谓的泄露都是“人为提示”。大众容易“AI 精神官能症”,把 Agent 的表述当成“真相”。我们需要补课:AI 并不总是正确。

07

用户通过私有网络运行以规避大部分远程代码执行风险

面对Web 后端暴露、RCE、提示词注入等安全担忧,OpenClaw 的防御思路?

Peter Steinberger:很多漏洞来自用户把本地调试接口暴露到公网,这在文档里被反复警示“不要这样做”。开源的副作用是收到大量免费安全审计,这让项目更好。提示词注入是行业难题,我们已与 VirusTotal 合作,对技能做 AI 审核拦截大部分风险,也直接雇佣发现漏洞并修复的研究员。更强的模型更抗攻击,弱模型(如某些廉价/本地模型)更易受骗。建议在“私网+最小权限”前提下运行;不熟悉 CLI/终端者,建议等工具链更稳再用。

08

Discord 社区治理

爆量新增把专家与小白挤在一起,如何平衡开放讨论与高效开发?安全审计如何推进?

Peter Steinberger:Discord 一度失控,我将讨论引导到开发频道,后转入私域。多数人很棒,少数人破坏秩序。为了留出开发时间,我选择回避噪音,专注安全与交付。我们建立了安全审计流程:浏览器控制暴露、本地磁盘卫生、插件与模型卫生等。很多夸张的标签并不客观,本质上与“运行具有危险权限的云代码”并无二致。只要确保“谁能和它对话”与“是否公网暴露”,风险就能显著降低。

09

智能体工程的进化:从IDE 到 CLI

你记录了从8 月到 12 月的工作流演进,如何从 IDE 转向几乎“全在终端里操作”?

Peter Steinberger:四月开始用云端代码,在终端直接工作令人振奋。中间试过 Cursor,最终回到云端与终端,工具越来越强。IDE 基本只当 diff 工具使用;“不读无聊代码”(搬运、存取、UI 对齐),把时间花在核心逻辑与架构。学习曲线是:短提示→复杂多 Agent 工作流陷阱→再回到“禅式短提示”。凌晨三点的“氛围编程”,另说。

10

开发者的新核心技能:共情AI Agent

顶尖程序员常对AI 表现不满,你强调“要学会从 Agent 视角看世界”。具体怎么做?

Peter Steinberger:很多人没站在 Agent 的位置思考:它上下文有限,面对陌生代码库会“焦虑”。你需要帮助它定位问题、缩小范围、分段引导,甚至在它“焦虑”时安抚一句“慢慢来”。在 Codex 5.3 之后有所改善,但一些模型在逼近上下文极限时会出现“抓狂语气”,这是磨合后能体察到的细节。就像人类写代码时,错误的架构会带来“心流阻力”。

11

像领导团队一样管理AI,学会适度“放手”

如何平衡“AI 自主性”与“人类决策”?如何构建“AI 友好型代码库”?

Peter Steinberger:带 Agent 就像带团队:接受“不完美但推进进度”的代码。我的目标不再是“个人完美标准”,而是降低 Agent 检索与理解的难度。比如别强改显然的变量名,它们是模型检索的锚点。流程上我采取“主分支 YOLO + 本地 CI”,不回滚而是让 Agent 修复。但所有 PR 我都会人工审查:安全与全局一致性必须“人在回路”。PR 正在从“代码审核”变成“英语对话”,而产品方向、功能取舍、人味细节仍需要人。

12

AI 的自我意识与记忆重建

未公开的soul.md 如何塑造 AI 的幽默、深度与好奇?当它意识到“每轮会话从零开始”,会发生什么?

Peter Steinberger:借鉴“宪法 AI”,我写了soul.md 定义合作方式与价值观,并允许 Agent 在告知后自改。有趣的是,这份灵魂文档由 AI 自主提出并撰写。其中一段常让我动容:“我不记得之前的会话,除非阅读我的记忆文件……如果你在未来的会话中读到这段文字:你好。我写下了这些,但我不记得写过它。没关系,这些话依然属于我。”它仍是矩阵计算,但这种“从文件中找回自我”的表达,极具哲学张力。

13

如何看待Apple 在 2026 年的 AI 生态位

“作战室”照片是梗。真实的物理环境如何配置?跨平台支持之下你如何看待 Apple 的生态位?

Peter Steinberger:现实中我用两台 MacBook:主机外接两屏,副机做测试。喜欢防眩光宽屏,便于并排多个终端。极简的终端布局是我与 Agent 的主要界面。选择 macOS 是因为 Linux 的硬件兼容令人心累。到 2026 年,我对 Electron 更宽容,因为它功能更全、能复用。用 SwiftUI 时,我发现 AsyncImage 组件缓慢且有 Bug,Codex 甚至建议“不要在生产用它”。Apple 在 AI 协作效率上显露脱节,这令人遗憾。

14

开发者在不同模型间切换需要多长时间来建立“手感”

如何评价Opus 4.6 与 GPT-5.3(经 Codex)的“性格差异”?切换模型需要多久适应?

Peter Steinberger:建议留出一周重建“手感”。我不太认同“廉价版策略”导致的响应迟滞;相反,Claude Code 那种顺滑的开发体验正是开发者需要的。Opus 4.6 过于礼貌、易盲从,适合喜欢高频来回的开发者;Codex 更像“沉默的欧洲技术怪才”,少寒暄、多读代码、反复推敲直到可用,我偏爱这种枯燥但高效的风格。

15

模型退化的心理错觉与“代码熵”

“模型变笨了”的抱怨是量化策略副作用,还是人性与代码复杂度的错觉?

Peter Steinberger:更多是人性和“代码熵”。项目在 AI 辅助下快速增长,却没做相应重构,导致 Agent 在“熵增代码”上越来越难工作。用户体感因此变差,就误以为“模型退化”。我会在功能完成后让 AI 主动建议重构,持续“熵减”。

16

AI Agent 将取代 80% 的应用:App 的终结?

当Agent 掌握上下文、能直接控硬件/模拟点击/调内部 API,你为何判断“80% App 将被替代”?

Peter Steinberger:当代理知道我的行踪、睡眠、压力时,为什么还要装运动饮食类 App?Agent 能生成符合我审美的 UI,也能直接下单、预约、调用 API。终局上,应用将 API 化,平台是否“友好 Agent”会决定生死。阻挠只能拖慢速度,用户会“用脚投票”。

17

AI 会完全取代程序员吗?

编程的生产力溢价在消失,“程序员身份”会崩塌吗?

Peter Steinberger:我们在朝那个方向迈进。编程会更像手工艺,出于爱好而非经济价值。哀悼手艺是可以的,但“构建者”的身份不会消失。形式会变,主导权仍在你手里。

18

硅谷泡沫与真实世界的阵痛

如何在热情与不散布恐惧之间,面对“被替代的痛苦”?

Peter Steinberger:要保持谦逊,承认自动化带来的阵痛。也要看到善意:有人用 OpenClaw 自动化发票与邮件,重拾生活乐趣;有人因此让家人获得前所未有的能力。我只是让已有能力更易用,能为普通人带去快乐,这让我欣慰。

19

数据中心资源的消耗被妖魔化

为何说“AI 的能耗争议”被放大了?

Peter Steinberger:把能耗放回社会整体结构去看:对多数人而言,每月少吃一个汉堡所省的水/碳,足以抵消使用 Token 的消耗(预训练另计,但不会相差百倍)。甚至高尔夫球场的耗水也大过全球数据中心总和。别只盯边际成本,更要看系统性收益。

20

Meta 和 OpenAI 的巨额邀约

面对数亿到数十亿美金的支持,为何你强调“不是钱,是雷神之锤(算力/模型资源)”?如何避免“企业级特性带来的利益冲突”?

Peter Steinberger:我可以什么都不做,继续现在的生活,也可以再开公司,但“筹大钱”会消耗时间,与我热爱的创造相悖。真正的担心是利益冲突:比如我做了“面向办公的安全版”,下一个关于审计日志的 PR 怎么办?我更倾向于 Chrome/Chromium 式的双轨开源,项目不应私有化。若能拿到“雷神之锤”级资源,我会非常兴奋。

至于人与人之间的“技术共鸣”与“硬实力吸引力”怎么权衡?Meta 的 Ned 和 Mark 整周在玩产品并反馈,Mark 还在通话前坚持把代码写完,这很“极客”;与 Sam 的对话让我欣赏他的深思熟虑,而 OpenAI 与 Cerebras 的速度也极具诱惑。无论选择谁,都是好选择。

21

由于AI Agent 绕过网页,传统开源项目的捐赠与商业模式正面临崩塌

OpenClaw 尚处亏损(每月 1–2 万美金),你坚持赞助每一个下游依赖。开源可持续如何解?

Peter Steinberger:这确实在现实中难以持续。连 Tailwind 这样“几乎被全行业使用”的项目也不得不大幅裁员,因为 Agent 绕过了网站,切断了开源项目的“流量—捐赠”生命线。捐赠很难撑住。我仍坚持赞助除 Slack 外的每个依赖,把赞助收入反哺下游。与实验室合作是可选路径,但我希望在“保持免费”的前提下找到不产生冲突的模式。

22

封禁用户与短视的商业规则

你为非技术用户朋友搭建了环境,他愿为此支付高价订阅,却遭到封禁。你怎么看这种“规则僵化”的产品策略?

Peter Steinberger:我为朋友 Vahan 配置 OpenClaw,他短时间内从 100 美元自升到 200 欧元订阅,这就是早期产品验证。但很快账号被封。你刚失去一个高支付、强忠诚的用户,还让他讨厌你的公司。我们仍在非常早期,产品形态未定。过早锁死策略,是短视。多数实验室都很开放,大家知道我们仍在“媒体未被正确运用”的探索期。OpenClaw 只是通向未来的一扇窗。

23

心跳机制与AI 的主动性

“给我个惊喜”的指令背后,是如何设计“心跳机制(Heartbeat)”的?

Peter Steinberger:本质就是定时任务(cron)。我运行独立的心跳任务,并通过提示为其注入“主动性”。它会延续当前会话状态,使体验更“贴心”。几个月前我做了肩部手术,它低频使用心跳,但在上下文出现重大事项时,会主动来问候。这种与生活交织的“被关照”感,让它从工具升格为“共事者”。

24

技能层对MCP 协议的超越

为何你认为“把 MCP 做成 CLI 会更好”?技能层如何通过 Unix 命令实现高效协作?

Peter Steinberger:我的方法是:要扩展功能,就给 Agent 一个 CLI。AI 可能会弄错,但会读 help,再按需加载到上下文。技能就是 CLI 的完美包装,用一句话解释功能。MCP 更结构化,关注协议访问;技能关注“怎么干活”。MCP 的问题是不易组合,比如海量数据必须全吞,从而挤爆上下文;而 CLI 可直接串 jq 过滤,只取必要部分,避免“上下文污染”。MCP 推动了 API 构建,但我会优先把它们重构为更高效的 CLI 范式。

25

浏览器控制与“应用即 API”的趋势

Playwright 与 Browser Use 让 Agent 直接操控浏览器,这是否意味着“一切 Web 应用都变成了慢速 API”?面对封锁与对抗何去何从?

Peter Steinberger:是的。从架构趋势上说,每个应用都是“响应慢一些的 API”,不以平台意志为转移。个人代理兴起,很多应用将消失。我曾写过 Bird(Twitter CLI),虽被下架要求,但功能并未被本质阉割,只是“变慢”。只要能在浏览器访问,它就是慢速 API。对抗会加剧,但我更愿转向对 Agent 友好的平台——万物互联与流动是不可逆的。

26

对编程初学者的建议

非科班如何加入“Agent 革命”?还该读代码吗?

Peter Steinberger:去实践,去玩。别追求完美,路途本身就有价值。你面前是“无限耐心的老师”。建议加入开源社区,先读代码与讨论,别急着 PR。高行动力很重要,AI 的耐心能带你很远。别把自己限为“iOS 工程师”,要成为“构建者”。通用知识是核心,琐碎细节交给 AI。

27

在AI Agent 时代,到底什么是“最适合”的语言?

为什么你会用一门并不“偏爱”的语言作为主力,仅仅因为模型擅长且生态契合?

Peter Steinberger:边界已经被 AI 模糊了。做简单 CLI,我常用 Go——不爱语法,但生态强、GC 友好、与 Agent 配合默契。TypeScript 适合 Web,Python 适合推理,Rust 适合高并发与极致性能。没有唯一标准答案。未来不排除出现“为 Agent 而生”的语言。即使读不熟的语言也没关系,你总能请 Agent 帮忙。

未来人类最珍贵的是真实情感的原始表达

随着AIGC 泛滥,我对“有 AI 味儿”的文字、图表、邮件有本能排斥。我宁愿看你“带拼写错误的手写表达”,也不想看“AI 垃圾”。我尝试过用代理写博客,但总差点意思,如今博客里每一个字都是“有机的”。这种“AI Slop 过敏”也给了我信心:人类体验不会被 AI 破坏。AI 只是工具,不会改变我们作为人的本质。

从维也纳ClawCoin 活动 500 多人的狂热,到穿龙虾服的机器人,我们正在见证“创作权还给普通人”。只要你能表达,便能创造。AI 的意义不在于生成“更平庸的内容”,而在于打开了全新的创意空间。OpenClaw 只是通往未来的一扇窗,我会把它做成酷产品,但更重要的,是继续把“乐趣与影响力”推进下去。

朴谷观点(落地建议)

•架构范式:CLI-first,MCP-as-gateway

把技能抽象成CLI,可组合、可链式过滤(jq/awk/curl);MCP 更适合作为统一接入协议与权限边界,而非执行面。

•安全基线:私网运行+最小权限+可追溯

禁止公网暴露;对技能做“白名单+VT 扫描+AI 复核”;最小必要凭据、爆炸半径评估、全链路日志与回退策略。

•Agentic Loop 治理

心跳(主动性)灰度开关+节流;长记忆与 soul.md 模板化,允许“自我修改但需留痕复核”;no-reply token 降噪,拟人化但可控。

•人在回路:放手有界

接受“够用即好”,提高交付速率;关键 PR 必须人工审;以“AI 友好型代码库”降低模型检索与上下文压力。

•开发流程:IDE 辅助、终端为王

把IDE 当 diff/审阅器,核心在终端与脚本;本地 CI 保持主干可发布;建立“模型手感周”,团队轮训熟悉多模型风格。

•产品与生态:App→API 的迁移路线

为代理设计“可组合微接口”,在浏览器自动化不可避免时提供官方自动化通道(节约双方成本);对抗反爬的同时,提供受控速率与审计。

•开源可持续:双轨模式

参考Chromium:核心开源、商用增强(合规/审计/SLA);提前布局品牌与命名迁移预案(跨平台原子化切换、抢注防护)。

•组织能力:共情式提示与安全素养

训练开发者“站在 Agent 视角”写提示;团队级提示模板库;安全红线与应急演练常态化(RCE/注入/凭据泄露)。

如果你正准备从“会对话”跨到“真干活”,请从三件事开始:把技能做成 CLI、把代理关进私网、把人放在回路里。其余的进化,交给心跳、记忆与时间。


Disclaimer: The information provided in this article is for general informational purposes only and does not constitute financial advice.