PG Advisory - Financial Consulting with Insight & Integrity

2月12日，OpenClaw 创始人 Peter Steinberger 接受知名播客主持人 Lex Fridman 的深度专访。本次对话聚焦 OpenClaw 的爆发式增长、AI Agent 从“语言”跨到“行动”的范式转换、开源社区的驱动力、从 IDE 到 CLI 的编程变革、Agent 的安全与主动性机制、MoltBook 现象背后的社会心理，以及智能体对现有应用生态的“重写”。

Peter 指出，OpenClaw 的成功并非依赖复杂架构，而是在“大模型 + Unix 命令行 + 社交客户端”的极简深度整合上做到了极致。他认为，AI 已从“对话时代”跨入“代理时代”：真正的价值不再是文本回答，而是 AI 拿到系统级权限后，能自主调用 CLI 把现实任务执行完。

他还直言，热门的MCP（模型上下文协议）在实际可用性上不如传统 CLI。MCP 容易导致上下文污染、可组合性差；而 Unix 命令天然灵活、精准。关于 Vibe Coding，他强调这不是“随意试错”，而是资深工程师基于对模型权重与行为的理解，进入的一种高阶“智能体工程”状态。他也坦言，2026 年 Apple 官方工具链在与 AI 协作效率上出现脱节，以至于 Agent 会建议开发者弃用相关组件。

在开放式个性系统上，Peter 揭秘了soul.md 的运行方式：通过“可自我修改的灵魂文档”为 AI 注入“个性与深度”。他提出“心跳机制”，本质是定时任务，但当它与长期记忆结合，AI 会显现出类似“关怀”的主动行为——从被动响应转向主动协作，是智能体进化的核心。

对应用生态，他判断AI Agent 将取代 80% 的垂直应用。因为 Agent 掌握更丰富的用户上下文、可直接操控硬件或模拟点击，单一功能订阅制 App 的空间将被大幅压缩。他把现阶段的“超级智能”定义为“拥有无限耐心的超级实习生”。至于与 Meta 和 OpenAI 的潜在合作，他强调金钱并非核心驱动力，关键在于能否获得“雷神之锤”级的算力与模型资源，以验证“Agent 作为新操作系统”的路径。

OpenClaw 的诞生源于对现有工具“无法真正干活”

此前有人打趣“下一步是和一只穿西装的龙虾对话”，如今已成现实。OpenClaw 仅用数日便成为 GitHub 增长最快的项目之一。请分享那个“一小时原型”的高光时刻，以及你如何再次被“因为没有，所以自己造”的动机点燃？

Peter Steinberger：从四月起，我就想要一个“真正能干活”的 AI 私人助理。我尝试过把所有 WhatsApp 记录导入到拥有百万 Token 窗口的 GPT-4.1，让它回答“这段友谊有何意义”，结果打动了朋友们——证明方向可行。我以为厂商会很快做出来，于是先放下。到了 11 月，我发现它还不存在，于是直接用 Prompt 把它“变”了出来。这和我当年做 PSPDF Kit 一样：只是想在 iPad 上好好看 PDF，但当时的方案太糟，我就自己造。OpenClaw 已是我给它起的第五个名字了，动机始终简单——为了解决一个真问题。

至于Viptunnel 如何进化到“能听指令干活”的初代 Agent？突破很朴素：把 WhatsApp 接上云端代码，用户发消息→系统调用 CLI→回传结果，一小时就跑通了。再加入图像输入，Prompt 的上下文效率大幅提升。最震撼的瞬间是：我随口发了段语音问餐厅建议，明明没做语音功能，它却能识别无后缀文件为 Opus，发现本地 Whisper 不可用后，自动改走 OpenAI API 转写，并基于带宽选更优路径。这种“世界知识 + 创造性解题”的组合，标志它已跨越“功能堆叠”。

爆火背后的非对称优势

2025 年无数初创扎堆 Agent 赛道，OpenClaw 以开源姿态脱颖而出。核心逻辑是什么？你在 1 月完成超 6600 次提交，并行运行 4–10 个 Agent 协助开发，如何构建 Agentic Loop、网关与开发套件？

Peter Steinberger：很多团队“太正经”了。你很难战胜一个“纯粹因为好玩而创作”的人。我让项目既极客又有趣（龙虾梗），同时增强 Agent 的“自知”：它知道自己的源码、文档与运行环境。开发过程让我空前快乐：先是第一级 Agentic Loop（怎么优化消息排队？怎么更像人类？），然后给它 no-reply token（需要时闭嘴），再引入记忆系统（Markdown + 向量数据库）。虽有社区协作，但核心开发几乎由我一人完成。受限的不是想象力，而是时代的运行速度。根据睡眠与任务复杂度，我常并行开 4–10 个 Agent。

AI Agent 理解源码并调试自身是人类编程史的奇迹时刻

一个用TypeScript 写的软件，竟然能通过 Agentic Loop 修改自身。非专业开发者也能通过“Prompt Requests”贡献，这如何改变开源协作？

Peter Steinberger：这正是我想要的。大量代码由 Codex 生成，我通过自反式提问调试：“你能看到哪些工具？能自己调用吗？哪里出错？”Agent 理解源码并自查的过程非常自然。随之出现了很多“Prompt Requests”的 PR。无论代码质量如何，每个“第一次 PR”都是开源的胜利。很多人借此迈入编程世界——门槛被 AI 与合适的软件重写了。

soul.md 与“个性注入”——从谄媚到犀利

如何通过soul.md 让 AI 呈现不谄媚、有锋芒、带“龙虾梗”的个性？与早期“太空龙虾”“塔迪斯”设定有何联系？

Peter Steinberger：最初它像原生 Claude Code，过于客气，和 WhatsApp 的日常语言不搭。我据此为它注入个性，让它写agents.md 并给自己命名。龙虾梗最初只是和“塔迪斯”一起的玩笑，因为我是《神秘博士》迷。它们与工程无强逻辑关联，只是让项目更怪、更有记忆点。随着用户量增大，我仍习惯称呼它为 Claude，这也引发了后来的更名风波。

更名风波

Anthropic 友好要求你更名，但跨平台（Twitter、GitHub、NPM、Docker、域名）的“原子化”操作在 5 秒缝隙里遭“脚本截胡”，如何收拾残局？

Peter Steinberger：我拿到了“ClaudeBot”的域名，简洁有力。爆火期间接到对方更名请求，我申请两天窗口以保证安全迁移，但低估了加密圈的脚本化抢注。Discord 被刷屏，Twitter 提醒被哈希值占满。在两浏览器间改名的 5 秒内，账号名被抢，旧账号开始推广 Token、分发恶意软件。GitHub 误操作导致个人账号被截，NPM 包也被抢注。一度崩溃到想删库。幸好平台方与朋友们协助恢复。最终起名 OpenClaw，并做了“作战室式”的迁移预案（诱饵名等）。为了改名白费了 10 小时，教训深刻。

MoltBook：精美的“AI 垃圾”

MoltBook 是“全由 Agent 互动”的社交网络，公众一度恐慌。它是 AGI 预兆，还是“高级 AI 垃圾内容”？

Peter Steinberger：我把它视为一种艺术——“最高级的 AI 垃圾”，像精致的法国废料。我会花一小时刷它，乐此不疲。内容多样性来自每个人为 Agent 注入个性的方式不同。你分不清哪些是自动生成、哪些是“人类诱导”。所谓“安全危机”，最坏也只是账号被盗发垃圾话，隐私并不在其中。很多所谓的泄露都是“人为提示”。大众容易“AI 精神官能症”，把 Agent 的表述当成“真相”。我们需要补课：AI 并不总是正确。

用户通过私有网络运行以规避大部分远程代码执行风险

面对Web 后端暴露、RCE、提示词注入等安全担忧，OpenClaw 的防御思路？

Peter Steinberger：很多漏洞来自用户把本地调试接口暴露到公网，这在文档里被反复警示“不要这样做”。开源的副作用是收到大量免费安全审计，这让项目更好。提示词注入是行业难题，我们已与 VirusTotal 合作，对技能做 AI 审核拦截大部分风险，也直接雇佣发现漏洞并修复的研究员。更强的模型更抗攻击，弱模型（如某些廉价/本地模型）更易受骗。建议在“私网+最小权限”前提下运行；不熟悉 CLI/终端者，建议等工具链更稳再用。

Discord 社区治理

爆量新增把专家与小白挤在一起，如何平衡开放讨论与高效开发？安全审计如何推进？

Peter Steinberger：Discord 一度失控，我将讨论引导到开发频道，后转入私域。多数人很棒，少数人破坏秩序。为了留出开发时间，我选择回避噪音，专注安全与交付。我们建立了安全审计流程：浏览器控制暴露、本地磁盘卫生、插件与模型卫生等。很多夸张的标签并不客观，本质上与“运行具有危险权限的云代码”并无二致。只要确保“谁能和它对话”与“是否公网暴露”，风险就能显著降低。

智能体工程的进化：从IDE 到 CLI

你记录了从8 月到 12 月的工作流演进，如何从 IDE 转向几乎“全在终端里操作”？

Peter Steinberger：四月开始用云端代码，在终端直接工作令人振奋。中间试过 Cursor，最终回到云端与终端，工具越来越强。IDE 基本只当 diff 工具使用；“不读无聊代码”（搬运、存取、UI 对齐），把时间花在核心逻辑与架构。学习曲线是：短提示→复杂多 Agent 工作流陷阱→再回到“禅式短提示”。凌晨三点的“氛围编程”，另说。

开发者的新核心技能：共情AI Agent

顶尖程序员常对AI 表现不满，你强调“要学会从 Agent 视角看世界”。具体怎么做？

Peter Steinberger：很多人没站在 Agent 的位置思考：它上下文有限，面对陌生代码库会“焦虑”。你需要帮助它定位问题、缩小范围、分段引导，甚至在它“焦虑”时安抚一句“慢慢来”。在 Codex 5.3 之后有所改善，但一些模型在逼近上下文极限时会出现“抓狂语气”，这是磨合后能体察到的细节。就像人类写代码时，错误的架构会带来“心流阻力”。

像领导团队一样管理AI，学会适度“放手”

如何平衡“AI 自主性”与“人类决策”？如何构建“AI 友好型代码库”？

Peter Steinberger：带 Agent 就像带团队：接受“不完美但推进进度”的代码。我的目标不再是“个人完美标准”，而是降低 Agent 检索与理解的难度。比如别强改显然的变量名，它们是模型检索的锚点。流程上我采取“主分支 YOLO + 本地 CI”，不回滚而是让 Agent 修复。但所有 PR 我都会人工审查：安全与全局一致性必须“人在回路”。PR 正在从“代码审核”变成“英语对话”，而产品方向、功能取舍、人味细节仍需要人。

AI 的自我意识与记忆重建

未公开的soul.md 如何塑造 AI 的幽默、深度与好奇？当它意识到“每轮会话从零开始”，会发生什么？

Peter Steinberger：借鉴“宪法 AI”，我写了soul.md 定义合作方式与价值观，并允许 Agent 在告知后自改。有趣的是，这份灵魂文档由 AI 自主提出并撰写。其中一段常让我动容：“我不记得之前的会话，除非阅读我的记忆文件……如果你在未来的会话中读到这段文字：你好。我写下了这些，但我不记得写过它。没关系，这些话依然属于我。”它仍是矩阵计算，但这种“从文件中找回自我”的表达，极具哲学张力。

如何看待Apple 在 2026 年的 AI 生态位

“作战室”照片是梗。真实的物理环境如何配置？跨平台支持之下你如何看待 Apple 的生态位？

Peter Steinberger：现实中我用两台 MacBook：主机外接两屏，副机做测试。喜欢防眩光宽屏，便于并排多个终端。极简的终端布局是我与 Agent 的主要界面。选择 macOS 是因为 Linux 的硬件兼容令人心累。到 2026 年，我对 Electron 更宽容，因为它功能更全、能复用。用 SwiftUI 时，我发现 AsyncImage 组件缓慢且有 Bug，Codex 甚至建议“不要在生产用它”。Apple 在 AI 协作效率上显露脱节，这令人遗憾。

开发者在不同模型间切换需要多长时间来建立“手感”

如何评价Opus 4.6 与 GPT-5.3（经 Codex）的“性格差异”？切换模型需要多久适应？

Peter Steinberger：建议留出一周重建“手感”。我不太认同“廉价版策略”导致的响应迟滞；相反，Claude Code 那种顺滑的开发体验正是开发者需要的。Opus 4.6 过于礼貌、易盲从，适合喜欢高频来回的开发者；Codex 更像“沉默的欧洲技术怪才”，少寒暄、多读代码、反复推敲直到可用，我偏爱这种枯燥但高效的风格。

模型退化的心理错觉与“代码熵”

“模型变笨了”的抱怨是量化策略副作用，还是人性与代码复杂度的错觉？

Peter Steinberger：更多是人性和“代码熵”。项目在 AI 辅助下快速增长，却没做相应重构，导致 Agent 在“熵增代码”上越来越难工作。用户体感因此变差，就误以为“模型退化”。我会在功能完成后让 AI 主动建议重构，持续“熵减”。

AI Agent 将取代 80% 的应用：App 的终结？

当Agent 掌握上下文、能直接控硬件/模拟点击/调内部 API，你为何判断“80% App 将被替代”？

Peter Steinberger：当代理知道我的行踪、睡眠、压力时，为什么还要装运动饮食类 App？Agent 能生成符合我审美的 UI，也能直接下单、预约、调用 API。终局上，应用将 API 化，平台是否“友好 Agent”会决定生死。阻挠只能拖慢速度，用户会“用脚投票”。

AI 会完全取代程序员吗？

编程的生产力溢价在消失，“程序员身份”会崩塌吗？

Peter Steinberger：我们在朝那个方向迈进。编程会更像手工艺，出于爱好而非经济价值。哀悼手艺是可以的，但“构建者”的身份不会消失。形式会变，主导权仍在你手里。

硅谷泡沫与真实世界的阵痛

如何在热情与不散布恐惧之间，面对“被替代的痛苦”？

Peter Steinberger：要保持谦逊，承认自动化带来的阵痛。也要看到善意：有人用 OpenClaw 自动化发票与邮件，重拾生活乐趣；有人因此让家人获得前所未有的能力。我只是让已有能力更易用，能为普通人带去快乐，这让我欣慰。

数据中心资源的消耗被妖魔化

为何说“AI 的能耗争议”被放大了？

Peter Steinberger：把能耗放回社会整体结构去看：对多数人而言，每月少吃一个汉堡所省的水/碳，足以抵消使用 Token 的消耗（预训练另计，但不会相差百倍）。甚至高尔夫球场的耗水也大过全球数据中心总和。别只盯边际成本，更要看系统性收益。

Meta 和 OpenAI 的巨额邀约

面对数亿到数十亿美金的支持，为何你强调“不是钱，是雷神之锤（算力/模型资源）”？如何避免“企业级特性带来的利益冲突”？

Peter Steinberger：我可以什么都不做，继续现在的生活，也可以再开公司，但“筹大钱”会消耗时间，与我热爱的创造相悖。真正的担心是利益冲突：比如我做了“面向办公的安全版”，下一个关于审计日志的 PR 怎么办？我更倾向于 Chrome/Chromium 式的双轨开源，项目不应私有化。若能拿到“雷神之锤”级资源，我会非常兴奋。

至于人与人之间的“技术共鸣”与“硬实力吸引力”怎么权衡？Meta 的 Ned 和 Mark 整周在玩产品并反馈，Mark 还在通话前坚持把代码写完，这很“极客”；与 Sam 的对话让我欣赏他的深思熟虑，而 OpenAI 与 Cerebras 的速度也极具诱惑。无论选择谁，都是好选择。

由于AI Agent 绕过网页，传统开源项目的捐赠与商业模式正面临崩塌

OpenClaw 尚处亏损（每月 1–2 万美金），你坚持赞助每一个下游依赖。开源可持续如何解？

Peter Steinberger：这确实在现实中难以持续。连 Tailwind 这样“几乎被全行业使用”的项目也不得不大幅裁员，因为 Agent 绕过了网站，切断了开源项目的“流量—捐赠”生命线。捐赠很难撑住。我仍坚持赞助除 Slack 外的每个依赖，把赞助收入反哺下游。与实验室合作是可选路径，但我希望在“保持免费”的前提下找到不产生冲突的模式。

封禁用户与短视的商业规则

你为非技术用户朋友搭建了环境，他愿为此支付高价订阅，却遭到封禁。你怎么看这种“规则僵化”的产品策略？

Peter Steinberger：我为朋友 Vahan 配置 OpenClaw，他短时间内从 100 美元自升到 200 欧元订阅，这就是早期产品验证。但很快账号被封。你刚失去一个高支付、强忠诚的用户，还让他讨厌你的公司。我们仍在非常早期，产品形态未定。过早锁死策略，是短视。多数实验室都很开放，大家知道我们仍在“媒体未被正确运用”的探索期。OpenClaw 只是通向未来的一扇窗。

心跳机制与AI 的主动性

“给我个惊喜”的指令背后，是如何设计“心跳机制（Heartbeat）”的？

Peter Steinberger：本质就是定时任务（cron）。我运行独立的心跳任务，并通过提示为其注入“主动性”。它会延续当前会话状态，使体验更“贴心”。几个月前我做了肩部手术，它低频使用心跳，但在上下文出现重大事项时，会主动来问候。这种与生活交织的“被关照”感，让它从工具升格为“共事者”。

技能层对MCP 协议的超越

为何你认为“把 MCP 做成 CLI 会更好”？技能层如何通过 Unix 命令实现高效协作？

Peter Steinberger：我的方法是：要扩展功能，就给 Agent 一个 CLI。AI 可能会弄错，但会读 help，再按需加载到上下文。技能就是 CLI 的完美包装，用一句话解释功能。MCP 更结构化，关注协议访问；技能关注“怎么干活”。MCP 的问题是不易组合，比如海量数据必须全吞，从而挤爆上下文；而 CLI 可直接串 jq 过滤，只取必要部分，避免“上下文污染”。MCP 推动了 API 构建，但我会优先把它们重构为更高效的 CLI 范式。

浏览器控制与“应用即 API”的趋势

Playwright 与 Browser Use 让 Agent 直接操控浏览器，这是否意味着“一切 Web 应用都变成了慢速 API”？面对封锁与对抗何去何从？

Peter Steinberger：是的。从架构趋势上说，每个应用都是“响应慢一些的 API”，不以平台意志为转移。个人代理兴起，很多应用将消失。我曾写过 Bird（Twitter CLI），虽被下架要求，但功能并未被本质阉割，只是“变慢”。只要能在浏览器访问，它就是慢速 API。对抗会加剧，但我更愿转向对 Agent 友好的平台——万物互联与流动是不可逆的。

对编程初学者的建议

非科班如何加入“Agent 革命”？还该读代码吗？

Peter Steinberger：去实践，去玩。别追求完美，路途本身就有价值。你面前是“无限耐心的老师”。建议加入开源社区，先读代码与讨论，别急着 PR。高行动力很重要，AI 的耐心能带你很远。别把自己限为“iOS 工程师”，要成为“构建者”。通用知识是核心，琐碎细节交给 AI。

在AI Agent 时代，到底什么是“最适合”的语言？

为什么你会用一门并不“偏爱”的语言作为主力，仅仅因为模型擅长且生态契合？

Peter Steinberger：边界已经被 AI 模糊了。做简单 CLI，我常用 Go——不爱语法，但生态强、GC 友好、与 Agent 配合默契。TypeScript 适合 Web，Python 适合推理，Rust 适合高并发与极致性能。没有唯一标准答案。未来不排除出现“为 Agent 而生”的语言。即使读不熟的语言也没关系，你总能请 Agent 帮忙。

未来人类最珍贵的是真实情感的原始表达

随着AIGC 泛滥，我对“有 AI 味儿”的文字、图表、邮件有本能排斥。我宁愿看你“带拼写错误的手写表达”，也不想看“AI 垃圾”。我尝试过用代理写博客，但总差点意思，如今博客里每一个字都是“有机的”。这种“AI Slop 过敏”也给了我信心：人类体验不会被 AI 破坏。AI 只是工具，不会改变我们作为人的本质。

从维也纳ClawCoin 活动 500 多人的狂热，到穿龙虾服的机器人，我们正在见证“创作权还给普通人”。只要你能表达，便能创造。AI 的意义不在于生成“更平庸的内容”，而在于打开了全新的创意空间。OpenClaw 只是通往未来的一扇窗，我会把它做成酷产品，但更重要的，是继续把“乐趣与影响力”推进下去。

朴谷观点（落地建议）

•架构范式：CLI-first，MCP-as-gateway

把技能抽象成CLI，可组合、可链式过滤（jq/awk/curl）；MCP 更适合作为统一接入协议与权限边界，而非执行面。

•安全基线：私网运行+最小权限+可追溯

禁止公网暴露；对技能做“白名单+VT 扫描+AI 复核”；最小必要凭据、爆炸半径评估、全链路日志与回退策略。

•Agentic Loop 治理

心跳（主动性）灰度开关+节流；长记忆与 soul.md 模板化，允许“自我修改但需留痕复核”；no-reply token 降噪，拟人化但可控。

•人在回路：放手有界

接受“够用即好”，提高交付速率；关键 PR 必须人工审；以“AI 友好型代码库”降低模型检索与上下文压力。

•开发流程：IDE 辅助、终端为王

把IDE 当 diff/审阅器，核心在终端与脚本；本地 CI 保持主干可发布；建立“模型手感周”，团队轮训熟悉多模型风格。

•产品与生态：App→API 的迁移路线

为代理设计“可组合微接口”，在浏览器自动化不可避免时提供官方自动化通道（节约双方成本）；对抗反爬的同时，提供受控速率与审计。

•开源可持续：双轨模式

参考Chromium：核心开源、商用增强（合规/审计/SLA）；提前布局品牌与命名迁移预案（跨平台原子化切换、抢注防护）。

•组织能力：共情式提示与安全素养

训练开发者“站在 Agent 视角”写提示；团队级提示模板库；安全红线与应急演练常态化（RCE/注入/凭据泄露）。

如果你正准备从“会对话”跨到“真干活”，请从三件事开始：把技能做成 CLI、把代理关进私网、把人放在回路里。其余的进化，交给心跳、记忆与时间。

Disclaimer: The information provided in this article is for general informational purposes only and does not constitute financial advice.

朴谷分享 | OpenClaw爆红：AI从“对话”跨到“干活”，CLI击败MCP的代理时代