02:16
75d ago
X · @op7418(歸藏)· x-apiZH02:16 · 04·06
Anthropic 开始封改系统提示词的用户,返回 400 报错
龙虾作者 Peter 发现,如果你在 Claude Code 或 Anthropic 官方工具里改了系统提示词(比如提到 Openclaw),请求会被拒绝并返回 HTTP 400。这很可能是 Claude Code 泄露后打的补丁——就算你拿泄露版重新打包,改了提示词也可能触发。正文没披露具体触发规则、影响版本或 Anthropic 官方回应。核心是产...
#Tools#Anthropic#Peter#Claude Code
精选理由
HKR-H 和 HKR-R 强:Claude Code 锁提示词这个说法很抓眼球,直接戳中开发者对工具控制权的焦虑。分数低是因为 HKR-K 弱:全文只抛出一个 400 报错和触发条件,没有复现步骤、受影响版本、Anthropic 官方说明,信息缺口太大,没法验证真伪。
一句话点评
标题党,正文没披露任何具体信息。Anthropic 可能又出了新研究或产品策略,但光看标题无法判断是技术突破、安全限制还是商业手段。建议等详细内容出来再评价,目前只能标记为“待核实”。
锐评
Peter 声称 Claude Code 在用户改 system prompt 后返回 400。按这条摘要,唯一坐实的信息只有报错码 400,和触发条件指向“修改系统提示词”或出现“Openclaw”。我先把判断放前面:如果复现成立,这不是小修小补,这是 Anthropic 在把官方客户端从“可编排工具”收紧成“受监管入口”。对做 agent 和 devtool 的人,这比一句“封了泄露版”更有信息量,因为边界从模型层挪到了产品层。
我对原帖的动机判断不太买账。作者把它读成“Claude Code 泄露后的补丁”,这个说法现在证据不够。正文没给复现步骤,没给受影响版本,没说是 Claude Code 桌面端、CLI,还是别的官方工具,也没给请求样本。HTTP 400 还能来自很多层:客户端校验、API gateway 拒绝、服务端 policy parser 失败,甚至是某个未公开字段校验。只靠“出现 Openclaw 就 400”,还不能直接锚定到泄露事件补丁。
但产品策略收紧这件事,我觉得是顺着 Anthropic 过去一年的路数。Claude Code 从一开始就不是裸 API 壳子,它更像带安全边界的官方代理。Anthropic 这家公司一直偏“把行为约束前移”。更早是 Constitutional AI 写进训练和对齐;后面在 Claude 系列里,很多限制又写进 system prompt、tool policy、工作流控制。去年到今年,OpenAI 也在做类似事,比如 ChatGPT agent、Deep Research、Code Interpreter 这些官方入口,用户付费了也不等于你能随便改底层编排。厂商卖的不是纯模型调用权,卖的是一套可审计、可回滚、能限责的执行环境。Anthropic 只是把这个边界画得更硬。
我一直觉得,开发者社区对“我花了钱就该完全可改”这套期待,和模型厂商现在的产品形态已经错位了。API 还保留一部分可编排空间,官方工具却越来越像 SaaS。你买 Cursor、Copilot、Claude Code 这类东西,合同关系更接近“使用托管服务”,不是“获得一个本地可重打包内核”。如果 Anthropic 真在检测 system prompt 篡改,这说明他们把 prompt 当成产品完整性的一部分,而不是用户配置项。这一步很关键,因为它会影响二次封装、私有 repackage、甚至企业内部做套壳增强的空间。
这里还有一层行业背景。过去一年,很多团队都在把“系统提示词”当轻量控制面,靠它改人格、改工具调用规则、改路由。这个办法快,但也脆。OpenAI、Anthropic、Google 都吃过 prompt 泄露、越权调用、提示注入的亏。厂商现在往前走,通常有两条路:一条是把控制逻辑迁到不可见服务端;另一条是继续让客户端带 prompt,但加完整性校验、签名、版本锁。按这条传闻看,Anthropic 像是在第二条路上加码。我还没看到官方说明,所以不能断言具体机制,但方向很像“别碰我的 orchestration layer”。
我自己的疑虑在这儿:Anthropic 如果真把“改 system prompt”一概打成 400,手法有点粗。400 说明请求格式或参数非法,不是清晰的权限错误,也不是可解释的 policy refusal。对开发者体验,这种做法很差。你至少该返回明确错误类型,告诉用户是 integrity check 失败、policy blocked,还是版本不兼容。现在这类黑箱拒绝,会把第三方工具作者逼到抓包、逆向、对抗检测那条路上,最后只会加剧厂商和开发者之间的敌意。
还有个地方我想泼点冷水:Openclaw 这个词本身太像特征匹配样本了。如果只要出现这个字样就拦,说明策略很可能是脆弱的字符串规则,不是稳健的完整性机制。字符串拦截能挡一批现成 repackage,挡不住认真做适配的人。真要长期控制,厂商还是会走签名、服务端会话绑定、工具权限下沉这条线。标题给了冲突感,正文没披露机制细节,我没法确认 Anthropic 现在做到哪一步。
我对这条的结论很简单:别把它只当成一次“管得太宽”的公关争议。要是复现成立,它说明官方 AI coding 工具正在从开放前端变成受控终端。对普通用户,这只是一次 400。对做封装、做私有代理、做企业分发的人,这是一条边界线:你租的是能力,未必租到了控制权。
HKR 分解
hook ✓knowledge —resonance ✓
63
SCORE
H1·K0·R1