新FEATUREDHacker News 首页· rssEN00:00 · 06·21
Anthropic 让 Claude Opus 4.7 自己操控机器狗,完成速度比去年的人类团队快 18 倍
Anthropic 重跑了去年的 Project Fetch 实验,这次直接让 Claude Opus 4.7 在 Claude Code 里自主操控一只机器狗。在连接摄像头、激光雷达和检测沙滩球这四项任务上,Opus 4.7 平均用时 9 分 35 秒,比没用 Claude 的人类团队快 37.7 倍,比用了 Claude 的团队快 18.9 倍。模...
#Code#Anthropic#Claude Opus 4.7#Claude Opus 4.1
精选理由
Anthropic 把去年的实验重跑了一遍,这次让 Claude Opus 4.7 在 Claude Code 里直接操控机器狗,完成摄像头连接、激光雷达和沙滩球检测四项任务。平均 9 分 35 秒,比没用 Claude 的人类团队快 37.7 倍,比用了 Claude 的团队快 18.9 倍。和去年 Opus 4.1 的 17 分钟比,速度翻了一倍。有视频、有数字、有年同比,信息密度高。不过这是 Anthropic 自己的实验,没有第三方复现,实际落地效果还得打个折。
一句话点评
Claude Opus 4.7 自己操控机器狗,四项任务平均 9 分 35 秒搞定,比没用 Claude 的人类团队快 37.7 倍。但别急着喊机器人革命,它连精准推球都还做不好。
锐评
Anthropic 把去年的 Project Fetch 重跑了一遍,这次让 Claude Opus 4.7 在 Claude Code 里直接操控一只机器狗。在连接摄像头、激光雷达和检测沙滩球这四项任务上,Opus 4.7 平均用时 9 分 35 秒,比没用 Claude 的人类团队快 37.7 倍,比用了 Claude 的团队快 18.9 倍。模型只写了 1045 行代码,人类团队写了 10309 行,而且大部分代码一次就跑通。
这个速度差确实夸张,但得看清楚实验边界。人类团队要自己摸索方案、踩坑、写大量代码,而 Opus 4.7 是直接上手干活,中间只有一个研究员负责插线、输入提示词和批准命令。另外,原文明确说模型在精准移动沙滩球这件事上还是不行,而且实验完全不涉及底层机器人控制——比如怎么让关节动起来、怎么保持平衡,这些才是机器人学里真正难啃的骨头。
Anthropic 自己总结了一个模式:先是模型帮人,然后人帮模型,最后模型自己干。他们在网络安全领域也看到了类似趋势。这个判断方向是对的,但这次实验只验证了“模型能快速搞定软件集成类任务”,离“模型能操控物理世界”还差得远。正文没披露实验跑了几次、失败率多少,也没说换一台机器狗或换一个环境结果会不会变。如果是真的稳定复现,那至少说明大模型在设备调试和快速原型这块已经能省大量人力了。
HKR 分解
hook ✓knowledge ✓resonance ✓