AX 严选 · 2026-06-16

▸ 27 条 · updated 3m ago

2026年5月

一二三四五六日

1 2 3 4 5 6 736 819 921 1010 1132 1228 1335 1438 1528 1617 179 1824 1947 2026 2132 2236 237 246 257 2625 2729 2834 2936 308 316

2026年6月

一二三四五六日

138 235 332 422 532 610 78 828 943 1027 1129 1216 138 144 1513 1627 1721 1827 1912021222324252627282930

2026-06-16 · 星期二2026年6月16日

22:34

2d ago

FEATUREDAI HOT 精选· aihot-apiZH22:34 · 06·16

Anthropic 企业订阅份额 5 月首超 OpenAI，特朗普禁令反而推了一把

Ramp 的数据显示，Anthropic 5 月企业 AI 订阅份额冲到 41%，OpenAI 是 39.5%，这是 Anthropic 第一次反超。公司刚拿了 650 亿美元融资，估值 9650 亿美元，第一次季度盈利后已经秘密提交 IPO 申请。特朗普政府以出口管制为由，要求 Anthropic 把最新模型 Mythos 5 和 Fable 5 下...

#Anthropic#OpenAI#Ramp#Funding

精选理由

Anthropic 首次在企业订阅份额上反超 OpenAI，有 Ramp 的真实支出数据撑腰，不是传闻。文章还带出 650 亿美元融资、秘密提交 IPO 申请，以及特朗普政府出口管制反而刺激采用量创新高这几个信息点，既有硬数字又有反直觉的政策效果，对从业者判断模型选型和市场走向有直接参考价值。

一句话点评

Anthropic 企业订阅份额首次超过 OpenAI，但数据只来自 Ramp 一家平台，别急着说格局变了。

锐评

Ramp 的数据说 Anthropic 5 月企业 AI 订阅份额冲到 41%，OpenAI 是 39.5%，这是 Anthropic 第一次反超。我会先打个折：Ramp 是一家企业支出管理平台，它的样本偏向用 Ramp 管订阅的公司，不代表整个市场。正文没披露样本量和统计口径，这个“首次超越”的含金量要打问号。有意思的是，特朗普政府以出口管制为由要求 Anthropic 下架最新模型 Mythos 5 和 Fable 5，禁止非美国人访问，结果反而推高了企业采用量。Ramp 首席经济学家说类似情况 3 月也发生过——当时国防部把 Anthropic 列为供应链风险，企业支出反而创了纪录，钱主要花在 Claude Opus 4.8 上。这个逻辑大概是：政府越禁，企业越觉得这东西重要，赶紧买。但正文没解释为什么禁令会刺激采购，也没说这些新增客户是长期签约还是短期避险。另外，Anthropic 刚拿了 650 亿美元融资，估值 9650 亿美元，第一次季度盈利后就秘密提交了 IPO。这些数字很大，但正文没披露盈利规模、收入结构，也没说 IPO 时间表。如果是真的挺省钱，但信息缺口太多，先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

22:04

2d ago

FEATUREDAI HOT 精选· aihot-apiZH22:04 · 06·16

Midjourney V8.1 上线草稿模式：一次出 24 张低清预览，只花一半快速时长

Midjourney 给 V8.1 加了个草稿模式，点一下闪电按钮就能用。每次生成 24 张低分辨率、低画质的预览图，消耗的快速时长只有标准 V8.1 作业的一半。挑出满意的图点“Vary”就能渲染成高清成品。另外还出了个 --preview 参数，可以提前试玩还在打磨的新模型，但出图可能比较糙，而且不保证效果一直稳定，尤其在个性化设置和情绪板下差异会...

#Vision#Midjourney

精选理由

Midjourney V8.1 的草稿模式直接砍半快速时长成本，一次出 24 张低画质预览，挑中再高清化，对重度用户是肉眼可见的效率提升。--preview 参数给了尝鲜入口，但官方自己打了预防针说输出不稳定，这点先别太激动。H 和 K 都踩中了，R 确实够不着，因为这事基本只在生图圈子里传。

一句话点评

Midjourney V8.1 出了草稿模式，一次吐 24 张低清预览，只花一半的快速时长，挑中再高清渲染，等于用速度换试错成本。

锐评

这次更新最实在的是草稿模式：点一下闪电按钮，一次生成 24 张低分辨率、低画质的预览图，消耗的快速时长只有标准 V8.1 作业的一半。对需要大量试 prompt 的人来说，这相当于把试错成本直接砍半，挑出满意的再点“Vary”渲染成高清成品，逻辑很顺。另一个 --preview 参数是让你提前玩还在打磨的新模型，但官方明确说了出图可能比较糙，而且不保证效果一直稳定，尤其在个性化设置和情绪板下差异会更明显。这点先别太激动，它更像一个公开测试入口，不是正式功能。正文没披露草稿模式的具体分辨率，也没说 --preview 指向的是哪个模型版本。这两个信息缺口会让实际评估打折扣——低清到底多低、预览模型离正式版有多远，都直接影响要不要现在就用。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

21:54

2d ago

FEATUREDAI HOT 精选· aihot-apiZH21:54 · 06·16

OpenAI 的护城河快干了：市场份额跌破一半，微软考虑换用 DeepSeek，一年亏掉 340 亿美元

Gary Marcus 用三件事说明 OpenAI 的领先优势正在快速消失。第一，市场份额首次跌破 50%，谷歌正在吃掉它的份额，普通用户觉得 ChatGPT 和 Gemini 用起来没区别，纯靠大模型做生意留不住人。第二，微软这个最大金主正在考虑把 Copilot 的后端从 OpenAI 换成 DeepSeek，原因是按用量计费后成本太高——自己最大...

#OpenAI#Google#Microsoft

精选理由

Gary Marcus 用市场份额跌破 50% 和微软考虑换供应商这两件事，论证 OpenAI 的领先优势在快速缩小。文章是评论性质，不是一手报道，而且 Marcus 一向看空 OpenAI，读者需要知道这个立场。但两个信号都是公开可查的事实，对行业判断有参考价值，所以给到 78 分。

一句话点评

OpenAI 市场份额跌破 50%，微软考虑把 Copilot 后端换成 DeepSeek，2025 年亏了 340 亿美元——护城河确实在消失。

锐评

Gary Marcus 用三件事说明 OpenAI 的领先优势正在快速消失，逻辑是通的，但每一条都得打个折。市场份额跌破 50% 这个数字来自社交媒体截图，不是第三方审计报告，样本和统计口径都没披露。普通用户觉得 ChatGPT 和 Gemini 没区别，这更像个人观察而非用户调研，但方向没错——纯靠大模型做 to C 生意，用户粘性确实弱。微软考虑换 DeepSeek 这条最值得看。按用量计费后成本太高，连最大金主都在找替代方案，说明 OpenAI 的定价在规模化场景里撑不住。不过正文没披露微软内部评估到了哪一步，是技术验证还是已经进入采购流程，这点先别太激动。财务数据来自 Ed Zitron 声称看到的审计报告，2025 年收入 130.7 亿、成本 340 亿，亏损同比扩大近 8 倍。如果数字属实，烧钱速度确实不可持续。但原文没提供报告原文或审计机构名称，只能当作线索而非定论。Marcus 还提到华盛顿可能通过出口管制间接帮 OpenAI 打击 Anthropic，这部分分析比较薄，更像政治揣测。整体来看，三条论据都有信息缺口，但合在一起指向同一个趋势：OpenAI 的领先地位正在被成本和竞争两面夹击。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

18:08

2d ago

FEATUREDAI HOT 精选· aihot-apiZH18:08 · 06·16

微软考虑在 Copilot Cowork 里加一个 Azure 托管的 DeepSeek V4，当便宜选项

Copilot Cowork 要从无限用改成按量计费了，因为有人一周跑几百个任务，成本扛不住。微软想了个省钱方案：在 Azure 上托管一个微调过、加了安全护栏的 DeepSeek V4，让用户自己选要不要用。Axios 说微软已经微调出一个能跑的模型，但最终上不上还没定。

#Microsoft#DeepSeek#Azure

精选理由

两条实质变化：Copilot Cowork 从无限用改按量计费，以及微软考虑在 Azure 上托管微调版 DeepSeek V4 来省钱。Axios 确认模型已经微调出来了，但最终上不上还没定，所以分数停在 78。

一句话点评

Copilot Cowork 被薅到要改按量计费，微软想用 DeepSeek V4 当省钱备胎，但还没定。

锐评

微软 Copilot Cowork 要从无限用改成按量计费，直接原因是有人一周跑几百个任务，成本扛不住。Axios 的报道说微软已经在 Azure 上微调了一个 DeepSeek V4，加了安全护栏，打算作为可选的低成本方案让用户自己选。这个思路很直接：用更便宜的模型接住高频但不太复杂的任务，把贵的模型留给真正需要的地方。不过现在能确认的只有“微调出了一个能跑的模型”，最终上不上、什么时候上都没定。正文没披露这个微调版 DeepSeek V4 在 Cowork 场景下的具体表现数据，也没说比现有方案能省多少成本。如果是真的能大幅降本又不掉链子，对用量大的团队会挺有吸引力。但安全护栏做到什么程度、会不会因为过度过滤变得不好用，这些都得等微软自己公布。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:50

2d ago

AI HOT 精选· aihot-apiZH15:50 · 06·16

微软 Copilot Cowork 全球上线，能跑多步骤任务，还支持切换不同模型

微软把 Copilot Cowork 正式推到了全球可用状态。这个工具让 AI 智能体可以接公司内部的知识和流程，去跑那种耗时较长、步骤较多的任务。这次更新明确说支持多模型，但官方公告里没列出具体支持哪些模型、怎么收费、延迟表现如何。

#Microsoft#Satya Nadella

精选理由

微软把 Copilot Cowork 推到了全球可用，让 AI 智能体接公司内部知识和流程去跑长任务。这次明确说支持多模型，但官方公告没披露具体支持哪些模型、怎么收费、延迟表现如何。对企业 AI 部署是个信号，但信息太薄，我会先打个折。

一句话点评

微软把 Copilot Cowork 正式上线了，核心是让 AI 智能体接公司内部资料去跑长流程任务，这次还加了多模型支持。但官方推文和博客摘要都没说支持哪些模型、怎么收费、延迟多少——这些才是企业采购时会问的关键。我会先打个折：多模型听着灵活，但没名单就没法判断是真开放还是只多接了一个自家模型。另外“长期运行”到底多长、稳定性怎么样，正文也没披露。如果是真的能稳定跑几小时的任务还省钱，那对...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

15:00

2d ago

AI HOT 精选· aihot-apiZH15:00 · 06·16

OpenRouter 教程：一个 API Key 通吃所有编程代理

OpenRouter 发了一篇教程，核心就一句话：任何支持 OpenAI Chat Completions API 的工具，只要把 base URL 改成 openrouter.ai/api/v1，把 key 换成 sk-or- 开头的，就能直接用 OpenRouter 的 300 多个模型（来自 60 多家供应商）。教程里列了 Claude Code...

#OpenRouter#Claude Code#Codex CLI

精选理由

OpenRouter 官方教程，核心是教你把任何兼容 OpenAI 接口的工具切到它的 300+ 模型池。K 命中：对选编码代理的从业者来说，有具体的配置步骤和工具清单，能直接上手。H 和 R 没中：标题平淡，没有悬念；内容偏工具文档，没有身份共鸣。重要性 55 —— 有用但不值得上推荐位。

一句话点评

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

SCORE

H0·K1·R0

13:47

2d ago

AI HOT 精选· aihot-apiZH13:47 · 06·16

马斯克放话：AI 编码能力会达到 Stockfish 那种统治级水平

马斯克说 AI 在编码和通用计算机操作上会达到 Stockfish 那种水平。Stockfish 是顶级开源国际象棋引擎，能碾压人类特级大师。他没给时间表也没给衡量标准，更像一个长期赌注。

#Code#Elon Musk#Stockfish

精选理由

马斯克发推说未来AI编码能达到Stockfish那种水平——Stockfish是顶级开源国际象棋引擎，能碾压人类大师。比喻很生动，但正文没披露任何时间表、衡量标准或验证方法，属于零来源内容。重要性上限卡在45，因为没法判断这是随口一说还是真有依据。

一句话点评

马斯克拿国际象棋引擎Stockfish打比方，说AI编码和操作电脑能达到碾压人类特级大师的水平。这话听着提气，但他没给时间表，也没说怎么算达标，更像一个长期赌注。正文没披露任何技术路径或验证数据，先别太激动。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

13:32

2d ago

● P1AI HOT 精选· aihot-apiZH13:32 · 06·16

小米发布 MiMo Claw 云端智能助手，集成金山办公套件

小米把 MiMo-V2.5-Pro 旗舰模型塞进了一个云端轻量 Claw 产品里，叫 MiMo Claw。它原生支持 MCP 工具调用协议，一次对话能连续调用上千次工具，上下文窗口有一百万 token。靠着 MTP 三层解码架构，跑 OpenClaw 标准 agent 工作流时吞吐量大概提升到原来的 3 倍。在 ClawEval 测试里任务达标率（Pa...

#Agent#Code#Xiaomi#MiMo

精选理由

我会先打个折：正文没披露定价和真实延迟数据，ClawEval 的达标率也只贴了一半，所以实际性价比和稳定性还不好判断。但小米这次把旗舰模型、金山办公和 MCP 工具调用打包成一个云端轻量产品，信息密度够高，值得从业者关注。

一句话点评

小米把自家旗舰模型和金山办公套件塞进了一个云端助手，免费用户每天能用4小时，但别急着当生产力工具，正文没提任务失败率和实际办公场景的横向对比。

锐评

小米这次发布的 MiMo Claw，本质上是一个免部署的云端智能助手，主打“开箱即用”的 AI 办公体验。它把 MiMo-V2.5-Pro 模型和金山办公（WPS）的文档处理能力打通了，你可以在一个界面里让 AI 直接生成、预览和编辑 Word、Excel、PPT 等文件，不用在多个平台间跳转。这对轻度办公用户来说，确实降低了使用门槛。有几个数字值得留意：官方说在 ClawEval 测试里，任务达标率是 63.8%，同等效果下 Token 消耗比同类产品低 40%-60%。如果属实，意味着跑长任务更省钱。另外，免费用户单次体验时长从 1 小时提到了 4 小时，付费订阅月费 14.9 元起，价格不算贵。不过，文章没给出 63.8% 这个达标率的具体参照系，也没说明“同类产品”是谁。云端托管虽然省事，但后台任务续跑和自主纠错的实际稳定性如何，还得看用户上手后的反馈。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:23

2d ago

FEATUREDAI HOT 精选· aihot-apiZH13:23 · 06·16

美国司法部以国家安全为由，为 xAI 在密西西比州无证运行的燃气轮机辩护

美国司法部正试图驳回 NAACP 对 xAI 的诉讼，理由是关停其燃气轮机会威胁军事行动。国防部官员称，Grok 是四个能在机密网络里支撑关键任务的模型之一，包括近期对伊朗的打击。NAACP 起诉是因为 xAI 在密西西比州的 Colossus 2 数据中心无证运行燃气轮机，数量从 4 月的 27 台涨到 57 台，氮氧化物排放量飙升了 111%。正文...

#xAI#NAACP#U.S. Department of Justice

精选理由

xAI 无证排放被 NAACP 告了，司法部跳出来说关停燃气轮机会影响军事行动，还搬出 Grok 在机密网络里支撑关键任务、包括对伊朗打击的说法。排放数据涨得猛，国防部背书让这件事既有新鲜感又有分量，但还在诉讼阶段，正文没给出军事依赖的具体证据链，我会先打个折。

一句话点评

司法部用“国家安全”给 xAI 无证燃气轮机撑腰，但没说是哪条法律，这点先别太激动。

锐评

这条新闻最值得看的是美国司法部下场的方式：不是帮 xAI 补环保手续，而是直接说关掉它的燃气轮机会威胁军事行动。国防部官员称 Grok 是四个能在机密网络里支撑关键任务的模型之一，还参与了近期对伊朗的打击。这个说法把一家商业公司的数据中心和战争决策绑在了一起，分量很重。但正文没披露司法部援引的具体国家安全法条，也没解释为什么 Grok 的训练或推理必须依赖密西西比州 Colossus 2 那 57 台无证燃气轮机，而不是其他合规的电力方案。NAACP 起诉的核心是排放：燃气轮机数量从 4 月的 27 台涨到 57 台，氮氧化物排放量飙升了 111%。这些数字说明当地环境压力在快速加大，而司法部的回应完全绕开了污染问题，只谈军事必要性。还缺两个关键信息：一是 xAI 有没有申请过许可、被拒过还是根本没申请；二是国防部对 Grok 的依赖有没有替代方案。如果这些都不清楚，所谓“国家安全”更像是一张用来跳过地方环保监管的万能牌。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

12:42

2d ago

FEATUREDAI HOT 精选· aihot-apiZH12:42 · 06·16

WorkBuddy 日活冲到行业第二的 3-4 倍，非技术岗用户大量涌入

从 3 月到现在，WorkBuddy 的日活用户数已经是行业第二名的 3 到 4 倍。用户群不再只是开发者，HR、运营、行政这些非技术岗位也开始用它干活。它的企业版和项目功能把 agent 办公场景拉得更宽了。同期，Trae Work、QoderWork、Kimi Work 都在改名或发新版抢市场。腾讯云觉得这可能是十年一遇的机会。不过正文没披露绝对日...

#WorkBuddy#Trae Work#QoderWork

精选理由

WorkBuddy 日活倍数确实能打，非技术用户进场也是个实打实的信号。但正文没给绝对日活数，没法判断市场盘子到底多大，所以分数先打个折，不上85。

一句话点评

WorkBuddy 日活冲到行业第二的 3-4 倍，非技术岗用户大量涌入，但正文没披露绝对日活数字和统计口径，这个倍数先打个折看。

锐评

这条消息最值得关注的点不是倍数本身，而是用户结构的变化。HR、运营、行政开始用 WorkBuddy 干活，说明 agent 办公产品正在跨出开发者圈，往业务流程里渗透。企业版和项目功能上线后，场景从个人提效变成了团队协作，这是产品从工具转向平台的关键一步。但信息缺口也很明显。正文只说日活是行业第二的 3-4 倍，没给出绝对数字，也没说明行业第二是谁、数据怎么统计的。如果基数很小，倍数再高也没意义。另外，非技术用户到底在用 WorkBuddy 做什么、留存怎么样、付费意愿如何，这些都没提。Trae Work、QoderWork 等竞品在改名抢市场，说明这个赛道还在早期混战阶段，WorkBuddy 的先发优势能不能守住，要看后续的产品迭代和商业化能力。腾讯云说这是十年一遇的机会，更像是在给自己打气，实际验证还差得远。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

09:40

2d ago

FEATUREDAI HOT 精选· aihot-apiZH09:40 · 06·16

DeepSeek 首次拿外部投资，估值超 500 亿美元，但钱进的是梁文锋管的有限合伙，不是公司本身

DeepSeek 完成了第一轮外部融资，融了超过 500 亿人民币（约 74 亿美元），估值推到 500 亿美元以上。这笔交易的结构不太常规：投资人的钱进的是一个由 CEO 梁文锋管理的有限合伙企业，而不是直接投进 DeepSeek 公司。这些外部投资者没有投票权，而且股份要锁定五年才能退出。唯一有投票权的直接投资者是中国国有 AI 投资基金。梁文锋自...

#DeepSeek#Liang Wenfeng#Tencent#Funding

精选理由

我会先打个折：正文没披露这轮融资的具体用途和投资人完整名单，所以没法判断钱会怎么花。但这条消息本身信息密度够高——500 亿美元估值、74 亿美元融资额、有限合伙结构、五年锁定期、唯一有投票权的是国有基金，每一条都在说同一件事：梁文锋把控制权抓得很紧，外部人出钱但没什么话语权。这种安排在国内头部 AI 公司里不常见，对想理解 DeepSeek 权力结构和资本逻辑的人来说，是条硬消息。

一句话点评

DeepSeek 拿了第一笔外部钱，但投资人没投票权、钱锁五年，更像梁文锋用个人信用募了一笔长期赌注。

锐评

这笔融资最值得看的不是 500 亿美元估值，而是钱怎么进来的。投资人把钱放进梁文锋管的有限合伙企业，不是直接投进 DeepSeek 公司，没有投票权，股份还要锁定五年才能卖。唯一有投票权的直接投资者是国有 AI 投资基金。梁文锋自己跟投了约 200 亿人民币，腾讯和宁德时代是最大的外部金主。这个结构说明梁文锋把控制权抓得很死，外部钱更像一笔超长期的、没有管理权的借款。估值 500 亿美元听着高，但跟 OpenAI 和 Anthropic 逼近万亿美元的估值比，还是便宜一截。DeepSeek 的 V4 Pro 模型输入比 GPT-5.5 便宜约 11 倍，输出便宜约 35 倍，价格战打得很凶。梁文锋对投资人明说优先搞基础研究和通用人工智能，不追求短期利润，还会继续做开源模型。正文没披露这笔钱的具体用途，也没说盈利时间表。如果真能把低成本路线跑通，这个估值不算贵；但五年锁定期意味着投资人赌的是 2031 年之后的退出，中间变数不小。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

08:18

2d ago

AI HOT 精选· aihot-apiZH08:18 · 06·16

Google Cloud 开源 OKF v0.1：一份让 AI 智能体不再猜文档结构的 Markdown 规范

Google Cloud 把内部用的知识格式开源成了 OKF v0.1，本质上是一套带固定元数据的 Markdown 写法。每份文档必须包含标题、URI、描述、正文、日期和来源这六个字段，前端元数据还能带上版本号、过期时间和访问提示。它的目的很直接：别让智能体（也就是跑业务流程的 AI）去瞎猜文档里哪段是标题、哪段是正文。目前还是 v0.1 草案，正文...

#Agent#Google Cloud

精选理由

Google Cloud 把内部知识格式开源成 OKF v0.1，是一套带固定元数据的 Markdown 写法，专门让智能体不用瞎猜文档结构。这件事有新闻性（H）也有知识点（K），但 v0.1 草案阶段没有实际采用证据，缺 R，所以整体卡在精选门槛下面一点。

一句话点评

Google Cloud 把内部给 AI 智能体喂资料用的格式开源成了 OKF v0.1，就是一套带固定标签的 Markdown 写法，强制要求标题、链接、描述、正文、日期和来源六个字段，让跑业务流程的 AI 不用再猜文档结构。目前只是 v0.1 草案，正文没披露任何实际采用方或落地案例，也没给出和现有文档格式的兼容性对比。这点先别太激动——规范本身不复杂，但有没有人跟着用才是关键。还缺的是...

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

06:42

2d ago

FEATUREDAI HOT 精选· aihot-apiZH06:42 · 06·16

Cartesia 发了两个实时语音模型 Sonic 3.5 和 Ink 2，一个说一个听，双双在榜单上排第一

Cartesia 把文字转语音的 Sonic 3.5 和语音转文字的 Ink 2 打包成一个实时语音栈。Sonic 3.5 从收到文字到出声音只要约 82 毫秒，在实时 TTS 榜单上拿了第一；Ink 2 在 Artificial Analysis 的流式语音转文字榜单上也排第一。Cartesia 现在是唯一一家同时占着听和说两个榜首的厂商。正文没提模...

#Cartesia#Artificial Analysis

精选理由

Cartesia 把听和说两个方向都做到实时榜单第一，82 毫秒的出声延迟是个硬指标，说明在需要低延迟的对话场景里有实际优势。不过语音赛道本身关注度有限，正文也没披露模型参数量、训练数据和具体架构，技术细节还看不到，所以分数卡在 85 以下。

一句话点评

Cartesia 把听和说的实时模型都做到榜单第一，82 毫秒出声音很快，但正文没提价格和模型大小，先别急着下单。

锐评

Cartesia 这次把文字转语音的 Sonic 3.5 和语音转文字的 Ink 2 打包成一个实时语音栈，两个模型分别在各自榜单上拿了第一。Sonic 3.5 从收到文字到出声音只要约 82 毫秒，这个延迟在实时对话场景里基本感觉不到卡顿，对语音助手、实时翻译这类应用是个实打实的提升。Ink 2 在流式语音转文字上也排第一，说明它在边说边出字的速度和准确率上都有优势。不过正文没披露模型参数量、推理成本和具体定价，也没说什么时候正式开放。榜单第一是好事，但实际用起来贵不贵、稳不稳定，还得等更多信息。另外，两个模型打包成一个栈，意味着你可能要一起用，灵活性会打折扣。如果是真的省钱又好用，那对做语音产品的团队是个好消息，但现在只能先观望。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

04:29

2d ago

FEATUREDAI HOT 精选· aihot-apiZH04:29 · 06·16

微软的 GitHub 被 AI 代码提交量冲垮，不得不找 AWS 借服务器

GitHub 快被 AI 写的代码撑爆了。他们原本预计 2026 年全年会有 140 亿次代码提交，而 2025 年这个数字才 10 亿，翻了 14 倍。微软本来计划在 2027 年前把 GitHub 全部迁到自己家的 Azure 云上，但迁移速度根本追不上需求暴涨。从去年 10 月到现在，他们把扩容目标从 10 倍调高到了 30 倍，到今年 5 月也...

#Microsoft#GitHub#AWS

精选理由

GitHub 因为 AI 代码提交量一年暴涨 14 倍，自家 Azure 迁移来不及，被迫找 AWS 救火——数字扎实，讽刺感拉满，三条 HKR 都打中了。没给更高分是因为这本质上是基础设施运维故事，不是产品发布，而且跟 AWS 的具体合作细节正文也没披露。

一句话点评

微软把 GitHub 的算力需求外包给了死对头 AWS，因为 AI 写的代码太多，自家 Azure 根本接不住。

锐评

这件事最直白的信号是：AI 写代码的量已经大到连微软都扛不住了。GitHub 预计 2026 年全年代码提交量会冲到 140 亿次，是 2025 年 10 亿次的 14 倍。这个数字本身要打个折，因为提交次数不等于有效代码产出，AI 很容易刷出大量低质量提交，但它确实说明平台的基础设施压力是实打实的。微软原本计划 2027 年前把 GitHub 全部迁到 Azure，但从去年 10 月到现在，扩容目标从 10 倍一路调到 30 倍，到今年 5 月还有 40% 的核心流量没迁完，当月还出了 9 次事故。迁移速度追不上需求暴涨，这是他们转头找 AWS 买容量的直接原因。微软官方只承认在搞多云策略，没点名 AWS，但消息源指向的就是亚马逊。正文没披露这笔 AWS 订单的规模和费用，也没说这种多云架构是临时过渡还是长期方案。如果 GitHub 长期跑在 AWS 上，微软当年收购时说的“开发者优先、开放平台”反而成了一句被现实逼出来的实话。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:39

3d ago

AI HOT 精选· aihot-apiZH02:39 · 06·16

支付宝开始内测 AI 版，右滑就能跟助手“阿宝”对话办事

支付宝把 AI 助手直接塞进了 App 里，右滑就能切到一个对话界面，跟叫“阿宝”的助手用文字或语音说你要办的事。比如查公积金，它会自动找到对应的小程序入口，把操作页面摆到你面前，省掉原来好几步跳转。涉及付钱、转账的环节，最后一步还是得你自己点确认，阿宝只负责跑流程。官方这次只放了 100 个邀请码，正文没提什么时候大规模开放，也没说背后用的是哪个模型。

#Alipay#Ant Group

精选理由

支付宝在 App 里塞了个右滑就能唤出的 AI 助手“阿宝”，帮你跑腿找小程序、填信息，但付钱转账最后一步还是得你自己点。官方只放了 100 个邀请码，正文没提大规模开放时间和背后模型。我会先打个折：交互想法挺直接，但技术细节完全没给，现在只能当个产品动向看，别急着往能力上靠。

一句话点评

支付宝把AI助手“阿宝”塞进App，右滑对话就能查公积金、调小程序，省掉手动翻菜单。支付环节仍由用户确认，安全设计合理。但官方只放了100个邀请码，规模极小，正文没提模型来源和正式上线时间，目前更像PR试探，别当产品已成熟。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

02:23

3d ago

FEATUREDAI HOT 精选· aihot-apiZH02:23 · 06·16

蚂蚁百灵开源三款新模型，用混合注意力架构把推理速度拉到 340 tokens/s

蚂蚁百灵发了 Ling-2.6-flash、Ling-2.6-1T 和 Ring-2.6-1T 的技术报告，代码和权重都公开了。三款模型用了同一种 Hybrid Linear Attention 架构，把 Lightning Attention 和 MLA 按 7:1 的比例拼在一起，主要为了在长文本上跑得快、省资源。Ling-2.6-flash 在 ...

#Reasoning#Agent#Code#Ant Group

精选理由

蚂蚁百灵这次开源了三款模型，核心卖点是把 Lightning Attention 和 MLA 按 7:1 的比例揉成一个 Hybrid Linear Attention，主要为了在长文本上省资源、跑得快。报告给了具体参数和效率数据，代码权重都公开，信息扎实，所以给了 featured。没打更高是因为蚂蚁的模型在社区关注度上还比不上那几个顶流实验室，实际业务里的表现也得再观察，我会先打个折。

一句话点评

蚂蚁百灵把三款新模型全开源了，架构上把两种注意力机制按7:1混搭，主要图长文本跑得快。Ling-2.6-flash在4块H20上每秒能吐340个token，1T版训练效率比上代高了约4倍，但报告没提具体训练花了多少钱。

锐评

这次蚂蚁百灵公开的技术报告挺实在，把Ling-2.6-flash、Ling-2.6-1T和Ring-2.6-1T的架构、训练流程和Agent强化学习细节都摊开了。三款模型用的都是Hybrid Linear Attention，简单说就是把Lightning Attention和MLA（多头潜在注意力）按7:1的比例拼在一起，目的是在处理长文本时既省显存又跑得快。Ling-2.6-flash在4块H20显卡上解码速度到了340 tokens/s，这个数字对需要低延迟的线上业务比较友好。Ling-2.6-1T在Artificial Analysis Intelligence Index上的token效率比前代提升了约4倍，说明训练时用更少的算力就能达到相近效果，但报告正文没披露具体的训练总成本和数据规模，这点先别太激动。Ring-2.6-1T high在PinchBench拿了87.60，ClawEval得了63.82，这两个分数在同类开源模型里算能打，不过报告没给出和同尺寸竞品的横向对比，也没说明这些评测任务和实际业务场景的对应关系。代码和权重都公开了，后续可以自己跑一下验证。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

02:06

3d ago

AI HOT 精选· aihot-apiZH02:06 · 06·16

毕业生被AI检测整疯了：手写判99%AI率，AI写的反而0%

国内高校用AIGC检测工具查论文，结果经常反常识。有学生手写的摘要被判定99%是AI生成的，而完全用AI写的部分却显示0%。学校要求AIGC率低于40%，学生用Claude反复改，花了一百多块检测费（维普20元一篇，知网和万方按每千字符2元收费），才把数字压到36.1%。答辩时导师让改回学术表达，AI率又弹回37.21%。同一篇论文在三个平台测出48%...

#Claude#维普#知网

精选理由

HKR三条全中，但这是一篇现象报道而非产品/研究更新，所以分数卡在featured门槛以下。具体的检测费用和平台间数据差异让文章有料，荒诞的循环既有趣又有共鸣。72分，tier all。

一句话点评

这条新闻最荒诞的地方不是检测不准，而是学生被迫花钱跟一个不准的系统玩猫捉老鼠。手写被判99% AI率，纯AI写反而0%，说明这些检测工具连“什么是人写的”都没搞明白。维普20元一篇、知网万方按千字符2元收费，学生花了一百多块反复测，就为了把数字压到学校要求的40%以下。同一篇论文在三个平台测出48%、44%、59%，差异大到没法信。更离谱的是，答辩导师让改回学术表达，AI率又弹回37.21%...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

01:56

3d ago

AI HOT 精选· aihot-apiZH01:56 · 06·16

教育部“阳光志愿”系统升级：输入分数和排名，AI 助手帮你筛志愿

教育部今天上线了升级版“阳光志愿”系统，免费给考生用。输入高考成绩和位次，系统就能推荐志愿方案，还带一个叫“智慧小招”的 AI 助手，24 小时回答政策问题。数据由高校直接报送、官方核验，覆盖就业去向和奖学金信息，也包含 21 项生涯测评工具。正文没披露 AI 助手用了哪个模型，也没说推荐算法的具体逻辑——这点先别太激动，权威性主要靠数据来源，不是 A...

#Ministry of Education#IT之家

精选理由

传统政务服务+AI作为工具，没有agent或产品层面的新意。AI助手只是其中一个功能，正文没披露模型、算法或任何技术细节。硬排除规则#4触发：传统政务/科学+AI作为工具，无agent/产品属性。

一句话点评

教育部免费志愿填报系统升级上线，输入成绩和位次就能出方案，还带AI助手“智慧小招”24小时答疑。数据由高校直报、官方核验，权威性比商业App靠谱。但正文没披露AI助手用的什么模型，推荐算法逻辑也没说——这点先别太激动，权威主要靠数据来源，不是AI多聪明。21项生涯测评工具倒是实用，适合考生摸清方向。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

SCORE

H0·K0·R0

01:49

3d ago

AI HOT 精选· aihot-apiZH01:49 · 06·16

字节跳动上线 Seedance 2.0 Mini，视频生成成本直接砍半

字节在火山引擎上线了 Seedance 2.0 Mini 视频生成模型，主打便宜。生成 720p 视频每秒大约 0.5 元，比标准版便宜一半，速度是 Seedance 2.0 Fast 的两倍，官方说画质没怎么降。图生视频每千 tokens 收 0.023 元，视频生视频收 0.014 元。主要想用在电商素材、营销物料和用户原创内容这些需要批量出片的场...

#ByteDance#Volcano Engine#Seedance 2.0 Mini

精选理由

字节在火山引擎上线了 Seedance 2.0 Mini，720p 视频每秒约 0.5 元，比标准版便宜一半，速度是 Fast 版的两倍，官方说画质没怎么降。定价信息具体，对做视频生成的团队有参考价值。但这只是产品线扩展，不是新模型发布，正文也没给出画质对比的量化数据，所以我会先打个折。

一句话点评

字节发了个便宜版视频模型，720p 每秒约 0.5 元，比标准版砍半，速度还快两倍。官方说画质没怎么降，主要给电商和营销批量出片用。但正文没提最长能生成多少秒、模型参数量，也没给画质对比样本，所以“画质相当”这个说法先打个折。如果是真的，这个价格对高频低预算场景挺友好，但实际效果还得等上线后自己跑跑看。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

00:30

3d ago

FEATUREDAI HOT 精选· aihot-apiZH00:30 · 06·16

五角大楼把大部分日常 AI 工作流从 Anthropic 迁走，计划 9 月前彻底切断

五角大楼已经转移了超过三分之二的日常 AI 工作负载，不再用 Anthropic 的模型，目标是在 9 月前完全清零。起因是年初五角大楼想让 Anthropic 签一份协议，允许把 Claude 用于大规模监控和全自动武器，CEO Dario Amodei 以模型还不够可靠为由拒绝了。之后五角大楼把 Anthropic 列为“供应链风险”，还起诉了但没...

#Anthropic#OpenAI#Dario Amodei

精选理由

五角大楼和Anthropic的决裂是个标志性事件：一边是国防需求，一边是AI伦理底线，Dario以模型不够可靠为由拒绝签字，结果被列为供应链风险并限期清零。冲突本身够硬，细节也扎实，但起诉结果和替代方案还没披露，所以分数没给到90以上。

一句话点评

五角大楼把日常AI工作从Anthropic切走，不是因为技术不行，是因为CEO拒绝签大规模监控和全自动武器的使用协议。

锐评

这事本质是AI公司被逼到墙角：要么接军方的活但背上伦理风险，要么拒绝然后丢订单。Anthropic选了后者，CEO Dario Amodei的理由是模型还不够可靠，不敢让它进全自动武器和大规模监控这种零容错场景。五角大楼反应很快，直接把Anthropic标成“供应链风险”，还起诉了，虽然没赢。OpenAI调整了立场，把合同吃下来了。现在超过三分之二的日常AI工作负载已经迁走，目标是9月前完全清零。Polymarket上预测6月底前双方和解的概率只有9%，说明市场也不看好短期内能谈拢。正文没披露具体迁移到了哪些模型，也没说OpenAI到底在哪些条款上松了口。这点先别太激动——日常AI工作流可能只是文档处理、代码辅助这类非致命场景，跟全自动武器还有距离。但Anthropic这次硬扛，确实给行业立了个先例：有些钱可以不赚。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:00

3d ago

FEATUREDAI HOT 精选· aihot-apiZH00:00 · 06·16

Qwen 发布机器人操作模型 RobotManip，靠对齐而非堆预训练数据让机械臂听懂人话干活

Qwen 团队放出了 Qwen-RobotManip，一个给机械臂用的基础模型。核心思路不是继续堆预训练数据，而是做对齐——用偏好样本教模型学会正确的操作风格，让规模真正发挥作用。演示里，Qwen-Omni 会实时观察桌面，随口发指令，RobotManip 现场执行，没有预设任务清单，能叠碗、叠衣服、做汉堡、插花。模型在多种真实机械臂平台上跑过，对没见...

#Robotics#Qwen (Alibaba)#Qwen-Omni#Qwen-RobotManip

精选理由

Qwen-RobotManip 不是又一个更大的机器人模型，它用对齐替代更多预训练数据来释放规模潜力，演示里 Qwen-Omni 随口发指令、机械臂现场执行，效果挺直观。我会先打个折，因为正文没披露偏好数据的规模、采集成本和对齐方法的具体细节，验证强度还不好判断。分数定在 82，低于 85 就是因为这些信息缺口，但方向本身对行业有参考价值。

一句话点评

Qwen 给机械臂模型做对齐，让它在没见过的任务上也能听懂人话直接干活，但正文没披露模型大小、训练数据量和延迟，这些是判断能不能落地的关键。

锐评

这条新闻最值得看的是思路：不是继续堆预训练数据，而是用偏好样本做对齐，让机械臂模型学会“正确的操作风格”。演示里 Qwen-Omni 实时看桌面、随口发指令，RobotManip 现场执行叠碗、叠衣服、做汉堡、插花，没有预设任务清单，跨了好几种真实机械臂平台。这说明模型对新场景、没见过的语言指令和不同硬件有一定泛化能力。但正文只给了演示视频和论文链接，没披露模型参数量、训练数据规模，也没提推理延迟。机器人操作对实时性要求很高，延迟不公布就没法判断实际可用性。另外，演示场景偏桌面整理和简单装配，复杂接触、动态环境下的表现还不清楚。如果是真的，这套“对齐解锁规模”的路线挺省钱——不用无止境采数据，靠偏好样本就能让大模型在操作任务上发挥出来。但现阶段只能当技术验证看，离产线部署还缺可靠性数据和量化指标。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:00

3d ago

FEATUREDAI HOT 精选· aihot-apiZH00:00 · 06·16

Qwen 发布 RobotWorld 世界模型：用自然语言统一 20 多种机器人的动作控制

Qwen 放出了一个叫 RobotWorld 的具身世界模型，核心思路是把自然语言当成通用遥控器——你说“拿起红杯子放架子上”，它就能直接生成对应的动作视频，不用给每种机器人单独写控制接口。模型用 Qwen2.5-VL 做动作编码器，靠 860 万条视频-文本对联合训练了操作、自动驾驶和室内导航三类场景，覆盖 20 多种机器人形态和 500 多个动作类...

#Qwen#Qwen2.5-VL

精选理由

Qwen 放出了 RobotWorld，一个用自然语言当通用动作接口的具身世界模型，拿 860 万条视频-文本对训练，跨了操作、自动驾驶和室内导航三个领域。规模和多形态覆盖是实打实的，没给更高分是因为目前只有博客和论文，没有可用的模型或 demo 放出来，落地效果还看不到。

一句话点评

Qwen 用自然语言当通用遥控器，一个模型统一了 20 多种机器人和 500 多个动作，但没提实际跑起来延迟多少。

锐评

这条新闻的核心卖点是“语言即接口”：你不用给每种机器人单独写控制程序，说一句“拿起红杯子放架子上”，模型就能直接生成动作视频。这背后是用 Qwen2.5-VL 做动作编码器，靠 860 万条视频-文本对联合训练了操作、自动驾驶和室内导航三类场景。模型能同时生成 2 到 4 个视角的视频，并且保证不同视角里物体的位置和运动轨迹一致，这点在技术上挺实用，相当于自带多机位监控。但有几个地方得先打个折。第一，正文没披露推理速度，这对机器人控制是致命信息——生成一帧要 0.5 秒还是 5 秒，决定了它能不能用在真实场景里。第二，虽然宣称在 4 个基准上拿了第一，但没说是哪 4 个基准，也没给具体分数，验证强度存疑。第三，860 万条数据听起来不少，但跨了三个差异巨大的领域，每个领域实际分到多少样本、质量如何，正文都没交代。还缺的关键信息是：这个模型生成的视频，跟真实物理世界的误差有多大？有没有在真实机器人上做过闭环控制实验？如果只是生成好看的视频但没法驱动机器人干活，那它更接近一个仿真渲染工具，而不是世界模型。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:00

3d ago

FEATUREDAI HOT 精选· aihot-apiZH00:00 · 06·16

xAI 发布 Grok Imagine Video 1.5：图生视频更快了，还能同步生成音频

xAI 把它的图生视频模型升级到了 1.5 版，现在通过 API 正式开放，网页端和手机 App 上还提供了一个更快的 Fast 版本。生成一段 6 秒 720p 的视频大约需要 25 秒，比上一代快了将近一倍。音频和画面是同步生成的，环境音、音效和对白能直接对上动作，口型也更准了。长镜头里的运动更稳，扭曲少了，物体的重量感和惯性更真实。工作流上新增了...

#xAI#Grok#David Thompson

精选理由

xAI 把图生视频模型升到 1.5，速度翻倍、加了同步音频和更好的物理表现，这些升级都踩在实用痛点上。但视频生成赛道已经有跑在前面的玩家，这次更新更像是追平差距而不是拉开身位，所以重要性维持 78 分不变。

一句话点评

xAI 把图生视频模型升到 1.5，6 秒 720p 生成只要 25 秒，比上代快近一倍，音画同步生成，口型也更准。但正文没提训练数据规模和定价，这点先别太激动。

锐评

Grok Imagine Video 1.5 这次升级主要解决了两件事：速度和音画同步。生成一段 6 秒 720p 视频从 40 多秒压到 25 秒左右，对需要快速迭代的创作者来说，等待成本明显降低。音频和画面在同一个生成过程里完成，环境音、音效、对白能直接对上动作，口型同步也有改善，这比先出画面再单独配音的方案更省事。长镜头里的运动也更稳了，扭曲少了，物体的重量感和惯性更真实，说明模型在物理一致性上做了针对性优化。工作流方面，新增了项目分组、并行多智能体提示和素材库搜索，相当于给创作者配了一套简单的项目管理工具，不用再靠翻聊天记录找素材。官方还放了一个用 1.5 做的电影级预告片案例，展示上限效果，但没给普通用户日常出片的成功率数据。最大的信息缺口是训练数据规模和 API 定价完全没提。速度快、效果好，但如果成本翻倍或者数据合规存疑，实际落地就得打折扣。另外，Fast 版和标准版在画质上差多少，正文也没交代。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

00:00

3d ago

FEATUREDAI HOT 精选· aihot-apiZH00:00 · 06·16

OpenRouter 推出 Subagent 工具：让贵模型把杂活外包给便宜模型干

OpenRouter 上线了一个服务端工具 Subagent。把它加到 tools 数组里，你的主力模型（比如 Claude Opus 4.8）就能在生成过程中把总结、提取数据、套模板、转格式这类机械活扔给更便宜的小模型（比如 GLM 5.2）去跑。Claude Opus 4.8 每百万输入 token 要 5 美元，GLM 5.2 只要 1.4 美元...

#Agent#OpenRouter#Anthropic Claude Opus 4.8#GLM 5.2

精选理由

OpenRouter 把子任务委托做成了服务端工具，不是简单包一层 API。Opus 4.8 和 GLM 5.2 的价格对比让省钱效果很直观。要扣分的地方：正文没给延迟数据，也没说子代理跑崩了怎么兜底。我会先打个折，等有实际延迟和容错方案再看。

一句话点评

OpenRouter 上线了 Subagent 工具，让贵模型把总结、提取数据这类机械活扔给便宜小模型干，Claude Opus 4.8 和 GLM 5.2 的输入价差 3.6 倍，省的是真金白银。

锐评

这条值得点开看，因为它解决了一个很实际的成本问题：在 agent 流程里，主力模型经常被用来干总结、转格式、套模板这类不需要强推理的活，白白烧钱。OpenRouter 的方案是把这些任务打包成一个服务端工具，主力模型在生成过程中直接委托给便宜的小模型（比如 GLM 5.2），自己只负责编排和判断。文章给了一个具体场景：20 次工具调用的 agent 工作流里，大概 5 到 8 次可以委托出去，单次请求成本直接砍一截，推理质量不受影响。技术细节上，每次委托是隔离的，小模型只看得到任务描述，拿不到父对话的上下文和记忆，这避免了上下文污染。小模型自己也能带工具（比如联网搜索），但禁止递归委托，单次请求最多委托 10 次，这些限制让行为可控。文章还提了一嘴 Advisor 工具，跟 Subagent 相反，是把难决策往上抛给更强的模型，两者可以搭配用。正文没给出实际延迟数据和委托失败率，也没说小模型输出质量波动时怎么兜底。这点先别太激动，省钱的账算得漂亮，但生产环境里委托链路一长，稳定性和调试复杂度都是未知数。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:00

3d ago

FEATUREDAI HOT 精选· aihot-apiZH00:00 · 06·16

Qwen-RobotNav：一个模型搞定五种导航任务，还能让上层 AI 随时调整它的观察策略

Qwen 发布了一个叫 Qwen-RobotNav 的导航模型，基于 Qwen3-VL 训练，用 1560 万条样本学会了指令跟随、找东西、跟踪目标、自动驾驶和具身问答这五种活。它把视觉记忆的控制权开放了出来，像调节“看多少帧”、“更关注新画面还是旧画面”、“不同摄像头各占多少注意力”这些参数，都可以在运行时直接改，不用重新训练。在 EXPRESS-B...

#Qwen#Qwen-RobotNav#Qwen3-VL

精选理由

Qwen 基于 Qwen3-VL 训了个机器人导航模型，1560万条样本学会五种活。亮点是把视觉记忆参数开放出来，运行时就能调，不用重新训练。这点先别太激动，因为正文没给真实机器人上的测试结果，目前还是仿真和数据集上的表现。

一句话点评

Qwen 把导航模型做成了一个可调参数的“视觉记忆接口”，推理时就能改看多少帧、新旧画面权重，不用重新训练。在 EXPRESS-Bench 上比之前最好的成绩高了 15.4%，导航步数还少了 77%，但实机只在一台 Go2 上测过。

锐评

这条新闻最值得看的是他们把“怎么记住画面”这件事做成了可调节的接口。模型训练时用了 1560 万条样本，把视觉记忆的四个参数——总看多少帧、新旧画面各占多少注意力、不同摄像头权重、采样方式——全部随机化，所以推理时上层规划器可以直接调参，不用改模型结构。这相当于给导航模型装了个“记忆旋钮”，找东西时可以多看历史画面，跟踪目标时只看最近几帧，一套权重搞定五种任务。数字上，他们在 VLN-CE RxR 上指令跟随成功率 76.5%，HM3Dv2 物体搜索只用 RGB 就达到 75.6%，超过了用深度信息的方法。EXPRESS-Bench 上比之前最好成绩高 15.4%，导航步数少 77%，说明规划效率确实有提升。但正文没披露这 1560 万条样本的具体构成和来源，也没说训练用了多少算力。实机验证只在一台 Unitree Go2 上做了零样本部署，用的是自带低分辨率单摄像头，场景覆盖有限。还缺的是：这套参数化接口在不同机器人平台上的迁移成本、多摄像头配置下的上限表现，以及和现有导航栈的对比基准。如果后续能补上这些，对做机器人导航的人来说会更有参考价值。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:00

3d ago

FEATUREDAI HOT 精选· aihot-apiZH00:00 · 06·16

本地编程栈实测：Qwen 3.6 35B-A3B 免费换来 5 倍提速

Tomasz Tunguz 翻完 Hacker News 上 500 多条评论，画出了现在程序员用本地模型写代码的主流配置。模型这边，Qwen 3.6 35B-A3B 被提到最多，占 33%，它的 27B 版本占 20%，后面是 DeepSeek Pro 和 Gemma4 31B。这些模型都用了混合专家架构，好处是能在普通家用显卡上跑起来——35B 总...

#Code#Agent#Qwen#DeepSeek

精选理由

Tunguz 从 500 多条 HN 评论里挖出了真实的本地编程配置：模型端 Qwen 3.6 35B-A3B 占 33%，工具端 Pi 占 49%，混合专家架构让消费级显卡能跑起来。有对比有数字，不是厂商通稿。扣分是因为这是二手整理，不是一手评测，而且正文没给出性能对比基准，只能当社区风向看。

一句话点评

Hacker News 500 多条评论画出了本地写代码的主流配置：Qwen 3.6 35B-A3B 被提最多，跑在普通显卡上，零成本、能离线，但效果像需要你手把手带的初级程序员。

锐评

Tomasz Tunguz 翻完一个 Hacker News 帖子，把现在程序员用本地模型写代码的配置理清楚了。模型首选是 Qwen 3.6 35B-A3B，被 33% 的评论提到，它的 27B 版本占 20%。这些模型都用了混合专家架构，总参数看着大，但实际推理时只激活一小部分，所以能在普通家用显卡上跑起来。工具这边，Pi 和 OpenCode 是主流，都是轻量级的外壳，专门为本地推理设计。有个评论把体验说得很直白：用本地的 Qwen 写代码，像带一个知识面广但需要你时刻指导的初级程序员，效率提升大概 5 倍；而用云端付费的 Claude Opus，像有个能跟你一起想架构的资深同事，效率提升 15 倍。差距摆在这，但零成本、完全离线、代码隐私不外泄，对很多人来说这个折中很划算。跑分也印证了这一点：Qwen3.6 27B 在 SWE-bench Verified 上拿了 77.2%，35B-A3B 拿了 73.4%，离 Claude Sonnet 4.6 的 79.6% 确实不远。不过这篇分析完全基于一个论坛帖子的自发讨论，不是严谨的抽样调查，样本量也就 500 多条评论，只能反映那批爱折腾的早期用户的偏好。正文没披露这些模型跑在什么具体显卡上、内存占用多少、处理大项目时上下文窗口够不够用。如果你也想搭一套，最好先拿自己常写的代码类型测一下，别光看跑分就上头。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:00

3d ago

AI HOT 精选· aihot-apiZH00:00 · 06·16

Grok 出了个免费 PowerPoint 插件，在幻灯片里直接让 AI 帮你写稿、搜资料、配图

xAI 在 6 月 16 日给 Microsoft PowerPoint 上架了一个免费插件，你给个大纲，Grok 就能生成整份带图、带图表、甚至带网络或 X 平台实时信息的幻灯片。它也能按指令加单页、换风格、调整结构，还能调用你绑定的 Grok 连接器（比如最近的邮件、SharePoint 或 Google Drive 里的文件）来写内容。之前 Gr...

#Vision#xAI#Grok#Microsoft

精选理由

xAI 给 PowerPoint 上了个免费插件，Grok 能根据大纲直接吐整份幻灯片，还能接实时数据和外部文件。场景选得准，打工人看了会心动，但全文就是功能清单，没任何实测数据，效果好不好、会不会瞎编内容都未知，这点先别太激动。

一句话点评

Grok 出了个免费 PowerPoint 插件，给个大纲就能生成整份带图、带实时数据的幻灯片，还能按指令加页、换风格。它可以直接读你绑定的邮件、SharePoint 或 Google Drive 里的文件来写内容，这点比纯靠提示词实用。不过正文没提生成质量到底怎么样，也没说图表和配图是自动搜来的还是模板拼的。如果是真的能省掉大半排版和搜资料的时间，但别指望一次生成就能直接用，大概率还得自己改。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

AX 严选 · 2026-06-16

更多

频道

后台