热点聚合 · 2026-05-30

▸ 22 signals · updated 3m ago

live · 238 today·policy v2

AI HOT 精选OpenAI 上市前连挖两人：Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户，医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线，App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI，但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench：由博士科学家出题、审题，专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus，它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史：你以为的石破天惊，其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型，用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗？Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人：Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户，医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线，App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI，但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench：由博士科学家出题、审题，专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus，它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史：你以为的石破天惊，其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型，用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗？Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人：Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户，医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线，App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI，但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench：由博士科学家出题、审题，专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus，它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史：你以为的石破天惊，其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型，用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗？Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·

⤓ RSS live

按日期浏览清除筛选 ✕

2026年5月

一二三四五六日

126 212 320 419 542 632 749 826 923 1017 1136 1248 1337 1454 1539 1630 1719 1849 1976 2045 2148 2249 2313 2415 2520 2637 2744 2848 2935 3022 3114

2026年6月

一二三四五六日

147 258 348 447 545 619 715 852 945 1031 1128 1221 1313 1415 1524 1635 1726 1824 1912021222324252627282930

2026-05-30 · 星期六2026年5月30日

21:09

19d ago

FEATUREDr/LocalLLaMA· rssEN21:09 · 05·30

我花 6400 美元搭了一台本地大模型服务器，一年下来比用 API 便宜了 700 多

作者晒了一台自组的本地大模型服务器，总花费 6406.45 美元，核心配置是 4 张 AMD MI100 显卡，主要跑 Qwen3.6 27B 模型。这台机器每天处理约 2040 万个输入 token 和 132 万个输出 token。他拿 OpenRouter 的 API 价格算了一笔账：第一年本地总成本（含电费）是 2992.72 美元，而调用同等...

#Inference-opt#Qwen#OpenRouter#Z.AI

精选理由

这是一篇个人实测帖，不是厂商通稿。作者把账单摊开算：硬件折旧、电费、OpenRouter 比价，结论是首年能省 700 多美元。我会先打个折——这个结论绑定了他的特定负载（日处理 2000 多万 token）和二手 MI100 价格，换个人未必复现。但文章的价值不在普适性，而在把“自建推理服务器到底划不划算”这笔账算得清楚、可复现，对正在纠结买卡还是调 API 的人有参考意义。信息密度和话题性都够，放在 featured 低位合理。

一句话点评

自组 4 卡 MI100 跑 Qwen 27B，第一年比用 API 便宜 700 多刀，但正文被 Reddit 屏蔽了，看不到具体配置和折旧算法。

锐评

作者算了一笔本地大模型服务器的经济账：花 6406 美元攒了台 4 张 AMD MI100 显卡的机器，主要跑 Qwen3.6 27B，每天吞吐量约 2040 万输入 token 加 132 万输出 token。拿 OpenRouter 的 API 价格对比，第一年本地总成本 2992 美元，比纯用 API 的 3701 美元省了 700 多。这个数字看着还行，但得打个折——Reddit 原文被屏蔽了，我们看不到电费单价、硬件折旧年限、MI100 的二手行情这些关键假设。MI100 是 2020 年的老卡，32GB 显存，跑 27B 模型得靠多卡并行，实际推理延迟和并发能力都没披露。另外，本地维护的人工成本、机器闲置时的电费、模型更新换代的迁移成本，这些隐性开销也没法核实。如果只是个人重度使用，这个方案确实比按月付 API 费划算，但前提是你得会折腾驱动和推理框架，MI100 在 ROCm 下的兼容性坑不少。想抄作业的话，先确认自己的日均 token 量能不能跑满这个利用率，否则回本周期会拉长很多。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:02

19d ago

FEATUREDAI HOT 精选· aihot-apiZH21:02 · 05·30

Simon Willison 把 Python 网页应用直接跑在了浏览器里，不再需要后端服务器

Simon Willison 用 Pyodide（把 Python 编译成浏览器能跑的 WebAssembly）加上 Service Worker，让 Python 的 ASGI 网页应用完全在浏览器里运行。他让 Claude Opus 4.8 帮忙写了代码，做了两个能用的演示：一个基础 FastAPI 例子，另一个是他自己的 Datasette 1....

#Code#Tools#Simon Willison#Claude

精选理由

Simon Willison 用 Claude Opus 4.8 辅助开发，把 Python ASGI 应用搬进了浏览器，已经跑通了 Datasette 的演示。这件事的钩子在于：浏览器不再只是前端沙箱，可以直接当应用服务器用。技术栈交代得清楚，Pyodide、Service Worker、ASGI FastCGI 每一步都有据可查，不是概念图而是能跑的代码。我会先打个折，这目前还是个开发者实验，离生产环境还有距离，但思路对无服务器和边缘部署的人有启发。

一句话点评

Simon Willison 用 Pyodide 把 Python 网页应用搬进浏览器里跑，不再需要后端服务器，Datasette 都能完整运行。

锐评

Simon Willison 把 Python 的 ASGI 网页应用（比如 FastAPI 和他自己的 Datasette）完全塞进了浏览器。做法是用 Pyodide 把 Python 编译成 WebAssembly，再配合 Service Worker 拦截浏览器请求，直接在本地跑 Python 后端逻辑。这比四年前他做的 Datasette Lite 更进一步：旧方案用 Web Worker 模拟，页面里的 JavaScript 脚本跑不起来，很多插件会挂；新方案用 Service Worker 走完整的 ASGI 协议，脚本能正常执行，兼容性好得多。代码是让 Claude Opus 4.8 帮忙写的，他给了两个能跑的演示：一个基础 FastAPI 例子，一个 Datasette 1.0a31 完整版。这说明方案不是针对某个应用的特例，对遵循 ASGI 标准的 Python 应用都适用。不过正文没提性能开销和首屏加载时间。Pyodide 本身初始化就不快，加上 Service Worker 拦截所有请求，实际延迟和内存占用会是多少，目前没有数据。另外，这种方案只适合处理同源请求，跨域场景和需要真实后端数据库的应用还是得老老实实搭服务器。他说等自己搞明白原理后会升级 Datasette Lite，到时候可以看看实际体验到底怎么样。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

18:55

19d ago

FEATUREDAI HOT 精选· aihot-apiZH18:55 · 05·30

软银被曝计划在法国砸 750 亿欧元建 AI 数据中心

消息来自《论坛报》和《金融时报》，软银自己还没官宣。750 亿欧元这个数字很大——作为对比，法国之前公布的“法国 2030”计划里给整个 AI 的预算大约是 25 亿欧元。这笔钱主要投向 AI 数据中心，也就是给大模型训练和推理提供算力的基础设施。不过正文没披露具体建多少座、选址在哪、分几期投入，也没说软银是独资还是拉上当地伙伴一起干。我会先打个折：这...

#SoftBank#La Tribune#Financial Times#Funding

精选理由

这条消息我会先打个折，因为正文只引了《论坛报》和《金融时报》的报道，没披露交易结构、时间表或已确认的承诺。但750亿欧元的数字本身就构成一个强信号：算力基建的军备竞赛已经从北美烧到欧洲，软银选法国落子，背后大概率有当地能源和政策许可的配合。对从业者来说，这比单纯看模型发布更值得留意——它关系到未来几年欧洲区的算力供给和成本。

一句话点评

软银要在法国砸750亿欧元建AI数据中心，但消息来自媒体爆料，软银自己还没官宣，数字先打个折看。

锐评

这条消息目前还停留在“据报道”阶段，源头是《论坛报》和《金融时报》，软银官方没有确认。750亿欧元这个数字非常夸张——法国政府之前整个“法国2030”计划拨给AI的总预算才25亿欧元左右，一下子多出几十倍的体量，如果属实，会直接改变欧洲算力格局。钱主要投向AI数据中心，也就是给大模型训练和推理提供算力的基础设施。但正文没披露具体建多少座、选址在哪、分几期投入、软银是独资还是拉当地伙伴一起干，这些关键信息全是空白。另外，750亿是承诺投资还是实际到位资金也没说清，这种超大额投资通常分多年、附带条件，落地过程中变数很多。在软银正式公告出来之前，这条消息更适合当信号看，别急着当事实用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

18:39

19d ago

● P1FT · 科技· rssEN18:39 · 05·30

SoftBank承诺750亿欧元在法国建设欧洲最大AI设施

软银说要砸750亿欧元在法国建一个欧洲最大的AI设施。不过目前能看到的正文只有FT的403安全验证页面，具体建多大、什么时候建成、跟谁合作、用什么技术方案，这些关键信息全都没披露。这个数字本身挺唬人的，但正文没给任何细节，先别太激动。

#SoftBank#Financial Times#Funding

精选理由

标题信息量不小，但正文被付费墙挡死了，实际内容为零。软银 750 亿欧元的数字很大，说明资本在算力基建上还在加码，法国被选为落脚点也值得关注。不过我会先打个折——没看到具体规划、合作伙伴或落地时间，这些都还是空白，所以重要性给到 82 已经算给面子了，再高就虚了。

一句话点评

750亿欧元是个大饼，目前只是意向，钱还没到账。法国想借机搞AI主权，但正文没披露具体落地时间表和约束条款，先别太激动。

锐评

孙正义这次画了个超级大饼：承诺在法国砸750亿欧元建数据中心，号称欧洲最大AI设施。数字看着吓人，但这是多年累计投资额，不是一次性到账。FT另一篇报道点出了关键——这个项目绑着“AI主权”的旗号，但具体怎么绑、法国政府给了什么优惠、软银自己出多少还是拉基金一起投，正文都没写清楚。对从业者来说，如果真能落地，意味着欧洲多了一大块算力供给，可能拉低推理和训练成本。但软银过往在WeWork等项目的执行记录，让人不得不打折看待这个承诺。目前连选址、电力供应、芯片来源这些硬指标都没披露，更像是一份政治合作备忘录而非工程计划。还缺什么：分阶段投资节点、软银自有资金比例、法国政府的补贴或税收优惠细节、以及建成后的算力定价模式。这些信息不出来，750亿就只是个数字。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:52

19d ago

FEATUREDAI HOT 精选· aihot-apiZH17:52 · 05·30

NVIDIA 用 DynoSim 给推理部署做模拟器，一次能跑几千种配置，速度是实时的 1500 倍

NVIDIA 给自家推理服务框架 Dynamo 配了个仿真工具 DynoSim，用 Rust 写成。它把部署测试变成“先在虚拟时间线上模拟、再挑最好的上真机”的流程，不用一个个试。测试里它能跑到实时速度的 1500 倍，一次筛几千种配置。正文没披露具体硬件环境、支持哪些模型和实测延迟数据，所以这个 1500 倍先打个折看——快是真的快，但省多少时间还得...

#Inference-opt#NVIDIA#Product update

精选理由

HKR 三项都成立：钩子是 1500 倍实时仿真，机制是虚拟时间线批量试配置，共鸣点打在推理成本和延迟上。单信源 NVIDIA 产品更新，信息量有限，放在 featured 低段合理。

一句话点评

NVIDIA 给自家推理框架 Dynamo 出了个仿真工具，号称能跑到实时 1500 倍，但正文没给硬件环境和实测延迟，这数字先打个折看。

锐评

NVIDIA 给 Dynamo 推理服务框架配了个叫 DynoSim 的仿真工具，用 Rust 写成。它的思路是把部署测试从“一个个试”变成“先在虚拟时间线上模拟、再挑最好的上真机”，一次能筛几千种配置。测试里它跑到实时速度的 1500 倍，这个数字说明模拟本身很快，但正文没披露跑在什么硬件上、支持哪些模型、以及最终上真机后的延迟和吞吐到底省了多少。所以 1500 倍更像一个上限参考，实际能省多少部署调参时间还得看具体场景。另外，仿真保真度也没给量化指标——如果模拟和真实表现偏差大，筛出来的“最佳配置”可能还得返工。对做推理部署优化的团队来说，这个工具如果能接入自己的模型和流量模式，价值会更大，但目前公开信息里看不到开放程度和接入方式。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:44

19d ago

FEATUREDAI HOT 精选· aihot-apiZH17:44 · 05·30

NVIDIA 计划六月发布 N1X ARM 笔记本芯片集成 Blackwell GPU

NVIDIA、微软和 Arm 同时发了个台北音乐中心的坐标，暗示 6 月 1 日有发布会，主角很可能是与联发科合作的 ARM 笔记本芯片 N1X。这颗芯片把 CPU、Blackwell 架构的 GPU 和 AI 单元全塞进去了，目标是让轻薄本跑出接近 RTX 4070 的图形性能。如果真能做到，NVIDIA 就不只是卖显卡了，而是直接跟 Intel、A...

#Inference-opt#NVIDIA#Microsoft#Arm

精选理由

HKR 三项都过，但这仍然是一条基于 X 的预告解读，不是 NVIDIA 的官方发布。把它当作一个有趣的硬件传闻处理，分数压在 60–71 区间。

一句话点评

NVIDIA 要在 Computex 上发 ARM 笔记本芯片了，但 Reddit 原文被墙，具体规格和性能都还没看到。

锐评

NVIDIA 计划在 6 月 2 日的 Computex 上发布一款叫 N1X 的 ARM 笔记本芯片，把自家的 Blackwell GPU 和 AI 计算单元集成到一颗 SoC 里。这基本就是冲着高通骁龙 X Elite 和苹果 M 系列去的，想在 Windows on ARM 的笔记本市场里插一脚。不过现在能确认的信息很少。Reddit 上的爆料帖被网络策略挡了，正文没披露任何架构细节、核心数、功耗或跑分。另一条来源也只是转述了“或将于六月发布”这个时间点，没有补充技术参数。所以这颗芯片到底能不能打，现在完全没法判断。我会先打个折：NVIDIA 做 ARM SoC 不是第一次，之前的 Tegra 在消费端没掀起太大浪。这次的关键看两点——GPU 性能能不能拉开和竞品的差距，以及 Windows 对 ARM 的生态支持到不到位。这两点目前都缺信息，等 Computex 的实测再下结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:30

19d ago

● P1TechCrunch AI· rssEN16:30 · 05·30

GitHub Copilot 改为按 token 计费模式

GitHub Copilot 要改成按 token 计费，开发者普遍不满。TechCrunch 报道只引了一句评论，没披露具体价格、用量额度或生效日期，所以目前只能确认收费模式变了，但到底贵多少、怎么算还不清楚。

#Code#GitHub#Microsoft#TechCrunch

精选理由

H 和 R 通过：Copilot 改计费直接影响开发者成本，且已有明显反弹。K 不通过：RSS 正文只有一句评论，缺价格、额度和时间，不值得上头条。

一句话点评

Copilot 从按人头收费改成按 token 用量收费，开发者直接炸了。

锐评

GitHub Copilot 把计费模式从固定月费改成按 token 消耗算钱，开发者社区反应激烈，标题直接用了“开玩笑吧”。这事的核心矛盾在于：写代码时模型自动补全产生的 token 量很难预估，用户怕账单失控。目前两篇报道都只给了标题和情绪，正文没披露具体单价、免费额度或 token 计算规则，也没看到 GitHub 官方的完整解释。我会先打个折——如果单价定得低、有硬上限，可能实际支出变化不大；但如果按对话模型那种按量计费直接套到代码补全上，高频用户的成本会明显上涨。还缺三个关键信息：每千 token 的价格、是否保留免费层、以及 IDE 内补全和聊天分别怎么算 token。这些没出来之前，开发者骂得有理，但结论别下太早。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

15:30

19d ago

● P1TechCrunch AI· rssEN15:30 · 05·30

谷歌推出Gemini Spark 24/7 AI助手产品

TechCrunch 的编辑实测了谷歌新推出的 Gemini Spark，把它当成一个全天候 AI 助手来用，主要干了整理邮件摘要和规划本地活动这两件事。体验下来觉得确实能帮上忙，但文章没搞懂谷歌为什么要把这个功能单独做成一个产品，而不是直接塞进现有的 Gemini 里。正文没披露这东西什么时候正式上线、要不要另外收费。

#Agent#Tools#Google#TechCrunch

精选理由

我会先打个折：正文没披露价格和发布时间，所以不能当产品发布看。但亮点在于，这是一篇上手实测，不是通稿。编辑用“actually pretty useful”收尾，说明 Gemini Spark 在收件箱摘要和本地活动规划这两个场景里跑通了，没翻车。对做 agent 的人来说，这种“替你干活”的体感比跑分重要。信息缺口明显，但反转叙事和具体场景撑住了 featured 的分数。

一句话点评

谷歌把 Gemini 做成了一个 24 小时在线的 AI 助手 Spark，实测体验两极分化：有用，但也让人后背发凉。

锐评

谷歌发布的 Gemini Spark 是一个常驻后台的 AI 助手，主打 24/7 全天候待命。从几家媒体的实测标题看，评价非常分裂。TechCrunch 觉得它“实际上挺有用”，但 The Verge 的编辑直接说这是“最令人印象深刻也最可怕的 AI 体验”。这种恐惧感可能源于它持续在线的特性，让人感觉被时刻注视。目前 TechCrunch 的正文是空的，我们看不到具体的使用场景和性能数据，比如它到底能自动完成哪些任务、响应延迟多高、会不会频繁出错。The Verge 的另一篇标题提到“AI 变得越好，越暴露一个空洞的承诺”，暗示 Spark 虽然能力变强，但可能没解决根本的信任或价值问题。这条新闻值得关注，但先别急着下结论。我们需要等详细的评测出来，看它到底是真能帮人省时间的工具，还是一个让人更焦虑的监控器。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:00

19d ago

FEATUREDThe Verge · AI· rssEN13:00 · 05·30

AI生成虚假黑人形象在TikTok上销售Shein廉价品

The Verge 挖出一批 TikTok 账号，用 AI 生成一个叫 Aliyah 的浅肤色黑人女性，穿西部牛仔装，对着镜头哭诉手工皮带扣卖不出去，求观众“哪怕停 13 秒”救救她的生意。实际上 Aliyah 不存在，皮带扣也不是手工做的——不同视频里出现一模一样的扣子，明显是批量生产的 dropshipping 货，源头大概率是 Shein 这类平...

#Multimodal#The Verge#TikTok#Shein

精选理由

HKR 三项全中。故事本身是一个诈骗与身份伪造的强钩子，给出了 13 秒停留指令和虚拟人设 Aliyah 这些具体机制，共鸣点也很明确——AI 被用来批量制造虚假身份带货，直接冲击平台信任。它不是模型或产品发布，放在 featured 档刚好。

一句话点评

TikTok上有人用AI生成的黑人形象卖Shein廉价货，靠种族身份博信任来加价，这比普通带货更恶劣。

锐评

这事说白了就是数字时代的黑脸营销。有人用AI生成哭泣的黑人女性头像，在TikTok Shop上把Shein几美元的腰带、裙子标到三四十美元卖，靠的是“支持黑人女性创业”的话术。The Verge的记者追踪了多个账号，发现这些AI形象背后根本不是黑人，而是专门做一件代发的匿名操盘手。文章没给出这类账号的具体数量和销售额，也没说TikTok是否已经批量处理。但记者点出了核心套路：用种族共情当钩子，把廉价品包装成“黑人拥有的小生意”。AI生成的人脸让骗局成本更低——不需要真人出镜，一天能铺几十个号。还缺两个关键信息：一是TikTok Shop对这种身份欺诈有没有明确的审核机制，二是消费者被骗后能不能追回差价。这点先别太激动，平台规则没跟上之前，这类玩法只会换张脸继续。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

12:17

19d ago

FEATUREDHacker News 首页· rssEN12:17 · 05·30

美国企业因成本飙升开始限制AI使用

华尔街日报报道，随着AI使用成本飙升，美国公司开始限制用量。文章标题说“企业开始配给AI”，但正文被付费墙挡住，没披露具体哪些公司、花了多少钱、怎么限量的。信息缺口：不知道是限制调用次数、按部门分配预算，还是直接砍项目。

#Inference-opt#The Wall Street Journal#Hacker News#Commentary

精选理由

标题有趋势感，但正文信息量不够，没有公司名、成本数字或配额机制，只能算行业报道的常规水平，所以分数在60-71区间。

一句话点评

AI 账单来了，美国公司开始给员工设用量上限。省钱是真疼，但正文没给具体涨了多少。

锐评

这条新闻说的不是 AI 不好用，而是用不起了。WSJ 报道，美国企业因为 AI 成本飙升，开始对内部使用进行配给，也就是限制谁可以用、能用多少。这跟过去两年“全员上 AI”的画风完全不同，说明财务部门开始算账了——模型调用、API 费用、算力消耗这些隐性成本，在规模化推广时会被迅速放大。文章没披露具体的成本涨幅数字，也没说限制的是哪种模型或场景，所以没法判断是通用大模型太贵，还是企业自己没做优化。但信号很明确：AI 在企业里正从“战略投资”变成需要审批的日常开销。如果你所在的公司还没感受到账单压力，可能只是用量还没到临界点。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

11:59

19d ago

FEATURED彭博科技· rssEN11:59 · 05·30

新加坡防务论坛与会专家称AI风险超越核武器威胁

彭博社标题说AI危险在新加坡防务论坛上盖过核武器，但正文只返回了403反爬页面，没有披露任何演讲者、论点、证据或会上讨论的具体机制。信息缺口：无法确认论坛上到底讨论了哪些AI风险、谁在发言、有没有实际案例或政策建议。

#Safety#Bloomberg#Policy#Safety/alignment

精选理由

硬排除-零来源：可读正文只有403反机器人页面，没有发言人、数字或机制，仅剩标题。H和R通过，K不通过，重要性上限39。

一句话点评

防务圈开始把 AI 风险排在核武器前面，但正文没给出具体威胁模型或量化对比，更像情绪表态。

锐评

新加坡防务论坛上，与会专家直接说 AI 的风险已经超过核武器。这个判断来自防务圈内部，不是科技公司或学术界的自说自话，所以值得留意。但 Bloomberg 这篇报道只给了结论，没展开讲他们到底担心什么场景——是自主武器失控、网络攻击自动化，还是模型被当成战略讹诈工具，正文都没说。报道也没提是哪些专家、基于什么标准做的比较。核武器的风险有几十年的军控框架和事故数据打底，AI 这边连统一的威胁定义都还没成型。所以这个“超过”更像是在说潜在上限更高、管控更空白，而不是实际发生概率更大。要判断这个表态的分量，还缺几样东西：论坛上有没有具体提案、军方代表怎么接话、以及有没有后续的政策文件跟进。光一句“比核武器还危险”，先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

08:12

19d ago

FEATUREDr/LocalLLaMA· rssEN08:12 · 05·30

把一块 RTX Pro 6000 塞进 2016 年的戴尔 R730 服务器，跑 65 万 token 上下文

作者想把一块最新的 RTX Pro 6000 Blackwell 显卡装进一台 2016 年的戴尔 PowerEdge R730 服务器里，目标是搭一台能跑 65 万 token 上下文的本地 AI 盒子。过程不顺利：先要切掉风扇导流罩才能把卡塞进去，接着用双 riser 卡解决供电，然后系统卡在 PCIe BAR 分配上，根本认不到全部显存。后面就是...

#Inference-opt#NVIDIA#Dell#Commentary

精选理由

HKR 三项都站得住：老服务器配新显卡跑 650K 上下文，玩法新鲜、细节扎实、对想省钱自建 AI 机器的人有参考价值。不过它终究是一次个人硬件折腾，不是产品发布或模型更新，所以重要性我给 72 分，放在 featured 里。

一句话点评

把一张2026年的显卡塞进2016年的服务器，主要卡在PCIe BAR分配上，系统认不全显存，正文没披露最终是否跑通了65万token上下文。

锐评

这篇帖子记录了一次硬核折腾：作者想把NVIDIA RTX Pro 6000 Blackwell装进一台老旧的戴尔R730服务器，目标是在本地跑65万token上下文的大模型。过程很真实，先切风扇导流罩，再用双riser卡解决供电，但真正的麻烦是PCIe BAR分配——老平台无法给新显卡分配足够的地址空间，导致系统认不全显存。作者尝试了ACPI/DSDT检查、调整MMIO aperture、测试Linux内核的PCIe启动参数，但正文被Reddit安全策略拦截，后续细节和最终结果都没披露。这条信息对想用旧服务器搭AI盒子的人有参考价值：它点出了老平台的主要瓶颈不是供电或物理尺寸，而是PCIe资源分配。但关键信息缺失严重——到底跑没跑起来？65万token上下文是实测还是理论值？延迟和稳定性怎么样？这些都没说。如果你手头有类似设备，可以先检查主板的MMIO上限，别急着买卡。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

07:00

19d ago

FEATURED新智元 · 公众号· rssZH07:00 · 05·30

Anthropic 内部流出一份 Claude 流畅度评分表，最高 11 分，优秀人类能拿 7.5

这份评分表把用户跟 Claude 的对话拆成 11 个可观察的行为指标来打分，满分 11 分。背后的研究用了 9830 组匿名多轮对话，发现高质量对话里 85.7% 都出现了“反复修改追问”这个动作。正文没披露具体评分细则和实验设计细节，目前只能看到评分框架，所以这个 7.5 分到底怎么算出来的还不清楚，先别太激动。

#Benchmarking#Tools#Safety#Anthropic

精选理由

这篇的切入点是把 AI 和人的关系倒过来，用评分卡的形式讲 Claude 怎么分析用户行为，标题自带传播力。内容有具体的行为列表和样本量，不是空谈。我会先打个折：这不是模型发布或重大能力更新，所以放在 featured 档位刚好，不用拔到 breaking。对从业者来说，能从中看到 Anthropic 对“高质量使用”的定义，也能反推自己用 Claude 的方式在什么水平。

一句话点评

Anthropic 搞了个给用户打分的 Claude 流畅度评分表，满分 11 分，说“优秀人类”能拿 7.5 分。但正文没披露评分细则，这个分数怎么算出来的还不清楚，先别太激动。

锐评

Anthropic 把用户跟 Claude 的对话拆成 11 个可观察的行为指标来打分，比如会不会反复修改追问、有没有把 AI 当同事协作。背后的研究用了 9830 组匿名多轮对话，发现高质量对话里 85.7% 都出现了“反复修改追问”这个动作，说明跟模型来回打磨是出好结果的关键习惯。但这条新闻的信息缺口很大。正文只给了评分框架的轮廓，没披露具体每项指标怎么量化、权重怎么分配，也没说 7.5 分这个“优秀线”是从哪批样本里划出来的。是内部员工的平均分，还是那 9830 组对话的统计结果？不知道。另外，评分表目前覆盖 Chat、Cowork 和 Claude Code 三种场景，但不同场景下“好对话”的标准应该不一样，文章没解释怎么统一打分。我会先打个折：这更像一个还在打磨的内部实验，不是马上要推给用户的产品功能。它有意思的地方在于把“人怎么用 AI”这件事量化了，但离一个靠谱的评分系统还差实验设计、样本分布和跨场景一致性这些关键信息。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

07:00

19d ago

FEATURED新智元 · 公众号· rssZH07:00 · 05·30

Opus 4.8 算了一夜，把 1170 亿人的投胎概率做成了模拟器

这篇文章的正文被微信环境异常页挡住了，实际内容没抓到。从标题和已有英文摘要看，沃顿商学院教授 Ethan Mollick 用 Claude Opus 4.8 生成了一个叫“历史之幕”的网站，把人类历史上约 1170 亿次出生做成加权随机模拟，跑了 4000 轮蒙特卡洛来估算你投胎到不同地区和时代的概率。但具体怎么算的、模型代码怎么写的、有没有幻觉或偏差...

#Agent#Code#Reasoning#Anthropic

精选理由

HKR 三项都成立：Mollick 的投胎模拟器是个有梗的钩子，不是常规的“模型又变强了”；1170亿人口和4000轮模拟给了可验证的数字；对开发者来说，这种一夜搭出复杂原型的效率比跑分更有说服力。这不是 Anthropic 官方发布，所以留在 featured 低位没问题。

一句话点评

沃顿教授用 Claude Opus 4.8 跑了个“投胎模拟器”，算尽 1170 亿次出生，但正文被微信环境异常页挡了，具体实现细节和代码质量全看不到。

锐评

这条新闻的噱头很足，但信息缺口也很大。Ethan Mollick 让 Claude Opus 4.8 直接生成一个网站，把人类历史上约 1170 亿次出生做成加权随机模拟，跑了 4000 轮蒙特卡洛来估算你投胎到不同地区和时代的概率。这本质上是一次模型长链条代码生成和前端部署能力的展示，说明 Opus 4.8 能独立完成从数据建模到网页上线的完整任务。但正文被微信环境异常页挡住了，我们看不到任何实际代码、模型提示词或运行日志。4000 轮蒙特卡洛这个数字本身不说明精度，因为没披露权重怎么设的、历史人口数据从哪来、模型有没有在计算中产生幻觉或偏差。我会先打个折：这更像一个教学演示项目，而不是严谨的人口学模拟。还缺的是：模型生成代码的一次通过率、有没有人工介入修改、以及运行成本。如果 Mollick 后续公开了完整对话记录和代码仓库，这条新闻的价值才能坐实。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:48

19d ago

FEATURED彭博科技· rssEN04:48 · 05·30

MiniMax 启动国内上市准备，招股书里把 DeepSeek 列为对手

MiniMax 已经向监管提交了文件，开始筹备在国内上市。招股书里点名 DeepSeek 是本土竞争对手。不过正文被 Bloomberg 的反爬机制挡住了，没拿到具体内容，所以估值、募资规模、上市板块和时间表这些关键信息目前都看不到。

#MiniMax#DeepSeek#Funding

精选理由

Bloomberg 这篇报道说 MiniMax 已经按监管要求启动境内上市流程，竞争对手点名了 DeepSeek。我会先打个折：正文没给估值、没时间表、没募资规模，所以重要性到不了顶。但这件事本身信号够强——一家中国大模型公司在 DeepSeek 风头正劲时选择上市，说明融资节奏在加快，也侧面反映行业烧钱压力。对从业者来说，这比单纯的技术发布更直接关系到谁能活下去、谁能拿到钱。

一句话点评

MiniMax 启动国内上市流程，招股书点名 DeepSeek 为对手，但估值、募资额、板块全被 Bloomberg 反爬挡了，正文没拿到。

锐评

MiniMax 已经向监管交了材料，开始筹备国内 IPO，招股书里直接把 DeepSeek 列为本土竞争对手，说明它想讲一个“中国 AI 大模型第一梯队”的资本故事。但这条消息目前只有一个标题和摘要，Bloomberg 正文被反爬机制拦了，所以估值、募资规模、上市板块、时间表这些关键数字全看不到。我会先打个折：招股书点名对手是常规操作，不代表业务上真能对标。MiniMax 的语音和视频生成产品在 C 端有存在感，但跟 DeepSeek 这种靠开源模型和极低推理成本打出声量的路线不太一样。它到底拿什么数据说服二级市场，现在还缺招股书里的营收结构、客户集中度和研发投入占比。这点先别太激动，等招股书细节出来再看它是不是真能撑起一个 AI 上市标的。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:00

19d ago

FEATUREDFT · 科技· rssEN04:00 · 05·30

英国军方考虑允许 AI 自主发动致命打击，不再需要人类批准

FT 这篇报道的标题很炸，但正文被付费墙挡住了，只看到订阅页面。标题说英国军方正在研究让武器系统在没有人类批准的情况下执行致命打击。具体是哪种武器、在什么条件下可以自主开火、法律框架怎么搭、有没有时间表，这些关键信息正文都没披露。光看标题，这更像是一个政策方向的试探，离真正部署还远，先别太激动。

#Robotics#Agent#Safety#UK military

精选理由

FT 标题抛出一个很猛的判断，但点进去只有订阅提示，等于只给了一个概念，没给任何能验证的细节。我会先打个折：话题性够强，能让人立刻意识到“人在回路”这条底线正在被试探，所以重要性和传播力都高。但信息缺口太大，没法判断这是政策试探、技术验证还是媒体标题操作，这点先别太激动。

一句话点评

标题很炸，但正文被付费墙挡了，关键信息全没看到，先别太激动。

锐评

FT 这篇报道的标题说英国军方在研究让武器系统不经人类批准就执行致命打击，但点进去只看到订阅页面，正文完全没披露。具体是哪种武器、在什么条件下可以自主开火、法律框架怎么搭、有没有时间表，这些关键信息一概不知。光看标题，这更像是一个政策方向的试探，离真正部署还远。目前能确认的只有 FT 发了这么一条标题，其余都是空白，没法做更多判断。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

04:00

19d ago

FEATUREDAI HOT 精选· aihot-apiZH04:00 · 05·30

xAI 放弃 JAX GPU，改用自研 C 语言训练框架

SemiAnalysis 爆料 xAI 已经不用 JAX 在 NVIDIA GPU 上训练模型了，转而用 Grok Build 写了一套 C 语言训练框架。报道说 xAI 的 JAX 方案模型浮点利用率（MFU）不到 10%，这个数字很低，意味着大部分算力都浪费在调度和通信上，没真正花在训练上。NVIDIA 的 JAX 团队过去两年几乎全员扑在支持 x...

#Code#Inference-opt#xAI#JAX

精选理由

xAI 换训练框架是个强钩子，MFU 不到 10% 这个数字够扎眼，但来源是单条推文，复现条件也没给，所以定在 80 分，不上 P1。我会先打个折看后续：如果真有实锤，这事对训练成本的讨论会很大。

一句话点评

xAI 弃用 JAX GPU 训练栈，自研 C 框架，但 MFU 不到 10% 这个数字没给复现条件，先别太激动。

锐评

这条爆料的核心信息是：xAI 不用 JAX 在 NVIDIA GPU 上训练了，自己用 Grok Build 写了一套 C 语言训练框架。SemiAnalysis 给出的理由是 xAI 的 JAX 方案模型浮点利用率（MFU）不到 10%，也就是说大部分 GPU 算力没花在正经训练上，都耗在调度和通信开销里了。这个数字如果属实确实很低，但正文没披露测试环境、模型规模、并行策略这些关键条件，没法判断是 JAX 本身的问题还是 xAI 工程实现的问题。 NVIDIA 的 JAX 团队过去两年主力支持 xAI 却没能留住这个客户，侧面说明大客户对训练效率的容忍度在收紧。自研 C 框架听着硬核，但用 Grok Build 这种 AI 辅助写底层训练代码，稳定性和可维护性都是未知数。还缺的信息是：新框架的 MFU 到底提到了多少，以及这套方案会不会开源或对外输出。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:00

19d ago

FEATURED量子位 · 公众号· rssZH04:00 · 05·30

人大和至知研究院开源了 Claw Agent 的全套训练方案，连数据带模型和评测一起给了

人大和至知研究院放出了一个叫 ClawGym 的 Agent 训练框架，把数据、训练代码和模型权重都开源了。他们合成了 13500 条可执行的任务当训练数据，又做了 200 条任务的基准测试集。用这套东西训出来的 ClawGym-30B-A3B 模型，在他们自己的 ClawGym-Bench 上拿了 56.82 分，比 Qwen3-235B-A23B ...

#Agent#Tools#Benchmarking#Renmin University of China

精选理由

这条消息对 Agent 开发者很实用。ClawGym 把数据、代码、模型检查点一起打包开源，不是又一个只有排行榜的项目。13.5K 合成任务规模不算大，但 200 个评测任务和 56.82 的得分给了明确的起点。我会先打个折：正文没披露合成任务的质量验证细节，也没说这个分数在实际业务场景里对应什么水平，所以别急着对标生产环境。但作为开源基建，它降低了复现和改造的门槛，值得关注。

一句话点评

人大和至知研究院开源了一套Agent训练全流程，但正文因验证问题无法读取，具体方法、数据和模型细节均未披露。

锐评

这条消息本身挺值得关注：Agent（让模型进业务流程干活）的训练一直缺标准化数据和高难度评测，团队直接放出数据、训练代码和模型权重，对想复现或改进Agent能力的人来说是实打实的资源。但问题在于，原文页面被微信环境异常拦截，我实际看不到任何技术细节。摘要里提到合成了13500条可执行任务，模型在自建基准上拿了56.82分，超过Qwen3-235B-A23B——这个分数绝对值不高，说明任务本身有难度，不是刷榜玩具。不过，基准只有200条任务，覆盖面是否够广、任务类型是否贴近真实业务场景，这些都没法从现有信息判断。另外，30B激活参数能超过235B模型，要么是数据质量高，要么是评测设计对特定模式有利，这点先别太激动，得等看到具体任务样例和训练配方才能下结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:00

19d ago

FEATURED量子位 · 公众号· rssZH04:00 · 05·30

帮 Gemini 拿下 IMO 金牌的建模负责人，差点去当了职业钢琴家

这篇文章讲的是 Yi Tay，他在 Gemini Deep Think 拿到 IMO 金牌级成绩时担任建模联合负责人。他 2023 年参与创立了 Reka AI，639 天后又回到了 Google DeepMind。文章还提到他 2012 年就考过了 Trinity 古典钢琴副学士文凭，差点走上职业演奏的路。不过正文因为微信环境验证拦截，具体技术细节和...

#Reasoning#Multimodal#RAG#Yi Tay

精选理由

这是一篇人物特写，不是 Gemini 能力发布稿。核心价值在于 Yi Tay 在 IMO 金牌成果里的具体角色、他创办 Reka 又回归的经历，以及 639 天这个精确时间跨度。文章没展开技术细节，所以重要性停在人物和行业信号层面，76 分放在 featured 档是合适的。

一句话点评

Yi Tay 是 Gemini Deep Think 拿 IMO 金牌的建模联合负责人，他 2023 年创立 Reka AI，639 天后又回了 Google DeepMind。

锐评

这条新闻最有意思的点不是“AI 拿金牌”，而是人的轨迹：Yi Tay 在 Gemini Deep Think 达到 IMO 金牌级成绩时担任建模联合负责人，之后出去创业做了 Reka AI，639 天后又回到 Google DeepMind。这种“大厂—创业—回归”的路径在顶级 AI 研究员里越来越常见，说明大模型创业的窗口期和人才流动节奏都在加快。文章还提到他 2012 年就考过了 Trinity 古典钢琴副学士文凭，差点走职业演奏路线。但正文因为微信环境验证拦截，具体技术细节、他在 Gemini Deep Think 里到底负责哪部分建模、Reka AI 期间做了什么、回归后的新角色，这些关键信息都没披露。所以这条目前只能当人物动态看，别往技术突破上过度解读。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:30

20d ago

FEATURED机器之心 · 公众号· rssZH02:30 · 05·30

港中文新优化器 Pion 在“等谱流形”上更新大模型，解决 AdamW 和 Muon 训练崩溃问题

香港中文大学等团队搞了个新优化器叫 Pion，核心思路是不动权重矩阵的奇异值，只在“等谱流形”上做正交等价变换来更新参数。他们拿一个 6000 万参数、没用归一化层的类 LLaMA 模型试跑，Pion 稳定训练了 96 亿个 token，而 AdamW 和 Muon 都崩出 NaN 了。正文没披露更大规模模型或具体下游任务上的效果，所以这点先别太激动，...

#Fine-tuning#Alignment#Benchmarking#CUHK

精选理由

我会先打个折：这篇是优化器数学，不是产品发布，所以分数在 78–84 之间。但它的钩子很直接——AdamW 和 Muon 会训崩，而 Pion 用“在等谱流形上更新”这个思路稳住了。正文给了 60M 模型、9.6B token 的无归一化实验，证明能避免 NaN，这对做训练的人有实际参考价值。信息量够，痛点准，所以 HKR 全过。

一句话点评

Pion 让一个 6000 万参数、没加归一化层的模型稳定跑了 96 亿 token，AdamW 和 Muon 都崩了。但只测了这个小模型，大模型上能不能省归一化层还不好说。

锐评

这条新闻讲的是港中文等团队的新优化器 Pion，它换了个思路：更新模型参数时不动权重矩阵的奇异值，只在“等谱流形”上做正交等价变换。打个比方，就像拧魔方，只转面不拆块，保持整体结构不乱。他们拿一个 6000 万参数、没用归一化层的类 LLaMA 模型试跑，Pion 稳定训练了 96 亿个 token，而 AdamW 和 Muon 都崩出 NaN 了。这个对比挺直观，说明 Pion 在抑制训练不稳定上确实有东西。但正文没披露更大规模模型或具体下游任务上的效果。6000 万参数在现在的大模型语境里算很小的，能不能 scale up 到几十亿、几百亿参数，以及去掉归一化层后在实际任务上表现如何，都还是未知数。另外，文章也没提训练速度、显存开销这些工程指标，光看稳定性不够。如果后续能在更大模型上复现，并且证明去掉归一化层能省算力或简化架构，那这条才值得认真看。现在只能说在小模型上开了个好头，别急着下结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:30

20d ago

FEATURED机器之心 · 公众号· rssZH02:30 · 05·30

英伟达和清华的 γ-World 把世界模型从单机改成了联机，登顶 HuggingFace 日榜

这篇推文本身因为微信环境验证没抓到正文，我只能根据已有的英文摘要和标题来还原。γ-World 是一个多智能体世界模型，核心是把多个 AI 角色放在同一个虚拟环境里互动。它用了一种叫“单纯形位置编码”的方法和 hub token 机制，把多个智能体之间的交互计算成本从平方级降到了线性级。说人话就是：以前每加一个角色，系统要算它和所有其他角色的关系，开销涨...

#Agent#Robotics#Multimodal#NVIDIA

精选理由

我会先打个折：这是研究发布，还没看到大规模落地验证，但技术点够具体。Gamma-World 解决的是多个 AI 同时在一个世界里交互时计算量爆炸的问题，用正单纯形位置编码让每个智能体知道彼此位置，再靠 hub token 汇总信息，把原本 O(n²) 的复杂度压到 O(n)。8 个玩家延迟压到 4.5ms 这个数挺实在，说明小规模场景已经能跑顺。不过正文没披露更多玩家数下的表现，这点先别太激动。整体属于有干货、有数字、方向对路的研究，给 featured 合理。

一句话点评

英伟达和清华搞了个多角色世界模型，把8个AI互动的延迟从17.6毫秒压到4.5毫秒，但正文被微信吞了，技术细节只能靠猜。

锐评

这条消息最值得看的是成本控制思路。γ-World 用“单纯形位置编码”和 hub token，把多智能体交互的计算量从平方级砍到线性级。翻译成人话：以前每加一个角色，系统要算它和所有其他角色的关系，角色一多开销就爆炸；现在相当于给每个角色发了个坐标，再设几个信息中转站，大家不用互相盯着看了。8个玩家场景下延迟从 17.6 毫秒降到 4.5 毫秒，这个数字如果属实，意味着实时多角色模拟在消费级显卡上也能跑。但得先打个折。微信原文因为环境验证没抓到，我只能根据英文摘要和标题还原，论文里具体怎么实现、在什么硬件上测的、有没有开源代码，这些关键信息都缺。另外，线性复杂度听起来很美，但 hub token 会不会成为新瓶颈、角色数量再往上加效果如何，正文没披露。如果是真的挺省钱，但这点先别太激动，等看到完整论文再说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:30

20d ago

FEATURED机器之心 · 公众号· rssZH02:30 · 05·30

苹果搞了个叫 PICO 的图像压缩方案，画质不变，文件能小到三分之一

苹果发了篇论文介绍 PICO，一个用 AI 做图像压缩的编解码器。在主观画质差不多的情况下，它比 AV1、VVC 和 JPEG AI 省 57% 到 70% 的码率，也就是说文件体积能压到原来的三分之一甚至更少。在 iPhone 17 Pro Max 上跑，压一张 1200 万像素的照片要 230 毫秒，解压要 150 毫秒。正文没具体讲模型结构和训练...

#Vision#Multimodal#Inference-opt#Apple

精选理由

HKR 三项都成立：PICO 有明确的 57%–70% 码率节省和 230 毫秒端侧编码数据，不是纯概念。但正文没提产品化时间，目前还是研究发布，所以分数放在 78–84 这个区间。

一句话点评

苹果搞了个叫PICO的AI图像压缩方案，同等画质下文件能压到传统格式的三分之一，在iPhone上跑得动。但正文没披露模型结构和训练细节，这点先别太激动。

锐评

苹果这篇论文讲的是用AI做图像压缩，核心卖点是省码率。在主观画质差不多的情况下，PICO比AV1、VVC和JPEG AI能省掉57%到70%的码率，也就是说一张图的文件体积可以压到原来的三分之一甚至更少。这个数字挺夸张，但要注意这是他们自己测的主观画质，不是通用的客观指标，实际效果得等第三方复现。速度方面，在iPhone 17 Pro Max上压一张1200万像素的照片要230毫秒，解压150毫秒。这个延迟在手机端勉强能接受，但如果是连拍或者视频场景就够呛了。另外，正文没讲模型到底多大、功耗多少、训练用了什么数据，这些对端侧部署很关键的信息全缺了。苹果2023年收购了做AI压缩的WaveOne，这篇论文的作者里也有那家公司的人，说明这个方向他们确实在认真推。但论文本身更像一个技术预告，离真正塞进iOS相册替代HEIF还有距离。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

热点聚合 · 2026-05-30

更多

频道

后台