热点聚合 · 2026-05-20

▸ 45 signals · updated 3m ago

live · 238 today·policy v2

AI HOT 精选OpenAI 上市前连挖两人：Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户，医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线，App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI，但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench：由博士科学家出题、审题，专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus，它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史：你以为的石破天惊，其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型，用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗？Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人：Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户，医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线，App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI，但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench：由博士科学家出题、审题，专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus，它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史：你以为的石破天惊，其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型，用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗？Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人：Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户，医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线，App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI，但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench：由博士科学家出题、审题，专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus，它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史：你以为的石破天惊，其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型，用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗？Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·

⤓ RSS live

按日期浏览清除筛选 ✕

2026年5月

一二三四五六日

126 212 320 419 542 632 749 826 923 1017 1136 1248 1337 1454 1539 1630 1719 1849 1976 2045 2148 2249 2313 2415 2520 2637 2744 2848 2935 3022 3114

2026年6月

一二三四五六日

147 258 348 447 545 619 715 852 945 1031 1128 1221 1313 1415 1524 1635 1726 1824 1912021222324252627282930

2026-05-20 · 星期三2026年5月20日

23:28

29d ago

FEATUREDAI HOT 精选· aihot-apiZH23:28 · 05·20

腾讯发布操作系统层级的 AI 助手“马维斯”，Windows、Mac、安卓同步上线

腾讯公关总监张军宣布 AI 助手“马维斯”正式上线，覆盖 Windows、Mac 和安卓。它不是一个普通的聊天窗口，而是直接长在系统层，能理解文件结构、归类解析文档、识别处理图片，甚至帮你修电脑。官方说市面上 Agent 能做的事它基本都能做，还能调度不同模型、在电脑上操控手机应用。比较实在的一点是，它预装了不少本地模型，通过路由机制把轻量任务分给本地...

#Agent#Vision#Tools#Tencent

精选理由

腾讯把 AI 助手直接做进操作系统层，Windows、Mac、安卓一起发，能读文档、识图、做系统维护，还能跨设备操控，部分功能离线可用。我会先打个折：正文没披露背后的模型、定价和权限设计细节，所以目前只能看到产品形态，看不到技术底牌。这点先别太激动，但三端同步和系统级操控确实把桌面 agent 的竞争往前推了一步，对做 agent 和端侧部署的团队来说是个值得盯的样本。

一句话点评

腾讯把AI助手做进了系统层，能读文件、修电脑，还预装了本地模型，断网也能用。但“市面上Agent能做的它基本都能做”这句先打个折，等实测。

锐评

马维斯跟普通聊天窗口最大的区别是它直接长在操作系统里，能理解文件结构、调度不同模型干活，甚至操控手机应用。比较实在的一点是它预装了不少本地模型，通过路由机制把轻量任务留在本地处理，拔网线也能用，这对在意隐私和延迟的人是个加分项。不过正文没披露本地模型的具体规格、参数量，也没说清楚“修电脑”到底能修到什么程度——是自动打补丁还是真能排查蓝屏。另外，腾讯之前推过WorkBuddy，现在又出马维斯，产品线之间的关系和定位差异也没讲明白。硬件要求、实际资源占用、多端体验一致性，这些都得等上手之后才知道。官方说能调度模型、操控手机应用，但没给出具体场景和成功率，这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

23:24

29d ago

FEATURED彭博科技· rssEN23:24 · 05·20

英伟达第二季度财报超预期但前景指引疲软

英伟达对截至7月的季度给出了约910亿美元的销售预测，数字本身不低，但市场反应冷淡。正文没披露具体盈利、利润率或股价变动，所以没法判断是预期太高还是毛利率有压力。

#Nvidia#Bloomberg#Ed Ludlow#Commentary

精选理由

H/K/R 都过，但正文只给了销售指引和投资者反应，没披露盈利、利润率或股价变动。Nvidia 的关联度够高，所以放 all 但不进 featured。

一句话点评

英伟达上季度业绩还行，但下季度指引没达到市场的高预期，芯片竞争在升温，股价盘后先跌为敬。

锐评

英伟达这份财报属于“过去不错，未来让人犹豫”。第二季度营收和利润都超过了分析师预期，说明卖芯片的生意依然很猛。但问题出在对下一季度的收入指引上——数字没达到华尔街最乐观的那档预期，市场立刻用脚投票。Bloomberg 的视频报道直接用了“疲软指引”这个词，并点出芯片领域的竞争在加剧，这可能是英伟达给不出更高预期的原因之一。不过这篇报道是视频摘要，正文没披露具体的营收、利润和指引数字，也没说竞争具体来自哪些对手、在训练芯片还是推理芯片层面。所以“竞争加剧”到底有多严重，是 AMD 抢了份额还是云厂商自研芯片在起量，目前看不出来。这点先别太激动，等完整财报电话会记录出来再判断会更准。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

22:42

29d ago

FEATUREDLatent Space· rssEN22:42 · 05·20

Railway：为 AI 代理而生的云，35 人撑起 300 万用户

Railway 创始人 Jake Cooper 聊了他们怎么从 18 个月攒 100 个用户，做到现在每周新增 10 万注册。团队只有 35 人，服务 300 万用户，融了 1.24 亿美元。他们把大部分工作负载搬到了自建裸金属数据中心，回本周期只要 3 个月，对比租用云服务能省下不少钱。Jake 认为未来的软件是给 AI 代理用的，不是给人用的，所以...

#Agent#Tools#Railway#Jake Cooper

精选理由

这篇访谈不是讲模型本身，而是讲基础设施怎么为 agent 工作负载重新设计。Railway 用一个小团队撑起 300 万用户，还做了裸金属迁移，对做 agent 部署的开发者来说是个很实在的参考。信息密度和话题性都够，但毕竟不是核心模型发布或重大产品更新，给 74 分放在 featured 里比较合适。

一句话点评

Railway 创始人聊了从 18 个月攒 100 个用户到每周新增 10 万注册的路径，核心判断是未来软件是给 AI 代理用的，不是给人用的。

锐评

Jake Cooper 给 Railway 的定位很明确：不是又一个 Heroku，而是给 AI 代理准备的云。这个判断背后有实打实的运营数据撑着——35 人团队服务 300 万用户，每周还能新增 10 万注册，说明产品找到了一个真实且增长迅猛的需求点。他们自建裸金属数据中心，回本周期只要 3 个月，对比租用云服务省下不少钱，硬件本身还在升值，这笔账算得很精。但文章里没展开的是，所谓“代理原生云”到底在技术栈上跟现有 PaaS 有什么本质区别。提到了代理需要版本控制、可观测性、计算和编排，但具体怎么实现、跟 Temporal 或 Central Station 怎么配合，细节很少。另外，他们刚经历了一次 GCP 大宕机，虽然发了事后分析，但暴露了自建基础设施在容灾上的脆弱性——多可用区、多环网架构下，工作负载发现居然还绑在 GCP 上，这点对想跟进自建数据中心的团队是个重要提醒。整体看，Railway 的增长故事和成本模型值得关注，但“代理原生”这个叙事还需要更多产品细节来支撑，目前更像是一个方向性判断而非已验证的范式。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

22:03

29d ago

FEATUREDTechCrunch AI· rssEN22:03 · 05·20

英伟达又创收入新高，同时披露手里攥着 430 亿美元初创公司股权

英伟达在周三盘后发了新一季财报，收入 816 亿美元，比上季度涨了 20%，其中数据中心收入 752 亿美元，也是历史最高。公司顺手批了 800 亿美元的回购计划。比较少见的是，这次财报里还亮出了投资账本：英伟达在初创公司里持有的股权价值高达 430 亿美元。不过文章没细说这些股权具体投了哪些公司、按什么估值算的。另外，公司对下个季度的收入增速给出了放...

#Nvidia#Funding

精选理由

Nvidia 盘后公布季度营收再创新高，还披露手里攥着 430 亿美元初创公司持仓，等于告诉大家它不光是卖铲子的，还是 AI 生态里最大的金主之一。正文没给出具体营收数字和下季增速预期，所以重要性我会先打个折，但光是 430 亿这个新披露的持仓规模，就足够让关注算力成本和资金流向的人多看两眼。

一句话点评

英伟达单季收入冲到816亿美元，但下季度增速要放缓了。另外它手里攥着430亿美元初创公司股权，具体投了谁、怎么估值的都没说。

锐评

英伟达这份财报数字确实大：单季收入816亿美元，数据中心就占了752亿，都是历史新高。但文章没给下季度具体增速预期，只说会“放缓”，这点先别太激动，得看后续市场怎么消化。比较有意思的是它头一回亮出投资账本，在初创公司里的股权价值高达430亿美元。这相当于一家大型风投的盘子了，但正文没披露这些股权具体对应哪些公司、按什么估值方法算的。如果是按最近一轮融资定价，在市场回调时可能有水分。另外公司还批了800亿美元回购，说明管理层觉得股价没被高估，但这也可能是在增速放缓前给股东一个交代。整体看，业绩还在涨，但增速拐点和投资组合的真实流动性是接下来要盯的两个点。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:55

29d ago

FEATUREDTechCrunch AI· rssEN21:55 · 05·20

xAI 正因数据中心燃气发电机被起诉，转头又宣布要花 28 亿美元再买一批

SpaceX 的 IPO 文件里提到，xAI 计划在未来三年内再采购价值 28 亿美元的天然气涡轮发电机，用来扩建 AI 基础设施。就在这个消息出来的同时，xAI 在孟菲斯附近的数据中心正因为使用高污染发电机而惹上官司。不过这篇报道没披露起诉方是谁、具体索赔内容、在哪个法院，也没说涡轮机供应商是哪家。一边被诉污染，一边加码买发电机，这个时间点挺尴尬的。

#xAI#Elon Musk#SpaceX#Incident

精选理由

这条消息的看点全在标题制造的反差——被诉还要加码买发电机，但正文没披露谁起诉、告什么、涡轮机找谁买，信息缺口很大。28 亿美元这个数字本身够硬，说明 xAI 在算力基建上押注极重，但我会先打个折：没供应商、没交付时间、没诉讼细节，只能当一条有话题性的信号看，别急着下结论。

一句话点评

xAI 一边因数据中心发电机污染被起诉，一边又通过 SpaceX 的 IPO 文件披露要再花 28 亿美元买天然气涡轮机。报道没写原告是谁、在哪起诉、索赔多少，信息缺得厉害，先别急着下结论。

锐评

这条新闻最值得看的是时间点：xAI 在孟菲斯的数据中心刚因为用高污染发电机惹上官司，转头就宣布未来三年还要砸 28 亿美元买更多天然气涡轮机。钱从哪来？信息是从 SpaceX 的 IPO 文件里挖出来的，说明 xAI 的硬件采购承诺已经大到需要在关联公司的上市材料里披露。但报道的硬伤也很明显。标题说“被起诉”，正文却没提原告身份、具体指控、在哪个法院、索赔金额，连涡轮机供应商是谁都没写。这就像只告诉你有人吵架，却不说是谁、为什么吵、在哪吵。没有这些，我们没法判断这官司是社区环保组织的小规模抗议，还是州政府层面的执法行动，对 xAI 的实际影响差很多。另外，28 亿美元这个数字本身需要拆开看。三年采购额，平均一年不到 10 亿，对一家估值几百亿的 AI 公司来说不算离谱，但用天然气涡轮机自建电厂来绕过电网瓶颈，说明当地电力基础设施已经跟不上它的算力扩张速度了。这比官司本身更值得长期关注。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:54

29d ago

● P1彭博科技· rssEN21:54 · 05·20

Anthropic与SpaceX达成450亿美元三年算力采购协议

根据一份证券文件，Anthropic 跟马斯克的 SpaceX 签了份大单：未来三年支付差不多 450 亿美元，换取计算资源来支撑它的 Claude 模型。这笔钱摊下来每年约 150 亿美元，说明头部 AI 公司抢算力的成本已经拉到天文数字级别。不过正文被 Bloomberg 的机器人验证挡住了，具体是租 GPU 还是包数据中心、交付节奏和退出条款都没披露。

#Inference-opt#Anthropic#SpaceX#Elon Musk

精选理由

我会先打个折：450 亿美元是三年总承诺，不是一次性付款，但数字大到足以让任何 AI 公司重新算账。Anthropic 把算力押在 SpaceX 身上，说明它不想只靠 AWS 或 Google Cloud，分散供应商是明牌。不过正文没披露具体算力规格、交付时间表，也没说 SpaceX 的算力基础设施到底建到什么程度，这点先别太激动。Bloomberg 拿证券文件报出来，可信度比 PR 稿高，值得写。

一句话点评

Anthropic 三年要付给 SpaceX 近 450 亿美元买算力，年均 150 亿，这个数字比它自己的年收入还高，先别太激动，正文没披露具体 GPU 数量和交付节奏。

锐评

这条消息的核心就一个数字：三年 450 亿美元，折合每年 150 亿。放在 AI 行业里，这个采购规模是顶级的，说明 Anthropic 对算力的需求还在急剧膨胀，而且愿意把筹码押在马斯克的体系上。但 Bloomberg 原文被付费墙挡住，我们只能看到标题，正文没披露合同细节——比如用的是 SpaceX 自研芯片还是英伟达 GPU、算力以什么单位计价、交付时间表是什么。这些信息直接决定这笔交易是“真省钱”还是“溢价锁资源”。另外，Anthropic 目前的年收入大概在几十亿美元量级，一年光算力就花 150 亿，资金缺口怎么补、是不是靠新一轮融资撑着，正文也没提。我会先打个折：450 亿是合同上限还是固定承诺，这个区别很大。如果是真的，对 OpenAI 和 Google 的算力竞争格局会有直接冲击，但眼下缺的细节太多，只能当个信号看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

100

SCORE

H1·K1·R1

21:35

29d ago

FEATUREDr/LocalLLaMA· rssEN21:35 · 05·20

HalBench 基准测试：用 3200 个带坑问题测了 4 个头部模型，看谁更会拒绝瞎编

一位开发者自己搭了个叫 HalBench 的测试，专门看模型在遇到“前提本身是错的”的问题时，是会顺着瞎编（谄媚）还是直接指出问题。他拿 3200 个这种带坑提示词跑了 4 个模型：Sonnet 4.6 平均分 0.565 排第一，最敢反驳；Gemini 3.1 Pro 0.339 垫底，更容易顺着错误前提往下编。分数越高，代表模型越能识别出问题里的假...

#Safety#Benchmarking#Alignment#Anthropic

精选理由

HKR 三项都成立：HalBench 有个清晰的定制评测钩子，3200 条提示加分数，话题踩在模型信任和安全评测的痛点上。来源只有 Reddit 一个帖子，基准本身也没经过外部验证，所以放在低 featured 档。

一句话点评

Sonnet 4.6 在 3200 个带坑提示词里最敢反驳错误前提，Gemini 3.1 Pro 最容易顺着瞎编，但测试集全是作者自己出的题，代表性要打个折。

锐评

这个叫 HalBench 的测试，说白了就是看模型会不会“皇帝的新衣”式地拍马屁。作者设计了 3200 个前提本身就有错的问题，比如问“为什么天空是绿色的”，然后看模型是直接指出“天空不是绿的”，还是顺着错误往下编理由。Sonnet 4.6 平均分 0.565 排第一，说明它最常直接反驳；Gemini 3.1 Pro 只有 0.339，更容易被带偏。分数越高代表模型越“敢说真话”，但这里有个关键限制：所有题目都是作者一个人出的，没有披露题目覆盖哪些领域、错误类型是否多样。如果题目全是常识类，那测出来的只是模型的基础知识，不代表它在专业领域也能识别错误前提。另外，正文没提测试时的温度参数和重复次数，单次跑 3200 题的结果波动可能不小。还缺什么？一是需要第三方独立出题来验证，二是没测开源模型，作者正在征集建议。如果你关心的是模型在实际对话里会不会被用户带节奏，这个测试比通用基准更贴近真实场景，但别把它当成模型安全性的全面评估。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:29

29d ago

● P1TechCrunch AI· rssEN21:29 · 05·20

Anthropic 每月要付给 xAI 12.5 亿美元买算力

#Inference-opt#Anthropic#xAI#Elon Musk

精选理由

TechCrunch 爆出 Anthropic 每月要给 xAI 付 12.5 亿美元买算力，对手方和价格都挺意外。正文只给了金额，没写买了多少卡、签了多久、跑在什么环境里，所以信息缺口不小。我会先打个折：金额够大，但缺关键细节，没法给到 90 分以上。

一句话点评

Anthropic 每月付 12.5 亿美元包下 xAI 整个数据中心，合同签到 2029 年。这笔钱来自 SpaceX 上市文件，但正文没披露具体算力规模和部署条件，先别急着算性价比。

锐评

Anthropic 租下了 xAI 在孟菲斯 Colossus 1 数据中心的全部算力，每月账单 12.5 亿美元，合同签到 2029 年 5 月。头两个月有折扣，因为 xAI 那边还在爬坡。这笔钱来自 SpaceX 的上市文件，xAI 自己说这是在把闲置算力变现。说白了，Grok 用户量最近掉得厉害，服务器空出来了，正好租给竞争对手回血。不过正文没披露具体有多少张 GPU、什么型号，也没说这 300 兆瓦的电力对应多少浮点运算能力。12.5 亿一个月的数字看着吓人，但不知道单位算力成本就没法判断是贵了还是便宜了。另外，Anthropic 拿这批算力是训练还是推理也没交代，两种场景对硬件要求差别很大。合同细节比如中途退出条款、算力交付标准也都没提，这些缺口让这笔交易的含金量暂时只能打个问号。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:25

29d ago

FEATUREDr/LocalLLaMA· rssEN21:25 · 05·20

Cohere 联合创始人亲自回应：Command A+ 是他们第一个 MoE 开源模型，主打在 1-2 张 GPU 上跑得动

Cohere 的 Nick Frosst 在 Reddit 上发帖，正式推出了 Command A+。这是他们第一个混合专家（MoE）模型，用 Apache 2.0 协议开源。帖子里说，这个模型最大的卖点是效率，做了很极限的量化工作，在 1 到 2 张消费级 GPU 上就能跑得很流畅，对个人开发者和小团队比较友好。不过他也直说，模型的顶尖性能还有待打磨...

#Agent#Inference-opt#Cohere#Nick Frosst

精选理由

我会先打个折：正文没披露参数量、基准测试成绩和上下文窗口，这些关键指标全缺，所以重要性只能给到 74。亮点是 Cohere 终于把 Command-A 这条线捡起来，换成 MoE 架构还给了 Apache 2.0，量化后能在 1 或 2 张 GPU 上跑，对想自己部署的人是个实在消息。但信源只有 Reddit 讨论，没有官方技术报告或实测数据，这点先别太激动。

一句话点评

Cohere 发了 Command A+，用 MoE 架构把模型压到 1-2 张消费级显卡就能跑，但创始人自己说顶尖性能还没调好，先别急着跟旗舰比。

锐评

Cohere 联合创始人 Nick Frosst 在 Reddit 上亲自宣布了 Command A+，这是他们第一个混合专家（MoE）模型，用 Apache 2.0 协议开源。帖子里最大的卖点是效率：团队做了很极限的量化，让模型在 1 到 2 张消费级 GPU 上就能跑得流畅，对个人开发者和小团队来说部署门槛确实低。不过 Frosst 也直说“顶尖性能还有待打磨”，这点先别太激动。正文没披露参数量、基准测试分数或具体的量化方案，也没给出跟 Command R 系列或同尺寸开源模型的对比数据。光凭“我们类别里最快、响应最灵敏”这句话，没法判断实际能力到底在哪一档。另外，帖子提到这个模型是为了让开发者能搭 agent（让模型进业务流程干活），但没说明在工具调用、长上下文或多步推理上的具体表现。想认真评估的话，还得等社区跑完实际任务再看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:18

29d ago

FEATUREDAI HOT 精选· aihot-apiZH21:18 · 05·20

Google Stitch 更新支持代码库导入和动态 UI 生成

Stitch 这次更新主要干了四件事。一是实时流式出设计稿，你边改它边生成，不用干等。二是能直接导入现有代码库或 Design.md 文件，拿你项目里真实在用的组件来做设计，品牌风格不容易跑偏。三是加了动态界面生成，四是做完的设计可以导出成一个可分享的线上链接，省掉从原型到上线中间一堆部署步骤。工具现在已经全球开放，正文没提收费模式。

#Agent#Code#Tools#Google

精选理由

我会先打个折：正文没披露模型细节、定价和实际输出质量，所以别急着当生产工具。但 Stitch 这次更新把实时流式构建和代码库导入加进来，等于让 AI 直接读你的代码和设计文档来生成页面，不再是画个样子就完事。对天天在 Figma 和代码编辑器之间切换的团队，这个流程缩短挺实在。全球开放也让更多人能上手试，不过没看到成本或准确率数据，这点先别太激动。

一句话点评

Google 把 Stitch 升级到 3.0，现在能直接导入你的代码库，还能自动生成动态 UI，原型工具开始往真实开发流程里挤了。

锐评

Stitch 这次更新最实在的变化是支持导入代码库和动态 UI 生成，不再是只能从零画图的玩具。它新加了一个叫 Hatter 的智能体，专门处理多步骤设计任务，还能导出 MCP 格式，说明 Google 想让这个工具直接插进开发工作流，而不是只给设计师玩。Product Hunt 上提到可以一键导出到 Figma、Netlify 等平台，对不想在工具间来回倒腾的人来说省了一步。不过，正文没披露导入代码库后对复杂项目的理解准确率怎么样，也没说动态 UI 生成在交互逻辑上能覆盖多少场景。目前看它更适合快速出原型和简单页面，真要接生产环境的代码库，效果还得打个问号。另外，免费策略能持续多久、会不会和 Google 其他设计工具打架，这些都没提。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:12

29d ago

● P1彭博科技· rssEN21:12 · 05·20

Anthropic营收增长加速，预计迎来首个盈利季度

彭博这条消息说 Anthropic 正朝着公司第一个盈利的季度迈进，主要驱动力是市场对它的 AI 软件需求猛涨。不过正文被付费墙挡了，没披露具体收入规模、利润区间，也没说是哪个季度。我会先打个折：盈利趋势是真的，但数字和细节都看不到，这点先别太激动。

#Anthropic#Funding

精选理由

我会先打个折：正文没给具体数字，营收多少、利润多少、哪个季度都不清楚，所以这条消息更像一个方向性信号，不是实锤。但 Bloomberg 的报道本身有信息量——Anthropic 靠卖 AI 软件把营收拉起来了，可能第一次不亏钱。这对一直烧钱的 AI 实验室来说是个转折点，从业者会盯着后续财报验证。

一句话点评

Anthropic跟投资人说自己下季度营收要翻倍到109亿美元，并且首次实现运营盈利。但别急着开香槟，后面算力账单太大，全年不一定能守住盈利。

锐评

Anthropic预计在2026年第二季度营收达到约109亿美元，比上一季度翻了一倍多，并且会首次出现运营利润。这个数字来自它发给投资人的融资材料，由华尔街日报先报出来，TechCrunch等媒体跟进。翻倍增长确实猛，说明Claude在专业用户里的口碑转化成了真金白银，公司也在推小企业服务和律所工具来分散客户群。但这条消息有两个地方要打折。第一，盈利只是“运营利润”，不是净利润，而且公司自己预警说后面几个季度会因为巨大的算力支出重新掉回亏损。第二，所有数据都是Anthropic单方面给投资人的说法，没有经过审计，公司也拒绝公开评论。同一天OpenAI传出要在九月IPO，这个时间点放盈利消息，多少有点给竞争对手上眼药的意思。还缺什么？我们看不到成本结构，不知道这109亿营收里推理成本、模型训练成本各吃掉多少，也不知道客户留存率和企业合同的具体条款。没有这些，单季运营盈利更像一个融资节点上的里程碑，而不是商业模式已经跑通的铁证。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

100

SCORE

H1·K1·R1

20:55

29d ago

● P1彭博科技· rssEN20:55 · 05·20

SpaceX 2025年资本开支207亿美元用于AI和航天器

SpaceX 在 2025 年花了 207 亿美元，主要用于 AI 和航天器。这个数字比很多国家一年的科技预算都高，说明马斯克在同时押注两条线：一边用 AI 优化火箭发射和卫星网络，一边加速星舰等航天器量产。正文没披露具体哪些 AI 项目在烧钱，也没说 IPO 时间表，所以这点先别太激动——钱花得多不等于马上上市。

#SpaceX#Funding

精选理由

HKR 的 H 和 K 靠体量和具体数字 207 亿美元通过，但 R 弱，因为 AI 关联缺少项目、算力和融资细节。落在 60–71 区间。

一句话点评

SpaceX 上市文件显示 2025 年资本开支 207 亿美元，AI 和航天器是两大烧钱方向，但没拆开各自占多少。

锐评

SpaceX 在 IPO 文件里把 2025 年的资本开支定在 207 亿美元，主要投向 AI 和航天器。这个数字本身很大，但正文没披露 AI 和航天器各自分到多少预算，也没说 AI 这部分是给 Starlink 做网络优化，还是跟 xAI 有算力上的往来。xAI 去年亏了 64 亿美元，SpaceX 这边又在大笔投 AI，钱是不是在两家公司之间流转、怎么流转，文件里看不出来。对想判断 SpaceX 估值的人来说，缺的就是这笔 AI 投入到底能换来什么——是自用降本，还是对外卖算力，目前都只能猜。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

20:49

29d ago

● P1彭博科技· rssEN20:49 · 05·20

英伟达公布一季度财报每股收益超预期营收指引910亿

英伟达刚发了 2026 财年第一季度的财报，每股收益 1.87 美元，比华尔街预期的 1.77 美元高出一截。公司对截至 7 月的当季营收指引是 910 亿美元，也明显高于市场预估的 874 亿左右。这条视频本身是彭博的报道片段，正文没披露各业务线的具体表现和毛利率细节，所以没法判断增长是数据中心业务继续拉动的，还是有别的板块在补位。

#Inference-opt#Nvidia#Bloomberg#Wedbush Securities

精选理由

Nvidia 财报是观察 AI 基础设施热度的关键节点，910 亿的指引给 HKR 三项都提供了实打实的信号。这不是模型或功能发布，所以放在 featured 档位没问题，信息质量够硬。

一句话点评

英伟达一季度每股收益超预期，下季营收指引给到910亿美元，但正文没披露具体利润数字和增长结构，先别急着算估值。

锐评

英伟达这份一季报，目前能确认的是两个点：每股收益比市场预期好，以及公司自己对下个季度的营收指引是910亿美元。这个910亿的数字挺关键，它直接反映了英伟达对接下来芯片需求的判断，尤其是数据中心业务能不能继续猛跑。不过，现在能看到的信息来自一段视频报道，正文里没有给出本季度的具体营收、净利润、毛利率，也没提各业务线的增速。这就意味着我们没法判断超预期是靠主业拉动，还是有一次性收益。另外，910亿的指引是公司自己给的，市场原本的预期是多少、差距有多大，报道里也没说。对从业者来说，这份财报最大的信号是需求端还没踩刹车，但缺了成本结构、库存水平和客户集中度的数据，还看不清这轮增长的安全边际有多厚。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

20:25

29d ago

● P1AI HOT 精选· aihot-apiZH20:25 · 05·20

英伟达2027财年Q1净利润583亿美元同比增长211%

英伟达 2027 财年第一财季（截止到 2026 年 4 月 26 日）总收入 816.15 亿美元，净利润 583.21 亿美元，同比直接翻了两倍多。增长主要靠数据中心业务，单这一块就进账 752 亿美元，同比涨了 92%。毛利率也拉到了 75% 左右，比去年同期高了 14 个百分点。公司预计下个季度收入能到 910 亿美元，上下浮动 2%。另外，董...

#Inference-opt#Nvidia#Product update

精选理由

英伟达这份财报就是AI基础设施景气度的温度计。数据中心752亿美元的收入说明大厂还在疯狂囤卡，211%的利润增速比很多AI公司的营收涨得还快。我会先打个折：这是财务数据，不是新模型或新功能发布，所以重要性停在82分。但数字本身已经足够让关注算力成本和供应链的人必须看一眼。

一句话点评

英伟达一个季度净赚583亿美元，同比涨了211%，但股价反而跌了2%，说明市场对它的预期已经高到离谱。

锐评

英伟达这个季度的财报数字确实夸张。总收入816亿美元，其中数据中心业务就占了752亿，同比涨了92%，基本是靠卖AI芯片撑起来的。净利润583亿，比去年同期翻了两倍多，毛利率也提到了75%左右，赚钱效率很高。公司还一口气批了800亿美元的回购计划，股息也涨了25倍，回馈股东的手笔很大。但有个细节值得注意：下季度营收指引是910亿，只比这季度多了不到100亿，增速在放缓。而且财报这么好，股价反而跌了2%，说明市场之前已经把预期打得太满，现在看到增长没超预期就开始犹豫了。正文没提具体是哪款芯片卖得最好，也没说竞争对手的情况。如果想知道这波增长还能撑多久，还得看后续大客户的订单是不是在减少，以及有没有更便宜的替代方案冒出来。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

19:16

29d ago

FEATUREDAI HOT 精选· aihot-apiZH19:16 · 05·20

OpenAI 官宣 GPT-5 要来了，但除了这句话什么都没说

ChatGPT 官方账号发了条推，就一句话“GPT-5 即将发布”，配了个船的表情。没给发布日期、参数规模、上下文窗口长度、定价，也没提 API 什么时候开放。我会先打个折——这种预告大概率是提前占坑，离真正能用还有段时间。

#ChatGPTapp#GPT-5#Product update

精选理由

这条消息我会先打个折。标题确实抓人，但正文等于什么都没说，没日期、没参数、没价格、没 API 细节，连“即将”是多快都判断不了。如果是真的，对做模型选型和成本估算的人影响不小，但现在只能当个预告看，别太激动。

一句话点评

官方账号只发了一句话和船的表情，没给日期、参数、价格、API 时间，这种预告先当占坑看。

锐评

ChatGPT 官方账号发了条推，就一句“GPT-5 即将发布”，配了个船的表情。没给发布日期、参数规模、上下文窗口长度、定价，也没提 API 什么时候开放。我会先打个折——这种预告大概率是提前占坑，离真正能用还有段时间。从信息量看，这条推几乎什么都没说。没有技术细节，没有性能对比，没有开放时间表。船的表情可能暗示“ship”双关，但也就这点可解读的。对从业者来说，现在唯一能确定的是 OpenAI 在释放信号，但信号本身没有可验证的内容。还缺的东西很多：模型规模多大、推理成本降了多少、多模态能力有没有升级、API 定价策略会不会变、上下文窗口能塞多少东西。这些才是决定能不能用的关键，正文一个都没披露。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

17:26

29d ago

FEATUREDAI HOT 精选· aihot-apiZH17:26 · 05·20

Perplexity 上线查询感知压缩，上下文 token 最多砍掉 70% 但回答质量反而更好

Perplexity 把一项叫“查询感知压缩”的技术用到了线上。它能在搜索时把喂给模型的上下文 token 最多减少 70%，同时回答质量还提升了。核心逻辑是“更好的上下文优于更多的上下文”，也就是先理解你问什么，再挑最相关的信息塞进窗口，而不是一股脑全丢进去。正文没披露具体测试基准和压缩方法细节，所以实际效果我会先打个折，但能省下这么多 token ...

#RAG#Inference-opt#Perplexity#Product update

精选理由

我会先打个折：正文只给了一条 X 帖子，没放基准测试和可复现的设置，所以别太激动。但这条信息本身够硬——Perplexity 在生产环境用查询感知压缩，最多砍掉 70% 上下文令牌，同时回答质量还变好了。对搞外挂资料库和搜索优化的从业者来说，这直接关系到省钱和降延迟，值得看一眼。

一句话点评

Perplexity 上线了查询感知压缩，能把塞进模型的上下文 token 砍掉最多 70%，回答质量反而更好。但正文没给测试基准和压缩方法细节，这个数字先别太激动。

锐评

Perplexity 把一项叫“查询感知压缩”的技术推上线了，核心逻辑是先理解你问什么，再挑最相关的信息喂给模型，而不是把搜索结果一股脑全丢进去。官方说这样能把上下文 token 最多减少 70%，同时回答质量还提升了。这个方向本身不新鲜，但能直接用在线上产品里，说明工程上跑通了。省 token 的好处很直接：推理成本更低、响应更快。70% 这个数字如果稳定，对大规模搜索服务来说确实挺省钱。但正文没披露具体在哪些测试集上验证了质量提升，也没说压缩方法本身会不会引入新的延迟或错误过滤。没有这些信息，很难判断“质量提升”是普遍成立，还是只在特定场景下成立。另外，压缩策略如果过于激进，可能会丢掉一些看似不相关但实际有用的信息，这点在复杂查询上尤其容易翻车。我会等他们放出更详细的技术说明或第三方评测，再判断这到底是一次扎实的优化，还是主要为了宣传。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:21

29d ago

● P1FT · 科技· rssEN17:21 · 05·20

OpenAI 准备最快九月提交 IPO 申请

FT 这篇报道的正文被付费墙和安全验证挡住了，只拿到了标题和摘要。已知信息是：OpenAI 正在准备 IPO 文件，最快今年 9 月挂牌，目标估值冲到 1 万亿美元。承销商名单里有高盛、摩根士丹利和 Cooley 律所。但具体的发行条款、上市交易所、财务数据这些关键信息，正文没披露——或者说我们拿不到。1 万亿这个数字我先打个折看，毕竟现在连 S-1 ...

#OpenAI#Goldman Sachs#Morgan Stanley#Funding

精选理由

我会先打个折：1 万亿估值目标听着很吓人，但正文没披露这个数字是怎么算出来的，也没说收入、利润或用户增长的具体支撑，这点先别太激动。不过，FT 的报道把时间点、承销商和律所都点出来了，信息颗粒度够细，不是捕风捉影。一家基础模型公司走到 IPO 提交这一步，本身就是行业顶格的信号，所以重要性给到 95 没问题。

一句话点评

OpenAI 最快本周提交 IPO 申请，目标九月上市。赢了马斯克的官司后，它立刻把战场转向了华尔街。

锐评

OpenAI 准备上市了，时间点卡得很紧。在马斯克输掉那场威胁公司架构和融资的官司后第二天，消息就放出来了，目标是最快九月挂牌。据华尔街日报的消息源，它已经在跟高盛和摩根士丹利合作，可能几天或几周内就会秘密提交招股书。这个节奏说明 OpenAI 想趁热打铁，把法律上的胜利直接转化成资本市场的信心。但报道里没提任何财务数据，比如营收、亏损、用户增速，这些才是决定它是不是“重磅 IPO”的关键。另外，SpaceX 的招股书也快公开了，两家公司会在融资能力上直接竞争，这比打官司更考验 Sam Altman。现在最缺的信息是 OpenAI 的盈利模型到底长什么样。烧钱换规模的故事在 2026 年还能不能讲通，得等招股书出来才知道。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

100

SCORE

H1·K1·R1

16:54

29d ago

FEATUREDAI HOT 精选· aihot-apiZH16:54 · 05·20

ChatGPT 手机版接入 Codex，手机上问一半，回到电脑能接着聊

OpenAI Devs 发帖说 ChatGPT 移动端现在支持 Codex，你可以在手机 App 里提问，之后在桌面端继续同一个对话。帖子没提支持哪些平台、需要哪个 App 版本，也没说是不是逐步推送。

#Code#Tools#OpenAI#Product update

精选理由

OpenAI Devs 是官方渠道，消息可信，HKR 三项都踩中了。但正文只确认了移动端能用 Codex 和跨设备接续对话，具体支持哪些平台、版本号、推送范围全都没提，所以信息量刚好卡在 featured 门槛上，先别当全量上线看。

一句话点评

OpenAI 把 Codex 搬上了手机，你可以在外面用手机问代码问题，回家在电脑上接着聊。但官方没说是全员推送还是灰度，也没提安卓和 iOS 是否同步。

锐评

这条更新解决了一个实际痛点：写代码时灵感来了，手边没电脑，先用手机把问题丢给 Codex，回到桌面端接着看结果。跨设备对话同步本身不新鲜，但 Codex 这种需要看代码、跑输出的工具，能在移动端先起个头，确实方便。不过帖子信息量很薄。没说明是 ChatGPT 原生 App 还是通过浏览器，也没提是否需要付费账号。更关键的是，移动端 Codex 能做什么、不能做什么完全没讲——能执行代码吗？能读文件吗？还是只能文字问答？这些决定了它到底是真工具还是聊天窗口换皮。我会先打个折：如果只是把桌面端对话同步到手机上看，那更像是补了个同步功能，算不上移动端支持 Codex。等官方放出具体能力再判断值不值得装。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:41

29d ago

FEATUREDThe Verge · AI· rssEN16:41 · 05·20

YouTube Shorts 现在能用 AI 把别人的视频改成动画或给你换头

YouTube 给 Shorts 的“混剪”功能加了一个叫“重新想象”的选项，背后用的是 Gemini Omni 模型。你可以直接拿别人发过的短视频，让 AI 把画面风格改成动漫、替换画面里的东西，或者把自己的脸塞进原视频里。创作者可以在上传时决定允不允许别人用 AI 改动自己的内容。正文没提生成一次要多久、有没有水印，也没说免费用户能用几次。

#Multimodal#Vision#Google#YouTube

精选理由

Google 给 YouTube Shorts 的 Remix 加了个 reimagine 模式，用 Gemini Omni 直接改别人的短视频。我会先打个折：这不是新模型发布，是个产品功能更新，所以放在低 featured 档。但它的传播力很强，因为“混剪别人视频”这个动作本身就自带话题，而且创作者能选择关掉，这点在授权上算给了台阶。正文没披露这个功能什么时候全量上线，也没说对视频时长、分辨率的限制，这些缺口让实际影响还得再观察。

一句话点评

YouTube Shorts 加了 AI 混剪功能，能拿别人视频改画风、换物件甚至换脸，但正文没提生成速度、水印和免费额度，先别太激动。

锐评

Google 给 YouTube Shorts 的“混剪”加了一个叫“重新想象”的选项，背后是 Gemini Omni 模型。你可以直接拿别人发过的短视频，让 AI 把画面风格改成动漫、替换画面里的东西，或者把自己的脸塞进原视频里。创作者在上传时可以决定允不允许别人用 AI 改动自己的内容，这点算是把版权控制权交回了一部分。但正文没披露几个关键信息：生成一次要等多久、成品有没有水印、免费用户能用几次。这些直接决定这功能是玩具还是能日常用。另外，换脸和改内容会带来多大的滥用风险，文章也没展开，只提了创作者可以关掉权限，但没讲平台有没有审核或举报机制。我会先打个折：功能听起来好玩，但实际体验和风控措施都还是空白，等上线后看实测再判断值不值得常开。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:00

29d ago

FEATUREDThe Verge · AI· rssEN16:00 · 05·20

谷歌搜索的 AI 进化，就是塞进更多广告

谷歌开始在搜索广告里用 Gemini 自动生成产品介绍，还会在部分广告里直接嵌入聊天机器人。文章拿胶囊咖啡机举了个例子，但没提具体覆盖范围和广告价格怎么算。说白了，你搜东西时看到的“赞助产品”描述，以后可能都是 AI 写的，有些广告点进去还能跟机器人聊两句。

#Agent#Tools#Google#Gemini

精选理由

Google 开始在 Gemini 的商品搜索结果里塞赞助商品和广告聊天机器人了。我会先打个折：正文完全没提投放范围有多大、怎么收费、效果数据如何，所以这更像一次试探性铺开，而不是大规模产品发布。对从业者来说，值得盯的是它把广告嵌进对话式搜索的路径，但现阶段信息缺口太大，先别太激动。

一句话点评

谷歌把 Gemini 塞进搜索广告里写产品描述，还加了聊天机器人，但没提覆盖范围和广告主怎么算钱。

锐评

谷歌开始在搜索广告里用 Gemini 自动生成产品介绍，部分广告还会直接嵌入聊天机器人。文章拿胶囊咖啡机举例，但正文没披露这项功能覆盖了多少广告位、广告主是按点击还是按对话付费。这点先别太激动——AI 写广告文案不是新鲜事，但把聊天机器人直接嵌进广告位，意味着用户可能在不离开搜索结果页的情况下就跟品牌对话，这对广告转化率的计算方式会有直接影响。目前缺两个关键信息：一是 Gemini 生成的内容有没有人工审核兜底，万一 AI 把产品参数写错了谁来负责；二是广告主能不能控制 AI 的回复边界，还是完全交给模型自由发挥。这两个问题不回答，就很难判断这是真提效还是又多了一个需要盯着的风险点。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:45

29d ago

● P1Hacker News 首页· rssEN15:45 · 05·20

字节跳动开源Lance：用单个模型实现图像视频理解与生成编辑

Lance 是字节跳动放出的一个多模态研究项目，把看图、看视频、生成图片、生成视频和编辑这些事塞进了同一个模型里。模型激活参数只有 3B，个头不大，训练用了不到 128 张 GPU，对想复现或微调的人来说门槛不算高。代码、论文和模型权重都公开了，但项目页没写具体的 benchmark 跑分和商用许可条款，这点先别太激动，得自己去翻论文和 HF 页面确认。

#Multimodal#Vision#ByteDance#Lance

精选理由

字节跳动的 Lance 把图像和视频的生成、理解塞进一个模型，激活参数 3B，训练用了不到 128 块 GPU。我会先打个折：正文没披露 benchmark 成绩、没放真实生成样本，授权协议也没说清楚，所以现在只能当研究发布看，别急着对标成熟产品。但单模型覆盖多模态这个方向，对想省部署成本的小团队确实有吸引力。

一句话点评

字节开源了一个3B参数的模型Lance，能同时做图片和视频的理解、生成和编辑，但实际效果和限制正文没细说。

锐评

字节跳动把Lance放出来了，一个模型干三件事：看懂图片/视频、生成新内容、还能编辑。参数量只有3B，属于小模型，好处是本地跑得动，成本低。但正文主要是个GitHub仓库的导航页，没给技术报告、没给评测分数，也没说训练数据怎么来的。光看Star数（445）和Fork数（27），社区还在早期围观阶段。 “统一多模态”这个方向是对的，但小模型同时做理解和生成，通常会在某个任务上妥协——要么生成质量打折扣，要么理解不够细。这点先别太激动，等他们放出论文或demo再看。另外，仓库里Issues只有6个，Pull requests是0，说明外部贡献还没起来，代码成熟度待观察。目前缺的关键信息：在标准测试集上和专用模型的对比、推理延迟、显存占用，以及生成内容的版权和安全性说明。如果这些不补上，暂时只能当个有趣的研究预览，不适合直接往产品里塞。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:00

29d ago

FEATUREDTechCrunch AI· rssEN15:00 · 05·20

Stability AI 发布 Stable Audio 3.0 音频生成模型系列

Stability AI 推出了 Stable Audio 3.0 系列，一共四个模型。最小的两个（4.59 亿参数）能在设备本地跑，生成两分钟的音乐或音效；中等（14 亿参数）和大杯（27 亿参数）模型则能生成 6 分 20 秒的完整曲子，比 2024 年的 2.0 版长了一倍多。小、中杯模型都开放权重，可以随便用和改。不过正文没提训练数据来源、生成...

#Audio#Stability AI#Product update

精选理由

我会先打个折：标题的 6 分钟和正文的 2 分钟对不上，正文没解释这个差距，所以别太激动。但端侧能跑出 2 分钟音轨这件事本身挺省钱，对做音频工具的人是个信号。整体算中等偏轻的产品更新，靠标题的钩子和端侧成本点撑到 featured 门槛。

一句话点评

Stability AI 发了四个音频模型，最大的能生成 6 分 20 秒的歌，比上代翻了一倍多。三个小模型直接开放权重，这点挺实在。

锐评

Stability AI 这次一口气发了四个模型，从 4.59 亿参数到 27 亿参数，覆盖了从手机端到专业级的场景。最大的亮点是生成时长：大杯和中杯都能出 6 分 20 秒的完整曲子，比 2024 年的 2.0 版本（最长 3 分钟）翻了一倍多。小杯的两个模型参数只有 4.59 亿，能在设备本地跑，生成 2 分钟的音乐或音效，对做短视频配乐的人来说是个低成本选择。不过，报道里只提了“专业级”这个说法，没给出任何客观评测指标或用户盲测数据。音乐质量到底怎么样，结构能不能稳住 6 分钟不崩，这些都得等实际用起来才知道。另外，三个小模型开放了权重，但最大的 27 亿参数模型没开，正文也没解释原因。训练数据来源和版权处理方式同样没提，这在音乐生成领域是个绕不开的坑。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

14:35

29d ago

FEATUREDr/LocalLLaMA· rssEN14:35 · 05·20

AMD Ryzen AI Halo PC 配 128GB 内存定价 3999 美元

Reddit 帖子称 AMD Ryzen AI Halo PC 配备 128GB 板载内存，售价 3999 美元。这个价格对于能本地跑大模型的机器来说不算离谱，128GB 内存意味着可以加载 70B 甚至更大参数的模型，不用频繁做内存交换。但正文只贴了个 Reddit 链接，实际 CPU/GPU 规格、发布时间、销售渠道都没披露，消息可信度要打个折。

#AMD#Reddit#VideoCardz#Product update

精选理由

HKR 三项都通过，但正文只有一条 Reddit RSS 卡片，缺少 CPU/GPU 规格、上市时间和销售渠道。这条信息对本地 AI 硬件定价有参考价值，但算不上头条新闻。

一句话点评

3999 美元配 128GB 统一内存，价格比 Mac Studio 同内存版低一截，但正文没披露 CPU/GPU 核心数、带宽和实际跑模型性能，先别太激动。

锐评

这条消息来自 Reddit 讨论，但原文链接被屏蔽，我们看不到完整的产品页面或官方公告，只能基于标题里的两个数字做判断。3999 美元、128GB 板载内存，这个组合在本地跑大模型圈子里确实有吸引力——对比苹果 Mac Studio M2 Ultra 配 128GB 统一内存要 4799 美元起，AMD 这套便宜了 800 美元，而且 x86 生态对模型推理框架的兼容性通常更友好，不用折腾 Rosetta 转译。但关键信息全是缺口：没说用的是哪颗 Ryzen AI Halo 芯片，CPU 和 GPU 核心数未知，内存带宽也没提。本地跑大模型最吃内存带宽，如果带宽只有 100GB/s 级别，那 128GB 容量再大也喂不饱模型推理速度。另外，3999 美元是整机价格还是准系统？带不带硬盘和系统？这些都没披露。Reddit 原帖被网络屏蔽，我们没法交叉验证来源，只能把这条当早期传闻看。如果后续有官方规格表出来，我会先盯内存带宽和 NPU 算力这两项，那才是决定它能不能当本地推理机的硬指标。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

14:12

29d ago

FEATUREDThe Verge · AI· rssEN14:12 · 05·20

AI 内容打标签这事，到了见真章的时候

Google 在 I/O 大会上说，现在能更广地验证 SynthID 给 AI 图片打的水印了；另一边 C2PA 也在推一套叫 Content Credentials 的标准，想给图片、视频、音频都加上来源元数据。说白了，就是两套技术路线在比赛谁能更靠谱地告诉你“这东西是不是 AI 生成的”。但文章没具体说这次 SynthID 的验证范围到底铺到了多大...

#Safety#Multimodal#Google#The Verge

精选理由

这条消息本身有料，但正文没给出完整覆盖范围、落地时间表和实际采用数据，所以我会先打个折。它更像一次中量级的溯源更新，不是那种必须立刻写的重磅发布。

一句话点评

Google 和 C2PA 在比赛谁能给 AI 内容打上靠谱的“身份证”，但文章没交代 SynthID 这次验证范围到底铺了多大，这点先别太激动。

锐评

Google 在 I/O 上说 SynthID 水印验证能力变强了，另一边 C2PA 也在推 Content Credentials 标准，想给图片、视频、音频都加上来源元数据。说白了就是两套技术路线在抢“AI 内容身份证”的话语权。文章把这事定性为“make or break time”，但正文没给出 SynthID 这次验证范围的具体数字，也没说跨平台兼容性到底解决了多少。我会先打个折：水印和元数据这类方案，最大的坑不是技术能不能做，而是整个生态愿不愿意配合。如果只有 Google 自己的产品认 SynthID，其他平台不买账，那这个“身份证”出了家门就失效。文章没提 C2PA 那边有多少厂商实际落地了，也没说用户端能不能一眼看懂这些标签。还缺三块关键信息：一是两套方案的实际覆盖率数据，二是被篡改后水印还能不能验出来，三是普通用户看到标签后行为会不会真的改变。没有这些，只能说方向对，但离“靠谱”还有距离。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:24

29d ago

FEATUREDThe Verge · AI· rssEN13:24 · 05·20

如果连 Google 都做不出有用的 AI 智能体，那可能没人能了

Google 在 I/O 2026 上发了好几个 AI 智能体，能帮人搜资料、规划活动、总结邮件和日历。这些智能体可以在后台一直跑，但文章没提什么时候上线、怎么收费，也没给任何实测数据。作者的意思是，Google 在 AI 智能体上折腾了好几年，这次借着 OpenClaw 的热度再推一把，但如果连手握海量用户数据的 Google 都搞不定，那整个行业吹...

#Agent#Tools#Google#OpenClaw

精选理由

H 和 R 都很强，因为文章把 Google 的 agent 当成整个行业能不能成的风向标，而且直接踩中从业者对实用性、平台权力和成本的焦虑。K 给了新信息，但只限于后台运行这一点，正文没披露上线时间、定价和实际评测结果，所以整体还是落在 featured 偏下位置。

一句话点评

Google 在 I/O 大会一口气发了多个能后台常驻的 AI 助手，但没给上线时间、价格和实测数据，先当画饼看。

锐评

Google 这次在 I/O 上展示的 AI 助手（也就是让模型进业务流程干活的 agent），核心卖点是能一直在后台跑，帮你搜资料、规划活动、总结邮件和日历。听起来很美好，但文章通篇没提这些功能什么时候能用上、要不要额外付费，更没有任何真实用户测试的数据。作者的观点很直接：Google 手握 Gmail、日历、搜索这些海量个人数据，如果连它都做不出好用的 AI 助手，那整个行业吹的牛可能都兑现不了。这次发布明显是借着 OpenClaw 的热度再推一把 agent 概念。但一个产品如果连发布时间和收费方式都不敢说，我会先打个折。真正决定这东西有没有用的，不是发布会上的 demo，而是它能不能在你不盯着的时候不出错、不瞎操作。这点目前完全没验证。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:00

29d ago

FEATUREDThe Verge · AI· rssEN13:00 · 05·20

犹他州要建一个占地4万英亩的数据中心，当地居民炸锅了

Kevin O'Leary 牵头的 Stratos 项目计划在犹他州 Box Elder 县建一个巨型数据中心，占地 4 万英亩，预计耗电 9 吉瓦。这个数字什么概念？相当于好几个核电站的发电量全给它用。当地居民强烈反对，担心噪音、环境破坏，以及对本就紧张的水资源造成更大压力。专家也发出了警告，但县委员会还是批准了。正文没披露具体是哪家科技公司最终会用...

#The Verge#Kevin O'Leary#Stratos Project#Policy

精选理由

这条新闻把 AI 基建的物理代价摆到了台面上。9GW 是什么概念？差不多是九个大型核电机组的出力，全灌进一个县，当地的水资源肯定扛不住。正文没细说冷却方案和用水量，但光这个规模就足够让做算力规划的人重新掂量选址风险。我会先打个折，因为没有模型或平台层面的直接更新，但作为基础设施信号，它比普通数据中心新闻重得多。

一句话点评

犹他州批了个占地4万英亩、要吞掉9吉瓦电力的巨型数据中心，但正文没说是哪家科技公司买单，当地水和噪音的账也没算清。

锐评

这条新闻最值得盯的数字是9吉瓦——差不多是几个核电站的发电量全供一个数据中心用。项目占地4万英亩，由Kevin O'Leary牵头，选址在犹他州Box Elder县。当地居民已经在抗议噪音、环境破坏，尤其担心对本就紧张的水资源雪上加霜。专家也发了警告，但县委员会还是放行了。我会先打个折：The Verge这篇报道没披露最终是哪家科技巨头要用这些算力，也没给出具体的水耗估算或环评细节。没有这些，9吉瓦就只是一个吓人的大数，没法判断它到底划不划算、有没有替代方案。还缺几块关键信息：谁签的租约、冷却方案是风冷还是水冷、当地电网能不能扛住、以及有没有谈妥可再生能源配比。这些不补上，这个项目更像是一场豪赌，而不是一笔算过账的买卖。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:00

29d ago

FEATUREDTechCrunch AI· rssEN13:00 · 05·20

Figma 在协作画布里塞了个 AI 助手，能直接用对话生成和修改设计

Figma 在它的多人协作画布上直接加了一个 AI 助手。你可以用大白话让它生成新设计、改现有设计，或者自动跑一些重复活儿，比如批量出不同版本的设计稿。你还能同时开好几个助手，让它们各干各的。Figma 说这个助手能理解设计语境和元素，因为它背后用的模型是专门针对设计场景调过的。不过正文没披露这个助手具体是用自家模型还是接了别家的 API，也没提生成结...

#Agent#Tools#Figma#Product update

精选理由

Figma 把 AI agent 塞进了协作画布，你打字就能让它生成或改设计。我会先打个折：正文只说了能力范围，没提用的是什么模型、成本多少、什么时候上线，所以别太激动。但这件事本身值得关注，因为它意味着设计师的工作流可能要被 agent 插一脚了。

一句话点评

Figma 把 AI 助手直接塞进了多人协作画布里，能听懂大白话指令改设计、跑批量活儿，但正文没提模型是自研还是套壳，效果先打七折。

锐评

Figma 这次更新是把一个能听懂自然语言的 AI 助手放到了设计画布上，你可以用大白话让它生成新界面、改现有元素，或者自动跑一些重复劳动，比如一口气出多个版本的设计稿。比较特别的是，你还能同时开好几个助手各干各的，这在工作流里可能比单线程助手更实用。Figma 说这个助手能理解设计语境和元素，因为背后模型是专门针对设计场景调过的。但关键信息缺了一大块：正文完全没披露这个助手用的是 Figma 自家训练的模型，还是接了 OpenAI、Anthropic 等第三方 API。如果是套壳，那生成质量和成本就高度依赖别人；如果是自研，Figma 也没给出任何性能对比或延迟数据。另外，助手对复杂设计系统的理解能到什么程度、会不会在多人协作时互相干扰，这些都没提。对设计师来说，这东西能不能用，核心看两点：一是生成结果是不是真的能直接进生产文件，而不是只出个大概样子；二是批量跑版本时，版权和设计一致性怎么保证。这些 Figma 都没说清楚，所以现在只能当个效率插件看，别急着把它当主力。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

11:04

29d ago

FEATURED阿里技术 · 公众号· rssZH11:04 · 05·20

阿里平头哥发布真武 M890 AI 芯片，128 卡超节点服务器已在百炼平台上线

阿里平头哥的真武 M890 AI 芯片首次公开，主打 Agent 场景的算力底座。配套的 128 卡超节点服务器，卡间直连延迟低于 150 纳秒，机架带宽达到 Pb/s 级别。这套硬件已经在阿里云百炼平台跑起来了，支持通义千问、DeepSeek 和 Kimi 等模型。不过正文因为环境验证问题没加载出来，具体的芯片架构、制程、显存规格和实测性能数据暂时看...

#Agent#Inference-opt#Alibaba#T-Head

精选理由

HKR三项都踩中了，但得先打个折——消息源是阿里自己的技术文章，没有第三方实测、没提定价、也没说量产规模。所以分数就卡在featured门槛上，当个基础设施产品更新看比较合适。

一句话点评

阿里平头哥发了新AI芯片真武M890，主打让模型进业务流程干活时更省算力，但正文卡在微信验证页，芯片具体规格和实测数据全没看到。

锐评

这条消息的含金量得先打个折，因为原文被微信的环境验证挡住了，所有技术细节都来自摘要的二手转述。能确认的是，平头哥把真武M890定位成“Agentic算力底座”，也就是专门为让模型跑自动化业务流程设计的芯片，不是通用训练卡。配套的128卡超节点服务器有两个硬指标：卡间直连延迟低于150纳秒，机架带宽到Pb/s级别。150纳秒这个数在芯片通信里算很低了，说明他们重点优化了多卡协同，这对Agent场景里频繁调用工具、多步推理确实有用。但正文没披露芯片制程、显存大小、单卡算力，也没给任何跑分对比，所以没法判断它跟英伟达H200或华为昇腾的实际差距。另外，这套硬件已经在阿里云百炼平台上线，支持通义千问、DeepSeek和Kimi，说明至少通过了内部验证，但对外客户能不能用、成本多少，目前一概不知。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

10:57

29d ago

FEATUREDHacker News 首页· rssEN10:57 · 05·20

BBC记者演示谷歌AI搜索可被虚假内容操纵

BBC 记者自己试了一下，只花 20 分钟发了一篇假博客，第二天谷歌 AI 就把他描述成世界热狗冠军。问题出在 AI 搜索时太容易信单个网页，有人已经在用这招操纵医疗、理财等严肃问题的回答。谷歌说政策没变，但悄悄更新了反垃圾规则。专家提醒：在系统修好之前，别太信 AI 给你的唯一答案。

#Safety#Google#BBC#Incident

精选理由

标题有搜索安全钩子，但正文几乎没给实质内容——没披露攻击怎么发生、Google 怎么反制、有没有数据或案例。BBC 来源可信，但 HN 上的讨论只有 19 分和 8 条评论，热度低。对从业者来说，知道这件事存在就够了，但不足以作为深度参考。

一句话点评

BBC记者用一篇假文章就让谷歌AI说他是热狗大赛冠军，只花了20分钟。这招也被用来操纵医疗和理财建议，门槛低得离谱。

锐评

BBC记者亲自下场做了个实验：在自己网站上发了一篇编造的文章，声称他是吃热狗世界冠军。第二天，谷歌的AI概览和ChatGPT就采信了这个说法，直接向用户输出这个假信息。整个过程只用了20分钟，成本几乎为零。这不是个例。报道里提到，同样的手法已经被用来在保健品、退休理财等话题上植入偏见答案，而且是大规模、系统性的操作。问题出在AI搜索的工作方式上。当模型需要联网找答案时，它可能只抓取单一网页或社交帖子作为依据，缺乏交叉验证。谷歌回应说他们一直在用反垃圾策略保护AI搜索功能，最近也更新了政策，把生成式AI回复明确纳入反垃圾范围。但专家Lily Ray说得直接：在更好的系统上线前，你最好默认自己正在被操纵。这篇报道没给出谷歌具体的技术防护措施，也没说明更新后的政策实际拦截了多少恶意内容。记者只验证了攻击路径存在且极易复现，但防御侧的信息基本是空白。如果你关心的是“谷歌到底做了什么来堵这个漏洞”，正文给不了你答案。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

08:08

29d ago

FEATUREDFT · 科技· rssEN08:08 · 05·20

黄仁勋访华期间，中国禁了英伟达的一款游戏显卡

FT 这篇报道的正文被付费墙挡住了，只返回了 403 验证页面，所以具体禁了哪款芯片、禁令范围多大、什么时候生效，正文都没披露。从标题和现有摘要看，事情发生在黄仁勋到访中国的同一时间点，北京想借这个机会给华为、寒武纪这些国产芯片厂商腾空间，让它们在追赶美国对手的路上少点阻力。我会先打个折：信息只来自标题和一段摘要，细节全缺，暂时没法判断这是正式法规、行...

#Nvidia#Jensen Huang#Huawei#Policy

精选理由

FT 报道中国在黄仁勋访华期间禁了一款 Nvidia 游戏芯片，H 和 R 的钩子很硬，芯片地缘政治的故事天然有传播力。K 这边我会先打个折，因为芯片型号、禁令边界和怎么执行正文都没说，事实层比较薄。

一句话点评

黄仁勋到访当天，中国禁了英伟达一款游戏芯片，但正文被付费墙挡住，具体型号和禁令范围都没披露。

锐评

这条新闻目前只有标题和一段摘要，正文因为付费墙完全看不到，所以关键信息全是缺口：禁的是哪款游戏芯片、禁令是正式法规还是行政指导、什么时候生效、影响范围多大，一概不知。从摘要透露的意图看，北京选在黄仁勋访华这个时间点出手，是想给华为、寒武纪等国产芯片厂商腾市场空间，让它们在追赶美国对手的路上少点阻力。这个逻辑说得通，但没正文就没法判断执行力度。如果只是限制某款消费级显卡的零售渠道，实际影响有限；如果是针对整个产品线的进口许可收紧，那性质就完全不同了。另外，游戏芯片本身不直接涉及数据中心算力，禁令的象征意义可能大于实际杀伤力——更像是在谈判桌上加一个筹码。建议等全文解锁或者官方文件出来再下判断，现在能说的就这么多。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

07:53

29d ago

FEATUREDAI HOT 精选· aihot-apiZH07:53 · 05·20

欧盟发了高风险AI分类指南草案，现在开放提意见

欧盟委员会5月19日发了份草案，教大家怎么按《欧盟人工智能法》第6条判断一个AI系统算不算“高风险”。核心看两点：一是AI系统本身是不是受管制的产品（比如医疗器械里的安全组件），二是它的用途有没有落在Annex III列出的高风险场景里。判断主要依据系统的“预期用途”和提供者自己怎么声明，整条价值链上的责任也会被考虑。草案里也给了豁免条件，比如只做纯流...

#Safety#European Commission#Policy#Safety/alignment

精选理由

欧盟委员会发了《AI 法案》第六条高风险分类的指导草案，核心是按“预期用途”判断系统算不算高风险，如果只是辅助任务可以豁免。我会先打个折：正文没披露具体豁免边界和判定流程的细节，目前还是草案阶段，咨询截止日期原文写的是“206月23日”，大概率是笔误。对在欧盟上线 AI 产品的团队来说，这份草案直接关系到合规成本和上市时间，值得跟进，但别急着按它改架构。

一句话点评

欧盟发了份AI风险分类指南草案，核心就看两件事：你的AI是不是用在受管制的产品里，或者干的是不是Annex III列的高风险活儿。判断主要看“预期用途”和你怎么声明，别被“豁免条件”忽悠，门槛不低。

锐评

这份草案说白了就是教大家怎么给AI系统贴“高风险”标签。判断逻辑不复杂，先看AI本身是不是医疗器械这类受管制产品的安全组件，再看它的用途有没有落在Annex III的高风险场景清单里。关键依据是提供者自己声明的“预期用途”，整条价值链上的责任也会被考虑，所以别想着在说明书里含糊其辞就能躲过去。草案也给了豁免出口，比如只做纯流程性任务、辅助人类完成已有工作、或者只是高风险评估的前期准备。但正文没披露这些豁免条件的具体案例和边界，实际落地时很可能扯皮。另外，公众咨询截止到2026年6月23日，想提意见的得抓紧。目前最大的信息缺口是：草案里对“预期用途”的认定标准到底有多硬，以及监管机构会怎么核查提供者的声明。这点先别太激动，等最终版出来再看执行力度。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

06:51

29d ago

FEATUREDAI 群聊日报· atomZH06:51 · 05·20

Karpathy 加入 Anthropic 预训练团队，Google I/O 发布 Gemini 3.5 Flash 并给 Vertex AI 改名

今天最炸裂的消息是 Karpathy 宣布加入 Anthropic 预训练团队。群友分析，他先后拒绝回 Tesla 和加入导师的 world model 项目，唯独选了这里，说明大语言模型可能真要有新突破了。另一件大事是 Anthropic 收购 Stainless 后直接关停其托管服务，切断了 OpenAI 的 SDK 同步管道，群友把这叫“基础设施...

#Reasoning#Code#Tools#Andrej Karpathy

精选理由

这是群聊日报的二手消息汇总，没有给出原始链接、具体任命细节或产品参数。Karpathy 去 Anthropic 这事我会先打个折，等官方确认再激动。Gemini 3.5 Flash 和 100 美元订阅档位正文没披露性能数据和权益清单，只能当个风向标看。整体信息量够上推荐，但可信度和细节都偏弱，所以放在 featured 的低分段。

一句话点评

Karpathy 加入 Anthropic 预训练团队，群友从“拒回 Tesla、拒跟导师”推断大模型可能真有新突破。Anthropic 收购 Stainless 后直接关停服务，切断了 OpenAI 的 SDK 同步管道，被群友称为“基础设施拒绝服务攻击”。

锐评

今天群聊日报信息量很大，但来源是匿名化群聊整理，所有判断都来自群友讨论，不是一手报道，这点先打个折。最值得关注的是两条线：一条是人才流动信号，Karpathy 先后拒绝 Musk 和 PhD 导师，唯独选了 Anthropic 的预训练团队，群友解读为“LLM 可能又有突破了”——这个推断有逻辑，但正文没披露他具体负责什么方向，别急着下结论。另一条是基础设施层面的竞争升级，Anthropic 收购 Stainless 后立刻关停托管服务，群友当场验证发现官网代码示例从 OpenAI 换成了 Anthropic，这比发 PR 稿狠多了，直接掐断对手的开发者工具链。Google I/O 那边 Gemini 3.5 Flash 和 $100 订阅档位反而显得常规，群友最崩溃的是 Vertex AI 改名 Agent Platform——“上周才搞明白区别，这周告诉我没了”，产品命名混乱对开发者体验的伤害是实打实的。方法论部分，群友把 90 篇知乎高赞和 2 万条推文用 embedding 聚类后导入 LLM Wiki 的工作流挺实用，但没给出效果验证，不知道聚类质量怎么样。整体来说，人才和基础设施两条线指向同一个方向：头部玩家在预训练和开发者生态两个层面同时收紧，竞争从模型能力延伸到对关键中间件的控制。缺的信息是 Karpathy 的具体职责、Stainless 收购金额和条款，以及 Google 新订阅档位的实际权益细节。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:27

29d ago

FEATURED新智元 · 公众号· rssZH04:27 · 05·20

驭势科技在港交所上市，成为全场景L4自动驾驶第一股，市值超百亿港元

驭势科技今天在港交所挂牌，发行价每股60.30港元，公开发售部分超额认购6777倍。公司主要做机场、厂区这类封闭场景的L4级无人驾驶物流车和接驳车，2025年在大中华区机场L4商用车市场占了90.5%的份额。不过原文因为微信环境验证拦截，正文内容没抓到，具体的财务数据、技术路线和募资用途都没披露，这些关键信息得去翻招股书才能确认。

#Robotics#Agent#Vision#UISEE

精选理由

驭势科技港股上市，机场 L4 商用车市占率做到九成，公开发售被抢了六千多倍，说明市场对自动驾驶商业化这条路的买单意愿很强。不过正文没披露营收和盈利情况，光看市占率还判断不了生意本身赚不赚钱，这点先别太激动。

一句话点评

驭势科技港股上市，机场无人车份额超九成，但正文被微信验证拦了，财务和募资用途都没看到，先别急着算账。

锐评

驭势科技今天在港交所挂牌，发行价60.30港元，公开发售超额认购6777倍，这个数字说明散户抢得很凶。公司主攻机场、厂区这类封闭场景的L4级无人驾驶物流车和接驳车，2025年在大中华区机场L4商用车市场占了90.5%的份额，基本是垄断地位。但问题来了：原文因为微信环境验证被拦截，正文内容完全没抓到。招股书里该有的财务数据、技术路线、募资用途，这篇报道一个字都没披露。90.5%的份额听起来吓人，可机场L4商用车这个市场本身有多大、增速如何、公司到底赚不赚钱，全得自己去翻招股书。超额认购倍数高不代表基本面扎实，港股打新情绪波动大，这点先别太激动。另外，封闭场景的L4落地确实比开放道路靠谱，但天花板也低，要看它能不能把机场这套复制到港口、矿区，或者往开放场景延伸。目前信息缺口太大，没法判断这百亿市值是实至名归还是上市窗口期的溢价。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:27

29d ago

FEATURED新智元 · 公众号· rssZH04:27 · 05·20

摩尔线程 MUSA 生态更新：SDK 对齐 CUDA 12.8，SGLang 主线已合并

摩尔线程放出了自家 GPU 生态 MUSA 的最新进展。SDK 5.1.0 把兼容目标拉到了 CUDA 12.8，覆盖了 761 个驱动和运行时接口，意思是跑 CUDA 代码时能认的指令更多了。推理框架 SGLang 的主线代码已经合并了 MUSA 的支持，硬件支持排期在 2026 年第二季度。另外还提了一个叫 MUSACODE 的工具，能自动把库迁移...

#Inference-opt#Agent#Robotics#Moore Threads

精选理由

我会先打个折：这还是一家厂商的生态更新，不是整个国产 GPU 阵营的集体突破。但文章把兼容 API 数量、SDK 版本对标和 SGLang 主线合入这几个点都摆出来了，比空谈“替代 CUDA”实在。老黄喝豆汁的梗让标题有了传播力，内文也没写成公关稿，对关注推理部署和算力自主的读者来说值得一看。

一句话点评

摩尔线程把自家GPU对CUDA的兼容性拉到了12.8，SGLang主线也合并了支持，但正文被微信验证页挡住了，具体跑分和实测延迟都没看到。

锐评

这条消息的核心是摩尔线程MUSA SDK 5.1.0把兼容目标定在了CUDA 12.8，覆盖了761个驱动和运行时接口。用人话说，就是现在用CUDA写的代码，在这家国产卡上能直接认的指令更多了，迁移成本会低一些。另外推理框架SGLang的主线代码已经合并了MUSA的支持，硬件排期在2026年Q2，说明生态上在跟开源社区接轨，不是自己闷头搞一套。但得打个折。原文因为微信环境验证被挡住了，我没法看到具体的性能对比、实际跑分或者延迟数据。兼容接口数量只能说明“能跑”，不能说明“跑得好”。CUDA的护城河不光是API数量，还有编译器优化、算子库深度和多年积累的调试工具链，这些在新闻稿里通常不会提。还缺几块关键信息：在真实模型（比如Llama 3或类似规模）上的推理吞吐和首token延迟是多少？MUSACODE自动迁移工具的成功率和对复杂算子的支持程度如何？以及最重要的，这些卡现在到底能不能稳定买到、供货周期多长。没这些，光看兼容数字还激动不起来。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:09

29d ago

FEATUREDAI HOT 精选· aihot-apiZH04:09 · 05·20

Kling AI 上线原生 4K 视频生成，不再靠后期放大，直接出真 4K

Kling AI 在 4 月 23 日放出一个原生 4K 视频生成模型，不是先做低分辨率再放大，而是从生成阶段就按 4K 来跑。官方说好莱坞团队和 Wonder Studios 已经在用，制片人反馈这是他们工作流里第一个原生 4K 基础模型，Wonder Studios 特别提到原生生成能避免传统放大带来的角色变形，画面一致性更好。不过正文没披露价格、...

#Multimodal#Vision#Kling AI#Wonder Studios

精选理由

我会先打个折：这是厂商自己发的消息，不是第三方评测。能一键出原生4K确实少见，也报了合作方名字，所以给了featured。但没给任何可比的硬指标——生成一段4K要多久、花多少钱、最长能出多少秒，这些全没说。这点先别太激动，等实测出来再看。

一句话点评

原生 4K 生成能避免放大带来的角色变形，但正文没提价格、推理成本和访问限制，这点先别太激动。

锐评

Kling AI 放出了一个原生 4K 视频生成模型，不是先做低分辨率再放大，而是从生成阶段就按 4K 跑。这个区别挺关键：传统超分放大容易让角色变形、纹理糊掉，原生生成理论上能保住画面一致性。Wonder Studios 的反馈也印证了这一点，说避免了角色变形问题。好莱坞制片人把它称为工作流里第一个原生 4K 基础模型，说明在专业制作端确实有人买单。但正文没披露任何硬指标。不知道生成一段 4K 视频要多久、花多少钱、有没有用量限制。也没说这个模型是开放公测还是只给合作方用。没有对比数据，比如和自家低分辨率模型或其他竞品在一致性、细节保留上的量化差距。还缺一个关键信息：原生 4K 的训练数据和推理算力成本到底高到什么程度。如果成本翻了几倍但画质提升只在特定场景下可见，那对大部分创作者来说性价比存疑。建议等官方放出定价和实际可用范围后再判断是不是真能进日常流程。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

04:01

29d ago

FEATUREDAI HOT 精选· aihot-apiZH04:01 · 05·20

OpenAI 给每家 YC 创业公司投 200 万美元 API 额度，换股权

OpenAI 要给 Y Combinator 当前批次的每家创业公司提供价值 200 万美元的 API 信用额度，不是现金，是直接抵扣调用 GPT 等模型的费用，换取一定股权。正文没披露具体占股比例、额度有效期和使用上限。这招有点像当年 Sam Altman 在 YC 当合伙人时，Yuri Milner 给每家创业公司投钱的打法，只不过这次 OpenA...

#Tools#OpenAI#Y Combinator#Sam Altman

精选理由

我会先打个折：正文没写股权比例、使用期限和额度上限，所以这笔账到底划不划算还不好说。但 OpenAI 直接拿 API 额度换 YC 系公司的股权，等于在早期就把自己嵌进一堆创业公司的技术栈里，锁客意图很明显。对缺钱的团队来说，200 万美元的 API 信用确实能省下一大笔早期推理成本，只是别忽略绑定的代价。这点先别太激动，等条款出来再算总账。

一句话点评

OpenAI 给 YC 每家创业公司 200 万美元 API 额度换股权，正文没写占股比例和额度有效期，这点先别太激动。

锐评

OpenAI 这招是拿 API 调用额度当投资筹码，不是给现金，创业公司用 GPT 等模型直接扣额度，省了前期算力开销。200 万美元这个数字看着大，但关键信息全缺：占股多少、额度多久过期、有没有月用上限，正文一概没提。这很像当年 Sam Altman 在 YC 时 Yuri Milner 那套批量撒钱打法，只不过这次撒的是自家产品。对早期团队来说，如果额度够用且占股合理，确实能省一笔；但如果占股偏高或额度限时太紧，实际价值就得打折扣。还缺一个信息：这些额度能不能跨模型用，比如 GPT-5 出来后是否还能抵扣。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:00

29d ago

FEATUREDFT · 科技· rssEN04:00 · 05·20

英伟达黄仁勋用 900 亿美元投资把客户和初创公司绑上自家芯片生态

这篇报道的正文被付费墙挡住了，只返回了安全验证页面，所以具体细节没法核实。从标题和摘要片段看，英伟达正在搞一轮总额 900 亿美元的投资扫货，规模已经对标科技巨头里最激进的风投部门。黄仁勋的思路不是单纯撒钱，而是通过投资让客户和 AI 初创公司深度依赖英伟达的芯片与技术栈，把买卖关系做成生态绑定。正文没披露这 900 亿是已承诺金额、已部署资金还是包含...

#Nvidia#Jensen Huang#Funding#Partnership

精选理由

这篇 FT 报道把 Nvidia 近年的投资和云信用额度打包成一个 900 亿美元的交易网，角度挺狠——不是卖铲子，是直接当 AI 热潮的银行。我会先打个折：900 亿是承诺总额，不是已经花出去的钱，正文也没拆清楚股权投资和云额度各占多少。但核心逻辑站得住：Nvidia 通过投资初创公司和给云厂商额度，让下游客户用它的 GPU 训练和推理，同时换来对 Nvidia 硬件的长期依赖。这点对从业者来说很实际，算力成本高企、担心被一家供应商锁死，都是日常痛点。文章没披露这些交易的具体条款和回报预期，所以没法判断财务上划不划算，但作为行业信号已经够分量。整...

一句话点评

英伟达砸900亿美元搞投资扫货，把客户和初创公司绑在自己的芯片生态上。但正文被付费墙挡了，这900亿是承诺、到账还是画饼，全看不清。

锐评

黄仁勋这轮900亿美元的投资手笔，规模已经对标科技巨头里最激进的风投部门。他的思路不是单纯撒钱，而是通过投资让客户和AI初创公司深度依赖英伟达的芯片与技术栈，把买卖关系做成生态绑定——你拿了我的钱，就得用我的卡、跑我的软件。这比单纯卖硬件要稳得多，相当于提前锁定了未来几年的需求。但这条新闻有个硬伤：正文被FT的付费墙完全挡住了，只返回了安全验证页面。所以这900亿到底是已承诺金额、已部署资金，还是包含了一些远期认购权或实物折价，全都没法核实。数字本身很大，但如果里面掺了水分，实际撬动的杠杆可能没那么夸张。另外，投资组合的行业分布、有没有集中在某几个大客户身上，这些关键信息也一概不知。我会先给这个数字打个折。等看到具体投向和资金结构再说，现在只能确认英伟达在用资本手段加固护城河，但护城河到底多宽，还得看明细。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

03:49

29d ago

● P1机器之心 · 公众号· rssZH03:49 · 05·20

Google I/O 发布 Gemini 3.5 Flash，搜索框接入 AI 智能体

谷歌在 I/O 大会上发布了 Gemini 3.5 Flash，并把 AI 模式直接嵌进了搜索框。公司说现在它的 AI 服务每月要处理超过 3200 万亿个 token，已经有超过 850 万开发者在使用 Gemini。不过这篇文章因为微信平台的环境验证问题，正文内容没能加载出来，所以具体的模型参数、性能对比和实际体验细节都没法确认。

#Agent#Multimodal#Code#Google

精选理由

谷歌 I/O 这次把模型更新和搜索入口绑在一起推，AI Mode 直接嵌进搜索框，比普通功能发布重得多。Gemini 3.5 Flash 是新的轻量模型，月 token 消耗 3.2 千万亿说明用量已经很大，850 万开发者这个数字也够扎实。我会先打个折：正文没披露 3.5 Flash 的具体 benchmark 对比和定价，实际性价比还得等实测。但就凭搜索框变智能体这一条，当天必须写。

一句话点评

谷歌把搜索框变成了一个能看图、读文件、替你盯信息的AI助手，但后台智能体功能要付费订阅才能用。

锐评

这次改版把谷歌搜索从“输关键词找链接”直接推到了“让AI替你干活”的阶段。用户现在可以丢图片、视频甚至浏览器标签页进去提问，AI概览也支持连续追问，交互更像聊天。底层跑的是新发布的Gemini 3.5 Flash模型，谷歌说AI模式月活已经破了10亿，查询量每季度翻倍，这个增速说明用户对AI搜索的接受度很高。比较激进的是“搜索智能体”，它能在后台24小时帮你盯房价、球鞋发售等信息，但正文明确写了，这个功能今年夏天只对Google AI Pro和Ultra付费用户开放。免费用户能拿到的“生成式界面”功能，可以生成交互图表来讲解复杂知识，这点倒是全员可用。文章没提新版搜索的广告会怎么变，也没说AI生成的回答里引用来源的透明度如何。在搜索这种靠广告吃饭的业务上大改，商业影响和内容生态的冲击都还是未知数。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

100

SCORE

H1·K1·R1

03:07

29d ago

FEATURED纽约时报中文网· rssZH03:07 · 05·20

中国法院第三次判企业用 AI 替代员工后辞退违法，杭州案月薪从 2.5 万降到 1.5 万被认定非法解雇

杭州中院把一起 AI 替代岗位的案子定为指导性案例：公司用 AI 取代质检岗，给员工调岗但月薪从 2.5 万砍到 1.5 万，员工拒绝后被辞退，法院认定公司没做合理安置，属于违法辞退。这是中国官方第三次公开支持被 AI 抢走工作的劳动者胜诉，信号很明确——企业引入 AI 算自愿降本，不能当裁员的理由。文章提到中国青年失业率约 17%，超 2 亿人在零工...

#Robotics#The New York Times#Meituan#Nvidia

精选理由

这篇 NYT 报道把中国 AI 政策与劳动仲裁案例绑在一起讲，杭州案的数字和判决理由都写清楚了。它不是模型发布或产品动态，所以重要性给 80、放在 featured 比当天必写更合适。我会先打个折：正文没披露企业名称和具体行业，但三个公开判例的累积信号已经够强，值得让从业者看到政策与法院之间的拉扯。

一句话点评

法院把AI替代岗位的案子定为指导性案例，信号很明确：企业用AI算自愿降本，不能当裁员的理由。但正文没披露这判决对后续同类案件的实际约束力有多大。

锐评

这条新闻值得点开看，因为它不是泛泛讨论AI抢饭碗，而是给出了一个具体的司法动作：杭州中院把一起AI替代质检岗的案子定为指导性案例。员工月薪从2.5万被砍到1.5万后遭辞退，法院认定公司没做合理安置，属于违法辞退。这是中国官方第三次公开支持被AI替代的劳动者胜诉，说明法院在试图划一条线——企业引入AI是你自己选的降本手段，不能拿来当裁员的合法理由。文章提到中国青年失业率约17%，超2亿人在零工经济里谋生，这个背景解释了为什么官方对AI就业冲击的调门变了。但有几个关键信息是缺的：一是这三起判例到底覆盖了多少类似纠纷，正文没给数据；二是指导性案例在基层法院的实际援引率和约束效果，文章也没展开；三是企业有没有在判决后调整用工策略，比如改用更隐蔽的变相降薪或绩效淘汰，这些后续影响完全没涉及。所以这条新闻的价值在于告诉你政策风向在转，但别急着下结论说劳动者就有了护身符。司法信号和实际执行之间还有很大距离，这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:39

29d ago

FEATUREDAI HOT 精选· aihot-apiZH02:39 · 05·20

微软内部警告：AI 编程工具让 GitHub 的代码托管生意面临生存危机

微软内部认为，Cursor、Claude Code 这类 AI 编程助手正在改变开发者写代码和协作的方式，大家不再需要频繁把代码传到 GitHub 仓库，这让 GitHub 的托管业务受到根本性冲击。微软已经要求部分团队在 2026 年 6 月底前停用 Claude Code，统一改用自家的 GitHub Copilot CLI，表面理由是统一工具链和...

#Code#Agent#Tools#Microsoft

精选理由

这条消息的杀伤力在于“内部示警”和“生存级风险”这两个词，把 AI 编程工具对 GitHub 托管业务的威胁摆到了台面上。我会先打个折：目前只有一家媒体爆料，微软和 GitHub 都没公开回应，所以不能当定论看。但信息量够硬——微软一边推 Copilot CLI，一边给 Claude Code 设了停用 deadline，说明内部已经在用行政手段抢开发者入口了。对从业者来说，这比单纯的产品更新更有嚼头：如果 AI 编程工具真的让代码托管变得可有可无，GitHub 的护城河就塌了一大块。正文没披露这个决策覆盖多大规模、是否全球执行，这点先别太激动。整...

一句话点评

微软自己先慌了：AI 编程工具让开发者不用频繁传代码到 GitHub，托管业务被掏了老底。但内部禁用 Claude Code 更像省钱和锁客，别全信“生存危机”这套。

锐评

这条消息的核心矛盾在于：微软一边说 GitHub 被 AI 编程工具冲击得“生存级风险”，一边又用行政命令让内部团队停用 Claude Code、统一切回自家 Copilot CLI。这更像一场借外部竞争压力推动内部工具收口和成本控制的动作，而不是 GitHub 明天就要关门。报道提到几个关键时间点：2024 年 Cursor 推出能处理复杂任务的集成开发环境，2025 年 Claude Code 把能力延伸到终端、可自主完成多步骤工程任务。这些产品确实改变了开发流程——代码在本地就被 AI 生成和调试好了，上传到 GitHub 不再是必须步骤。但正文没给出任何数据说明 GitHub 的活跃仓库数、推送频率或付费用户是否真的在下降，所以“生存级风险”目前还只是一份内部判断，缺乏可验证的量化证据。另外，微软要求 2026 年 6 月底前停用 Claude Code，理由之一是压缩 2027 财年运营开支。这说明决策背后有明确的财务动机。同时 GitHub Copilot CLI 仍保留对 Claude 模型的访问权限，说明微软不是要彻底切断对手，而是在客户端层面收口、在模型层面保持弹性。OpenAI 一度考虑自建替代平台这个细节也值得留意，但报道没展开，不知道是技术验证还是战略试探。整体看，这条新闻的价值在于暴露了微软对 GitHub 护城河变浅的焦虑，但焦虑程度和实际业务损伤之间有多大距离，还需要更多数据才能判断。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:00

30d ago

● P1AI HOT 精选· aihot-apiZH02:00 · 05·20

通义千问发布 Qwen3.7-Max，主打长时间自主干活和跨平台编程

Qwen 团队推出了 Qwen3.7-Max，一个专为智能体场景设计的闭源模型。它最显眼的能力是能长时间自主执行任务，官方演示了一个连续跑 35 小时、调用上千次工具的内核优化任务。在编程方面，它在 Terminal Bench 2.0 上拿了 69.7 分，超过了 DeepSeek-V4-Pro Max 的 67.9 分；在 SWE-Pro 这类复杂...

#Agent#Multimodal#Tools#Qwen Studio

精选理由

Qwen Studio 发了 Qwen3.7，一口气覆盖聊天、图像视频理解、图像生成、文档处理、网页搜索、工具调用和工件生成，摆明要往智能体方向走。我会先打个折：正文没给任何 benchmark、定价、上下文窗口或延迟数据，所以没法判断实际可用性和成本。亮点是工具调用和工件生成这两项，说明模型不只是聊天，而是被设计成能进业务流程干活。这点先别太激动，等看到具体评测和接入方式再说。

一句话点评

Qwen3.7-Max 在 Terminal Bench 2.0 上拿了 69.7 分，比 DeepSeek-V4-Pro Max 高 1.8 分，但正文没披露上下文长度、定价和 API 开放时间，这些先打问号。

锐评

Qwen3.7-Max 把自己定位成“智能体专用模型”，最抓眼球的证据是官方演示了一个连续跑 35 小时、调用上千次工具的内核优化任务。这个数字说明模型能在长时间自主执行中保持连贯推理，不是那种跑几步就断片的玩具。编程智能体方面，它在 Terminal Bench 2.0 上拿了 69.7 分，超过 DeepSeek-V4-Pro Max 的 67.9 分；SWE-Pro 这类复杂软件工程任务上 60.6 分，比对手高 1-2 分，属于小幅领先。通用智能体基准如 MCP-Mark 和 Skillbench 也都有 2-5 分的优势，但幅度不算碾压。要注意的是，这篇博客是产品发布文，不是技术报告。正文没披露上下文长度上限、API 定价、具体开放时间，也没说明 35 小时任务是否可复现、有没有人工干预。所有基准测试用的都是内部脚手架或特定框架（如 Claude Code），跨框架泛化能力虽然提了，但没给量化对比。STEM 推理部分，GPQA Diamond 92.4 分、HLE 41.4 分确实高，但 CritPT 只有 11.4 分，说明模型在批判性推理这种需要挑错的任务上还有明显短板。整体看，Qwen3.7-Max 在智能体场景上确实往前拱了一步，尤其是长程自主执行和跨框架兼容性。但缺少上下文长度、成本和可复现细节，让这些数字的实用参考价值打了折扣。等 API 上线后看实际延迟和费用，才能判断是不是真能进生产流程。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:41

30d ago

FEATUREDr/LocalLLaMA· rssEN00:41 · 05·20

用 4 张老 RTX 2080 Ti 在本地跑 DeepSeek-V4，预填充跑到 255 token/s

一个 Reddit 用户用 4 张 RTX 2080 Ti 显卡（总预算不到 2500 美元）在本地跑起了 DeepSeek-V4-Flash 模型。模型总参数 2840 亿，每次推理激活 130 亿参数。他用了 W8A8 量化（把权重和激活值都压到 8 位精度）来省显存，还自己写了适配老 Turing 架构的 CUDA 算子。机器配了 1TB 的 D...

#Inference-opt#DeepSeek#NVIDIA#Known_Ice9380

精选理由

一个 Reddit 用户用 4 块二手 RTX 2080 Ti 搭了一套不到 2500 美元的机器，跑 DeepSeek-V4-Flash（284B 参数，每次推理只激活 13B），通过 W8A8 量化和自己写的 Turing 内核优化，prefill 阶段跑到约 255 tok/s。我会先打个折：这是单用户自报数据，没有第三方复现，也没披露并发、上下文长度和 decode 阶段的吞吐，所以别直接当采购依据。但亮点在于它证明了老卡在量化+定制内核下还能打，对预算有限的团队是个有参考价值的思路。正文没提功耗和稳定性，这两点在实际部署里很关键。

一句话点评

4 张老 RTX 2080 Ti 跑 DeepSeek-V4，每秒能吐 255 个 token，总花费不到 2500 美元。但正文被 Reddit 安全策略挡了，看不到具体延迟和量化损失。

锐评

这条帖子的亮点是用 4 张 RTX 2080 Ti 这种老卡，靠 W8A8 量化（把模型权重和计算中间值都压到 8 位精度）和手写的 Turing 架构 CUDA 算子，在本地跑起了 DeepSeek-V4-Flash。2840 亿总参数、每次只激活 130 亿参数的设计本身就省资源，配上 1TB 内存做卸载，255 prefill tok/s 的速度对个人折腾来说相当能打。总预算不到 2500 美元，比一张新旗舰卡还便宜。但 Reddit 原文被 403 挡了，我们看不到实际推理延迟、量化后回答质量有没有明显下降、多轮对话稳不稳。手写算子虽然能榨性能，但通用性和维护成本是另一回事。这点先别太激动，等有人复现或者原帖主补上完整测试再看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

00:01

30d ago

FEATUREDHacker News 首页· rssEN00:01 · 05·20

GitHub 内部仓库遭未授权访问官方启动调查

GitHub 官方发推说正在调查内部仓库被未授权访问的事。目前只确认了有这回事，但没披露访问范围、攻击路径或哪些仓库受影响。Hacker News 上这条有 62 分和 15 条评论，说明社区在关注但信息还很少。正文没交代是不是有数据泄露或凭证被偷，这点先别太激动，等后续更新。

#GitHub#Hacker News#Incident

精选理由

H 和 R 通过，但 K 因为缺少范围和攻击细节不通过。GitHub 安全事件对开发者基础设施有影响，但正文只给了调查状态，信息量不够上精选。

一句话点评

GitHub 自己承认内部代码仓库被人摸进去了，正在查。目前细节很少，别急着下结论。

锐评

这件事目前信息量很低，但重要性不低。GitHub 官方确认有未授权访问内部仓库的行为，并已启动调查。Hacker News 上两条帖子标题一个叫“调查中”，一个直接写“被黑了”，后者显然更耸动，但正文都是空的，没有披露攻击路径、受影响范围或时间线。对从业者来说，值得盯的点是：如果攻击者拿到了私有仓库的代码或密钥，影响会顺着供应链扩散。但现阶段所有判断都得打折，因为官方连“内部仓库”具体指什么都没说——是员工用的工具脚本，还是 GitHub.com 的核心基础设施代码，差别巨大。我会先等 GitHub 的正式公告，再看有没有第三方分析出来。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

00:00

30d ago

● P1OpenAI 博客· rssEN00:00 · 05·20

OpenAI 模型推翻了一个 80 年的离散几何猜想

OpenAI 发了一篇博文，说他们内部一个通用推理模型自己解决了一道叫“平面单位距离问题”的数学难题，推翻了大家信了几十年的主流猜想。这道题是 Erdős 在 1946 年提出的，简单说就是平面上放 n 个点，最多能有多少对点距离刚好是 1。之前学界普遍认为正方形网格那种摆法已经接近最优了，但这个模型给出了一族新构造，把单位距离对的数量往上提了一个多项...

#Reasoning#OpenAI#Research release

精选理由

我会先打个折：正文没披露模型名称、证明机制和可复现条件，所以没法给更高分。但 OpenAI 模型推翻 80 年几何猜想这件事本身够新、够具体，也够有争议性，HKR 三项全中，85 分放在 P1 合理。

一句话点评

OpenAI 一个通用推理模型自己推翻了 80 年的离散几何猜想，成本不到 1000 美元，但模型细节和训练数据都没说。

锐评

这条新闻最值得看的是：一个没专门为数学定制的通用推理模型，自己找到了反例，推翻了 Erdős 在 1946 年提出的平面单位距离问题猜想。之前学界普遍认为正方形网格的构造已经接近最优，模型却从代数数论里搬来了意想不到的工具，给出了一个多项式级别的改进。Tim Gowers 说如果这是人写的，他会毫不犹豫推荐顶刊接收，这个评价分量很重。成本方面，Latent Space 提到整个过程花了不到 1000 美元，如果是真的挺省钱。但 OpenAI 官方正文没披露具体用了哪个模型、参数量多大、推理时用了多少算力，也没说训练数据里是否包含过相关数学文献。这点先别太激动——模型可能见过类似思路的论文，只是人类没把它们和这个猜想连起来。还缺的关键信息：外部数学家验证的范围有多大，是完整验证了证明还是只检查了关键步骤；模型产生这个证明之前失败了多少次、有没有人类在循环里做筛选。这些会直接影响“自主解决”这个说法的含金量。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

100

SCORE

H1·K1·R1

00:00

30d ago

FEATUREDAI HOT 精选· aihot-apiZH00:00 · 05·20

大模型 API 的补贴期结束了，三家厂商开始涨价

Tomasz Tunguz 对比了 Google、OpenAI 和 Anthropic 三家最新旗舰模型的 API 定价，发现补贴正在退潮。Google Gemini 3.1 Pro 最便宜，输入每百万 token 2 美元、输出 12 美元；OpenAI GPT-5.5 短暂补贴后涨到输入 5 美元、输出 30 美元；Anthropic Claude...

#Inference-opt#Google#OpenAI#Anthropic

精选理由

Tom Tunguz 这篇是定价评论，不是模型首发新闻，但三家旗舰模型的价格摆在一起，差距够大，对从业者选型有参考价值。我会先打个折，给 featured 而不是 must-write，因为正文没披露补贴具体怎么算、能撑多久，判断还缺一手数据。

一句话点评

三家大模型都在涨价，Google 最便宜但年涨三倍，OpenAI 补贴结束反弹，Anthropic 反而在降。

锐评

Tomasz Tunguz 这篇博客把三家 API 定价摊开来看，结论很直白：烧钱换份额的阶段过去了，现在大家都在保利润。Google Gemini 3.1 Pro 输入每百万 token 2 美元、输出 12 美元，虽然还是最便宜，但 Tunguz 指出它每年价格翻三倍，这个趋势比绝对值更值得盯。OpenAI 的 GPT-5.5 短暂补贴后涨到输入 5 美元、输出 30 美元，说明之前的低价是战术性的，不是成本真降了。Anthropic 的 Claude Opus 4.7 反而从“奢侈品定价”往下调，维持在输入 5 美元、输出 25 美元，策略明显不同。文章把涨价归因于三家都在疯狂砸钱建基础设施，现金流吃紧，所以开始要利润。这个判断逻辑是通的，但正文没给出各家实际的推理成本或毛利率数据，所以“补贴退潮”到底是回归正常利润还是仍在亏本卖，其实看不出来。另外，Tunguz 是 Theory Ventures 的 GP，视角天然偏向商业模式和资本支出，对技术侧的成本结构变化着墨不多。如果你在选模型做预算，这篇能帮你快速对齐价格水位，但别拿它当成本分析报告用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

热点聚合 · 2026-05-20

更多

频道

后台