ax@ax-radar:~/feed $ tail -f signal.log
40 srcsignal 12%cycle 04:32

热点聚合 · 2026-05-18

49 signals · updated 3m ago
live · 238 today·policy v2
AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·
RSS live
2026-05-18 · 星期一2026年5月18日
23:00
31d ago
● P1彭博科技· rssEN23:00 · 05·18
Meta转岗7000名员工至AI岗位并启动全球裁员
Meta 内部发了份备忘录,要把 7000 人调到 AI 相关的岗位上。这波调整不是单纯的转岗,更大的背景是公司这周晚些时候会启动新一轮裁员。具体哪些部门被裁、裁多少人,正文没披露。转去做 AI 的 7000 人具体干什么也没细说,是去搞模型研发、做 AI 产品还是负责内容审核的自动化,目前都不清楚。
#Meta#Personnel
精选理由
这条消息的冲击力在于数字和时机:7000人不是小数目,而且是在裁员前集中转岗,说明Meta在AI上的投入是动真格的,但代价是其他部门的人可能要走。对从业者来说,这比单纯吹AI前景更实在,因为它直接告诉你大厂内部的人力资源正在发生什么级别的挪移。我会先打个折,这毕竟只是内部调动,不是新增岗位,但作为行业风向标已经够分量了。
一句话点评
Meta一边把7000人转去做AI,一边裁掉8000人,这不是转型,是用AI换人。
锐评
扎克伯格这次动作很直接:先在公司内部把7000名员工调到AI相关岗位,紧接着在全球裁掉8000人,新加坡的亚洲总部已经开始动手。Bloomberg的报道点出了时间线——调岗在前,裁员在后,说明这不是临时起意,而是算过账的。Meta刚赚了创纪录的钱,转头就裁人,逻辑上说得通:把人力成本省下来,砸进算力和模型训练里。 但报道没讲清楚那7000人转去AI岗具体做什么。是去做数据标注、模型评估,还是真的进研究团队?这两者差别很大。如果是前者,本质上是用内部人力替代外包,成本是降了,但对技术突破帮助有限。另外,8000人的裁员规模不小,文章没披露涉及的部门和地区分布,也没说遣散成本会不会吃掉一部分省下来的钱。 我会先打个折:这更像是一次财务驱动的资源腾挪,而不是技术路线上的重大转向。真正值得盯的,是接下来几个季度Meta的AI产品能不能把裁掉的人头价值赚回来。
HKR 分解
hook knowledge resonance
打开信源
99
SCORE
H1·K1·R1
22:33
31d ago
● P1FT · 科技· rssEN22:33 · 05·18
NextEra与Dominion达成4200亿美元公用事业合并交易
这篇 FT 报道正文被付费墙挡住了,只露出标题和摘要片段。标题里提到的“Project Astra”是一桩 4200 亿美元的并购案,由 NextEra 和 Dominion 两家电力公司主导,目标是拿下美国“数据中心走廊”的供电控制权。但具体怎么合并、钱怎么分、监管批不批、成本最终会转嫁给 AI 客户还是普通用户,这些关键信息正文都没披露。我会先打个...
#NextEra#Dominion#Partnership#Policy
精选理由
FT 这篇把 AI 基建的真实成本问题摆上台面,不是讲模型而是讲电费账单。NextEra 和 Dominion 的交易会进一步锁死美国数据中心密集区的电力供应,从业者读到这里会立刻联想到自家云账单和选址风险。我会先打个折:正文没披露价格、交割时间和监管门槛,所以只能算一个信号而非定论。但'控制走廊'这个事实本身就够让做 AI infra 的人警觉,推荐给关注算力成本和地缘布局的读者。
一句话点评
NextEra和Dominion合并成一家4200亿美元的电力公司,直接原因是AI数据中心太耗电了。但FT这篇正文被付费墙挡了,具体交易结构和监管风险都没看到。
锐评
这笔交易的核心逻辑很直白:AI算力中心正在疯狂吞噬美国电网的负荷,电力公司与其各自为战,不如抱团抢下这块增量蛋糕。4200亿美元的合并体量,说明市场已经把电力供应看作AI基建的硬瓶颈,不再是配角。但FT的报道正文被锁在付费墙后面,我们看不到交易的具体条款、股权结构,也不知道监管机构会从哪个角度审查——是反垄断,还是电价上涨对居民用户的冲击。标题里提到“会引发一场关于AI繁荣成本的争斗”,这个判断很关键,但缺少细节支撑。目前能确认的只有合并规模和两家公司的名字,至于这笔交易最终会让数据中心用上更便宜的电,还是把成本转嫁给普通家庭,正文没披露,这点先别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
20:00
31d ago
● P1彭博科技· rssEN20:00 · 05·18
Meta 在路易斯安那州砸 2000 亿美元建数据中心,靠 10 座天然气电厂供电
Meta 在路易斯安那州 Richland Parish 搞了一个 AI 数据中心,钱不是自己全掏,而是通过一笔 2000 亿美元的私募融资来支撑。这个园区的总电力需求最高能到 7.5 吉瓦,其中 5 吉瓦专门给计算设备用。为了喂饱这些机器,他们计划新建 10 座天然气发电厂来供电。这个规模非常夸张,相当于把未来几年的算力扩张押注在化石能源上。不过视频...
#Inference-opt#Meta#Bloomberg#Funding
精选理由
Meta这个数据中心项目把AI基建的烧钱程度又拉高了一个量级。2000亿美元融资和7.5吉瓦电力需求是实打实的硬数字,5吉瓦专供计算说明他们押注的是推理和训练长期需求,不是短期炒作。我会先打个折:正文没披露电力来源和具体时间表,7.5吉瓦能不能落地还得看当地电网和审批。如果是真的,这个单点耗电量已经超过很多小国家的总用电,能源成本会直接决定这个数据中心的经济账能不能算过来。
一句话点评
Meta 在路易斯安那砸 2000 亿美元建 AI 数据中心,钱是私募出的,电靠新建 10 座天然气电厂,这相当于把未来算力扩张押注在化石能源上。
锐评
这条消息最值得关注的是融资结构和能源选择。2000 亿美元不是 Meta 自己掏腰包,而是通过私募融资来支撑,说明现在建 AI 基础设施的资本门槛已经高到连 Meta 都要拉外部资金了。园区总电力需求最高 7.5 吉瓦,其中 5 吉瓦专门给计算设备用——这个数字什么概念?大概相当于五个中等规模城市的居民用电量。为了喂饱这些机器,他们计划新建 10 座天然气发电厂,等于把未来几年的算力扩张直接绑在化石能源上,跟科技公司嘴上说的碳中和目标形成鲜明对比。 不过视频是 Bloomberg 的付费内容,正文只给了摘要,没披露融资的具体条款、建设时间表、以及 Meta 自己到底出了多少钱。另外,7.5 吉瓦是峰值需求还是常态负载,也没说清楚。这些缺口意味着我们现在只能看到这笔交易的轮廓,没法判断它的财务风险和实际落地节奏。如果后续有更多细节,我会先打个折看——这种规模的基建项目,从宣布到真正跑起来,中间变数通常不小。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
19:01
31d ago
● P1r/LocalLLaMA· rssEN19:01 · 05·18
llama.cpp 合入 MTP speculative decoding 加速 Qwen3.6
llama.cpp 在 PR #22673 里正式合并了 MTP(多 token 预测)投机解码支持。实测 Qwen3.6 27B 用 Q8_0 量化,在 Strix Halo 上从 7.4 tok/s 提到 18.1 tok/s,速度翻了 2.44 倍;双 RTX 3090 的 Q8_0 方案也从 25.7 tok/s 涨到 55.9 tok/s,约...
#Inference-opt#Code#Benchmarking#llama.cpp
精选理由
HKR 三项都满足:llama.cpp 合入了 MTP 投机解码,用 Qwen3.6 27B 在 Strix Halo 和 RTX 3090 上跑出了实打实的加速数字。范围限定在本地推理优化,不是大模型发布,78 分放在 featured 合适。
一句话点评
llama.cpp 正式支持 MTP 投机解码,Qwen3.6 27B 在 Strix Halo 上跑到 2.44 倍速,但小显存设备上效果打折甚至没用。
锐评
llama.cpp 合入了 MTP(多 token 预测)投机解码,专门给 Qwen3.6 系列加速。社区实测数据出来了:在 Strix Halo 上跑 Qwen3.6 27B 能到 2.44 倍速,RTX 3090 上约 2.17 倍,这提升挺实在的。但别急着高兴,有用户拿 6GB 显存笔记本跑 35B MoE 模型,结论是“不值得”,RTX 5080 16GB 跑 128k 长上下文时 MTP 也没帮上忙。这说明加速效果很吃硬件配置,显存紧张或上下文极长时,MTP 额外占用的资源可能抵消掉收益。目前信息都来自 Reddit 用户自发测试,正文被屏蔽看不到原始帖子的详细设置和误差范围,缺少官方基准或更系统的消融实验。想判断自己设备值不值得开 MTP,最好等更多不同配置的对比数据出来。
HKR 分解
hook knowledge resonance
打开信源
95
SCORE
H1·K1·R1
17:40
31d ago
● P1彭博科技· rssEN17:40 · 05·18
Elon Musk 败诉 Sam Altman 和 OpenAI 重组案
陪审团驳回了马斯克对 Sam Altman 和 OpenAI 的指控,核心理由是马斯克拖得太久才起诉。马斯克原本想通过诉讼阻止 OpenAI 转向营利性架构,但报道没披露具体在哪个法院打的官司、马斯克要求了哪些补救措施,也没说 OpenAI 这次重组的具体条款是什么。
#Elon Musk#Sam Altman#OpenAI#Policy
精选理由
马斯克输掉这场官司,核心就一句话:陪审团觉得他告晚了。正文没写具体在哪个法院、马斯克要了多少赔偿、OpenAI 重组方案到底怎么改,所以信息缺口不小。但光是“起诉过晚被驳回”这个结果,已经够让关注 AI 圈权力格局的人讨论一阵了。我会先打个折,因为细节太少,没法判断后续会不会上诉或者对 OpenAI 架构产生实质影响。
一句话点评
马斯克告 OpenAI 重组案败诉,陪审团一致认为他起诉太晚了,核心指控根本没进入实质审理。
锐评
这场被炒成“AI 世纪审判”的官司,最后倒在一个程序问题上:9 名加州陪审员一致认定马斯克起诉的时间超过了法律允许的期限,所以法庭没去判断 OpenAI 从非营利转向营利是否真的“偷了慈善机构”。TechCrunch 的报道提到,庭审虽然挖出不少硅谷大佬的证词和 OpenAI 早期的狗血历史,但陪审团要回答的问题其实很窄——就是看时效过没过。 换句话说,马斯克在法律上输了,但 OpenAI 的重组是否合理、有没有辜负最初的使命,这个实质争议在法庭上并没有得到答案。报道也没披露陪审团具体依据哪几条证据认定超时,以及马斯克方面会不会上诉。如果你关心的是 OpenAI 的治理结构到底有没有问题,这场判决给不了结论,它只说明马斯克动手晚了。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
16:24
31d ago
● P1Hacker News 首页· rssEN16:24 · 05·18
Qwen 3.7 Preview 发布
阿里 Qwen 团队在 X 上发了 Qwen 3.7 预览版的链接,但正文只贴了 Twitter 和 Hacker News 地址,没披露模型参数量、能力变化、定价或发布时间。目前 HN 上只有 9 分和 1 条评论,信息量约等于零。想了解具体升级点还得等后续公告。
#Qwen#Alibaba#Product update
精选理由
HKR-H 和 HKR-R 成立,因为官方 Qwen 版本预告确实有模型竞赛的钩子。HKR-K 不成立:正文没披露任何参数、能力差异、基准测试或访问条件,所以分数落在 60–71 区间。
一句话点评
Qwen 3.7 预览版来了,社区等得挺急,但正文没披露具体模型参数和性能跑分,先别太激动。
锐评
Qwen 放出了 3.7 的预览版,社区反应很热烈,Reddit 上甚至有人用梗图表达等待的焦急。不过目前公开的信息非常有限,只有“预览版”这个状态,没有给出模型规模、架构变化、基准测试成绩或具体的发布时间表。从社区讨论看,大家期待的是 Qwen 系列一贯的开放权重和中文能力,但这次预览到底开放到什么程度、是完整模型还是蒸馏版,正文都没说。对从业者来说,现在能判断的只有两点:一是 Qwen 团队在持续迭代,二是社区对它的期待值很高。至于这个版本是否值得立刻上手测试,得等官方放出技术报告和权重再说。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K0·R1
13:37
31d ago
● P1Hacker News 首页· rssEN13:37 · 05·18
Cloudflare 用 Mythos 模型在内部代码库测试漏洞挖掘和攻击链生成
Cloudflare 在 Project Glasswing 里测试了 Anthropic 的 Mythos Preview 模型,把它丢到 50 多个内部代码仓库上跑。这个模型跟之前通用大模型最大的区别是:它能自己把几个小漏洞串成一条完整的攻击链,并写出验证代码在沙箱里编译运行,跑不通就自己改假设再试,直到证明漏洞真的可利用。不过,这个预览版没有正式...
#Reasoning#Code#Safety#Cloudflare
精选理由
HKR 三项全中。Cloudflare 拿自己的代码库做了一手测试,跑出可执行漏洞利用链,还记录了不一致拒答的问题,信号很强。但这不是 Anthropic 官方模型发布,只是第三方试用报告,所以分数停在 84 这个区间是合理的。
一句话点评
Cloudflare 拿 Anthropic 的 Mythos 模型扫了自己五十多个代码库,发现它能自动把几个小漏洞串成完整攻击链,还会自己写代码验证漏洞是否真的能用。
锐评
Cloudflare 这篇博客讲的是他们内部测试 Mythos Preview 的真实体验,不是第三方评测,所以结论要打点折——他们只测了自己的代码库,不代表对所有项目都有效。但信息量很足:Mythos 最大的进步不是找漏洞,而是能把几个原本不起眼的小问题(比如内存释放后还能访问)串成一条完整的攻击路径,并且自己写验证代码、编译、运行,失败了还会调整假设再试。这个闭环能力让之前只停在“可能有问题”的发现变成了“确实能打穿”的证明。 另一个值得注意的点是模型会“拒绝干活”。即使 Anthropic 给的是去掉额外安全限制的版本,Mythos 有时还是会拒绝写漏洞利用代码,但换个问法或改个环境变量就又同意了。这种不一致说明模型自带的护栏不可靠,不能当安全策略用。 博客没给出具体的漏洞发现数量、误报率,也没说扫一次要花多少钱、跑多久。这些数据对判断它能不能规模化用很关键,目前只能看到能力演示,离生产环境的成本收益评估还差一截。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
04:47
31d ago
● P1机器之心 · 公众号· rssZH04:47 · 05·18
openJiuwen 开源多智能体蜂群框架 JiuwenSwarm
openJiuwen 社区在「虾马」之后又开源了一个叫 JiuwenSwarm 的多智能体框架,把多个 AI 模型组织成“蜂群”来协作。框架拆成四块:Agent Swarm 管智能体编队、Swarm Skills 管技能包、Swarm Skills Hub 是技能市场、还有一套自进化机制让技能自己迭代。他们拿 PinchBench 跑了个分,Jiuwe...
#Agent#Tools#Memory#openJiuwen
精选理由
我会先打个折:openJiuwen 不是一线实验室,这篇又缺复现细节和基线对比,所以分数停在 78。但 HKR 三项都踩中了——“养蜂”说法有传播力,四个组件加 PinchBench 94.2% 给了硬信息,开源蜂群架构对做智能体编排的人确实有吸引力。正文没披露许可证和复现配置,这点先别太激动。
一句话点评
openJiuwen 社区开源了一个叫 JiuwenSwarm 的多智能体框架,主打“蜂群”式协作。但两篇来源文章都因环境异常无法读取正文,具体架构、性能数据和实际效果目前全看不到。
锐评
这条消息目前只能看个标题,两篇来源(机器之心和量子位)的微信文章都触发了环境异常验证,正文内容完全缺失。从标题判断,openJiuwen 社区在之前“虾马”项目之后,又推出了 JiuwenSwarm,定位是多智能体蜂群框架,强调群体智能和“养蜂”概念。 “蜂群”这个比喻在智能体领域不算新,通常指大量简单 agent 通过简单规则涌现出复杂行为,类似蚂蚁或蜜蜂的群体智能。但这类框架的落地难点一直在于:任务拆解是否可靠、agent 间通信开销多大、整体行为是否可控。正文没披露,这些关键点一个都验证不了。 我会先打个折。开源框架的新闻,如果连代码仓库链接、架构图、基准测试结果都没放出来,光靠标题里的“重磅”“引领”撑不起判断。等正文能读了,或者社区放出实际跑通的 demo 和对比数据,再评估不迟。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
04:00
31d ago
● P1FT · 科技· rssEN04:00 · 05·18
Musk 诉 Altman 案陪审团就 OpenAI 归属权作出裁决
FT 这篇付费文章只露了个标题和摘要,正文被订阅墙挡了。标题说 OpenAI 的 IPO 估值可能到 1 万亿美元,但 Elon Musk 的法律挑战可能搅黄它的商业化计划。具体开庭时间、IPO 条款、Musk 的诉求是什么,正文没披露。
#OpenAI#Elon Musk#Funding#Policy
精选理由
FT 这篇标题把 OpenAI 的万亿美元 IPO 和奥克兰陪审团直接挂钩,冲突感很强,但正文其实只说了马斯克的法律挑战可能阻碍其商业计划,审理时间表、IPO 具体条款都没披露。我会先打个折:钩子够猛,信息密度不够,所以放在 78 分这档,不是必写级别。
一句话点评
Altman 出庭作证了,但这场官司的核心不是谁更会说话,而是陪审团信谁的旧邮件和聊天记录。
锐评
这场审判走到陪审团阶段,说明双方都没能在庭前和解,现在把 OpenAI 的归属权交给 8 个普通人决定。Altman 出庭的表现被描述为“占上风”,但报道也提醒,证人席上的表现不一定能赢官司——陪审团最终看的是证据,不是口才。Musk 和 Altman 都在攻击对方可信度,这本身就说明书面协议存在模糊地带,否则不用打到这个地步。 FT 的报道点出了一个很实际的背景:OpenAI 正盯着千亿美元级别的 IPO,而这场在奥克兰陪审团房间里做出的裁决,会直接决定这家公司到底属于谁、以什么结构上市。Verge 的评论更直接,认为无论谁赢,都证明 AI 行业被错误的人领导。 目前公开报道主要围绕庭审戏剧性展开,对 Musk 当初到底承诺了什么、有没有书面协议、OpenAI 非营利转营利的具体条款这些关键事实披露有限。判决出来之前,所有“谁更有理”的判断都得先打个折。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
00:00
32d ago
● P1AI HOT 精选· aihot-apiZH00:00 · 05·18
Cursor 发布编程模型 Composer 2.5
Cursor 把代码助手 Composer 升级到了 2.5 版,底层还是基于月之暗面的 Kimi K2.5 开源模型。这次主要做了三件事:一是用“文字反馈强化学习”,在模型犯错的地方直接插一句提示(比如“提醒:可用工具有这些”),让模型在那个点上学会纠正,而不是靠最后的总分去猜哪里做错了;二是把合成训练数据的量提到了上一代的 25 倍,并且动态生成更...
#Agent#Code#Fine-tuning#Cursor
精选理由
HKR 三项都踩中了:Cursor 本身就是编程助手的核心入口,文章又给了 Moonshot 基座、25 倍合成数据、文本反馈 RL 和分片 Muon 这些实打实的训练细节。我会先打个折——正文没给基准测试、没提价格,也没说用户端能力边界,所以分数卡在 78–84 这个区间是合理的。
一句话点评
Cursor 把编程模型 Composer 2.5 放出来了,跑分涨了,还专门训了模型的沟通风格和“别瞎忙活”的节奏。
锐评
Cursor 这次更新 Composer 2.5,核心不是换了个更强的底座模型,而是把训练方法做了升级。它还是基于 Kimi K2.5 的开源检查点,但用了两个新招:一是“带文字反馈的定向强化学习”,说白了就是模型在干活过程中哪句话说错了、哪个工具用错了,直接在出错的地方插一句提示当老师,让模型只改那个点,而不是等整件事干完再给个模糊的总分。这对纠正代码风格、减少无效工具调用这类局部毛病很管用。二是用 25 倍于上一代的合成任务来练,动态挑更难的题,防止模型刷分刷到天花板。 官方给的跑分表确实涨了,但更值得看的是他们放出的“努力曲线”图——模型在长任务里更稳,不会干到一半开始摸鱼或过度折腾。正文没披露具体延迟和成本变化,也没说这个模型在真实项目里的通过率比 2.0 高多少。另外,他们提到正和 SpaceXAI 用百万张 H100 级别的算力从头训一个更大的模型,那才是真正的下一代,2.5 更像是一次训练工程上的中期升级。
HKR 分解
hook knowledge resonance
打开信源
97
SCORE
H1·K1·R1

更多

频道

后台