ax@ax-radar:~/feed $ tail -f signal.log
40 srcsignal 12%cycle 04:32

热点聚合 · 2026-05-05

42 signals · updated 3m ago
live · 238 today·policy v2
AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·
RSS live
2026-05-05 · 星期二2026年5月5日
20:43
44d ago
● P1FT · 科技· rssEN20:43 · 05·05
Apple因延迟推出AI Siri功能达成2.5亿美元和解
苹果同意支付 2.5 亿美元,和解一桩因为宣传了“AI Siri”功能但迟迟没上线的集体诉讼。起诉方是买了 iPhone 的用户,他们认为苹果 2024 年的营销广告夸大了 Siri 的智能程度,实际功能却一直没推。目前这篇报道正文被付费墙挡住,看不到和解的具体覆盖范围、法院文件细节,以及苹果到底什么时候会把这些功能补上。
#Agent#Apple#Incident#Product update
精选理由
FT 报道苹果就延迟的“AI Siri”达成 2.5 亿美元和解。H 是法律层面的转折,K 有具体金额和 2024 年的宣传事实,R 踩中了 AI 功能交付风险这个行业痛点。不过赔付范围等信息缺失,所以重要性没给到 85 以上。
一句话点评
苹果画了个AI Siri的饼没兑现,现在要花2.5亿美元和解,这钱主要赔给买过特定iPhone的用户。
锐评
苹果因为推迟推出宣传过的AI Siri功能,同意支付2.5亿美元和解集体诉讼。这笔钱说明苹果在AI落地节奏上确实翻了车,而且翻得挺贵。和解方案覆盖的是购买特定iPhone机型的用户,具体哪些型号和每人能拿多少,目前公开报道里没写清楚。另外,苹果到底什么时候能把当初承诺的AI Siri功能推出来,正文也没给出新时间表。所以这事本质上是苹果为过度承诺买单,但用户真正关心的“智能Siri什么时候能用”依然没答案。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
20:39
44d ago
● P1彭博科技· rssEN20:39 · 05·05
中国阻止Meta二十亿美元收购Manus AI交易
彭博社在 5 月 5 日的一期播客里提到,北京方面拦下了 Meta 收购 Manus AI 的交易,报价是 20 亿美元。播客片段没讲监管层具体用什么理由否决,也没披露交易条款和 Manus AI 到底做什么业务。想知道为什么被拦,得去听完整期节目,光看这个页面信息不够。
#Meta#Manus AI#Bloomberg#Policy
精选理由
Bloomberg 播客摘要说北京阻止了 Meta 收购 Manus AI,20 亿美元的价码摆在那,但正文没解释为什么拦、交易怎么设计的、Manus 具体做什么。我会先打个折,因为关键信息缺失,没法判断是纯监管原因还是有其他考量。冲突性和话题度够高,但细节太少,所以放在 featured 而不是头条。
一句话点评
中国直接叫停了Meta对Manus AI的二十亿美元收购,这比单纯的投资审查更重,等于把一家中国AI创业公司的退出通道堵死了。
锐评
这笔交易被否,最直接的影响是Manus AI没法走“卖给大厂”这条路了。二十亿美元的报价说明Meta很想要它的团队或技术,但中国监管层显然认为这涉及关键技术外流。文章把这件事拔高到“全球AI竞赛转折点”,这个判断我先打个折——目前看更像个案,还没看到成文的系统性封锁政策。 文章没披露Manus AI具体做什么、团队规模多大,也没说清否决的具体法律依据。这些信息缺口让“信号意义”的讨论有点虚。对AI从业者来说,更实际的信号是:如果你在做底层模型或数据基建,未来想拿美元基金然后卖给美国巨头,这条路可能越来越窄。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
19:45
44d ago
● P1The Verge · AI· rssEN19:45 · 05·05
Apple 计划在 iOS 27 允许用户选择第三方 AI 模型
Mark Gurman 爆料,苹果计划在 iOS 27、iPadOS 27 和 macOS 27 里开放“扩展”机制,让第三方聊天机器人接管 Siri、写作工具和图片生成这些系统级功能,不再只绑死 ChatGPT。用户能把自己常用的模型设成默认。不过原文没提会支持哪些模型、怎么收费、开发者接口长什么样,这些关键信息都还缺着,先别太激动。
#Agent#Tools#Multimodal#Apple
精选理由
HKR 三项都成立:系统级模型选择器是个强钩子,也给了具体的 Extension 落点。打 80 分是因为正文没披露支持哪些模型、怎么收费、开发者接口长什么样,目前还只是一份路线图爆料,我会先打个折。
一句话点评
苹果可能在 iOS 27 里让你自己选默认 AI 模型,不再只绑 ChatGPT。但正文没披露具体支持哪些模型、怎么审核,先别太激动。
锐评
这条消息的核心是苹果在系统层面松绑了 AI 模型的选择权。以前 Siri 和 Apple Intelligence 的后台基本是 ChatGPT 一家独大,现在 iOS 27 可能会像换默认浏览器一样,让你把 Gemini 或别的模型设成主力。这对用户是好事,不用被一家模型绑死;对开发者来说,意味着苹果的 AI 生态会从封闭走向半开放,第三方模型有机会直接进入 iPhone 的系统级交互。 不过,目前信息全来自 The Verge 和 TechCrunch 对苹果计划的转述,没有官方确认,也没有给出技术实现细节。最关键的两点都没说清楚:一是苹果会开放到什么程度——是只允许几个合作方上架,还是真的像 App Store 一样让开发者提交模型?二是隐私和审核机制怎么做,本地运行和云端调用的比例怎么分。这些直接决定了这个功能是实质开放还是做做样子。 另外,报道里没提这个功能是否只限海外,国内用户能不能用、能用哪些模型,都是未知数。如果苹果只是把选择权限制在几家已合作的巨头之间,那对生态的冲击就小很多。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
16:09
44d ago
● P1FT · 科技· rssEN16:09 · 05·05
五大出版集团起诉 Meta 和扎克伯格侵犯版权用于训练 Llama 模型
五家主要出版集团把 Meta 和扎克伯格告了,理由是 Meta 在训练 Llama 系列模型时,未经授权就用了他们受版权保护的作品。目前这篇 FT 报道正文被付费墙挡住,只显示了标题和摘要片段,所以具体涉及多少本书、索赔金额、在哪个法院起诉、以及 Meta 到底是通过什么方式把这些书喂给模型的,这些关键信息正文都没披露。
#Fine-tuning#Safety#Meta#Mark Zuckerberg
精选理由
这条消息我会先打个折——正文只是 RSS 摘要,没披露涉案作品数量、索赔金额、具体法院和训练数据怎么被抓包的机制,信息缺口不小。但五家出版集团联手告 Meta 和 Zuckerberg,矛头直指 Llama 的训练语料,这事本身够硬。对做模型的人来说,训练数据到底能不能用、用了要付多少钱、会不会被告,是每天都在算的账。这点先别太激动,等起诉书细节出来再看授权边界怎么划,但眼下值得放进必读。
一句话点评
五大出版集团告 Meta 用盗版书训练 Llama,FT 正文被付费墙挡了,具体证据和诉求看不到。
锐评
这起诉讼的核心指控是 Meta 在训练 Llama 模型时,未经授权使用了大量受版权保护的书籍。从现有信息看,出版方认为模型能“逐字复制”原文,这直接触及了 AI 训练数据合法性的老问题。但关键细节全卡在 FT 的付费墙后面,比如原告具体拿出了哪些“逐字复制”的证据、索赔金额是多少、以及诉讼是在哪个法院提起的,这些目前都看不到。 我会先打个折,因为“逐字复制”这个说法在技术上有多种可能:可能是模型真的背下了训练数据,也可能是提示词故意诱导出来的。没有诉状原文,很难判断出版方的证据有多硬。另外,把扎克伯格个人也列为被告,是一种施压策略,但最终能否成立要看是否有证据证明他个人直接决策了数据使用方式。 这条新闻值得跟,但眼下缺的信息太多。需要等诉状公开,看具体侵权书目清单和“逐字复制”的实例,才能判断这案子是雷声大还是真有杀伤力。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
16:01
44d ago
● P1r/LocalLLaMA· rssEN16:01 · 05·05
Google 发布 Gemma 4 MTP 模型加速推理技术
Google 在 Hugging Face 上放了 4 个 Gemma 4 的 MTP 检查点。MTP 的做法是拿一个小号草稿模型一次预测好几个 token,再由主模型并行验证,相当于让模型“先猜后验”,最终解码速度能提一倍,而且输出质量跟原来一模一样。不过 Reddit 原帖被网络策略挡了,正文没披露具体模型尺寸、硬件要求或实测延迟数据。
#Inference-opt#Google#Hugging Face#Gemma
精选理由
H、K、R 都站得住:钩子是 2 倍低延迟解码,有检查点和机制说明,不是画饼。它不是旗舰模型发布,属于实用更新,75 分放在 featured 低位合理。
一句话点评
Google 给 Gemma 4 加了多 token 预测(MTP),一次猜多个词来提速,但 Reddit 帖子被屏蔽,正文没披露具体加速数据和硬件条件。
锐评
这条消息本身很简单:Google 把多 token 预测(MTP)技术用到了 Gemma 4 上。MTP 的原理是让模型一次预测后面好几个词,而不是传统的一个一个往外蹦,这样在生成阶段可以明显减少推理步数,理论上能提速。但 Reddit 原帖被网络屏蔽,正文内容完全看不到,只有标题提到“MLX”,暗示有人在苹果芯片上用 MLX 框架跑通了。关键信息全缺:到底加速了多少百分比?在什么卡上测的?显存占用有没有变化?这些数字没有,就没法判断是实打实的省钱,还是实验室里的纸面优化。另外,MTP 通常需要额外的输出头,模型体积会变大一点,这部分代价原文也没提。想跟的人建议直接去 Hugging Face 搜 Gemma 4 的模型卡,看官方有没有放出 benchmark。
HKR 分解
hook knowledge resonance
打开信源
85
SCORE
H1·K1·R1
11:30
44d ago
● P1FT · 科技· rssEN11:30 · 05·05
Google、xAI与Microsoft同意接受美国AI模型国家安全审查
三家大模型公司跟美国政府达成了协议,以后发布新模型前要先过一道国家安全审查。起因是 Anthropic 最新的 Mythos 模型让官方有些紧张。不过这篇报道正文被付费墙挡住了,具体怎么审、审哪些模型、什么时候开始执行,这些关键细节都没披露。
#Safety#Google#xAI#Microsoft
精选理由
我会先打个折:正文只说了三家同意审查,起因是 Anthropic 的 Mythos 模型引发了担忧,但怎么审、审哪些模型、什么时候开始,全都没写。所以这条消息更像一个政策风向标,而不是一份可操作的合规指南。对从业者来说,知道大厂开始接这种审查就够了,具体影响还得等细节出来再判断。
一句话点评
三家大模型公司同意让美国政府在新模型发布前先做安全审查,但具体怎么查、查到什么程度,正文没披露。
锐评
Google、xAI 和微软跟美国政府谈妥了一件事:以后他们最前沿的 AI 模型在公开之前,会先交给政府做一轮国家安全审查。这相当于给模型上市加了一道“政审”环节,不再是公司自己说了算。目前只有这三家公开同意,OpenAI 和 Meta 还没表态。 不过,FT 的原文被付费墙挡住了,我们看不到审查的具体标准、流程,也不知道政府有没有权力叫停发布。从标题和已知信息判断,这更像是一个自愿性质的合作框架,而不是强制法规。对从业者来说,这意味着未来在美国发布大模型,合规成本可能会增加,发布节奏也可能变慢。 现在还缺几个关键信息:审查到底看什么(是模型能力上限、数据安全,还是输出内容风险),以及如果审查不通过,公司能不能强行发布。这些没搞清楚之前,先别急着下结论说行业要变天。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
10:00
44d ago
● P1OpenAI 博客· rssEN10:00 · 05·05
OpenAI发布GPT-5.5 Instant作为ChatGPT新默认模型
OpenAI 把免费用户和默认聊天用的模型升级到了 GPT-5.5 Instant。官方说这次更新主要干了三件事:回答更靠谱、更简洁,并且更能利用你之前聊过的上下文来贴合你的偏好。内部测试里,在医疗、法律、金融这类高风险问题上,GPT-5.5 Instant 比上一代 GPT-5.3 Instant 的幻觉内容少了 52.5%;在用户举报过的事实错误对...
#Reasoning#Alignment#Memory#OpenAI
精选理由
HKR 三项全中:OpenAI 把 ChatGPT 默认模型切到了 GPT-5.5 Instant,说答案更准、幻觉更少、个性化控制更好,但没给任何评测数字、价格或上下文窗口,我会先打个折。这点先别太激动,等看到实测再判断。
一句话点评
OpenAI把ChatGPT默认模型换成了GPT-5.5 Instant,主要提升是回答更准、更简洁,幻觉少了52.5%,但官方没给独立评测和延迟数据。
锐评
这次更新最实在的数字是:在高风险领域(医疗、法律、金融)的幻觉率比上一代降了52.5%,在用户标记过的刁钻问题上错误也少了37.3%。OpenAI还放了个代数题的例子,展示新模型能自己发现推导错误并纠正,而不是像旧版那样直接判“无解”。这点挺直观,说明模型在推理时多了一层自我检查。 不过得打个折:这些全是内部评测,没有第三方基准或外部验证。文章也没提推理速度和成本变化,对开发者来说这两项跟准确率一样重要。另外,“更简洁”和“更个性化”目前只有定性描述,没给出具体指标,比如回复长度缩短了多少、用户满意度提升了多少。 如果是真的,免费用户和付费用户都能直接用上,覆盖面够大。但想判断它是不是日常干活更顺手了,还得等实际用一阵子,看看在长对话和复杂任务里会不会翻车。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
05:11
44d ago
● P1新智元 · 公众号· rssZH05:11 · 05·05
OpenAI总裁Brockman庭审承认零现金获近300亿美元股权
Greg Brockman 在法庭上承认,他获得 OpenAI 营利性子公司的股权时,自己没出任何现金。这部分股权现在价值超过 200 亿美元,接近 300 亿美元。听证会还挖出他和 Sam Altman 都持有芯片公司 Cerebras 的股份,而 OpenAI 先给了 Cerebras 一份 100 亿美元的订单,后来又追加到 200 亿美元,中间...
#Safety#Alignment#OpenAI#Greg Brockman
精选理由
我会先打个折:信息来自单一庭审爆料,标题带点煽风点火的味道,但核心事实够硬——没投现金却拿天价股权、高管同时持有供应商股份、订单金额从100亿翻到200亿,这些数字把OpenAI非营利转营利的合规问题钉得很死。正文没披露交叉持股的具体比例和贷款条件,但现有信息已经足够让从业者重新审视这家公司的治理结构。
一句话点评
OpenAI总裁在法庭上承认,自己没掏一分钱就拿到了价值近300亿美元的股权,马斯克的律师正逼他退回来。
锐评
这条新闻最扎眼的地方是“零现金换近300亿美元股权”。OpenAI总裁Brockman在庭审中亲口确认,他个人没出钱就获得了这笔股份,目前估值约290亿到300亿美元。马斯克那边的律师抓住这点猛打,要求他把股权退还给公司。 先别急着下结论说这就是“认罪”。庭审证词只是确认了出资事实——Brockman确实没拿现金换股,但这在初创公司里不算罕见,早期核心成员常以技术、劳务或创始身份拿到股份。关键争议在于,OpenAI从非营利转向营利的过程中,这种安排是否违反了当初对捐赠者和公众的承诺。 目前报道没披露Brockman具体用什么贡献换的股权,也没说清楚这300亿估值是按哪轮融资算的。庭审还在进行,马斯克一方能不能真把股权要回来,还得看后续法官怎么认定公司性质转变的合法性。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
03:59
44d ago
● P1机器之心 · 公众号· rssZH03:59 · 05·05
xAI的55万块英伟达GPU利用率仅11%
The Information 的报道说,xAI 手里大概 55 万张英伟达 GPU,但模型浮点运算利用率(MFU)只有 11%,折算下来相当于真正在干活的卡就 6 万张左右。文章把锅甩给了 HBM 显存读写、服务器之间通信、训练时空等和软件栈不统一这几个问题。作为对比,Meta 的利用率是 43%,Google 是 46%。不过原文因为微信环境验证失...
#Inference-opt#Agent#xAI#Nvidia
精选理由
这篇不是模型发布或产品更新,是实打实的基础设施效率爆料。55万卡对11%利用率这个对比本身就够抓人,再加上Meta和Google的43%、46%做参照,信息密度高。我会先打个折:正文没披露xAI具体怎么算的MFU,也没说这个11%是瞬时值还是长期均值,但瓶颈拆解(HBM、跨节点通信、软件栈)让文章站得住脚,所以给到82分。
一句话点评
xAI 55 万块 H100 集群,实际干活的比例只有 11%,相当于花大钱建了个超级电厂,结果大部分时间在空转。
锐评
这条消息最值得关注的点不是马斯克“摸鱼”,而是 55 万块 GPU 只跑出 11% 的利用率,说明超大规模集群的工程调度和故障恢复远比想象中难。11% 这个数字来自一篇未公开全文的微信文章,正文被环境验证挡住,看不到原始出处和统计口径——是瞬时利用率还是月均?算的是训练、推理还是包含闲置待命?这些都没披露。如果 11% 是常态,那意味着绝大多数算力在等待数据、等待 checkpoint 同步,或者卡在硬件故障上。对从业者来说,这比“囤卡”本身更值得追问:当集群大到一定程度,网络、存储、散热和调度系统的瓶颈会让边际收益急剧下降。目前信息缺口很大,先别急着下结论,等看到具体技术报告再判断是工程问题还是统计花招。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
03:59
44d ago
● P1机器之心 · 公众号· rssZH03:59 · 05·05
Anthropic 联创预测:2028 年底前 AI 自己搞研发的概率超六成
Anthropic 联合创始人 Jack Clark 给了个时间点:到 2028 年底,AI 脱离人类独立做研发的概率超过 60%。他拿几个基准测试当证据——Claude Mythos Preview 在软件工程测试 SWE-Bench 上跑到 93.9%,Opus 4.5 在评估 AI 复现研究能力的 CORE-Bench 上拿到 95.5%。Cla...
#Agent#Code#Benchmarking#Anthropic
精选理由
我会先打个折:标题里的“自我进化”和“没有人类了”是媒体写法,Clark 原文说的是无人类参与的 AI 研发概率,不是奇点降临。但他作为联创,拿内部模型跑出来的基准分来押 2028 这个时间点,分量不一样。SWE-Bench 93.9% 说明代码修 bug 这类短任务已经很高,CORE-Bench 95.5% 测的是复现论文的工程能力,真正该盯的是 MLE-Bench 和 PostTrainBench——这两个才碰得到长周期、需要自己调参和做后训练的任务,目前正文没给具体分数,这点先别太激动。整体看,他是在用基准曲线推 timeline,不是纯拍脑...
一句话点评
Jack Clark 给了个 2028 年 AI 独立研发的预测,但正文被微信验证页挡住了,关键证据和上下文都看不到,先打个折。
锐评
Anthropic 联合创始人 Jack Clark 放了个时间点:到 2028 年底,AI 脱离人类独立做研发的概率超过 60%。他拿几个基准测试当证据——Claude Mythos Preview 在软件工程测试 SWE-Bench 上跑到 93.9%,Opus 4.5 在评估 AI 复现研究能力的 CORE-Bench 上拿到 95.5%。这些数字确实高,说明模型在写代码和复现实验这类长链条任务上越来越能打。 但问题在于,正文被微信的验证页面挡住了,我们看不到 Clark 具体怎么从这些基准分数推到 60% 这个概率的。SWE-Bench 和 CORE-Bench 测的是特定任务,离真正的独立研发——自己提假设、设计实验、迭代试错——还有多远,正文没披露。另外,Clark 强调信号来自任务时长和后训练能力,而不是什么奇点叙事,这点倒是务实,但具体怎么定义“独立研发”也没说清楚。 还缺几样东西:Clark 这个预测是正式论文里的结论还是随口一说?有没有同行评审或外部验证?60% 这个数字是怎么算出来的,还是纯主观判断?这些信息缺口不补上,这条新闻就只能当个观点看,别急着当趋势。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1

更多

频道

后台