ax@ax-radar:~/feed $ tail -f signal.log
40 srcsignal 12%cycle 04:32

热点聚合 · 2026-05-16

30 signals · updated 3m ago
live · 238 today·policy v2
AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·
RSS live
2026-05-16 · 星期六2026年5月16日
18:56
33d ago
● P1AI HOT 精选· aihot-apiZH18:56 · 05·16
Eric Jang 从零实现 AlphaGo 训练框架和成本分析
Eric Jang 花了几个月从零实现 AlphaGo,并把过程写成教程和代码放了出来。他原本的理解是“用自我对弈训练的搜索增强神经网络”,但亲手做一遍后对细节有了更深体会。他给出一条关键判断:前沿研究仍然很贵,但特定能力的落地成本掉得很快——到 2026 年,训练一个能打的围棋 AI 租算力只要几千美元,不再需要 DeepMind 级别的资源。他自称...
#Reasoning#Code#Eric Jang#AlphaGo
精选理由
我会先打个折:这是个人分享,不是论文或模型发布,所以信息密度有限。但亮点很明确——Eric Jang 一个人花几个月从零把 AlphaGo 做出来,还给了个具体成本判断:2026 年租算力训强围棋 AI 只要几千美元。这个数字直接说明当年需要大团队、大预算的系统,现在个人和小团队也能碰了。正文没披露具体训练配置和模型强度验证,所以“强”到什么程度还不好说,这点先别太激动。整体适合当一条有话题、有数字、对从业者有参考价值的动态来推。
一句话点评
Eric Jang 用休假时间从零复现了 AlphaGo,并公开了训练成本。这比看论文更实在,能直接摸清当年那套搜索加自我对弈在今天到底要花多少钱。
锐评
Eric Jang 在播客里聊了他从零搭建 AlphaGo 的过程,核心是想搞懂深度神经网络怎么把极其耗时的树搜索“压缩”进一个十层网络里。他提到 AlphaGo 的蒙特卡洛树搜索能给出每一步的明确改进方向,这比现在大语言模型用的强化学习聪明得多——后者得从几万个 token 里猜哪一步做对了,效率极低。 这次复现最有价值的是他顺带做了成本分析,让我们能直观对比 2016 年的烧钱玩法和现在的开销。不过,正文没披露他具体用了什么显卡、花了多少电费或租了多少云实例,只说了是基于现代工具重写。这点信息缺口挺关键,因为成本数字直接决定个人开发者或小团队能不能玩得起这套流程。 另外,他还试了用 AI 自动调参跑实验,发现让模型写代码、调超参已经很顺,但选研究方向、跳出死胡同这类需要“品味”的活,AI 目前还干不了。这个判断很实在,别被“AI 研究员”的噱头带偏,它现在更像一个任劳任怨的实习生,而不是能拍板课题的导师。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
12:15
33d ago
● P1r/LocalLLaMA· rssEN12:15 · 05·16
MTP 支持合并至 llama.cpp 主分支
llama.cpp 的 master 分支合并了 PR #22673,正式加入 MTP(Multi-Token Prediction)支持。MTP 让模型在推理时一次预测多个后续 token,而不是逐个生成,理论上能降低解码延迟。不过正文没披露具体支持哪些模型、有没有 benchmark 数据、以及合并到了哪个正式版本。如果你跑本地模型,可以关注后续 ...
#Inference-opt#llama.cpp#ggml-org#Open source
精选理由
MTP 支持合并进 llama.cpp 主分支,对本地推理玩家是个直接可用的更新——从 main 分支编译就能跑。但正文只有 RSS 摘要,没披露 MTP 的具体机制(比如是单头还是多头预测)、支持哪些模型、实测能快多少,也没给发布版本号。信息缺口明显,所以分数压在 68 合理:有钩子、有新事实、有触达面,但验证和细节全缺,属于小规模开源推理优化更新。
一句话点评
llama.cpp 主分支正式合并 MTP 支持,本地跑 DeepSeek 类模型推理速度能提一截。
锐评
MTP(多 token 预测)被合进 llama.cpp 主分支,意味着以后用这个推理引擎跑 DeepSeek-V2/V3 这类模型时,可以一次预测多个 token,而不是一个一个字往外蹦。对本地部署的人来说,最直接的好处是生成速度变快、延迟更低。社区讨论里有人提到 b9180 这个构建版本已经落地,说明代码不是停留在 PR 阶段,而是真能用了。 不过目前信息主要来自 Reddit 帖子标题和合并记录,正文被屏蔽,看不到具体实现细节和性能对比数据。比如到底快了多少、显存占用有没有变化、支持哪些量化格式,这些关键数字都缺失。另外 MTP 对输出质量是否有影响,社区也没展开讨论。 想尝鲜的话可以更新 llama.cpp 试试,但建议先在自己常用的模型上跑一遍对比,别急着上生产环境。等有人放出实测数据,再判断这个合并的实际收益有多大。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
12:06
33d ago
● P1Hacker News 首页· rssEN12:06 · 05·16
SANA-WM开源世界模型发布 可生成一分钟720p可控视频
NVIDIA 放出了一个叫 SANA-WM 的开源模型,参数规模 26 亿,主打的是用一张图加一条镜头移动路线,直接生成长达一分钟的 720p 视频。它把长视频生成拆成两步:先用一个混合线性注意力的主干网络跑出长序列粗稿,再用一个 170 亿参数的精修模型去改善纹理、动作和后半段的画质。训练成本不算高,64 块 H100 跑 15 天,用了约 21.3...
#Multimodal#Vision#NVIDIA#Open source
精选理由
标题说 SANA-WM 是个 2.6B 参数的开源世界模型,能生成 1 分钟 720p 视频。我会先打个折:正文只给了链接、9 分和 8 条评论,训练数据、许可证、推理成本、跟其他模型的对比跑分全都没披露。2.6B 这个尺寸在视频模型里算小的,如果真能稳定跑一分钟不崩,推理成本可能比较友好,但这点先别太激动,因为没看到任何实测证据。开源是个加分项,不过没写是什么许可证,商用能不能用还不清楚。整体看,这是个有话题度的发布,但信息缺口很大,实际能力得等更多细节出来才能判断。
一句话点评
NVIDIA 开源了一个 26 亿参数的世界模型,一张图加镜头轨迹就能在单张显卡上生成一分钟 720p 可控视频,但模型权重还没放出来。
锐评
SANA-WM 把长视频生成的门槛打下来了。它用 26 亿参数的小模型,在单张 H100 上就能跑出一分钟 720p 视频,甚至还有个蒸馏版能在 RTX 5090 上用 34 秒搞定。对比它提到的 LingBot-World 等工业级方案,吞吐量号称高了 36 倍,训练也只用了 64 张 H100 跑 15 天,成本确实低。 能这么省,核心在于它把注意力机制做了混合设计:逐帧用轻量的 Gated DeltaNet,隔一段时间才做一次完整的 softmax 注意力,显存不会随着视频变长而爆炸。另外它专门加了一个双分支模块来控制 6 自由度镜头轨迹,让画面跟着指定路径走,不是随机乱飘。 不过先别太激动。正文明确说模型权重还是“soon”的状态,没得下载跑不起来。另外它只用了约 21.3 万段公开视频训练,这个数据量对世界模型来说不算大,泛化能力要打问号。演示视频全是固定视角的慢速自然场景,没看到快速运动或复杂交互,实际可控性还得等开源后自己测。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
08:52
33d ago
● P1AI HOT 精选· aihot-apiZH08:52 · 05·16
研究员用Anthropic Mythos工具六天破解苹果M5芯片内存完整性保护
苹果在 M5 和 A19 芯片上花五年做的 MIE 内存完整性保护,被三个研究员用 Anthropic 的 Mythos 工具攻破了。他们 4 月 25 日发现漏洞,5 月 1 日就写完利用程序,全程只用了六天。攻击手法是纯数据攻击,不碰指针,靠普通用户权限的标准系统调用就能拿到 root 权限。团队已经当面把报告交给了苹果。完整技术细节要等苹果发补丁...
#Agent#Code#Safety#Anthropic
精选理由
我会先打个折:正文只提了三位研究人员和 Mythos 工具,没披露漏洞是否已报给苹果、Mythos 具体怎么辅助的、以及 Anthropic 的回应,所以信息有缺口。但 6 天从发现到完成内核漏洞利用、绕过 M5/A19 的 MIE 并拿到 root,这个速度和效果本身就很说明问题——AI 辅助攻击开发的门槛在降。对从业者来说,这比单纯说“AI 不安全”更有冲击力,因为直接落在具体芯片和系统上。H/K/R 全过,但单篇来源和缺少后续处理信息,让我没给到 85 分以上。
一句话点评
Anthropic 的安全研究工具 Mythos 帮研究员六天挖出两个苹果 M5 芯片的内核漏洞,直接绕过了内存完整性保护。但正文没披露漏洞具体细节和苹果的回应。
锐评
这条消息的看点不是 Anthropic 又发了个模型,而是他们用自家工具 Mythos 干了件很实际的事:在六天内找到并利用了两个 macOS 内核未知漏洞,成功绕过了苹果 M5 芯片的内存完整性保护机制。内存完整性保护可以理解为芯片层面的一道硬锁,防止恶意代码篡改内核数据,绕过它意味着攻击者能在系统最底层执行任意代码。 目前的信息都来自 RSS 摘要,正文是空的,所以没法判断漏洞的严重等级、利用条件苛刻与否,也不知道 Anthropic 是否按常规漏洞披露流程提前通知了苹果。标题里“五天内”和“六天”的差异,可能是不同来源统计口径不同,但都指向同一个事实:自动化漏洞挖掘的效率在提高。 对从业者来说,这条消息的价值在于它提供了一个具体案例,说明 AI 辅助安全研究正在从理论走向实战。但别急着下结论说“AI 已经能独立挖漏洞了”,工具还是需要研究员来操作和决策。还缺的关键信息是:漏洞是否已被修复、Mythos 这套工具对外部研究者的开放程度,以及这种效率提升对防守方意味着多大的压力。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
06:31
33d ago
● P1新智元 · 公众号· rssZH06:31 · 05·16
OpenAI大规模重组由总裁Brockman主导
标题说 OpenAI 大规模重组,总裁 Brockman 掌权。但正文只显示微信验证页,没披露重组范围、汇报线、涉及团队、决策过程和时间表。信息缺口很大,目前只能当传闻看。
#OpenAI#Brockman#Personnel
精选理由
硬排除-零信源:标题声称OpenAI大规模重组,但正文没有任何可验证的组织事实,连正文本身都不存在。H和R通过,但K不通过,不能作为重大人事新闻打分。
一句话点评
OpenAI 总裁 Brockman 亲自接管产品,要把所有 AI 代理业务整合成一个平台。这轮高管换血说明他们急了,但正文没披露具体产品路线图,先别太激动。
锐评
OpenAI 又换高管了,这次是联合创始人兼总裁 Greg Brockman 亲自下场抓产品,目标是把公司所有“让模型进业务流程干活”的 AI 代理业务,整合成一个统一的平台。从 The Verge 的报道看,Brockman 在内部备忘录里明确说要“投资单一代理平台”,这基本等于承认之前多条业务线各自为战,现在要集中火力。 这次调整的背景是 AI 代理领域的竞争已经白热化,谷歌、Anthropic 都在猛推类似产品。OpenAI 频繁换将,说明他们对目前的推进速度不满意。但报道里没提这个新平台具体长什么样、什么时候上线、跟现有的 ChatGPT 插件或 Assistant API 是什么关系。这些关键信息都缺着,所以这次重组到底是真能提速,还是又一次内部权力洗牌,现在下不了判断。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K0·R1
04:04
33d ago
● P1量子位 · 公众号· rssZH04:04 · 05·16
阿里健康发布医疗AI青灵子 接入BMJ十年期刊文献
阿里健康发布了一款叫“青灵子”的医疗 AI,目标用户是中国 500 万医生。它直接拿了 BMJ 集团旗下 70 本期刊过去十年的全文内容做知识底子,不是只搜摘要。回答问题时,模型会按 PICO 框架(把临床问题拆成患者、干预、对照、结局)和 GRADE 证据分级来走流程,相当于先框定问题结构再给答案,而不是自由发挥。产品还拉了 300 多位临床专家做审...
#RAG#Reasoning#Safety#Alibaba Health
精选理由
阿里健康把BMJ的期刊库直接做成回答的证据底座,再用临床专家评审兜底,等于在“模型胡说”和“医生不敢用”之间加了一层硬约束。正文没披露评审通过率、更新频率和实际延迟,这些会直接影响医生愿不愿意买单。我会先打个折:方向对,但落地效果还得看真实诊疗场景的反馈。
一句话点评
阿里健康推了个叫“青灵子”的医疗AI,主打卖点是接了BMJ十年期刊文献当证据源,但正文没披露具体评测数据和临床验证结果,这点先别太激动。
锐评
这条新闻的核心卖点是“证据源”——阿里健康的医疗AI“青灵子”直接接入《英国医学杂志》(BMJ)过去十年的期刊文献,想用顶级循证证据把自己和市面上其他医疗大模型区分开。机器之心那篇稿子提到一个数字:有医生88天登录了193次,想说明产品粘性高,但样本量只有一个人,完全不能代表500万中国医生的使用情况。 两篇报道都来自科技媒体,不是医疗专业期刊或第三方评测机构,所以目前只能看到厂商宣传的“独家合作”和“顶级证据”,看不到任何关于回答准确率、误诊率、科室覆盖范围的独立验证数据。医疗AI最要命的就是安全性和可靠性,光说接了BMJ不够,得说清楚模型在真实问诊场景下到底表现怎么样。 还缺几个关键信息:第一,BMJ文献是实时更新还是定期导入,更新延迟多久;第二,模型是通用大模型加RAG(外挂资料库)方案,还是专门用医学数据训练过;第三,有没有做过和医生诊断的对照实验。这些没披露之前,只能把它当成一个“声称有更好资料来源的医疗问答工具”,离“神助攻”还有距离。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
00:00
34d ago
● P1Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·16
OpenAI通过Plaid让ChatGPT接入银行账户
ChatGPT 在美国向 Pro 用户开放了个人理财功能预览,通过 Plaid 连接银行账户后,能读取余额、交易记录和投资持仓,回答消费和储蓄问题。文章指出,OpenAI 的隐私承诺存在两个关键缺口:理财对话未被列入广告敏感话题排除清单,意味着消费和贷款讨论可以触发广告匹配;财务数据的模型训练默认是 opt-in,用户需主动关闭。作者认为,这个功能的主...
#Tools#OpenAI#Plaid#ChatGPT
精选理由
我会先打个折:正文只说了 OpenAI 通过 Plaid 让 ChatGPT 连接银行账户,没披露上线时间、授权流程和可访问的数据范围,所以这更像一个信号而不是一个可评估的产品更新。但信号本身够强——让模型直接碰银行数据,权限和安全的坑一个都不少,从业者看到标题就会想点进去看细节。HKR 三项都踩中了,只是信息缺口把分数压在 featured 档,没往上走。
一句话点评
ChatGPT 要接你的银行账户了,用的是 Plaid 这个中间人,能看余额和流水但不能转账。
锐评
OpenAI 给 ChatGPT 开了个新口子:通过 Plaid 直接读你的银行账户数据。Plaid 就是那个很多金融 App 背后负责安全连接银行的中间件,所以技术上不是 OpenAI 自己存你的密码,而是你授权 Plaid 把只读数据喂给 ChatGPT。能看余额、信用卡欠款、交易记录,但碰不了钱,没法转账或支付。 这件事的逻辑跟之前接健康数据一样——让模型拿到更私密的个人上下文,回答才能更贴你本人。比如你问“我能不能买这个沙发”,它能直接扫一眼账户说“你信用卡还欠着八千,建议下个月再说”。但正文没披露这些财务数据会不会被 OpenAI 用来训练模型,也没说数据在服务器上留多久。隐私政策这块目前是空的,这点先别太激动。 对从业者来说,这等于把 AI 助手往“个人 CFO”方向推了一步,但信任门槛比健康数据还高。银行账户是多数人最敏感的数字资产,一次数据泄露的代价远大于推荐错一家餐厅。OpenAI 能不能让用户放心把账本交出来,比技术接没接通更重要。
HKR 分解
hook knowledge resonance
打开信源
97
SCORE
H1·K1·R1
00:00
34d ago
● P1OpenAI 博客· rssEN00:00 · 05·16
OpenAI与马耳他合作向全体公民提供ChatGPT Plus
OpenAI 与马耳他政府宣布全球首个国家级合作:所有公民完成马耳他大学开发的 AI 素养课程后,可免费获得一年 ChatGPT Plus。课程教 AI 能做什么、不能做什么、怎么用,不设背景门槛。第一阶段 2026 年 5 月启动,由马耳他数字创新局负责分发。正文没披露覆盖多少人口、政府是否承担成本、以及课程具体时长。
#Tools#Safety#OpenAI#Malta
精选理由
HKR-H/K 通过:国家级 ChatGPT Plus 分发是一个真实的分发信号。HKR-R 偏弱,因为正文缺少覆盖人数、费用分摊、上线日期或采购矛盾,所以这条归入普通合作类。
一句话点评
马耳他成了全球第一个全民免费领 ChatGPT Plus 的国家,但得先上完 AI 素养课才能用一年。
锐评
OpenAI 和马耳他政府合作,给所有公民发一年免费 ChatGPT Plus,条件是先完成马耳他大学设计的一门 AI 素养课。这更像一次国家级的付费获客实验:用课程筛选用户,用补贴培养使用习惯。马耳他人口不到 60 万,成本可控,适合跑通“政府买单、全民普及”的模式。OpenAI 也借机把“智能像水电一样变成公共设施”的说法落地了一次。 不过,正文没披露 OpenAI 给马耳他的具体价格,也没说一年后公民是否要自己续费、数据隐私条款有没有特殊安排。课程内容、完成率和实际使用数据也都没给。这些缺口让“全民普及”的效果暂时没法验证。 另外,OpenAI 提到已在爱沙尼亚、希腊做教育合作,马耳他这次是把范围从学校扩到全体公民。如果后续能公布续费率、使用频次和课程通过率,才能判断这是真普及还是品牌活动。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R0

更多

频道

后台