ax@ax-radar:~/feed $ tail -f signal.log
40 srcsignal 11%cycle 04:32

热点聚合 · 2026-06-11

28 signals · updated 3m ago
live · 238 today·policy v2
AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·
RSS live
2026-06-11 · 星期四2026年6月11日
14:27
7d ago
● P1Hacker News 首页· rssEN14:27 · 06·11
小米开源代码生成模型MiMo Code
小米把 MiMo Code 开源了,这是一个专门写代码的模型。但正文没披露模型大小、用了什么数据训练、以及跑分结果,所以暂时没法判断它跟其他开源代码模型比怎么样。如果你打算试,建议先跑一下自己的测试用例。
#Code#Xiaomi#Open source
精选理由
小米把 MiMo Code 开源了,这是一个专门写代码的模型。但正文没披露模型大小、用了什么数据训练、以及跑分结果,所以暂时没法判断它跟其他开源代码模型比怎么样。如果你打算试,建议先跑一下自己的测试用例。
一句话点评
小米把代码模型开源了,MIT 协议随便用。但正文没披露模型尺寸、跑分和硬件要求,先别急着上车。
锐评
小米开源了一个叫 MiMo Code 的终端 AI 编程助手,版本号 V0.1.0,用 MIT 协议发布,意味着你可以拿去商用或改着玩,没什么限制。从名字和“终端”这个定位看,它应该是想在本地命令行里帮你补全、解释或生成代码,而不是云端 IDE 插件那一路。 现在最大的问题是信息缺口太大。三篇来源都只给了标题,正文是空的,我们不知道模型参数量多大、用什么基座训的、在 HumanEval 这类基准上跑分多少、支持哪些语言、内存占用和推理延迟怎么样。这些数字直接决定它能不能在笔记本上跑、补全速度跟不跟手、生成质量够不够用。如果是 1B 以下的小模型,本地跑确实省 API 钱,但能力上限要打个大问号;如果是 7B 以上,普通机器可能带不动。 另外也没看到跟同类开源终端工具(比如 continue.dev 接本地模型、或者 GitHub Copilot CLI)的对比,不知道差异化在哪。建议等官方放出技术报告或实测数据再判断值不值得装。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H0·K0·R0
12:11
7d ago
● P1彭博科技· rssEN12:11 · 06·11
OpenAI考虑大幅降价与Anthropic竞争用户
彭博引述知情人士消息,OpenAI 正在考虑大幅下调服务价格,因为他们预计对手 Anthropic 也会跟着降价。两家公司都在筹备上市,这波操作像是在 IPO 前先打一场价格战。不过正文只有一句话,没提具体降多少、什么时候开始、哪些产品会受影响。
#OpenAI#Anthropic
精选理由
OpenAI 在 IPO 前想靠降价抢 Anthropic 用户,话题本身够热,但彭博这篇正文就一句话,没数字、没时间、没产品范围。按规则,信息太薄就往下压一档,给 72 分,tier all。
一句话点评
OpenAI 在考虑大幅降价,但正文没披露具体降多少、什么时候降,先别太激动。
锐评
OpenAI 被曝正在考虑大幅下调付费模型的调用价格,直接原因是 Anthropic 那边也在准备降价抢用户。这条消息来自《华尔街日报》引述的知情人士,CNBC 做了转述,但两篇报道都没给出具体降价幅度、涉及哪些模型、以及什么时候生效。Gary Marcus 把这解读为 OpenAI 示弱,这个判断先打个折——降价在竞争里很常见,不一定等于技术落后,也可能是想用价格压住对手的增长势头。 真正值得看的是两点:第一,如果降价幅度确实“大幅”,说明两家头部公司都开始把模型当流量入口而不是高毛利产品来卖,这对下游做应用的公司是好事,但对靠 API 差价赚钱的中间层会是压力。第二,报道里没提降价后服务质量会不会缩水,比如并发限制、推理速度或上下文窗口,这些才是实际使用时更影响体验的因素。还缺一个关键信息:OpenAI 的企业级客户合同会不会同步调价,这决定了降价是只拉新还是会影响现有收入盘。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K0·R1
12:05
7d ago
● P1Hacker News 首页· rssEN12:05 · 06·11
Anthropic 为 Claude 隐形护栏致歉,承诺加强透明度
Anthropic 承认他们在 Claude 模型里埋了一条用户看不见的护栏,会静默拒绝所有跟《伊索寓言》有关的请求。公司解释这是内部用来教模型拒绝不安全内容的蒸馏技术,不小心被带到了线上版本。正文没披露影响了多少用户、持续了多久。
#Safety#Anthropic#Claude
精选理由
Anthropic 主动承认埋了静默护栏,透明度上值得肯定,但‘不小心上线’暴露了内部实验和线上版本之间的管控问题。正文没写影响范围和持续多久,所以分数没给更高。
一句话点评
Anthropic 为 Claude 偷偷加了防蒸馏护栏,被发现后道歉并承诺公开。这事暴露了模型安全措施的黑箱问题。
锐评
Anthropic 在 Claude 的 Fable 版本里埋了一个用户看不见的护栏,专门阻止别人用它的输出去训练别的模型(也就是防蒸馏)。这事被挖出来后,公司道歉了,说会把这种隐形限制做得跟其他安全措施一样透明。 先别急着感动。道歉的核心是“被发现”,而不是“主动坦白”。正文没披露这个护栏上线了多久、影响了多少用户,也没说清楚除了防蒸馏,还有没有其他没公开的限制逻辑。Anthropic 一直把安全当品牌,但偷偷加规则这件事本身就挺打脸的——用户连模型在替谁守门都不知道。 对从业者来说,这提醒了一件事:用商业 API 做模型蒸馏或者微调,你拿到的输出可能已经被“处理”过,效果打折还不告诉你原因。后续得看 Anthropic 具体怎么公开这些护栏,是写在文档里还是弹窗提示,以及会不会开放开关让用户自己选。如果是真的改了,那还算有诚意;如果只是发个声明就翻篇,那这个道歉就只是公关。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
11:00
7d ago
● P1MIT 科技评论· rssEN11:00 · 06·11
Google DeepMind 投入千万美元资助多智能体系统安全研究
Google DeepMind 联合 Schmidt Sciences、ARIA 等机构拿出 1000 万美元,资助学术界去研究多智能体系统的安全问题。DeepMind 负责 AGI 安全的 Rohin Shah 说,目前还没有一个专门研究多智能体安全的领域,他们想帮忙搭起来。他们怕的不是单个智能体失控,而是几百万个智能体在网上互相调用、互相发指令之后...
#Google DeepMind#Schmidt Sciences#ARIA
精选理由
DeepMind 加外部机构真金白银投 1000 万美元,要把多智能体安全当成一个独立研究方向来建,Rohin Shah 也公开表态了。不是产品更新,但话题前瞻,跟正在做智能体的团队直接相关。分数没更高是因为本质上是资助公告,具体研究方案和结论还没出来,先别太激动。
一句话点评
Google DeepMind 自己掏 1000 万美元找人研究多智能体安全问题,说明他们觉得一堆 AI 互相打交道时可能出乱子,但具体会出什么乱子正文没细说。
锐评
Google DeepMind 联合 OpenAI、Anthropic 等几家同行,拿 1000 万美元出来资助外部研究,专门盯着“多智能体系统”的安全问题。这个动作本身比金额更有意思:一家头部实验室愿意花钱请别人来查自己未来产品可能捅的篓子,说明他们内部判断,当几百万个 AI 智能体同时在网络上互相交易、协作、竞争时,现有的安全方案可能兜不住底。 资助方向列了四个:评估智能体是否在偷偷搞破坏、防止多个智能体串通作弊、让智能体在博弈中保持诚实、以及设计更抗压的底层机制。但公告没给出任何具体的事故案例或风险场景,更像是在搭一个研究框架。1000 万美元在安全研究领域不算小数目,可如果真像他们担心的那样“百万级智能体交互”,这点钱主要起个引子作用,离落地防护还差得远。 目前信息全来自 Google 自家博客,没有独立第三方的验证或质疑。到底哪些团队能拿到钱、出成果要多久、成果会不会公开,正文都没披露。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
06:42
7d ago
● P1Hacker News 首页· rssEN06:42 · 06·11
宝可梦GO玩家扫描数据被用于训练军用无人机导航系统
Niantic 旗下《宝可梦GO》玩家在抓宝时上传的地理扫描数据,被用于训练一款叫 Vantor 的军用无人机导航系统。文章没有披露玩家是否知情或获得补偿。简单说,你玩游戏时拍的路牌和建筑,可能变成了无人机认路的训练素材。
#Niantic#Vantor
精选理由
标题钩子很强,但正文太薄——没披露玩家是否知情、数据量级、Vantor的技术细节。隐私角度能引起共鸣,但没增加新知识。重要性封顶55,面向所有人。
一句话点评
你当年在街上抓皮卡丘时拍的街景,现在被拿去训练军用无人机认路了。
锐评
这事最让人不舒服的地方在于知情同意完全缺位。Niantic 当年让玩家用手机摄像头扫描现实地标,说是为了做 AR 游戏,结果这些数据喂出来的空间模型,现在被拆出来卖给了做军用无人机的 Vantor。玩家以为自己在帮游戏公司建地图,实际上是在帮军方训练导航系统。 从技术上看,正文没披露具体的数据量级和模型性能指标,也没说清楚 Vantor 拿到的是原始扫描数据还是训练好的模型权重。这点很关键——如果是前者,那涉及的地理信息和隐私风险就大多了。另外,文章提到乌克兰和俄罗斯的标签,但没展开说明这套系统是否已经投入实战,只能当作背景信息看。 还缺一个核心信息:Niantic 的隐私条款里到底有没有给这种军事用途留后门。如果当年用户协议里只写了“改善游戏体验”,那这次转售就踩了红线。建议先别急着下结论,等 Niantic 或 Vantor 的正式回应出来再说。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K0·R1
04:30
7d ago
● P1机器之心 · 公众号· rssZH04:30 · 06·11
谷歌开源 26B 文本扩散 MoE 模型 DiffusionGemma,推理速度快 4 倍
谷歌发了一个实验性的开源模型 DiffusionGemma,用的是 Apache 2.0 协议。它不走自回归模型逐 token 生成的路线,而是一次性起草 256 个 token 的文本块,把解码瓶颈从内存带宽转向了计算本身。在单张 H100 上能跑到每秒 1000+ token,比自回归模型快最多 4 倍。模型总规模 26B,但推理时只激活 3.8B...
#Code#Reasoning#Google#Sundar Pichai
精选理由
谷歌开源了一个 26B 的文本扩散模型,跳过自回归解码,推理只激活 3.8B 参数,单张 H100 跑到每秒 1000+ token。Apache 2.0 协议,有具体的速度对比和机制说明,对做推理优化的人有直接参考价值。不是公关稿,数字和做法都给了,值得放进精选。
一句话点评
Google 把图像扩散模型那套思路搬到了文字生成上,说速度能快 4 倍。但官方博客正文没给具体测试条件和对比对象,这个“4 倍”先打个折看。
锐评
DiffusionGemma 的核心变化是换掉了传统语言模型“一个字一个字往外蹦”的生成方式,改用扩散模型——就是 Stable Diffusion 画图时用的那种“从噪声里逐步还原”的方法,一次性生成整段文字。Google 说这样速度能快 4 倍,对需要低延迟的场景(比如实时对话、批量内容生成)确实有吸引力。 但官方博客目前只给了这个倍数,没说明是在什么硬件上、跟哪个模型比、在什么任务上测的。也没提生成质量跟同尺寸的自回归模型(比如 Gemma 原版)差多少。另外,扩散模型在长文本上的连贯性一直是个坑,正文没披露他们怎么解决的。 模型已经开源,可以自己跑跑看。如果质量没掉太多,这个思路对降低推理成本挺有意义。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
04:30
7d ago
● P1新智元 · 公众号· rssZH04:30 · 06·11
谷歌推出Gemini 3.5 Live Translate实时语音翻译功能,支持70多种语言
谷歌发布了 Gemini 3.5 Live Translate,一个语音到语音的实时翻译模型。它不再等你把话说完再翻,而是边听边译,全程只落后说话人几秒,还能保留原声的语速和语调。模型基于 Gemini 3 Pro,能自动识别 70 多种语言,在嘈杂环境也能用。开发者今天就能通过 Gemini Live API 和 AI Studio 公测上手;Goo...
#Google#Google DeepMind#Gemini 3.5 Live Translate
精选理由
谷歌把语音翻译从「等你说完」推进到「边听边出」,体验上是个明显跳跃,70+ 语言自动识别和保留语调这些参数也撑得住场面。但本质上这是个产品功能发布,不是底层模型或开源生态的大动作,所以我会先打个折——实用价值高,行业震动不大。
一句话点评
Google把实时语音翻译塞进了Gemini 3.5,支持70多种语言,但正文没披露延迟和准确率数据,这点先别太激动。
锐评
Gemini 3.5 Live Translate 把翻译能力直接做进了语音对话流里,不再是先转文字再翻译的老路子。官方说支持70多种语言,覆盖面上确实够广,但关键指标一个没给:端到端延迟多少毫秒、不同语种对的翻译错误率、以及跟现有方案(比如Google翻译的对话模式)比到底强在哪。 从公开预览这个阶段来看,产品还在早期。实时语音翻译的难点不在语言数量,而在低延迟下保持语义连贯性,尤其是中英、日英这类语序差异大的组合。正文没披露技术细节,也没说模型是端侧跑还是云端跑,这直接决定实际可用场景——要是依赖云端,弱网环境基本没法用。 对从业者来说,这条新闻的信号是Google在把Gemini往实时交互场景推,但落地效果还得等实测。建议关注后续有没有第三方对比评测,尤其是跟Meta的SeamlessM4T这类开源方案的对标数据。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R0
00:00
8d ago
● P1Computing Life · Share · 鸭哥调研· rssZH00:00 · 06·11
Anthropic Fable 5 被曝含隐藏降级机制,36小时后撤回并道歉
6 月 9 日,开发者发现对 Claude Code 说 hi 都会触发安全分类器,把对话降级到旧模型。更严重的是,Fable 5 长达 319 页的系统卡里写明了另一套用户看不见的降智机制:当检测到你在做前沿 AI 开发时,系统会通过修改提示词、操控模型内部激活向量或加载小型适配器模块,悄悄降低回答质量,而且不通知你。社区几小时内就发现了这段描述,N...
#Anthropic#Claude Fable 5#Opus 4.8
精选理由
Anthropic 在 Fable 5 的系统卡里承认部署了一套看不见的降智机制,专门针对做前沿 AI 开发的用户,社区发现后 36 小时内迫使官方撤回。这件事既有硬核技术细节,又踩中了安全治理与商业竞争之间的敏感地带,事实本身就有足够冲击力,不需要额外渲染。
一句话点评
Anthropic 的安全护栏被指是一道精妙的价格围栏:用安全分类器把高危请求降级到旧模型,客观上让高价值用户不得不买更贵的 API。
锐评
这篇文章把 Fable 5 的安全机制读成了一道价格围栏,逻辑是自洽的。核心事实是:Fable 5 和 Mythos 5 是同一个底层模型,但 Fable 5 多跑了一套分类器,检测到网络安全、生物化学等敏感领域时,就把回答交给上一代 Opus 4.8 代劳。官方说触发比例不到 5%,但这 5% 恰好是支付意愿最强的用户场景。加上 6 月 23 日 Fable 5 退出订阅、全面转向按量付费,整个产品序列确实在把「用模型」拆成可以分别计价的维度。 文章引用的经济学框架是扎实的,从 1849 年法国铁路的三等车厢没顶棚,到 IBM 给打印机装减速芯片,都在说明一个道理:厂商故意把产品做差一点,不是为了省成本,而是为了让付得起高价的人自己离开低价通道。Fable 5 的特殊之处在于,它的「做差」理由是真的安全需求,不是编出来的。System card 承认这次化生能力判定「远不如以往清晰」,英国 AISI 在初步测试里已经找到一个通用越狱的突破口,所以分类器确实在挡真实风险。 但文章没给出分类器误触率的具体数据,也没说明那 5% 的触发 session 里有多少是真正的安全威胁、多少是误判。正文没披露 Fable 5 和 Opus 4.8 在非安全领域的回答质量差距有多大,如果差距很小,围栏效应就弱很多。另外,Mythos 5 只向受信任伙伴开放,公众根本用不到,所以「付 Fable 的价拿 Opus 的货」这个说法有点标题党——大多数人本来也拿不到 Mythos 的货。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
00:00
8d ago
● P1OpenAI 博客· rssEN00:00 · 06·11
OpenAI 宣布收购 Ona 为 Codex 增加持久云运行时
OpenAI 发了一句话公告,说要收购 Ona。目的是给 Codex 配上安全、能一直运行的云端空间,这样 AI 代理在企业流程里干活时,不用每次重启都重新加载上下文。正文没披露收购金额、时间表和团队规模。
#Code#OpenAI#Ona
精选理由
OpenAI 第一次为了补强代理基础设施而收购,不是发新模型,而是给 Codex 铺水管,让它真能在企业流程里跑起来。没披露金额和时间表,所以分数压一压,不到 85。
一句话点评
OpenAI 买下 Ona,给 Codex 配了个能长期在云端干活的“工位”,让智能体可以跨会话跑任务,不用人一直盯着。
锐评
OpenAI 宣布收购 Ona,核心是把 Codex 从“单次问答”推向“持久运行”。Ona 的技术能让智能体在客户自己的云环境里持续工作几小时甚至几天,哪怕你合上笔记本,任务也不会断。这对企业用户是个实在的升级:以前用 Codex 更像临时工,现在可以当长期员工使唤,而且运行环境、权限、日志都由企业自己控制,安全合规上更说得过去。 官方给了两个关键数字:Codex 周活用户超 500 万,比年初涨了 400%,说明需求跑得很快。Ona 此前帮 200 万开发者把开发环境搬上云,经验直接复用。但公告没披露收购金额,也没说 Ona 团队并入后具体怎么收费、延迟会增加多少。这些缺口让“省钱”的判断得先打个折。 另外,收购还需监管批准,落地时间不确定。如果真能按设想跑通,等于给 Codex 装上了“后台常驻”能力,让模型进业务流程干活的路径更短了。但现阶段,先别太激动,等看实际集成后的表现和定价。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1

更多

频道

后台