ax@ax-radar:~/feed $ tail -f signal.log
40 srcsignal 11%cycle 04:32

热点聚合 · 2026-06-17

26 signals · updated 3m ago
live · 238 today·policy v2
AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·
RSS live
2026-06-17 · 星期三2026年6月17日
21:31
1d ago
持续报道 · 2d● P1Hacker News 首页· rssEN21:31 · 06·17
OpenAI 2025年财务披露:收入130亿美元但运营亏损209亿
一份据称是 OpenAI 经审计的财务文件被记者 Ed Zitron 拿到并公开。文件显示,OpenAI 2025 年收入 130.7 亿美元,比 2024 年的 37 亿涨了不少,但研发开支就烧掉 191.8 亿,其中 105.9 亿直接付给了微软。加上 75 亿的交付成本和 57.3 亿的销售市场费用,全年运营亏损达到 209.2 亿。净亏损数字看...
#OpenAI#Microsoft#Ed Zitron
精选理由
泄露的审计文件把 OpenAI 的真实家底摊开了:2025 年收入 130.7 亿,但运营亏损 209.2 亿,研发开支里 105.9 亿进了微软口袋。这是行业等了很久的财务透明时刻,戏剧性、信息量和讨论度全拉满。重要性给 88 没问题,tier 选 featured 也合理,因为这不是分析师猜测,是据称审计过的数字。
一句话点评
OpenAI去年亏了385亿美元,收入涨了但烧钱更快,主要都砸在算力上了。
锐评
这份泄露的审计文件把OpenAI的家底摊开了:2025年收入130.7亿美元,但总成本高达340亿,净亏385亿。钱主要烧在研发上,花了191.8亿,其中光付给微软的算力和训练费就超过106亿。收入涨了近四倍,亏损却扩大了近八倍,说明模型越做越大,成本增速远超赚钱速度。 文件还提到,2025年OpenAI从非营利转营利实体,导致账面多出415.5亿的“公允价值变动”损失,这是会计处理带来的数字,不是现金真的流出。剔除这部分和少数股东权益后,归到公司头上的净亏是385亿。年底公司账上还有约500亿资产,近一半是现金,短期不会断粮。 不过,正文没披露用户量、付费转化率和客单价,也没说这340亿花出去换来了多少模型能力提升。光看亏损数字很吓人,但如果没有收入质量和增长天花板的判断,很难说这是烧钱换未来,还是单纯的成本失控。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
17:11
1d ago
持续报道 · 1d● P1FT · 科技· rssEN17:11 · 06·17
Anthropic CEO在G7呼吁建立统一的全球AI监管框架
Anthropic 的 CEO 在 G7 会议上呼吁各国不要各自为政搞 AI 监管。他的理由是:规则不统一会拖慢安全研究,企业也得应付一堆互相打架的标准。正文没披露他具体提了什么统一方案,也没说点名批评了哪个国家的政策。
#Anthropic#G7#Policy
精选理由
Anthropic CEO在G7会议上呼吁各国别搞分裂式AI监管——话题有共鸣,但全文付费墙,零具体细节。太薄,不值得上推荐位。
一句话点评
两家头部AI公司CEO在G7会上提议建排华联盟,正文被Reddit屏蔽,具体提案细节没看到。
锐评
这条消息本身值得关注,但信息缺口很大。Anthropic和DeepMind的CEO在G7会议上提议建一个美国主导的AI联盟,明确要把中国排除在外。这基本是把AI竞争从商业层面直接拉到地缘政治层面,等于公开要求G7国家在AI基础设施、人才、标准上搞一个“朋友圈”,不带中国玩。 但具体怎么操作,正文没披露。Reddit原帖被网络策略拦截,我们只看到标题和一张图,没有提案原文,也没有会议纪要。所以不知道这个联盟是管芯片出口、模型开源、还是人才流动,也不知道G7其他国家的反应。 如果是真的,这比单家公司禁售影响更大,等于在制度层面划阵营。但先别太激动,CEO提议和实际落地差很远,G7内部利益也不一致。后续得看有没有官方声明或会议记录流出来,才能判断这是真动作还是表态。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H0·K0·R1
13:00
1d ago
持续报道 · 1d● P1The Verge · AI· rssEN13:00 · 06·17
Google发布六年来首款新智能音箱搭载Gemini助手
Google 会在 6 月 24 日开卖一款叫 Google Home Speaker 的新智能音箱,定价 49.99 美元。这是自 2020 年 Nest Audio 之后 Google 第一次发新的音箱产品。它运行的是 Gemini for Home,也就是说你可以跟它连续对话,不用每句都喊一遍“Hey Google”,助手能记住上下文。外观是个裹...
#Google#Gemini for Home
精选理由
Google 六年来的第一款新音箱,49.99 美元定价配上 Gemini 连续对话,产品更新是实打实的。但智能音箱现在不算热赛道,行业影响力有限,所以 H 和 K 都站得住,R 偏弱,整体停在 featured 72 分这个位置。
一句话点评
谷歌把Gemini塞进音箱,99美元定价直接对标亚马逊Echo,但正文没给任何硬件或功能细节。
锐评
谷歌这次用99.99美元的价格把Gemini模型装进了智能音箱,摆明了要和亚马逊Echo抢客厅入口。这个定价不算贵,如果真能把大模型的多轮对话和复杂指令理解跑顺,会比现在只会定闹钟、查天气的智能音箱好用一大截。但问题在于,目前所有报道都只给了标题和价格,正文完全没披露这款音箱到底用了哪个版本的Gemini、是端侧跑还是云端调、延迟多少、支持哪些语言。这些信息直接决定它是个能聊天的真升级,还是又一个套了AI壳的旧硬件。另外,谷歌之前Nest系列的产品线已经够乱了,这次是替代旧款还是另开新线,也没说清楚。如果是真的把大模型塞进百元音箱还能保持低延迟,那挺省钱也挺实用;但如果只是云端调API,那和手机上的语音助手没本质区别,没必要专门买个音箱。先别太激动,等实测出来再看。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R0
10:00
1d ago
持续报道 · 1d● P1OpenAI 博客· rssEN10:00 · 06·17
GPT-5.4在自动化实验室改进药物合成反应产率至25.2%
OpenAI 把 GPT-5.4 连到了 Molecule.one 的自动化化学平台 Maria 上,让它自己设计实验来改进一类药物合成反应。模型挑中了 Chan-Lam 偶联里最难搞的底物之一——伯磺酰胺,并提议用 TEMPO 做温和氧化剂。跑了两轮实验后,88% 的硼酸和 83% 的磺酰胺底物产率都有提升,平均产率从 16.6% 涨到 25.2%,...
#OpenAI#Molecule.one#GPT-5.4
精选理由
硬排除规则 #4:传统科学 + AI 交叉,没有 agent 或产品层面的含义。GPT-5.4 连到自动化化学平台优化药物合成——AI 只是传统研究的工具,对 AI 从业者没有直接价值。分数上限 39。
一句话点评
GPT-5.4 在自动化实验室里把一种难做的药物合成反应产率从 16.6% 提到了 25.2%,靠的是它自己翻文献后提议加 TEMPO 这个温和氧化剂。
锐评
OpenAI 把 GPT-5.4 接入了 Molecule.one 的自动化实验室 Maria,让它自己提方案、做实验、分析数据,目标是改进 Chan-Lam 偶联反应里最难搞的一类底物——伯磺酰胺。模型没让人手把手教,自己翻完文献后提议加 TEMPO 这种温和氧化剂,结果在 88% 的硼酸和 83% 的磺酰胺底物上产率都有提升,平均产率从 16.6% 涨到 25.2%,超过 30% 产率的反应比例也从 15.6% 翻到 37.5%。后续人工在常规实验台上复现,14 组里有 11 组产率更高,多数翻了一倍以上。 这个数字绝对值不算高,25.2% 的平均产率在合成化学里依然偏低,但提升幅度和底物覆盖面说明方向是对的。文章也坦承这只是早期结果,而且整个流程里人类还是参与了选题把关、实验计划微调和最终验证,不是全自主。 目前没披露的是:模型提议 TEMPO 的逻辑链路有多深,是碰巧撞上还是真有化学直觉;另外 10,080 次实验的总成本和耗时也没给,没法判断这种“AI 化学家”模式离日常药物研发管线有多远。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H0·K1·R0
09:12
1d ago
● P1Hacker News 首页· rssEN09:12 · 06·17
智谱开源GLM-5.2大模型,登顶开源排行榜
Z.ai 的 GLM-5.2 在 Artificial Analysis 的 Intelligence Index v4.1 上拿了 51 分,超过 MiniMax-M3 和 DeepSeek V4 Pro(都是 44 分),成了目前最强的开源权重模型。模型体量没变,还是 744B 总参数、40B 活跃参数,但科学推理和智能体任务进步明显:HLE 涨了...
#Reasoning#Agent#Code#Z.ai
精选理由
GLM-5.2 在 Artificial Analysis 的 Intelligence Index 上拿了 51 分,超过 MiniMax-M3 和 DeepSeek V4 Pro,成了最强开源权重模型。参数没变,分数涨了 11 分,科学推理和智能体任务有实打实的提升。但这是单一评测机构的单榜成绩,没有其他来源交叉验证,所以重要性给到 82 分,先打个折。
一句话点评
智谱开源GLM-5.2,编程和长任务跑分进全球前三,但部分长程基准仍落后Claude Opus 4.8一截,先别急着喊“碾压”。
锐评
GLM-5.2这次把力气花在了两个地方:一是把上下文窗口做到实打实的100万token,不是那种一到几十万就拉胯的“纸面1M”;二是让模型能扛住跨天甚至跨周的长任务,比如从零写一个多端应用并完成调试打包。在Artificial Analysis综合榜上拿了51分,和Anthropic、OpenAI并列前三,Code Arena前端开发盲测甚至排到第一。 不过数字得拆开看。在考验超长周期软件工程的SWE-Marathon上,它比Opus 4.8低了13个百分点,差距不小。官方自己也说,长程任务能力介于Opus 4.7和4.8之间。所以整体定位更接近“开源最强、逼近闭源头部”,而不是全面超越。 技术上有两个点值得注意:一是IndexShare方案把长上下文下的计算量压到2.9倍,推理成本控制得比较务实;二是模型发布当天就适配了华为昇腾、平头哥等一堆国产芯片,对国内开发者来说部署门槛低了不少。另外模型用MIT协议开源,商用没什么限制。目前缺的是更多第三方在真实长程任务上的横向对比,以及不同思考档位下的成本数据,这些会直接影响实际选型。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1

更多

频道

后台