ax@ax-radar:~/feed $ tail -f signal.log
40 srcsignal 11%cycle 04:32

热点聚合 · 2026-06-18

23 signals · updated 3m ago
live · 238 today·policy v2
AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·
RSS live
2026-06-18 · 星期四2026年6月18日
11:00
15h ago
持续报道 · 1d● P1AI HOT 精选· aihot-apiZH11:00 · 06·18
OpenAI在ChatGPT健康问答中部署GPT-5.5 Instant,免费用户可用
OpenAI 把最新的 GPT-5.5 Instant 模型用在了 ChatGPT 的健康问答上,免费用户也能用。在 3500 条回复的盲评里,医生给它的准确性、沟通清晰度和完整性打分,比真人医生写的回答还高,而且更少出现漏掉危险信号、不追问背景这类问题。后台监控显示,过去两个月健康回复的事实错误率下降了 71%。这些提升靠的是模型本身变强,以及请医生...
#OpenAI#GPT-5.5 Instant#GPT-5.3 Instant#Benchmark
精选理由
OpenAI 把 GPT-5.5 Instant 塞进了 ChatGPT 的健康问答,免费用户也能用。在 3500 条回复的盲评里,医生给它的准确性、沟通清晰度和完整性打分,比真人医生写的回答还高,而且更少漏掉危险信号、不追问背景这类问题。后台监控显示过去两个月事实错误率下降了 71%。这些提升靠的是模型本身变强,以及请医生参与调优,但正文没披露医生参与的具体方式和样本覆盖的疾病范围,所以效果能不能泛化到所有健康场景还得打个问号。
一句话点评
OpenAI 把 GPT-5.5 Instant 用在健康问答上,免费用户也能用,医生盲评打分比真人医生还高。但要注意,评测是 OpenAI 自己主导的,外部独立验证还没看到。
锐评
OpenAI 宣布在 ChatGPT 里用 GPT-5.5 Instant 处理健康类问题,免费用户就能用。他们给了一组数据:每周有 2.3 亿人用 ChatGPT 问健康问题;在自家 HealthBench 评测上,GPT-5.5 Instant 的得分已经追平了需要付费的“思考”模型,而且比上一代 GPT-5.3 Instant 提升明显。更抓眼球的是,他们让一组医生不限时上网写回答,再让另一组医生盲评,结果 GPT-5.5 Instant 在准确性、沟通、完整性等维度上得分比真人医生还高。另外,通过隐私保护的方式监测线上流量,健康回答里被标记为可能有事实性问题的比例,两个月内下降了 71%。 这些数字看着挺漂亮,但得打个折来看。首先,评测基准和医生评审都是 OpenAI 自己组织的,虽然拉了全球医生网络,但方法论和利益冲突的细节没公开。其次,文章没给出具体的错误率绝对值,只说“下降了 71%”,基数是多少不知道。最后,健康问答容错率极低,模型在“识别紧急情况”和“解释不确定性”上的表现到底多可靠,光靠内部评测还不够,需要更多独立第三方的验证和真实世界的安全性数据。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1
06:17
20h ago
持续报道 · 1d● P1Hacker News 首页· rssEN06:17 · 06·18
DeepSeek 网页端上线图像识别功能
DeepSeek 官网登录页出现了“Vision”标签,说明现在可以上传图片了。但正文没披露具体用了哪个模型、支持什么图片格式、以及是否对所有用户开放——目前能确认的只有标题这一条信息。
#Vision#Multimodal#DeepSeek#Product update
精选理由
标题有钩子——DeepSeek 加 Vision 对关注国产模型的人是个信号。但正文只有一个登录页,没披露模型版本、图片格式、是否全量开放。H 命中(标题有悬念),K 和 R 都 miss。落在 60-71 区间,取低端 60,因为信息缺口太大,实际价值有限。
一句话点评
DeepSeek 网页和 App 端上线了识图模式,但 App 端还挂着“内测中”的提示,网页端倒是直接可用。
锐评
DeepSeek 把识图模式做成了和“快速模式”“专家模式”并列的一个独立入口,用户上传图片后模型能直接理解画面内容,不只是简单的文字提取。研究员 Xiaokang Chen 在 6 月 18 日宣布了这个消息,但 IT 之家实测发现 App 端仍然提示“图片理解功能内测中”,网页端没有这个限制,说明全量推送还没完全到位。 今年 4 月 DeepSeek 公开过这套识图背后的技术框架,叫“以视觉原语思考”,相当于让模型先拆解图像的基本元素再推理,而不是直接端到端黑盒输出。这个思路在学术上有交代,但正文没给出任何实际效果对比、支持哪些图片格式、单次识图有没有用量限制,也没提是否免费。 我会先打个折:上线不等于稳定可用,App 端的内测提示说明灰度还在进行。如果你现在就想用,优先试网页端。另外,识图能力到底强在哪、跟其他家的多模态模型比差多少,这篇稿子完全没展开,只能等后续实测。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K0·R0
04:33
21h ago
持续报道 · 1d● P1AI HOT 精选· aihot-apiZH04:33 · 06·18
阿里开源科学基础模型LOGOS,1B参数超越微软NatureLM
阿里和人大高瓴学院开源了一个叫 LOGOS 的科学模型,把蛋白质、小分子、材料等七种科学数据统一编成一套“科学语法”的 token 序列,让模型用预测下一个词的方式直接处理。它把蛋白质口袋和配体的 3D 接触模式也转成了离散 token,不依赖显式 3D 坐标就能预测空间相互作用。LOGOS-1B 只有 10 亿参数,微软 NatureLM 是 8×7...
#Alibaba ATH-Token Foundry#Renmin University Gaoling School of AI#Microsoft NatureLM#Open source
精选理由
阿里开源了一个 10 亿参数的科学模型 LOGOS,把七种科学数据统一成 token 序列,用预测下一个词的方式处理,还在多个任务上赢了参数多 56 倍的微软 NatureLM。有具体数字、有开源代码,知识增量扎实。但领域太专,我会先打个折——对科学 AI 圈内人是硬货,对圈外人共鸣不强,所以放在 featured 里比较合适。
一句话点评
阿里开源了一个1B参数的科学模型LOGOS,把蛋白质、小分子等不同科学数据统一成一套“语言”来训练,在多个任务上打平甚至超过了微软56倍参数量的NatureLM。
锐评
这条消息最值得看的是参数效率:1B的模型能跟微软8×7B的NatureLM掰手腕,说明这套“统一科学语法”的思路在压缩模型体积上确实有效。它把蛋白质、小分子、材料这些原本需要不同模型处理的对象,全部转成离散的token序列,让一个自回归模型就能搞定生成、预测等多种任务,省掉了传统方法里换任务就要换模型的麻烦。 不过,正文只提了“六大代表性科学任务”和“匹配或超越领域专用方法”,没有给出具体的评测基准名称和分数,也没说明NatureLM是在哪些指标上被超越的。44.87B tokens的预训练语料听起来很大,但不同模态的分布很不均匀——蛋白质占了近29B,小分子只有2.1B,这种数据倾斜会不会导致模型在某些化学任务上表现虚高,文章没展开。 另外,把3D空间接触模式“语法化”成离散token,完全不用3D坐标输入,这个想法很巧妙,但实际能保留多少空间精度、在需要精确几何约束的任务上会不会掉链子,还得看后续的第三方复现和评测。开源了权重和代码是好事,建议先跑一下自己关心的任务再下结论。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R0
03:34
22h ago
持续报道 · 1d● P1Hacker News 首页· rssEN03:34 · 06·18
苹果 CEO 库克称内存芯片成本上升将推高产品价格
苹果 CEO 蒂姆·库克对《华尔街日报》说,内存芯片成本涨得太猛,产品涨价“不可避免”。他没说具体哪些产品会涨、什么时候涨,也不确定 9 月要发的 iPhone 18 会不会受影响。库克把锅甩给两件事:AI 需求把芯片价格推高了,伊朗那边的战争又断了氦气供应——氦气是造芯片的关键气体。内存条价格从去年 10 月到现在已经翻了一倍多。苹果今年早些时候已经...
#Apple#Tim Cook#TSMC
精选理由
苹果 CEO 公开确认要涨价,话题性够,但信息增量薄。内存价格翻倍和氦气短缺都是旧闻,库克没给时间线也没点名具体产品,所以 H 和 R 打勾,K 不成立,落在 60-71 这个区间。
一句话点评
库克亲口说涨价“不可避免”,但没给时间表和幅度,更像提前放风试探市场反应。
锐评
库克接受华尔街日报采访时把涨价原因直接指向 AI 抢走了存储芯片产能。自 2024 年以来,内存和存储芯片价格已经翻了四倍,而且预计涨势要持续到 2027 年。这个数字挺吓人,但文章没说明是哪种规格的芯片、对比的基准价是什么,所以“四倍”这个数先打个折看。 真正落到消费者头上的影响,TechInsights 给了一个估算:下一代 iPhone 18 Pro 可能要贵 270 美元,起售价摸到 1299 美元。不过这只是第三方基于利润率的推算,苹果官方没确认。库克只承认成本压力“不可持续”,Mac Mini 已经悄悄涨了价,戴尔、任天堂也跟进了。 现在还缺两个关键信息:一是苹果会不会通过砍掉存储容量来压住起售价,二是这轮涨价是永久性的还是等产能缓解后会回调。如果只是放风而不给具体方案,更像是在给市场打预防针。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K0·R1

更多

频道

后台