ax@ax-radar:~/feed $ tail -f signal.log
40 srcsignal 12%cycle 04:32

热点聚合 · 2026-05-03

20 signals · updated 3m ago
live · 238 today·policy v2
AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·
RSS live
2026-05-03 · 星期日2026年5月3日
17:34
46d ago
● P1Hacker News 首页· rssEN17:34 · 05·03
奥斯卡禁止 AI 生成作品参评表演和编剧奖
奥斯卡主办方宣布,AI生成或辅助的内容不能参评表演和编剧两个奖项。正文只给了这条规则覆盖的奖项范围(2类),没披露具体规则文本、生效时间或如何执行。目前只有15个点赞和1条评论,讨论热度不高。
#Safety#The Oscars#Policy
精选理由
HKR-H和HKR-R成立:标题禁令清晰,且触及AI创作的核心焦虑。HKR-K不成立:正文仅确认了标题层面的禁令,未披露规则文本、生效时间或执行机制,信息量不足以作为AI行业头条。这是值得讨论的政策新闻,但非AI行业重点推荐。
一句话点评
奥斯卡直接划了条线:AI 生成的表演和剧本不能拿奖。规则刚出,但正文没写怎么查、怎么界定“人类创作”,执行细节还是一片空白。
锐评
这条规则与其说是技术禁令,不如说是学院在给行业表态:表演奖和编剧奖只认人,不认模型。规则要求表演必须由真人完成且署名在法定字幕里,剧本也得是“人类创作”,学院还保留随时要求剧组说明 AI 使用情况的权利。TechCrunch 的报道把背景串得挺清楚——Val Kilmer 的 AI 复制品正在拍独立电影,AI“演员”Tilly Norwood 三天两头上头条,新的视频模型也让不少电影人公开喊绝望。这些事叠在一起,学院不出手才奇怪。 但文章没提最关键的东西:怎么查。是让剧组自己申报,还是学院有技术手段去验?如果一部片子用 AI 辅助写了初稿、再由真人编剧大改,算不算“人类创作”?边界不划清楚,这条规则就只是一面旗,不是一把尺。另外,规则只卡了表演和编剧两个奖,其他奖项比如视觉效果、剪辑能不能用 AI,正文完全没提,这也是个很大的缺口。
HKR 分解
hook knowledge resonance
打开信源
85
SCORE
H1·K0·R1
05:06
46d ago
● P1新智元 · 公众号· rssZH05:06 · 05·03
Claude Code 让 Anthropic 两个月收入翻倍,成史上增长最快的 AI 公司
Semi Analysis 的报告说,Anthropic 的年化收入(ARR)已经冲到 440 亿美元,过去 12 个月净增了 350 亿。其中 Claude Code 这个编程助手到 2026 年 2 月,自己就贡献了 25 亿美元的年化收入。推理毛利率也从 38% 涨到了 70% 以上。不过正文因为微信环境异常没抓到具体内容,这些数字背后的客户留存...
#Agent#Code#Inference-opt#Anthropic
精选理由
我会先打个折——Semi Analysis 的数据不是官方财报,但 440 亿 ARR 和 70% 推理毛利率这两个数如果属实,说明 Anthropic 靠 Claude Code 在企业端收钱的速度比外界想的快得多。文章真正值得盯的不是总盘子有多大,而是三个东西能不能同时成立:企业用量在涨、代码智能体收入在涨、推理毛利也在涨。正文没披露 Claude Code 的客户留存和续费率,这点先别太激动。
一句话点评
Anthropic 年收入冲到 440 亿美元,Claude Code 一个编程助手就贡献了 25 亿,但正文因为微信环境异常没抓到,数字来源和客户留存情况都不清楚,先打个折看。
锐评
Semi Analysis 这份报告给出的数字很猛:Anthropic 年化收入 440 亿美元,过去一年净增 350 亿,其中 Claude Code 到今年 2 月自己就扛了 25 亿美元的年化收入。推理毛利率也从 38% 涨到 70% 以上,说明卖算力的成本控制得不错,不是赔本赚吆喝。 但这里有个硬伤——微信原文因为环境异常根本没抓到正文,我们看到的只是摘要里的几个数字。报告是谁写的、数据怎么算的、客户是一次性大单还是持续付费、Claude Code 的收入有没有把企业捆绑销售算进去,这些全都不清楚。Semi Analysis 本身是第三方分析机构,不是 Anthropic 官方财报,数字可能有估算成分。 如果这些收入数字属实且能持续,那 Anthropic 确实跑通了“编程助手直接收钱”的路子,比单纯卖 API 调用要稳。但眼下缺的是客户留存率、续费率、以及 Claude Code 在企业环境里的实际渗透情况。这些才是判断 440 亿是不是泡沫的关键。
HKR 分解
hook knowledge resonance
打开信源
87
SCORE
H1·K1·R1
00:30
47d ago
● P1Hacker News 首页· rssEN00:30 · 05·03
OpenAI o1 在哈佛急诊分诊研究中诊断准确率为 67%
哈佛大学在急诊分诊场景下拿 OpenAI 的 o1 模型和真人医生比了一场。o1 正确诊断了 67% 的患者,而分诊医生的准确率在 50% 到 55% 之间。这个差距看着不小,但正文没披露样本量、病例构成和具体评估方法,所以数字本身只能当个方向参考。模型是在结构化信息里做判断,和医生在嘈杂急诊室里干活的条件完全不一样,直接比准确率会高估模型的实际可用性...
#Reasoning#Benchmarking#OpenAI#Harvard
精选理由
HKR 三项都成立:急诊分诊是高 stakes 场景,67% vs 50–55% 给了一个可讨论的数字,临床信任和职业边界问题自带传播力。但样本量和测试条件全没披露,所以分数压在 78–84 区间,不给 P1。
一句话点评
OpenAI o1 在急诊分诊测试里诊断准确率 67%,比医生高了十几个点,但这是拿历史病历做的回顾性实验,不是真在急诊室里跑。
锐评
哈佛这项研究让 o1 看急诊病历做诊断,准确率 67%,对照的真人分诊医生是 50% 到 55%。数字看着漂亮,但得先打个折:这是回顾性研究,模型读的是整理好的文字病历,不是急诊室里嘈杂、信息碎片化的真实场景。正文没披露样本量和病例构成,也没说医生是在什么条件下做的判断——是忙到飞起的夜班医生,还是专门坐下来答题?这些缺口让 67% 这个数只能当个方向参考,不能直接等同于“AI 比急诊医生强”。 另外,研究只测了诊断准确率,没碰更关键的问题:误诊的代价。急诊分诊不是考试,漏掉一个心梗比答错一道题严重得多。o1 在哪些病上容易翻车、错误类型是漏诊还是误诊,正文都没提。这些才是决定能不能往医院里推的核心。 总的来说,这研究证明了模型读病历做鉴别诊断有潜力,但从“读病历答对题”到“在急诊室真能帮上忙”,中间还隔着临床验证、安全边界和 workflow 集成好几道坎。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1

更多

频道

后台