ax@ax-radar:~/feed $ tail -f signal.log
40 srcsignal 11%cycle 04:32

热点聚合 · 2026-05-22

49 signals · updated 3m ago
live · 238 today·policy v2
AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·
RSS live
2026-05-22 · 星期五2026年5月22日
23:59
27d ago
● P1AI HOT 精选· aihot-apiZH23:59 · 05·22
Gemini 月活破 9 亿,新增两个能替你干活的代理功能
Google 说 Gemini 应用月活用户超过 9 亿了。这次更新把 Gemini 从问答工具往主动干活的个人代理方向推了一步。新模型叫 Gemini 3.5 Flash,还换了套叫“Neural Expressive”的设计语言,另外 Gemini Omni 模型能把提示词直接生成视频。重点在两项代理功能:Daily Brief 会给你出个性化每日...
#Agent#Multimodal#Google#Gemini
精选理由
Google 这次更新核心就两件事:一是 Gemini 应用月活冲到 9 亿,盘子确实大;二是推出了 Daily Brief 和 Gemini Spark 两个代理功能,后者可以在用户授权下 24 小时跑任务。我会先打个折,正文没披露代理功能的具体完成率和延迟数据,实际干活靠不靠谱还不知道。但 9 亿这个量级加上“常驻后台的个人代理”定位,对做 agent 产品的团队来说是个明确的信号——大厂开始用自家分发渠道推代理了,竞争门槛在抬高。
一句话点评
Gemini 月活破 9 亿,但 Google 没说是怎么算的。新推的 Daily Brief 和 Spark 代理功能听起来像能替你干活,实际能接管多少任务、会不会翻车,正文没给细节,先别太激动。
锐评
Google 这次把 Gemini 从问答工具往主动干活的个人代理方向推了一步。月活 9 亿这个数字挺大,但正文没披露统计口径,是打开过就算,还是真在用的,不知道。新模型叫 Gemini 3.5 Flash,还换了套设计语言,另外 Omni 模型能把提示词直接生成视频,这点如果效果稳定,对内容创作挺省事。 重点在两项代理功能:Daily Brief 给你出个性化每日简报,Gemini Spark 号称能 7x24 小时替你管理任务。听着像能帮你订票、回消息、整理日程,但授权范围、出错率、隐私怎么处理,正文全没提。这种主动代理一旦翻车,代价比问答答错大得多。 还缺的是实际体验数据和限制条件。比如 Spark 能接管哪些 App,跨平台支持怎么样,延迟高不高。这些不说清楚,9 亿用户更像是个宣传数字,产品到底能不能用,还得等上手。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
19:57
27d ago
● P1AI HOT 精选· aihot-apiZH19:57 · 05·22
Anthropic 的 Project Glasswing 一个月内发现超万个高危软件漏洞
Anthropic 说,他们和大约 50 家合作伙伴用 Claude Mythos Preview 模型,在全球最关键的基础软件里找到了超过一万个高危或严重级别的漏洞。现在瓶颈已经不是找漏洞的速度,而是验证、通报和打补丁的速度。在开源软件扫描这块,模型自己估算发现了 6,202 个高危或严重漏洞,其中 1,752 个已经过独立安全公司或 Anthrop...
#Code#Agent#Benchmarking#Anthropic
精选理由
Anthropic 这次放出的不是模型跑分,而是 Claude 在真实关键系统里挖漏洞的战报。约 50 家合作伙伴用 Claude Mythos Preview 扫出超过一万个高危或严重漏洞,独立验证准确率 90.6%,说明模型在安全自动化这条线上已经从“能看”走到“能干活”了。我会先打个折:正文没披露漏洞类型分布、误报率和修复成本,也没说这 90.6% 是在什么条件下测的,所以准确率数字先别太激动。但不管怎么说,一万多个高危漏洞这个量级,加上 Mozilla、Cloudflare 这类合作方背书,对做安全自动化和关键基础设施防护的团队来说,是一个...
一句话点评
Anthropic 用新模型一个月扫出上万个高危漏洞,但具体细节要等补丁铺开才能说,现在看到的数字先打个折。
锐评
Anthropic 公布了 Project Glasswing 的首月数据:约 50 家合作方用 Claude Mythos Preview 模型,在各自的核心软件里总共发现了超过一万个高危或严重漏洞。Cloudflare 一家就找到 2000 个 bug,其中 400 个是高危或严重级别,而且误报率比人类测试员还低。Mozilla 测 Firefox 150 时挖出 271 个漏洞,是上一版用 Claude Opus 4.6 时的十倍多。这些数字说明 AI 找漏洞的速度已经远超人类,现在瓶颈变成了怎么快速验证、通报和打补丁。 在开源软件扫描上,Anthropic 自己用 Mythos Preview 扫了 1000 多个项目,模型自己估计有 6202 个高危或严重漏洞。其中 1752 个已经过外部安全公司复核,90.6% 是真漏洞,62.4% 确认是高危或严重级别。按这个比例推算,光开源项目就能筛出近 3900 个高危漏洞。wolfSSL 那个例子挺直观——模型直接构造了一个能伪造证书的攻击,影响数十亿设备。 不过要冷静看。Anthropic 自己说了,因为行业惯例是漏洞发现后 90 天才公开细节,现在披露的都是滞后指标。正文没给出漏洞的具体类型分布,也没说这些漏洞里有多少是模型独立发现、多少需要人工引导。英国 AISI 和 XBOW 的外部评测都夸模型能力强,但评测基准的覆盖面和真实攻防场景的差距有多大,文章没展开。另外,微软和甲骨文都说补丁量在猛增,但没提这些补丁对应的漏洞修复成本有多高。等补丁大规模部署后 Anthropic 承诺会放出更多细节,那时候才能判断这波 AI 挖漏洞到底改变了什么。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1
19:42
27d ago
● P1彭博科技· rssEN19:42 · 05·22
Anthropic融资超300亿美元,估值突破900亿
彭博社援引知情人士消息,Anthropic 计划最快下周关闭一轮超过 300 亿美元的融资,投后估值超过 9000 亿美元。这个数字会让它超过 OpenAI,成为全球最值钱的 AI 创业公司。不过正文被 Bloomberg 的机器人验证墙挡住了,具体条款、投资方和资金用途都没披露。
#Anthropic#OpenAI#Bloomberg#Funding
精选理由
彭博说 Anthropic 最快下周就能把这轮超过 300 亿美元的融资关掉,投后估值冲到 9000 亿美元以上,按这个数字它会超过 OpenAI 成为估值最高的 AI 初创公司。我会先打个折:正文没披露具体投资人、资金用途和估值计算方式,而且交易还没落袋,所以重要性停在 91 分,没往 95 以上推。但这条消息本身够直接——钱、时间、排名三个要素都给了,对关注前沿实验室资本动态的人就是一条硬消息。
一句话点评
Anthropic 这轮融的钱比原定目标还多,估值直接反超 OpenAI,但 9000 亿这个数字得看最终条款会不会缩水。
锐评
Anthropic 这轮融资的规模和速度都挺夸张。超过 300 亿美元、估值破 9000 亿,如果下周真能敲定,它会直接超过 OpenAI 成为估值最高的 AI 创业公司。这个估值背后有收入数据在撑:公司预计第二季度营收 109 亿美元,比上季度翻了一倍多,而且可能首次实现盈利。年化营收目标也喊到了 500 亿美元,去年 7 月这个数字才 40 亿,增长曲线很陡。 不过这些数字目前都来自彭博社引用的匿名消息源,最终投资承诺和条款还在谈,存在变数。文章没披露这轮融资的具体领投方和资金用途,也没说 9000 亿估值是投前还是投后。另外,年化营收是按短期收入推算全年,如果后续季度增速放缓,这个数字会打折扣。 我会先打个折看这件事:收入增长是真的猛,但估值已经跑到很前面了。还缺的是具体的投资人名单、资金怎么花,以及这轮融资后离上市还有多远。
HKR 分解
hook knowledge resonance
打开信源
100
SCORE
H1·K1·R1
14:36
27d ago
● P1AI HOT 精选· aihot-apiZH14:36 · 05·22
BitCPM-CANN开源发布,华为昇腾NPU原生训练1.58比特大模型
ModelBest、清华和OpenBMB搞了个BitCPM-CANN,从0.5B到8B都有,全程用华为昇腾910B NPU训练,没走英伟达路线。1.58比特三元量化意味着每个权重只取三种值,内存比BF16省了约6倍,能塞进手机、电脑和车载设备里跑。基准测试成绩保住了全精度模型的95-97%,这点挺实在。我会先打个折:正文没披露具体推理延迟和功耗数据,也...
#Inference-opt#Benchmarking#ModelBest#Tsinghua University
精选理由
HKR三项都站得住:昇腾910B全栈训练1.58比特开源模型这个角度够新,数据也扎实。没给P1是因为目前只有发布事实,缺少独立复现或实际落地效果的佐证,所以先放在featured。
一句话点评
面壁智能在华为昇腾 NPU 上原生训练并开源了 1.58-bit 大模型,显存省了约 6 倍,能力保留率 90% 以上,但正文没给具体评测基准和延迟数据。
锐评
这条消息最值得看的是“全栈国产算力跑通了极低比特训练”。BitCPM-CANN 从量化算子到训练框架全在昇腾 910B 上完成,意味着以后在华为卡上做 1.58-bit 模型有了公共基础设施,不用每家从头搭一遍。四个尺寸(0.5B 到 8B)都开源了,官方说推理显存比 BF16 省约 6 倍,能力保留率在 90% 到 97.2% 之间,8B 模型能塞进旗舰手机跑。 但先别太激动。文章没交代这个“能力保留率”是在哪些基准上测的,也没提推理延迟和吞吐。极低比特模型最怕的是生成质量在长文本或复杂任务上掉得厉害,光看一个百分比不够。另外,训练成本、与同尺寸全精度模型在真实业务场景下的对比也都没给。如果后续能补上这些,才能判断它是不是真能当端侧主力模型用。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1
11:17
27d ago
● P1AI HOT 精选· aihot-apiZH11:17 · 05·22
阿里千问 App、PC 及网页端上线 Qwen3.7-Max,免费可用
千问 App 更新到 6.9.7 版就能在对话框里切到 Qwen3.7-Max,PC 和网页端也一样,目前免费。官方说这个模型主打“让模型进业务流程干活”,能写代码、自动跑办公流程,还能扛住长任务——他们自己测了一次 35 小时、调用工具超过 1000 次的内核优化实验,全程没断思路。不过这些数据来自官方测试,实际体验会不会打折还得自己试。另外,API...
#Agent#Code#Tools#Alibaba
精选理由
阿里把 Qwen3.7-Max 铺到千问全线产品,门槛降到免费,还特意强调 35 小时连续工具调用没崩,摆明了在打 agent 可靠性和零成本体验这两张牌。我会先打个折:正文没给基准测试、上下文窗口和 API 定价,所以实际能力上限和商用成本还看不清。但就凭多端同步上线和这个压测结果,对正在选模型做工具链集成的人来说,是个值得立刻上手试的信号。
一句话点评
千问 App 更新后能免费用 Qwen3.7-Max,官方说它能跑 35 小时不断思路,但这是自家测试,实际稳不稳还得自己上手试。
锐评
阿里把最新的 Qwen3.7-Max 直接塞进了千问 App、PC 和网页端,更新到 6.9.7 版就能免费用。这个模型的核心卖点是“让模型进业务流程干活”,也就是所谓的智能体能力。官方给了一个很具体的数字:在一次内核优化实验里,它自主跑了 35 个小时,调用了超过 1000 次工具,全程没断思路。这个数字如果真实,说明它在处理长链条、多步骤任务时的稳定性确实不错,至少比动不动就忘掉上下文的模型强。 但这里有个关键信息缺口:这个 35 小时的测试是官方自己跑的,任务场景、失败重试次数、人工干预比例都没披露。所以这个数字更像一个上限参考,实际用起来,比如让它自动处理几十封邮件或写一个复杂项目,效果可能会打折。另外,文章提到它能跨框架部署,在 Claude Code 等工具里也能用,这对开发者是个好消息,不用被绑在单一工具上。 目前 API 还没上线,只能通过官方客户端体验。想评估它到底能不能扛住真实业务,最好等 API 开放后,用自己的任务跑一遍,重点关注它在第 20 步、第 50 步时的逻辑连贯性和错误恢复能力。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
04:30
27d ago
● P1AI HOT 精选· aihot-apiZH04:30 · 05·22
DeepSeek推进七百亿元融资,承诺坚持开源而非商业化
DeepSeek 正在敲定一笔约 700 亿元人民币的首轮外部融资,投前估值约 450 亿美元。腾讯、IDG 资本和砺思资本接近参投,梁文锋个人也可能注资约 200 亿元。他在投资者会议上明确表示,公司会继续做开源模型,目标是通用人工智能,而不是急着商业化。如果这笔钱到位,将创下中国科技初创公司首轮融资的最高纪录。不过文章也提到,具体金额和最终参投方仍...
#DeepSeek#Liang Wenfeng#Tencent#Funding
精选理由
HKR 三项都踩中了。700 亿融资规模本身就够炸,加上梁文锋个人可能跟投 200 亿,这种资金体量在开源模型公司里不常见,所以 H 给了。K 这边,450 亿美元估值、腾讯和 IDG 接近入局,以及梁文锋明确说坚持开源不急着商业化,都是能帮人判断行业水温的关键事实。R 更直接,这笔钱怎么花、开源路线能不能扛住商业化压力,会直接影响国内 AI 创业的资本逻辑和开源生态。分数没给到 95 以上,是因为交易还在推进,最终条款和交割都没披露,先打个折。
一句话点评
700亿融资、450亿美元估值,梁文锋自己还要再掏200亿,但承诺继续开源不急着变现——这个组合挺少见,先别太激动,钱到账再说。
锐评
DeepSeek这轮融资如果落地,700亿元人民币的规模会是中国科技初创公司首轮融资的最高纪录。投资前估值约450亿美元,腾讯、IDG和砺思资本接近确定参投,国家队也在里面。梁文锋个人可能注资约200亿,同时明确表示继续开发开源模型,目标是通用人工智能而不是短期变现。 这些数字很大,但正文没披露资金的具体用途——是买算力、养团队还是做生态?也没说开源会开到什么程度,是只放权重还是连训练方法、数据配比都公开。另外,报道来源是彭博社援引知情人士,最终参与者和金额都可能变,现在下结论还早。 如果梁文锋真的用个人资金跟投200亿,那他对控制权和长期路线的坚持会比口头承诺更有说服力。但反过来,这么大一笔钱进来,投资方对回报的耐心能有多久,正文完全没提。
HKR 分解
hook knowledge resonance
打开信源
99
SCORE
H1·K1·R1
02:58
27d ago
● P1彭博科技· rssEN02:58 · 05·22
DeepSeek 创始人把目标定为通用人工智能,同时一笔 100 亿美元的融资在推进
彭博这条快讯只给了标题,正文被付费墙挡住了。标题说 DeepSeek 创始人公开把 AGI(通用人工智能)设为目标,并且公司正在推进一轮 100 亿美元的融资。但创始人具体怎么说的、钱从哪来、谁领投、估值多少、钱打算怎么花,这些关键信息正文都没披露。100 亿这个数字放在 AI 创业公司里非常夸张,如果是真的,说明资本市场对 DeepSeek 的预期已...
#Reasoning#DeepSeek#Bloomberg#Funding
精选理由
标题信息量不小,但正文基本是空壳,没给出创始人原话、融资细节或任何时间线。我会先打个折:这条消息的传播价值在于 DeepSeek 把 AGI 目标和巨额融资同时抛出来,信号很强,但事实支撑很弱。Bloomberg 的稿子只给了标题级事实,投资人是谁、钱怎么花、估值多少全没写,所以重要性停在 86 分是合理的,不能再往上拉。
一句话点评
DeepSeek 创始人公开把 AGI 当目标,同时 100 亿美元融资在推进。但正文被付费墙挡住,具体谁投、估值多少、钱怎么花全没披露,先别太激动。
锐评
这条消息只有标题,正文被彭博的付费墙挡得严严实实,所以能确认的事实非常有限。标题透露了两件事:一是 DeepSeek 创始人首次公开把 AGI(通用人工智能)设为公司目标,二是公司正在推进一轮 100 亿美元的融资。100 亿这个数字放在 AI 创业公司里极其夸张,如果属实,说明资本市场对 DeepSeek 的预期已经拉到了和 OpenAI 差不多的量级。但关键信息全是缺口——创始人原话怎么说的、是内部信还是公开演讲、这轮融资谁领投、估值多少、钱打算砸在算力还是人才上,正文都没披露。另外,喊 AGI 目标本身在 2026 年这个节点不算新鲜事,各家头部公司都在喊,重点要看有没有配套的路线图或阶段性验证指标。这条新闻目前更像一个信号,说明 DeepSeek 在资本层面要搞大动作,但具体怎么搞、能不能搞成,还得等更多细节出来才能判断。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
00:00
28d ago
● P1Computing Life · Share · 鸭哥调研· rssZH00:00 · 05·22
智谱发布GLM-5.1高速版API,输出速度达每秒400个token
智谱在 5 月 22 日放出了 GLM-5.1 高速版 API,输出速度标称 400 tokens/s,是人类阅读速度的 80 倍以上。这个速度不是靠传统编译优化“调”出来的,而是底层的 TileRT 推理引擎把 GPU 的工作模式从“批处理车间”改成了“连续流水线”——取消计算步骤之间的等待和隔离,让数据持续流动,GPU 不再频繁启停。模型本身也做了...
#Inference-opt#Zhipu#GLM-5.1#TileRT
精选理由
400 tokens/s 是个好钩子,但正文没交代测试条件、并发数、输入长度和计费规则,所以速度先打个折看。TileRT 的说法有信息量,不过没展开具体怎么重构执行模型,技术细节偏薄。整体对从业者有提醒价值,但缺少独立验证,所以分数停在 78 不动。
一句话点评
智谱把旗舰模型的速度拉到400 tokens/s,不是靠换小模型,而是重写了推理引擎。这点挺狠,但正文没提价格和实际延迟,先别急着喊“最快”。
锐评
智谱这次发布的GLM-5.1高速版,直接把API输出速度干到了每秒400个token,刷新了全球大模型厂商的公开纪录。更值得关注的是,它没走“用小模型换速度”的老路,而是声称在旗舰级模型上做到了低延迟。技术实现上,他们和TileRT团队合作,在推理引擎、调度系统和基础设施三个层面做了系统级优化。简单说,就是通过提前编译、把计算任务常驻在GPU里,省掉了大量调度和同步的开销,让单卡吞吐能力更高,多卡协同也更聪明。 不过,这篇IT之家的报道主要来自厂商通稿,缺少第三方实测数据。400 tokens/s是稳定输出还是瞬时峰值?在高并发下尾延迟到底压到了多少?这些关键指标都没给。另外,价格也没披露,速度快但成本如果翻倍,对生产环境来说意义就大打折扣。目前这个API只开放给部分企业客户,普通开发者还没法验证。 总的来说,技术思路有突破,但实际效果还得等更多独立评测和定价信息出来才能下判断。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1

更多

频道

后台