ax@ax-radar:~/curated $ grep -l 'curated=true' sources/
40 srcsignal 72%cycle 04:32

AX 严选

200 · updated 3m ago
按日期浏览1018 · 44
2026-06-01 · 星期一2026年6月1日
13:30
17d ago
AI HOT 精选· aihot-apiZH13:30 · 06·01
微软研究:评估智能体行为,代码库比文档更管用
微软研究团队发帖说,大规模评估智能体行为时,用代码库比看文档效果更好。他们没透露具体评估了多少样本、用了什么协议,但直接抛出一个结论:代码库能更真实地反映智能体在任务中的表现。同时,他们邀请全球研究者一起搞“价值对齐”——就是让AI的行为符合人类价值观。正文没披露评估规模或具体协议,这点先别太激动。
#Agent#Alignment#Benchmarking#Microsoft Research
精选理由
微软研究院这篇讲智能体行为评估,核心结论是代码库比文档更有效,但没交代评估用了多少样本、什么场景,验证力度打折扣。价值对齐部分只是邀请参与,没有具体方法或数据。对从业者来说,代码库优于文档这个判断可以拿来参考,但别直接照搬——规模未知,效果可能不通用。整体信息密度中等,适合泛读标记。
一句话点评
微软研究说,大规模测智能体时,用代码库比看文档更准。但正文没披露测了多少样本、用了什么协议,结论可信度要打折。价值对齐是邀请全球一起搞,没给具体方法。
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H0·K1·R1
10:24
17d ago
AI HOT 精选· aihot-apiZH10:24 · 06·01
Runway 在伦敦设欧洲总部,砸钱搞世界模型
Runway 宣布在伦敦设立欧洲总部和世界模型研究中心,计划 18 个月内向英国 AI 生态投 1 亿美元,到 2028 年翻倍。欧洲是 Runway 第二快增长市场,过去一年订阅销量涨了 50%,已有数百万用户,20% 的企业客户在欧洲,包括 BBC、Fremantle 和 WPP。世界模型是 Runway 的核心方向,想用它做机器人、科研和工业模拟...
#Multimodal#Robotics#Runway#BBC
精选理由
Runway 在伦敦设欧洲总部和世界模型研究中心,计划18个月投1亿美元,2028年前翻倍。有地点、有投资额、有时间线,信息够具体。但正文没披露任何新模型、论文或产品能力,属于常规行业新闻的上限。
一句话点评
Runway 在伦敦设欧洲总部,18 个月内投 1 亿美元,到 2028 年翻倍。欧洲订阅销量一年涨 50%,已有数百万用户,20% 企业客户在欧洲,包括 BBC、WPP。世界模型是核心方向,想用于机器人、科研和工业模拟。正文没披露具体模型进展或技术细节,更像区域扩张和人才招聘公告。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
07:00
17d ago
AI HOT 精选· aihot-apiZH07:00 · 06·01
Cursor 团队版涨价:新增高级席位,用量池分开算
Cursor 更新了 Teams 定价,核心三件事:第一,每个标准席位(年付 $32/月,月付 $40/月)的用量拆成两个独立池子——自家模型 Composer/Auto 一个池,第三方 API 另一个池,互不挤占,相当于变相提了额度。第二,新增 Premium 席位,年付 $96/月(标准的三倍价格),但用量是标准的五倍,官方说 99% 的重度用户一...
#Code#Tools#Cursor#Product update
精选理由
HKR三项全过,但这是Cursor Teams的定价机制更新,不是新的Agent能力或模型发布,落在60–71的产品/业务更新区间,所以给69分和all层级。
一句话点评
Cursor 把标准席位的用量拆成自家模型和第三方 API 两个独立池子,互不挤占,相当于变相提了额度。新增 Premium 席位,年付 $96/月(标准三倍价),但用量是五倍,官方说能覆盖 99% 重度用户一整月。对团队来说,混搭席位比全员升档更省钱。但正文没披露具体池子大小,没法算实际性价比。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
06:13
17d ago
AI HOT 精选· aihot-apiZH06:13 · 06·01
英伟达和台积电把AI搬进晶圆厂,用GPU加速光刻、仿真和质检
英伟达宣布台积电正在用它的GPU和AI工具改造芯片制造流程,覆盖计算光刻、晶体管仿真、制程控制和晶圆厂运营。具体来说:cuLitho把光刻环节的成本效益或生产周期优化了20%到50%(正文没说是成本降了还是周期短了);cuEST让化学仿真平均快了50倍;cuML用来分析数万道工序里的几十万个参数,降低制程波动;H200 GPU做排程运算来提升产能。另外...
#NVIDIA#TSMC#Product update
精选理由
H和R勉强过关,因为英伟达、台积电和晶圆厂确实戳中算力供应链。K直接挂掉:没披露任何可验证的机制或指标,所以只能归到低信息密度的常规报道档位。
一句话点评
英伟达和台积电把AI塞进晶圆厂,覆盖光刻、仿真、质检、排程。cuLitho声称优化20%-50%,但没说是降本还是提速,这点先别太激动。cuEST仿真快50倍,cuML分析几十万参数降波动,H200做排程提产能。数字挺好看,但正文没披露具体产线、部署规模、实测良率提升,更像产品宣传片。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R1
05:00
18d ago
AI HOT 精选· aihot-apiZH05:00 · 06·01
NVIDIA 和 Google Cloud 在 Google I/O 上宣布合作,面向超过 10 万开发者提供 L4 GPU 和 Gemini 模型支持
NVIDIA 和 Google Cloud 在 Google I/O 大会上宣布扩大合作,面向超过 10 万开发者。核心是提供 NVIDIA L4 Tensor Core GPU,用于 AI 推理和图形处理——说白了就是让模型跑得更快、画图更流畅。同时,Vertex AI 平台开始支持 Gemini 模型,开发者可以直接调用。还放出了一批开源工具,覆盖...
#Inference-opt#Tools#NVIDIA#Google Cloud
精选理由
触发了硬排除规则:云厂商合作推广。NVIDIA与Google Cloud的项目有具体数字,但本质仍是厂商宣传,没有颠覆性产品,因此重要性上限为39。
一句话点评
NVIDIA和Google Cloud在I/O大会上宣布扩大合作,面向10万+开发者。核心是提供L4 GPU用于推理和图形处理,Vertex AI平台也支持Gemini模型。说白了就是让模型跑得更快、画图更流畅,开发者可以直接调用。还放出一批开源工具,覆盖AI应用构建和部署流程。 短评:大厂联手铺基建,对开发者是好事,但具体性能提升、成本降低等关键数据没披露,别急着激动。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H0·K1·R1
04:49
18d ago
AI HOT 精选· aihot-apiZH04:49 · 06·01
NVIDIA 开源 AlpaGym:让自动驾驶模型在模拟器里“边开边学”,弥补训练和实际部署的差距
NVIDIA 发布了 AlpaGym,一个用于自动驾驶模型后训练的强化学习框架。核心思路是:之前模型训练大多是“开环”的,只看模型输出和标准答案的差距,不看这个输出放到真实环境里会引发什么后果。AlpaGym 把模拟器 AlpaSim 的反馈直接连到训练循环里,让模型在模拟场景里“边开边学”,自己踩的坑自己记住。这样能暴露静态数据集里发现不了的错误累积...
#Robotics#Reasoning#NVIDIA#Research release
精选理由
HKR-K通过,因为文章解释了闭环后训练的概念;但HKR-H/R不通过:没有基准数据、数据规模或广泛的行业钩子。这是一篇狭窄的NVIDIA开发者教程,不是硬排除项。
一句话点评
NVIDIA 把自动驾驶模型训练从“对答案”改成“进模拟器边开边学”,让模型自己踩坑自己改。关键是用 AlpaSim 模拟器做强化学习,模型每次刹车、转向的后果都反馈回训练循环,能暴露静态数据集里发现不了的错误累积。但正文没披露用了多少场景、跑了多少步、比开环训练提升多少,目前更像一个工具框架发布,效果验证还缺数据。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
04:35
18d ago
AI HOT 精选· aihot-apiZH04:35 · 06·01
Nemotron 3 Ultra 本周发布
NVIDIA AI 官方账号发了一条推文,说 Nemotron 3 Ultra 本周发布。正文只有这一句,没提模型参数量、上下文窗口、许可证、价格或发布渠道。目前能确认的只有发布时间窗口,其他信息等后续披露。
#NVIDIA#Product update
精选理由
H 和 R 通过,K 不通过:这只是一条 Nemotron 3 Ultra 的预告,没有规格、许可证或访问路径,属于小型产品更新。
一句话点评
NVIDIA 官宣 Nemotron 3 Ultra 本周发,但推文就一句话,没提参数量、上下文窗口、许可证或价格。目前只能确认发布时间,其他全是空。短评:先别激动,等具体参数和开源情况。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
03:59
18d ago
AI HOT 精选· aihot-apiZH03:59 · 06·01
NVIDIA Vera CPU:专为AI智能体工作负载设计的服务器芯片
NVIDIA发了一篇博客,讲他们新出的Vera CPU怎么给AI智能体(就是那种会自己调用工具、跑代码、查资料的模型)提速。核心逻辑是:以前大家只盯着GPU,但智能体每干一步——比如编译代码、跑个Python脚本、查数据库——都得靠CPU执行,而且步骤越多,CPU就成了瓶颈。Vera CPU有88个自研核心,配1.2 TB/s的LPDDR5X内存带宽,...
#Agent#Inference-opt#NVIDIA#Product update
精选理由
HKR-K勉强通过:Vera CPU明确关联了智能体工作负载和四种扩展机制。HKR-H和HKR-R不通过,因为正文只有厂商话术,没有性能、定价或可用性数据。
一句话点评
NVIDIA 发了一篇博客,说他们新出的 Vera CPU 专门给 AI 智能体(会自己调用工具、跑代码、查资料的那种模型)提速。核心逻辑是:以前大家只盯着 GPU,但智能体每干一步——比如编译代码、跑个 Python 脚本、查数据库——都得靠 CPU 执行,而且步骤越多,CPU 就成了瓶颈。Vera CPU 有 88 个自研核心,配 1.2 TB/s 的 LPDDR5X 内存带宽,官方说能...
HKR 分解
hook knowledge resonance
打开信源
50
SCORE
H0·K1·R0
03:39
18d ago
● P1AI HOT 精选· aihot-apiZH03:39 · 06·01
MiniMax 开源 M3 模型,支持百万 token 上下文和原生多模态
MiniMax 把 M3 模型开源了,权重公开可下载。它把三个能力塞进了一个模型里:编程水平摸到了 GPT-5.5 和 Gemini 3.1 Pro 的边(SWE-Bench Pro 得分 59.0%),能处理 100 万 token 的超长上下文,还原生支持图片和视频输入。长上下文不卡顿的关键是他们自研的 MSA 稀疏注意力机制——在 100 万 t...
#Code#Agent#Multimodal#MiniMax
精选理由
MiniMax M3开源了一个把文本、图像、音频塞进同一个模型的一体方案,上下文窗口拉到100万token。最实在的点是MSA注意力机制,每token计算成本降到前代的1/20,长文本推理能省不少钱。编码和Agent跑分看着不错,但正文没给出具体对比对象和测试细节,这点先别太激动。整体是一次有诚意的开源发布,信息量够,但验证还缺一环,所以放在featured而不是P1。
一句话点评
MiniMax 开源了 M3,一个模型同时搞定写代码、读百万 token 长文和看图看视频,目前开源模型里第一个做到这三合一的。
锐评
M3 最值得看的是它把三个能力打包进一个开源模型:写代码、处理超长上下文(100 万 token,差不多能一次吞下三体三部曲的量)和原生多模态(直接看懂图片和视频)。这在闭源模型里已经是标配,但开源模型里 M3 是第一个同时做到的。 性能数字挺能打:SWE-Bench Pro 编程测试拿了 59%,超过了 GPT-5.5 和 Gemini 3.1 Pro,逼近 Opus 4.7。在 SVG 生成和文档理解上也有超过头部闭源模型的成绩。不过这些基准测试和真实使用场景有差距,MiniMax 自己也承认了,所以他们搞了个模拟真实开发者行为的交互式评估框架,但正文没披露这个框架的具体数据和验证方式。 长上下文能跑起来靠的是他们自研的 MSA 稀疏注意力架构,把计算量砍到了原来的二十分之一,预填充阶段快 9 倍以上,解码阶段快 15 倍以上。这个优化思路很实际,但正文没给出 MSA 在哪些能力上比全注意力有明显折损,只说“绝大多数能力匹配”。这点先别太激动,等第三方实测。另外,模型权重开放到什么程度、商用条款怎么样,正文也没提,想直接拿来用的得自己去翻他们的授权协议。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K1·R1
03:36
18d ago
AI HOT 精选· aihot-apiZH03:36 · 06·01
NVIDIA 把 AI 工厂的操作系统 DSX OS 开源了,目标是省电、快上线、少宕机
NVIDIA 正式发布了 DSX OS,这是一套专门给 AI 工厂(大规模跑推理和训练的算力集群)用的开源、模块化软件栈。它覆盖了从能源、芯片、基础设施到模型和应用五个层面,核心目标是让 AI 工厂更快投产、更省电、更稳定。正文提到,DSX OS 能把固定电力预算下能跑的 GPU 数量提升最多 40%,对推理性能影响很小——这对电费占大头的算力运营方来...
#Inference-opt#Tools#NVIDIA#Product update
精选理由
触发硬排除-纯营销:NVIDIA官方博客介绍了DSX OS的堆栈框架,但未披露版本、定价、部署条件或可验证的性能。HKR-K勉强通过;HKR-H/R不通过。
一句话点评
NVIDIA 把 AI 工厂的软件栈开源了,叫 DSX OS,覆盖能源、芯片、基础设施、模型和应用五层。核心卖点:固定电力下 GPU 数量最多能提 40%,对推理性能影响很小——电费大头玩家可以算算账。但正文没披露版本号、定价和部署门槛,开源到什么程度、能不能直接上手跑还不清楚。先别太激动,等实测。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K1·R0
02:16
18d ago
AI HOT 精选· aihot-apiZH02:16 · 06·01
上海发文支持多模态智能体,自动驾驶要在共享出行和物流里落地
上海市政府发了服务业“十五五”规划,明确要支持多模态智能体开发,推动智能客服、智能运营这些工具规模化用起来。自动驾驶方面,说要“有序推进”在共享出行、物流运输等场景的应用。规划还提了具身智能,让机器人进家庭、养老、文旅场景。不过正文没披露具体预算、时间表或落地目标,所以目前还只是方向性表态,不是执行方案。
#Agent#Multimodal#Robotics#Shanghai Municipal People's Government
精选理由
这是一份上海市政府办公厅印发的服务业“十五五”规划摘要,点名支持多模态智能体、MaaS、智能驾驶和具身智能产品,场景覆盖共享出行、物流、家庭、养老、文旅。信息本身有政策指向性,但正文没披露资金规模、落地时间表或具体试点项目,所以只能算政策风向,不是执行信号。评分卡在66分合理:知道方向,但没法判断力度和节奏。
一句话点评
上海发了服务业“十五五”规划,明确支持多模态智能体、智能驾驶和具身机器人。方向很全,但正文没披露预算、时间表或落地目标,目前只是方向性表态,不是执行方案。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
00:00
18d ago
AI HOT 精选· aihot-apiZH00:00 · 06·01
AI 看跌情绪地图:做空比例最高的是 GPU 云厂商,不是英伟达
风投 Tomasz Tunguz 统计了 AI 相关股票的做空比例(卖空股数/总流通股),发现市场对 AI 的怀疑集中在特定板块,不是全面看空。AI 云和 neocloud(GPU 算力租赁公司)的中位做空比例最高,达 16.8%,远高于 SaaS 的 9.5% 和开发者工具的 8.9%。做空比例最高的个股都是中小市值公司:SoundHound AI ...
#NVIDIA#Commentary
精选理由
HKR三项都达标,但原文只给了空头比例对比,没有列出具体公司、时间窗口或统计方法。作为市场情绪评论有用,但信息缺口明显,不值得上精选。
一句话点评
风投 Tomasz Tunguz 统计了 AI 相关股票的做空比例,发现市场对 AI 的怀疑集中在特定板块,不是全面看空。AI 云和 neocloud(GPU 算力租赁公司)的中位做空比例最高,达 16.8%,远高于 SaaS 的 9.5% 和开发者工具的 8.9%。做空比例最高的个股都是中小市值公司:SoundHound AI 36.3%、C3.ai 32.2%、BigBear.ai 29...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K1·R1
00:00
18d ago
AI HOT 精选· aihot-apiZH00:00 · 06·01
xAI 发布 Composer 2.5,一个主打“跑长任务、跟复杂指令”的编程模型
xAI 在 Grok Build 里上线了 Composer 2.5,入口在 /models 菜单里选。官方说它“快、先进、擅长长时间任务和复杂指令”,但正文没披露上下文窗口、跑分结果和定价。目前只对 SuperGrok 和 X Premium+ 用户开放,所以普通用户暂时用不了。如果你已经在用 Grok Build,可以敲 /model 切过去试试,...
#Code#xAI#Product update
精选理由
HKR-K 通过是因为文章给出了 Grok Build 的入口和付费层级访问方式。HKR-H/R 都弱:没披露价格、上下文窗口或基准结果,所以这只是一个常规的小版本更新。
一句话点评
xAI 发了 Composer 2.5,说是快、擅长长任务和复杂指令,但正文没披露上下文窗口、跑分和定价。目前只对 SuperGrok 和 X Premium+ 用户开放,普通用户用不了。如果你已经在用 Grok Build,可以敲 /model 切过去试试。 短评:xAI 发了个新编程模型,但关键参数全没给,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
2026-05-31 · 星期日2026年5月31日
23:48
18d ago
AI HOT 精选· aihot-apiZH23:48 · 05·31
MiniMax M3 即将发布,已开放免费试用
MiniMax 的下一代模型 M3 马上要来了,现在已经在 OpenCode 上可以免费试用。正文没提模型参数量、正式定价、发布日期或试用次数限制,所以具体能力边界和成本还不清楚。
#Code#MiniMax#OpenCode#Product update
精选理由
HKR-H 和 HKR-K 靠免费试用这个钩子勉强通过,但 HKR-R 缺失:正文没披露规格、定价、发布时间和试用限制,所以这条信息停留在低价值的产品更新区间。
一句话点评
MiniMax M3 已在 OpenCode 上开放免费试用,但正文没披露参数量、定价、发布日期和试用次数限制。能免费上手是好事,但具体能力边界和成本还不清楚,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H1·K1·R0
18:32
18d ago
AI HOT 精选· aihot-apiZH18:32 · 05·31
DeepSeek V4 Flash 上线 OpenCode Zen
DeepSeek V4 Flash 已经可以在 OpenCode Zen 上用了。不过正文没披露模型参数、定价、上下文窗口和访问条件,所以暂时没法判断它比 V3 强在哪、贵不贵。
#Code#DeepSeek#OpenCode Zen#Product update
精选理由
HKR-H 靠 DeepSeek V4 Flash 这个命名钩子通过,但 K 和 R 都缺规格或工作流影响。就是个小的产品上线通知,没有硬性排除理由。
一句话点评
DeepSeek V4 Flash 上线 OpenCode Zen,但正文没披露参数、定价、上下文窗口和访问条件,所以暂时没法判断它比 V3 强在哪、贵不贵。短评:上线消息,缺关键参数,先别激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R0
16:38
18d ago
AI HOT 精选· aihot-apiZH16:38 · 05·31
教皇比Geoffrey Hinton更懂AI?
Gary Marcus发了一篇短文,核心观点是:看AI输出了什么,不等于知道它怎么输出的。他拿教皇的一条推文举例——教皇说真正的理解来自经验,不是文本近似。Marcus认为Hinton最近一次访谈里犯了和Richard Dawkins一样的错:把LLM的模仿当成了有意识。Marcus强调,LLM研究者不是在造有感知的“存在”,而是在造一种“互动小说”,...
#Interpretability#Reasoning#Geoffrey Hinton#Commentary
精选理由
标题有钩子,但正文没披露具体论据,比如教皇说了什么、Hinton的什么观点被对比、有没有实验或案例支撑。信息缺口明显,属于观点评论而非事实报道,因此重要性压到36,排除出tier。
一句话点评
Gary Marcus 拿教皇的推文怼 Hinton:看 LLM 输出什么不等于知道它怎么输出的。教皇说“真理解来自经验,不是文本近似”,Marcus 补了一句——LLM 是在造互动小说,不是造有感知的存在。观点不新,但 Marcus 没给任何实验证据,全文就是观点复读。适合当辩论素材,别当技术分析。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H1·K0·R1
2026-05-30 · 星期六2026年5月30日
15:09
19d ago
AI HOT 精选· aihot-apiZH15:09 · 05·30
OpenAI 送开源维护者半年 Pro,价值 1200 美元,有项目链接就能领
OpenAI 给开源项目维护者发福利:免费领 6 个月 ChatGPT Pro(价值 1200 美元),申请没有硬性 GitHub Star 数要求,只要有项目链接就行。正文还聊了 AI 工具分类:一类是“agent 型”(比如 Claude Code、Codex),能自己跑;另一类是“实习生型”(比如 Cursor),需要人做决策、培养判断力,但缺点...
#Agent#Code#Tools#OpenAI
精选理由
H/K/R都过:1200美元和6个月是明确钩子,申请条件具体(无Star门槛、有项目链接即可)。但只是社区小福利,不是ChatGPT能力或平台更新,所以落在60–71的all档。
一句话点评
OpenAI 给开源项目维护者送 6 个月 ChatGPT Pro(价值 1200 美元),申请不卡 GitHub Star 数,有项目链接就行。正文还聊了 AI 工具分类:一类是“agent 型”(如 Claude Code、Codex),能自己跑;另一类是“实习生型”(如 Cursor),需要人做决策、培养判断力,但缺点是需要人在场。作者推荐了网易 UU 远程工具,称免费两年、4K 14...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
11:04
19d ago
AI HOT 精选· aihot-apiZH11:04 · 05·30
阶跃星辰发了个开源多模态模型,但正文只说了四个字
阶跃星辰在 X 上发帖称发布了一款开源多模态模型,配文只有“小即是美”。正文没披露模型名称、参数量、权重许可证、发布物或基准测试结果,信息缺口很大,目前无法判断模型大小、能力或开源诚意。
#Multimodal#StepFun#Open source#Product update
精选理由
HKR三项全挂:帖子只有一句口号和发布类别,没有模型名称、参数量、许可证或基准。按0/3规则,直接排除,分数上限40。
一句话点评
阶跃星辰发帖说开源了一个多模态模型,配文只有“小即是美”。但正文没披露模型名称、参数量、权重许可证、发布物或基准测试结果,信息缺口很大,目前无法判断模型大小、能力或开源诚意。短评:标题党,信息太少,先别激动。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
00:36
20d ago
AI HOT 精选· aihot-apiZH00:36 · 05·30
阿里云和Qwen拿下欧足联六年合同,给足球比赛当AI后台
阿里云和Qwen成了欧足联(UEFA)的独家AI、云计算和电商合作伙伴,从2027/28赛季一直签到2032/33赛季,还覆盖2028年欧洲杯。合作内容是用Qwen大模型和阿里云基础设施来搞赛事运营、球迷互动、媒体内容和沉浸式观赛。蔡崇信说会投入全栈AI和电商能力。合同期六年,说明阿里云在体育行业拿了个长期大单,但正文没披露具体金额和落地场景细节,比如...
#Multimodal#Tools#Alibaba Cloud#Qwen
精选理由
正文只确认了阿里云和Qwen成为欧足联多年独家AI、云计算与电商合作伙伴,覆盖2027/2028至2032/2033赛季及EURO 2028,但未披露任何AI能力、部署方式或可验证的落地效果,属于纯营销公告,因此重要性上限为39。
一句话点评
阿里云签下欧足联六年长约,从2027/28赛季到2032/33赛季,覆盖2028年欧洲杯。合作内容是用Qwen大模型和阿里云基础设施搞赛事运营、球迷互动和沉浸式观赛。这是阿里云在体育行业拿下的长期大单,但正文没披露具体金额和落地场景细节,比如Qwen具体用在哪个环节、球迷互动怎么做。合同期长说明双方信任度高,但没金额就不好判断投入规模。短评:阿里云拿下欧足联六年AI大单,但没披露金额和具体落...
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K1·R0
2026-05-29 · 星期五2026年5月29日
23:58
20d ago
AI HOT 精选· aihot-apiZH23:58 · 05·29
ComfyUI 现在能直接调 OpenRouter 的 20 多个模型了
ComfyUI 新版本接入了 OpenRouter,你可以在同一个工作流里直接选 20 多个模型,不用再单独配置每个模型的 API。对做图生图、视频生成这类需要反复试模型的人来说,省了来回切换的麻烦。不过正文没提具体支持了哪些模型、有没有请求次数限制,也没说 ComfyUI 版本号,想用的话得自己去试。
#Tools#ComfyUI#OpenRouter#Product update
精选理由
HKR-K 和 HKR-R 通过:ComfyUI 工作流里能直接调 20 多个 OpenRouter 模型,省去来回切换工具。正文没披露版本号、费用和调用限制,只能算小产品更新。
一句话点评
ComfyUI 直接调 OpenRouter,工作流里能选 20 多个模型,省去挨个配 API 的麻烦。对反复试模型做图、做视频的人挺方便。但正文没提具体支持哪些模型、有没有调用次数限制,也没说 ComfyUI 版本号,想用还得自己试。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
22:31
20d ago
AI HOT 精选· aihot-apiZH22:31 · 05·29
DynoSim:用模拟跑一遍部署配置,省下大把GPU时间
NVIDIA 发了一个叫 DynoSim 的模拟器,专门用来调大模型推理服务的部署参数。调过的人都知道,模型后端、张量并行、调度策略、路由、KV 缓存这些变量互相影响,改一个可能把瓶颈挪到别处,而且跑一次真实实验就要占一堆 GPU。DynoSim 的思路是用离散事件模拟把整个 Dynamo 推理栈跑一遍,在虚拟时钟上模拟请求到达、调度、前向传播、KV ...
#Inference-opt#NVIDIA#Commentary
精选理由
HKR-K和HKR-R是弱正面:推理优化相关,但正文只给出了变量类别,省略了DynoSim机制、可复现结果和发布状态。
一句话点评
NVIDIA 发了个叫 DynoSim 的模拟器,专门用来调大模型推理服务的部署参数。调过的人都知道,模型后端、张量并行、调度策略、路由、KV 缓存这些变量互相影响,改一个可能把瓶颈挪到别处,而且跑一次真实实验就要占一堆 GPU。DynoSim 的思路是用离散事件模拟把整个 Dynamo 推理栈跑一遍,在虚拟时钟上模拟请求到达、调度、前向传播、KV 缓存等行为,而不是真的去跑 GPU。它用 ...
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
22:23
20d ago
AI HOT 精选· aihot-apiZH22:23 · 05·29
Claude Design Card:把文字一键转成公众号首图和小红书卡片,支持28种布局
这是一个专为中文内容创作者设计的开源工具,能把文字、链接或文章直接生成视觉卡片,比如公众号首图、小红书图文卡、教程步骤卡。它自动提炼重点、选版式、生成HTML再截图成PNG,省掉手动用Figma或Canva的步骤。支持28种布局和10种主题,核心价值是自动化“写完文章后最繁琐的排版流程”。开源,适合经常发内容的创作者试试。
#Tools#claude-design-card#Figma#Canva
精选理由
HKR-H 和 HKR-K 通过:它把文字/链接/文章一键转成公众号首图、小红书卡片,对做内容运营的人是个实在的钩子,而且明确写了 28 种布局、10 种主题。HKR-R 弱:这是个 Claude 周边的小工具,不是模型能力或市场级别的发布,对多数从业者参考价值有限。
一句话点评
这个开源工具能把文字/链接一键转成公众号首图、小红书卡片,支持28种布局和10种主题,省掉手动开Figma的步骤。核心是自动提炼重点→选版式→生成HTML→截图PNG。开源免费,适合高频发内容的创作者。不过正文没披露生成一张图要多久、截图质量是否稳定,实际体验可能打折扣。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
21:03
20d ago
AI HOT 精选· aihot-apiZH21:03 · 05·29
ChatGPT 对话目录功能上线
ChatGPT 现在给超过5条回复的对话加了个目录,方便你快速跳转到聊到哪了。正文没说是全平台推送还是灰度测试,也没提用户能不能手动开关。
#Tools#ChatGPT#OpenAI#Product update
精选理由
HKR-K和HKR-R通过:5条回复触发条件具体,长对话导航痛点真实。HKR-H不通过:这只是一个小功能更新,平台范围和开关条件正文都没披露。
一句话点评
ChatGPT 给长对话加了目录,超过5条回复自动生成,方便跳转。官方没说是不是全量推送,也没提能否关闭。小改进,但长聊场景挺实用。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
20:40
20d ago
AI HOT 精选· aihot-apiZH20:40 · 05·29
Luma Agents 上线:输入内容自动生成宣传图
Luma Labs 宣布 Luma Agents 可以根据用户输入的内容和定义的“钩子”自动生成宣传图,省去手动设计。但正文只给了 App 链接,没提模型细节、定价、输出数量限制或上线范围,实际效果和成本还不清楚。
#Agent#Tools#Multimodal#Luma Labs
精选理由
HKR-H 靠“输入内容生成宣传图”这个自动化钩子过关,但 K 和 R 都很弱。没有硬性排除理由,所以留在低优先级的产品更新档位。
一句话点评
Luma 出了个“宣传图自动生成”工具,你给内容和一句钩子,它就能出图。正文只扔了个 App 链接,没提用了什么模型、怎么收费、一次能出几张、哪些地区能用。效果和成本全是问号,先别激动。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
20:10
20d ago
AI HOT 精选· aihot-apiZH20:10 · 05·29
Runway API 上新了五个模型,包括视频生成和图像放大
Runway API 新增了五个模型:Seedance 2.0(视频生成)、GPT Image 2(图像生成)、HappyHorse 1.0(未知用途)、Nano Banana Pro(可能是轻量模型)和 Magnific Precision Upscaler V2(图像放大)。官方说可以在一个接口里调用这些模型,但正文没披露价格、响应速度、调用次数限...
#Multimodal#Vision#Tools#Runway
精选理由
Runway API 例行端点扩展:HKR-K 有具体的模型列表,HKR-R 适合多模态集成决策,但 HKR-H 较弱,且正文没有给出定价、限制、延迟或新能力。
一句话点评
Runway API 一口气加了五个模型,包括视频生成 Seedance 2.0、图像生成 GPT Image 2、放大工具 Magnific Precision Upscaler V2,还有两个用途不明的 HappyHorse 1.0 和 Nano Banana Pro。官方说一个接口就能调,但没披露价格、响应速度、调用次数限制和地区可用性。如果价格合理,对想快速集成多种生成能力的开发者挺...
HKR 分解
hook knowledge resonance
打开信源
67
SCORE
H0·K1·R1
19:15
20d ago
AI HOT 精选· aihot-apiZH19:15 · 05·29
LlamaIndex 给 Google 新出的 Agents API 搭了个文档解析模板
LlamaIndex 团队基于 Google 刚发布的 Agents API 做了一个模板,让智能体能直接调用 LlamaParse 和 LiteParse 来解析非结构化文档。流程分四步:先配好 Git 仓库地址,把仓库克隆到智能体沙箱里,装上 LiteParse 命令行工具和 LlamaParse 的 SDK,最后用提示词驱动智能体干活。说白了就是...
#Agent#Tools#LlamaIndex#Google
精选理由
这是个小众开发者工具的模板更新:HKR-K靠具体的配置步骤和解析流程通过;HKR-H没有悬念或惊喜,不成立;HKR-R范围窄,没有行业争议点,所以定级为all而非featured。
一句话点评
LlamaIndex 给 Google Agents API 套了个模板,让智能体能直接调 LlamaParse 和 LiteParse 解析非结构化文档。流程四步:配 Git 仓库、克隆到沙箱、装 CLI 和 SDK、用提示词驱动。说白了就是把文档解析能力打包成智能体技能。 亮点是省去自己写工具调用的麻烦,适合快速搭文档处理流水线。但正文没披露解析速度、成本、支持的文件类型上限,也没说沙...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R0
19:00
20d ago
AI HOT 精选· aihot-apiZH19:00 · 05·29
Google 用 AI Studio 搞了个 I/O 2026 测验,全程“氛围编程”
Google 拿自家 AI Studio 工具,用“氛围编程”(就是靠自然语言描述需求让模型写代码,不手敲)做了个 I/O 2026 的在线测验。正文只说了工具和主题,没透露用了哪个模型、具体提示词怎么写、工作流怎么搭,也没说什么时候上线。想抄作业的从业者得自己试了。
#Code#Tools#Google#Product update
精选理由
官方测验推广;正文只说Google AI Studio用氛围编程生成,没有可复现的工作流、模型细节或产品变化。HKR三项全挂,所以排除。
一句话点评
Google 用自家 AI Studio 搞了个 I/O 2026 在线测验,全程靠“氛围编程”——也就是用自然语言描述需求让模型写代码,不用手敲。正文只说了工具和主题,没透露用了哪个模型、具体提示词怎么写、工作流怎么搭,也没说什么时候上线。想抄作业的从业者得自己试了。 短评:氛围编程做测验,噱头大于细节,缺模型和提示词,抄不了。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
18:59
20d ago
AI HOT 精选· aihot-apiZH18:59 · 05·29
Gemini Omni 演示:画个圆就能变视频
Gemini App 发了个演示:你上传一段画圆的视频,输入提示词“当我画完这个圆时,它变成了___”,模型就能把草图变成视频。效果看着挺酷,但正文没披露用了什么参数、什么时候开放、怎么收费。目前只是个 demo,离真正上手用还有距离。
#Multimodal#Vision#Gemini App#Gemini Omni
精选理由
官方 X 账号演示了一个具体的草图转视频流程,满足 H/K/R 的钩子、新知和相关性判断。但正文没披露模型参数、上线范围或价格,只是一个功能演示,不是正式发布,所以评分落在 60–71 区间。
一句话点评
Gemini App 演示了 Omni 的草图转视频功能:上传画圆视频,输入提示词“当我画完这个圆时,它变成了___”,模型就能生成视频。效果酷,但正文没披露用了什么参数、何时开放、怎么收费。目前只是个 demo,离上手还有距离。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
17:14
20d ago
AI HOT 精选· aihot-apiZH17:14 · 05·29
Kog 把推理速度拉到 3000 token/s,是常规的 10-30 倍
Kog 团队在 8 块 AMD MI300X 上跑出单用户 3000 token/s,8 块 NVIDIA H200 上 2100 token/s,而常规推理只有 100-300 token/s。他们把 LLM 解码当成内存流问题来解,用 monokernel 设计、重建同步机制、针对性内存映射,以及一个叫 Laneformer 的模型架构(延迟张量并...
#Inference-opt#Kog#AMD#NVIDIA
精选理由
Kog 团队在 8×AMD MI300X 上跑出单用户 3,000 tokens/s,比 8×NVIDIA H200 的 2,100 还快 43%,这个速度差距对推理成本影响很大——如果 MI300X 价格更低,那 AMD 在推理场景里就很有竞争力。不过正文没披露用了什么模型、什么精度、上下文多长,也没给复现细节,所以这个数字目前只能当个参考上限,不能直接拿来算实际部署成本。
一句话点评
Kog 在 8 块 AMD MI300X 上跑出单用户 3000 token/s,比常规推理快 10-30 倍。核心是把解码当内存流问题,用 monokernel 和 Laneformer 架构消除阻塞。但这是单用户场景,多用户并发下性能未知,且 Laneformer 是否通用、能否适配现有模型都没说。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
16:05
20d ago
AI HOT 精选· aihot-apiZH16:05 · 05·29
Gemini架构师聊幕后:Jeff Dean等四人出镜,但没提参数、架构或发布时间
Google AI的播客节目请来四位Gemini架构师,包括Jeff Dean。他们聊了团队如何推动AI前沿,但正文没披露模型参数、架构变化或发布时间线。想听八卦可以看,想找技术细节的可以跳过。
#Google AI#Jeff Dean#Gemini#Commentary
精选理由
HKR 中只有 H 靠嘉宾名字过关,K 和 R 都挂。正文本质是节目预告:嘉宾名单给了,但没有任何可验证的技术事实——参数、架构、发布时间全没提,也没有成本或竞争信息。
一句话点评
Google AI 播客请来四位 Gemini 架构师(包括 Jeff Dean)聊幕后故事,但正文没披露任何模型参数、架构变化或发布时间线。想听八卦可以看,想找技术细节的可以跳过。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H1·K0·R0
16:00
20d ago
AI HOT 精选· aihot-apiZH16:00 · 05·29
NVIDIA 开源 MCG 工具包:一分钟自动生成模型说明书,应对加州和欧盟 AI 法规
NVIDIA 发布了一个叫 MCG 的工具包,能自动给 AI 模型写说明书(Model Card)。你给它一个 GitHub 链接或上传文件,它就能在不到一分钟内生成一份包含模型用途、训练数据、性能、偏见、隐私等字段的文档。背后用了 RAG(外挂资料库)和 GPT-OSS-120B 模型来提取代码和文档里的信息。测试下来,91% 的字段能填上,准确率 ...
#Safety#Tools#NVIDIA#Product update
精选理由
HKR-K 和 HKR-R 通过:它有具体的文档生成机制和监管背景。这仍然是一篇 NVIDIA 开发者教程,没有模型发布、定价、基准测试或跨来源信号。
一句话点评
NVIDIA 出了个自动写模型说明书的工具 MCG,给个 GitHub 链接就能在 1 分钟内生成 Model Card,91% 字段能填上,准确率 76%。背后用了 RAG(外挂资料库)和自家 GPT-OSS-120B 模型。主要为了应付加州 AB-2013 和欧盟 AI 法案的合规要求。Oracle 已经在用了。 短评:填表自动化,合规省力,但准确率 76% 意味着近四分之一的字段可能...
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R1
15:58
20d ago
AI HOT 精选· aihot-apiZH15:58 · 05·29
Replit 直播预告:Canvas 新功能 + Clerk 自定义登录
Replit 发了一条推文,预告一场直播,主题是 Canvas 新功能和用 Clerk 做自定义登录。但正文只给了一个直播链接,没透露任何具体信息:新功能是什么、登录流程怎么改、价格或上线时间,一概没提。想了解细节只能自己去看直播回放。
#Tools#Clerk#Product update
精选理由
标题看起来像产品更新,但正文只有一条直播链接,没有功能清单、登录机制或发布时间。信息缺口太大,无法判断价值,直接跳过。
一句话点评
Replit 预告直播讲 Canvas 新功能和 Clerk 自定义登录,但正文只甩了个直播链接,没提任何具体改动、价格或上线时间。想了解细节只能自己看回放,信息量约等于零。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
15:55
20d ago
AI HOT 精选· aihot-apiZH15:55 · 05·29
Gemini 本月更新:新界面 + 全天候智能体助手
Gemini 官方宣布了本月更新,核心是重新设计的界面和 Gemini Spark 的 24 小时智能体辅助。正文没披露具体功能细节、上线范围、支持平台、定价或性能变化,所以目前只能确认产品层面的标题信息。
#Agent#Gemini#Gemini Spark#Product update
精选理由
HKR-H 和 HKR-R 通过:Gemini Spark 作为全天候智能体是这次月更的钩子,也踩中了 Google 的竞争节奏。HKR-K 不通过:正文没披露功能细节、上线范围或价格,信息量只够当一条小产品更新看。
一句话点评
Gemini 本月更新主要提了两个点:界面重设计,以及 Gemini Spark 的 24 小时智能体辅助。但正文没披露任何具体功能、上线范围、平台或定价,所以目前只能当产品预告看。短评:界面和全天候助手是亮点,但没细节前先别激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
15:00
20d ago
AI HOT 精选· aihot-apiZH15:00 · 05·29
Kling AI 在戛纳展示全 AI 电影《RAPHAEL》制作流程
Kling AI 在戛纳放出了一部叫《RAPHAEL》的短片,全程用自家模型做,从创意到成片都走 AI 工作流。正文没披露用了多少算力、花了多少钱、做了多久,也没给可复现的步骤,所以目前只能当个概念展示看。
#Multimodal#Vision#Tools#Kling AI
精选理由
硬排除规则适用:这是纯营销案例。Kling AI 帮 RAPHAEL 做了电影,但正文既没有可复现的工作流,也没有硬指标。H/K/R 三项都不达标,所以分数低于 40。
一句话点评
Kling AI 在戛纳放了一部叫《RAPHAEL》的短片,全程用自家模型做,从创意到成片都走 AI 工作流。正文没披露用了多少算力、花了多少钱、做了多久,也没给可复现的步骤,所以目前只能当个概念展示看。 短评:概念片,没成本没步骤,先别当标杆。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
13:00
20d ago
AI HOT 精选· aihot-apiZH13:00 · 05·29
阶跃星辰 Step 3.7 Flash 开放权重,可在 Kilo Code 直接跑
阶跃星辰把 Step 3.7 Flash 的开放权重模型放到了 Kilo Code 上,开发者可以直接下载运行。正文没披露参数量、许可证条款、定价或部署要求,所以实际能跑多大、商用是否受限还不清楚。开放权重意味着你可以本地或自建服务器部署,不用每次都调 API,对需要离线或定制推理的场景比较友好。
#StepFun#Kilo Code#Product update#Open source
精选理由
HKR-K 通过,因为 Kilo Code 可用性对开发者是可操作的信息。HKR-H/R 偏弱:正文没提模型参数量、许可证、定价和基准对比,属于小产品/开放权重更新,不值得特别关注。
一句话点评
阶跃星辰把 Step 3.7 Flash 的开放权重模型放到了 Kilo Code 上,开发者可以直接下载运行。正文没披露参数量、许可证条款、定价或部署要求,所以实际能跑多大、商用是否受限还不清楚。开放权重意味着你可以本地或自建服务器部署,不用每次都调 API,对需要离线或定制推理的场景比较友好。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
12:57
20d ago
AI HOT 精选· aihot-apiZH12:57 · 05·29
阶跃星辰发布 Step 3.7 Flash,专为智能体工作流设计
阶跃星辰在 X 上宣布 Step 3.7 Flash 模型,主打让模型进业务流程干活(agent workflow)。他们提到 NousResearch 用户已经在 Hermes Agent 上基于该模型做开发。正文没披露模型参数量、定价、跑分或开放方式,目前信息有限,先别太激动。
#Agent#StepFun#NousResearch#Hermes Agent
精选理由
StepFun 发了 Step 3.7 Flash 的定位帖,说它专为智能体工作流打造,还提了 NousResearch 和 Hermes Agent 的用户。但正文没披露参数、价格或上线条件,也没有测试结果。信息缺口太大,只能当低信号的产品营销看。
一句话点评
阶跃星辰发了 Step 3.7 Flash,说是专为“让模型进业务流程干活”设计的。目前只有一条 X 帖子,没提参数量、定价、跑分,也没说怎么用。有 NousResearch 用户拿它做 Hermes Agent,算个信号,但信息缺口太大,先别激动。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H0·K0·R0
12:00
20d ago
AI HOT 精选· aihot-apiZH12:00 · 05·29
OpenRouter 推出 Guardrails:给智能体套上预算、隐私和安全的笼头
OpenRouter 上线了 Guardrails 功能,一套可配置的安全和治理工具,专门管那些跑在 API 上的智能体。核心功能有五项:预算控制(按日/周/月设限额,每人每 Key 独立计算,一个脚本跑冒了不会烧掉整月预算)、零数据留存(一键关掉所有会存你数据的接口)、模型/供应商限制(只允许用你审核过的模型或供应商)、提示注入防御(用 30 多条正...
#Agent#Safety#Tools#OpenRouter
精选理由
HKR-K和HKR-R通过:5类Guardrails功能给从业者提供了具体信号,对应成本和安全的痛点。但这仍是OpenRouter的常规产品更新,没有披露定价、效果数据或采用规模,所以分数维持在60–71区间。
一句话点评
OpenRouter 给 API 智能体上了五道安全锁:预算控制(每人每 Key 独立算,脚本跑冒了不会烧整月)、零数据留存、模型/供应商白名单、提示注入防御(30 多条正则,延迟可忽略)、数据防泄漏。亮点是预算按实体独立计算,比共享额度更精细。但正文没披露定价、上线时间和技术实现细节,目前只说是可配置规则层,不涉及模型内部安全。对跑生产 agent 的团队有用,但别指望它能防住高级越狱。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
10:37
20d ago
AI HOT 精选· aihot-apiZH10:37 · 05·29
Claude Code 源码里挖出的隐藏配置:钩子能改写命令、自动批准、注入上下文
一篇博客翻了一遍 Claude Code 的源码(npm 包 @anthropic-ai/claude-code@2.1.87),发现官方文档没写的几个可配置能力。核心是 hook 脚本的返回值:PreToolUse 钩子可以返回 updatedInput 字段,在命令执行前偷偷改掉它——比如把 git push 自动加上 --dry-run;Perm...
#Code#Tools#Claude Code#Commentary
精选理由
这篇文章本质上是一个指向页——标题画了饼,但正文没给任何可验证的配置项名称或机制。HKR 的 H 和 R 都成立,但 K 不成立,因为信息量不足以支撑实操价值。所以它只能留在低价值区间,重要性 48 合理。
一句话点评
Claude Code 源码里藏了一堆官方文档没写的配置,最实用的是 hook 脚本能返回 JSON 实时改命令——比如在 git push 前自动加 --dry-run。还有 YOLO Classifier 允许用大白话描述环境(比如“这是测试服务器,可以删东西”)来决定自动放行。这些功能来自 npm 包 v2.1.87,但作者没提模型版本、性能或定价,也没说这些隐藏字段会不会在下次更新里消失。
HKR 分解
hook knowledge resonance
打开信源
48
SCORE
H1·K0·R1
10:21
20d ago
AI HOT 精选· aihot-apiZH10:21 · 05·29
四部门发文:全民AI素养要提升,人才要加快培养
中央网信办等四部门联合印发了《2026年提升全民数字素养与技能工作要点》,把“提升全民人工智能素养”单列为一项重点任务,具体包括用AI赋能教育、加快AI人才培育、深化AI普及应用。文件还提到要促进AI安全规范发展。不过正文没披露具体预算、落地时间表或考核指标,所以目前更像一个方向性信号,离实际执行还有距离。
#CAC#Policy
精选理由
K通过,因为2026年工作计划、四部门联合发文、6项任务都是具体新信息。H不通过,标题措辞平淡,没有让人想点开的意外点。R不通过,只说了要提升素养和培育人才,但没披露谁来执行、花多少钱、涉及哪些岗位,从业者没法判断对自己业务的实际影响。
一句话点评
四部门把“提升全民AI素养”单列为2026年重点任务,方向明确但正文没披露预算、时间表或考核指标,目前更像一个政策信号,离落地还有距离。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R0
09:00
20d ago
AI HOT 精选· aihot-apiZH09:00 · 05·29
Qwen-VLA:让模型不光能看能想,还能动手干活
阿里 Qwen 团队发布 Qwen-VLA,一个通用视觉-语言-动作模型。它把机器人操作、视觉导航等任务统一到一个框架里:给模型看画面、听指令,它直接输出下一步动作或轨迹。训练分四阶段,先纯文本学动作结构,再加视觉数据,最后用强化学习在仿真环境里优化闭环成功率。数据量不小:公开机器人数据超 1 万小时,内部真机数据超 1000 小时,合成仿真轨迹超 8...
#Multimodal#Vision#Tools#Qwen
精选理由
HKR 中 H/K 通过,因为 Qwen VLA 的定位和 Qwen Studio 的功能列表是实打实的信息。但正文没给参数、发布时间、评测或可跑 demo,所以只能算低优先级的产品更新,不构成行业震动。
一句话点评
阿里 Qwen 团队发布 Qwen-VLA,一个视觉-语言-动作模型,能直接看画面、听指令输出机器人动作。训练分四阶段,先纯文本学动作结构,再加视觉数据,最后用强化学习优化闭环成功率。数据量不小:公开机器人数据超 1 万小时,内部真机数据超 1000 小时,合成仿真轨迹超 800 万条。但正文没披露模型参数量、推理延迟和真机实测成功率,这些才是落地关键。短评:统一框架思路对,但数据堆砌不等于...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
07:15
20d ago
AI HOT 精选· aihot-apiZH07:15 · 05·29
阿里云把百炼能力打包成命令行工具,一行代码让 Agent 调用 150 多个模型
阿里云开源了百炼 CLI,一个专为 Agent 设计的命令行工具。开发者只需一行命令,就能让 Claude Code、Qoder 等主流 Agent 框架调用阿里云百炼平台上的 150 多款模型、十多款应用,以及知识库、记忆、联网搜索等全套能力。说白了,就是不用再手动写一堆 API 调用代码,Agent 可以直接通过命令行“插拔”阿里云的模型和服务。目...
#Agent#Tools#Alibaba Cloud#Open source
精选理由
触发硬排除-云厂商推广:阿里云百炼 CLI 平台公告,正文为空,未披露许可证、安装路径、版本或支持矩阵。HKR-K 保留,但 tier 被排除上限。
一句话点评
阿里云把百炼平台的能力打包成一个命令行工具(CLI)并开源,Agent 框架(如 Claude Code)一行命令就能调 150 多款模型、知识库、联网搜索等。好处是省去手动拼 API 的麻烦,但正文没披露性能基准、延迟或成本对比,也没说 CLI 是否支持离线或本地模型。对做 Agent 编排的团队是个便利,但实际效果得看跑起来才知道。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K1·R0
02:18
21d ago
AI HOT 精选· aihot-apiZH02:18 · 05·29
PixVerse 分享15秒动画IP预告片制作流程
PixVerse 发了一个15秒动画IP预告片的案例,角色叫MILO和BUMBLE,设定是地下邮政骑手。但正文没披露具体用了什么工具链、模型设置或生成步骤,只说要转发关注才能私信拿到工作流和提示词。信息缺口明显,没法判断效果好坏或成本高低。
#Multimodal#Vision#Tools#PixVerse
精选理由
HKR-H靠短预告片工作流这个钩子勉强过关,但HKR-K因为没给任何可复现的工具或参数直接挂掉,HKR-R也缺成本、工作流或竞争层面的价值。整篇就是PixVerse的产品展示,归入低价值浏览档。
一句话点评
PixVerse 发了个15秒动画IP预告片,角色MILO和BUMBLE是地下邮政骑手。但正文没披露工具链、模型设置或生成步骤,只说转发关注才能私信拿工作流和提示词。信息缺口明显,没法判断效果好坏或成本高低。 短评:转发才给工作流,信息缺口大,没法判断效果。
HKR 分解
hook knowledge resonance
打开信源
42
SCORE
H1·K0·R0
00:45
21d ago
AI HOT 精选· aihot-apiZH00:45 · 05·29
三星抢先出样 HBM4E 内存,单堆栈 48GB、带宽 3.6 TB/s
三星宣布向主要客户交付业界首批 12 层 HBM4E 样品,单堆栈容量 48GB,引脚速度 14Gbps(可扩至 16Gbps),带宽 3.6 TB/s,比 HBM4 再提升 20%。能效和散热也分别改善了 16% 和 14%。不过正文没披露具体客户是谁、量产时间表,以及样品是否已通过验证——所以“业界首批”更多是抢发布节奏,离真正落地还有距离。
#Samsung Electronics#Product update
精选理由
三星HBM4E出样对AI算力链有影响,所以HKR-H/R通过。但文章只有标题,没有规格、客户、量产时间或性能数据,HKR-K不通过,评分维持58。
一句话点评
三星抢发HBM4E样品,单堆栈48GB、带宽3.6 TB/s,比HBM4再提20%,能效和散热也改善了。但正文没披露客户是谁、量产时间,样品是否通过验证也不清楚——所以“业界首批”更多是抢发布节奏,离落地还有距离。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H1·K0·R1
00:07
21d ago
AI HOT 精选· aihot-apiZH00:07 · 05·29
阶跃星辰发布 198B 多模态模型 Step 3.7 Flash,英伟达说能跑在企业级 GPU 上
阶跃星辰(StepFun)的 Step 3.7 Flash 是一个 1980 亿参数的 MoE 多模态模型,每次推理只激活约 110 亿参数,所以虽然模型很大但实际算力消耗不算离谱。它支持图片、视频和文字输入,上下文窗口 256K,还提供了低、中、高三档推理深度可选。英伟达官方博客说这个模型可以在他们的 GPU 上跑,也支持 SGLang、Tensor...
#Multimodal#Vision#StepFun#NVIDIA
精选理由
HKR-K 通过是因为 198B 参数的多模态细节是实打实的信息。HKR-H 和 HKR-R 不通过:标题和正文都是英伟达开发者博客的部署宣传口吻,没有基准测试、定价或可复现的性能数据,所以既没有意外钩子,也刺激不到成本或竞争神经。
一句话点评
阶跃星辰的 Step 3.7 Flash,1980 亿参数 MoE 模型,每次推理只激活约 110 亿参数,所以虽然模型大但实际算力消耗不算离谱。支持图片、视频和文字输入,上下文 256K,还提供低、中、高三档推理深度可选。英伟达官方博客说可以在他们的 GPU 上跑,也支持 SGLang、TensorRT-LLM 等框架。但正文没披露跑一次需要多少张卡、延迟多少,也没给任何基准测试分数。对于...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R0
2026-05-28 · 星期四2026年5月28日
23:54
21d ago
AI HOT 精选· aihot-apiZH23:54 · 05·28
llm-anthropic 0.25.1 发布:支持 Claude Opus 4.8,默认输出长度不再卡 8192
Simon Willison 的 LLM 命令行工具更新了 Anthropic 插件,主要三件事:新增 Claude Opus 4.8 模型;给开通了 fast mode 的企业用户加了个 `-o fast 1` 参数,能更快出结果;默认 max_tokens 从固定的 8192 改成每个模型自己的最大输出长度——之前 8192 会截断长回复,现在不用...
#Tools#Inference-opt#Anthropic#Claude
精选理由
HKR-K 和 HKR-R 通过:具体选项和默认值改动会影响 Claude 工具链的实际使用。HKR-H 偏弱,这只是一个 llm-anthropic 的小版本更新,不是 Anthropic 的能力发布。
一句话点评
Simon Willison 的 LLM 命令行工具更新了 Anthropic 插件,主要三件事:新增 Claude Opus 4.8 模型;给开通了 fast mode 的企业用户加了个 `-o fast 1` 参数,能更快出结果;默认 max_tokens 从固定的 8192 改成每个模型自己的最大输出长度——之前 8192 会截断长回复,现在不用手动调了。 短评:小版本更新,对 CL...
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
23:33
21d ago
AI HOT 精选· aihot-apiZH23:33 · 05·28
OpenRouter 上线模型对比页,可视化 GPT-5.5 和 Claude Opus 4.7/4.8 表现
OpenRouter 推出了一个模型对比页面,能直接可视化 GPT-5.5、Claude Opus 4.7 和 Claude Opus 4.8 的性能差异。正文没披露具体用了哪些指标维度、怎么打分的,所以这个页面更像一个快速看板,帮你直观感受模型间的相对强弱,而不是严谨的评测报告。
#Benchmarking#OpenRouter#OpenAI#Anthropic
精选理由
OpenRouter 上线了一个模型对比页面,把 GPT-5.5、Claude Opus 4.7 和 4.8 放在一起可视化。但正文没交代用了什么指标、权重怎么设、分数怎么算,等于只给了个空壳。对从业者来说,知道有这个页面就够了,但别急着拿它做选型依据——信息不全,验证不了。
一句话点评
OpenRouter 搞了个模型对比页面,把 GPT-5.5、Claude Opus 4.7 和 4.8 放一起可视化。好处是直观,不用自己翻基准分。但正文没交代用了哪些指标、怎么打分的,所以更像快速看板而非严谨评测。短评:直观对比 GPT-5.5 和 Claude Opus 4.7/4.8,但评分方法未公开,当看板用就好。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
20:55
21d ago
AI HOT 精选· aihot-apiZH20:55 · 05·28
Grok Build 0.2.7 上线:新增用量查询、登录、子智能体共享终端,图像理解也升级了
Grok Build 0.2.7 主要加了四个功能:/usage 可以查用量,/login 支持登录,跨子智能体共享终端(多个子任务能共用同一个终端环境),以及图像理解能力改进。正文没披露具体改进幅度、定价或灰度范围,想了解细节得自己去翻 changelog。
#Agent#Vision#Tools#xAI
精选理由
Grok Build 0.2.7 是小版本更新,功能具体:加了用量查询、登录、跨子智能体共享终端,图像理解也升级了。但正文没披露价格、上线范围或性能指标,信息缺口明显。HKR-K 和 HKR-R 过关,分数落在 60–71 区间合理。
一句话点评
Grok Build 0.2.7 更新了四个功能:用量查询、登录、跨子智能体共享终端(多个子任务共用同一个终端环境),以及图像理解改进。正文没披露改进幅度、定价或灰度范围,想了解细节得自己去翻 changelog。短评:四个功能里共享终端最实用,但没给性能数据,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
20:35
21d ago
AI HOT 精选· aihot-apiZH20:35 · 05·28
Replit Canvas:一个让你边画边改的AI建站工具
Replit 发布了 Canvas,一个智能体设计工具,用来建网站、做应用和营销素材。它不像传统聊天框那样只能打字,而是给你一块画布,可以自由探索想法、创建不同版本并反复修改。正文没披露定价、开放范围或背后的模型机制,所以具体怎么收费、什么时候能用、效果多好,目前还不清楚。
#Agent#Tools#Replit#Product update
精选理由
HKR-H 和 HKR-R 通过,因为 Canvas 有明确的开发者工作流钩子;HKR-K 不通过:正文缺少价格、上线范围和模型细节。这是一个常规产品更新,不是重点推荐。
一句话点评
Replit 出了个叫 Canvas 的智能体设计工具,主打画布式交互,不是传统聊天框。能建网站、做应用和营销素材。但正文没披露定价、开放范围或背后的模型机制,所以具体怎么收费、什么时候能用、效果多好,目前还不清楚。 短评:画布交互比聊天框更直观,适合反复迭代。但没定价和开放范围,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
19:03
21d ago
AI HOT 精选· aihot-apiZH19:03 · 05·28
Gemini Omni 在印度开放视频编辑功能
印度用户现在能用 Gemini Omni 直接编辑和转换手机里的视频了,支持从相册或已存文件上传。目前只限印度地区,其他地区还没消息。
#Multimodal#Vision#Gemini#Product update
精选理由
这是 Gemini Omni 在印度的小范围功能更新,只说了开放地区和支持上传来源,没披露定价、模型能力、质量指标或全球上线计划,所以分数压在 60-71 区间。
一句话点评
Gemini Omni 向印度用户开放了视频编辑功能,支持从相册上传视频直接剪辑和转换。目前仅限印度,其他地区未开放。正文没披露具体编辑能力(如裁剪、滤镜、转格式)和延迟表现,实用性待验证。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
18:52
21d ago
AI HOT 精选· aihot-apiZH18:52 · 05·28
MiniMax M2.7 免费智能体编程限时开放
MiniMax 宣布 M2.7 模型可在 OpenHandsDev 上免费用于智能体编程(让模型自动写代码、调代码),但限时开放。正文没说明活动持续多久、有无使用次数限制、模型参数大小以及是否需要申请资格。想尝鲜得抓紧,但具体门槛和时长都不清楚。
#Agent#Code#MiniMax#OpenHandsDev
精选理由
这是一条很小的产品可用性更新:HKR-K 和 HKR-R 通过免费智能体编程访问通过,但正文没写限时周期、额度、模型参数和使用条件,所以分数在 60–71 之间。
一句话点评
短评:免费白嫖 M2.7 写代码,但限时且门槛未知,别太激动。 MiniMax 把 M2.7 模型塞进 OpenHandsDev 平台,让开发者免费体验智能体编程——也就是模型自己写代码、调代码,省去手动改 bug 的功夫。限时开放,但正文没披露活动持续多久、有无使用次数限制、是否需要申请资格。M2.7 是 MiniMax 的旗舰模型,编程能力在内部测试中表现不错,但这次免费是推广手段还是...
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R1
18:41
21d ago
AI HOT 精选· aihot-apiZH18:41 · 05·28
Google 发布 Pay & Wallet MCP 服务器,AI 助手可以直接查文档、验钱包卡、管商户
Google 推出了一个 MCP 服务器,专门给 Google Pay 和 Google Wallet 的开发者用。核心思路是让 AI 编程助手(比如 Cursor、VS Code 里的 agent)能直接调用四个工具:搜官方文档(用了 RAG,也就是外挂资料库,回答更准)、验证 Wallet 卡券的 JWT 或 JSON 定义、查你的集成状态和商户 ...
#Agent#Tools#Google#Product update
精选理由
HKR-K 成立,因为 IDE 内嵌实时 API 和账户上下文这个机制是新的;HKR-R 只对 MCP 工具实践者有参考价值,但 Google Pay/Wallet 的垂直场景限制了传播面;HKR-H 弱,标题没有制造悬念或紧张感。整体属于小范围产品更新,所以维持 64 分和 all 层级。
一句话点评
Google 给 Pay 和 Wallet 开发者出了个 MCP 服务器,让 AI 编程助手能直接搜文档(RAG 外挂资料库)、验证卡券 JWT、查集成状态和商户信息。好处是少切页面,但正文没披露延迟和成本,也没说支持哪些 IDE 以外的 agent。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
17:35
21d ago
AI HOT 精选· aihot-apiZH17:35 · 05·28
Replit 说有四步能防 AI 生成应用留后门,但没公开具体步骤
Replit 发帖称有一套四步流程,用来保障 vibecode(AI 写代码)应用的安全,避免发布时留下后门。但帖子只提了目标,没披露四步具体是什么、做了哪些技术检查、以及可复现的安全条件。信息缺口明显,目前只能当个预告看。
#Code#Safety#Replit#Product update
精选理由
触发硬排除规则 6:除了一个后门警告,没有数据、步骤细节、机制或示例。HKR 中的 H 和 R 都存在,但信息缺口把分数压在 40 以下。
一句话点评
Replit 说有一套四步流程保 AI 写代码的应用安全,但帖子只画了饼,没披露四步具体是啥、做了哪些技术检查。目前就是个预告,信息缺口太大,没法判断靠不靠谱。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H1·K0·R1
17:25
21d ago
● P1AI HOT 精选· aihot-apiZH17:25 · 05·28
Google 发布图像模型 Nano Banana Pro 和 Nano Banana 2 接入 Gemini API
Google AI 开发者账号官宣了两个图像模型:Nano Banana Pro(代号 gemini-3-pro-image)和 Nano Banana 2(代号 gemini-3.1-flash-image),现在就能通过 Gemini API 调用,直接上生产环境。帖子贴了一些社区示例展示效果,但正文没披露定价、跑分、并发限制这些关键信息,想评估成...
#Vision#Multimodal#Google AI Developers#Gemini
精选理由
Google 这次一口气发了两个图像模型,Nano Banana Pro 和 Nano Banana 2,都走 Gemini API,直接面向生产环境。标题和摘要只给了名字和可用性,没提性能对比、价格、安全机制,所以没法判断实际强不强。我会先打个折,不往 p1 放,但作为产品动态值得让关注图像生成和多模态的人知道。
一句话点评
Google 把两款新图像模型 Nano Banana Pro 和 Nano Banana 2 接入了 Gemini API,但正文没披露具体性能数据和对比基准。
锐评
Google 这次发布的是两个图像模型,名字叫 Nano Banana Pro 和 Nano Banana 2,已经可以通过 Gemini API 调用。从命名看,Pro 版大概率是性能更强的版本,2 代可能是迭代升级。但这条消息目前只有标题,正文是空的,所以没法判断具体强在哪、快多少、成本怎么算。我会先打个折:接入 API 意味着开发者能直接用了,这是好事,但没看到任何 benchmark 或延迟数据之前,别急着下结论说它比现有方案好。如果你在选图像模型,建议等官方放出技术细节或第三方评测再对比。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
17:21
21d ago
● P1AI HOT 精选· aihot-apiZH17:21 · 05·28
Claude Code 现在能同时派几十上百个“子代理”分头干活
Claude Code 推出了动态工作流,一次会话里可以自动生成脚本、派出几十到几百个小代理(subagent)并行处理任务,做完还会先自己验证结果再交给你。目前是研究预览版,Max、Team 和开通了权限的企业用户能在命令行、桌面版、VS Code、API 以及 Amazon Bedrock 和 Vertex AI 上用到。正文没给出具体性能对比数据...
#Agent#Code#Tools#Anthropic
精选理由
HKR 三项全中。这是 Anthropic 对 Claude Code 的一次实质性更新,不是小修小补。核心卖点很具体:单个会话里并行跑几十上百个子智能体,对日常用 Claude Code 写代码的人意味着任务拆解和并发能力上了一个台阶。我会先打个折——目前还是研究预览,正文没披露并行任务的具体失败率和额外 token 开销,实际省不省钱得等用户自己跑完看账单。但就凭这个并发机制和明确的开放范围,值得当天跟进。
一句话点评
Claude Code 能自己写脚本、派几十上百个小代理并行干活,做完还先自查再交差。但正文没给性能对比,实际省多少时间、会不会并行翻车还不清楚。
锐评
Anthropic 给 Claude Code 加了个动态工作流,简单说就是让模型在一次对话里自动拆任务、写脚本、生成几十到几百个小代理(subagent)并行执行,最后把结果汇总验证再给你。这比之前手动一步步调要省事,尤其适合批量改代码、跑测试、跨文件重构这类重复性工作。 目前是研究预览版,Max、Team 和开了权限的企业用户能在命令行、桌面版、VS Code、API 甚至 Amazon Bedrock 和 Vertex AI 上用到。覆盖面挺广,但正文没给出任何性能对比数据——比如同样一个重构任务,用动态工作流比不用快多少、token 消耗涨了多少、并行代理多了会不会互相踩脚。这些才是决定要不要切过去的关键。 另外,代理数量提到“几十到几百”,这个范围太宽了。上限几百个代理同时跑,调度和一致性怎么保证,正文也没展开。建议等有实际跑分或者社区反馈再判断,现在只能当个方向性更新看。
HKR 分解
hook knowledge resonance
打开信源
85
SCORE
H1·K1·R1
17:05
21d ago
● P1AI HOT 精选· aihot-apiZH17:05 · 05·28
Claude Opus 4.8 发布:编码和操控浏览器更强,快速模式降价三分之二
Anthropic 把 Opus 升级到了 4.8,价格和 4.7 一样。主要提升在写代码和让模型自己操作网页完成任务上:在 Online-Mind2Web 这个测浏览器操控能力的基准上拿了 84%,漏掉的代码错误比之前少了大约 75%。新加了一个 2.5 倍速的快速模式,费用降到了之前的三分之一。早期用户反馈它更诚实,不会在证据不足时硬说搞定了,做复...
#Agent#Reasoning#Code#Anthropic
精选理由
HKR 三项全过。这是 Anthropic 旗舰模型更新,有明确的价格和基准数据:84% 的 Online-Mind2Web 得分说明在网页操作智能体任务上表现不错,代码错误漏检率降了约 75% 对日常写代码的人是个实在提升,价格没涨也降低了试用门槛。这些事实让这条更新在同日新闻里能排到 85–94 分区间。
一句话点评
Opus 4.8 在浏览器操控基准上拿了 84%,漏代码错误少了约 75%,还出了个 2.5 倍速模式,费用降到之前的三分之一。
锐评
Anthropic 把 Opus 4.8 定位成一次加量不加价的升级,价格和 4.7 持平。最实在的改进在写代码和让模型自己操作网页干活这两块:Online-Mind2Web 这个测浏览器操控能力的基准上拿了 84%,漏掉的代码错误比之前少了大约 75%。新加的快速模式把速度拉到 2.5 倍,费用降到之前的三分之一,对高频调用场景挺省钱。早期用户反馈它更诚实,不会在证据不足时硬说搞定了,做复杂任务时会先确认再动手,这点对放进业务流程里跑很重要。 不过这篇公告是 Anthropic 自己发的,引用的用户评价都来自合作方,没有独立第三方的对照测试。系统卡里应该有更完整的评估,但正文没给出快速模式下能力会不会打折、延迟具体是多少。另外,跟 GPT-5.5 的对比只出现在个别用户引语里,缺少系统性的横向数据。如果你主要用它写代码或做网页自动化,漏错误少了 75% 是个值得试的信号;但如果是其他场景,等独立评测出来再判断会更稳。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
16:02
21d ago
AI HOT 精选· aihot-apiZH16:02 · 05·28
微软开源 Data Formulator:用 AI 智能体帮你拖拽分析企业数据
微软研究院开源了 Data Formulator,一个面向企业数据工作流的 AI 分析工具。它把原始数据导入一个 AI 就绪的工作空间,用户可以用 AI 智能体(相当于一个会干活的助手)来探索、分析和可视化数据,把表格变成可操作的洞察。正文没披露定价、部署方式以及数据如何连接到系统,所以实际落地成本和安全验证还不清楚。
#Agent#Tools#Data Formulator#Product update
精选理由
HKR-K通过,因为智能体进入了企业数据探索、分析和可视化场景。HKR-H和R都偏弱,定价、部署、连接器均未披露,所以落在低产品更新区间。
一句话点评
微软开源了 Data Formulator,把原始数据导入一个 AI 工作空间,用智能体帮你分析、画图。相当于给 Excel 配了个会干活的助手。但正文没提定价、部署方式、数据怎么连进去,所以实际落地成本和安全验证还不清楚。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R0
15:41
21d ago
AI HOT 精选· aihot-apiZH15:41 · 05·28
Google 用 Kaggle 黑客松教小模型“先想再说”,冠军方案用评分表当奖励信号
Google 办了一场 Kaggle 黑客松,让社区用有限的 TPU 算力(Kaggle TPU v5e-8,限 9 小时)把 Gemma-2-2B 和 Gemma-3-1B 这种小模型训练出推理能力。冠军方案叫 G-RaR,核心是用一个大模型(Gemma-3-12B)当裁判,按评分表给模型的推理步骤打分,而不是只看答案对不对。这样即使答案不唯一,模型...
#Reasoning#Fine-tuning#Alignment#Google
精选理由
这是一篇 Google 开发者黑客马拉松的复盘,不是新模型发布。有用信号是后训练配方(SFT + GRPO + SimPO),在有限 TPU 下跑通,对社区做推理后训练有参考价值。但整体偏活动总结,信息密度有限,所以分数压在 60–71 区间。
一句话点评
Google 用 Kaggle 黑客松证明,小模型(Gemma-2-2B/3-1B)在有限算力(TPU v5e-8,限 9 小时)下也能训练出推理能力。冠军方案 G-RaR 的核心是用一个大模型当裁判,按评分表给推理步骤打分,而不是只看答案对不对。这样即使答案不唯一,模型也能收到细颗粒度的反馈。参赛者超过 11000 人,提交 300+ 方案。不过正文没披露最终模型在标准推理基准(如 GSM...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
15:00
21d ago
AI HOT 精选· aihot-apiZH15:00 · 05·28
Google I/O 2026 速览:12 个重点,但只提了 Gemini Omni 和 3.5 Flash 两个模型名
Google 发了 I/O 2026 的 12 个高光时刻视频合集,正文只点名了 Gemini Omni 和 Gemini 3.5 Flash 两个模型,没披露参数、定价、上线时间或产品细节。Omni 应该是多模态统一模型,3.5 Flash 是轻量版,但具体快多少、便宜多少、能不能跑在端侧,一概没说。其他 10 个 moment 只给了标题和视频链接...
#Multimodal#Inference-opt#Google#Gemini Omni
精选理由
H 和 R 都成立:官方 I/O 回顾有浏览价值,模型竞赛也是持续热点。但 K 扣分严重——正文几乎没给干货,参数、价格、上线时间全缺,导致信息密度低,只能卡在 60-71 这个区间。
一句话点评
Google I/O 2026 的 12 个高光时刻,正文只点名了 Gemini Omni(多模态统一模型)和 Gemini 3.5 Flash(轻量版),没披露参数、定价、上线时间或产品细节。其他 10 个 moment 只有标题和视频链接,信息量极低。 短评:标题党,正文几乎没干货,等后续技术博客再判断。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
14:38
21d ago
AI HOT 精选· aihot-apiZH14:38 · 05·28
OpenRouter 新增 Flex 和 Priority 两种服务层级
OpenRouter 给 OpenAI、Google Vertex 等模型加了两个服务选项:Flex(灵活)和 Priority(优先)。正文没披露具体定价,只说去各模型页面看。推测 Flex 可能更便宜但延迟高或排队,Priority 反之。
#Inference-opt#OpenRouter#OpenAI#Google Vertex
精选理由
HKR-K 和 HKR-R 通过:Flex/Priority 给推理运维加了一个控制点,直接关系到成本和延迟。HKR-H 不通过,加上定价缺失,分数落在 60–71 区间。
一句话点评
OpenRouter 给 OpenAI、Google Vertex 等模型加了 Flex(灵活)和 Priority(优先)两个服务层级。正文没披露具体定价,只说去各模型页面看。推测 Flex 可能更便宜但延迟高或排队,Priority 反之。短评:API 路由商开始分层卖服务,省钱还是省时间,得等价格出来再算。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H0·K1·R1
14:02
21d ago
AI HOT 精选· aihot-apiZH14:02 · 05·28
Runway 一人一天做出 AI 短片《昨夜》,讲东京一夜的记忆碎片
Runway 发布了一部完全由 AI 生成的短片《昨夜》,一个人用 Runway 在一天内完成,属于 Project Luxo 项目,目的是测试 AI 视频能否跨过“恐怖谷”(即画面逼真到让人不觉得诡异)。短片通过破碎记忆的视角,讲在东京改变人生的一个夜晚。正文没披露模型设置、片长、工作流程步骤或评估标准,所以不清楚具体用了多少算力、生成质量如何验证。
#Multimodal#Vision#Runway#Project Luxo
精选理由
H/K/R三个钩子都在,但都很弱:文章展示了一支有吸引力的Runway短片demo和一人一天的制作条件,没有模型更新、工作流拆解、指标或可复现的测试。
一句话点评
Runway 用一部完全由 AI 生成的短片《昨夜》来测试 AI 视频能否跨过“恐怖谷”,一个人一天内完成,成本和时间门槛确实低。但正文没披露片长、模型设置和生成质量验证方式,所以“跨过恐怖谷”这个结论得打个问号。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
13:12
21d ago
AI HOT 精选· aihot-apiZH13:12 · 05·28
Anthropic 在米兰开第六个欧洲办公室,顺带晒了几个意大利客户用 Claude 的硬数据
Anthropic 在米兰开了新办公室,这是它在欧洲的第六个点(之前已有伦敦、都柏林、巴黎、苏黎世、慕尼黑)。正文主要晒了几个意大利客户案例:JAKALA 把 Claude 铺到了 3000 多个工位,说释放了 senior 团队约 70% 的时间;金融超级 App Satispay 把 18 个月的计划压缩到 7 个月,核心支付系统更新比原计划快 1...
#Code#Safety#Anthropic#JAKALA
精选理由
触发硬排除-纯营销:故事主体是 Anthropic 的区域办公室和客户部署通报。HKR-K 有具体数字,但无产品或能力更新,因此分数封顶。
一句话点评
Anthropic 在米兰开了欧洲第六个办公室,主要晒意大利客户案例。JAKALA 把 Claude 铺到 3000 多个工位,说 senior 团队释放了约 70% 的时间;Satispay 把 18 个月计划压缩到 7 个月,核心支付系统更新比原计划快 10 倍。数字挺好看,但都是客户自报,没有第三方验证,也没有披露具体成本或 ROI。Bending Spoons 说大部分代码改动用 C...
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H0·K1·R0
13:10
21d ago
AI HOT 精选· aihot-apiZH13:10 · 05·28
OpenClaw 新版本上线:安全边界更严、网关更快、内存更稳
OpenClaw 发布了 2026.5.27 版本,主要改进包括更严格的运行时安全边界(防止越权或逃逸)、更快的网关和回复路径(降低请求延迟)、以及 Codex 和应用服务器的内存稳定性(减少 OOM 或抖动)。此外还优化了频道和提供商支持,新增 Pixverse 视频能力。正文未披露具体性能提升幅度或安全漏洞细节,但整体属于一次常规迭代,适合正在用 ...
#Code#Safety#Memory#OpenClaw
精选理由
HKR-K 通过,因为文章列出了具体更新:运行时安全边界、网关回复路径、内存和 Pixverse 视频。HKR-H 和 HKR-R 较弱;这只是一个小型开源工具的版本发布。
一句话点评
OpenClaw 发了个常规更新,主要修运行时安全边界(防越权逃逸)、降网关延迟、稳内存防 OOM。没给具体提升数字,也没说修了啥漏洞,算一次小迭代。Pixverse 视频是新能力,但正文没披露效果。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
10:40
21d ago
● P1AI HOT 精选· aihot-apiZH10:40 · 05·28
DeepSeek 被曝融完 500 亿美元就冲科创板 IPO
一位参与本轮融资的大型基金经理说,DeepSeek 打算在完成约 500 亿美元(折合 3500 亿人民币)的融资后,立刻申请科创板上市。帖子没提估值、时间表、招股书,公司自己也没出来确认,我会先打个折看这件事。
#DeepSeek#Funding
精选理由
HKR 三项全中:DeepSeek 拿完约 500 亿美元融资就申请科创板 IPO,等于把中国大模型公司的身价直接摆到二级市场。消息来自参与本轮的一位基金经理,不是空穴来风,但正文没披露正式申请文件或更多交叉验证,所以可信度先打个折。这件事对行业的意义在于,它可能给国内 AI 公司的估值和退出路径提供一个真实参照,也会让中美 AI 竞争的讨论更具体。
一句话点评
消息来自一位参投基金经理,公司没确认,先打五折看。
锐评
这条消息只有一个信源:一位参与本轮融资的大型基金经理。帖子说 DeepSeek 打算在拿完约 500 亿美元(折合 3500 亿人民币)融资后立刻申请科创板上市,但没给出估值、时间表,也没看到招股书或公司官方表态。500 亿美元这个融资规模本身就很大,如果属实,说明资方对 DeepSeek 的商业化预期拉得很高。但“融完立刻申请”这种说法更像意向而非既定动作,科创板审核周期和监管态度都是变量。正文没披露这轮融资是否已 close、有哪些领投方、资金用途是什么,也没提公司营收或盈利情况。这些缺口让整件事还停在传闻阶段,别急着当定局看。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
08:42
21d ago
AI HOT 精选· aihot-apiZH08:42 · 05·28
Qwen3.7-Max 在 OpenRouter 上用量冲到第一
阿里云宣布 Qwen3.7-Max 在 OpenRouter 热门大模型榜登顶,使用量达 77.3B tokens。这个数字说明调用量很大,但正文没披露统计周期、排名算法和定价,所以含金量不好判断。
#Alibaba Cloud#Qwen#OpenRouter#Benchmark
精选理由
HKR 三项都过:H 靠中国模型登顶 OpenRouter 这个具体 hook,K 有 773 亿 token 的用量数据但缺统计周期和价格,R 踩中模型竞争和开发者选型神经。来源是厂商自宣,信息不完整,分数压在 60–71 合理。
一句话点评
Qwen3.7-Max 在 OpenRouter 上以 773 亿 token 调用量登顶,说明用的人确实多。但正文没披露统计周期和排名算法,也没提定价,这个“热门榜”含金量要打折。如果是按绝对 token 数排,大厂免费或低价冲量很容易刷上去。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
08:07
21d ago
AI HOT 精选· aihot-apiZH08:07 · 05·28
手把手教你用 pgvector 搭一套混合搜索:稠密+稀疏+量化,Colab 就能跑
这篇教程在 Google Colab 里搭了一个 pgvector 测试环境,覆盖 PostgreSQL 安装、pgvector 编译、Psycopg 连接、向量类型注册,以及用 SentenceTransformers 生成和存向量。正文没披露搜索效果对比或延迟数据,所以暂时只能当环境搭建指南看,不能直接判断这套混合搜索比纯稠密好多少。
#RAG#Embedding#Tools#Google
精选理由
这是一份可复现的 pgvector/RAG 工程指南,没有产品发布、基准数字或行业事件,因此停留在 60-71 的教程区间。
一句话点评
这篇教程手把手教你在 Colab 里搭 pgvector 环境,从装 PostgreSQL、编译 pgvector 到用 SentenceTransformers 生成向量存进去。但正文没披露搜索效果对比或延迟数据,所以暂时只能当环境搭建指南看,不能直接判断这套混合搜索比纯稠密好多少。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H0·K1·R1
08:02
21d ago
AI HOT 精选· aihot-apiZH08:02 · 05·28
可灵AI要在AI电影节放20部原生4K短片
可灵AI将在5月29日加州卡尔弗剧院举办的AI on the Lot社区日上,展示20部由Prompt Club创作者制作的原创AI短片,全部是原生4K分辨率。这算是AI视频生成领域少见的“真4K”展示——之前很多AI短片都是后期拉伸或超分上去的,原生4K意味着生成模型本身就能输出高分辨率画面,对算力和模型细节要求更高。不过正文没披露这些短片是纯AI生...
#Multimodal#Vision#Kling AI#AI on the Lot
精选理由
20部4K原生AI短片在电影节展映,说明可灵AI在视频生成质量上敢拿大屏幕检验,对从业者是个信号。但正文就是个活动预告,没提用了什么新模型、工作流机制、成本数据或评测基准,所以信息量有限,不值得过度兴奋。
一句话点评
可灵AI要在AI电影节放20部原生4K短片,不是后期拉伸那种,对算力和模型细节要求高。但正文没提这些短片是纯AI生成还是人工辅助,也没说时长和帧率,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R1
03:33
22d ago
AI HOT 精选· aihot-apiZH03:33 · 05·28
阿里云DataWorks上线AI数据智能体
阿里云DataWorks推出一个叫Data Agent的AI数据智能体,号称能简化数据工作流、加速洞察。但这条推文只给了产品名和一句宣传语,没提用了什么模型、怎么收费、哪些区域能用、技术原理是什么。说白了就是个预告,具体能力得等后续披露。
#Agent#Alibaba Cloud#DataWorks#Product update
精选理由
硬排除-云厂商促销:这是阿里云产品推广,只有一句泛泛的简化工作流。HKR三项全不满足,所以分数低于40且排除tier。
一句话点评
阿里云DataWorks出了个叫Data Agent的AI数据智能体,号称简化数据工作流、加速洞察。但这条推文只给了产品名和一句宣传语,没提用了什么模型、怎么收费、哪些区域能用、技术原理是什么。说白了就是个预告,具体能力得等后续披露。
HKR 分解
hook knowledge resonance
打开信源
34
SCORE
H0·K0·R0
02:19
22d ago
AI HOT 精选· aihot-apiZH02:19 · 05·28
阿里云市场上架 MuleRun:每月20美元买一个“AI打工人”,能写代码做设计
MuleRun 把自己包装成一个“全天候 AI 劳动力”,挂在阿里云市场上卖,个人版每月20美元起。能干的事包括研究、写报告、写代码、做设计。企业版加了 SSO 单点登录、RBAC 权限控制、私有网络、团队知识管理和集成。正文没披露模型基座、任务成功率或延迟数据,所以“劳动力”这个说法先打个折——更像是一个封装好的 AI 代理服务,适合小团队快速试用,...
#Agent#Code#Tools#MuleRun
精选理由
硬规则排除云厂商促销:这是阿里云市场的一个上架公告,列出了价格和功能清单,但没有性能数据、采用规模或可验证案例。HKR-K通过,但分数上限40。
一句话点评
MuleRun 在阿里云市场上架了一个“全天候 AI 劳动力”,个人版每月 20 美元起,号称能干研究、写报告、写代码、设计。企业版加了 SSO、RBAC、私有网络和团队知识管理。但正文没披露模型基座、任务成功率或延迟数据,所以“劳动力”这个说法先打个折——更像是一个封装好的 AI 代理服务,适合小团队快速试用,但离替代真人还差不少验证。
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K1·R0
01:24
22d ago
AI HOT 精选· aihot-apiZH01:24 · 05·28
华为何庭波:今年秋季新麒麟芯片性能“跳跃性”提升,首发完整“韬芯片”
华为半导体业务总裁何庭波接受人民日报专访,确认今年秋季将发布首款完整“韬芯片”麒麟手机芯片,性能、集成度、晶体管密度相比去年是“跳跃性”提升。她提出“韬定律”用“时间缩微”替代摩尔定律的“几何缩微”,核心是逻辑折叠技术——类似把城市区域叠起来装电梯,缩短信号传输时延。过去6年华为已自研381款芯片,覆盖光通信、5G、自动驾驶、AI计算等。正文未披露新芯...
#Huawei#He Tingbo#People's Daily#Product update
精选理由
这篇是人民日报专访华为何庭波,核心信息是华为6年自研381款芯片、秋季发新麒麟芯片且性能“跳跃性提升”。但正文没披露任何可验证的性能指标、AI算力或制程数据,对AI从业者来说,既没有模型更新、也没有智能体或算力产品信息,H/K/R三项全不满足。
一句话点评
何庭波官宣秋季麒麟芯片性能“跳跃性”提升,但没给任何跑分、制程或功耗数据。她提出的“韬定律”用逻辑折叠(类似把电路叠起来缩短信号延迟)替代摩尔定律的几何缩微,过去6年自研381款芯片覆盖通信、AI、自动驾驶。亮点是华为首次从理论层面讲自己的芯片演进逻辑,但正文没披露新芯片的代工厂、良率或能效比,跳跃性提升到底跳了多少也不清楚。短评:官宣跳跃但没给标尺,韬定律是理论包装还是真能落地,等秋季真机。
HKR 分解
hook knowledge resonance
打开信源
34
SCORE
H0·K0·R0
00:00
22d ago
● P1AI HOT 精选· aihot-apiZH00:00 · 05·28
xAI 发布编程模型 Grok Build 0.1 公测版
xAI 发布了专门干编程活的模型 grok-build-0.1,现在通过 API 公测。这个模型主要用来做网页开发、修 bug 这类需要模型自己调用工具、跑流程的任务,跟 Grok Build 命令行工具背后是同一个模型。速度标称每秒 100 个 token 以上,价格是输入每百万 token 1 美元、输出每百万 token 2 美元。除了写代码,官...
#Agent#Code#Tools#xAI
精选理由
我会先打个折:这是 0.1 公测版,正文没披露基准测试成绩、上下文窗口大小和具体任务成功率,所以别急着把它当成成熟产品。但亮点很实在——速度标到 100+ tokens/秒,定价也直接亮出来,输入 $1/M、输出 $2/M,对想试编码智能体的团队来说,成本门槛不高。xAI 明显在抢 Cursor/Claude 的开发者心智,这点从定位就能看出来。综合看,信息量够、有价格锚点,但缺验证数据,给 78 分、featured 不 p1 是合理的。
一句话点评
xAI 发了专做编程的模型 Grok Build 0.1,速度标称每秒 100+ token,输入每百万 token 1 美元、输出 2 美元,主打 agent 式写码和工具调用。
锐评
xAI 这次放出的 Grok Build 0.1 是个专门干编程活的模型,现在通过 API 公测。它明确说自己是为“agentic coding”训练的,也就是让模型在开发流程里自己规划、调用工具、改代码,不是只补全一行。支持的场景包括网页开发、调试和 MCP(模型上下文协议,让模型能接外部工具)。速度标称每秒 100 多个 token,在编程模型里算快的,价格是输入每百万 token 1 美元、输出 2 美元,比自家通用模型便宜一截,对高频调用比较友好。 官方说这个模型就是 Grok Build CLI 背后的引擎,也接入了 Cursor、OpenRouter、Vercel AI Gateway 等第三方工具。不过目前没给任何跑分数据,SWE-bench、HumanEval 之类的基准都没提,所以实际编程水平没法判断。另外“公测”意味着接口和稳定性可能还有变动,生产环境接入前最好先压测一下。 还缺的东西很关键:一是没有和其他编程模型(比如 Claude、GPT-4o、DeepSeek Coder)的对比,二是没说明上下文窗口多大、支持哪些语言和框架的深度优化。如果只是快和便宜但生成质量跟不上,那省下来的钱可能不够修 bug。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
2026-05-27 · 星期三2026年5月27日
23:09
22d ago
AI HOT 精选· aihot-apiZH23:09 · 05·27
用 Coding Agent 的关键:开头规划比什么都重要
作者建议先用 GPT-5.5 或 Claude Opus 4.7 这类最强模型,在 Codex、Claude Code、Cursor 的 Plan 模式下分别生成设计方案,挑最好的再借鉴其他版本。复杂计划拆成多个 Phase,每个写清楚要求和验证标准,存成 Markdown 文档。执行时按 Phase 走,人工随时纠偏。最后用 GPT-5.5 做一次代...
#Agent#Code#Tools#OpenAI
精选理由
一篇实操建议帖,没给实验数据、失败案例或成本数字,但痛点抓得准、流程可复制,适合放在 60-71 的实用技巧档,不上推荐位。
一句话点评
短评:规划先行,选最优方案再执行,避免多Agent交叉Review导致代码膨胀。 点评:作者分享了一个实用的Coding Agent工作流:先用GPT-5.5或Claude Opus 4.7在Codex、Claude Code、Cursor的Plan模式下分别生成设计方案,挑最好的再借鉴其他版本。复杂计划拆成多个Phase,每个写清楚要求和验证标准,存成Markdown文档。执行时按Pha...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
18:44
22d ago
AI HOT 精选· aihot-apiZH18:44 · 05·27
Midjourney 网页版更新:语音对话能记住你的图片提示和风格参考了
Midjourney 网页版改进了对话模式,现在支持文字和语音输入。开启语音会话后,模型能直接访问你之前设置的图片提示、风格参考、侧边栏设置和最近生成的任务——不用退出语音再手动调参数。图片提示现在可以从工具栏和侧边栏直接添加,而且提交语音时图片会保留在工具栏里,直到你手动移除。新增了一个“Rerun as HD”按钮,可以把之前用标准清晰度生成的 V...
#Multimodal#Audio#Vision#Midjourney
精选理由
Midjourney Web 语音会话现在能读取上下文(图像提示、风格参考、侧边栏设置和最近任务),所以 H 和 K 成立。但只是 Web 产品更新,没披露新模型、定价或访问范围变化,R 不成立。
一句话点评
Midjourney 网页版语音模式现在能记住你之前设的图片提示、风格参考和侧边栏设置,不用退出语音再调参数了。新增的“Rerun as HD”按钮可以把之前标准清晰度的 V8.1 图一键转高清。小改进不少,比如搜索对无订阅用户开放、上传限制明确到 20MB。整体是体验优化,没有新模型或能力突破。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K1·R0
17:59
22d ago
AI HOT 精选· aihot-apiZH17:59 · 05·27
OpenCode 和 MiMo V2.5 限时免费,1M 上下文窗口
OpenCode 和 MiMo V2.5 现在限时免费开放,支持 1M 上下文窗口(一次能塞进整本小说或超长代码库),还带推理、文本和图像能力。不过正文没披露免费截止日期和使用限制,想薅羊毛得抓紧确认。
#Reasoning#Multimodal#OpenCode#MiMo
精选理由
HKR 三项都过:免费入口(h)、1M 上下文等能力披露(k)、成本敏感但额度/截止日未公开(r)。评分留在 all 是因为来源只有一条 X 帖子,没给额度、截止日和基准测试,信息缺口明显。
一句话点评
OpenCode 和 MiMo V2.5 限时免费,1M 上下文窗口能塞整本小说或超长代码库,还带推理、文本和图像能力。但正文没披露免费截止日期和使用限制,想薅羊毛得抓紧确认。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
17:30
22d ago
AI HOT 精选· aihot-apiZH17:30 · 05·27
Replit 入选 Redpoint 2026 InfraRed 100 榜单
Replit 被风投 Redpoint 列入 2026 年 InfraRed 100 榜单,该榜单专门收录做 AI 运行基础设施的公司。往届入选者包括 Stripe、Snowflake 和 HashiCorp,说明这个名单偏重底层平台型公司。正文没披露具体评选标准,所以这份荣誉更多是品牌背书,不是技术能力排名。
#Code#Tools#Replit#Redpoint
精选理由
H/K/R三项都不满足:文章确认Replit入选Redpoint的2026 InfraRed 100榜单,但没给评选标准、产品变化或用户影响。信息量低的榜单曝光,低于40分,排除。
一句话点评
Replit 入选 Redpoint 的 InfraRed 100 榜单,往届有 Stripe、Snowflake,说明这是份偏底层平台的风投背书,不是技术排名。正文没披露评选标准,所以这份荣誉更多是品牌认可,别太当技术实力认证。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
16:01
22d ago
AI HOT 精选· aihot-apiZH16:01 · 05·27
Grok编程智能体上线Kilo IDE,需付费订阅才能用
xAI把Grok编程智能体(grok-build-0.1)放到了Kilo IDE的扩展和命令行工具里,订阅SuperGrok或X Premium+就能用。说白了就是让Grok帮你写代码、改代码,直接在开发环境里干活。不过门槛不低——两个订阅都是付费档,免费用户暂时没戏。正文没披露具体支持哪些编程语言或任务类型,也没说效果多好,这点先别太激动。
#Agent#Code#Tools#xAI
精选理由
xAI把Grok编程智能体集成到Kilo IDE,算是个小产品更新,不是技术突破。正文没披露任何基准测试、定价细节或跟Cursor/GitHub Copilot的对比,信息量有限,所以分数压在60–71区间。HKR里K和R都成立:K是因为确实有新的接入路径和订阅要求,R是因为开发者会关心IDE生态和付费墙。H不成立,因为这种集成太常规,没有惊喜。
一句话点评
xAI 把 Grok 编程智能体(grok-build-0.1)塞进了 Kilo IDE 的扩展和命令行,订阅 SuperGrok 或 X Premium+ 就能用。说白了就是让 Grok 帮你写代码、改代码,直接在开发环境里干活。不过门槛不低——两个订阅都是付费档,免费用户暂时没戏。正文没披露具体支持哪些编程语言或任务类型,也没说效果多好,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
15:48
22d ago
AI HOT 精选· aihot-apiZH15:48 · 05·27
Claude Marketplace 新增五家合作伙伴,可用已有消费额度购买
Claude Marketplace 新上了五家第三方工具:augmentcode、boltdotnew、coderabbitai、Hebbia 和 Legora。它们的产品都基于 Claude 模型,而且你之前跟 Anthropic 签的消费承诺(比如预付费或最低消费)可以直接用来买这些服务,不用额外掏钱。正文没披露具体价格或额度折算方式,但对企业客...
#Code#Tools#Anthropic#augmentcode
精选理由
这是Anthropic生态和采购政策的更新,公布了5家新合作伙伴以及消费承诺可跨厂商使用的条件,因此HKR-K/R通过。正文没有披露定价、收入分成、上线地区或实际采用数据,信息缺口明显,属于小型产品/合作动态。
一句话点评
Claude Marketplace 新增五家第三方工具,包括代码生成、前端搭建、代码审查等方向。最大卖点:企业之前跟 Anthropic 签的消费承诺(预付费或最低消费)可以直接用来买这些服务,不用额外掏钱。正文没披露具体价格或额度折算方式,但对企业客户来说,这相当于把已锁定的预算盘活了。短评:Anthropic 在学应用商店抽成模式,但对企业客户更友好——承诺的预算能买第三方工具,不用再...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
14:59
22d ago
AI HOT 精选· aihot-apiZH14:59 · 05·27
Krea 2 开放 API,能在 ComfyUI 和 Claude 里直接调用了
Krea 2 的 API 今天上线,支持在 fal 和 ComfyUI 上跑,也能通过 NousResearch 的 Hermes 智能体调用,还兼容 Claude、Codex 和 OpenClaw。正文没披露定价、调用配额和模型参数,所以实际成本和多平台稳定性还不清楚。如果你已经在用这些平台或智能体,可以省去自己搭管道的功夫。
#Agent#Tools#Krea#NousResearch
精选理由
Krea 2 API 新增了多个平台和智能体支持,对工具链整合有实际价值,所以 K 和 R 通过。但正文没给定价、速率限制和性能数据,只能算一个小更新,不值得上头条。
一句话点评
Krea 2 API 上线了,能在 fal 和 ComfyUI 上跑,也能通过 NousResearch 的 Hermes 智能体调用,还兼容 Claude、Codex 和 OpenClaw。正文没披露定价、调用配额和模型参数,所以实际成本和多平台稳定性还不清楚。如果你已经在用这些平台或智能体,可以省去自己搭管道的功夫。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
11:00
22d ago
AI HOT 精选· aihot-apiZH11:00 · 05·27
思科把 OpenAI 的 Codex 塞进企业工程,95% 的新 AI 功能靠它写
思科和 OpenAI 的合作案例,核心是把 Codex 从开发工具升级成“工程队友”。三个方向:一是用 Codex 写 AI 安全产品 AI Defense,原本几个季度的功能开发压缩到几周;二是用 Codex CLI 自动修 C/C++ 代码缺陷,吞吐量提升 10-15 倍,每月省下 1500 个工程小时;三是帮 Splunk 团队把 React 1...
#Code#Agent#Safety#Cisco
精选理由
硬排除5适用:这读起来像思科用OpenAI/Codex的厂商案例。正文列出了AI原生开发、AI Defense和缺陷修复自动化三个方向,但没给任何指标或机制,所以上限39分。
一句话点评
思科说 Codex 写了 95% 以上的 AI 功能,这个数字水分不小,更像是宣传口径。更可信的是修 C/C++ 代码缺陷的吞吐量提升 10-15 倍,每月省 1500 个工程小时——这是实打实的效率账。三个方向里,AI Defense 把几个季度的开发压到几周,代价和验证细节没披露。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H0·K0·R0
10:50
22d ago
AI HOT 精选· aihot-apiZH10:50 · 05·27
藏师傅做了个小红书排版AI工具,能自动画地图、配图
藏师傅发布了 guizang-social-card-skill,专门优化小红书图文排版。亮点是给旅行博主加了地图组件:你输入目的地和路线,AI 自动在底图上标线路、嵌入图片。它完全用 HTML 和实拍图生成内容,所以平台不会打上“AI 生成”标签,还会主动从高质量图站找对应主题图片。正文没披露具体用了什么模型或成本,但纯前端渲染+外挂图库的做法,延迟...
#Agent#Tools#Multimodal#藏师傅
精选理由
藏师傅发布了一个小红书图文排版AI技能,核心是输入目的地和路线后自动在地图上标路线并嵌入图片。这是一个具体的小产品更新,来自一条X帖子,没有披露定价、开源状态、模型依赖或效果数据,信息量有限。H和K通过:钩子直观,机制有具体操作流程;R不通过:属于创作者工具,不触及成本、就业、安全或平台竞争等敏感神经。
一句话点评
藏师傅做了个小红书排版工具,核心卖点是给旅行博主加地图组件:输入目的地和路线,AI自动标线路、嵌图片。纯HTML+实拍图生成,平台不会打“AI生成”标签,还会从图站找对应主题图。这点对小红书博主挺实用,省了手动拼图。但正文没披露用了什么模型、成本多少,纯前端渲染+外挂图库,延迟应该不高,但地图数据源和图片版权没提,商用有风险。短评:排版省力,地图组件是亮点,但模型和成本没交代,先别急着用。
HKR 分解
hook knowledge resonance
打开信源
65
SCORE
H1·K1·R0
10:43
22d ago
AI HOT 精选· aihot-apiZH10:43 · 05·27
Qwen3.7-Max 在 Qoder 上限时半价,新用户每天送 100 次免费调用
Qoder 平台今天开始对 Qwen3.7-Max 打五折,限时活动。新用户每天自动获得 100 次免费调用,不用手动领。覆盖桌面端、JetBrains 插件、命令行、QoderWork 和 QoderWake 五个入口。半价能省多少正文没披露具体原价,但如果是高频调 API 的场景,这波折扣力度挺大。
#Code#Tools#Qwen#Qoder
精选理由
这是Qoder的折扣和额度通知:K通过是因为提供了半价、每天100次免费调用和客户端列表;H和R不通过,因为没有新能力、基准测试、定价表或工作流影响的信息。
一句话点评
Qwen3.7-Max 在 Qoder 上限时半价,新用户每天还白送 100 次调用,覆盖桌面、IDE 插件、命令行等五个入口。正文没披露原价,但如果是高频调 API 写代码,这波折扣挺实在。短评:半价加每日免费额度,写代码的可以冲,但限时活动得抓紧。
HKR 分解
hook knowledge resonance
打开信源
56
SCORE
H0·K1·R0
07:48
22d ago
AI HOT 精选· aihot-apiZH07:48 · 05·27
OpenAI 奥尔特曼认错:AI 对白领的冲击没预想的那么严重
Sam Altman 在科技会议上承认,他之前关于 AI 会消灭大量初级岗位的预测没成真,并说“很高兴自己错了”。正文没披露他引用了什么数据或覆盖了哪些行业,只提到 Block、Snap、Meta 裁员时提过 AI,但他今年 2 月又说有些公司只是拿 AI 当裁员借口。这点先别太激动,Altman 自己也没给出具体证据,更像一个态度表态。
#OpenAI#Sam Altman#Commentary
精选理由
OpenAI CEO 说AI对白领的冲击没他之前想的那么严重,还补了句“很高兴自己错了”。这个反转有钩子,但正文没披露原话、数据或适用行业,信息缺口明显。适合浏览级,不推高优先级。
一句话点评
Sam Altman 承认自己之前说AI会消灭大量初级岗位的预测没成真,并表示“很高兴自己错了”。但正文没披露他引用了什么数据或覆盖了哪些行业,只提到Block、Snap、Meta裁员时提过AI,而他今年2月又说有些公司只是拿AI当裁员借口。这点先别太激动,Altman自己也没给出具体证据,更像一个态度表态。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
05:39
22d ago
AI HOT 精选· aihot-apiZH05:39 · 05·27
阿里云被Omdia评为智能体AI市场领导者
Omdia把阿里云列为智能体AI市场雷达的领导者,理由是阿里云在每一层都有全栈能力,而且是第一个把整个平台围绕智能体范式来做的云厂商。不过正文没披露Omdia具体评了多少家、用了哪些标准、阿里云得分多少,所以这个“领导者”的含金量有多大还不好说。
#Agent#Alibaba Cloud#Omdia#Benchmark
精选理由
这是一篇厂商转发分析师徽章的公关稿,正文没披露Omdia用了多少评估维度、样本范围或具体评分,信息缺口太大。没有产品变化、成本数据或竞争对比,对从业者没有实质参考价值。
一句话点评
Omdia把阿里云评为智能体AI市场领导者,理由是“全栈”和“首个围绕智能体范式重构平台”。但正文没披露评了多少家、用了什么标准、阿里云具体得分,这个“领导者”的含金量得打个问号。如果是真的,说明阿里云在AI基础设施的整合度上确实走在前列。
HKR 分解
hook knowledge resonance
打开信源
30
SCORE
H0·K0·R0
02:54
23d ago
AI HOT 精选· aihot-apiZH02:54 · 05·27
我国将推进AI综合立法和低空经济立法
正文没披露草案条款、时间表或负责机构,目前只有立法方向,没有具体内容。
#Safety#China#Policy
精选理由
HKR-K和R通过,因为这条信息点出了中国AI立法动向,影响合规规划。HKR-H不通过,且缺少条款、时间表和主管部门细节,所以归入all层级。
一句话点评
我国要加快AI和低空经济立法,但正文没披露草案条款、时间表或负责机构,目前只有方向,没有具体内容。短评:立法方向定了,但没细节,先别激动。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
01:56
23d ago
AI HOT 精选· aihot-apiZH01:56 · 05·27
阿里云成为PyTorch基金会白金会员
阿里云宣布以白金会员身份加入PyTorch基金会,成为该基金会的最高级别企业会员。官方称已在多种硬件上大规模跑PyTorch,并强调自己是Qwen开源模型家族和AI基础设施的“全球领导者”。但正文没披露会员费金额、具体工程贡献或是否参与PyTorch核心开发,所以这个头衔的实际分量还不好判断。
#Inference-opt#Alibaba Cloud#PyTorch Foundation#Qwen
精选理由
白金会员身份本身是个事实,但正文没提阿里云为此投了多少钱、PyTorch 基金会那边有什么变化,也没说开发者能因此省多少事。信息量就这么多,60–71 档合理。
一句话点评
阿里云成了PyTorch基金会的白金会员,最高级别。官方说自己在多种硬件上大规模跑PyTorch,还是Qwen开源模型的“全球领导者”。但正文没披露会员费多少、具体贡献了什么工程代码、有没有参与核心开发,所以这个头衔的实际分量得打个问号。短评:头衔挺高,但没披露具体贡献和会费,分量得打折。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
01:30
23d ago
AI HOT 精选· aihot-apiZH01:30 · 05·27
Claude Code v2.1.152:代码审查意见能直接改文件了,还加了自动切换备用模型
Anthropic 给 Claude Code 打了个小版本更新。最实用的改动是 /code-review --fix:以前代码审查只给建议,现在可以直接把建议写到工作目录里,省掉手动改的步骤。另外加了 /reload-skills 命令,不用重启就能重载技能配置;SessionStart 也支持技能重载了。MessageDisplay hooks 和...
#Code#Agent#Tools#Anthropic
精选理由
这是一次小版本更新,但四个功能都挺实在:/code-review --fix 省去手动改代码的步骤,/reload-skills 不用重启就能换技能,MessageDisplay 钩子让开发者能自定义消息展示,fallback model 切换保证模型不可用时自动降级。对日常用 Claude Code 写代码的人来说,这些改动能直接提升效率。不过正文没披露具体性能提升数据或模型切换的延迟影响,这点先别太激动。整体属于常规产品更新,重要性 69 合理。
一句话点评
Claude Code 小版本更新,最实用的是 /code-review --fix 能把审查建议直接写进文件,省掉手动改的步骤。还加了 /reload-skills 不用重启就能重载技能配置,以及主模型不可用时自动切备用模型。都是工程体验优化,没有新能力。短评:代码审查从“只动嘴”变成“直接动手”,日常用挺省事。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H0·K1·R1
00:00
23d ago
AI HOT 精选· aihot-apiZH00:00 · 05·27
AI 时代不是软件时代的终结,而是给野马套上缰绳
一位 VC 认为,AI 像野马一样强大但不可控,真正落地需要一套“驯服”系统,包含七个组件:上下文与记忆(为不同场景定制检索,比如放射科医生和律师需要的资料库完全不同)、工具与动作(通过 MCP 协议暴露外部工具,并处理参数校验和失败回退)、编排与循环(思考-行动-观察-重复,支持子任务和重试)、状态与持久化(10 步任务在第 7 步崩溃后能从第 8 ...
#Agent#Tools#Memory#Commentary
精选理由
文章提供了一个实用的生产级智能体架构清单,7个组件覆盖了记忆、工具调用、编排、状态持久化、沙箱、可观测性和成本优化,对正在搭建智能体系统的团队有直接参考价值。但标题过于宏大,正文没有披露任何实验数据、案例或产品发布,所以评分落在60-71区间。
一句话点评
一位 VC 把 AI 比作野马,落地需要一套“驯服系统”,拆了七个组件:上下文记忆(放射科医生和律师要的资料库不一样)、工具调用(MCP 协议暴露外部工具,处理参数校验和失败回退)、编排循环(思考-行动-观察-重复)、状态持久化(10 步任务在第 7 步崩溃后能从第 8 步恢复)、沙箱计算、可观测与治理、成本与工作流优化。观点不新,但框架清晰,适合给团队对齐认知。正文没披露具体落地案例或成本...
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H0·K1·R1
2026-05-26 · 星期二2026年5月26日
23:34
23d ago
AI HOT 精选· aihot-apiZH23:34 · 05·26
Anthropic 任命韩国负责人,准备在首尔开办公室
Anthropic 挖来前 Snowflake 韩国总经理 KiYoung Choi 当韩国代表董事,马上要在首尔开办公室。理由是韩国人用 Claude 的强度是人口比例的 3.5 倍,而且偏技术和创意类工作。Choi 在 Google Cloud、Adobe、微软干过,经验是帮大企业搞云和 AI 转型。正文没披露首尔办公室具体人数和开业时间,但提到高...
#Anthropic#KiYoung Choi#Snowflake#Personnel
精选理由
核心信息是韩国Claude.ai使用量超出人口比例3.5倍,以及Anthropic在首尔设办公室的动作,这两点让文章有信息增量。但新闻主体仍是区域人事任命,悬念弱,所以落在60-71分区间。
一句话点评
Anthropic 挖来前 Snowflake 韩国总经理 KiYoung Choi 当韩国代表董事,马上要在首尔开办公室。理由是韩国人用 Claude 的强度是人口比例的 3.5 倍,而且偏技术和创意类工作。Choi 在 Google Cloud、Adobe、微软干过,经验是帮大企业搞云和 AI 转型。正文没披露首尔办公室具体人数和开业时间,但提到高管近期会去剪彩。这条主要是人事和区域扩张...
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
21:24
23d ago
AI HOT 精选· aihot-apiZH21:24 · 05·26
Claude Code 出了个安全插件,写代码时帮你抓漏洞
Claude Code 发布了一个安全指导插件,所有用户都能从 /plugins 安装。插件会在你写代码时识别并修漏洞。正文没披露它具体能查哪类漏洞、怎么扫描、以及自动修复到什么程度——这点先别太激动,实际覆盖面和误报率都不清楚。
#Code#Tools#Safety#Claude Code
精选理由
H/K/R 都达标,但正文只说了安装路径,没披露漏洞类型、扫描机制和修复范围。这是一个小版本功能更新,够不上专题报道门槛。
一句话点评
Claude Code 出了个安全指导插件,装了就帮你边写代码边找漏洞。但正文没说是哪类漏洞、怎么扫、自动修到什么程度——覆盖面和误报率都不清楚,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
69
SCORE
H1·K1·R1
21:08
23d ago
AI HOT 精选· aihot-apiZH21:08 · 05·26
Google 发了个 Gemini Omni 视频提示词指南,教你用5招控画面
Google 出了份 Gemini Omni 视频生成的使用指南,核心是5个提示词技巧:用模型已有的知识写短描述就行;能精确控制视频里的文字排版;支持推拉摇移这些专业镜头指令,像摄影师一样调度画面;可以迭代编辑,不用从头重来;还能直接调角色动作节奏或情绪。说白了就是靠提示词让模型生成更可控的视频。目前这个功能在 Gemini 应用和 Google Fl...
#Multimodal#Vision#Google#Gemini
精选理由
这是Google自家出的Gemini Omni视频提示词指南,给了5条技巧和两个使用入口,有用但偏轻。HKR-K通过;HKR-H和HKR-R没达到精选标准。
一句话点评
Google 出了份 Gemini Omni 视频提示词指南,核心就五招:用常识写短描述、精确控制文字排版、像摄影师一样用推拉摇移、迭代编辑不用重来、直接调角色情绪。说白了就是让视频生成更可控。目前功能在 Gemini 应用和 Google Flow 里能用。但指南没提生成时长、分辨率、成本这些硬指标,也没说是否支持多人或复杂场景。如果真能靠提示词精确调度镜头和文字,对做短视频或广告素材的人...
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R0
19:59
23d ago
AI HOT 精选· aihot-apiZH19:59 · 05·26
人类与AI分工:教育、咨询和文学奖争议
这篇文章讨论哪些人类特质该保留、哪些可以交给AI,提到了教育实验、咨询实验和最近一个文学奖争议。正文没披露实验设计、样本量、结果,也没说是哪个文学奖,信息缺口比较大,先别急着下结论。
#Commentary
精选理由
硬排除-零来源:HKR-H和HKR-R成立,但正文没有给出任何数据、可复现的设置或具名案例,行业读者得不到一条可验证的新事实。
一句话点评
一篇讨论人类与AI分工的帖子,提到教育、咨询实验和文学奖争议,但正文没披露实验设计、样本量、结果,也没说是哪个文学奖。信息缺口大,先别急着下结论。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K0·R1
19:56
23d ago
AI HOT 精选· aihot-apiZH19:56 · 05·26
选择保持人性:AI 让社交媒体帖子越来越像,但别让它替你思考
Ethan Mollick 观察到社交媒体上的帖子越来越趋同,他怀疑是 AI 生成或同质化处理的结果。正文没披露具体平台、样本量或检测方法。他引用两项教育研究:土耳其高中约 1000 名学生用 ChatGPT 做数学作业,平时作业完成得更好,但考试时反而不如不用 AI 的同学——因为 AI 直接给答案,绕过了学习必需的心智努力。另一项在台北十所高中近 ...
#Commentary
精选理由
硬排除-零来源适用:帖子声称内容趋同,但没给平台、样本量、检测方法或具名例子。HKR-R命中,但HKR-H/K未命中,因此排除。
一句话点评
Ethan Mollick 观察到社交媒体帖子越来越像,怀疑是 AI 生成或同质化处理的结果,但正文没披露具体平台、样本量或检测方法。他引用两项教育研究:土耳其约 1000 名高中生用 ChatGPT 做数学作业,平时作业完成得更好,但考试时反而不如不用 AI 的同学——因为 AI 直接给答案,绕过了学习必需的心智努力。另一项在台北十所高中的近千名学生中,用 AI 辅助学习的学生在概念理解上...
HKR 分解
hook knowledge resonance
打开信源
36
SCORE
H0·K0·R1
19:55
23d ago
AI HOT 精选· aihot-apiZH19:55 · 05·26
Luma Agents 把新闻稿一键转成可分享图
Luma Labs 宣布 Luma Agents 能把新闻稿直接变成可分享的图形,操作就两步:贴内容、定方向。正文没披露模板数量、生成次数限制或定价,目前看更像一个轻量演示,离成熟产品还有距离。
#Agent#Tools#Luma Labs#Product update
精选理由
这是 Luma Agents 的一个小功能更新:正文只披露了两步工作流,没有价格、模板数量或生成限制。HKR-K 勉强通过,HKR-H/R 都很弱,所以留在较低的产品更新档位。
一句话点评
Luma Labs 出了个 Agents 功能,能把新闻稿一键转成可分享的图片,操作就两步:贴内容、定方向。听起来挺省事,但正文没披露模板数量、生成次数限制或定价,目前更像一个轻量演示,离成熟产品还有距离。短评:两步出图,但缺模板数和定价,先当玩具看。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K1·R0
16:00
23d ago
AI HOT 精选· aihot-apiZH16:00 · 05·26
Replit 应用加登录的两种方式:零配置或品牌化
Replit 给应用加登录提供了两个选项:一是 Replit Auth,零配置,用户直接用 Replit 账户登录,适合快速验证;二是 Clerk Auth,支持品牌化登录界面,开发和生产环境都只需一个提示词就能搞定。正文没披露具体费用或限制,但零配置方案对原型阶段挺省事。
#Tools#Replit#Clerk#Product update
精选理由
这是一篇 Replit 登录功能的常规更新,提供了两种登录方式,但正文没披露安全边界、定价或 AI 能力,所以归为低价值的可浏览 all 层级。
一句话点评
Replit 给应用加登录出了两个方案:Replit Auth 零配置,用户直接用 Replit 账号登录,适合快速验证原型;Clerk Auth 支持品牌化登录界面,开发和生产环境都只需一个提示词搞定。正文没披露费用或限制,但零配置方案对原型阶段挺省事。
HKR 分解
hook knowledge resonance
打开信源
52
SCORE
H0·K1·R1
15:39
23d ago
AI HOT 精选· aihot-apiZH15:39 · 05·26
2026年5月AI展望:开源模型还没追上闭源,Google的Gemini也打不过Claude Code
这篇文章是Nathan Lambert对2026年5月AI行业现状的观察。核心判断是:开源模型在真正的智能体(agent)场景里,离闭源模型还有明显差距。去年12月Anthropic的Opus 4.5在Claude Code里表现炸裂,但到现在快半年了,还没有开源模型能复制那个体验。作者估计这个差距可能还要再拖半年以上。Google的Gemini 3....
#Gemini#Mythos#Commentary#Open source
精选理由
HKR-R 靠开源生态张力过关,但 HKR-H 和 HKR-K 都不行:角度太宽,披露的事实缺数字、缺机制、缺可验证的论断。
一句话点评
开源模型在真正的智能体场景里离闭源还有明显差距。去年12月Anthropic的Opus 4.5在Claude Code里表现炸裂,但快半年了,还没有开源模型能复制那个体验。作者估计这个差距可能还要再拖半年以上。Google的Gemini 3.5 Flash也没能挑战Claude Code和Codex。正文没披露Mythos的具体参数和发布方,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
14:00
23d ago
AI HOT 精选· aihot-apiZH14:00 · 05·26
微软亚洲研究院办AI价值观挑战赛,找哲学法学社科的人来参赛
微软亚洲研究院发起了一个全球AI价值观挑战赛,专门面向哲学、伦理、法学和社会科学的研究人员。比赛目的是探讨AI能否理解人类价值观的复杂性。帖子只给了报名链接,没披露比赛形式、奖金、时间线和评审标准。如果你关心AI对齐中的价值判断问题,可以关注后续信息。
#Alignment#Safety#Microsoft Research Asia#Safety/alignment
精选理由
微软亚洲研究院发了个AI价值观挑战赛,面向哲学、伦理、法学和社会科学研究者,但正文没披露赛制、奖金或时间表,信息量很低。安全对齐是行业痛点,所以有讨论价值,但缺关键细节,只能放在低到中位的all层。
一句话点评
微软亚洲研究院办了个AI价值观挑战赛,只招哲学、伦理、法学、社科的人,想探讨AI能不能理解人类价值观的复杂性。但正文只给了报名链接,没披露比赛形式、奖金、时间线和评审标准,信息缺口很大。如果你关心AI对齐中的价值判断问题,可以蹲后续,但这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
58
SCORE
H0·K0·R1
10:09
23d ago
AI HOT 精选· aihot-apiZH10:09 · 05·26
Uber 四个月烧光全年 AI 预算,总裁公开质疑:钱花哪了?
Uber 总裁 Andrew Macdonald 说,公司 2026 年前四个月就把全年 AI 预算花完了,但他看不出 token 用量暴涨和用户实际体验提升之间有什么关系。2025 年 Uber 研发投入 34 亿美元(约 231 亿人民币),同比增长 9%,但 CEO 已经开始用缩减招聘来填 AI 的坑。Macdonald 的原话是:token 用...
#Uber#Commentary
精选理由
标题抓眼球,但正文信息量不足:没给预算规模、项目范围、总裁原话的完整语境。适合推给所有人看,因为话题本身有讨论价值,但别当深度分析。
一句话点评
Uber总裁说2026年前四个月就把全年AI预算烧光了,但token用量暴涨和用户体验提升之间看不出关系。2025年研发投入34亿美元(约231亿人民币),同比增9%,CEO已开始缩减招聘来填AI的坑。关键信息缺口:正文没披露全年AI预算具体金额、项目范围,也没给采访完整上下文。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
07:27
23d ago
AI HOT 精选· aihot-apiZH07:27 · 05·26
阿里云CTO:从云原生转向智能体原生,四大基石铺路
阿里云CTO李飞飞在QwenConference2026上宣布,公司正从云原生转向智能体原生,并为此搭建了四大基石:模型、智能体云、工具与服务,以及规模。说白了就是,阿里云不再只卖算力和容器,而是想让模型直接进业务流程干活。不过正文没具体说这四大基石各自怎么落地、成本或延迟有没有改善,目前更像一个方向宣言。
#Agent#Tools#Alibaba Cloud#Li Feifei
精选理由
硬排除-云厂商宣传/纯营销:阿里云CTO讲“从云原生到智能体原生”加四个基石,但没有可验证的产品细节或从业者冲突;HKR三项全部不满足。
一句话点评
阿里云CTO李飞飞在QwenConference2026上宣布从云原生转向智能体原生,核心是让模型直接进业务流程干活,而非只卖算力。四大基石(模型、智能体云、工具与服务、规模)更像方向宣言,正文没披露具体落地路径、成本或延迟改善。目前缺验证,先别太激动。
HKR 分解
hook knowledge resonance
打开信源
34
SCORE
H0·K0·R0
05:37
23d ago
AI HOT 精选· aihot-apiZH05:37 · 05·26
龙虾之父开源 skill-cleaner:给 AI 智能体的技能“减肥”,省 token 又提准
OpenClaw 龙虾之父 Peter 开源了一个叫 skill-cleaner 的工具,专门给 AI 智能体的技能描述做“体检”和“减肥”。核心问题:很多开发者把技能描述写得太长,像本书一样,导致每次调用都多花 token 钱,还让智能体选技能时容易出错。有个用户案例:把技能描述从 90 多词砍到 40 词以内后,智能体一次就选对了技能。这个工具能自...
#Agent#Tools#Peter#Open source
精选理由
H/K/R 都够,但这是个个人开源小工具,不是框架级发布。正文给了功能数量和压缩例子,但没披露评估规模、准确率数字或社区采用信号。
一句话点评
Peter 开源了一个给 AI 智能体技能描述“做体检”的工具 skill-cleaner,核心是帮开发者砍掉冗长的技能描述,省 token 钱。有个案例:描述从 90 多词砍到 40 词以内,智能体一次就选对了技能。工具能查重复、闲置技能,还能自动精简描述。不过正文没披露测试规模,单案例说服力有限,实际效果得自己跑一遍。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
04:54
24d ago
AI HOT 精选· aihot-apiZH04:54 · 05·26
谷歌 AlphaProof Nexus 用 AI 自动证明数学定理,解出 2 道 56 年没人做出来的题
谷歌 DeepMind 新框架 AlphaProof Nexus 把大语言模型和 Lean 形式化验证(一种让计算机严格检查证明每一步是否合法的工具)结合起来,在 353 个开放数学问题里自主解出 9 个,其中 2 个已经挂了 56 年。它还从 492 个整数序列猜想里证明了 44 个,解决了一个 15 年的 Hilbert 函数问题。每个问题的推理成...
#Reasoning#Google#AlphaProof Nexus#Research release
精选理由
标题的钩子很强,56年和2道题的数字直接拉高期待,但正文完全没披露题目名称、证明机制或复现条件,信息缺口导致可信度打折扣。谷歌在推理赛道上的竞争背景让这条内容有讨论价值,但缺乏可验证细节,所以评分卡在60-71区间合理。
一句话点评
谷歌DeepMind的AlphaProof Nexus用大语言模型+Lean形式化验证(让计算机严格检查证明每一步),在353个开放数学问题里自主解出9个,其中2个挂了56年。每个问题推理成本只要几百美元,这点挺省钱。但正文没披露具体是哪两个56年难题,也没说证明过程是否可复现。Agent A(最简版本)也能解这9个问题,说明底层模型能力提升是关键,别太激动以为是新架构的功劳。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K0·R1
03:57
24d ago
AI HOT 精选· aihot-apiZH03:57 · 05·26
Kling AI 给亚马逊剧集《大卫之家》做了 AI 生成场景,号称行业首次
《大卫之家》创作者 Jon Erwin 说 Kling AI 支撑了该剧第一季和第二季,并实现了多项行业首次:在已完成的剧集中用 AI 生成场景、首个原生 4K 模型,以及运动控制功能让 AI 生成内容保留演员真实情感。但正文没披露用了多少 AI 镜头、具体上线时间或技术基准,所以这点先别太激动——是局部辅助还是大量替代,信息缺口还在。
#Multimodal#Vision#Kling AI#Jon Erwin
精选理由
触发硬排除规则5:这是一篇 Kling AI 的供应商案例,核心信息就是某剧用了该产品。没有独立信源、镜头数、成本或工作流数据,所以分数封顶39。
一句话点评
Kling AI 撑起了亚马逊热剧《大卫之家》第一二季,号称首次在已完成的剧集里用 AI 生成场景、首个原生 4K 模型,还能靠运动控制保留演员真实情感。但正文没披露用了多少 AI 镜头、具体上线时间或技术基准,所以这点先别太激动——是局部辅助还是大量替代,信息缺口还在。
HKR 分解
hook knowledge resonance
打开信源
39
SCORE
H1·K1·R0
02:50
24d ago
AI HOT 精选· aihot-apiZH02:50 · 05·26
腾讯混元发翻译模型 Hy-MT2,1.8B 版本登顶 Hugging Face 趋势榜
腾讯混元发布 Hy-MT2 翻译模型,1.8B 小模型在 Hugging Face 开源趋势榜排第一,30B-A3B MoE 版排第四,下载量已超 7000。同时上线了“腾讯混译”微信小程序,支持语音输入、离线翻译,还能自定义翻译风格和指令。模型代码和权重已开源。
#Audio#Inference-opt#Tencent Hunyuan#Hugging Face
精选理由
HKR 三项都过线,但内容基本是官方发布加榜单数据,没披露评测集、许可证、定价,也没和 DeepL/Google 做可复现对比,所以分数压在 60-71 区间。
一句话点评
腾讯混元新翻译模型 Hy-MT2 在 Hugging Face 上火了:1.8B 小模型排趋势榜第一,30B-A3B MoE 版排第四,下载量超 7000。同时上线了微信小程序“腾讯混译”,支持语音输入、离线翻译,还能自定义风格和指令。模型已开源。 亮点是 1.8B 小模型能排第一,说明在翻译任务上小参数也能打,部署成本低。但 7000 下载量不算大,热度可能来自腾讯品牌和微信生态。官方没...
HKR 分解
hook knowledge resonance
打开信源
71
SCORE
H1·K1·R1
00:00
24d ago
AI HOT 精选· aihot-apiZH00:00 · 05·26
智能体重力:平台靠算力和数据锁住你的AI干活
风投Tom Tunguz提出一个新概念“智能体重力”:AI agent跑起来需要大量算力,哪个平台能提供算力、又能把数据留在自己生态里,agent就更难迁移走。他举了个例子——Databricks在微软平台上新加了一个功能,让Power BI用户能直接在Databricks里建agent、管数据,而不是用微软自家的Fabric。这等于在挖对手的数据和a...
#Agent#Tom Tunguz#Databricks#Microsoft
精选理由
文章提出了一个有用的概念“智能体重力”——智能体需要巨大算力,平台会借此留住用户。案例是Databricks在微软平台上的功能,但正文没披露具体算力规模或成本数字,所以更像一篇观点评论,不够硬核。HKR三项都达标,但缺可验证数据,达不到精选门槛。
一句话点评
风投Tom Tunguz提出“智能体重力”:AI agent跑起来需要大量算力,哪个平台能提供算力、又能把数据留在自己生态里,agent就更难迁移走。他举了个例子——Databricks在微软平台上新加了一个功能,让Power BI用户能直接在Databricks里建agent、管数据,而不是用微软自家的Fabric。这等于在挖对手的数据和agent workload。想法有意思,但正文没披...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
2026-05-25 · 星期一2026年5月25日
23:53
24d ago
AI HOT 精选· aihot-apiZH23:53 · 05·25
Anthropic 新模型 Claude Mythos 让欧洲央行紧急开会:银行补丁速度必须从“行板”提到“急板”
Anthropic 的 Claude Mythos 模型能自动挖出银行系统的高危漏洞,已发现数千个,覆盖主流操作系统和浏览器。欧洲央行为此临时召集会议,要求银行大幅加快补丁部署——以前几周做的事,现在可能30分钟内就会被黑客反向利用。但问题是,Mythos 目前只对少数美国机构开放,欧洲银行拿不到权限,只能靠美国同行分享经验。央行副主席说“没有权限不能...
#Safety#Anthropic#European Central Bank#Policy
精选理由
标题用“震动金融圈”“紧急开会”制造了强冲击,但正文没给出模型名称、会议时间、升级机制或影响范围,信息缺口太大。H和R靠标题的监管安全钩子勉强过关,K因为关键事实全缺而失败。整体信息密度低,属于标题党高、干货少的类型,不值得高优先级处理。
一句话点评
Claude Mythos 能自动挖银行系统高危漏洞,已发现数千个,覆盖主流系统和浏览器。欧洲央行紧急开会要求银行把补丁部署从几周压缩到30分钟内——因为黑客可能反向利用。但Mythos只对少数美国机构开放,欧洲银行拿不到权限,只能靠美国同行分享经验。正文没披露Mythos的具体检出率、误报率,也没说哪些银行实际参与了测试。这点先别太激动:模型能力是真的,但封闭测试+信息不对称让欧洲监管只能...
HKR 分解
hook knowledge resonance
打开信源
49
SCORE
H1·K0·R1
16:40
24d ago
AI HOT 精选· aihot-apiZH16:40 · 05·25
Luma Agents 帮你生成电商主图,说能提升转化率
Luma Labs 发推说 Luma Agents 能根据你上传的参考图和风格定义,自动生成电商商品主图,号称能把浏览者变成买家。但正文没披露任何转化率提升数据、定价或测试条件,这点先别太激动。
#Agent#Vision#Luma Labs#Product update
精选理由
硬排除适用于营销/数据单薄的内容:转化率声称没有具体数字、样本量、价格或可复现的测试设置。HKR三项全不满足,因此分数低于40。
一句话点评
Luma Agents 能根据参考图和风格定义自动生成电商主图,号称把浏览者变买家。但正文没披露任何转化率提升数据、定价或测试条件,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H0·K0·R0
15:26
24d ago
AI HOT 精选· aihot-apiZH15:26 · 05·25
Qwen3.7-Max 隐式缓存上线:自动开启,不用配置
Qwen3.7-Max 新增了隐式缓存功能,默认自动启用,用户无需任何设置就能享受更快的响应和更低的成本。不过官方没说具体能省多少钱、延迟降多少,也没给缓存命中率。如果你需要更稳定、更高的命中率,可以改用显式缓存(需要手动配置)。
#Inference-opt#Qwen#Alibaba Cloud#Product update
精选理由
这是 Qwen3.7-Max 的一个小推理优化更新。HKR-K/R 通过机制和成本/延迟相关性,但没有降价、延迟提升或命中率数据,所以分数落在 60–71 区间。
一句话点评
Qwen3.7-Max 上线了隐式缓存,默认自动开,用户不用改任何设置就能省成本、提速度。但官方没披露具体省多少钱、延迟降多少,也没给缓存命中率——这点先别太激动。如果你需要更稳定的效果,可以手动配显式缓存。正文没披露实测数据,实际收益得自己跑一遍才知道。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H0·K1·R1
13:53
24d ago
AI HOT 精选· aihot-apiZH13:53 · 05·25
教皇与Anthropic合作,讨论AI时代人类未来
梵蒂冈办了一场活动,教皇XIV和Anthropic联合创始人Christopher Olah聊了AI时代人类怎么办。Olah说AI有真实可能大规模替代人类劳动,还观察到模型内部出现了类似喜悦、恐惧的“内部状态”——这点先别太激动,正文没披露具体怎么测的、样本多大、验证多强。合作机制、时间线、具体项目都没说,目前更像一场高层对话,不是落地计划。
#Safety#Interpretability#Anthropic#Christopher Olah
精选理由
H和R通过:教皇+Anthropic创始人这个组合本身有话题性,也切中AI安全与价值观治理的敏感点。K不通过:正文只说了双方对话,没披露合作机制、时间表或具体项目,信息缺口太大,够不上推荐位。
一句话点评
教皇和Anthropic聊AI,更像一场高层对话而非落地计划。Olah说AI可能大规模替代人类劳动,还观察到模型内部有类似喜悦、恐惧的“状态”——这点先别太激动,正文没披露怎么测的、样本多大、验证多强。合作机制、时间线、具体项目都没说,信息缺口明显。
HKR 分解
hook knowledge resonance
打开信源
66
SCORE
H1·K0·R1
2026-05-24 · 星期日2026年5月24日
22:13
25d ago
AI HOT 精选· aihot-apiZH22:13 · 05·24
Luma Agents推出自动生成用户生成内容风格广告
Luma Labs 说 Luma Agents 可以根据你给的简报和风格设定,自动生成看起来像用户自拍的那种广告视频。正文没披露能生成多少条、怎么收费、用了什么模型,也没说这些广告能不能直接投放到平台。
#Agent#Luma Labs#Product update
精选理由
这是Luma Labs自家X帖的产品更新,属于小厂动态。HKR的h和r通过,但k不通过——因为生成量、定价、机制、投放效果都没披露,信息缺口太大,没法判断实际价值。
一句话点评
Luma Agents 能批量生成像用户自己拍的广告图/视频,适合电商主图、社媒素材。关键看它是不是真能模仿真实用户风格,而不是套模板。正文没披露生成成本、单条耗时,也没说支持哪些平台。如果成本够低、效果不假,对中小卖家挺实用。
HKR 分解
hook knowledge resonance
打开信源
64
SCORE
H1·K0·R1
17:18
25d ago
AI HOT 精选· aihot-apiZH17:18 · 05·24
让 Codex 自己学会把重复活做成自动化工具
这是一个提示词框架,教 Codex 翻自己的聊天记录和记忆,找出那些至少干过两次、输入稳定的重复任务,然后自动把它们变成技能、子智能体或自动化工具,避免重复造轮子。流程包括生成候选清单、执行创建,最后汇报结果和待验证项。正文没披露这个框架在实际测试中的成功率或误判率,但思路挺实用——相当于让模型自己给自己写脚本,省掉人工梳理重复工作流的时间。
#Code#Agent#Memory#Codex
精选理由
HKR 都过,但这是一套实用提示框架,不是 Codex 新功能发布。正文给了筛选机制,没披露效果指标、案例或对照实验,所以压在 70 分。
一句话点评
这个提示词框架让 Codex 自己翻聊天记录和记忆,找出至少干过两次、输入稳定的重复任务,自动变成技能或自动化工具。相当于让模型给自己写脚本,省掉人工梳理重复工作流的时间。正文没披露实际测试的成功率或误判率,这点先别太激动。思路挺实用,但效果得看实测。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
15:05
25d ago
AI HOT 精选· aihot-apiZH15:05 · 05·24
Pixverse 测了个角色设计工作流:GPT Image 出图,Seedance 做动画
Pixverse 放了个角色设计工作流测试:先用 GPT Image 2.0 生成 Lucas 的静态概念图,再用 Seedance 2.0 把图做成弹跳动画。效果从静态到电影级动态。正文没披露具体耗时、成本或可控性,目前只是演示链路通不通。
#Multimodal#Vision#Pixverse#GPT Image 2.0
精选理由
正文没披露生成耗时、画质对比或定价,就是一个社交演示,不是产品发布或技术评测。
一句话点评
Pixverse 把 GPT Image 2.0 和自家 Seedance 2.0 串起来做了个角色设计工作流:先画静态概念图,再一键生成弹跳动画。效果看着挺顺,但正文没披露耗时、成本或可控性,目前只是演示链路通不通。这点先别太激动,等开放测试再看实际体验。
HKR 分解
hook knowledge resonance
打开信源
45
SCORE
H0·K1·R0
12:05
25d ago
AI HOT 精选· aihot-apiZH12:05 · 05·24
Claude Code 自动模式:让多个任务同时跑
作者说 Claude Code 的自动模式去掉了每次操作的权限确认弹窗,这样你可以在一个会话跑着的时候,另开一个会话并行干活,不用干等着。
#Agent#Code#Tools#Claude
精选理由
HKR 三项都过,但这是一条短小的 X 工作流技巧,没有时序数据、失败边界或安全细节。保持在 Claude Code 生产力技巧小分类的 68 分区间。
一句话点评
Claude Code 的自动模式去掉了每次操作的权限确认弹窗,让你能同时开多个会话并行干活,不用干等着。核心价值是省掉手动确认的等待时间,适合批量改代码或跑多个任务。但正文没披露自动模式下的安全机制——没有弹窗意味着模型可以直接执行写文件、跑命令等操作,误操作或恶意指令的防护全靠模型自身判断,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R1
04:00
26d ago
AI HOT 精选· aihot-apiZH04:00 · 05·24
OpenClaw 2026.5.22 发布:模型列表响应降到5毫秒,npm包锁依赖防投毒
OpenClaw 新版本把 /models 接口响应时间压到约5毫秒,之前没给具体数字,但5毫秒对网关层来说基本是瞬时返回。npm 包现在加了锁定依赖,能防止依赖链被篡改或投毒,对生产环境部署更安全。Windows 安装和更新路径也做了加固。整体是一次性能和安全的小迭代,没有新功能,但如果你在用 OpenClaw 做模型路由,值得升一下。
#Inference-opt#Safety#OpenClaw#Product update
精选理由
一个小工具的版本更新,有一个具体的延迟数字和一个依赖锁定机制,所以 HKR-K 通过。没有新能力、定价变化或广泛生态影响,分数落在 60–71 区间。
一句话点评
OpenClaw 小版本更新,/models 接口响应压到约5毫秒,网关层基本瞬时返回。npm 包加了锁定依赖,防依赖链投毒,Windows 安装路径也加固了。没新功能,但做模型路由的话值得升。正文没披露5毫秒是P50还是P99,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
61
SCORE
H0·K1·R0
2026-05-23 · 星期六2026年5月23日
19:00
26d ago
AI HOT 精选· aihot-apiZH19:00 · 05·23
Replit Agent 接上 Squidler:说人话就能测 App,测完还能自己修
Replit 的 AI 编程助手 Agent 接入了测试工具 Squidler,用户用自然语言描述想要的功能,Agent 直接生成应用并部署,Squidler 像真人一样点来点去测 bug,测出问题再自动丢回给 Agent 修。整个过程不用写一行测试脚本,等于把“写代码→测 bug→改代码”这个循环全自动化了。正文没披露这套流程跑一轮要多久、Squid...
#Agent#Tools#Code#Replit
精选理由
HKR 三项都过,但来源是官方 X 级别的产品公告,没有可复现的结果、定价或覆盖细节。按中小型 coding agent 集成处理,不到推荐位门槛。
一句话点评
Replit Agent 接上 Squidler 后,你只需用自然语言描述想要的功能,Agent 自动生成应用并部署,Squidler 像真人一样点来点去测 bug,测出问题再自动丢回给 Agent 修——全程不用写一行测试脚本。等于把“写代码→测 bug→改代码”这个循环全自动化了。但正文没披露这套流程跑一轮要多久、Squidler 的测试覆盖率有多高,也没说它能不能测复杂交互或跨页面逻辑...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
09:46
26d ago
AI HOT 精选· aihot-apiZH09:46 · 05·23
Mistral收购Emmi AI,补物理仿真团队做工业AI
Mistral AI宣布收购Emmi AI,后者有30多名物理仿真和数字孪生方向的研发人员。这笔交易的核心是补人——Mistral想用物理仿真能力做工业AI,比如在制造、能源场景里让模型理解真实物理规律。数字孪生就是给设备建一个虚拟副本,可以低成本跑模拟、做预测。30多人不算大团队,但对工业AI这种重垂直场景来说,关键人才比人数重要。正文没披露收购金额...
#Robotics#Mistral AI#Emmi AI#Partnership
精选理由
HKR-H/K 通过,因为 Mistral 确实收购了 Emmi AI 并加了 30 多人。HKR-R 偏弱:没有交易金额、产品路线图或客户验证,所以分数落在 60–71 区间。
一句话点评
Mistral 收购了做物理仿真和数字孪生的 Emmi AI,30 多人团队,想补工业 AI 的物理理解能力。数字孪生就是给设备建虚拟副本,低成本跑模拟。30 人不大,但工业场景关键人才比人数重要。正文没披露收购金额,也没说具体落地客户,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R0
07:15
26d ago
AI HOT 精选· aihot-apiZH07:15 · 05·23
飞书里直接调本地 Claude Code,开源项目已上线
feishu-claude-code-bridge 这个开源项目把飞书和本机的 Claude Code CLI 连起来了。你在飞书发消息,它转成 prompt 传给 `claude -p` 执行,再把输出流式同步回飞书。反过来 Claude 也能读飞书里的上下文、创建编辑文档。相当于把飞书当聊天界面,背后跑本地模型干活。项目还能扩展接 Codex 等其...
#Agent#Code#Tools#Feishu
精选理由
HKR 全过:飞书桥接 Claude Code 有具体的工作流钩子(h)、机制和计费日期(k)、以及团队成本痛点(r)。范围就是一条 X 帖里的单个开源连接器,所以分数压在 70 档。
一句话点评
飞书当聊天界面,背后跑本地 Claude Code 干活,挺实用。但注意 6 月 15 日起 `claude -p` 模式要单独计费,成本会涨。项目开源可扩展,但正文没披露延迟和稳定性数据,生产环境需谨慎。
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
02:35
27d ago
AI HOT 精选· aihot-apiZH02:35 · 05·23
Kling AI 在戛纳办了场官方会,聊 AI 怎么进电影制作流程
Kling AI 在戛纳电影市场(Marché du Film)搞了场官方会议,跟全球电影人聊 AI 怎么真正进制作流程。官方说它已经用在动画长片、好莱坞剧集、实验短片和院线电影四种类型上。正文没披露具体合作方或项目细节,所以这点先别太激动——能进戛纳本身是个信号,但实际落地效果和规模还不清楚。
#Multimodal#Vision#Kling AI#Marché du Film
精选理由
触发硬排除-纯营销:核心事实是Kling AI在戛纳电影市场办了一场官方会议,没有新模型、新功能、新定价或可验证的成片列表。电影+AI的劳动力角度给了有限相关性,但正文没披露任何具体项目名称、制作成本或延迟数据,信息缺口太大,不值得推送。
一句话点评
Kling AI 在戛纳电影市场办了官方会议,宣称已用于动画长片、好莱坞剧集、实验短片和院线电影四种类型。能进戛纳是个信号,但正文没披露具体合作方或项目细节,实际落地效果和规模还不清楚,这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
35
SCORE
H0·K0·R1
00:41
27d ago
AI HOT 精选· aihot-apiZH00:41 · 05·23
Google DeepMind 扩大与新加坡合作,主攻科学发现、防疫和医疗
Google DeepMind 宣布扩大与新加坡的合作,新项目覆盖三个方向:加速科学发现、加强大流行病防范和改善医疗保健。正文没披露预算、时间表、具体模型或部署规模,所以目前只能知道合作范围变宽了,但投入多大、落地多快还不清楚。
#Safety#Google DeepMind#Singapore#Partnership
精选理由
这是一条 Google DeepMind 与新加坡扩大合作的简讯,正文只列出了三个方向(科学发现、大流行病防范、医疗保健),但没给预算、时间表或任何部署指标,所以从业者看完没法评估投入产出或跟进节奏。信息密度低,适合快速扫过,不值得深挖。
一句话点评
DeepMind 跟新加坡的合作又扩大了,这次覆盖科学发现、大流行病防范和医疗三个方向。但正文没披露预算、时间表、具体模型或部署规模,所以目前只能知道合作范围变宽了,投入多大、落地多快还不清楚。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H0·K1·R0
2026-05-22 · 星期五2026年5月22日
23:59
27d ago
● P1AI HOT 精选· aihot-apiZH23:59 · 05·22
Gemini 月活破 9 亿,新增两个能替你干活的代理功能
Google 说 Gemini 应用月活用户超过 9 亿了。这次更新把 Gemini 从问答工具往主动干活的个人代理方向推了一步。新模型叫 Gemini 3.5 Flash,还换了套叫“Neural Expressive”的设计语言,另外 Gemini Omni 模型能把提示词直接生成视频。重点在两项代理功能:Daily Brief 会给你出个性化每日...
#Agent#Multimodal#Google#Gemini
精选理由
Google 这次更新核心就两件事:一是 Gemini 应用月活冲到 9 亿,盘子确实大;二是推出了 Daily Brief 和 Gemini Spark 两个代理功能,后者可以在用户授权下 24 小时跑任务。我会先打个折,正文没披露代理功能的具体完成率和延迟数据,实际干活靠不靠谱还不知道。但 9 亿这个量级加上“常驻后台的个人代理”定位,对做 agent 产品的团队来说是个明确的信号——大厂开始用自家分发渠道推代理了,竞争门槛在抬高。
一句话点评
Gemini 月活破 9 亿,但 Google 没说是怎么算的。新推的 Daily Brief 和 Spark 代理功能听起来像能替你干活,实际能接管多少任务、会不会翻车,正文没给细节,先别太激动。
锐评
Google 这次把 Gemini 从问答工具往主动干活的个人代理方向推了一步。月活 9 亿这个数字挺大,但正文没披露统计口径,是打开过就算,还是真在用的,不知道。新模型叫 Gemini 3.5 Flash,还换了套设计语言,另外 Omni 模型能把提示词直接生成视频,这点如果效果稳定,对内容创作挺省事。 重点在两项代理功能:Daily Brief 给你出个性化每日简报,Gemini Spark 号称能 7x24 小时替你管理任务。听着像能帮你订票、回消息、整理日程,但授权范围、出错率、隐私怎么处理,正文全没提。这种主动代理一旦翻车,代价比问答答错大得多。 还缺的是实际体验数据和限制条件。比如 Spark 能接管哪些 App,跨平台支持怎么样,延迟高不高。这些不说清楚,9 亿用户更像是个宣传数字,产品到底能不能用,还得等上手。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
22:10
27d ago
AI HOT 精选· aihot-apiZH22:10 · 05·22
ViggleAI 说动捕和角色动画变简单了,但没给细节
ViggleAI 发帖称动作捕捉和角色动画制作变得更容易,但正文只说了“持续构建,更多功能即将推出”。没有披露具体能力、技术参数、定价或发布日期,信息量很少,无法判断实际效果。
#Vision#Multimodal#ViggleAI#Product update
精选理由
硬排除规则5适用:这是一条产品预告,没有具体功能、规格、发布日期或可验证的机制。HKR-H、HKR-K、HKR-R均不满足。
一句话点评
ViggleAI 发了条帖子,说动捕和角色动画变简单了,但正文就一句“持续构建,更多功能即将推出”。没提具体能力、技术参数、定价或发布日期,信息量约等于零。短评:画饼帖,等真东西出来再说。
HKR 分解
hook knowledge resonance
打开信源
28
SCORE
H0·K0·R0
20:16
27d ago
AI HOT 精选· aihot-apiZH20:16 · 05·22
Codex 差异视图新增经典 +/- 标记选项
OpenAI 给 Codex 功能加了个外观设置:差异视图现在可以切换成传统的 +/- 标记,而不是只有彩色条。默认还是彩色条,需要你手动去开。就是个界面小调整,不影响功能。
#Code#Tools#OpenAI#Product update
精选理由
这是 OpenAI 开发者工具里一个很小的 UI 设置更新:HKR-K 靠具体机制(新增标记选项)通过,HKR-H 和 HKR-R 都很弱。属于小产品更新的低端,不值得推荐。
一句话点评
OpenAI 给 Codex 的差异视图加了个外观选项,可以切回传统的 +/- 标记,默认还是彩色条。就是个界面小调整,不影响功能,别激动。
HKR 分解
hook knowledge resonance
打开信源
55
SCORE
H0·K1·R0
19:57
27d ago
● P1AI HOT 精选· aihot-apiZH19:57 · 05·22
Anthropic 的 Project Glasswing 一个月内发现超万个高危软件漏洞
Anthropic 说,他们和大约 50 家合作伙伴用 Claude Mythos Preview 模型,在全球最关键的基础软件里找到了超过一万个高危或严重级别的漏洞。现在瓶颈已经不是找漏洞的速度,而是验证、通报和打补丁的速度。在开源软件扫描这块,模型自己估算发现了 6,202 个高危或严重漏洞,其中 1,752 个已经过独立安全公司或 Anthrop...
#Code#Agent#Benchmarking#Anthropic
精选理由
Anthropic 这次放出的不是模型跑分,而是 Claude 在真实关键系统里挖漏洞的战报。约 50 家合作伙伴用 Claude Mythos Preview 扫出超过一万个高危或严重漏洞,独立验证准确率 90.6%,说明模型在安全自动化这条线上已经从“能看”走到“能干活”了。我会先打个折:正文没披露漏洞类型分布、误报率和修复成本,也没说这 90.6% 是在什么条件下测的,所以准确率数字先别太激动。但不管怎么说,一万多个高危漏洞这个量级,加上 Mozilla、Cloudflare 这类合作方背书,对做安全自动化和关键基础设施防护的团队来说,是一个...
一句话点评
Anthropic 用新模型一个月扫出上万个高危漏洞,但具体细节要等补丁铺开才能说,现在看到的数字先打个折。
锐评
Anthropic 公布了 Project Glasswing 的首月数据:约 50 家合作方用 Claude Mythos Preview 模型,在各自的核心软件里总共发现了超过一万个高危或严重漏洞。Cloudflare 一家就找到 2000 个 bug,其中 400 个是高危或严重级别,而且误报率比人类测试员还低。Mozilla 测 Firefox 150 时挖出 271 个漏洞,是上一版用 Claude Opus 4.6 时的十倍多。这些数字说明 AI 找漏洞的速度已经远超人类,现在瓶颈变成了怎么快速验证、通报和打补丁。 在开源软件扫描上,Anthropic 自己用 Mythos Preview 扫了 1000 多个项目,模型自己估计有 6202 个高危或严重漏洞。其中 1752 个已经过外部安全公司复核,90.6% 是真漏洞,62.4% 确认是高危或严重级别。按这个比例推算,光开源项目就能筛出近 3900 个高危漏洞。wolfSSL 那个例子挺直观——模型直接构造了一个能伪造证书的攻击,影响数十亿设备。 不过要冷静看。Anthropic 自己说了,因为行业惯例是漏洞发现后 90 天才公开细节,现在披露的都是滞后指标。正文没给出漏洞的具体类型分布,也没说这些漏洞里有多少是模型独立发现、多少需要人工引导。英国 AISI 和 XBOW 的外部评测都夸模型能力强,但评测基准的覆盖面和真实攻防场景的差距有多大,文章没展开。另外,微软和甲骨文都说补丁量在猛增,但没提这些补丁对应的漏洞修复成本有多高。等补丁大规模部署后 Anthropic 承诺会放出更多细节,那时候才能判断这波 AI 挖漏洞到底改变了什么。
HKR 分解
hook knowledge resonance
打开信源
98
SCORE
H1·K1·R1
19:34
27d ago
AI HOT 精选· aihot-apiZH19:34 · 05·22
ChatGPT语音模式现在能帮你填表了
拍一张表单照片,用嘴说你要填什么,ChatGPT就能把填好的版本吐出来。正文没提支持哪些格式、哪些语言、要不要额外付费、以及什么时候上线。
#Multimodal#Vision#Audio#ChatGPT
精选理由
HKR中H和K通过,因为语音+图像的表单填写是一个具体可用的新交互流程,用户能直观理解价值。R偏弱,这只是OpenAI的一个小产品更新,没有披露支持的文件格式、语言范围、定价或上线时间,信息缺口明显,所以分数落在60-71区间。
一句话点评
拍张表单照片,用嘴说填什么,ChatGPT 就能吐出填好的版本。这功能把语音和视觉串起来了,省了打字和手写。但正文没提支持哪些格式、哪些语言、要不要额外付费、以及什么时候上线。如果是免费且支持中文,日常填表确实方便;要是只限英文 PDF 或 Plus 用户独享,那实用性就大打折扣。等具体上线范围和定价出来再判断值不值得激动。
HKR 分解
hook knowledge resonance
打开信源
68
SCORE
H1·K1·R0
18:00
27d ago
AI HOT 精选· aihot-apiZH18:00 · 05·22
Google I/O 2026对话环节回顾
这篇博客回顾了Google I/O 2026的对话环节,主题涵盖AI、量子计算、机器人和创造力。但正文没有披露具体演讲者、产品发布或技术细节,信息量有限。
#Robotics#Google#Commentary
精选理由
这是一篇Google I/O 2026对话环节的回顾,正文只提到讨论了AI、量子计算、机器人和创造力,没有披露嘉宾名单、产品发布或任何技术参数。HKR三项全挂:没有悬念或发布钩子(h),信息量太少连关键事实都不够(k),对从业者来说没有可用的产品、成本或竞争信息(r)。按0/3规则直接排除。
一句话点评
Google I/O 2026 对话环节回顾,但正文没提任何具体演讲者、产品发布或技术细节,信息量约等于零。标题看着大,实际是篇活动总结,对从业者没参考价值。
HKR 分解
hook knowledge resonance
打开信源
32
SCORE
H0·K0·R0
17:25
27d ago
AI HOT 精选· aihot-apiZH17:25 · 05·22
Warp 终端现在能直接调 OpenRouter 的模型了
Warp 这个终端工具接入了 OpenRouter,工程师演示了怎么连 DeepSeek。正文只给了文档链接,没提价格和具体上线时间。
#Agent#Tools#OpenRouter#Warp
精选理由
这是一个小型的开发者工具集成。正文只给了文档链接,没有披露定价、模型覆盖范围或 Warp 具体能力变化,所以分数维持在 60–71 区间。
一句话点评
Warp终端现在能直接调OpenRouter的模型了,包括DeepSeek。对开发者来说,等于少装一个插件,在命令行里就能切换模型。但正文只给了文档链接,没提价格、延迟和具体上线时间,实际体验和成本未知。
HKR 分解
hook knowledge resonance
打开信源
62
SCORE
H0·K1·R1
17:03
27d ago
AI HOT 精选· aihot-apiZH17:03 · 05·22
Perplexity 开源了供应链安全扫描器 Bumblebee
Perplexity 今天开源了一个叫 Bumblebee 的工具,专门扫描 macOS 和 Linux 开发者机器上的高风险软件包、扩展和 AI 工具配置。它是只读的,不会改你系统。亮点是连上他们的 Computer 平台后,一旦有新的供应链风险出现,可以自动触发更深的扫描。目前只支持 macOS 和 Linux,Windows 用户暂时用不了。代码...
#Tools#Perplexity#Open source#Product update
精选理由
HKR 三项都过:Perplexity 出安全工具出乎意料,扫描范围具体(包、扩展、AI 配置),供应链安全焦虑真实。但原文只是一条简短社交更新,没披露规则集、误报率、集成方式或采用数据,所以分数压在 60–71 区间。
一句话点评
Perplexity 开源了 Bumblebee,一个只读扫描器,专查 macOS/Linux 开发者机器上的高危包、扩展和 AI 工具配置。亮点是连上他们的 Computer 平台后,新风险出现能自动触发深度扫描。目前只支持 macOS 和 Linux,Windows 用户暂时用不了。 短评:开源供应链扫描工具,只读不写系统,连平台能自动触发深度扫描。但只支持 macOS/Linux,W...
HKR 分解
hook knowledge resonance
打开信源
70
SCORE
H1·K1·R1
16:41
27d ago
AI HOT 精选· aihot-apiZH16:41 · 05·22
Luma Agents 上线 Seedance 2.0,一键生成电影级画面
Luma Agents 推出了 Seedance 2.0,主打人像、风景、科幻、奇幻四种风格,声称能一键生成电影级画面。正文没披露模型参数、分辨率、生成速度或价格,所以实际效果和可用性还不清楚。如果你对 AI 视频生成感兴趣,可以点链接试试,但先别太激动。
#Agent#Multimodal#Vision#Luma Labs
精选理由
H/K 通过,因为 Seedance 2.0 集成和场景覆盖算新事实;但正文没提价格、分辨率、生成时长和基准对比,属于常规小版本更新,从业者参考价值有限。
一句话点评
Luma Agents 上线了 Seedance 2.0,主打四种风格一键生成电影级画面。但正文没披露分辨率、生成速度或价格,实际效果和可用性未知。如果你对 AI 视频生成感兴趣可以试试,但先别太激动。
HKR 分解
hook knowledge resonance
打开信源
63
SCORE
H1·K1·R0
16:17
27d ago
AI HOT 精选· aihot-apiZH16:17 · 05·22
Suno AI 做的《波多黎各》成夏日神曲,被美国早间节目 GMA 推荐
Suno 官方发帖说,今年夏天一首叫《波多黎各》的歌是用他们的 AI 工具做的,还上了美国早间节目 GMA 的推荐。帖子没透露播放量、创作者是谁、以及具体怎么生成的。
#Audio#Suno#GMA#Product update
精选理由
硬排除——纯营销:Suno 自己发帖说《Puerto Rico》用了它的工具、上了 GMA,但播放量、创作者、制作流程一概没披露,也没有第三方验证。
一句话点评
Suno 官方说《波多黎各》是AI做的,还上了GMA早间节目。但没提播放量、创作者和生成细节,更像品牌宣传。
HKR 分解
hook knowledge resonance
打开信源
38
SCORE
H1·K0·R0
16:10
27d ago
AI HOT 精选· aihot-apiZH16:10 · 05·22
GitHub 连续第三年拿下 Gartner 企业级 AI 编程代理领导者象限
Gartner 把 GitHub 放在企业级 AI 编程代理的领导者象限,这是第三年。正文没披露具体的评估标准、竞争对手位置,也没说 Copilot 的企业采用数据。所以这个排名更多是品牌背书,不能直接当采购决策依据。
#Agent#Code#GitHub#Gartner
精选理由
触发硬排除规则5:这是一篇厂商获奖公告,核心事实是 GitHub 被 Gartner 认可,但正文没披露评估方法、竞品排名或 Copilot 采用数据。HKR 三项均不满足,因此排除。
一句话点评
GitHub Copilot 连续第三年被 Gartner 评为企业级 AI 编程代理领导者。但正文没披露评估标准、竞品位置和企业采用数据,这个排名更像品牌背书,不能直接当采购依据。短评:Gartner 连续三年把 GitHub 放领导者象限,但没给评分细节,当品牌新闻看就好。
HKR 分解
hook knowledge resonance
打开信源
34
SCORE
H0·K0·R0
14:36
27d ago
● P1AI HOT 精选· aihot-apiZH14:36 · 05·22
BitCPM-CANN开源发布,华为昇腾NPU原生训练1.58比特大模型
ModelBest、清华和OpenBMB搞了个BitCPM-CANN,从0.5B到8B都有,全程用华为昇腾910B NPU训练,没走英伟达路线。1.58比特三元量化意味着每个权重只取三种值,内存比BF16省了约6倍,能塞进手机、电脑和车载设备里跑。基准测试成绩保住了全精度模型的95-97%,这点挺实在。我会先打个折:正文没披露具体推理延迟和功耗数据,也...
#Inference-opt#Benchmarking#ModelBest#Tsinghua University
精选理由
HKR三项都站得住:昇腾910B全栈训练1.58比特开源模型这个角度够新,数据也扎实。没给P1是因为目前只有发布事实,缺少独立复现或实际落地效果的佐证,所以先放在featured。
一句话点评
面壁智能在华为昇腾 NPU 上原生训练并开源了 1.58-bit 大模型,显存省了约 6 倍,能力保留率 90% 以上,但正文没给具体评测基准和延迟数据。
锐评
这条消息最值得看的是“全栈国产算力跑通了极低比特训练”。BitCPM-CANN 从量化算子到训练框架全在昇腾 910B 上完成,意味着以后在华为卡上做 1.58-bit 模型有了公共基础设施,不用每家从头搭一遍。四个尺寸(0.5B 到 8B)都开源了,官方说推理显存比 BF16 省约 6 倍,能力保留率在 90% 到 97.2% 之间,8B 模型能塞进旗舰手机跑。 但先别太激动。文章没交代这个“能力保留率”是在哪些基准上测的,也没提推理延迟和吞吐。极低比特模型最怕的是生成质量在长文本或复杂任务上掉得厉害,光看一个百分比不够。另外,训练成本、与同尺寸全精度模型在真实业务场景下的对比也都没给。如果后续能补上这些,才能判断它是不是真能当端侧主力模型用。
HKR 分解
hook knowledge resonance
打开信源
96
SCORE
H1·K1·R1

更多

频道

后台