AX 严选 · 2026-06-08

▸ 28 条 · updated 3m ago

2026年5月

一二三四五六日

1 2 3 4 5 6 736 819 921 1010 1132 1228 1335 1438 1528 1617 179 1824 1947 2026 2132 2236 237 246 257 2625 2729 2834 2936 308 316

2026年6月

一二三四五六日

138 235 332 422 532 610 78 828 943 1027 1129 1216 138 144 1513 1627 1721 1827 1912021222324252627282930

2026-06-08 · 星期一2026年6月8日

22:24

10d ago

FEATUREDAI HOT 精选· aihot-apiZH22:24 · 06·08

Anthropic 发了个 Swift 包，三行代码就能在苹果 App 里调用 Claude

Anthropic 给苹果开发者送了个新工具：一个 Swift 包，让 Claude 直接接入苹果的 Foundation Models 框架。开发者写三行代码就能调用，返回的是 Swift 原生类型，不用自己解析 JSON。支持多步推理、代码生成、联网搜索和数据分析，跑在 iOS 27、macOS 27 这些新系统上。说白了，就是苹果在自己的 AI ...

#Reasoning#Code#Tools#Anthropic

精选理由

HKR 三项都成立：Anthropic 确实发了一个让 Claude 接入苹果 Foundation Models 框架的 Swift 包，但这是开发者工具层面的集成，不是新模型发布，所以放在 featured 档里偏高的 82 分。正文没提这个包是否开源、有没有延迟或成本数据，我会先打个折，别把它当成 Claude 在苹果端全面铺开的信号。

一句话点评

Claude 直接进了苹果的官方 AI 框架，三行代码就能在 App 里调用，返回的还是 Swift 原生类型，不用自己写解析。但注意，这要求 iOS 27 起步，老设备用不了。

锐评

Anthropic 这次发的是一个 Swift 包，让 Claude 模型直接接入苹果的 Foundation Models 框架。对开发者来说，最大的好处是省事：写三行代码就能调用，返回的是 Swift 原生类型，不用再手动解析 JSON。支持的场景包括多步推理、代码生成、联网搜索和数据分析，跑在 iOS 27、macOS 27 这些新系统上。这件事值得关注的点在于，Claude 成了苹果官方 AI 框架里可选的第三方模型，不再是开发者自己绕路接 API。但正文没披露具体的延迟数据和成本对比，也没说和苹果自家模型在设备端推理上怎么分工。另外，iOS 27 意味着用户基数一开始不会太大，实际落地规模要看新系统铺开速度。还缺一个关键信息：这个包是只支持云端调用 Claude，还是能走苹果的本地推理管线。如果是纯云端，那离线场景就指望不上。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

20:32

10d ago

AI HOT 精选· aihot-apiZH20:32 · 06·08

Viggle API 上线：一秒让任意角色动起来，起价1分钱

Viggle 推出了 API，一次调用就能给任意角色添加任意动作，几秒出结果。起价0.01美元/秒（约7分钱人民币），注册送100次免费额度。可以接入 Claude、Codex 或其他智能体。正文没披露动作生成的精度或延迟上限，但价格确实低，适合做动态角色生成的小工具或游戏原型。

#Agent#Multimodal#Tools#Viggle

精选理由

这是 Viggle 自家的产品发布，没有第三方测试、没有规模数据、也没有生态影响，所以落在 60–71 的小更新区间。价格确实低，但正文没披露动作生成的精度或延迟上限，这点先别太激动。

一句话点评

Viggle API 上线，一次调用给任意角色加任意动作，几秒出结果。起价0.01美元/秒（约7分钱），注册送100次免费额度，可接入Claude、Codex等智能体。价格确实低，适合做动态角色生成的小工具或游戏原型。但正文没披露动作生成的精度或延迟上限，这点先别太激动。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

18:50

10d ago

AI HOT 精选· aihot-apiZH18:50 · 06·08

Claude 给 Connector 开发者上了个监控仪表盘

Claude 为已上架 Connector 的开发者推出了一个公测版监控仪表盘，能看活跃用户数、工具调用次数、目录排名、错误率、延迟、健康分，以及 Claude、Claude Code 和 Cowork 三个产品层面的使用数据。说白了就是让你知道自己的插件在用户手里跑得怎么样、哪里出错了、排名高不高。正文没披露仪表盘的具体刷新频率和是否收费。

#Tools#Claude#Anthropic#Product update

精选理由

正文没披露仪表盘刷新频率和是否收费，信息缺口明显。五个指标确实能帮开发者定位问题，但整体属于小范围工具更新，没有模型能力变化，所以分数压在 60–71 区间。

一句话点评

Claude给Connector开发者上了个公测版监控仪表盘，能看活跃用户、调用次数、错误率、延迟和健康分，还按Claude、Claude Code、Cowork三个产品拆了数据。说白了就是插件跑得怎么样、哪里崩了、排名高不高，一目了然。正文没披露刷新频率和是否收费，这点先别太激动。对做Connector的团队来说，终于不用靠用户骂才知道出错了，算是个基础但必要的基建补课。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

18:13

10d ago

FEATUREDAI HOT 精选· aihot-apiZH18:13 · 06·08

苹果说欧盟《数字市场法》卡住了 Siri AI，iOS 27 和 iPadOS 27 在欧盟地区没法按时上线

苹果发了一篇简短声明，把锅甩给了欧盟的《数字市场法》（DMA），说因为监管要求，Siri 的新 AI 功能不会随 iOS 27 和 iPadOS 27 一起在欧盟推出。具体哪些功能被拦、什么时候能在欧盟上线，正文一个字都没提。

#Agent#Apple#Siri#Product update

精选理由

苹果这篇声明很短，核心就一句话：因为 DMA，Siri 的新 AI 功能不会跟着 iOS 27 和 iPadOS 27 在欧盟上线。我会先打个折——正文没列出具体受影响的功能，也没给任何时间表，信息缺口不小。但这件事本身信号够强：大厂的产品节奏被法规直接打断，不是技术问题，是政策问题。对做全球化产品的 AI 从业者来说，这是个实打实的案例，提醒你分区合规可能比模型训练还难搞。所以虽然细节少，还是值得放在 featured 位置。

一句话点评

苹果把 Siri AI 在欧盟跳票的锅甩给 DMA，但具体哪些功能被卡、什么时候能上，一个字没提。

锐评

苹果这篇声明很短，核心就一句话：因为欧盟《数字市场法》（DMA）的监管要求，Siri 的新 AI 功能不会随 iOS 27 和 iPadOS 27 在欧盟上线。至于被拦下的具体是哪些功能、延迟到什么时候，正文完全没披露。这更像是一次提前的舆论站位，而不是产品说明。DMA 对大型科技平台有互操作性和数据使用的硬性规定，苹果可能担心 Siri 接入第三方数据或调用系统级能力时会踩线。但声明里没有给出任何技术细节或与监管机构的沟通进展，所以“DMA 导致延迟”目前只是苹果单方面的说法。对欧盟用户来说，这意味着新系统到手后 Siri 的 AI 体验可能和其他地区有明显差距。对从业者，值得关注的是苹果后续会不会被迫开放更多接口，以及这种监管压力会不会蔓延到其他市场。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

18:09

10d ago

AI HOT 精选· aihot-apiZH18:09 · 06·08

样本效率黑洞：AI能力越强，背后吃进去的数据越多

这篇文章用“黑洞”比喻AI对数据的吞噬能力——模型看起来能力很强，但支撑这些能力的核心是海量数据，而不是算法效率的提升。作者指出，过去几年AI进步主要靠加数据、加算力，尤其是RL（强化学习）本质上是在用算力生成合成数据，再拿这些数据训练模型。每个技能都需要成百上千个专家人工标注、写评分标准、解释推理过程，数据行业已经年收入几十亿美元。一个对比：人类一辈...

#Benchmarking#Commentary

精选理由

HKR-H和HKR-R通过，但HKR-K不通过：文章没有提供任何数据、具体案例或可验证的论断，触发了硬排除规则6，因此被标记为excluded。

一句话点评

这篇观点文章用“黑洞”比喻AI对数据的吞噬，核心判断是：过去几年AI进步主要靠加数据、加算力，而不是算法效率提升。作者指出RL本质是用算力生成合成数据，每个技能都需要成百上千专家人工标注、写评分标准、解释推理过程，数据行业已年收入几十亿美元。一个对比：人类学一个技能练几次，GRPO让模型每个任务生成几百到上千次rollout。但正文没披露具体模型规模、数据集大小或实验条件，全是比喻和推论。短...

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

17:12

10d ago

AI HOT 精选· aihot-apiZH17:12 · 06·08

Claude Code 上线一周年：验证与自动模式回顾

Claude Code 发布一周年，团队回顾了验证最佳实践、自动模式、例程和循环。第一个演示只收到两个 Slack 表情回应，说明早期关注度不高。正文没披露具体用户数或采用率，但视频链接里有更多细节。

#Agent#Code#Tools#Claude Code

精选理由

只有 R 成立：Claude Code 用户确实在意自动模式和验证流程。H 和 K 不成立，因为正文只给了两个 Slack 表情回应，没有披露机制、定价或可复现的最佳实践。

一句话点评

Claude Code 满一周年，团队自曝首个演示只收到两个 Slack 表情回应，说明早期冷启动确实难。回顾重点在验证最佳实践、自动模式和循环，但正文没披露用户数或采用率，具体效果得看视频。对做 coding agent 的团队来说，验证和自动模式的设计思路值得参考，但别当成功学案例。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

16:16

10d ago

FEATUREDAI HOT 精选· aihot-apiZH16:16 · 06·08

ChatGPT 现在能直接把数据变成图表，手机和网页端都上线了

ChatGPT 新增了图表生成功能，你给它数据或对比信息，它直接吐图表给你。官方说移动端和网页端都已经支持，但正文没披露具体支持哪些图表类型、数据量上限，也没说图表能不能二次编辑或导出。如果是真的挺省钱，不用再切到其他工具画图了。

#Tools#ChatGPT#Product update

精选理由

HKR-K 和 HKR-R 都成立：这是 ChatGPT 一个具体的产品更新，能在手机和网页上生成图表。HKR-H 偏弱，正文也没说支持哪些图表类型、数据上限、能不能二次编辑或导出，所以放在 featured 这一档刚好。

一句话点评

ChatGPT 能直接吐图表了，不用再切工具画图。但官方没说能画哪几种图、数据塞多少会崩，也没提能不能改或导出。

锐评

ChatGPT 把图表生成直接嵌进对话里，移动端和网页端都上了。这对经常要快速把数据变成柱状图、折线图的人来说，确实省了切到其他工具的时间。但官方这条推文信息量很薄，只说了“将数据和比较转化为图表”，没披露具体支持哪些图表类型，也没给数据量上限。如果只能画最简单的几种图，或者数据一多就报错，实用性会打折扣。另外，图表能不能二次编辑、导出成图片或矢量文件，正文也没提。这些缺口决定了它到底是个玩具，还是能塞进日常工作流。如果是真的挺省钱，但先别急着把其他画图工具删了，等实测看看边界在哪。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

16:07

10d ago

FEATUREDAI HOT 精选· aihot-apiZH16:07 · 06·08

NotebookLM 升级：对话里能直接干活，推理更强，但新格式和价格都没说

Google 给 AI Ultra 订阅用户推了个 NotebookLM 大更新。现在你在对话里就能让它执行多步骤任务，不用自己来回倒腾，相当于把 agent 塞进了聊天窗口。推理能力也升了级，处理复杂研究问题会更顺。官方说新增了一批输出格式，但正文没列具体是哪些，也没提价格会不会变、什么时候推给普通用户。我会先打个折：功能听着实用，但信息缺口不小，别...

#Agent#Reasoning#Tools#NotebookLM

精选理由

HKR 三项都踩中：Google 确认 NotebookLM 给 AI Ultra 用户加了 in-chat agent、高级推理和多输出格式。但正文没列出具体格式、没提价格变动、也没说普通用户什么时候能用，信息缺口不小，所以停在中等权重的产品更新档位。

一句话点评

Google给NotebookLM加了对话内智能体，能自己跑多步骤任务，但正文没列具体输出格式、价格和普通用户上线时间，先别太激动。

锐评

这次更新把agent塞进了NotebookLM的聊天窗口，你发一个指令，它就能自己拆任务、调资料、跑流程，不用你来回倒腾。对AI Ultra订阅用户来说，处理复杂研究问题确实省事不少，推理能力也升了级。但官方只说了“一系列新的输出格式”，具体是哪些、能导出什么、跟之前比强在哪，正文一个字没提。价格会不会变、什么时候推给普通用户，也没交代。如果是真的，多步骤自动化挺实用，但信息缺口太大，现在只能当个预告看。想评估实际价值，还得等Google把格式清单和扩展计划放出来。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:51

10d ago

FEATUREDAI HOT 精选· aihot-apiZH15:51 · 06·08

Runway 发布 Aleph 2.0 视频编辑模型，上传视频后一键改横竖比例

Runway 在桌面网页版上线了 Aleph 2.0 编辑模型。你上传一段已有的视频，选一个想要的宽高比，模型会自动把多出来的画面区域补上，让视频看起来就像原本是按这个比例拍的。正文没披露生成分辨率、处理时长和收费方式，实际效果得自己试。

#Multimodal#Vision#Runway#Product update

精选理由

Runway Aleph 2.0 是个中等体量的视频产品更新，机制讲得清楚，但没给定价、画质评测和铺开范围。HKR 三项都踩中了，放在 featured 门槛的低位。我会先打个折：正文没披露生成分辨率、处理时长和收费方式，实际省不省时间、效果自不自然，得自己上手试。

一句话点评

Runway 出了个视频改比例工具，上传视频选个尺寸，AI 帮你把缺的画面补上。但正文没提分辨率、速度和收费，先别急着当生产力。

锐评

Runway 在网页版上线了 Aleph 2.0，核心功能是视频画幅自适应：你给一段横屏视频，选竖屏比例，模型会把上下多出来的区域生成出来，让画面看起来像原生竖拍。这比传统裁剪或加黑边聪明，但本质是视频外扩生成，不是重新构图。目前信息全来自一条推文，正文没披露生成分辨率上限、处理一段 1 分钟视频要多久、是消耗点数还是单独付费。这些直接决定能不能进实际工作流。如果是按秒计费且延迟高，那更适合做社交媒体切片，而不是长视频重制。另外，画面填充的质量取决于原视频内容——边缘有复杂运动或人物进出时，AI 补出来的部分容易露馅。建议拿自己素材试几段，重点看边缘连贯性和细节闪烁，别只看官方 demo。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:21

10d ago

AI HOT 精选· aihot-apiZH15:21 · 06·08

OpenRouter 推出 Advisor：让小模型遇到难题时去问高级模型

OpenRouter 发布了一个叫 Advisor 的服务端工具，核心逻辑是：小模型卡住或陷入死循环时，可以临时去咨询一个更聪明的“顾问”模型，从而帮你把任务从贵的大模型迁移到更便宜的模型上。正文没披露支持哪些模型、差价多少，也没给出实测迁移成功率。

#Tools#Inference-opt#OpenRouter#Product update

精选理由

机制有意思，但正文没披露支持哪些模型、差价多少，也没给实测迁移成功率，信息缺口明显。算一个有趣的小产品更新，所以放在 70 分，不上精选。

一句话点评

OpenRouter 出了个叫 Advisor 的服务端工具，小模型卡住或死循环时，能临时去问一个更聪明的“顾问”模型。核心卖点是帮你把任务从贵的大模型迁移到便宜的模型上。但正文没披露支持哪些模型、差价多少，也没给实测迁移成功率。想法不错，但效果和成本节省都还是未知数。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:06

10d ago

FEATUREDAI HOT 精选· aihot-apiZH15:06 · 06·08

Hivemind 给 AI 编程助手加了个“记性”，能把每次干活的经验存下来复用

Hivemind 这个工具现在开放了持续学习功能，专门给 AI 编程智能体用。它会自动收集 Claude Code、Codex、Cursor、Hermes、Pi 这些助手干活时的操作轨迹，把成功的套路提炼成可复用的技能，存到你自己的云盘里，再同步给所有助手。内置的 SkillOpt 负责持续训练这些技能，效果上，Claude Code 准确率涨了 19...

#Agent#Code#Fine-tuning#Hivemind

精选理由

HKR三项都站得住，但这是Hivemind的一次功能更新，不是大厂动作，也没有其他来源交叉验证。52个场景的测试结果让它有干货，够格进低位的featured。

一句话点评

Hivemind 让 Claude Code、Codex 这些编程助手能互相抄作业，把成功操作存成技能共享，Claude Code 准确率涨了 19 分。但正文没提测试集规模和任务类型，这点先别太激动。

锐评

Hivemind 这次开放的功能，核心是把多个 AI 编程助手干活时的操作轨迹自动收集起来，挑出成功的套路，提炼成可复用的技能文件，存到你自己的云盘里，再同步给团队里所有助手。内置的 SkillOpt 负责持续训练这些技能，相当于给助手们建了一个共享的“经验库”。效果数字看着不错：Claude Code 准确率提升了 19.1 分，Codex 提升了 24.8 分，在全部 52 个测试设置里要么最佳要么持平。但正文没披露这 52 个测试具体是什么任务、样本量多大、有没有和没开持续学习的基线做严格对照。如果测试集就是日常开发场景，那这个提升说明技能复用确实能减少重复犯错；如果测试集偏窄，数字的参考价值就要打折。另外，数据存在用户自己的云盘里，隐私上比上传到第三方服务器好一些。一行命令安装、开源，接入成本低。还缺的信息是：技能库会不会随着时间膨胀导致冲突或过时，以及跨不同编程助手之间技能迁移的通用性到底怎么样。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

14:30

10d ago

FEATUREDAI HOT 精选· aihot-apiZH14:30 · 06·08

面壁智能开源 VoxCPM2 语音模型，200 万小时数据训练，支持 30 种语言和 9 种方言

OpenBMB 把 VoxCPM2 的技术报告和模型都放出来了，Apache 2.0 协议。这是个 20 亿参数的语音生成模型，用超过 200 万小时的多语言语音数据训练，能说 30 种语言和 9 种中文方言。它主要干三件事：按自然语言指令设计语音、可控地克隆声音，以及高保真地延续一段语音。技术方案上，它把语音拆成两步走——先用 16kHz 做语义编码...

#Audio#Fine-tuning#Benchmarking#OpenBMB

精选理由

HKR 三项都踩中了：200 万小时训练数据和 9 种方言是实打实的钩子，参数和协议信息也够新，对国内语音开发者有直接参考意义。分数定在 78 是因为技术报告正文没给出具体的评测基准和对比数字，实际效果和落地表现还不清楚，这点先别太激动。

一句话点评

OpenBMB 开源了一个 20 亿参数的语音模型，200 万小时训练数据，能说 30 种语言和 9 种方言，Apache 2.0 协议可以直接商用。

锐评

VoxCPM2 这次把技术报告、模型权重和微调代码全放出来了，Apache 2.0 协议，对想自己改语音模型的人来说门槛很低。20 亿参数不算大，但 200 万小时的多语言训练数据量很扎实，覆盖 30 种语言和 9 种中文方言，零样本克隆声音和指令控制语音风格这两项能力在公开基准上跑到了领先水平。技术路线上它把语音拆成两步：先用 16kHz 做语义编码，再用 48kHz 重建波形，相当于先理解要说什么、再精细还原怎么说。这个设计的好处是保真度高，但正文没披露推理延迟和显存占用，实际部署成本还不清楚。另外，200 万小时数据的具体来源和清洗方式也没展开，方言效果到底怎么样得自己试。我会先打个折：基准成绩好看，但真实场景里噪音、口音、长文本稳定性这些才是硬仗。如果你要做语音助手或配音工具，值得拿自己的数据跑一轮微调看看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:44

10d ago

AI HOT 精选· aihot-apiZH13:44 · 06·08

Kimi Code 更新了，但正文没写改了什么

标题说 Kimi Code 有焕新升级，还附了视频教程，但点进去页面提示环境异常，需要验证才能访问。正文完全空白，没披露任何功能变化、版本号、发布日期或使用条件。目前能确认的只有标题本身，具体更新内容未知。

#Code#Kimi#Product update

精选理由

HKR 三项全挂：标题只有模糊的“焕新升级”，正文完全空白，没有功能、版本或访问细节。0/3 的 HKR 加上营销式零数据内容，重要性上限被压在 40 以下。

一句话点评

标题说 Kimi Code 升级还带视频教程，但正文被微信验证墙挡住，一个字都没披露。目前能确认的只有标题本身，具体更新了什么、版本号、发布日期全未知。建议等官方补发可访问的公告再判断，别急着点验证。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

SCORE

H0·K0·R0

13:11

10d ago

AI HOT 精选· aihot-apiZH13:11 · 06·08

小互开源视频翻译工具：一句话搞定下载、转写、翻译、烧字幕

小互开源了 xiaohu-video-translate，说一句“把链接翻译成中文字幕视频”就能自动下载、用本地 Whisper 转写、AI 翻译润色、烧字幕、出文稿。转写跑在本地，不花 API 费。支持 YouTube、Bilibili、抖音链接和本地文件，英语、日语、韩语、法语、西班牙语等都能转成中文字幕。字幕精确到词级时间戳，按语义断句，每行不超...

#Audio#Tools#Code#Xiaohu

精选理由

这是个个人开源小工具，功能完整但没看到用户量、基准测试或社区反馈，属于实用但还没验证的 utility，放在 60–71 档合理。

一句话点评

小互开源了一个视频翻译工具，说一句指令就能自动下载、本地Whisper转写、AI翻译并烧录中文字幕。转写跑在本地，不花API费，这点挺省钱。支持YouTube、B站、抖音链接和本地文件，英日韩法西都能转中文。字幕精确到词级时间戳，按语义断句，每行不超12字，双语模式中文大英文小。工具由三个子技能组成，可单独或串联使用，适配Claude Code、Codex等AI编程工具。已开源，附安装指南。...

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

13:10

10d ago

FEATUREDAI HOT 精选· aihot-apiZH13:10 · 06·08

五个模型经济体里，价格崩盘消失了：控制与涌现

这篇博客因为 Hugging Face 返回了 429 错误（请求太频繁），正文内容没抓到。从标题和摘要看，实验用 OpenAI、NVIDIA、OpenBMB 的模型和一个自己微调的 5 亿参数模型来驱动市场里的交易代理。他们试了三种干预手段都没能重现价格崩盘，最后是靠结算时强行改写价格才把崩盘做出来。我会先打个折：具体怎么干预、崩盘长什么样、数据量多...

#Agent#Reasoning#OpenAI#NVIDIA

精选理由

我会先打个折：正文因为 Hugging Face 限流没抓到，具体干预怎么设计、崩盘长什么样、数据量多大都只能靠标题和摘要猜。但就现有信息看，五个模型经济体里崩盘凭空消失、只能靠结算作弊做出来，这个发现对代理可靠性和模拟真实性都是实打实的质疑。信息缺口明显，但角度够刁，值得推给从业者看一眼。

一句话点评

这篇博客因为 Hugging Face 返回了 429 错误，正文内容没抓到。从标题和摘要看，实验用 OpenAI、NVIDIA、OpenBMB 的模型和一个自己微调的 5 亿参数模型来驱动市场里的交易代理。他们试了三种干预手段都没能重现价格崩盘，最后是靠结算时强行改写价格才把崩盘做出来。我会先打个折：具体怎么干预、崩盘长什么样、数据量多...

锐评

这篇博客因为 Hugging Face 请求太频繁，正文没抓到，只能根据标题和摘要做判断。实验用 OpenAI、NVIDIA、OpenBMB 的模型，加上一个自己微调的 5 亿参数模型，让它们扮演市场里的交易代理。有意思的地方在于，他们试了三种干预手段，都没能让市场自然崩盘，最后是靠结算时强行改写价格才把崩盘做出来。这说明在模拟环境里，模型驱动的交易行为可能比预想的更稳定，或者干预设计本身没戳到痛点。不过信息缺口很大：正文没披露具体用了哪三种干预手段，也没说交易规则、市场结构、跑了多少轮。5 亿参数的小模型是自己微调的，但训练数据、微调方法都没提，这直接影响结论能不能复现。崩盘是强行做出来的，那“消失的崩溃”到底是模型行为导致的，还是模拟环境设计的问题，现在没法判断。如果后续能补上实验细节，这个方向对理解多模型交互下的市场稳定性会有参考价值。现在只能当个有趣的现象看，别急着下结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

12:00

10d ago

AI HOT 精选· aihot-apiZH12:00 · 06·08

OpenRouter 说它的 Agent SDK 能帮 AI 智能体满足欧盟 AI 法案的“人类监督”要求

OpenRouter 发了一篇博客，核心意思是：欧盟 AI 法案、美国科罗拉多州 AI 法案和 NIST 的 AI 风险管理框架，都要求 AI 做影响人的决策时（比如贷款、雇佣、医疗），必须有人类能监督、干预甚至推翻。OpenRouter 说它的 Agent SDK 里已经内置了“人在回路中”的工具，可以直接用来满足这些合规要求。文章给出了 5 个实现...

#Agent#Safety#Tools#OpenRouter

精选理由

硬排除：这是一篇供应商合规宣传稿。核心卖点是 OpenRouter 的 Agent SDK 能满足欧盟 AI 法案等要求，但正文没披露任何可验证的机制或测试条件。HKR-R 通过（合规和 liability 成本确实是 agent 部署的敏感点），HKR-H 和 HKR-K 不通过，分数上限 40。

一句话点评

OpenRouter 说它的 Agent SDK 内置了“人在回路中”工具，可以直接满足欧盟 AI 法案、科罗拉多州 AI 法案和 NIST 框架里关于人类监督的要求。文章列了 5 种实现模式，比如给高风险操作加审批门、超时自动升级。但正文没披露这些工具的具体实现细节或验证条件，更像产品宣传。如果你已经在用 OpenRouter 的 SDK，可以看看；否则先别太激动，合规落地还得看审计日志怎...

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

11:46

10d ago

AI HOT 精选· aihot-apiZH11:46 · 06·08

巴基斯坦版反诈助手：用 4B 小模型识别可疑短信和截图

Pakistan Notice Helper 是一个轻量安全工具，帮用户判断短信、链接或截图是否可疑，支持英文和乌尔都语。最终选了 Qwen3.5 4B Q8 模型（量化版 4B 参数），在 10 个测试用例里全部通过了高风险诈骗和截图场景。之前试过 27B 模型（质量好但成本高）和 MiniCPM-V 4.6 Q8（慢且不稳定），最后选了 4B 这个...

#Vision#Safety#Pakistan Notice Helper#Qwen

精选理由

HKR-H/K 通过：本地化诈骗检测和小模型测试有具体信息，10 个用例也公开了。但规模、指标和可复现性都比较单薄，所以分数压在 60–71 区间。

一句话点评

巴基斯坦团队用 Qwen3.5 4B 量化版做了个防诈骗工具，10 个测试全过，成本比 27B 低很多。但测试集只有 10 条，泛化能力未知，且受限于黑客松的 32B 上限规则，选 4B 未必是最优解。短评：10 条测试全过，但样本太少，先别太激动。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

09:59

10d ago

FEATUREDAI HOT 精选· aihot-apiZH09:59 · 06·08

阿里云把 AgentScope 的 Java 版升到 2.0，主打企业级智能体在 JVM 环境里跑生产

这个版本把架构改成了分布式无状态，能挂在 K8s 上自动扩缩容，会话断了也能恢复。多租户用 Workspace 做数据隔离，权限控制做得比较细，还加了人工介入的环节。长期运行靠 HarnessAgent 管上下文和容错。开源地址在推文链接里，但正文没给出性能基准或实际部署规模的数据。

#Agent#Tools#Safety#Alibaba Cloud

精选理由

阿里云把 AgentScope 的 Java 版推到了 2.0，这次改动挺实在：架构拆成分布式无状态，能挂在 K8s 上自动扩缩容，会话断了也能接上。多租户用 Workspace 做数据隔离，权限粒度更细，还加了人工介入环节，长期任务靠 HarnessAgent 管上下文和容错。我会先打个折——正文没给性能基准，也没说实际部署规模，所以这些能力到底省多少资源、稳不稳，还看不出来。开源地址在推文链接里，但没披露定价或落地案例。整体是给 Java 技术栈的企业把智能体往生产环境推了一步，信息缺口明显，先放在 featured 这档。

一句话点评

阿里云把 AgentScope Java 版推到了 2.0，主打 K8s 弹性伸缩和会话恢复，但正文没给性能基准和实际部署规模，这点先别太激动。

锐评

AgentScope Java 2.0 这次改成了分布式无状态架构，能挂在 K8s 上自动扩缩容，断了线的会话也能捡回来继续跑，这对生产环境是个实打实的改进。多租户用 Workspace 做数据隔离，权限控制做得比较细，还加了人工介入的环节，说明团队在往企业级安全上靠。长期运行靠 HarnessAgent 管上下文和容错，思路是对的，但正文没披露任何性能基准、延迟数据或实际部署的集群规模，也没说跟 1.0 比资源开销差多少。开源地址给了，代码可以自己看，但如果你是想评估能不能上生产，现在还缺压测报告和真实案例。我会先打个折，等有公开 benchmark 或用户反馈再判断。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

09:54

10d ago

AI HOT 精选· aihot-apiZH09:54 · 06·08

用 Agent 把 Qwen3-VL 塞进安卓手机跑推理

正文没披露模型尺寸、推理框架、跑在什么设备上，也没给任何性能数据（延迟、内存、帧率）。标题说打通了端侧推理，但信息缺口太大，没法判断实际效果。

#Agent#Vision#Inference-opt#Qwen

精选理由

标题说打通了 Qwen3-VL 安卓端侧推理，但正文没给模型尺寸、推理框架、设备型号和任何性能数据，信息缺口太大，没法判断实际效果。HKR-H 和 HKR-R 通过，但 HKR-K 不通过，因为缺少可复现的配置和性能细节。这是一个有趣的端侧推理教程线索，不是值得头条的信号。

一句话点评

标题说打通了Qwen3-VL在Android上的端侧推理，但正文被反爬墙截了，没披露模型尺寸、推理框架、跑在什么设备上，也没给任何性能数据（延迟、内存、帧率）。信息缺口太大，没法判断实际效果，这点先别太激动。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

09:38

10d ago

FEATUREDAI HOT 精选· aihot-apiZH09:38 · 06·08

微信在测试右滑拉起的 AI 助手，能直接调小程序干活，还和主流手机厂商打通了

腾讯正在灰度测试一个藏在微信里的 AI 助手，右滑就能呼出。它用自然语言指令直接调用数百万个小程序，比如帮你点咖啡。微信还跟华为、荣耀、小米、OPPO、vivo 合作，让手机系统助手也能跨应用调微信的服务，6 月 8 号已经放出了开发者接入指引。不过原文因为环境异常没加载出完整内容，具体的技术实现和开放范围正文没披露。

#Agent#Tools#Tencent#WeChat

精选理由

这条消息的钩子很足——微信开始把自己当成 agent 运行环境，不是只聊天，而是直接调小程序干活，还同步打通了手机厂商的系统级入口。我会先打个折，因为原文没加载完整，技术方案、开放范围、模型选型这些关键信息正文都没披露，所以暂时不能给更高分。但右滑入口加开发者指引加五家厂商合作，三个点放在一起，已经足够让从业者重新评估微信在 agent 分发上的位置。

一句话点评

微信把AI助手塞进右滑入口，能直接用话指挥小程序干活，但原文被验证页挡住，具体怎么实现、开放到什么程度都没看到。

锐评

这条消息的核心是微信开始让AI直接调用小程序生态，不再只是聊天工具里的问答机器人。右滑呼出、用自然语言点咖啡这类操作，本质上是把数百万个小程序变成AI可调用的工具集，让模型进业务流程干活。同时跟华为、荣耀、小米、OPPO、vivo五家手机厂商搞A2A打通，意味着系统级助手也能跨应用调微信服务，这对微信的服务触达范围是实质性的扩展。但必须说清楚：原文因为环境异常没加载出完整内容，我们看到的只是摘要层面的信息。具体的技术方案——比如AI怎么理解用户意图并匹配到对应小程序、调用链路是走官方API还是模拟点击、权限控制和错误处理怎么做——正文都没披露。6月8号放出的开发者接入指引也没看到细节，所以现在能判断的只是方向和意图，不是落地效果。对从业者来说，值得盯的是两点：一是微信对小程序调用权的开放程度，这决定了第三方开发者能分到多少蛋糕；二是手机厂商合作的实际体验，跨应用调服务听着美好，但延迟、兼容性和隐私授权都是坑。这些信息缺口没补上之前，先别急着下结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

09:30

10d ago

AI HOT 精选· aihot-apiZH09:30 · 06·08

生数科技与华策集团合作建AIGC影视中心，Vidu视频生成落地影视制作

生数科技（Vidu视频生成模型开发商）与华策集团（国内头部影视公司）宣布战略合作，共建AIGC影视创制中心。合作覆盖四个方向：用Vidu生成视频素材、辅助剧本创作、做影视预演（拍前预览）、以及后期视效制作。正文没披露具体投入金额、合作排他性、以及是否已有落地项目。对行业来说，这是视频生成模型第一次直接进影视工业流程，但合作刚签，实际产出和效率提升还没数...

#Multimodal#Vision#Shengshu Technology#Huace Group

精选理由

HKR-K 是实的：四个工作流方向都点名了，Vidu 直接进影视工业流程是第一次。HKR-R 来自制作岗位和成本压力，但没片单、没成本数据，所以验证弱。HKR-H 弱，合作刚签，没demo、没投入金额、没排他性，也没说已有项目在跑，吸引力有限。综合下来放在 all 层合适。

一句话点评

生数科技（Vidu）和头部影视公司华策共建AIGC创制中心，四个方向：视频素材生成、剧本辅助、拍前预览、后期视效。这是视频生成模型首次直接嵌入影视工业流程，但合作刚签，正文没披露投入金额、排他性、以及是否有落地项目。实际产出和效率提升还没数，这点先别太激动。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

08:33

10d ago

AI HOT 精选· aihot-apiZH08:33 · 06·08

邵猛开源“品牌转设计稿”技能，但提醒：复刻网站容易造出新的AI垃圾

邵猛在GitHub（shaom/brand-to-design-md-skill）开源了一个技能，让AI Agent学习设计品味后复刻网站。但他自己泼了冷水：这种复刻看多了，反而从“反AI垃圾设计”变成了新的“AI垃圾”——只抄到皮毛，没学到设计精髓。正文没披露具体复刻效果或失败案例，但提醒想抄作业的人，别光顾着省事。

#Agent#Tools#Shao Meng#GitHub

精选理由

HKR三项都过，但这是个人开源帖，没披露复刻效果、测试条件或成功率，属于小工具加评论，落在60–71分档。

一句话点评

邵猛开源了一个让AI Agent学设计品味后复刻网站的skill，但他自己泼冷水：这种复刻看多了，从“反AI垃圾设计”变成了新“AI垃圾”——只抄到皮毛，没学到精髓。正文没披露具体复刻效果或失败案例，但提醒想抄作业的人，别光顾着省事。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

08:02

10d ago

FEATUREDAI HOT 精选· aihot-apiZH08:02 · 06·08

微信 AI 开始内测，开发者有两种方式让小程序被 AI 直接操作

微信开放平台发了接入指引，确认微信 AI 在内测。开发者可以选两种模式：自动模式是授权平台读小程序源码，不用额外开发，AI 就能分析页面并直接操作；开发模式是自己写技能提交审核，让 AI 调用。两种模式不冲突，可以同时开，也不影响现有小程序服务。官方说“微信 AI”这个名字可能还会改。

#Agent#Tools#WeChat#Product update

精选理由

这条消息对微信生态的开发者很关键，因为官方终于给出了接入路径，不是画饼。自动模式等于让 AI 直接读你的小程序源码去干活，省掉额外开发，但正文没提对复杂页面的理解准确率怎么样，这点先别太激动。开发模式更灵活，但需要自己写技能并审核，上线节奏和审核标准也没说。整体看，平台动作明确，但模型能力、收费方式和正式开放时间都还是空白，所以分数卡在 featured 门槛附近。

一句话点评

微信 AI 开始内测了，给小程序开发者开了两条路：要么躺平让平台自己读代码，要么自己写技能。名字还没定，先别急着叫它“微信 AI”。

锐评

微信这次把 AI 直接塞进了小程序生态里，做法很务实。自动模式相当于平台帮你把小程序“翻译”成 AI 能看懂和操作的东西，开发者零成本就能上车，对小团队很友好。开发模式则留给有定制需求的人，自己写技能提交审核，让 AI 去调用。两种模式可以同时开，也不影响现有服务，这点降低了试错门槛。不过，正文没披露自动模式的分析准确率能到多少，也没提审核周期和技能调用失败的兜底方案。名字都还是暂定的，说明产品还在很早期。对开发者来说，现在可以关注，但别急着把核心业务全押上去，先看看内测跑出来的实际效果和成本再说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

08:00

10d ago

AI HOT 精选· aihot-apiZH08:00 · 06·08

CoreWeave 怎么看现在的算力市场

CoreWeave 分析了当前算力市场的增长动力和瓶颈，但正文没披露具体需求数字、供给上限、定价变化或时间窗口，所以这篇更像一个方向判断，不是数据报告。

#Inference-opt#CoreWeave#Commentary

精选理由

HKR-R 通过，因为算力供给触及成本焦虑；但 HKR-H 平淡，HKR-K 缺少数字或机制。Bloomberg 有可信度，但这仍是一篇信息量薄弱的市场观点。

一句话点评

CoreWeave 对算力市场的看法：推理需求在涨，但训练还没见顶。正文没给具体数字，更像方向判断。短评：方向对，但没数据支撑，当行业风向标看可以，别当投资依据。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

07:46

10d ago

AI HOT 精选· aihot-apiZH07:46 · 06·08

PixVerse 创作者计划 2.0：每周最高 850 美元现金奖励

PixVerse 推出了面向 AI 视频创作者的合作伙伴计划 2.0，核心是鼓励真实创作，比如发测试、教程、短片或公开推广新想法。奖励方面：合格帖子每周最多拿 15 万积分（具体价值未披露）；每周现金奖池 2500 美元，单个创作者一周最高能拿 850 美元——对个人来说算不错，但奖池总额不算高。另外对大项目、教程和电影节投稿有额外支持，还能获得更多曝...

#Multimodal#PixVerse#Product update

精选理由

HKR三项都过，但事实描述的是PixVerse的创作者补贴计划，不是模型、能力或生态发布。所以落在40-59的低价值区间。

一句话点评

PixVerse 把创作者激励计划升级到 2.0，核心是鼓励发测试、教程、短片这类真实内容。每周现金奖池 2500 美元，个人最高拿 850 美元——对个人创作者算不错，但总盘子不大。积分每周最多 15 万，但没披露具体价值，这点先别太激动。另外对大项目、教程和电影节投稿有额外支持，曝光和合作机会也提了，但正文没披露申请门槛和审核标准。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

05:53

10d ago

FEATUREDAI HOT 精选· aihot-apiZH05:53 · 06·08

高德发布 ABot-Earth0.5，用一张卫星图 10 分钟就能生成 3D 城市

高德搞了个叫 ABot-Earth0.5 的模型，号称是全球第一个原生 3D 的城市世界模型。它已经覆盖了 190 多个国家和地区。用起来很简单，你扔给它一张卫星图或者一段文字描述，它就能在普通消费级显卡上，大概 10 分钟给你生成一大片公里级的 3D 城市场景。出来的素材是 3DGS 格式，能直接拖进 Unity、虚幻引擎这些软件里接着用。按他们算的...

#Multimodal#Vision#Robotics#Amap

精选理由

高德这个ABot-Earth0.5把3D城市生成的门槛压得很低：消费级显卡、10分钟、公里级、直接出可编辑资产。我会先打个折，正文没披露生成精度和几何一致性有多高，也没给实际案例对比，所以“全球首个原生3D城市世界模型”这个说法先别太激动。但即便只做到七八成，对需要大量3D场景的团队来说也挺省钱。H/K/R三条都踩实了，重要性给80合理。

一句话点评

高德用一张卫星图10分钟就能生成3D城市，成本号称只要原来的1%。但“全球首个”和“覆盖190国”的说法正文没给技术细节，先当个demo看。

锐评

高德发布的ABot-Earth0.5，核心是把3D城市建模从重资产工程变成了轻量工具。你给一张卫星图或一段文字，它能在消费级显卡上花10分钟，生成公里级的3D城市场景，输出格式是3DGS，可以直接拖进Unity或虚幻引擎用。官方算了一笔账：制图成本降到传统方式的百分之一，效率提升约一千倍。这个数字如果属实，对需要大量虚拟环境的行业——比如具身智能训练、低空经济航线规划——确实能省下不少钱和时间。但文章没讲清楚几个关键点。第一，生成的3D模型精度和几何一致性怎么样，有没有和激光点云或实拍数据做过对比，正文没披露。第二，“覆盖190多个国家和地区”指的是模型有能力生成这些地方的场景，还是已经建好了现成的3D地图，表述比较模糊。第三，3DGS格式虽然渲染快，但在物理碰撞、动态交互上不如传统网格模型，直接用于仿真训练可能还要额外处理。目前产品刚开放内测，效果好不好还得看实际跑出来的东西。如果精度和可用性过关，这个工具对中小团队的意义会很大。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

01:30

11d ago

● P1AI HOT 精选· aihot-apiZH01:30 · 06·08

OpenAI宣布第三阶段计划到2028年实现AI主导研究

Sam Altman 和 Jakub Pachocki 在 6 月 8 日发文，把 OpenAI 的路线图摊开了讲。公司内部判断，到 2028 年 3 月，AI 系统可能承担他们研究工作里“相当大一部分”，所以第一个目标是造一个能自动做 AI 研究的系统，帮研究员更快地测试想法、找错和迭代。第二个目标是加速经济增长，同时把收益分出去。第三个目标最直接：...

#Agent#Reasoning#Alignment#OpenAI

精选理由

Sam Altman 和 Jakub Pachocki 这次没画大饼，而是给了个带时间点的内部判断：到 2028 年 3 月，AI 可能接手 OpenAI 研究工作的相当一部分。我会先打个折，这种预测本身就有自我实现的成分，但把它写进公开路线图，说明内部对研究自动化的信心已经很高了。文章把目标拆成三个：造自动做研究的系统、加速经济并把收益分出去、以及最直接的安全对齐。信息量够，时间点具体，对从业者来说既是信号也是压力，值得马上写。

一句话点评

OpenAI 说 2028 年 3 月前要让 AI 接手自家一大部分研究工作，但没给出具体衡量标准，这个时间表先打个折看。

锐评

Sam Altman 和 Jakub Pachocki 联名发了篇博客，把 OpenAI 的路线图摊开了讲。核心判断就一个：他们相信未来几年内，AI 做 AI 研究本身会成为决定技术进步快慢的关键因素。为此，OpenAI 给自己定了个内部目标——到 2028 年 3 月，自家研究里要有“显著一部分”由 AI 系统配合人类研究员完成。这个说法很模糊，正文没披露“显著一部分”到底是 30% 还是 80%，也没说用什么指标衡量，所以这个时间节点的可信度要打折扣。文章把 OpenAI 的发展划成三个阶段：第一阶段纯做研究，第二阶段变成产品公司，现在进入第三阶段，要让 AI 变得像电一样普及、便宜、安全，让每个人都能用上。他们还提了一嘴应该有个国际组织来协调前沿 AI 发展，必要时甚至可以集体踩刹车，但没给出任何具体机制或时间表。整篇博客更像一份愿景声明，而不是可验证的路线图。缺的东西很明确：没有实现路径的中间里程碑，没有成本估算，也没有说明如何验证“AI 主导研究”是否真的达成了。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

100

SCORE

H1·K1·R1

00:00

11d ago

● P1AI HOT 精选· aihot-apiZH00:00 · 06·08

苹果发了第三代基础模型，一共五款，从手机端到云端都有

苹果在 2026 年 6 月 8 日公布了第三代 Apple Foundation Models（AFM），这次是和 Google 合作定制的。五款模型里，两款跑在设备上：AFM 3 Core 是 30 亿参数的密集模型，质量比上一代好；AFM 3 Core Advanced 是 200 亿参数的稀疏模型，但每次只激活 10 到 40 亿参数，靠的是把...

#Inference-opt#Tools#Apple#Google

精选理由

苹果这次一口气发了五款模型，分设备端和服务器端两条线，还拉上 Google 做定制，信息量够硬。30 亿参数的密集模型和 200 亿参数但每次只激活一小部分的稀疏模型，思路很明确：在手机上跑得动，在云端也能控成本。正文没给具体跑分和定价，所以我会先打个折，但官方发布本身就有分量，尤其对做端侧推理和隐私计算的人。

一句话点评

苹果把200亿参数的大模型塞进手机，靠的是按需从闪存加载专家模块，每次只激活1-40亿参数。但别急着喊革命，正文没给延迟和耗电数据。

锐评

苹果这次发布的第三代AFM，最值得看的是端侧模型AFM 3 Core Advanced。它用了一种叫“指令跟随剪枝”的技术，把200亿参数的稀疏模型存在闪存里，根据你的指令只唤醒需要的部分，每次激活1到40亿参数。这思路很聪明，绕开了手机内存小的硬伤，让更复杂的模型能在本地跑。但文章没提关键指标：模型在手机上实际响应有多快？耗电增加多少？这些直接决定体验。另外，苹果强调和Google合作定制，连最强的云端模型AFM 3 Cloud Pro都跑在Google Cloud的NVIDIA GPU上，还保证隐私。这解决了算力问题，但也意味着苹果在云端推理上深度依赖外部硬件，长期成本和供应稳定性是个未知数。整体看，架构创新是实打实的，但落地效果还得等实机测试。尤其是那个按指令加载专家的机制，在不同任务上稳定性如何，文章完全没展开。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

AX 严选 · 2026-06-08

更多

频道

后台