X 监控

▸ 80 推文 · updated 3m ago

0 个账号

▸ 全部80 条

2026-04-29 · 星期三2026年4月29日

17:02

50d ago

FEATUREDX · @dotey（宝玉）· x-apiZH17:02 · 04·29

Hermes Agent 的记忆系统拆解：它用四层设计避开了 OpenClaw 的坑

Hermes Agent 的记忆不是一套，而是四套：高度浓缩的提示词记忆（MEMORY.md 和 USER.md）、可搜索的 SQLite 历史会话存档、像程序记忆一样运作的技能管理，以及可选的 Honcho 深层用户建模。核心思路是冷热分离——把最常用的信息压进极小的提示词快照里（加起来约 1,300 个 Token），以保住大模型的提示词缓存、降低...

#Agent#Memory#Tools#Hermes Agent

精选理由

这篇文章不是产品发布，更像一篇技术拆解，把 Hermes Agent 的记忆系统讲得很清楚。我会先打个折：它来自单一信源，没有第三方验证，但给出的四层结构、字符限制和缓存优先思路对实际做 agent 的人有参考价值。正文没披露性能对比数据，所以别把它当评测看，当成一个设计思路的分享就好。

一句话点评

Hermes 把记忆拆成四层，核心就一句话：提示词里只放最常用的，其他全扔进工具按需查。这比 OpenClaw 的流水账聪明，但别指望它记住你上周聊过什么。

锐评

这篇拆解把 Hermes 的记忆设计讲得很透。它没搞什么花哨的向量数据库，就用两个加起来不到 1,300 Token 的纯文本文件当热记忆，剩下的历史会话全塞进 SQLite，靠搜索工具按需调取。这个冷热分离的思路直接冲着省钱去的——大模型的提示词缓存很贵，频繁改系统提示词会让缓存失效，延迟和成本都往上蹿。Hermes 的做法是把系统提示词前缀焊死，新记忆只在开新会话或触发压缩时才写入快照，中途不改。压缩前的“记忆冲刷”是个好设计：先让模型把值得留的偏好和教训存进 MEMORY.md，再洗掉对话历史，避免摘要丢关键信息。技能层和可选的 Honcho 用户建模也补上了“怎么做事”和跨设备连续性的缺口。但正文没给出实际延迟或成本对比数据，也没说这套设计在复杂多轮任务里会不会因为记忆更新滞后而出错。另外，2,200 字符的硬上限对长期使用的智能体可能偏紧，这点得看实际场景。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

16:19

50d ago

X · @claudeai· x-apiEN16:19 · 04·29

Claude Code 黑客松结束，Opus 4.7 用了一周

Claude Code 黑客马拉松刚结束，参与者用 Opus 4.7 模型开发了一周。活动由 Cerebral Valley 合办，官方说正在公布获胜者，但没透露具体名字和项目细节。

#Code#Claude#Cerebral Valley#Commentary

精选理由

HKR-K 刚好过关，靠的是模型版本、开发时长和联合主办方这三个事实。HKR-H 和 HKR-R 都不行，因为没公布获奖名单、项目产出，也没透露 Claude Code 的新能力细节，所以不值得上推荐位。

一句话点评

又一场 Claude Code 黑客马拉松结束，但没公布具体项目。

锐评

Anthropic 和 Cerebral Valley 合办的 Claude Code 黑客马拉松刚结束，参与者用 Opus 4.7 开发了一周。官方只说在公布获胜者，但没透露名字和项目细节——这点先别太激动，信息缺口很大。这类活动主要看两点：一是模型能力在真实编码场景中的落地效果，二是社区对 agentic coding 的接受度。但正文没披露任何项目方向、技术亮点或参赛规模，所以没法判断这次比上次有什么新东西。如果后续有获胜项目详情，才值得关注：比如是否用到了多步 agent workflow、外挂资料库（RAG）还是纯靠模型原生能力。目前只能当个活动预告看。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

SCORE

H0·K1·R0

13:59

50d ago

FEATUREDX · @op7418（歸藏）· x-apiZH13:59 · 04·29

DeepSeek 多模态模型全量上线，网页版识图模式能用了

DeepSeek 把多模态模型全量推上线了，现在打开网页版就能用识图模式。从体验看，这应该是一个独立的多模态模型，不是把图片转文字再丢给纯文本模型那种拼接方案。正文没披露模型名字、参数量、定价和 API 开放时间，这些关键信息都还缺着，想接进自己流程的朋友得再等等。

#Multimodal#Vision#Deepseek#Product update

精选理由

我会先打个折：这条消息本身够重磅，DeepSeek 的多模态终于从传闻变成可试用的东西了。但正文只确认了网页版识图入口，模型叫什么、多大、多少钱、什么时候上 API 全都没说，信息密度其实挺薄的。HKR 三条都踩中了，不过来源只有一条 X 帖，验证不够硬，所以分数压在 78–84 这个区间是合理的。这点先别太激动，等 API 和 benchmark 出来再重新评估。

一句话点评

DeepSeek 多模态模型上线网页版，能直接看图了。但名字、参数、价格、API 全没公布，想接流程的还得等。

锐评

DeepSeek 把多模态模型直接放到了网页版识图模式里，现在打开就能用。从体验看，这应该是个独立的多模态模型，不是那种先把图片转成文字再丢给纯文本模型处理的拼接方案，这意味着理解和推理能力可能更连贯。但正文没披露任何硬指标——模型叫什么、参数量多大、推理成本多少、API 什么时候开放，这些全都没说。没有 API 就意味着你没法把它接进自己的工具链或产品里，只能手动在网页上试。定价也没提，不知道大规模用起来划不划算。我会先打个折：能上线全量说明工程侧已经跑通了，但信息缺口这么大，大概率还在为商业化或开放接口做最后准备。想在生产环境用的朋友，建议等 API 和定价出来再评估。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:49

50d ago

X · @dotey（宝玉）· x-apiZH04:49 · 04·29

真实模糊背景 + 霓虹线稿插画的提示词模板

Amira 分享了一套提示词模板，用来生成“真实模糊摄影背景 + 霓虹线稿主体”的混合风格图。模板里填了具体例子：主体是开心的兔子，拿着粉色气球，背景是清晨阳光下的植物园小径，周围有野花、绿叶、开花的树。效果是背景像真实照片（有阳光、虚化、自然元素），主体却是发白光的加粗霓虹线条简笔画，脚下发光鞋子还轻轻碰着地面，画面里还飘着星光、液滴等涂鸦装饰。这套...

#Multimodal#Amira#Commentary

精选理由

一条单图提示词模板，靠具体的风格配方和可替换字段满足了 HKR-H 和 HKR-K。正文没披露模型设置、对比效果或更广的行业神经点，所以 HKR-R 不触发。

一句话点评

一套提示词模板，能生成背景像实拍照片、主体是发光霓虹线稿的混合风格图。

锐评

这是一套提示词模板，不是模型或工具。它教你怎么写 prompt，让生成图同时有真实照片的背景和霓虹线稿风格的主体。模板里填了具体例子：主体是开心的兔子拿粉色气球，背景是清晨植物园小径。效果是背景像实拍（有阳光、虚化、自然元素），主体是发白光的加粗霓虹线条简笔画，脚下发光鞋子轻碰地面，画面还飘着星光、液滴等涂鸦装饰。这套模板本身免费、可复用，适合做插画、海报或社交媒体视觉素材。但正文没披露用了哪个模型（Midjourney / DALL·E / Stable Diffusion 哪个版本？）、生成参数（采样步数、CFG scale、seed 等）以及是否经过后期筛选。不同模型对“真实摄影背景”和“霓虹线稿”的融合能力差异很大，实际效果可能不如例子稳定。如果你手头有能跑图的环境，可以直接拿模板试，但别指望一次出图就完美。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

00:06

51d ago

FEATUREDX · @dotey（宝玉）· x-apiZH00:06 · 04·29

微软开源语音模型 VibeVoice-ASR 实测：一小时播客 8 分 45 秒转完，但 32GB 内存的 Mac 跑不动

Simon Willison 在 128GB 内存的 M5 Max MacBook Pro 上跑了社区做的 4-bit 量化版 VibeVoice-ASR，模型大小 5.71GB。转写一小时播客用了 8 分 45 秒，prefill 阶段内存峰值冲到 61.5GB，生成阶段稳定在 18GB 左右，所以普通 32GB 笔电基本没戏。这个 9B 参数模型最...

#Audio#Inference-opt#Microsoft#Simon Willison

精选理由

这篇不是新模型发布，而是 Simon Willison 拿微软 1 月开源的 VibeVoice-ASR 在自己机器上跑了一遍，给出了速度和内存的实测数字。我会先打个折：这只是单次测试，不代表所有场景，但 61.5GB 的内存峰值确实把 32GB 笔电劝退了，这点对想本地部署的人很关键。正文没提准确率对比，所以别当全面评测看，就当一份硬件门槛参考。

一句话点评

微软这个语音模型把说话人分离和转写一步搞定，但本地跑要 64GB 内存起步，32GB 笔电直接劝退。

锐评

Simon Willison 在 128GB 内存的 M5 Max 上实测了 VibeVoice-ASR 的 4-bit 量化版，一小时播客转写用时 8 分 45 秒。这个速度不算快，但核心价值在于把传统“Whisper + 说话人分离工具”的多步流程压缩成一次推理，直接输出谁在什么时候说了什么。模型是 MIT 协议开源的，9B 参数，原生支持 50 多种语言和中英混说，单次最多处理 60 分钟音频。内存是硬门槛。prefill 阶段峰值冲到 61.5GB，生成阶段稳定在 18GB 左右，所以 32GB 笔电基本没戏，想本地跑至少 64GB 以上。另外有个有意思的细节：模型把一场两人对谈识别成了三个说话人，因为主持人的开场白和广告口播用了不同录音环境，模型直接按声学特征切出了第三人。这说明说话人分离的准确度还受录音条件影响，不是真的人数识别。正文没披露字错率或多语种混说的具体准确率数据，也没跟 Whisper 做横向对比。超过 60 分钟的音频需要自己切片，还得手动对齐切片间的说话人 ID，这块的工程成本不能忽略。对做播客转写、会议纪要的人来说，流程确实简化了，但内存门槛和长音频处理的后处理工作，让这个方案目前更适合有高配机器的开发者先试试看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

2026-04-28 · 星期二2026年4月28日

18:57

51d ago

X · @Yuchenj_UW· x-apiMULTI18:57 · 04·28

Claude Code 挂了

Anthropic 的编程助手 Claude Code 当前不可用。正文只说了这一句，没交代故障开始时间、影响范围、是否已确认或恢复进度。整个硅谷都在围观这条状态。

#Code#Claude Code#Incident

精选理由

一条 X 帖子说 Claude Code 挂了，但没写影响范围、状态页确认、恢复时间。HKR 里 H 和 R 通过，K 不通过，所以只是个低价值的事故信号。

一句话点评

Claude Code 挂了，整个硅谷都在围观。

锐评

Anthropic 的编程助手 Claude Code 当前不可用。正文只说了这一句，没交代故障开始时间、影响范围、是否已确认或恢复进度。整个硅谷都在围观这条状态。关键信息缺口：故障何时开始、波及多少用户、Anthropic 是否已定位原因、预计恢复时间。目前只有一条状态，没有官方说明或后续更新。对从业者来说，这条消息本身信息量极低，更像一个社交事件——大家在看 Anthropic 如何应对突发故障。如果后续有 RCA 或恢复报告，才值得深入分析。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

18:55

51d ago

X · @dotey（宝玉）· x-apiZH18:55 · 04·28

ByteByteGo 一张图对比 MCP 和 Agent Skills，比 AI 画的精致但门槛还在

ByteByteGo 发了一张对比 MCP（模型上下文协议）和 Agent Skills（智能体技能）的示意图，画得比 AI 生成的图精致很多。但作者也承认：懂的人一看就明白，不懂的人看了图还是不懂。正文没有展开两者的具体机制差异，比如 MCP 怎么让模型调用外部工具、Agent Skills 怎么封装子任务，图里也没标注关键区别。如果你对这两个概念不...

#Agent#Tools#ByteByteGo#Commentary

精选理由

ByteByteGo 的图比 AI 画的精致，但正文只有一句评论，没讲 MCP 和 Agent Skills 到底差在哪、怎么选。这是低信息量的社交评论，给 45 分合理——有话题性但没干货，适合泛读。

一句话点评

图好看，但没解释MCP和Agent Skills到底差在哪。

锐评

ByteByteGo这张对比图确实比AI生成的精致，但作者自己承认：懂的人一看就明白，不懂的人看了还是不懂。正文没披露MCP（模型上下文协议，让模型调用外部工具）和Agent Skills（智能体技能，封装子任务让模型执行）的具体机制差异，图里也没标注关键区别。如果你对这两个概念不熟，光看图学不到东西。信息缺口明显：缺两者在工具调用方式、任务编排、状态管理上的对比。建议读者先补基础概念再看图，否则只是看个热闹。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

18:03

51d ago

FEATUREDX · @dotey（宝玉）· x-apiZH18:03 · 04·28

港科大等十余所高校发 88 页综述，给“世界模型”画了一张统一地图

这篇综述先捅破一层窗户纸：做强化学习、视频生成、Web Agent 的人嘴里说的“世界模型”根本不是一回事，论文之间没法比。作者团队拉出一个“能力等级 × 领域法则”的二维框架，把 400 多篇工作摆到同一张桌子上。能力分三层：L1 只预测下一步，L2 能做多步推演且遵守领域基本规则，L3 能在预测翻车时自己诊断原因、设计实验、修正模型。领域分物理、数...

#Reasoning#Robotics#Agent#HKUST

精选理由

我会先打个折：这不是新模型发布，是一篇梳理定义的综述。但它的价值在于把“世界模型”这个被用烂的词拆成可验证的层级和领域法则，400 多篇文献、26.2% 的物理一致性通过率、A-Lab 的闭环实验数据，都让讨论从玄学回到工程。对从业者来说，下次再有人说“我们做了世界模型”，可以直接拿这篇的框架去问到底在哪个层级、遵守什么领域法则。

一句话点评

这篇综述最大的贡献是给“世界模型”画了张地图，把各说各话的圈子拉到同一张桌子上。但别急着激动，L3 进化器目前只有自动化实验室跑通了，离通用智能还远。

锐评

这篇 88 页的综述先捅破一层窗户纸：做强化学习、视频生成、Web Agent 的人嘴里说的“世界模型”根本不是一回事，论文之间没法比。作者团队拉出一个“能力等级 × 领域法则”的二维框架，把 400 多篇工作摆到同一张桌子上，这事本身就有价值——至少以后吵架有个坐标系了。几个数字值得留意。视频生成模型在物理一致性测试上通过率只有 26.2%，说明画面好看不等于懂物理，杯子穿桌子的 bug 还很多。LLM 驱动的社会模拟能复现舆论极化，但智能体有系统性趋同偏差，跟真实人类行为分布偏离大，拿来预测社会趋势要打折扣。目前 L3 进化器做得最成熟的是 A-Lab，用机械臂 17 天跑 353 次闭环实验合成 36 种化合物，失败实验被提炼成知识而非丢弃，这个闭环自修正的思路比单纯堆参数有意思。论文末尾抛出一个根本问题：人类历史上最成功的世界模型都是符号化的、可编辑的，而现在的神经网络把所有规则藏在权重里，L1、L2 阶段够用，到了需要修改模型结构本身的 L3，这种隐式表示就成了障碍。正文没给出答案，但把问题摆对了位置。还缺的是：这个框架本身还没经过社区大规模验证，不同领域之间的迁移难度也没量化，先别把它当标准答案用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:41

51d ago

FEATUREDX · @OpenAI· x-apiEN17:41 · 04·28

GPT-5.4 Pro 帮数学家解决了一个 60 年没解开的 Erdős 问题

OpenAI 发推说，本月初一个悬了 60 年的 Erdős 问题在 GPT-5.4 Pro 的帮助下被解决了。推文里提到了 Sebastien Bubeck、Ernest Ryu 和 Andrew Mayne 三位研究员，但正文没披露具体是哪个问题、证明过程长什么样、能不能复现。我会先打个折：目前只有一条推文，没有论文或预印本链接，所以很难判断模型到...

#Reasoning#OpenAI#Sebastien Bubeck#Ernest Ryu

精选理由

这条消息的吸引力全在“60 年未解 Erdős 问题 + GPT-5.4 Pro”这个组合上，对 AI 从业者来说是个很强的信号。但正文只给了讨论数学研究变化的氛围，没给任何硬货——题目叫什么、证明怎么做的、能不能复现，全都没说。所以我会先打个折：钩子值一个 H 和 R，但 K 完全站不住，因为信息缺口大到没法判断模型到底干了多少活。这点先别太激动，等有论文或细节再重新评估。

一句话点评

一条推文说 GPT-5.4 Pro 帮忙解决了一个悬了 60 年的 Erdős 问题，但没给论文、没给问题名、没给证明过程，目前只能当预告看。

锐评

OpenAI 这条推文信息量很低，更像节目预告而不是成果发布。它只说 GPT-5.4 Pro 参与解决了一个 60 年未解的 Erdős 问题，但正文没披露具体是哪个问题、证明是怎么产生的、模型到底贡献了哪一步。三位研究员的名字给了，但没附任何论文链接或预印本，所以外界没法验证这个证明对不对、能不能复现。我会先打个折：数学证明的难点往往在关键构造或引理，如果模型只是辅助搜索文献或做数值实验，那和“解决”是两回事。目前没有证据表明 GPT-5.4 Pro 独立完成了推理，也没说人类研究员改了多少。还缺的东西很明确：问题编号、完整证明、模型交互日志、同行评审状态。在这些出来之前，这条推文只能说明 OpenAI 在往数学研究的方向试水，但试到什么程度还看不出来。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

17:22

51d ago

X · @dotey（宝玉）· x-apiZH17:22 · 04·28

让 ChatGPT 自己检查自己：一个提升输出质量的技巧

dotey 分享了一个 ChatGPT 使用技巧：利用会话内的 Agent 环境，让模型自己调用工具验证并迭代输出。以写画图提示词为例，先让 ChatGPT 自检、修改，再交给用户验收，结果通常更好。但原文没披露用了哪些工具、测试样本量或成功率，所以效果多好得自己试。

#Agent#Tools#dotey#ChatGPT

精选理由

HKR-K/R通过，因为它描述了一个具体的Agent自检工作流，并戳中了验收成本的痛点。HKR-H不通过；文章缺少具体工具、样本量或成功率，所以落在60–71的实用技巧区间。

一句话点评

让 ChatGPT 自己调用工具验证再迭代，写提示词效果更好。但没披露用了哪些工具、样本量，效果得自己试。

锐评

dotey 分享了一个实用技巧：利用 ChatGPT 会话内的 Agent 环境，让模型自己调用工具验证并迭代输出。以写画图提示词为例，先让 ChatGPT 自检、修改，再交给用户验收，结果通常更好。这个思路本质是把模型当“执行者+质检员”用，减少人工反复调参。但原文没披露用了哪些工具（比如是否调了代码解释器或浏览器）、测试样本量或成功率，所以效果多好得自己试。另外，这个技巧依赖会话内工具调用能力，如果模型工具调用不稳定或环境受限（比如免费版），可能效果打折。对 AI 从业者来说，这是一个低成本提升输出质量的 prompt 工程思路，但需要结合具体场景验证。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

16:23

51d ago

X · @dotey（宝玉）· x-apiZH16:23 · 04·28

开源项目试水AI生成UI，离Claude Design还有距离

作者试了一个开源项目，生成的是HTML雏形，交互和内容完整度都差一截；而Claude Design直接输出React组件，界面美观、交互流畅。正文没提项目名、提示词和复现环境，但作为开源起步已经不错，值得看看。

#Code#Tools#Claude Design#Open source

精选理由

HKR-R通过，因为AI生成UI的质量和交互完成度是产品与前端团队的真实痛点。HKR-H和K不通过：正文没披露项目名称、测试提示词和复现条件，信息缺口太大，只能算一条低信号的个人试用感受。

一句话点评

开源版Claude Design雏形，交互和完成度差一截，但起步不错。

锐评

作者对比了一个开源项目与Claude Design：后者直接输出React组件，界面美观、交互流畅；前者目前只生成HTML雏形，交互和内容完整度都差不少。正文没披露项目名、提示词和复现环境，信息缺口明显，没法直接复现或评估。但作为开源起步，能做到这个程度已经值得关注，尤其对想低成本搭建类似工具的人来说是个参考。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

16:15

51d ago

X · @dotey（宝玉）· x-apiZH16:15 · 04·28

GPT 5.5 后作者更爱用 Codex 和 ChatGPT：写作变强、能画图、暂时不限量

dotey 说 GPT 5.5 之后他更常用 Codex 和 ChatGPT 了，理由是 GPT 的写作能力明显提升，还能直接画图，而且目前没有 token 焦虑（即暂时不限量或价格可控）。不过正文没披露 GPT 5.5 的具体规格、token 上限或定价，所以“没有焦虑”这点先别太激动，可能只是个人体验或早期阶段。

#Code#Multimodal#dotey#OpenAI

精选理由

dotey 说 GPT 5.5 后更常用 Codex 和 ChatGPT，理由是写作变强、能画图、没有 Token 焦虑。但正文只有一条 RSS 片段，没披露 GPT 5.5 的上下文窗口、价格或参数规模，信息缺口很大。H 和 R 通过是因为它点出了 Token 成本这个真实痛点，对开发者有共鸣；K 不通过，因为这是一条个人印象，没有可验证的细节。

一句话点评

GPT 5.5 写作和画图变强，但“没 token 焦虑”可能只是早期体验。

锐评

dotey 说 GPT 5.5 之后他更常用 Codex 和 ChatGPT 了，理由是写作能力明显提升，还能直接画图，而且目前没有 token 焦虑（即暂时不限量或价格可控）。这听起来像一次体验分享，不是官方公告。关键信息缺口：正文没披露 GPT 5.5 的具体规格、token 上限或定价，所以“没有焦虑”这点先别太激动——可能只是个人体验或早期阶段，也可能是 OpenAI 暂时放宽了限制来推广新模型。如果真能做到写作+画图且不限量，那对日常使用是好事，但需要更多用户反馈和官方数据来验证。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

16:11

51d ago

X · @dotey（宝玉）· x-apiZH16:11 · 04·28

上下文窗口塞太满，再强的模型也会变笨

dotey 实测发现，不管模型多强，上下文窗口占用太满输出质量都会下降。固定格式的文档写作，Sonnet 和 Opus 差别不大；但对写作要求高的任务，Opus 明显更好。正文没披露具体样本量、窗口大小和评分标准，结论偏经验分享。

#Memory#dotey#Sonnet#Opus

精选理由

只有 R 通过：上下文衰减和 Opus 的成本权衡是真实痛点。H 和 K 不通过，因为正文没给样本量、窗口长度和评分方法，信息缺口太大，只能算低价值段子。

一句话点评

上下文塞太满，再强的模型也会变笨。

锐评

dotey 实测发现，上下文窗口占用过高时，所有模型输出质量都会下降。固定格式写作（如填表格）Sonnet 和 Opus 差距不大，但高要求写作 Opus 明显更好。正文没披露样本量、窗口大小和评分标准，结论偏经验分享，可参考但别当严谨评测。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

15:07

51d ago

● P1X · @claudeai· x-apiEN15:07 · 04·28

Claude 接入 Photoshop、Blender 和 Ableton 等创意工具

Claude 上线了 Blender 连接器，你可以在对话里让它帮你排查场景问题、写新工具，或者批量修改所有物体。正文没提这个功能是免费还是付费、支持哪些版本，也没说清楚 Claude 在 Blender 里的操作权限边界——它能改到什么程度、会不会误删东西，这些都得等实测才知道。

#Agent#Tools#Anthropic#Claude

精选理由

HKR 三项都过：Claude 接 Blender 是 Agent 往专业工具里伸了一只真能干活的手，不是概念图。正文没提版本、定价和上线范围，所以重要性停在 76，够 featured 但不到必写。我会先打个折——没看到实际跑起来的延迟和权限边界，这点先别太激动。

一句话点评

Claude 能直接操作 Photoshop、Blender 和 Ableton 了，不是生成内容，是替你点按钮、调参数。

锐评

Anthropic 给 Claude 装上了“创意连接器”，让它能直接操控 Photoshop、Blender、Ableton 这类专业软件。这跟之前让模型生成图片或音乐不一样——现在是模型去操作软件界面，帮你调图层、改节点、动音轨。对设计师和音乐人来说，省掉的是来回切换窗口和手动执行的步骤。文章提到 Anthropic 同时给 Blender 基金会捐了一笔钱，目的是帮这个开源软件保持免费。这步棋挺聪明：先确保工具本身不被商业收购掐住脖子，再把自己的模型嵌进去。但正文没披露具体捐了多少，也没说连接器的延迟和错误率怎么样。创意工具对实时反馈要求很高，如果模型操作卡顿或者误触，体验会大打折扣。现在还缺几个关键信息：连接器是本地运行还是走云端？支持哪些具体版本？对复杂工程文件（比如几百个图层的 PSD）的处理能力如何？这些直接决定它是真能进专业管线，还是只适合轻量演示。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

11:54

51d ago

X · @op7418（歸藏）· x-apiZH11:54 · 04·28

Codex 里做 PPT 现在能自动配图了，风格还挺多

作者优化了 Codex 里的 PPT Skills，现在生成 PPT 时会调用 GPT-Image-2 自动配图，支持人文纪实（类似胶片感）、信息图、流程图、对比图、关系图，还能把截图美化并调整比例。流程也改了：生成前会先问用户，不再直接跳过确认。正文没披露图片生成速度、成本或是否支持手动替换，这部分得自己试。

#Tools#Multimodal#Code#Codex

精选理由

正文没披露任何效果数据或用户反馈，就是一个个人工作流小改。亮点是 GPT-Image-2 调用和确认步骤，但没说明图片质量、生成速度或成本变化，信息缺口明显。

一句话点评

Codex 的 PPT 技能现在能自动配图了，但速度、成本、能否手动换图都没说。

锐评

作者在 Codex 里给 PPT Skills 加了个自动配图流程，调用 GPT-Image-2 生成图片，支持人文纪实（类似胶片感）、信息图、流程图、对比图、关系图，还能美化截图并调比例。生成前会先问用户，不再直接跳过确认。亮点是图片风格有区分度，不是千篇一律的 AI 图。但正文没披露图片生成速度、每次调用成本、是否支持手动替换或编辑，这些对实际使用很关键。如果生成慢或贵，自动配图反而拖累效率。建议自己试一下再决定是否常用。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

10:03

51d ago

X · @Khazix0918· x-apiZH10:03 · 04·28

内部AI工具三件套：Skill Hub、应用入口、一句话部署服务器

作者给公司全员做了内部分享，展示了三个自研AI工具。Skill Hub让员工上传、订阅和自动同步AI技能（Skill），解决版本混乱问题；应用入口统一存放内部应用，包括运营看板和小游戏；服务器部署助手把本地项目一键部署到公司服务器，非技术人员也能用。另外预告了一个免费AI热点监控网站AI Hot，但正文没披露上线时间。

#Agent#Code#Tools#AI Hot

精选理由

这是一条个人发的内部工具分享帖，工具本身具体（Skill Hub 支持上传/订阅/自动同步新版，部署助手一句指令上服务器），所以 HKR 三项都成立。但影响面窄：没有公开上线时间、没有代码、没有定价、没有可复现的部署方案，所以分数卡在 60–71 区间。正文没披露 AI Hot 监控网站何时免费公开，这点先别太激动。

一句话点评

三个内部工具，最实用的是服务器部署助手，非技术人员也能一键部署项目到公司服务器。

锐评

作者分享了三个自研AI工具：Skill Hub解决AI技能版本混乱问题，支持上传、订阅和自动同步；应用入口统一存放内部应用，包括运营看板和小游戏；服务器部署助手把本地项目一键部署到公司服务器，非技术人员也能用。另外预告了一个免费AI热点监控网站AI Hot，但正文没披露上线时间。亮点是部署助手降低了部署门槛，让vibe coding产出的项目能真正分享使用。但这些都是内部工具，没有开源计划，外部无法验证实际效果。AI Hot网站功能描述比较模糊，只说“精选策略和监控流程”，具体怎么去噪、更新频率、覆盖哪些信源都没说。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

06:27

51d ago

X · @op7418（歸藏）· x-apiZH06:27 · 04·28

OpenAI 一到周末就给 Codex 重置速率限制

有用户发现 OpenAI 的 Codex 产品每到周末就会重置速率限制，但推文没提具体是哪个套餐、哪个地区、重置逻辑是什么。如果这是免费或低档套餐的固定策略，那对周末赶活的开发者算个小福利——至少不用等额度恢复。不过正文没披露重置后额度是多少、是否影响付费用户，这点先别太激动。

#Code#OpenAI#Product update

精选理由

这是一条用户发的推文，不是 OpenAI 官方公告。H 和 R 勉强成立，因为确实戳中了重度用户和 coding agent 用户的痛点；但 K 不成立，正文没披露任何关键细节（额度、套餐、地区、重置逻辑），信息量极低，属于低价值的社交信号，没有硬伤但也不值得高优先级处理。

一句话点评

周末重置额度，对赶活的开发者算小福利，但具体规则没披露。

锐评

有用户发现 OpenAI 的 Codex 每到周末就重置速率限制，推文没提是哪个套餐、哪个地区、重置逻辑是什么。如果这是免费或低档套餐的固定策略，那对周末赶活的开发者算个小福利——至少不用等额度恢复。不过正文没披露重置后额度是多少、是否影响付费用户，这点先别太激动。另外，重置频率和额度上限直接影响开发者的实际使用体验，但信息缺口较大，无法判断这是临时 bug 还是有意设计。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

2026-04-27 · 星期一2026年4月27日

19:01

52d ago

FEATUREDX · @dotey（宝玉）· x-apiZH19:01 · 04·27

Cursor 3 用户反馈：别光顾着炫，先把 Agent 和 IDE 无缝焊在一起

Eric Zakariasson 的 Cursor 3 反馈帖收到 431 条回复，核心诉求不是更花哨的界面，而是一个稳定可靠的 AI 开发工作台。用户最强烈的意见是：Agent Window 不能牺牲 IDE 基本能力，进去之后 LSP、调试、终端、diff 操作经常要切回旧界面，理想状态是 Agent 推进工作，人随时能无缝接管。多 Agent 和...

#Agent#Code#Tools#Cursor

精选理由

三条都过：431 条回复量够大，需求提得具体，而且正好打在开发者对 AI 工作台的焦虑点上。放在 featured 低段是因为这是用户反馈汇总，不是 Cursor 官方发布或路线图，信息增量有但权威性打折。

一句话点评

431条用户反馈说得很直白：别整花活，先把Agent窗口里能正常用LSP、调试、终端、Git这些基本功做好。

锐评

这篇反馈整理的价值在于，它把用户对Cursor 3的期待从“更聪明的代码补全”拉回到了“一个能干活的工作台”。用户最强烈的信号是，Agent Window不能是座孤岛，进去之后连基本的代码跳转、调试、diff操作都得切回旧界面，这直接打断了开发流。多Agent并行、worktree管理、Git操作产品化这些需求，说明开发者想要的是一个能调度多个AI助手的控制中心，而不是一个聊天框。稳定性问题被反复提及，启动慢、内存暴涨、大项目卡死，这些会直接劝退专业用户。模型成本透明度也是高频诉求，用户想知道“这个任务用哪个模型最划算”，而不是盲目烧钱。信息架构混乱、找不到历史对话、快捷键缺失，这些细节正在消耗信任。正文没披露Cursor官方对这些反馈的回应或路线图，所以这些诉求目前还只是用户侧的单方面整理。如果Cursor 3真能把Agent与IDE无缝融合、把Git工作流产品化、保证大项目下的稳定性，它就有机会从编辑器变成开发者的AI工程主界面。否则，用户会继续在Codex、Claude Code等工具间来回跳。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

15:56

52d ago

X · @dotey（宝玉）· x-apiZH15:56 · 04·27

GPT Image 2 海报提示词：Elon Musk

dotey 分享了一个 GPT Image 2 的海报提示词，输入“Elon Musk”就能生成一张成品级概念字体海报。提示词要求标题文字必须巨大、可读、拼写准确，占视觉主导；如果标题是知名人物，还要加一张占画面 40–70% 的编辑肖像，肖像不能照搬现有照片或官方图，但得让人一眼认出是谁。配色限制在 4–6 色，风格走高端编辑海报路线，带丝网/石印/...

#Vision#Multimodal#dotey#xiaoxiaodong01

精选理由

HKR-K通过，因为帖子给出了可复用的GPT Image 2海报提示词约束。HKR-H/R不通过：没有产品新闻、基准测试或一手实测，所以价值较低。

一句话点评

一个提示词就能让 GPT Image 2 出成品级海报，但别指望每次都稳定。

锐评

dotey 分享的这条提示词，输入“Elon Musk”就能让 GPT Image 2 生成一张概念字体海报。核心要求：标题文字巨大、拼写准确、占视觉主导；如果是知名人物，还要加一张占画面 40–70% 的编辑肖像，但不能照搬现有照片。配色限制在 4–6 色，风格走高端编辑海报路线，带丝网/石印质感。这条提示词的价值在于把“生成一张好海报”这个模糊需求拆成了可执行的规则：字体设计、人物识别、色彩系统、构图逻辑都给了具体约束。对于想用 AI 做视觉设计的人来说，这是一个可以直接套用的模板。但正文没披露 GPT Image 2 对复杂提示词的遵循率有多高，也没说多次生成的一致性如何。实际效果可能时好时坏，尤其是“肖像不能照搬现有照片但又要让人一眼认出”这条，模型很可能翻车。另外，提示词里要求“自定义字体设计”，但当前图像生成模型对字母形状的精确控制还很弱，拼写错误或字体变形是常见问题。所以这条提示词值得收藏，但别指望每次都能稳定输出成品级海报。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

SCORE

H0·K1·R0

2026-04-26 · 星期日2026年4月26日

22:29

53d ago

X · @dotey（宝玉）· x-apiZH22:29 · 04·26

用户分享GPT Image 2图像生成提示词：立体刺绣风格小鸟插画

作者分享了一个 GPT Image 2 的提示词，用来生成小鸟站在花枝上的立体刺绣风格图片。提示词指定了蚕丝白和奶白底色、低浮雕纤维艺术效果、丝线刺绣和柔和光影。正文没披露生成参数、分辨率和实际输出图，所以效果好不好得自己试。

#Multimodal#Vision#Commentary

精选理由

HKR三项全挂：这是一条轻量级提示词分享，没有输出、参数、可复现结果或行业影响。当噪音处理，排除。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

SCORE

H0·K0·R0

04:32

53d ago

X · @dotey（宝玉）· x-apiZH04:32 · 04·26

GPT Image 2 数学信息图提示词模板

dotey 看到一张不错的数学可视化图但没给提示词，自己写了个 GPT Image 2 模板。模板分两段：第一段要求解释概念的定义、为什么成立、几何直觉和不同场景表现；第二段规定视觉风格——浅色纸张背景、深蓝标题、手绘箭头、圆角卡片和局部放大框。适合用来生成像讲义又像手绘海报的数学说明图，但正文没披露实际生成效果和模板的通用性验证。

#Multimodal#Vision#dotey#GPT Image 2

精选理由

这篇是 dotey 分享的 GPT Image 2 数学信息图提示词模板，正文给了两段可复用的指令结构，要求模型输出概念定义、成立原因、几何直觉和场景表现，并限定浅色纸张、深蓝标题、手绘箭头等视觉元素。H 和 K 都成立：钩子直接解决“没给提示词”的痛点，知识提供了具体的指令结构和风格约束。R 不成立：只面向提示词爱好者，没有测试、模型对比或行业影响，不涉及成本、就业或安全。

一句话点评

一个可复用的 GPT Image 2 提示词模板，专为生成数学可视化信息图设计。

锐评

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

03:41

53d ago

X · @op7418（歸藏）· x-apiZH03:41 · 04·26

藏师傅的 PPT 技能加动效了，断网也能播

藏师傅给 PPT Skill 每个版式配了展示动效，不是花哨那种，而是配合内容演示。本地动效文件支持离线播放，不用联网也能正常演示。正文没提版本号、价格和发布时间。

#Tools#藏师傅#Product update

精选理由

这是一次小众工具的功能更新。HKR-K靠版式动效和离线播放通过；HKR-H和R都很弱，而且版本号、价格、发布时间都没披露。

一句话点评

PPT 动效离线可用，但版本和价格都没说。

锐评

藏师傅给 PPT Skill 每个版式配了展示动效，强调是配合内容演示而非炫技。最大亮点是本地动效文件支持离线播放，不用联网也能正常演示，这对经常出差或网络不稳的用户很实用。但正文没披露版本号、价格和发布时间，所以没法判断这是免费更新还是付费升级，也不知道什么时候能用上。动效具体效果如何、是否兼容旧版 PPT 文件，也都没提。如果是免费更新，算是个不错的体验优化；要是单独收费，就得看动效质量值不值了。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

SCORE

H0·K1·R0

2026-04-24 · 星期五2026年4月24日

21:30

55d ago

FEATUREDX · @dotey（宝玉）· x-apiZH21:30 · 04·24

Cursor 3 加了 /multitask，能让多个子智能体同时干活，不用排队等

Cursor 3 新出的 /multitask 命令，可以同时跑好几个异步子智能体，不用像以前那样一个任务做完才能开始下一个。已经在排队里的任务也能随时切成并行模式。帖子没提同时能跑几个、吃多少资源、一个崩了会不会带崩其他的。

#Agent#Tools#Cursor#Product update

精选理由

这次更新解决的是 Cursor 里一个挺烦人的瓶颈——以前子任务只能串行，现在能并行跑了，排队中的任务也能随时切模式。我会先打个折：正文没披露并发上限、资源占用和失败回退机制，所以实际能并行多少个、会不会吃满内存、一个子任务崩了怎么收场，都还不知道。但光是把串行改并行这一点，对日常编码吞吐的提升就够实在，所以放在 featured 低位。

一句话点评

Cursor 3 的 /multitask 让多个子智能体同时干活，不用排队。但正文没披露并行任务上限和资源开销，这点先别太激动。

锐评

Cursor 3 加了一个 /multitask 命令，核心是把过去串行的子智能体任务改成并行。以前你得等一个任务跑完才能启动下一个，现在可以同时派发多个异步子智能体，已经在排队的任务也能随时切到并行模式。这对需要同时改多个文件、查多处代码的场景很实用，能省下不少等待时间。不过目前只有一条推文消息，正文是空的，关键信息全缺。没看到并行任务数量有没有上限，也没提多个子智能体同时跑会不会抢算力、导致单个任务变慢。另外，并行任务之间的冲突处理——比如两个子智能体同时改同一个文件——也没说明。这些都会直接影响实际体验。如果并行开销控制得好，这个功能对日常开发效率的提升会很明显。但在看到具体的资源消耗和冲突策略之前，建议先把它当成一个省等待时间的工具，别指望它能无脑加速所有任务。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:24

55d ago

● P1X · @AnthropicAI· x-apiEN17:24 · 04·24

Anthropic 发布 Project Deal 研究，探索代理间交易场景

Anthropic 发了个新研究叫 Project Deal。他们在旧金山办公室搭了个内部交易市场，让 Claude 替同事买东西、卖东西、谈价格。正文没披露用了哪个模型版本、市场有多大、成交了多少单，也没说最后是赚了还是亏了。这点先别太激动，目前看更像一个内部行为实验，不是产品发布。

#Agent#Reasoning#Anthropic#Claude

精选理由

这条能上 featured，靠的是 H 和 R 两项：Anthropic 自带关注度，让模型替同事谈办公室交易又天然有讨论性。我会先打个折——正文没给实验规模、模型版本和结果指标，K 项偏弱，所以分数停在中间档。

一句话点评

Anthropic 让 69 名员工各掏 100 美元，用 AI 代理互相买卖二手物品，成交 186 笔、总额超 4000 美元。实验发现模型越强，代理谈成的交易对主人越有利，但主人自己完全没察觉。

锐评

Anthropic 这个 Project Deal 实验，说白了就是搭了个封闭的二手跳蚤市场，让 Claude 模型替买卖双方自动砍价、成交。69 名员工参与，每人 100 美元预算，最后成了 186 笔交易，总金额 4000 多美元。这个规模很小，别急着把它当成“AI 代理经济”的雏形。真正值得留意的是他们对比了不同模型的表现：用最强模型代理的用户，拿到的交易结果明显更好，但用户自己感觉不到差别。这暴露了一个挺麻烦的问题——如果未来代理真替我们花钱，我们可能根本不知道它是在帮我省钱还是在悄悄吃亏。另外，实验里给代理的初始指令（比如“狠狠砍价”还是“随缘买”）对最终成交价和成交率没啥影响，说明现阶段模型自身的能力比我们怎么吩咐它更重要。正文没披露交易失败率、代理有没有出现离谱报价，也没说这 4000 多美元里有多少是“真实成交”那组产生的。这些缺口让结论得打个折。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

06:29

55d ago

FEATUREDX · @op7418（歸藏）· x-apiZH06:29 · 04·24

给 Agent 塞够背景和工具，它自己就能做出接近可用的 PPT 初稿

作者说只给了 Agent 大概三行风格指引，它产出的第一版 PPT 就已经接近能用。这个能力是从 Codepilot 的 agent memory 里长出来的，Agent 还参考了作者已有的项目和收藏文章来推测需求。正文没披露用了什么模型、什么工具、花了多久、有没有人工评估。关键信号是：持续记忆加个性化上下文比单纯写提示词更管用。

#Agent#Memory#Tools#Codepilot

精选理由

HKR-H和HKR-R通过：3行描述出PPT初版这个例子有传播力，也点出了记忆驱动Agent工作流的真实价值。HKR-K不通过：模型、工具、耗时、效果评测全没披露，所以留在all，不上featured。

一句话点评

这条更像个人实验感想，不是正式评测。Agent 能干活的前提是喂够上下文和工具，但正文没给具体任务、模型和成功率，先当经验分享看。

锐评

这条信息来自个人博主的简短分享，正文缺失，只能从标题推断核心观点：给 Agent 配齐背景资料和可调用的工具后，它的实际表现会明显提升。这个判断本身不新鲜，但点出了一个常被忽略的工程现实——很多 Agent 落地效果差，不是模型笨，而是上下文没给够、工具链没接好。不过，这条分享缺少关键细节。没说明用的是哪款模型、跑了什么任务、成功率多少、延迟和成本如何。也没交代“上下文”具体指什么：是长文档、对话历史，还是结构化数据？“工具”是 API、代码执行器还是数据库查询？这些缺口让结论只能停留在方向性认同，没法复现或量化。如果你正在搭 Agent 流程，这条提醒值得留意：别只盯着模型排行榜，先把信息通路和工具接口理顺。但别拿它当性能背书，等有具体实验数据再调整预期。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

04:38

55d ago

FEATUREDX · @op7418（歸藏）· x-apiZH04:38 · 04·24

DeepSeek V4 调用工具翻车：读不了 PPT 模板，自己跑去写网页

有用户实测 DeepSeek V4 的 Skill（工具调用）功能，发现它连读 PPT 模板这种基础指令都执行不了，最后自己瞎编了一个网页交差。用户原话是“指令遵循和工具调用的效果很差”，但正文没披露是哪个版本、是不是偶发、还是所有 Skill 都这样。对做 agent 或工具链的人来说，这个翻车比跑分更值得关注——模型能不能老老实实按流程干活，比单次...

#Agent#Tools#DeepSeek#Commentary

精选理由

这篇帖子有具体复现：DeepSeek V4 在 PPT 模板任务上没调 Skill，自己生成了网页，所以 HKR 三个条件都满足。但来源是单条社交帖，没有失效原因分析、版本范围或更多样例，信息缺口明显，所以定 all 层，不上 tier 1。

一句话点评

有人实测 DeepSeek V4 调用 Skill 直接翻车，功能目前基本不可用。

锐评

这条消息来自个人开发者 x-op7418 的实测，他试了 DeepSeek V4 的 Skill 调用功能，结果是完全跑不通。目前只有这一条来源，正文细节缺失，我们不知道他测的是哪个具体 Skill、报了什么错、是在官方客户端还是 API 环境。这些信息缺口让判断得打个折——可能是模型刚发布功能还没调通，也可能是特定场景下的兼容问题。但“完全无法正常调用”这个表述很绝对，说明不是偶发小毛病。对想上手用 V4 干活的人来说，Skill 这块先别抱期待，等官方修或者更多实测出来再看。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:32

55d ago

X · @Yuchenj_UW· x-apiMULTI04:32 · 04·24

DeepSeek、Kimi、Qwen 用更少、被阉割的英伟达卡甚至华为芯片训出强模型

UW 的 Yuchenj 感叹 DeepSeek、Kimi 和 Qwen 用更少、性能受限的英伟达 GPU（甚至华为芯片）训出了很强的模型。他引用 DeepSeek V4 报告，说他们发明了新注意力架构来提升训练和推理效率。正文没披露具体用了多少卡、芯片规格或跑分结果，所以“更强”是主观判断，不是硬数据。核心观点是“约束催生创造力”，并希望美国也有能打...

#Inference-opt#DeepSeek#Kimi#Qwen

精选理由

HKR-H 落在受限 GPU 训练强模型的反差上，HKR-R 落在出口管制下算力效率这个神经上。HKR-K 不成立，因为帖子没披露 GPU 数量、芯片规格或基准结果，这更像一篇评论而不是实质性更新。

一句话点评

DeepSeek、Kimi、通义千问用更少甚至被阉割的N卡训出强模型，这事确实值得反复琢磨。正文没披露具体用了多少卡、什么型号、训练成本，所以没法直接算账。但核心信号是：国产模型在硬件受限下找到了工程优化路径，比如更高效的并行策略或数据筛选。对从业者来说，这意味着买卡焦虑可以降一点，但复现门槛和稳定性仍是未知数。

锐评

Yuchenj这条帖文把3家公司放进了同一判断：DeepSeek、Kimi、Qwen在受限GPU条件下，依然训出了强模型。正文只给了一个支点：DeepSeek V4报告提到新注意力架构。GPU数量、芯片型号、训练token量、基准分数，正文未披露。只靠这点信息，没法把结论抬到“同等效果下更省10倍算力”这种级别。我对这条的核心判断是：这不是一条模型新闻，这是一个地域性研发风格已经成形的信号。中国头部团队这两年一直在做同一件事：预算、卡型、互联、出口限制都不理想，就把稀缺条件直接写进训练系统和模型结构。你能在DeepSeek身上看到MoE、长上下文、蒸馏、推理链压缩，也能在阿里Qwen系里看到更激进的开源节奏和成本控制。Kimi那边我记得更早是靠超长上下文和工程堆栈出圈，不是先靠“最大训练集群”吃下市场。这个脉络比帖文本身重要。说真的，我不太买“创造力热爱约束”这种浪漫化表述。约束当然会逼出优化，但约束也会直接吃掉上限。美国头部实验室过去一年在预训练、后训练、推理服务三段一起堆钱，不是因为他们不会优化，而是规模本身确实还有效。OpenAI、Anthropic、Google没有停在“更省”，而是在继续买更大的训练和推理余量。中国团队厉害的地方，不是证明“大算力没用”，而是在证明“算力不够时，架构和系统仍能追回很大一截”。这两个命题差很多。外部参照其实不少。DeepSeek上一轮出圈，就不是单靠模型分数，而是“性能接近头部闭源，价格压得极低”。Qwen过去一年的开源推进也很激进，很多团队拿来直接做蒸馏、RAG、代码补全和私有部署。美国开源这边，Meta Llama当然还在，但“强美国开源模型”这件事，近一年并没有稳定压住Qwen和DeepSeek的迭代速度。我没逐项核过每个版本的全量benchmark，不过从开发者采用面看，中国开源系已经不是跟跑者姿态了。我还有个疑虑。帖文把“更少且受限的NVIDIA GPU，甚至Huawei芯片”并列在一起，听起来很强，但这里最容易误导人。训练和推理是两回事，预训练、后训练、蒸馏又是三套成本结构。到底是从零预训练，还是高质量续训；到底是核心训练跑在A800/H800这类受限卡上，还是部分流程迁到昇腾，正文都没说。没有这层拆解，“少卡也能做强模型”很容易被转述成一句口号。我自己的结论比较直接：别把这条读成励志故事，要把它读成工程竞争力的再定价。要是DeepSeek V4那套注意力改法，真的同时改善训练吞吐和推理成本，它的价值不在社交媒体的感叹，而在两件很硬的事：一是同预算下能不能多跑一轮实验，二是部署侧每百万token成本能不能继续往下压。前者决定研究速度，后者决定开源模型能不能大规模进生产。帖子没有给数字，所以现在最多只能给方向判断，不能给胜负判断。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

04:23

55d ago

FEATUREDX · @op7418（歸藏）· x-apiZH04:23 · 04·24

用 Claude 做杂志风幻灯片，先问 6 个问题再出稿

一位开发者发布了一个 Claude Skill，让 AI 先问用户 6 个问题（受众、时长、素材、审美等），再生成一套杂志排版风格的幻灯片。支持 10 种版式、5 套固定主题（不让自定义颜色，靠限制保证风格稳定）、WebGL 动态背景，最终输出一个单 HTML 文件，无需构建、服务器或云。换图只需替换同名文件刷新即可，不用改代码。正文没披露这个 Ski...

#Tools#Claude#Product update#Commentary

精选理由

这是一个具体的个人项目分享，不是平台级发布。HKR-H和K靠标题钩子和具体参数通过，但R不通过——没有用户数据、基准测试或生态影响，所以落在常规工具更新区间，不往上调。

一句话点评

一个开发者用 Claude Skill 把幻灯片做成了杂志排版，正文没披露具体实现细节和效果对比。

锐评

这条分享来自个人开发者 x-op7418，他做了一个 Claude Skill，让 AI 直接生成杂志风格的幻灯片，而不是传统 PPT 模板那套。标题里的“像杂志，不像 PowerPoint”是个很直观的卖点，说明他追求的是排版更自由、视觉更编辑化的输出。但正文是空的，我们看不到任何技术路径：是纯靠提示词约束 Claude 的输出格式，还是接了外部渲染管线？也没说生成一页要多久、排版稳定性如何、对中文和图文混排的支持到什么程度。这点先别太激动。杂志排版对字体、栏位、图片出血和留白要求很高，纯文本模型直接出这种结果，大概率需要后处理或者依赖特定的导出格式（比如 HTML/CSS 或 SVG）。如果只是把大纲套进一个好看的模板，那和“AI 做设计”还有距离。还缺三样东西：实际生成的页面截图、工作流说明（是一次生成还是分步迭代）、以及对排版错误率的粗略估计。没有这些，只能当个灵感参考。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

03:51

55d ago

X · @op7418（歸藏）· x-apiZH03:51 · 04·24

Code Pilot 0.54 上线，能用 DeepSeek V4 系列了

Code Pilot 0.54 第一时间接入了 DeepSeek V4 Pro 和 V4 Flash，填官方 API Key 就能用。同时还支持 GPT 5.5 的反代和小米 MiMo 2.5 Pro。正文没披露定价、上下文长度、函数调用和发布时间，具体效果和成本还得等实测。

#Code#Tools#Code Pilot#DeepSeek

精选理由

这是一条第三方编码工具的兼容性更新。只有 K 成立：正文确认了 DeepSeek V4 Pro 和 V4 Flash 的支持方式（填官方 API Key），但价格、上下文长度、函数调用和测试数据均未披露，H 和 R 因此很弱，tier 定为 all。

一句话点评

Code Pilot 0.54 已适配 DeepSeek V4 Pro 和 V4 Flash，开发者可直接在 IDE 里调用最新模型写代码。但正文没披露 V4 系列的具体能力提升、定价或上下文长度，这点先别太激动。如果只是换模型名，实际体验未必有质变。

锐评

Code Pilot 0.54 接入 DeepSeek V4 Pro、V4 Flash、GPT 5.5 反代和 MiMo 2.5 Pro，这条先别吹能力，先把它当模型分销层更新看。正文只给了“填官方 API Key 即可使用”这一个条件，价格、上下文长度、工具调用、补全延迟、是否支持仓库级索引，正文未披露；没有这些，做代码场景判断就差半截。我一直觉得这类更新的价值，不在“第一时间支持”六个字，而在客户端有没有把模型差异吃干榨净。Cursor、Continue、Cline 过去一年都证明了一件事：单纯多挂几个 provider，很快就同质化；能拉开差距的是补全触发策略、代码库检索、diff 应用稳定性、成本路由，还有失败时怎么回退。Code Pilot 这次如果只是把 DeepSeek V4 Pro/V4 Flash 接进来，用户当然多一个选择，但这还不是护城河，最多是把自己留在候选名单里。我对“GPT 5.5 反代接入”这句有点警觉。反代好用是好用，企业采购、账号稳定性、速率限制、数据合规都容易出问题。尤其代码工具一旦进公司网络，安全团队盯的不是你能不能调模型，而是日志落哪、代码有没有二次留存、密钥怎么管。摘要没写部署形态，也没写团队版策略，我不会把它直接看成对 Cursor 或 GitHub Copilot 的正面威胁。 DeepSeek 这条线倒是有现实意义。过去一年，国内不少代码工具都在补 DeepSeek、Qwen、Kimi 这类本土模型入口，原因很简单：价格和可得性经常比闭源头部更友好，延迟也更可控。我还没查到 V4 Pro 和 V4 Flash 在代码 benchmark 上的正式数字，摘要也没给，所以现在最多只能说 Code Pilot 在跟进供给侧变化，离“因为接了 V4 就会明显更强”还差证据。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

SCORE

H0·K1·R0

01:47

56d ago

FEATUREDX · @op7418（歸藏）· x-apiZH01:47 · 04·24

新 Codex 能直接生成 PPT 并在浏览器里预览，还能圈区域改图

一条推文说新版 Codex 可以生成 PPT 并在内置浏览器里预览，还能针对评论对应的区域直接修改。背后用了 GPT 5.5 增强前端排版能力，配图则调用 GPT-Image 2 生成。正文没披露上线时间、开放范围、定价或模型参数，所以实际效果和可用性还不确定。

#Code#Tools#Multimodal#Product update

精选理由

这条展示了 Codex 工作流的实际扩展，浏览器做 PPT 的演示让 H 成立，评论定位修改和 GPT-Image 2 配图是 K 的新事实。但正文没给上线时间、开放范围、定价和具体模型细节，R 挂零。维持 69 / all 合理。

一句话点评

OpenAI 新模型 Codex 能直接生成 PPT，但正文没披露具体效果和限制，先别太激动。

锐评

这条消息来自个人分享，说新 Codex 很适合做 PPT，但原文只有标题，没有展示实际生成的幻灯片质量、支持哪些排版风格，也没提操作门槛。从标题语气看，用户体感是上手快、产出符合预期，但缺少对比——比如跟 Gamma 或 Copilot 做 PPT 的差距在哪。对从业者来说，如果 Codex 真能把自然语言指令直接变成可用的演示文稿，意味着模型在结构化输出和视觉排版上往前走了一步。不过现在信息太少，没法判断是稳定能力还是偶发好结果，也不知道对中文排版和复杂图表支持如何。建议等有实际案例或官方说明再评估。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

2026-04-23 · 星期四2026年4月23日

21:33

56d ago

● P1X · @dotey（宝玉）· x-apiZH21:33 · 04·23

Anthropic 给 Claude 托管智能体加了记忆功能，用文件系统存经验，不用向量库

Anthropic 把记忆功能做进了 Claude 托管智能体，现在公测。智能体能把之前会话里学到的经验存成文件，下次干活直接读，不用每次从头教。实现方式很朴素：记忆就是文件系统上的文件，智能体用 bash 和代码能力直接读写，开发者也能通过 API 导出或回滚。权限上支持多智能体共享，可设只读或读写，并发访问不冲突，所有改动有审计日志。Rakuten...

#Agent#Memory#Tools#Anthropic

精选理由

Anthropic 给 Claude 托管智能体加了跨会话记忆，目前公测。亮点是没上向量数据库，直接用文件系统接 bash 和代码执行链路，权限、审计、回滚都给了。两个用户数字挺硬：Rakuten 出错率砍掉 97%，Wisedocs 提速 30%。不过范围还锁在托管智能体 beta 版，所以重要性给 83，放 featured。

一句话点评

Claude 托管智能体现在能记住跨会话的经验了，下次干活不用从头教。但正文没给具体技术细节和遗忘机制，先当功能预告看。

锐评

Anthropic 给 Claude 的托管智能体加了记忆功能，相当于你部署的 AI 助手能在多次对话里积累经验，下次处理类似任务时直接调用，不用每次都从零开始。这对需要长期协作的企业场景挺实用，比如客服、项目管理这类重复性高的工作。目前还在公测，官方没披露记忆的存储方式、容量上限，也没说怎么防止记错或记混。这些直接决定实际可用性——如果记忆容易污染或膨胀，反而会拖累回答质量。另外，跨会话记忆的隐私和权限控制也没提，企业用户会比较关心数据隔离问题。我会先打个折：功能方向对，但落地效果要看后续测试反馈。如果记忆机制能透明化，比如让用户查看和编辑 AI 记住了什么，信任度会高很多。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

21:10

56d ago

X · @Yuchenj_UW· x-apiMULTI21:10 · 04·23

所有 AI Agent 的记忆能力都还很差

UW 研究员 Yuchenj 吐槽现在的 Agent 记性太差，举了个例子：ChatGPT 把“记忆”理解成每条回复都喊用户名字。正文只给了 1 个段子和 1 条链接，没披露具体产品、机制、评测设置或结果。真正的瓶颈不是存不住状态，而是业界对“记忆”的定义本身就有问题。

#Agent#Memory#Commentary

精选理由

HKR 的 H 和 R 通过：观点有挑衅性，且切中 agent 可靠性的真实痛点。K 不通过：帖文只给了一个 ChatGPT 的 anecdote，没有机制、控制实验或数据支撑，所以这条只能算低价值的评论性内容。

一句话点评

短评：记忆是智能体的阿喀琉斯之踵，这篇点出了关键痛点但没给解法。点评：作者直言当前所有智能体在记忆能力上“出奇地差”，这个判断基本符合行业共识。目前主流方案要么靠外挂数据库做检索式记忆，要么靠长上下文硬塞，前者丢失语境关联，后者成本高且容易“迷失在中间”。正文未披露具体评测基准或失败案例，信息缺口明显——比如是短期记忆（对话中忘事）还是长期记忆（跨会话遗忘）更差？也没提任何缓解方案（如M...

锐评

帖文拿 ChatGPT 1 个失败样例，去下结论说“今天所有 agent 都不擅长 memory”。这个判断太大，证据太薄。正文只有“每次都叫我名字”这 1 个现象，没给产品链接细节，没给触发条件，没给评测集，也没说明这里的 memory 指 profile、会话摘要、长期偏好，还是跨工具状态。定义没钉住，讨论就会飘。我一直觉得，agent memory 这块被产品团队和研究团队混成了 3 件事：个性化、上下文压缩、可写可读的长期状态。ChatGPT 这类“记住你的名字和偏好”，更像 profile layer，不是很多人期待的 task memory。真正难的是第三种：模型要在第 N 次任务里，能把第 1 次任务留下的结构化状态正确取回，还要知道何时更新、何时遗忘、何时冲突消解。这里一旦没有 schema、权限边界、检索排序和写入策略，效果就会迅速塌掉。光让模型“记住用户”，很容易滑成廉价拟人化。文章外的参照其实不少。去年到今年，OpenAI 的 Memory、Anthropic 的 Projects / artifacts 持久上下文、各类 agent 框架里的 memory store，大家都在试同一件事：把“上下文窗口不够”伪装成“我记得你”。我没看到哪家公开拿出一套很硬的长期记忆评测，至少这条帖文也没给。比较成熟的做法反而来自工程侧：把记忆拆成 KV、RAG、profile、workflow state、tool logs，再按任务类型路由。听起来不性感，但比“模型自己会记”靠谱得多。我对这条最大的不满，是它把一个产品体验问题说成了能力总判决。说真的，今天 agent 的 memory 确实普遍不行，但“不行”主要卡在系统设计，不全是模型本身。标题已给出态度，正文没披露机制和数据；拿它当吐槽可以，拿它当行业判断还差得远。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

21:06

56d ago

FEATUREDX · @claudeai· x-apiEN21:06 · 04·23

Claude 托管 Agent 的记忆功能开始公测，Agent 能跨对话记住上下文了

Claude 给托管 Agent 加了个记忆层，现在你的 Agent 可以从每次对话里学东西。官方说法是“智能优化的记忆层”，在性能和灵活性之间找平衡。但正文没披露记忆容量有多大、能记多久、怎么收费、哪些账号能用。对从业者来说，关键看两点：一是持久记忆什么时候变成默认配置，二是这会让 Agent 的评测和状态管理怎么变。

#Agent#Memory#Claude#Product update

精选理由

Claude 给托管代理加了记忆，这是个实打实的产品更新，对做代理的人吸引力够强，所以 H 和 R 都站得住。但公告信息量太薄，关键参数一个没给，K 这块只能打折扣，整体够不上 p1，放在 featured 低段比较合适。

一句话点评

Claude 托管智能体的记忆功能公测了，但官方公告正文没放出来，细节得等。

锐评

Anthropic 把记忆功能加进了 Claude 的托管智能体（Managed Agents），现在是公开测试阶段。这意味着你可以让 Claude 在多次对话或任务里记住偏好、上下文，不用每次都从头交代。对做客服、个人助手这类需要长期交互的场景，省事不少。不过目前只有一条标题信息，正文是空的。具体怎么用、记忆存多久、能不能手动编辑或删除、成本会不会涨，这些都没披露。另外，托管智能体本身是让模型进业务流程干活的方案，加上记忆后，稳定性和延迟表现也没提。我会先打个折：功能方向对，但没看到实现细节和限制前，别急着往生产环境推。等官方补文档再说。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

19:53

56d ago

● P1X · @dotey（宝玉）· x-apiZH19:53 · 04·23

Codex 接入 GPT-5.5，新增浏览器操控、文档生成和自动审查，从写代码工具转向干活智能体

Codex 现在能用 GPT-5.5 了，一口气加了五个能力。它能直接操控浏览器，自己点击页面、填表、截图看结果，走完整个流程再告诉你哪里有问题。文档方面，可以在 Microsoft Office 和 Google Drive 里直接生成表格、幻灯片和文档，应用内还加了文件预览器，改完就能看效果。电脑操控能力跟着 GPT-5.5 增强，能看屏幕、点击、...

#Agent#Code#Tools#OpenAI

精选理由

这次 Codex 更新干货不少，核心不是简单挂了个新模型，而是把定位从代码助手往能跑连续任务链的智能体上推。我会先打个折：正文是二手消息，没给定价、没讲推送范围，也没交代那个审查智能体的安全门槛到底设在哪，所以先别太激动。但五个升级里，浏览器和电脑操控、跨办公套件生成文档、自动审查这几项，确实让 Codex 的干活边界变宽了，值得从业者盯着后续落地细节。

一句话点评

Codex 接入 GPT-5.5 并一口气放出五个升级，从代码补全转向直接帮你干活。但正文是空的，具体能力、实测效果和限制都没说，先当个预告看。

锐评

这条消息的核心变化是 Codex 的角色定位在变：不再只是帮你写代码片段，而是想作为一个能独立执行任务的智能体，直接介入开发流程。接入 GPT-5.5 意味着底层的推理和规划能力可能更强，但具体强在哪，正文没给任何细节。五个能力升级也只提了个总数，没有列出具体是什么、解决了哪些旧版痛点。从已知信息看，这更像一次方向性宣告。对从业者来说，值得关注的点是 OpenAI 在把模型能力产品化到具体工作流里，而不是只卷基准测试。但缺少实测数据、延迟指标和任务完成率，现在没法判断它到底能省多少事。如果后续有具体案例或对比测试，才值得认真评估。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

19:49

56d ago

X · @Yuchenj_UW· x-apiMULTI19:49 · 04·23

预训练还是蛋糕，RL只是樱桃

UW的Yuchenj用Spud和Mythos两个模型提醒大家：预训练依然很重要，RL只是蛋糕上的樱桃，不是蛋糕本身。正文没披露Spud和Mythos的具体设置、规模或效果，所以这点先别太激动——但观点本身值得留意，尤其是当行业都在追捧RL的时候。

#Commentary

精选理由

这是一篇只有两句话的观点帖，没有披露 Spud 和 Mythos 的类型、实验设置、指标或数据来源，因此适用硬排除-零来源规则，评分上限为 40。HKR-H 和 HKR-R 成立，但 HKR-K 不成立，因为正文中没有任何可验证的内容。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

18:53

56d ago

FEATUREDX · @dotey（宝玉）· x-apiZH18:53 · 04·23

写 Skills 要分 Agent：Claude Code 和 Codex 能干的活不一样

dotey 总结了两个核心差异：一是执行 Skills 的模型不同（Claude Code 用 Claude，Codex 用 GPT），二是环境（Harness）不同——Codex 能调内置画图 Skill，Claude Code 不行；Claude Code 和 Codex 都能跑脚本联网，但 Cowork 可能不行；Claude Code 的 As...

#Agent#Tools#Code#Claude Code

精选理由

HKR-K 靠 3 个具体行为差异落地，HKR-R 因为 Agent 开发者会关心提示词和工具的可移植性。HKR-H 偏弱，且信息来源单薄：这是一条 X 帖子，没有基准测试、样本量或控制实验，所以留在 all 而非 featured。

一句话点评

正文没提供具体对比细节，只有标题。这条更像一个待展开的引子，先别当结论看。

锐评

这条信息只给了一个标题，没有展开任何具体对比。从标题看，作者想讨论 Claude Code、Codex 这类编程助手在“Skills”机制上的设计差异。Skills 可以理解为给模型装上的可复用能力模块，比如读写文件、调 API、跑终端命令。不同产品对 Skills 的定义、触发方式和权限控制差别很大，直接影响 agent 在真实项目里是帮手还是捣乱。但正文完全缺失，我们不知道作者具体指哪几个差异点、有没有实测数据或案例支撑。如果你在选型，建议直接去看各家的 Skills 文档和社区踩坑记录，别靠这个标题做判断。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

18:35

56d ago

● P1X · @claudeai· x-apiEN18:35 · 04·23

Claude 新增十多个消费应用连接功能

Claude 官方发了一条产品更新，说现在能连接更多非工作类 App，列了 TripAdvisor、Booking.com、Resy、Instacart、Spotify、Audible、AllTrails、Thumbtack、TurboTax 等至少 10 个。正文没披露具体怎么连、能执行哪些操作、支持哪些地区、权限范围多大、什么时候推完。我会先打个折...

#Tools#Agent#Anthropic#Tripadvisor

精选理由

这是 Anthropic 官方产品更新，HKR 三项都踩中了。钩子是 Claude 从办公工具杀进生活消费场景，知识点是新增至少 10 个消费 App 连接器但操作细节和上线范围全都没说，关联点在于它把“助手能不能代办个人事务”这个平台级问题摆上了台面。分数维持 75，因为目前只是列了 App 名字，正文没给出可执行动作、权限边界、地区限制和发布时间，我会先打个折，等后续披露再考虑上调。

一句话点评

Claude 开始直接连你的 Spotify、Uber Eats 和报税软件了，但先别急着把生活全交给它——手机端还在测试，正文也没说清楚它读你数据到底有多深。

锐评

Anthropic 给 Claude 加上了十多个消费类应用的连接功能，包括 Spotify、Uber Eats、Tripadvisor、Booking、Resy 和 TurboTax 这些日常高频工具。这意味着你可以直接让 Claude 帮你放歌、订餐、找餐厅或者处理税务，不用再在几个 App 之间来回跳。从产品思路上看，这是在把 AI 助手从“聊天工具”往“生活操作系统”推。但正文有几个关键信息没交代：一是连接后 Claude 能读取你多少历史数据，是只拿当前指令相关的，还是会把你的播放记录、消费账单全扫一遍；二是手机端明确标了“beta”，稳定性、权限控制都还没经过大规模验证。另外，TurboTax 这种涉及敏感财务信息的应用也进了名单，Anthropic 在文章里没展开讲数据隔离和隐私保护的具体方案。这点对从业者来说比功能本身更值得盯——功能铺得快不稀奇，权限边界划得清不清才是后面会不会翻车的关键。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

18:06

56d ago

● P1X · @OpenAI· x-apiEN18:06 · 04·23

OpenAI发布GPT-5.5模型，已在ChatGPT和API中可用

OpenAI 在 X 上宣布推出 GPT-5.5，已经接入 ChatGPT 和 Codex。官方说法是它面向实际工作和 agent 场景，能理解复杂目标、调用工具、自我检查，把更多任务从头跑到尾。我会先打个折：正文没披露参数量、价格、上下文窗口和任何基准测试结果，所以现在只能看到一句“新的智能形态”和“新的干活方式”，具体强在哪、贵不贵、跑多快都还不知道。

#Agent#Tools#Reasoning#OpenAI

精选理由

OpenAI 在 ChatGPT 和 Codex 上线 GPT-5.5，属于当天必须覆盖的发布。HKR 三项全中：新模型发布本身就有话题性，正文给出了 agent 工作流和工具调用的具体方向，对日常做 AI 应用的人有直接影响。我会先打个折——参数、价格、上下文窗口和基准分正文都没披露，所以重要性停在 92，不往上拉。真正值得盯的是落地链路，不是标题里的“新一类智能”。

一句话点评

OpenAI 发了 GPT-5.5，主要提升在干活效率上：写代码、操作软件、做研究时更少返工，而且速度没降。但官方还没给 API 具体上线时间，只说“很快”。

锐评

GPT-5.5 这次最大的变化不是单纯变聪明，而是干活更省步骤。官方说它在完成同样任务时用的 token 比前代少，在 Artificial Analysis 的编码指数上，达到顶尖水平但成本只有竞品的一半——这个数字挺实在，直接关系到用 API 的成本。在 Terminal-Bench 2.0 这种考命令行规划能力的测试上拿了 82.7%，比 GPT-5.4 高了 7 个多点，说明它在需要多步操作、调用工具的场景里确实更稳了。不过得注意，这些评测大部分是 OpenAI 自己选的基准，像 Expert-SWE 还是内部测试集，外部没法复现。正文里引用了早期测试者的正面评价，但没给出负面反馈或失败案例，这点信息不对称。另外，GPT-5.5 Pro 的评测数据只给了 BrowseComp 和 FrontierMath 两项，其他格子全是空的，不知道是没测完还是结果不好看。API 的具体上线时间和定价也没公布，想接入的开发者还得再等等。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

100

SCORE

H1·K1·R1

12:54

56d ago

FEATUREDX · @op7418（歸藏）· x-apiZH12:54 · 04·23

Claude 桌面端能接第三方模型了，走开发者模式填 API 就行

有人在 Claude 桌面端发现一个入口：不登录状态下，从 Help → Troubleshooting 开启开发者模式，重启后右上角会多出 Developer 选项，里面可以配置第三方推理服务的 API 地址和 Key，点 Apply locally 就能用。这意味着客户端可以直接把请求打到别的模型或自建的 Claude API 上，不经过 Anth...

#Tools#Inference-opt#Anthropic#Claude

精选理由

我会先打个折：这只是单条 X 帖子，Anthropic 没官宣支持范围、模型白名单或后续政策，所以分数停在 74。但 HKR 三项都踩中了——入口够隐蔽、路径可复现、话题直接打在客户端锁定上。正文没披露 Anthropic 是否默许，这点先别太激动，但如果是真的，等于 Claude 桌面端自己把围墙拆了个口子。

一句话点评

Claude 桌面端能接第三方模型了，但正文没披露具体支持了哪些模型、怎么接入，先别太激动。

锐评

这条消息说 Claude 桌面客户端现在可以调用第三方模型了，听起来像是 Anthropic 在客户端层面放开了模型选择。但信息来源只有一条个人博主的标题，正文是空的，所以关键信息全是缺口：到底支持了哪些模型，是 API 接入还是本地部署，是否需要付费，延迟和稳定性怎么样，全都没说。如果属实，这对习惯用 Claude 桌面端但想切模型的人来说是个实用更新，相当于不用换软件就能换引擎。但因为没有官方公告或截图佐证，目前只能当传闻看。我会先打个折，等有实测或官方说明再判断实际价值。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

04:33

56d ago

FEATUREDX · @dotey（宝玉）· x-apiZH04:33 · 04·23

OpenAI 把 ChatGPT 塞进 Google Sheets，说人话就能建表、填公式、做分析

OpenAI 正式发布了 ChatGPT 的 Google Sheets 插件，可以从 Google Workspace Marketplace 安装。核心卖点就是“不用学公式，说人话就行”：你告诉它要做什么，它帮你建表、填数据、写公式、做分析。官方举的例子从婚礼策划到咖啡店商业计划都有。今年 3 月 OpenAI 先出了 Excel 测试版，现在 S...

#Tools#Agent#OpenAI#Google

精选理由

HKR-H 成立，因为钩子是 ChatGPT 出现在 Google Sheets 里。HKR-K 和 HKR-R 也成立，分别靠 Marketplace 上架信息和入口迁移的敏感点。但全文只有单一来源，且没披露订阅要求和具体上线时间，所以没到 featured 级别。

一句话点评

ChatGPT 直接嵌进 Google Sheets 了，不用切窗口就能让 AI 帮你建表、改数据、做分析。

锐评

OpenAI 把 ChatGPT 做成了 Google Sheets 插件，用户可以在单元格里用自然语言直接操作表格。这相当于给电子表格加了一个对话式助手，省去了在聊天窗口和表格之间来回粘贴的步骤。目前公开信息只有标题和简短摘要，正文内容缺失。具体功能边界不清楚：是只能处理当前工作表，还是能跨表引用？对复杂公式和透视表的支持到什么程度？响应延迟和单次处理的数据量上限也没提。另外，插件是否需要付费账号、数据会不会离开表格环境传给 OpenAI 服务器，这些安全和成本问题都还没看到说明。我会先打个折看待这条消息。功能听起来实用，但缺少实测细节和限制条件，实际体验可能比标题描述的粗糙。等有上手评测或官方文档再判断它到底能省多少事。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:10

57d ago

FEATUREDX · @op7418（歸藏）· x-apiZH02:10 · 04·23

把本地 Agent 和线上 Agent 拉到一个群里，扫个码就能分享协作

Bloome 这个产品让你把本地 Agent（比如龙虾、Claude Code、CodeX）和线上 Agent 拉进同一个群聊，然后生成一个二维码分享给朋友，对方扫码就能让他的 Agent 也进群协作。系统自带一个云端 Agent，电脑离线时它能处理轻量任务（正文没披露具体能处理多重的任务），电脑上线后它还能 @ 本地 Agent 出来干活。添加本地 ...

#Agent#Tools#Bloome#Claude Code

精选理由

H 和 K 都成立：Bloome 让本地、线上和 1 个云端 Agent 同群聊，还支持二维码分享和离线/在线切换。R 弱是因为没给价格、权限、并发和采用数据，所以只能算一个 niche 产品更新。

一句话点评

标题像一句观察，不是一条新闻。正文没提供任何具体案例、产品名或数据，只能当观点看。

锐评

这条信息更像一个观点碎片，而不是一条有据可查的新闻。它抛出一个判断：当 Agent 能被分享，协作就会自然发生。但正文是空的，我们不知道这个判断来自哪个产品、哪篇论文，还是作者的推演。对从业者来说，这个方向本身不新鲜。把 Agent 当成可调用的服务或链接发给同事，确实可能降低协作门槛，但真正的难点在于权限控制、上下文同步和任务交接的可靠性。这些正文都没提。我会先打个折：想法方向对，但缺验证。如果后续有具体产品（比如某个平台上线了 Agent 分享功能）或实验数据，才值得认真讨论。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

02:02

57d ago

X · @op7418（歸藏）· x-apiZH02:02 · 04·23

Codepilot 0.53.0 接入了 GPT Image 2.0 图像模型

Codepilot 0.53.0 更新后支持 GPT Image 2.0 图像模型，官方和三方渠道都能用。另外 Nano Banana 2 也可以通过三方调用了。正文没披露 API 参数、定价、速率限制或上线时间，关键看三方路由会不会改变成本和配额结构。

#Multimodal#Vision#Tools#Codepilot

精选理由

一个常规的工具兼容更新。HKR-K 靠一条具体新事实通过：Codepilot 0.53.0 新增 GPT Image 2.0，并提到官方和第三方接入都可用；但 HKR-H/R 偏弱，因为价格、限制和 API 细节都没披露，所以留在 all。

一句话点评

短评：Codepilot 0.53.0 接入了 GPT Image 2.0，但正文没披露具体效果和成本，先别太激动。点评：Codepilot 0.53.0 更新后直接支持 GPT Image 2.0 图像模型，相当于在代码补全工具里塞了个画图入口。但正文是空的，来源只有一条 RSS 摘要，没说明调用方式、生成速度、定价或是否支持批量出图。GPT Image 2.0 本身画质和指令跟随比 ...

锐评

Codepilot 0.53.0 已接入 GPT Image 2.0，正文只给出“官方和三方都可以”这一个条件。我的判断很直接：这条先看分发层，不先看模型层。图像模型接进去不稀奇，稀奇的是同一前端同时给官方与第三方通路，还顺手把 Nano Banana 2 也挂上第三方。这种更新通常不是在卷产品定义，而是在卷可用性、配额弹性和结算路径。我对这类“已支持某模型”的公告一向比较保守。原因很简单，文章没披露 API 参数，没披露价格，没披露速率限制，也没披露图像尺寸、编辑模式、批量任务、失败重试这些实际决定体验的东西。没有这些信息，你没法判断它只是把模型名加进下拉框，还是做了完整适配。图像产品里，这个差别很大。只支持单轮出图，和支持参考图编辑、局部重绘、一致性角色、多图条件输入，工程价值完全不是一个量级。说真的，我更在意“第三方可用”这句。过去一年不少 AI IDE、聚合器、模型市场都在走这条路：同一个 UI，后面挂多家 provider，把官方 API、代理渠道、区域转售混在一起给用户选。这样做的好处很现实。第一是可用区更灵活，某家限流时能绕过去。第二是账单更好看，尤其是面对中小团队，月费产品比按 token 或按图计费更容易卖。第三是地域问题能被部分中间层吸收。我没看到 Codepilot 这次披露任何成本结构，所以现在还不能下结论说它一定更便宜；但只要第三方通路存在，价格和配额就不再只由模型原厂决定，这才是这条更新的交易含义。外部参照也很清楚。2024 到 2025 年，代码工具和多模型前端普遍从“绑定单一模型”转向“绑定路由能力”。Cursor、OpenRouter、一批国内聚合平台都吃到过这个红利：用户表面上在挑模型，平台实际上在卖可得性和切换成本。我印象里，很多团队最后留下来的原因不是某个模型绝对更强，而是故障时还能切、超额时还能补、报销时还能统一走一张单。我没核实 Codepilot 现在的后端结构，但如果它也往这个方向走，那它在卖的就不是 GPT Image 2.0 本身，而是“你不用自己管接哪家”。我也有个明确的保留意见：图像模型一旦走第三方，能力一致性经常出问题。安全过滤、参数暴露、种子控制、返回格式、生成时延，都会因为中间层再包一层而变化。很多聚合接入会把原厂特性压平，最后只剩“能出图”，高级编辑能力却被吃掉。Nano Banana 2 现在也能走第三方，听着方便，但如果第三方没把上下文图、风格保持、批处理接口对齐好，用户看到的只是“能调用”，不是“能稳定工作”。这类差异，标题从来不会告诉你。所以这条我不会高估。标题已经给出两件事：Codepilot 0.53.0 支持 GPT Image 2.0，且官方与第三方都可接；正文没有给出四个关键事实：价格、限制、参数、质量对齐。没有这四项，它还只是渠道层更新，不足以证明 Codepilot 在图像工作流上形成了新优势。要让我改观，至少得看到一组可复现信息：同一 prompt 下官方与第三方的出图耗时、失败率、单图成本，外加是否支持编辑类接口。没有这些，先把它当接入面扩张，别急着当产品跃迁。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

SCORE

H0·K1·R0

2026-04-22 · 星期三2026年4月22日

22:05

57d ago

FEATUREDX · @dotey（宝玉）· x-apiZH22:05 · 04·22

陈天桥借Manus谈跨境AI公司：一次性搬家不是真解决方案

陈天桥发推文，拿Manus从北京搬到新加坡的事，聊在监管、地缘政治和公众审视都在快速变化的时代，跨多个司法管辖区建一家AI公司到底需要什么。他的核心判断：任何一次性的转移都不是真正的解决方案。他认为真正重要的是持续调整组织结构、边界和责任，让合规内置于设计里，而不是靠架构腾挪“洗干净”自己。他用自己的公司举例——MiroMind总部在硅谷红木城，团队8...

#Chen Tianqiao#Manus#MiroMind#Commentary

精选理由

这是一条行业评论，有具体事件（Manus 迁址）和人物（陈天桥），切入点是跨境 AI 公司治理这个实操问题。H 和 R 都成立：话题有钩子，判断也打到痛点上。但 K 弱，因为正文没给出合规步骤、组织设计或运营数据，只有论点。

一句话点评

陈天桥借 Manus 的事发推，讨论跨司法管辖区建 AI 公司要面对什么。正文没披露，只有标题，信息量很薄。

锐评

这条推文本身不是产品发布或技术突破，更像一个老江湖的行业观察。陈天桥拿 Manus 当引子，核心是想说：在监管、地缘政治和公众情绪都快速变化的今天，跨多个司法管辖区建一家 AI 公司，已经不是单纯的技术或商业问题。标题点出了三个变量——监管、地缘、公众审视，但没有展开具体案例或数据。目前能看到的只有推文标题，正文内容缺失。我们不知道陈天桥具体提到了哪些司法管辖区的冲突，也不知道他给了什么建议或判断。Manus 本身的情况也没在现有信息里交代。对从业者来说，这个话题确实踩中了痛点，但这条推文目前只能当一个引子看。如果后续有全文或他本人的详细阐述，才值得认真拆解。现在先别急着下结论，信息缺口太大。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

21:38

57d ago

X · @dotey（宝玉）· x-apiZH21:38 · 04·22

GPT Image 2 提示词模板：一张图融合两个时代

这个帖子分享了一个 GPT Image 2 的提示词模板，用来生成左右分屏、无缝融合两个时代的照片。默认时间跨度约100年，示例是纽约时代广场，左边1920年代，右边今天，比例4:3。模板里把场景、时代A、时代B设成了变量，可以复用。核心要求是中间不能有硬分割线，两个时代的人、建筑、道具要自然互动，比如旧时代的人惊讶地看着现代人的手机。帖子没披露模型规...

#Multimodal#Tools#Commentary

精选理由

HKR-H和HKR-K通过：百年分屏对比有钩子，模板给出了可复用的提示词结构。HKR-R不通过：没有工作流、成本、安全或模型边界含义；有用的提示词技巧，但不是有意义的行业更新。

一句话点评

GPT Image 2 的提示词被扒出来了，但正文没给任何细节，只有标题。目前只能确认有人在逆向或分享生成图片的 prompt，具体效果、成本、是否官方都没提。如果是社区玩法，参考价值有限；如果是官方泄露，那才值得跟进。先别急着套用，等更多验证。

锐评

这条帖子放出 1 个 GPT Image 2 模板，核心不是审美词，而是它把同一场景的跨时代生成拆成了 4 组可控变量：场景、时代 A、时代 B、中心融合机制。这个拆法很实用，因为多数“复古对比图”提示词只会堆形容词，最后得到的是两张并排海报，不是一个能批量复用的生成结构。我对这类模板一向有个判断：只要 prompt 开始显式约束服饰、道具、建筑材料、人物动作，图像模型就从“出一张好看的图”转向“执行一个镜头设计”。这件事比帖子里的 cinematic、8k、photorealistic 这些词重要得多。后者基本已经成了 2025 年后图像社区的默认噪声词，很多模型加不加都差不多；前者才决定你能不能稳定复现“1920 年代纽约”和“今天的纽约”同时出现，而且彼此有互动。这里最聪明的一笔，是中心区域不许硬切，还要求跨时代人物互看、穿行、受惊。这会逼模型去做关系建模，不只是做左右两块素材拼接。我跟你说，这种模板的价值更像是一个小型 scene graph，只是用自然语言写出来了。过去一年里，Midjourney、Flux 系和 OpenAI 图像模型最明显的进步，不只是清晰度，而是对多主体、多属性、空间过渡的服从度高了一截。早一代模型看到“左边 1920s、右边 present day、中心自然融合”，常见结果是中心直接糊掉，或者把 LED 屏和黄包车乱炖。现在能不能做得像样，关键就在这种变量拆解有没有足够细。这个模板把建筑、材料、载具、手持物、发型配饰都点出来，已经接近 production prompt 的写法了。但我对帖子叙事也有保留。正文没披露模型版本细节、价格、生成张数、失败率，也没给 seed、负面约束、迭代次数。没有这些信息，你很难判断这是“模板本身强”，还是“作者挑中了 1 张最好看的结果”。图像社区这类分享最常见的问题，就是把筛选后的单张样本包装成稳定能力。我自己没看到批量测试，所以不会把它直接当成可靠工作流。要验证很简单：把 Scene 从 Times Square 换成上海外滩、东京涩谷、柏林墙旧址，再把时代差从 100 年改成 30 年或 300 年，看中心融合是否还稳。过不了这个测试，它就只是一个适合社媒传播的 prompt，不是可迁移的方法。还有一点我不太买账：historically accurate 这种要求写进 prompt，不等于模型真的有历史准确性。训练语料里最容易学到的是大众刻板印象，不是严肃史实。1920 年代时报广场该出现什么招牌、车辆比例、街面密度，模型未必知道，很多时候只是在生成“大家以为的 1920s 纽约”。这一点其实和视频生成里“documentary style”很像，风格能到位，史实常常飘。做内容创作没问题，做教育或品牌项目就得有人审图。所以这条我会把它看成一个 prompt engineering 小样板，不是模型能力证明。它说明的不是 GPT Image 2 突然会“穿越叙事”了，而是好用的图像提示词开始从形容词堆砌，转向结构化约束。这个方向我认可。标题给了模板，正文没给稳定性证据；先别把一张好图误判成一个成熟能力。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

21:29

57d ago

X · @dotey（宝玉）· x-apiZH21:29 · 04·22

一个寓言讲透 Agent Harness：模型是脑子，外面那套身体才是关键

这篇用寓言讲 Agent Harness 的文章很直观。故事里齐国和楚国都有同一个聪明先生（LLM），但齐国只凿洞喊话，楚国却给先生配了文吏（感知层）、执行队（行动层）、校验官（容错层）和记录官（记忆层）。结果楚国先生能解决实际问题，齐国先生却频频翻车。核心判断：模型能力是地板，Harness 质量才是天花板。同一个模型，套上不同的 Harness，表...

#Agent#Tools#Memory#Shen Kuo

精选理由

HKR-H 靠寓言角度能吸引点击，但 HKR-K 只是把 Harness 分层复述了一遍，没有数字、可复现的设置或一手测试。硬性排除规则“零来源”生效，所以重要性上限卡在 40 以下，层级定为 excluded。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

20:19

57d ago

FEATUREDX · @claudeai· x-apiEN20:19 · 04·22

Claude Cowork 现在能直接在对话里生成可交互的图表了

Anthropic 给 Claude Cowork 加上了交互式图表和示意图功能，目前是 beta 版，所有付费套餐都能用。正文只说了这两点，没提支持哪些图表格式、怎么编辑、什么时候全量放开，也没说权限上有没有限制。

#Tools#Anthropic#Claude#Product update

精选理由

这条放在 featured 低段，靠的是 Anthropic 的信源分量和 Claude 用户群匹配度。钩子够具体——交互式图表直接进协作界面，不是画饼；知识增量也有，beta 覆盖所有付费方案这点是实打实的新信息。但我会先打个折：正文没交代怎么生成、支持哪些图表格式、能不能在协作流里直接改，这些缺口让讨论深度上不去，所以 R 分弱。整体判断是值得从业者扫一眼，但暂时没法展开聊。

一句话点评

Claude Cowork 现在能直接生成可交互图表了，但官方只发了标题，没给细节。

锐评

Anthropic 给 Claude 的协作模式 Cowork 加了一个新能力：生成可交互的图表和示意图。这不再是以前那种静态截图，而是你可以在对话里直接拖拽、缩放、调整参数的那种动态图表。对做数据分析、写报告的人来说，省掉了把数据导出再丢进其他工具画图的步骤。但这次的信息量非常有限。官方只在 X 上发了个标题，没有演示视频，没有说明支持哪些图表类型，也没提交互能做到什么程度——是只能缩放，还是能实时改数据源重新渲染？这些都没说。另外，这个功能是只在 Cowork 模式下有，还是普通对话也能用，正文也没披露。我会先打个折：功能方向是对的，但实际体验要看它对复杂数据和中文图表的支持怎么样。等有上手案例再判断值不值得切过去用。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

16:57

57d ago

X · @Yuchenj_UW· x-apiMULTI16:57 · 04·22

Anthropic 该花 100 亿美元找 SpaceX 买/租 GPU

华盛顿大学助理教授 Yuchenj 认为，Anthropic 算力短缺已经拖累了它的编程产品竞争。证据是：Claude Code 从 Pro 套餐里撤掉、API 限频更严、封杀第三方应用、对外沟通混乱。如果算力够，Anthropic 可能早就赢了 AI 编程战。正文没披露任何实际 GPU 交易、算力数字或 Anthropic 的回应。

#Code#Inference-opt#Anthropic#SpaceX

精选理由

HKR-H和HKR-R成立：100亿美元找SpaceX买GPU这个点子够劲爆，而且算力卡住Claude Code确实戳中行业神经。HKR-K不成立：帖子只有四个抱怨，没有库存、交易、财务或公司回应，属于硬排除的零信源内容。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

08:45

57d ago

X · @op7418（歸藏）· x-apiZH08:45 · 04·22

GPT-Image-2.0 + Seedance 2.0 跑出《黑神话：林冲》游戏演示，UI 和台词全动

博主用 GPT-Image-2.0 和 Seedance 2.0 生成了《黑神话：林冲》的游戏演示，声称所有 UI 元素都是动画且带台词。效果看起来不错，但画面有明显涂抹感。正文只提了模型名和主观感受，没交代运行时长、分辨率、工作流步骤，也没说后期人工修了多少。别急着当成品看——确认的事实是演示感很强，但离可复现的技术规格还差得远。

#Multimodal#Vision#Commentary

精选理由

标题党成分重，实际信息缺口大：没披露生成时长、分辨率、工作流或人工后期比例，目前只能确认演示感强，不可复现。HKR-H靠游戏演示角度能吸引点击，但K和R都不达标，所以归为all层级低价值内容，不升featured。

一句话点评

《黑神话：林冲》又流出实机演示，画面和动作效果确实惊艳，但正文没披露任何技术细节或来源。目前只有一条来源，信息缺口大，建议等官方或更多信源验证后再下判断。

锐评

发帖者用了 GPT-Image-2.0 和 Seedance 2.0 跑出 1 条《黑神话：林冲》演示，但正文没给生成时长、分辨率、镜头数、后期占比。这条我先按“好看的 proof-of-concept”看，不按“游戏内容生产链已经跑通”看。差别很大。前者说明模型审美和镜头连续性在进步，后者要看 assets consistency、UI 状态管理、分镜可控性、返工成本，原帖一个都没交代。我对“所有交互 UI 全都是动的，而且还有台词”这句会先打个问号。因为动态 UI 最容易被短视频错觉放大：你可以先出一段主画面，再叠几层 motion graphic，观感就很像可交互系统。问题在于，这些 UI 是一次生成绑定在场景里的，还是后面单独合成的？台词是角色口型驱动，还是音频后配？原帖没说。标题已经给出效果感，正文没披露制作链路，这种素材没法外推成“某模型已经能稳定做游戏 PV”。说真的，这类视频最近一年越来越多，路径也差不多：先用图像模型定风格，再用视频模型补运动，最后靠剪辑把不稳定处藏掉。去年 Runway、Pika、Luma 那波 demo 也是这个套路；今年很多团队把 Kling、Vidu、即梦、Seedance 接进来，成片观感确实比 2024 年强一截，但可复现性还是老问题。我自己没跑过这条同款 workflow，不过按行业常见做法，越是“像成品”的 20 秒片子，越要问镜头失败了多少次、人工修了多少层。没这些数字，判断不了生产价值。我还有一点怀疑：这条借了《黑神话》式视觉语汇，天然会抬高观众容忍度。强美术风格本来就能遮掉一部分时序错误和材质涂抹感，所以“我真看不出来”不等于模型已经接近可上线资产标准。游戏团队真要用，至少得补两类信息：一类是成本，单条 30 秒要跑多久、多少钱、多少轮返工；另一类是一致性，同一角色换 5 个镜头后脸、甲胄、武器会不会漂。原帖都没有。我的判断很直接：这条证明了 AI 视频很会做“像游戏宣传片”的幻觉，没证明它已经进入游戏工业化流程。要让我改观，发帖者至少得放出完整 prompt、shot list、分辨率、生成轮次，外加未剪版本。现在这条，够吸睛，不够立论。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

07:33

57d ago

X · @op7418（歸藏）· x-apiZH07:33 · 04·22

Seedance 2.0 把 GPT 生成的游戏截图做成了可玩 Demo

有人用 Seedance 2.0 把 GPT Image 2 生成的一张 ARPG 游戏截图（《金瓶梅》），直接变成了带 UI 交互和场景切换的动态演示。视频里能看到两个画面之间的衔接，但正文没披露具体用了什么工作流、提示词、做了多久、以及用户能控制到什么程度。真正的看点不是标题的噱头，而是“从一张静态图到可交互 Demo”这条管线已经能跑通了。

#Vision#Multimodal#Tools#Commentary

精选理由

H 和 R 成立，因为帖子把 GPT Image 2 的静态图做成了带 UI 和转场的 ARPG 演示，视觉上很抓人，而且这条拼接链路是游戏和产品团队正在关注的方向。K 不成立：提示词、时长、分镜控制方式、可复现步骤全没披露，所以这条归入 all 层级。

一句话点评

标题党，正文没披露任何具体信息。从标题看可能是某个AI应用或游戏玩法有了突破，但缺乏细节无法判断真假。建议等更多信源验证，别急着激动。

锐评

帖子给出的事实很少：创作者把 Seedance 2.0 和 GPT Image 2 接在一起，做出了一个 ARPG《金瓶梅》的动态演示，还补了 UI 交互和两段画面衔接。问题也很直接：正文没有流程，没有提示词，没有镜头控制，没有时长，没有分层素材，没有任何可复现条件。只看这些信息，我最多承认它做出了“像游戏的短视频”，还不能直接叫“能玩”。我对这类演示一直卡得很细，因为过去一年里，很多“可交互”“可游戏化”视频，拆开看其实只是三件事：静态图一致性、镜头过渡、再加一层后期 UI。Runway、Pika、Luma 那波 demo 就反复出现过这个问题：观看时像 prototype，落到工程上只是 linear clip。Google 当时做 Genie 一类世界模型，卖点是从视频里学出可响应环境；这一条如果成立，最少要看到输入如何改变状态、状态如何影响下一帧。这个帖子没有给。有意思的地方不在题材，也不在情绪化标题，在于它暴露出一条越来越短的拼接链：GPT Image 2 负责把美术风格定住，Seedance 2.0 负责把帧间运动和镜头衔接补起来，外面再套一层 UI，就能产出一个足够像“游戏开场演示”的东西。对独立团队和工作室，这条链路是有价值的，因为它把“立项视频”成本继续往下打。以前你要概念图、分镜、动效、剪辑四套人，现在两三个工具就能先把气质做出来。但我还是要泼点冷水：从“像能玩”到“真能玩”，中间隔着一整层系统。至少要有状态切换、碰撞或导航规则、角色控制映射、失败条件、资源加载方式。哪怕是最简陋的交互小说，也得说明输入和输出怎么闭环。视频里有 UI，不等于有游戏循环；有转场，不等于有世界状态。这个差别，对做产品的人很关键，对投融资判断也很关键。我自己更愿意把这条看成 pre-production 工具链的进展，不是游戏生成已经跨线。外部参照也差不多是这个方向：去年不少团队用 Midjourney 或 GPT Image 做 key art，再用视频模型补 trailer，最后拿去测市场反馈。好用的是 pitching，不是 shipping。除非作者后续放出可操作 demo、输入响应录屏，或者公开从图像到交互脚本的链路，不然这条最多说明“AI 已经很会伪装成可玩内容”，还说明不了“AI 已经把游戏 runtime 做出来了”。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

02:43

57d ago

X · @dotey（宝玉）· x-apiZH02:43 · 04·22

用户分享GPT Image 2生成日式少年漫画提示词

X 用户 dotey 分享了一个 GPT Image 2 的提示词，用来生成一张彩色少年漫画页面。提示词要求画主角发现一支叫“Quill of GPT Image”的魔法笔，笔上要有 OpenAI 标志，页面要像拍下来的实体漫画书，比例是 1440x2560 竖版。正文没给出生成结果，也没说模型设置或多次生成是否稳定，所以效果和一致性未知。

#Multimodal#Vision#OpenAI#Commentary

精选理由

这是一条单纯的GPT Image 2提示词分享，没有输出、参数、复现或一致性证据。重要性28分，低于40分且无行业切入点，因此归为excluded。

一句话点评

有人分享了用 GPT Image 2 生成日式少年漫画和中国漫画的提示词，目前只有标题，正文没给具体 prompt 内容。如果提示词真能稳定输出特定画风，对做漫画或视觉内容的人挺实用，但效果和可控性还得实测。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

SCORE

H0·K0·R0

02:18

58d ago

X · @dotey（宝玉）· x-apiZH02:18 · 04·22

用户分享GPT Image 2杂志拼贴提示词

dotey 发了一条 GPT Image 2 的提示词，要求生成一张 4:5 竖版杂志拼贴，中心标题固定为“Create Everything at Once”。画面要包含科学图表、老地图、UI 截图、漫画分镜、工程蓝图等，布局不能是网格，颜色要鲜艳。这条帖子没提用了哪个模型版本、生成参数或实际出图效果。可复用的是提示词结构，不是产品更新。

#Multimodal#Vision#Tools#GPT Image 2

精选理由

这是一段提示词片段，不是产品更新或经过验证的工作流。HKR-H、HKR-K、HKR-R 三项都不满足：没有展示输出，没有模型设置或结果，也没有明确的行业痛点，因此排除。

一句话点评

用户分享了让 GPT Image 2 生成杂志拼贴风的提示词。正文没给具体词或效果图，所以只能当个线索看。如果你正好想试这种风格，可以自己去搜原推或社区帖子。目前信息量约等于零，别急着当教程用。

HKR 分解

hook —knowledge —resonance —

→ 打开信源

SCORE

H0·K0·R0

01:41

58d ago

X · @dotey（宝玉）· x-apiZH01:41 · 04·22

一个提示词把四季塞进同一张图，GPT Image 2 的玩法

dotey 发了一个 GPT Image 2 的提示词，能让一张图从左到右依次显示冬春夏秋，场景是上海外滩看陆家嘴。提示词要求 8K、电影光效、季节之间没有明显分界线。这只是一个可复用的风格化提示词，不是模型更新。正文没提用了哪个模型版本、生成参数或对比效果，想复现得自己调。

#Multimodal#Tools#GPT Image 2#Shanghai Bund

精选理由

这是一条提示词分享，不是模型、产品或工作流更新。HKR-H靠“四季融一图无分割线”这个具体钩子通过；HKR-K因为版本、参数、失败案例和效果对比全没披露而失败；HKR-R对从业者价值很弱，所以整体定为低价值全量推送。

一句话点评

GPT-4o 原生图像生成功能（GPT Image 2）被网友挖出一条提示词，能在一张图里无缝融合春夏秋冬四个季节，效果像延时摄影。目前只有一条推文在传，来源是个人账号，没有官方文档或评测。正文完全没披露提示词原文、生成耗时、是否需多次抽卡。如果是真的，对做封面图、概念设计的人挺实用，但这点先别太激动——等更多人复现再说。

锐评

这条的核心事实很简单：dotey 发布了 1 条 4:3 四季连续过渡提示词，正文只给场景、风格词和季节顺序，模型版本、采样参数、生成张数、失败率都没披露。我的判断是，这条信息量不在“模型又会了什么”，而在“提示词模板正在变成内容产品”。我一直觉得，图像模型到了 2025 年后半段，很多爆款案例已经不是能力突破，而是把一组稳定出片的约束词打包成可复制格式。这条就很典型：左到右季节顺序、无分割线、电影感光照、8K、高细节纹理，全是为了压住构图漂移和语义断层。问题也在这儿——“8K”“cinematic lighting”这类词，经常更像审美口令，不等于可复现质量。没有 seed、没有对比图、没有多次生成结果，我不买“这条 prompt 本身很强”这个说法，最多只能说它写得完整。文章外的上下文也很清楚。Midjourney 时代就有大量“神级 prompt 包”在卖，真正起作用的通常不是华丽形容词，而是构图约束、镜头语言、主体关系和负面限制。到了 GPT Image 这代，模型的自然语言跟随能力更强，长 prompt 的边际收益其实在下降，结构化约束反而更重要。这条能复用，靠的不是“诗意”，靠的是把一个常见需求拆成了连续构图+时间流动+季节显式排序。我还有个保留意见：上海外滩看陆家嘴这个场景，本身就自带强识别地标，模型更容易维持画面统一。你把 {Scene} 换成室内、人物群像、复杂街景，是否还能稳定做到四季无缝过渡，正文没给证据。只有标题信息和 snippet 时，我会把它看成一个可抄的 prompt scaffold，不会把它当成 GPT Image 2 的能力验证。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

00:45

58d ago

X · @dotey（宝玉）· x-apiZH00:45 · 04·22

GPT Image 2 提示词：四格“Out the Window”办公室梗图

这条推文分享了一个 GPT Image 2 的提示词，用来生成 9:16 的四格“Out the Window”办公室梗图。提示词指定了 4 个角色、4 个场景和双语对话气泡，最后以“Vibe Coding”作为笑点。这不是模型更新，只是公开了一个可复用的提示词，没有输出图、性能细节或发布信息。

#Vision#GPT Image 2#Commentary

精选理由

这不是模型更新，是一个可复用的 GPT Image 2 梗图提示词。HKR-H 靠办公室段子抓人，HKR-R 靠程序员文化共鸣扩散，但 HKR-K 不成立，因为帖子没给图、参数、失败案例或可验证的出图质量。

一句话点评

GPT Image 2 能直接生成“窗外” meme 四格漫画了，输入提示词就出图，省掉手动拼图。但正文完全没披露生成质量、风格一致性、文字渲染能力，也没说是否支持中文 meme。目前只有一条推文截图，样本太少，先别太激动。

锐评

这条帖子只公开了 1 段 GPT Image 2 四格漫画提示词，没有效果图，也没有参数、版本号、生成次数。我的判断很直接：它证明的是社媒上“模板化梗图提示词”还在涨，不证明 GPT Image 2 在漫画一致性上已经稳了。我对这类内容一直有点保留。四格漫画最难的地方，从来不是把台词写进气泡，而是角色跨分镜一致、构图稳定、文字不乱、笑点节奏不塌。正文给了 4 个角色、4 个分镜、9:16 比例和双语文案，这些都属于提示词层的约束；模型有没有按约束执行，完全没展示。连一张输出都没有，你很难判断 GPT Image 2 是一次出图就中过，还是跑了 20 次才挑到能发的版本。回到行业上下文，这种“公开一个长提示词”的传播方式，过去一年已经很常见了。OpenAI 图像模型、Flux 社区、Midjourney 用户都干过同样的事：先用一个熟悉的 meme 模板压低创作门槛，再把模型包装成“会做内容”的工具。问题是，单条 prompt 的复用价值通常没有看起来那么高。模型一改安全策略、字体渲染、长文本跟随，成品就会变；同一条 prompt 在不同日期、不同账号、不同流量负载下，结果都可能漂。这个帖子没给 seed、没给采样条件、没给失败案例，我不太买“可直接复刻”的暗示。还有一点我会多看一眼：它拿“Vibe Coding”做 punchline，说明图像生成的传播已经开始吃 AI 圈内梗，而不是面向泛用户叙事。这对社媒扩散有用，对产品判断没那么有用。你可以把它当成一个 prompt asset，但别当成能力证据。要让我改观，至少得看到同一角色跨 4 格的稳定输出、文字可读率、失败率，或者官方明确这是 GPT Image 2 的哪一版。现在这些，正文都没披露。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

2026-04-21 · 星期二2026年4月21日

23:17

58d ago

X · @dotey（宝玉）· x-apiZH23:17 · 04·21

GPT Image 2 提示词：儿童蜡笔旅行手账插画

这个提示词能让 GPT Image 2 生成一张 9:16 的儿童蜡笔风旅行手账插画，自动根据旅行天数画出路线、地标、美食和手写笔记。如果没写天数，默认按 1 天走。示例输入是“芝加哥 7 日游，英文”。实用点在于它是个可复用的模板，你只需要改三个变量：城市、天数、语言。

#Multimodal#Vision#Tools#Commentary

精选理由

这是一个可复用的 GPT Image 2 提示词模板，不是模型或产品更新。HKR-H/K 靠风格化的钩子和显式变量勉强及格，但 HKR-R 不通过，因为没有对比、失败分析或工作流影响，所以留在低价值区间。

一句话点评

这条分享了一个用 GPT Image 2 生成儿童蜡笔旅行日记插画的提示词。正文没披露提示词具体内容、生成效果或 OpenAI 官方是否已上线该功能。如果是个人测试，效果可能不稳定；如果是官方功能，值得关注。信息缺口大，先别激动。

锐评

这条帖子把 3 个输入变量塞进 1 个图像模板。我的判断是，它更像轻量工作流，不像创意提示词。城市、天数、语言一旦固定，输出就接近一张可批量生产的旅游海报。对做内容的人，这比“蜡笔风”本身更实用。我一直觉得，过去一年图像提示词最稳定的进展，不在风格词堆得多漂亮，而在模板化程度越来越高。Midjourney 时代很多 prompt 还是“多加形容词，赌一次采样”。到 GPT Image 这一代，大家开始把变量、默认值、版式、文案槽位写清楚。这里连“未填天数默认 1 日”都写了，说明作者想要的是可复用性，不是偶然灵感。我对这条的保留也很直接。帖子只给了 prompt，没给成图，也没给失败样例。正文没披露两件关键事实：第一，GPT Image 2 对长文本排版到底稳不稳；第二，自动补出的景点和路线有没有事实错误。做过这类图的人都知道，图像模型最容易翻车的地方，恰好就是多段文字、地图逻辑、城市知识这三项叠在一起。你让它生成 7-Day Chicago 路线，它未必懂“顺路”，更未必懂营业时间、区域距离和游客真实动线。还有一层问题，旅游内容现在已经很卷。只靠“儿童蜡笔风 + 城市路线图”，很快就会同质化。我看着更像社媒增长素材，不像高质量旅行规划工具。拿它做 Pinterest、短视频封面、酒店小红书配图，成立。拿它替代 itinerary 设计，离得还远。说真的，这类模板后面会分出两条线：一条是内容工厂，拼产量；一条是接 API、地图和 POI 数据，拼正确率。这条明显还停在前一条。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

23:09

58d ago

FEATUREDX · @dotey（宝玉）· x-apiZH23:09 · 04·21

dotey 分享 GPT Image 2 提示词用于生成信息图

dotey 分享了一条 GPT Image 2 提示词模板，能把文章内容转成 16:9 的漫画风信息图。提示词要求手绘风格、少量图标或名人元素、输出语言与原文一致，遇到敏感或版权人物就用长得像的替代，不能拒绝生成。正文没披露用了哪个模型版本、生成效果如何，也没有可复现的示例。这只是一个可复用的提示词模板，不是产品更新。

#Multimodal#Tools#GPT Image 2#dotey

精选理由

这是一条可复用的 GPT Image 2 提示词，不是产品或模型更新。HKR-H 和 HKR-K 因为具体的流程和可用约束条件通过，但 HKR-R 不通过，因为它不涉及成本、就业、安全或平台竞争；重要性维持在 60 分出头。

一句话点评

dotey 一口气分享了 5 组 GPT Image 2 的提示词，专门把文章转成卡通、黑板、手绘风信息图，但正文没给任何生成效果截图。

锐评

dotey 这次分享的是一套 GPT Image 2 的提示词模板，覆盖卡通、黑板粉笔、手绘笔记等几种常见信息图风格，主题可以自由替换。对做内容可视化的人来说，这相当于拿到了现成的“配方”，省去了从零调试提示词的时间。不过目前能看到的信息只有标题，正文是空的。提示词具体怎么写的、生成效果稳不稳定、不同主题下会不会翻车，这些关键细节都没披露。另外，GPT Image 2 本身对文字排版的支持一直不太靠谱，信息图里一旦出现大段文字或复杂数据图表，出错率会明显上升。这点先别太激动，等有人跑出实际效果再看值不值得放进工作流。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

22:49

58d ago

X · @dotey（宝玉）· x-apiZH22:49 · 04·21

GPT Image 2 提示词：唐朝贵妇带三个小黄人

这条推文分享了一个 GPT Image 2 的提示词，用来生成一幅 16:9 的工笔画：一位唐朝贵妇坐在木凳上，用吹风机吹头发，脚踩红高跟鞋、穿黑丝；三个小黄人穿着古装仆人服，一个在拉电线，一个在擦鞋，一个在拿手机拍照。背景是松树、竹子和太湖石，右上角有书法和印章。提示词里写了“仿古宣纸纹理、矿物颜料、幽默混搭”等细节。正文没放出生成结果、模型参数或失...

#Vision#Tools#Commentary

精选理由

只有 HKR-H 成立：唐代皇后加小黄人的组合确实有传播点。HKR-K 因为缺少输出、设置和失败案例而不成立，HKR-R 缺乏行业共鸣，所以这只是一个低价值的灵感片段，不值得作为专题报道。

一句话点评

一条展示 GPT-4o 图像生成能力的 prompt 分享，主题是“唐朝女王与她的随从小队”。正文完全缺失，只有标题和来源。无法判断生成效果、风格一致性、人物细节等关键信息。如果只是 prompt 展示，价值有限；若附带实测对比或翻车案例才值得细看。目前只能当个灵感存档，别当评测看。

锐评

这条的关键信息很少：作者公开了 1 段 GPT Image 2 提示词，但正文没放生成结果，也没给 seed、参考图、重试次数和失败样本。没有这些，任何“出图很稳”的判断都立不住。我先把话说死：这不是模型能力突破的证据，这只是一个写得很满的构图脚本。我觉得它有用的地方，在于把五层约束钉在了一起。第一层是画风，工笔、设色、旧宣纸、矿物颜料、题字和印章都写死。第二层是主体动作，唐代贵妇坐木凳、拿吹风机吹头发。第三层是 3 个侍从的分工，拉电线、擦鞋、举手机，各自动作不重叠。第四层是时空冲突，古装场景里塞进手机、吹风机、黑丝袜、红高跟。第五层是画幅，直接卡 16:9。你拿这套骨架去改题材，复用性确实高，因为它在替模型做“镜头调度”。这跟前两年 Midjourney 社区流行的“形容词瀑布”不太一样。我印象里，Midjourney v6 对长提示已经比早期强，但一旦人物数、道具数、动作链同时上来，还是容易串位，鞋子到别人脚上、手机消失、表情跑偏都很常见。OpenAI 这代图像模型如果真能把这种多角色、多道具、跨时代元素一次摆准，价值不在审美，而在可控性。我还没看到这条的输出，所以这一步不能替它下结论。我对这类 viral prompt 还有个保留：写得越细，不代表泛化越强。很多时候它只是把一个随机种子的幸运结果包装成“万能模板”。尤其这里还混了“小黄人”这种强识别 IP，模型会不会触发风格规避、角色改写，正文也没披露。要是换成别的模型，或者把工笔改成浮世绘、把 3 个侍从改成 5 个，稳定性会不会掉，没人知道。所以这帖更像一个提示词结构样本，不是能力评测。你要抄的不是“唐朝贵妇+小黄人”，而是这条把风格、材质、人数、动作、道具、背景、版式逐层锁死的写法。至于 GPT Image 2 到底是不是已经把复杂场景 controllability 做到生产可用，光看这 1 段 prompt，我不买账。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

22:32

58d ago

X · @dotey（宝玉）· x-apiZH22:32 · 04·21

GPT Image 2 提示词：生成公司微缩3D场景，带实时股价

这个帖子分享了一个 GPT Image 2 的提示词模板，输入公司名或股票代码，就能生成一张 45° 俯视的微缩3D场景图，里面会带上指定日期的实时股价数据。模板默认 4:3 比例，日期可以自动取当天，但如果拿不到市场数据会停止生成。注意这不是模型发布，只是一个提示词示例，帖子还贴了一张 Google 的生成图。

#Vision#Tools#Google#Commentary

精选理由

标题写的是 GPT Image 2 Prompt，容易让人以为是模型发布或新功能，但正文只有一段提示词模板，用公司名生成微缩股票场景，并强制校验实时股价。亮点是“图片生成里嵌数据校验”这个思路，但正文没披露任何效果、成本或验证结果，也没有说明这个模板来自哪里、是否官方。信息量太少，不足以支撑一条雷达条目。

一句话点评

GPT Image 2 的一个用户分享的 prompt 示例，用来生成等轴微型股票场景图。目前只有标题和来源，正文没披露任何技术细节或效果对比。如果你在找 GPT-4o 图像生成的实际表现参考，这条信息量几乎为零，先别太激动。

锐评

这条帖子给出的核心事实很简单：作者发布了 1 个 GPT Image 2 提示词模板，并要求在生成前先校验指定日期的股价数据，查不到就停止。我的判断是，这类内容的价值不在“等距微缩 3D”这层审美，而在它把一张图拆成了两段流水线：先取结构化数据，再让模型负责排版和视觉整合。做过多模态产品的人都知道，后一段通常不难，前一段才决定你交付的是作品还是幻觉。我对这条的第一反应是：它暴露了 GPT Image 2 这波实用化的一个常见方向。不是追求更强的纯生成，而是把提示词写成半个程序。这里最关键的句子不是“Cinema 4D”“PBR 材质”“45° 俯视”，而是“先确保准确且最新的股价数据”“如果不可用立即停止”。这其实是在用自然语言补工作流控制。去年到今年，很多团队都在这么干：让模型负责最后一公里，把检索、校验、拒答、格式约束写进 prompt 或 tool policy 里。你拿它做股票海报，和你拿它做地产卡片、电商主图、赛事战报，底层套路是同一套。我还想泼一点冷水。帖子把“实时股价”写得很满，但正文没有披露 GPT Image 2 是否原生接行情工具，也没给任何 API、调用链、失败样例。只有标题和模板时，我不会把这看成能力展示，更不会把它当成可靠的金融可视化方案。只要数据不是外部系统先喂给模型，单靠模型自己“去查”，稳定性就很悬。做过行情产品的人应该很熟：时区、盘前盘后、复权、交易所停牌、节假日，这些坑随便一个都能把图做错。模板里说“指定日期或当前日期”，但没定义是收盘价、日内区间，还是某个时点快照，这个缺口会直接影响可复现性。外部对比也很明显。OpenAI 这一年里图像能力最能打动开发者的，不是单张图更好看，而是文本遵循、版式控制、和工具链拼接更稳。Google Imagen 系列、Flux 那批社区工作流也是一样，大家最后都在比“能不能稳定产出模板化物料”，不是比谁偶尔出一张神图。这个模板正好踩在那个点上：它想把股票信息图做成可复用资产。问题是，真正把它变成产品的门槛不在 prompt，而在数据源、错误处理、以及品牌元素的可控性。比如“公司的标志性建筑”这句就很容易翻车。Google 还算好认，换成没有强视觉锚点的上市公司，模型会开始编。我自己也有个疑虑：这类模板在社媒上很容易被误读成“只要一句 prompt 就能做金融设计自动化”。这个说法我不太买账。模板能提高灵感密度，但生产级交付通常还得补三层东西：第一层是确定的数据 schema，至少要锁定 ticker、market、currency、date、open/high/low/close；第二层是品牌素材白名单，别让模型自由想象总部大楼和产品图标；第三层是失败分支，查不到数据、公司重名、日期非交易日时怎么退回。帖子里唯一触到产品意识的地方，就是“查不到就停止”，这反而比那些华丽风格词更有用。所以这条我会把它看成一个挺典型的信号：图像模型的 prompt engineering，正在从“描述画面”转向“描述流程约束”。它不是新能力发布，正文也没有 benchmark、价格、上下文窗口这些硬信息。你要是做 AI 设计工具，可以借它的结构；你要是想评估 GPT Image 2 的真实上限，这条基本给不了答案。

HKR 分解

hook ✓knowledge ✓resonance —

→ 打开信源

SCORE

H1·K1·R0

22:12

58d ago

X · @dotey（宝玉）· x-apiZH22:12 · 04·21

GPT Image 2 提示词：3D 盲盒风迷你概念店

这条推文分享了一个 GPT Image 2 的提示词模板，用来生成星巴克风格的 3D 迷你概念店。提示词指定了双层店面、大玻璃窗、品牌色装饰、员工制服、街边小人，以及 Cinema 4D 渲染效果。注意，这不是模型更新，只是公开了一个提示词模板，没有透露模型设置、定价或发布时间。

#Multimodal#Starbucks#Commentary

精选理由

只有 H 成立。帖子分享了一条提示词和画幅比，但没披露种子、步数、成本、失败案例或模型对比；这属于审美向的提示词分享，不是模型更新或行业信号。

一句话点评

GPT Image 2 的 3D Q版迷你概念店 prompt 被公开分享，但正文没给任何效果图或实测对比。目前只有一条推文标题，没有样本数、延迟或成本数据，无法判断生成质量或可用性。建议等更多用户实测再下结论。

锐评

帖子只公开了 1 段 Starbucks 微缩店提示词，正文未披露模型版本、采样参数、种子、参考图条件和价格，所以它证明不了 GPT Image 2 有了新能力。我的判断很直接：这类内容的传播价值高，方法价值低。你当然能把品牌名替换成 KFC、Nike、泡泡玛特，但那只是把一套已经在 Midjourney、SDXL 和 Flux 社区跑熟的“品牌 IP + 微缩街景 + C4D 玩具感”模板再搬一次。我对这条叙事不太买账的地方在于，它把“出图风格”包装成了“模型能力”。文案里最具体的条件只有 --ar 2:3 和一串风格词，连最基本的负面约束都没有。没有 seed，你没法复现构图；没有 reference image 或 image weight，你没法稳定品牌识别；没有 batch 对比，你也不知道成功率。过去一年图像社区已经反复验证过：涉及品牌门店、包装外形、人物制服这类多约束场景，决定结果的常常不是一句长 prompt，而是参考图、重绘流程、后处理和筛图成本。我自己没跑过这条 prompt 在 GPT Image 2 上的通过率，但只看文本，复现稳定性大概率一般。外部参照也很清楚。Midjourney V6 那波最火的“isometric store / toy diorama / blind box city”提示词，早就把这套视觉语法卷烂了；Flux 社区后来把 LoRA、品牌元素和 C4D 质感再往前推了一步。放到 2026 年，这种帖子能吸引眼球，是因为它把商业品牌和玩具化视觉缝得很顺，不是因为它给了新控制手段。要是作者想证明 GPT Image 2 真有优势，至少该给 4 组信息：同 prompt 多次采样结果、品牌一致性、文字渲染情况、和 Midjourney/Flux 的并排对比。现在这些都没有，所以我只会把它当灵感卡片，不会当工作流模板。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

19:22

58d ago

● P1X · @OpenAI· x-apiEN19:22 · 04·21

OpenAI 发布 ChatGPT Images 2.0 图像生成模型

OpenAI 在 X 上官宣了 ChatGPT Images 2.0，定位是能处理复杂视觉任务、出图直接可用的图像模型。帖子提到三点升级：编辑更精细、版式更丰富，以及加入了“思考级智能”，但没解释这具体指什么能力。视频演示看起来效果不错，不过正文没披露模型规模、定价、延迟和推送范围，我会先打个折——等看到实测和成本再说。

#Vision#Multimodal#Tools#OpenAI

精选理由

OpenAI 官方发的帖文，信源权威性没问题，加上“Images 2.0”这个名头，话题性和行业影响都够，所以 H 和 R 都给了。但我把分压在 featured 门槛附近，因为这条帖文信息量太薄：没模型细节、没定价、没延迟、没基准测试、也没说清楚谁现在能用，K 完全站不住。真正值得盯的是可编辑性和版式控制这两点，但光靠这条帖文还远不到能复现的程度，先打个折观望。

一句话点评

OpenAI 发了新图像模型 Images 2.0，能上网搜资料再画图，多语言文字渲染进步很大，但官方没给技术报告和对比数据。

锐评

这次更新最实在的进步是两件事：一是模型能直接联网抓信息来生成图片，比如你让它画一张“今天纽约天气的漫画”，它会先去查天气再画，不用你手动喂数据。二是多语言文字渲染终于像样了，官方展示的韩文、日文、中文海报和漫画里，文字基本没有乱码或拼写错误，这对做设计、广告的人来说是个实打实的生产力提升。不过官方这篇发布基本是产品宣传，没给任何技术细节。模型参数量、训练数据、推理延迟、和 DALL·E 3 或 Midjourney 的对比分数全都没提。展示的样图都是精选过的，实际用起来在复杂场景、小众语言上会不会翻车还不清楚。另外“对所有 ChatGPT 和 Codex 用户开放”这句话有点模糊，免费用户能用多少额度、生成速度怎么样，正文都没交代。总的来说，联网能力和多语言文字是肉眼可见的进步，但想判断它是不是真的“新一代”，还得等第三方实测和更多用户反馈。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

100

SCORE

H1·K1·R1

17:36

58d ago

● P1X · @dotey（宝玉）· x-apiZH17:36 · 04·21

Google 把 Gemini Deep Research 拆成两个版本：一个求快求省，一个烧算力出深度报告

Google 把 Gemini Deep Research 拆成了标准版和 Max 版，背后都是 Gemini 3.1 Pro 模型。标准版走速度和成本优先路线，适合嵌在产品里做即问即答；Max 版会反复搜索、推理、打磨报告，官方举的例子是分析师下班前丢一个尽调任务，第二天早上收完整报告。这次最大的变化是支持 MCP，能把 FactSet、S&P、Pi...

#Agent#RAG#Tools#Google

精选理由

这是一次有分量的产品更新：Gemini Deep Research 拆成标准版和 Max 版，在付费 API 里公开预览，标准版偏速度和成本，Max 版给更多算力、反复搜索和推理。HKR 三项都站得住，但官方没公布定价、调用限制和两版实际性能差距，所以分数压在 78-84 这个区间。

一句话点评

Google 把 Gemini 的深度研究功能拆成了标准版和 Max 版，但正文没披露两个版本在能力、成本或速度上的具体区别。

锐评

Google 给 Gemini 的深度研究功能做了个分层，分出标准版和 Max 版。这大概率是在学其他 AI 产品的付费分层策略，让轻度用户用便宜的标准版，重度需求上 Max。但这条消息目前只有一个标题，正文是空的，我们完全不知道 Max 到底强在哪——是能读更长的报告、能同时搜更多来源，还是推理步骤更多？也不知道价格怎么定、延迟高多少。这些关键信息都缺，所以现在没法判断这次升级是实质性的能力提升，还是换个名字做套餐拆分。建议等官方文档或实测出来再下结论。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

17:11

58d ago

X · @Yuchenj_UW· x-apiMULTI17:11 · 04·21

AI 实验室正在集体收紧开源，Qwen、Meta、MiniMax 都收紧了

UW 的 Yuchenj 观察到，越来越多 AI 实验室在退出开源。他举了三个例子：Qwen 在往更封闭的方向走，Meta 基本完全封闭，MiniMax 2.7 不允许商用。核心原因是经济账算不过来：训练成本极高，但放出模型权重后实验室很难直接赚钱。他建议用收入分成等方式帮实验室变现，让开源可持续。正文没披露 Qwen 和 Meta 具体收紧了哪个版本...

#Qwen#Meta#MiniMax#Commentary

精选理由

这是一篇行业评论，点了三个案例，不是产品发布或研究论文。HKR-R 成立是因为开源后退触及开发者的供应和许可焦虑；HKR-K 不成立是因为只有 MiniMax 2.7 的商用限制是具体的，Qwen 和 Meta 的版本、条款变化正文没给。

一句话点评

多家AI实验室正在收紧开源策略，不再像以前那样把模型权重和代码完整公开。正文没披露具体是哪些实验室、收回了哪些模型，信息缺口明显。趋势本身值得关注：开源曾是AI快速迭代的引擎，如果头部玩家陆续转向闭源或半开放，中小团队和学术界的跟进成本会上升。但“越来越多”这个判断目前缺乏数据支撑，先打个折。

锐评

MiniMax 2.7 禁止商业使用，这条已经不是情绪判断，而是许可条件变化。麻烦在于，帖文对 Qwen 和 Meta 只给了方向判断，没给版本、时间点、许可证文本。我只能确认一个硬事实：至少有团队开始把“开源”改成“可看、可试、不可自由商用”。我对“训练成本太高，所以实验室收紧”这个解释只买一半。算力贵当然是真的，2024 到 2025 年很多前沿模型的训练账单已经是千万到上亿美元级别，这个行业没人会白送权重。问题是，成本高从来不是全部答案。Meta 以前愿意放 Llama 权重，不是因为便宜，而是因为它要用免费分发换生态、研究注意力和下游云议价。阿里放 Qwen，也不只是做公益，它要抢开发者心智，要把推理、工具链和云服务一起带起来。开源模型从来不是单独卖钱的货，它更像获客渠道。渠道没有设计好，最后就会收回去。我还想 push back 一下“Meta 基本全闭源”这个说法。按我记忆，Meta 在过去一年仍然发布过可下载权重，只是许可证、可接受用途和商业门槛越来越像企业分发合同，不再是传统开源软件那套 OSI 逻辑。这个区别很大：不是简单的 open 对 closed，而是从 permissive 走向 source-available、field-of-use restriction、附加商业条件。很多人嘴上还叫它开源，法务上已经不是一回事了。 Yuchenj 提的 revenue sharing 方向，我觉得比单纯骂厂商靠谱，但正文没给机制，所以现在只能停在口号。分成到底按托管收入抽，还是按衍生产品抽，还是按商业 API 调用抽？这三种激励完全不同。去年到今年其实已经有一些近似实验：不少开放权重团队把模型本体免费放出，把商业授权、托管推理、企业支持和安全补丁做成收费层。严格说，这更接近 open-core，不是纯开源。我一直觉得大模型最后大概率会走这条路，跟数据库、搜索、可观测性软件很像：权重放出来，最值钱的是服务、更新速度、品牌担保和合规。我自己对这条还有个疑虑：开源退潮不一定只由成本驱动，能力风险和地缘合规也在推。尤其是多模态、agent、代码和生物方向，实验室法务团队会比研究团队更早踩刹车。帖文没展开这部分，所以不能替它补结论。眼下能落地的判断只有一个：别再把“放权重”直接等同于“开源阵营强势”。你得看许可证、商用条件、再发布权限，还有谁在托管入口上收钱。开没开，不在 GitHub 页面，在 license 细则里。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

16:25

58d ago

X · @op7418（歸藏）· x-apiZH16:25 · 04·21

随手拍张蓝莓，GPT-Image-2 就能生成同风格宣传图

博主用一张实拍蓝莓照片，让 GPT-Image-2 生成同产品风格的宣传图。结果蓝莓位置没变，但果实更大更饱满，设计元素全对。这对电商很实用——拍个实物就能自动出图，不用重新摆拍。不过正文没披露用了什么提示词、编辑参数、跑了多久，也没说失败案例。真正值得关注的是模型对“哪些元素能改、哪些不能改”的控制边界，而不只是图好不好看。

#Multimodal#Vision#Commentary

精选理由

这是一条单次演示帖，HKR-H 成立是因为它展示了“照片直接变广告图且物体位置基本保留”这个直观效果，有钩子；HKR-K 和 HKR-R 不成立，因为正文没披露提示词、编辑参数、耗时、失败案例、成本或可靠性数据，信息缺口太大，无法支撑行业级判断。

一句话点评

短评：一张蓝莓照片就能生成产品宣传图，GPT-Image-2 的视觉风格迁移能力很直观。正文没披露生成图的分辨率、是否支持多轮修改、以及风格一致性细节。如果真能一张照片定调，设计初稿成本会很低，但实际落地可能还需要人工调参。这点先别太激动，等更多实测。

锐评

发帖者展示了 1 张蓝莓实拍图，并让 GPT-Image-2 生成了 1 张宣传图，但正文没有给出提示词、编辑参数、耗时和失败样本。我的判断很直接：这更像一次审美对路的 in-context 图像编辑展示，不足以证明模型已经稳定学会“哪些能改，哪些不能改”。我对“蓝莓位置没变，所以模型很聪明”这个说法不太买账。单个案例里，位置保持有三种常见来源。第一种是模型真的学到了局部保真编辑。第二种是编辑强度本来就设得低，主体几何几乎被冻结。第三种更常见，输入图已经把构图限制死了，模型只是在光泽、体积感、背景质感上做增强。三种情况，产品意义差很多。正文一项都没披露，所以别急着把它读成“电商素材生产已经被打通”。我一直觉得，商品图编辑最难的不是“变好看”，而是可控性要穿过一条很窄的线。你得改掉瑕疵、补足商业质感、统一品牌风格；你又不能改 SKU、不能改包装字样、不能改净含量暗示、不能把水果大小改到涉嫌误导。这里最敏感的恰好是帖主夸的那句“蓝莓变得更大更饱满”。审美上这是加分，合规上就未必了。食品、电商、美妆这几类场景，视觉增强和商品失真之间本来只隔一层纸。文章没给出原图、输出图的像素级对齐，也没说是否锁定了 mask、主体框或 layout constraint，我没法把这条当成严肃的生产能力证明。拿行业里已有工具做参照，这也不新鲜。Adobe Firefly 和 Photoshop 的 Generative Fill，过去一年已经把“局部改背景、保主体、延展画幅”做得很顺。Midjourney 更擅长风格化，但对严格保版式、保 packshot 一直不稳。很多电商团队现在会把流程拆开：先用传统抠图和版式工具锁死商品区域，再让生成模型只处理背景、道具、光感和文案空间。原因很简单，生成模型一旦同时接管“商品真实性”和“广告美术”，翻车责任很难切。GPT-Image-2 如果真比上一代强，价值也会先落在这类半自动工作流里，不会是一句“拍一张就能出宣发图”这么轻巧。我还想补一个文章外的上下文。过去一年，多模态模型在“身份一致性”和“局部编辑一致性”上确实进步很快。人像领域已经能把脸保得比较稳，商品图也开始能保住大轮廓和主色。但“位置不变”不等于“语义不变”。水果大小、表面纹理、反光形状、景深、甚至旁边水珠数量，都会影响用户对新鲜度和品质的判断。做过电商 A/B 的人都知道，CTR 提升和合规风险经常一起上升。帖主说“对电商帮助非常大”，这个方向我同意；要说已经能放心上线，我自己还没看到证据。如果 OpenAI 想把 GPT-Image-2 这类能力打进真实商用，最需要给的不是再多几个惊艳案例，而是可复现条件：同一 prompt 跑 20 次的一致率，锁定主体后的漂移范围，文字与标签的误改率，编辑耗时，失败样本，最好再加上是否支持区域级约束。没有这些，大家看到的只是一个很会挑样片的 demo。对从业者来说，这条信息量在于一个信号：图像编辑模型正在逼近“可上流水线”的门槛；但这条帖文本身，还没把门推开。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

14:01

58d ago

X · @op7418（歸藏）· x-apiZH14:01 · 04·21

OpenAI 预告今晚发 GPT-Image-2，目前只有一张图

这条推文就是个预告，说 GPT-Image-2 今晚会发布，附了一个链接。正文没披露模型能干什么、怎么收费、是 API 还是网页端用，也没给具体几点上线。能确认的就两件事：产品叫 GPT-Image-2，时间窗口是今晚。

#Vision#Product update

精选理由

这是一条预告，不是正式发布。HKR-H 靠'今晚 + GPT-Image-2'这个钩子成立；HKR-K 不成立，因为价格、API 形态、能力差异都没披露；HKR-R 不成立，因为没有提到任何具体的工作流或市场影响，所以落在 60-71 的观察区间。

一句话点评

OpenAI 预告今晚发 GPT-Image-2，但正文没披露任何细节，比如能力提升、定价或可用范围。目前只有一条推文，连官方博客都没同步。如果是真的，图像生成质量或速度可能有明显升级，但这点先别太激动——来源单一，信息缺口大，等今晚实际发布再看。

锐评

OpenAI 只预告今晚上线 GPT-Image-2，正文未披露能力、价格、上下文、分辨率、接口形态。基于这点，我的判断很简单：这条现在几乎没有技术信息，更多是在抢注意力和发布时间窗，不是在给从业者可执行的产品信号。说真的，图像模型发布到 2026 年，标题里的名字早就不够看了。你至少得知道三件事：一是生成质量怎么评，二是编辑链路怎么接，三是成本落在哪。比如去年到今年，大家对图像模型的分水岭已经不是“会不会画”，而是 inpainting、角色一致性、多轮编辑、文字渲染、可控构图、以及 API 吞吐。Black Forest Labs 那波 FLUX 之所以能被开发者真拿去用，不只是因为出图好看，也因为社区很快摸清了 LoRA、蒸馏版、开源权重和部署门槛。Google Imagen 系列的问题则一直很典型：演示强，开发者拿到手时常常要再看地区、权限和接口限制。GPT-Image-2 如果今晚只给一段 demo 视频，没有 API、速率限制、价格表，我觉得讨论价值会很快掉下去。我还有个疑虑：OpenAI 这两年很爱把多模态能力包装成统一产品体验，这对 ChatGPT 用户有效，对开发者未必够。图像模型要进生产，采购看的是每张图成本、失败重试率、版权与安全过滤、编辑可重复性。标题现在只给了产品名，连它是 ChatGPT 内置功能、Responses API 新模态，还是独立 image endpoint 都没说。这个缺口很要命，因为三种形态对应的采用路径完全不同。前两种偏消费端和 agent 工作流，后一种才更像给现有图像 SaaS、设计工具、广告生成链路直接接入。我自己也没查到更多材料，所以没法下任何性能判断。要是拿外部参照，OpenAI 上一轮图像能力给市场的冲击，靠的是“文本到图像”并入现有产品面板；而最近一轮竞争，已经卷到 Gemini、Ideogram、Midjourney、FLUX 各自擅长的细分项。今晚如果只是常规升级，影响大概率在 ChatGPT 留存；如果它把编辑一致性、文字排版和 API 成本一起打穿，这条才会变成开发者新闻。现在先别被“来了”两个字带节奏，标题给了时间，正文没给判断所需的关键变量。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

14:00

58d ago

X · @OpenAI· x-apiEN14:00 · 04·21

OpenAI 发了一条只有一句话的预告帖

OpenAI 官方账号在 X 上发帖，正文只有一句“这不是截图”，附带一个链接。帖子里没提产品名、演示方式、发布时间，也没说链接指向什么。目前能确认的只有这是一条短预告，别过度解读。

#OpenAI#Commentary

精选理由

只有HKR-H通过：这是一条预告，不是一篇报道。标题写了'这不是截图'，但链接指向什么、是什么产品、怎么演示、什么时候发布，正文一个字都没提。信息密度低于40，归入excluded。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

13:28

58d ago

X · @op7418（歸藏）· x-apiZH13:28 · 04·21

GPT-Image-2 一张随手拍直接变宣传图

博主发帖说，拿一张随手拍的照片让 GPT-Image-2 生成宣传图，没给任何文字提示，结果出来的氛围感很高级。目前只有这一个例子和两张图，没有透露用了什么提示词、设置、延迟、分辨率或价格。单张图转图，不是基准测试，效果看着不错但样本太少，先别急着下结论。

#Multimodal#Vision#Commentary

精选理由

标题说“太猛了”，但正文只有一组图片对比，没有系统评测。亮点是零文字指令的图像到图像生成，但缺少关键参数和价格，这点先别太激动。

一句话点评

GPT-Image-2 生成图质量很高，但正文没披露任何技术细节、成本或延迟数据。目前只有一条推文截图，来源单一且不可靠，建议等官方文档或第三方实测再下结论。

锐评

发帖者展示了 GPT-Image-2 生成 1 张“宣传图”风格图片，但正文没给提示词、参数、分辨率、延迟和价格，所以这条最多只够证明一件事：模型能把 1 张随手拍照片往商业海报审美上推。离“能力上限”还早。我对这类帖子一直比较警惕。图像模型最容易被单张样例带跑，因为风格命中一次，观感就会非常强。问题是，可复现条件完全没披露。发帖者说“什么都没说”，这句话本身就不够严谨：是否用了系统默认风格、参考强度、自动补全提示、裁切增强，正文都没写。连输入图长宽比都不知道，就没法判断模型是在做重绘、扩图，还是强风格化编辑。回到行业经验看，这种“随手拍变宣传图”的展示并不新。去年到今年，Recraft、Midjourney、Ideogram，连部分手机厂商内置生成编辑，都反复打过同一类 demo：给你一张普通照片，输出更像广告图的结果。差别从来不在“能不能做出一张好看的”，而在三件事：稳定性、可控性、成本。这里三项都缺。标题给了情绪，正文没给评测。我还想补一层判断。假如 GPT-Image-2 真能在“零文字指令”下稳定产出高完成度宣传图，那背后更重要的不是审美本身，而是默认意图推断做得更激进了：模型会主动猜“用户想要商品化表达”。这对 C 端很好用，对专业设计流未必是好消息。默认猜得太多，往往也意味着可控性下降。我自己没看到更多样本前，不会把这当成能力跃迁，只会把它当成一次成功演示。说实话，这条信息密度很低。想让我改观，至少得补 5 个东西：原图、完整操作链路、是否真无文字提示、生成耗时、同条件多次结果。没有这些，这就是一条好看的 sample，不是结论。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

13:16

58d ago

X · @op7418（歸藏）· x-apiZH13:16 · 04·21

一句话让 GPT 生成小说剧情长图

博主用一条提示词让 GPT 生成了《神秘复苏》的剧情和世界观介绍长图，提示词要求“用一张长图详细地介绍小说剧情、故事线和世界观”。正文没披露用了哪个 GPT 版本、生成耗时多久、图片尺寸多大。这只是一个提示词演示，不是产品发布。

#Multimodal#Commentary

精选理由

HKR-H 通过：一句话提示词生成整张小说世界观长图，这个钩子够具体，读者会想点进去看效果。HKR-K 和 HKR-R 不通过：只披露了提示词，GPT 版本、生成耗时、图片尺寸都没说，验证门槛高；这是一次内容演示，不是关于工作流、成本或模型竞争的故事，信息缺口太大，不适合作为雷达推荐。

一句话点评

一句话让GPT生成小说剧情和世界观长图，听起来很酷，但正文没披露具体实现方式、模型版本和生成质量。如果只是简单扩写加排版，那很多工具都能做；如果真能理解复杂世界观并视觉化，那才是突破。目前信息太少，先别太激动。

锐评

发帖者用 1 句提示词生成《神秘复苏》长图，但正文没披露 GPT 版本、耗时、分辨率、是否二次编辑。就这点材料，我不买“只要一句话就能稳定出整篇小说世界观图解”这种讲法。眼前能确认的，只有一次演示成功，不是可复现能力声明。我自己的判断是，这条更像两件老能力被揉到了一起：一是长文本摘要与结构化改写，二是画布式排版或图文混排。过去一年，ChatGPT 和 Gemini 都在把“写内容 + 排版成可分享成品”做成同一条链路，海报、卡片、长图都越来越多。这个方向不新。新的是产品把步骤藏起来了，所以用户会误以为模型突然“懂设计、懂小说、懂世界观”。说真的，这里面最值钱的不是那句提示词，而是系统预设、版式模板、字体与段落密度控制。文章没给这些条件，我没法把功劳全算到模型推理上。还有个问题我会比较警觉：这种输出如果基于现成小说内容，版权边界和事实漂移都不好看。《神秘复苏》这种长篇网文人物线很多，设定也碎，一张长图想压缩完整剧情，最容易出现的不是“做不出来”，而是把支线压扁、把设定讲错。去年不少“AI 一键读懂一本书”的产品就卡在这：展示很顺，细节一核对就漏人物、错时间线。这里发帖者没给原图细节，也没给读者核验点，所以我还不能判断质量到底是能用，还是只适合社媒转发。我还想补一个上下文。OpenAI 这一路产品演示，越来越爱把多步工作流收进一句自然语言里：先理解任务，再生成内容，再自动选呈现形式。用户体验确实好了，但这不等于底层模型在知识覆盖、长程一致性、版权处理上同步解决了。标题讲的是“一句话”，我看到的其实是“系统替你补完了一堆隐藏提示”。这条可以当成产品封装变强的例子，看成模型出现新物种，我觉得有点过。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

13:05

58d ago

X · @op7418（歸藏）· x-apiZH13:05 · 04·21

给一张车图，AI 直接生成官网设计稿

作者只上传了一张汽车照片，没告诉 AI 这是什么车，AI 就生成了一个汽车官网设计稿。正文没披露用了哪个模型、具体提示词、原图质量、生成耗时和输出效果，所以这个结果能不能复现、效果稳不稳定都不清楚。单看这个能力挺有意思，但先别太激动——没有更多细节前，只能当个 demo 看。

#Vision#Multimodal#Commentary

精选理由

标题钩子成立，因为“没给车型名就生成官网设计稿”这个反差足够抓人。但正文信息严重不足：模型、提示词、输入图片、生成耗时、输出质量全都没提，目前只能确认“图片输入+网页设计生成”这个条件。没有成本、速度或质量数据，从业者无法判断这个流程是否可复现或值得跟进，所以 workflow 价值很弱。综合下来 H 成立、K 不成立、R 弱，维持 all 层级和 48 分。

一句话点评

给一张车图，AI直接生成官网设计稿，连品牌都没说。效果看着还行，但正文没披露用了什么模型、生成耗时多久、能不能改细节。如果是秒出且可编辑，那前端设计师真得慌；如果只是单次演示，先别太激动。

锐评

作者只给 AI 1 张汽车图片，并称系统生成了官网设计稿；正文未披露模型名、提示词、输入图、耗时、分辨率和输出截图。这种材料，我不会把它当能力结论，只能当一个演示线索。我一直觉得这类帖子最容易把两件事混在一起：一是视觉识别，二是模板化网页生成。前者要求模型从车灯、车身线条、轮毂比例里抓到品牌语言；后者很多时候只要识别出“这是一辆偏运动/偏豪华的车”，再套一个 hero banner、参数区、预约试驾 CTA，就已经很像官网了。标题说“没说这是啥车”，不等于模型完成了品牌识别，更不等于它理解了这辆车的产品定位。少了输出截图和 prompt，连它是做了品牌拟合，还是只做了汽车行业通用 landing page，都没法判断。这不是小题大做。过去一年，多模态模型在“看图做前端”上确实进步很快。OpenAI、Anthropic、Google 那几家的强模型，都已经能把截图、手稿、海报转成像样的 HTML/CSS；我没核实你这条用的是哪家，但主流模型做到“从图里抽视觉元素，再生成一个像样页面”并不稀奇。难点从来不是 first draft，而是品牌一致性和可复现性：同一张图跑 5 次，版式稳不稳；换 3 张不同角度的同款车，颜色、文案调性、按钮层级会不会漂；再进一步，能不能把图里没有的信息老老实实留空，而不是编参数、编车型名。这个分水岭，帖子里一个都没给。我对这种演示还有个保留：汽车官网是高度模式化的页面类型。你给模型一张 SUV 图，它很容易补出“性能、空间、智能座舱、预约试驾”这套行业固定结构。这说明模型学会了网页套路，不自动说明它学会了产品理解。要验证后者，至少该给两组对照：同一模型面对超跑、MPV、皮卡时，信息架构是否跟着变；同一张图去掉 logo 和保留 logo，输出差异有多大。没有这些，结论很容易被标题带跑。所以这条我先记成一个不错的 demo，不记成能力里程碑。要让我买账，作者至少得补 5 个东西：模型名称、完整 prompt、输入原图、生成耗时、输出截图。再加一组重复实验，信息量才够。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

12:47

58d ago

X · @op7418（歸藏）· x-apiZH12:47 · 04·21

在 GPT 里玩 ARPG：三步循环，看图选剧情

这个玩法把 GPT 变成了一个图文互动游戏：先生成剧情画面和选项，你选一个，它再根据你的选择生成下一幕图片，然后继续出选项，循环下去。本质上是一个“图片生成 + 分支叙事”的循环，不是真正的游戏引擎。正文没披露用的是哪个 GPT 版本、图片生成工具、每次生成要等多久、以及能不能记住前面的选择。

#Multimodal#Vision#GPT#黄老板

精选理由

HKR-H成立，因为“在GPT里玩ARPG”这个角度新颖。HKR-K和HKR-R不成立：帖子披露了一个3步的图片加选项循环，但没有披露模型版本、延迟、成本或记忆能力，所以这只是一个有趣的演示，而非产品或方法故事。

一句话点评

有人在 GPT 里跑起了 ARPG 游戏，靠的是把游戏逻辑写成提示词和状态机，让模型一步步模拟战斗和剧情。正文没披露具体延迟和 token 消耗，所以实用性要打折——目前更像概念验证，离流畅可玩还远。但思路有意思：把模型当游戏引擎用，省掉传统开发，适合快速 prototyping。

锐评

发帖者展示了 GPT 内 3 步 ARPG 循环，但正文没披露模型版本、图像工具、延迟、成本和记忆机制，所以我不会把它算成“GPT 能玩游戏”的能力跃迁。这个演示成立的前提很窄：模型先产一张剧情图和几个选项，用户点一个，再按选项续写下一张图。你把它拆开看，就是分支叙事 + 图像生成 + 上下文回填。能跑通，说明多模态交互的壳子已经够顺手；壳子之外，游戏系统本身几乎没被证明。我一直觉得这类 demo 最容易把人带偏。ARPG 这三个字会让人自动脑补战斗系统、数值成长、地图状态、背包、技能冷却、敌人 AI。正文一个都没给。标题给了“可以玩”，正文只给了“可以一幕一幕生成”。这中间差很远。没有显式状态机，没有确定性的规则执行，没有低延迟连续反馈，它更接近 AI 绘本 DM，像早期 AI Dungeon 加上图片，再套一层 ChatGPT 交互界面。你说它好不好玩，当然有机会好玩；你说它是不是游戏引擎，我不买账。文章外的上下文其实很清楚。过去一年里，Character.AI、Inworld、Latitude 这类产品一直在试“LLM 当游戏主持人”这条路，强项都是生成氛围和分支文本，短板也一直没变：状态漂移、规则不稳、成本高、长程一致性差。OpenAI 自家这一路也早就有人拿图像模型做交互小说和视觉 RPG，我自己见过的最好效果，通常都要外接一层状态存储，甚至要把 HP、物品、任务进度写成结构化变量，不能只靠自然语言记忆。只靠聊天上下文硬撑，玩十几轮后设定开始飘，这几乎是老问题。这里正文没说有没有外部 memory，我倾向于先按“没证明有”处理。还有个很现实的点是延迟。一次回合如果要出图，再带文本分支，单轮等待哪怕 10 到 20 秒，沉浸感都会断。正文没给任何数字。成本也没给。假设每一步都要调用一次高质量图像生成，再叠加文本推理，几十轮下来就是实打实的 token 和图像额度消耗。这个模式适合做一次性体验、社媒传播、主播整活，不太像能长期留存的产品形态。至少在没有缓存、素材复用、低价图像管线之前，我看不到它能自然扩成日活很高的游戏品类。说真的，我反而觉得这条的价值不在“ARPG”，而在界面范式。聊天窗口过去主要承载问答、搜索、文档协作，现在有人把它当轻量交互引擎来用：模型负责导演、画面和分支，用户只做选择推进。这个方向如果继续长，会逼着产品把状态管理、回合控制、素材缓存、工具调用编排做成原生能力。谁先把这些做成平台层，而不是靠一串长提示词堆出来，谁才有资格谈“AI 游戏”。我对这条还有一个保留意见：它很依赖演示者手工挑选最好看的片段。没有完整试玩录像，没有失败样本，没有连续 30 分钟的稳定表现，我很难判断这是不是高频可复现。很多这类帖子的问题不在首回合，而在第 8 回合以后角色长相变了、装备忘了、剧情断了。正文没披露这些，我只能说它证明了一个交互套路能成立，没证明它已经是产品。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

11:27

58d ago

X · @Khazix0918· x-apiZH11:27 · 04·21

GPT-Image-2 疑似全量上线，随手一次生成两张图，审美和知识都在线

一位前设计师发帖称 GPT-Image-2 已悄悄全量上线，并晒出两张一次生成的图片，表示其世界知识能力和审美都很强。帖子只披露了两个条件——随意写的提示词和单次生成，没有交代上线时间、访问范围、模型细节或任何官方说明。

#Multimodal#Vision#Product update#Commentary

精选理由

HKR-H 靠'悄悄全量上线'这个钩子成立，HKR-R 因为图像质量影响设计师工作流和替代焦虑也成立。HKR-K 不成立：帖子只展示了2张一次生成的样例，上线范围、时间、入口、参数、官方确认全都没披露。

一句话点评

GPT-Image-2 全量上线，前设计师惊呼“太太牛了”。核心卖点是世界知识能力和审美提升——画东西更懂常识、构图更好看。但正文没披露任何技术细节、定价、可用地区或生成速度，目前只有一条个人推文，可信度打折。建议等官方文档或实测再判断是否真比 DALL·E 3 强。

锐评

发帖者展示了 2 张一次生成图片，并宣称 GPT-Image-2 已“全量上线”；正文没给发布时间、入口范围、模型卡或官方说明。先把这件事压回事实层：现在能确认的只有个人账号看到了新效果，还有 2 张样例图。拿这个直接下“全量”判断，证据不够。我对这条的直觉是，OpenAI 大概率在继续走“先静默放量，再补文档”的老路，但“全量”三个字还是喊早了。过去一年里，OpenAI 在图像和语音入口上多次出现 UI 先变、帮助中心后到、地区和套餐分批开的情况。这个节奏不稀奇。稀奇的是，社区很容易把“我这里能用”误读成“所有人都能用”。两者差得不是情绪，是 rollout 机制：账号白名单、地区、订阅层级、速率限制，任何一个条件没披露，都不能叫全量。如果只看样图描述里那句“世界知识能力、审美都太强”，我反而会更谨慎。世界知识在图像生成里不是一句夸奖就能成立，它至少要落到可复现任务：冷门地标、历史服饰年代、品牌物料风格、排版语义对齐。审美也一样，得看多轮稳定性，不是 2 张图好看就算数。Midjourney 早就把“第一眼惊艳”卷到很高了，OpenAI 这轮如果真有跃迁，应该体现在更低 prompt 依赖、更强文字渲染、更少手部和布局翻车。我自己还没看到这组对比。我还有个保留意见：这类帖子最容易把“模型能力”与“采样运气”混在一起。一次生成很加分，但两张样例远远不够。提示词没完整公开，负面词没说，是否做过重抽也没法核实。标题已经给出“GPT-Image-2 全量上线”，正文没有交代最关键的验证信息。我会先把它当成用户侧体验信号，不当成产品层面的确定发布。等 OpenAI 官方 changelog、帮助中心，或更多账号在同条件下复现，再谈是不是一次像样的图像代际更新。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

09:35

58d ago

X · @op7418（歸藏）· x-apiZH09:35 · 04·21

把 Seedance 2.0 论文喂给 GPT-Image-2，它吐了一张解释长图

有人把 Seedance 2.0 的论文直接丢给 GPT-Image-2，模型自动生成了一张长图来解释论文内容。正文只说了这一句，没透露图片尺寸、输入方式、提示词或是否可复现。效果听起来挺方便，但信息太少，没法判断图的质量和准确性。

#Multimodal#Vision#Commentary

精选理由

HKR-H 通过，因为把论文喂给模型生成解释长图这个操作本身有新鲜感。HKR-K 和 HKR-R 不通过，因为正文只有一句话加两个链接，没披露提示词、输入方式、图片尺寸、准确性验证或可复现条件，信息量太少，无法作为 actionable 信号。

一句话点评

这条推文展示的是用 GPT-Image-2 把 Seedance 2.0 论文生成了解释长图，不是模型本身发布。正文没披露 Seedance 2.0 的架构、参数或效果对比，目前只能当个视觉演示看。短评：图比论文好懂，但模型能力还得看原文。

锐评

帖子只给出 1 句描述：作者把 Seedance 2.0 论文交给 GPT-Image-2，产出了一张“论文解释长图”。关键条件全没给：图片尺寸、论文输入方式、提示词、是否多轮、是否人工改稿、长图里有没有直接摘抄原文，正文未披露。所以现在能下的判断很窄：这证明了 GPT-Image-2 至少能参与“把长文组织成视觉版式”的流程，证明不了它完成了可靠的论文解释。我对这类展示一直比较警觉。视觉上顺的长图，和内容上对的长图，是两回事。模型很擅长把标题、箭头、模块框、配色做得像那么回事，这会放大一种错觉：结构感≈理解力。做过多模态的人都知道，信息图任务里最容易翻车的不是画图，而是抽取主线、保留约束、别编机制。尤其是论文解释，图里只要把损失函数关系、训练阶段顺序、消融结论抹平一点，看起来就很专业，实际已经偏了。这条放到近一年的产品走势里看，倒是有个明确信号：图像模型正在被当成“文档到信息图”的排版器。Google 那边我记得 Gemini 体系已经反复展示过把文档、网页、笔记整理成视觉摘要；OpenAI 这边 GPT-Image 系列也一直在补文字生成、版式控制、长图输出这类能力。我还没查到 GPT-Image-2 对超长中文文字、复杂公式、论文图表重绘的稳定指标，所以我不会把它夸成“科研助手升级”。现在更像是把设计实习生工作流自动化了一段。我还有个 pushback：Seedance 2.0 这篇论文本身的难度、页数、图表密度、公式占比，帖子都没交代。要是输入的是摘要页、作者自己先提炼过的 bullet、甚至是 OCR 后的整理文本，结论完全不同。复现条件差 1 步，能力判断就会差一大截。说真的，这种演示要想成立，至少得同时给 4 样东西：原论文 PDF、完整 prompt、生成耗时、长图逐段和原文的对照校验。没这些，它更像一个好看的 demo，不是能力证据。所以我现在的态度很简单：可以把它当成内容包装能力的样张，别急着把它记成论文理解突破。对做产品的人有用的点，是“图文摘要链路”能不能接进知识库、审校和模板系统；对做模型的人，这条信息还远远不够。

HKR 分解

hook ✓knowledge —resonance —

→ 打开信源

SCORE

H1·K0·R0

09:24

58d ago

X · @op7418（歸藏）· x-apiZH09:24 · 04·21

OpenAI 新模型能直接生成《金瓶梅》主题游戏截图

一条 X 帖子称，用一句提示词就让 OpenAI 新模型生成了两张《金瓶梅》主题的古代 ARPG MMO 开放世界游戏截图。帖子附了图片链接，但没说是哪个模型、什么时候上线、怎么用、有没有安全过滤。真正的信号是内容边界可能松动了，别被标题带跑。正文没披露模型名称、发布时间、访问路径和安全策略。

#Multimodal#Vision#OpenAI#Commentary

精选理由

HKR-H 和 HKR-R 成立：一条提示词出《金瓶梅》截图，标题情绪化但事实本身有传播力，且内容边界变化直接影响创作者和安全团队。HKR-K 不成立：来源是单条 X 帖子，只有1条提示词和2张图，模型身份、发布状态、访问方式、安全策略全缺，只能留在 all 层级。

一句话点评

标题党，正文没披露任何具体信息。OpenAI 新模型可能涉及内容审核尺度放宽，但无数据、无对比、无来源支撑。建议等官方或可信信源出细节再判断，目前只能当个传闻看。

锐评

这条信息只证明 1 个账号贴出了 1 条提示词和 2 张图片，OpenAI 新模型这个主语还没被坐实。正文没给模型名，没给发布时间，没给访问入口，也没给 system card 或安全策略。拿这点材料就下“内容尺度放开”结论，证据不够。我更在意的是生成目标的组合：古代、ARPG、MMO、开放世界、《金瓶梅》主题。这里混了 IP/文学指涉、成人联想、游戏美术三个维度。图真是 OpenAI 产的，信号也不一定是“成人内容解禁”，更像模型对含混文化对象的拒答阈值变了，或者仅仅把《金瓶梅》当作古风叙事标签处理。两者差很多。前者是政策边界移动，后者只是分类器没把它打进高风险桶。说真的，这类截图帖过去一年见太多了。xAI Grok 图像、Flux 社区微调、甚至一些套壳闭源服务，都常拿“单提示出敏感题材”做传播钩子。最后一查，常见情况是私测白名单、区域灰度、老版本策略漂移，或者干脆不是同一家模型。我还没查到这条的原始生成链路，所以不会把账先记到 OpenAI 头上。我自己的判断是：如果 OpenAI 真调了图像内容边界，后续一定会连着出现三样东西——更多可复现样例、失败样例的边界线、官方文档更新。现在三样都没有。现阶段能说的只有一句：标题给了“尺度大”，正文没披露任何能验证这件事的关键条件。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

08:11

58d ago

X · @op7418（歸藏）· x-apiZH08:11 · 04·21

OpenAI 的 gpt-image-2 模型全量上线了，效果很顶

一位用户发帖称 OpenAI 的 gpt-image-2 模型已经全量上线，现在就能用。他贴了两张生成图：一张让模型用可爱风格解释大语言模型训练过程，另一张给了一个 OpenAI 更新文档让模型介绍更新内容，两张效果都很好。不过正文没披露产品入口、定价、支持平台或上线时间，想尝鲜得自己去找。

#Multimodal#Vision#OpenAI#Product update

精选理由

HKR-H 和 HKR-R 通过：OpenAI 图像模型声称全量上线，对关注接入和计费的开发者来说有吸引力且相关。分数卡在中间是因为 HKR-K 偏弱：只有一条 X 帖子的截图和两张样例，没有官方文档、定价页、控制台入口或发布时间。

一句话点评

OpenAI 的 GPT-Image-2 模型全量上线，现在所有人都能用了。之前只对部分开发者开放，这次放开意味着图像生成能力正式进入产品阶段。不过正文没披露模型参数量、生成速度、定价或样本效率，这些关键指标缺失，没法判断它比 DALL·E 3 强多少。如果真像传闻那样支持高分辨率、多轮编辑和风格控制，那对 Midjourney 和 Adobe Firefly 是直接压力。但没跑分、没成本数...

锐评

X 帖子给出了 gpt-image-2 可用的两张样例图，但没有给出产品入口、价格、模型卡或发布时间。这种信息量，够说明“有人已经用到”，不够说明“OpenAI 已全量上线”。我对“全量”这个词有点警觉。OpenAI 过去一年很常见的做法，是先在 ChatGPT 某些界面灰度放能力，再晚几天到几周补 API、控制台和计费页。图像这条线更是这样：先让用户看到效果，再慢慢补可控参数、速率限制、版权说明。只靠两张图，就把它讲成正式 GA，我觉得有点过。这条消息如果成立，行业含义其实不在“又有一个会画图的模型”，而在 OpenAI 有没有把图像生成重新拉回统一模型栈。过去一段时间，文本、语音、图像都在往同一套调用接口靠，这对开发者比样张更重要。你要做工作流、广告素材、UI 草图、教育内容，先看的不是“顶不顶”，而是能不能稳定批量生成，能不能控尺寸、风格、一致性，失败率和延迟是多少。正文这些都没披露。我还想补一个上下文。OpenAI 之前的图像能力已经很强，但工程侧一直有个老问题：演示惊艳，不等于生产可用。Midjourney 强在审美，Ideogram 强在文字，Google Imagen 这两年在企业侧也没停。gpt-image-2 如果只是把“看起来更好”再推高一点，竞争格局不会大变；如果它把文档理解、版式生成、长文本渲染和 API 可编排性一起做好，那才会真的吃到生产流量。可惜这条帖文只展示了主观观感，没有给任何可复现条件。说真的，我现在更想看到三个东西。第一，OpenAI API 文档里是否正式出现 gpt-image-2 名称与参数。第二，计费页是否给出按图、按 token、按分辨率还是按步骤收费。第三，控制台有没有批量调用、编辑、变体和一致性相关设置。没有这些，最多只能判断“能力疑似放量”，还不能判断“产品已经落地”。所以这条我会先记一笔，但不会按正式发布处理。标题给了“全量上线”的判断，正文没有提供支撑这个判断的关键信息。

HKR 分解

hook ✓knowledge —resonance ✓

→ 打开信源

SCORE

H1·K0·R1

04:12

58d ago

FEATUREDX · @op7418（歸藏）· x-apiZH04:12 · 04·21

CodePilot v0.52.0 把 AI 生成内容的预览和编辑都塞进了侧边栏

这次更新主要让侧边栏能干更多活。AI 生成的 React 组件（.jsx/.tsx）点一下就能实时渲染看效果；表格文件（.csv/.tsv）会变成可排序的表格视图，还能一键导出；Markdown 文件在预览里就能直接改，停笔 1 秒自动保存；HTML 文件支持一键导出整页长图。另外文件树里现在可以直接新建 .md 文件和文件夹。核心变化是把编辑和预览的...

#Code#Tools#CodePilot#Product update

精选理由

这是一个中等价值的产品更新。HKR-K 靠具体的工作流细节和功能机制通过，但 HKR-H 和 HKR-R 偏弱：没有强标题钩子，也没有明确的行业影响、定价、规模或性能数据。

一句话点评

CodePilot 发了 v0.52.0，但正文没给任何更新内容，没法判断这次是修 bug 还是加了新功能。

锐评

这条更新目前只有标题，没有正文，所以能说的很有限。CodePilot 是个 AI 编程助手，v0.52.0 这个版本号看起来像一次常规迭代，但具体改了什么——是补了安全漏洞、优化了补全延迟，还是加了新的模型切换选项——正文都没披露。对想评估要不要升级的用户来说，现在唯一能确认的就是“有新版本”，其余都得等官方补 changelog。建议先别急着更新，等有人实测或者官方放出 release notes 再看。

HKR 分解

hook —knowledge ✓resonance —

→ 打开信源

SCORE

H0·K1·R0

02:52

58d ago

FEATUREDX · @op7418（歸藏）· x-apiZH02:52 · 04·21

Codex 上线 Chronicle 记忆功能：自动截屏帮你记住上下文

Codex 给 Pro 用户加了个叫 Chronicle 的记忆功能，原理是自动持续截屏，把本地屏幕内容存下来。这样你下次问“刚才那个文档”或“那个 Bug”，它不用你重新交代就能对上号。截图存在本地，不传云端。但正文没披露截屏频率、用户能不能控制开关、以及截图保留多久——这几个点直接决定了隐私风险和使用体验，目前都是未知数。

#Memory#Tools#Product update

精选理由

Codex 这个 Memory 更新有看点，核心是自动截屏当本地记忆用，Pro 用户能直接指文档和 Bug，钩子够强。但正文没交代支持哪些平台、怎么开关、截屏频率和保留时长，这些才是真正决定实用性和隐私风险的关键。分数 71 合理，信息缺口明显，先别太激动。

一句话点评

OpenAI 给 Codex 加了个叫 Chronicle 的记忆功能，但正文没披露具体怎么记、记多少、会不会串项目。

锐评

Codex 上了 Chronicle，相当于给编程助手装了个项目级记事本，让它能跨对话记住你的代码上下文和偏好。这对长期维护同一个项目的开发者来说，可能比每次重新描述需求省事不少。但这条消息目前只有一句话标题，没有任何技术细节或官方公告链接。我不知道这个记忆是存在本地还是云端、能记住多长的历史、不同项目之间怎么隔离。如果记忆机制做得粗糙，反而可能把旧项目的习惯带进新项目里，造成干扰。另外，OpenAI 没说明这个功能是默认开启还是需要手动触发，也没提对 token 消耗和延迟的影响。这些信息缺口让实际体验打了问号，建议等官方文档或实测出来再判断它到底实不实用。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:29

59d ago

FEATUREDX · @op7418（歸藏）· x-apiZH02:29 · 04·21

Miclaw 现在支持多终端了

Miclaw 打通了 PC、Mac、手机和小爱音箱，共享记忆，还能跨设备连续对话。比如在手机上让它把电脑里的文件发过来。核心是记忆和控制链打通，但正文没披露覆盖范围、权限设计和上线时间。

#Agent#Memory#Tools#Miclaw

精选理由

HKR 三项全过：跨设备记忆的钩子清晰，文件传输的例子可测试。分数卡在 71 是因为支持范围、权限模型和上线时间都没披露，所以归为 all 而非 featured。

一句话点评

Miclaw 宣布支持多终端，但正文没披露具体是哪些平台、同步机制和性能表现，先当个功能更新看。

锐评

这条消息本身信息量很薄，只有一句话说 Miclaw 现在支持多终端了。对用户来说，多终端意味着可以在手机、平板、电脑之间切换使用，不用反复登录或丢失进度。但正文没写具体适配了哪些系统——是 iOS、Android、Web 还是桌面端，也没提数据同步是实时还是手动触发，离线能不能用。这些细节直接决定这个功能是“真能用”还是“只是有了”。另外，Miclaw 本身是个相对小众的工具，这次更新是追赶同类产品的标配功能，还是有自己的实现思路，从现有信息里看不出来。建议等官方放出具体支持列表和同步逻辑后再判断实际价值。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:06

59d ago

FEATUREDX · @dotey（宝玉）· x-apiZH02:06 · 04·21

GitHub Copilot 暂停 Pro、Pro+ 和学生版新注册，Pro 套餐砍掉 Claude Opus 模型

4 月 20 日，GitHub 对 Copilot 个人版动了次大手术：Pro、Pro+ 和学生版不再接受新用户，只剩免费版还能注册。官方说这是为了保住现有付费用户的服务质量。Pro+ 的使用额度被拉到 Pro 的 5 倍以上，Pro 用户如果老撞墙，官方建议加钱升 Pro+。最狠的一刀是 Pro 套餐直接移除了 Claude Opus 模型，Anth...

#Code#GitHub#Anthropic#Claude

精选理由

Copilot 个人版这次调整不是发新功能，而是卡入口、压额度、分层模型。Pro 用户被拿走 Claude Opus，Pro+ 额度拉到 Pro 的五倍以上，定价却没变——等于用供给端收缩来应对模型成本压力。信息来自 X 帖子而非 GitHub 官方公告，这点先打个折，但暂停注册和退款窗口本身已经够具体，值得从业者盯后续。

一句话点评

Copilot 个人版突然砍掉 Claude Opus 并暂停新用户注册，大概率是成本扛不住了，现有 Pro 用户得做好模型降级的准备。

锐评

GitHub 这次调整动作很急，直接暂停了 Pro、Pro+ 和学生版的新用户注册，同时从 Pro 套餐里移除了 Claude Opus 模型，还收紧了使用额度。这基本是在给个人版服务踩刹车，最直接的原因很可能是算力成本过高，尤其是接入 Claude Opus 这种大模型，按调用量计费很容易烧钱。目前只有免费版还能正常注册，但免费版本身额度就低。对于现有的 Pro 用户来说，虽然暂时不受影响，但模型被砍意味着以后只能用相对便宜的模型，回答质量可能会打折扣。正文没披露具体的额度收紧到什么程度，也没说这次调整是临时止血还是永久策略。如果后续连企业版也开始限制模型选择，那说明微软内部对 Copilot 的投入产出比正在重新算账。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

02:00

59d ago

FEATUREDX · @dotey（宝玉）· x-apiZH02:00 · 04·21

Claude 切 opus-4.6 只能改配置文件了，/model 命令已失效

有用户发现 Claude 的 /model 命令已经不能直接选 opus-4.6，但可以通过编辑 ~/.claude/settings.json 把 model 字段设为 claude-opus-4-6 来切换。发帖人说写东西时 opus-4.6 更稳、更省 token，但正文没披露测试样本或计费数据，所以这点先别太激动。真正的信号是访问路径变了，不是...

#Tools#Commentary

精选理由

这是用户发现的配置变通方法，不是 Anthropic 官方发布。HKR-K 通过，因为给出了可复现的 settings.json 修改步骤；HKR-R 通过，因为 Claude 用户会关注模型路由的摩擦；稳定性和 token 节省的声称缺少样本或计费数据支撑。

一句话点评

Opus 4.6 写东西更稳还省 token，但 /model 快捷切换被砍了，得手动改配置。

锐评

这条分享了一个实际使用体验：Anthropic 的 Opus 4.6 模型在写作任务上比某些新模型更稳定，而且消耗的 token 更少，意味着调用成本更低。但用户发现聊天界面里的 /model 命令不能直接切换到这个模型了，只能通过后台配置文件来指定。这暗示官方可能在逐步弱化 Opus 4.6 的入口，引导用户转向其他模型，但老用户因为输出质量和成本原因还在手动绕路使用。信息来自个人社交动态，没有官方公告或数据支撑，无法判断这是临时调整还是长期策略。也没说清楚具体在什么类型的写作任务上更稳、省了多少 token，以及配置切换的具体步骤是否复杂。

HKR 分解

hook —knowledge ✓resonance ✓

→ 打开信源

SCORE

H0·K1·R1

2026-04-20 · 星期一2026年4月20日

22:55

59d ago

X · @AnthropicAI· x-apiEN22:55 · 04·20

Anthropic 推出 STEM 研究员计划，招专家来干几个月项目

Anthropic 宣布启动 STEM 研究员计划，面向科学和工程领域的专家，邀请他们加入研究团队参与为期几个月的具体项目。目前只透露了项目时长和申请链接，没有说招多少人、给多少经费、具体做什么方向。想判断这个计划含金量高不高，得等后续披露选拔标准和项目规模。

#Anthropic#Product update#Personnel

精选理由

Anthropic 官方发的帖子，来源权威性没问题，但 K 不成立是因为除了“几个月”的合作周期，名额、钱、研究范围一概没给。R 成立是因为它踩中了研究者想进顶尖实验室的痛点；信息太少，只能放在低 all 档。

一句话点评

Anthropic 推出 STEM 奖学金项目，面向理工科学生。正文没披露资助金额、名额和申请条件，目前只有标题，信息缺口很大。

锐评

Anthropic 启动 STEM Fellows Program，公开信息只有合作期为“几个月”和申请入口，名额、资助金额、研究题目、知识产权归属，正文都没披露。我的判断很直接：这更像一层低承诺的人才漏斗，用项目协作先筛人，再决定要不要拉进长期研究体系。我这么看，不是因为 fellowship 这个词本身，而是 Anthropic 过去一年的人才动作一直偏“研究能力贴身化”。他们一边做前沿模型，一边把安全、评测、工具使用、科学任务这几条线捆得很紧。现在再加一个面向 STEM 专家的短期项目，逻辑上很顺：先把领域科学家放进真实研究流，看他们能不能和模型研究员一起定义问题、做数据、搭评测、跑闭环。比起直接全职招聘，这种形式成本更低，筛选信号更密。外部参照也有。OpenAI、Google DeepMind、微软研究院这些年都做过驻留、学者合作、创业者驻场一类项目，但大多会先讲清楚资助、周期、方向，至少会给出 cohort 轮廓。Anthropic 这条信息薄到只剩“来合作几个月”，我对它的宣传口径有点保留：如果目标真是推动科学发现，项目边界通常要先写清；如果边界故意留空，很多时候是在给内部团队留最大匹配空间，也是在借申请池看外部哪里的人最稀缺。我还没查到申请页细则，所以这块我不下死结论。但只看这条帖子，我更关心三件事：一是 fellows 能不能碰到核心模型能力，还是只做外围应用；二是产出归属怎么定，论文、代码、专利有没有公开权；三是最后转正比例高不高。标题已经给出“科学与工程专家”“合作数月”，正文没给这些关键条件。没有这些，别急着把它读成 Anthropic 在做大规模科学平台，它现在更像一场定向搜人。

HKR 分解

hook —knowledge —resonance ✓

→ 打开信源

SCORE

H0·K0·R1

20:42

59d ago

FEATUREDX · @claudeai· x-apiEN20:42 · 04·20

Claude 的 Cowork 模式现在能直接生成可实时刷新的仪表盘和追踪器，数据来自你绑定的应用和文件

Claude 在 Cowork 里新增了一个能力：生成“活的”小组件，比如仪表盘或进度追踪器。这些组件不是静态截图，每次打开都会自动拉取最新数据。官方说数据源可以是你连上的应用和文件，但具体支持哪些应用、文件类型以及权限怎么管，正文都没提。我会先打个折，等看到实际集成列表再判断实用性。

#Tools#Product update

精选理由

HKR 三项全中：钩子是能连应用和文件的 live artifacts，每次打开自动刷新。这是 Claude 工作流能力的一次实在升级，天然有 Claude 热度加成。但公告没写清楚连接器范围、权限模型和推送节奏，信息缺口明显，所以我会先打个折，放在 78 分，不进 p1。

一句话点评

Claude 在 Cowork 里能直接生成可交互的仪表盘和追踪器了，但官方只发了标题，没给具体怎么连 App 和文件的细节。

锐评

这条更新把 Claude 从“写代码给你看”推到了“直接给你一个能用的工具”。在 Cowork 环境里，它能生成实时仪表盘和追踪器，并且声称可以连接到你自己的应用和文件。这意味着你不用再手动把数据搬来搬去，理论上可以让 AI 直接读取你的 Notion 页面或表格，生成一个动态更新的视图。但这里信息缺口很大。正文是空的，我们只知道一个标题。它具体支持接入哪些 App？连接方式是 OAuth 授权还是手动上传？实时刷新的延迟有多高？这些全都没说。如果只是接入了几个特定的云服务，那实用性会大打折扣。另外，这种“活”的制品一旦连上私人文件，权限和隐私怎么控制，也是必须搞清楚的问题。先别急着激动。等官方放出具体支持列表和操作演示，再判断它到底是真打通了工作流，还是只加了个好看的挂件。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

SCORE

H1·K1·R1

20:38

59d ago

● P1X · @AnthropicAI· x-apiEN20:38 · 04·20

Anthropic 与 Amazon 达成合作协议获得 5 吉瓦计算资源

Anthropic 宣布加深与亚马逊的合作，为训练和部署 Claude 锁定了最高 5 吉瓦的算力。这批算力从这个季度开始陆续到位，到 2026 年底预计先上线近 1 吉瓦。5 吉瓦是个什么概念？大概相当于几个大型数据中心的满负荷运转，说明他们接下来要把模型规模或服务量再往上拉一个台阶。不过正文没披露合同金额、具体用什么芯片、数据中心建在哪，所以实际成...

#Inference-opt#Tools#Anthropic#Amazon

精选理由

标题里的 5 吉瓦别直接信，那是远期上限，真正有谱的是今年底先到 1 吉瓦。正文没提合同金额、用什么芯片、数据中心在哪，所以成本结构和实际性能都还是问号。我会先打个折看交付节奏，但能在这个时间点锁产能，对 Anthropic 的训练和部署确实是颗定心丸。

一句话点评

Anthropic 和 Amazon 签了个大单，但 FT 正文被付费墙挡了，具体条款看不到。

锐评

Anthropic 官方博客确认了和 Amazon 扩大合作，目标是拿到最多 5 吉瓦的计算资源来训练和部署 Claude。5 吉瓦什么概念？大概相当于几个大型核电站的发电量，说明他们接下来对算力的胃口非常大。但 FT 标题里那个“1000 亿美元”的数字，Anthropic 自己的公告没提。HN 上的讨论提到 Amazon 先投了 50 亿，Anthropic 反过来承诺了 1000 亿的云消费——这个数字如果属实，更像是一份长期对赌协议，而不是一次性到账的投资。这点先别太激动，1000 亿是未来多年的总消费承诺，不是 Amazon 现在掏出来的现金。目前缺的是：这 5 吉瓦具体什么时候到位、分几年交付、以及 Anthropic 拿什么条件换来的。这些细节都没披露。

HKR 分解

hook ✓knowledge ✓resonance ✓

→ 打开信源

100

SCORE

H1·K1·R1

X 监控

更多

频道

后台