ax@ax-radar:~/feed $ tail -f signal.log
40 srcsignal 11%cycle 04:32

热点聚合 · 2026-05-29

35 signals · updated 3m ago
live · 238 today·policy v2
AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选Sumi:从头训练的 7B 开源均匀扩散语言模型78·
RSS live
2026-05-29 · 星期五2026年5月29日
19:16
20d ago
● P1Hacker News 首页· rssEN19:16 · 05·29
Shift 启动免费家务清洁服务用于机器人训练数据采集
一家叫 Shift 的初创公司提出免费帮人打扫房子,条件是允许它记录整个清洁过程,用来训练未来的家务机器人。正文没披露具体在哪些城市提供服务、怎么收集数据(比如用摄像头还是传感器),也没说机器人什么时候能落地。想法挺直接:用真人干活的数据喂模型,比在实验室里模拟更真实。但数据隐私、用户筛选这些关键细节都还没公开,先别太激动。
#Robotics#Shift#The Verge#Hacker News
精选理由
HKR-H 和 HKR-R 通过:免费清洁住宅换机器人训练数据,这个数据换劳动的钩子很锋利,容易引发讨论。HKR-K 不通过:RSS 正文只确认了免费清洁,没披露覆盖城市、采集机制或机器人时间表,信息缺口明显,所以这条留在 all 里。
一句话点评
用免费保洁换你家的动作数据来训机器人,隐私条款和采集范围正文没细说,先别急着报名。
锐评
Shift 这家公司搞了个很直接的交换:派人上门免费做家务,同时用摄像头和传感器记录整个清洁过程,拿这些数据去训练未来的家务机器人。商业模式上就是用劳动力换训练数据,比纯实验室采集更贴近真实家庭环境。 但正文只给了标题和摘要,关键信息全是缺口:采集哪些数据、摄像头拍什么范围、数据怎么存储和授权、用户能不能要求删除,这些都没披露。免费保洁听着划算,但你家可能变成机器人公司的训练场,隐私代价得自己掂量。另外也没说目前采集了多少家庭、数据质量怎么样、模型训练效果有没有验证。 对从业者来说,这种真实场景的动作数据确实稀缺,如果隐私和合规框架能跑通,采集成本会比实验室方案低很多。但在看到完整的隐私协议和数据处理流程之前,这个模式还停留在“想法有意思,落地待观察”的阶段。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K0·R1
17:46
20d ago
● P1Hacker News 首页· rssEN17:46 · 05·29
Robinhood 允许 AI agent 交易股票
Robinhood 宣布开放接口,允许用户的 AI 代理直接进行股票交易。正文没披露具体怎么控制风险、权限边界划在哪、哪些用户能用、收不收费,也没说什么时候全面上线。目前只有 TechCrunch 一篇报道和 Hacker News 上 21 个赞、16 条讨论,信息量有限。让 AI 替你管钱听着刺激,但没看到风控细节前,我会先打个折。
#Agent#Tools#Robinhood#TechCrunch
精选理由
标题很炸,但正文几乎没给料。我会先打个折:Robinhood 确实放出了这个信号,但没交代风控机制和上线范围,现在只能当个方向性信号看。H 和 R 都够强——代理碰钱这件事本身就自带争议和监管风险;K 直接不及格,因为关键细节全是空白。所以分数卡在 74,不往上拉。
一句话点评
Robinhood 开了个口子,让 AI 直接拿你的钱炒股。钱锁在独立钱包里,亏完拉倒,不会动你主账户。
锐评
Robinhood 正式允许用户创建独立账户,让 AI agent 直接买卖股票。这些 agent 能读取你的持仓、分析数据、生成策略,但只能动用你预先转入专用钱包的那笔钱,主账户资金不受影响。每笔交易都会推送通知,部分订单需要用户手动批准才能执行。 这个设计相当于给 AI 划了个沙盒:你往里放一笔亏光了也不心疼的钱,让它自己跑。TechCrunch 的报道没披露 agent 的决策模型具体怎么运作、回测表现如何,也没提风控细节——比如市场剧烈波动时会不会自动熔断。Robinhood 同时推出了 agent 信用卡,但正文同样没解释信用额度由谁审批、责任怎么划分。 目前最缺的是真实用户的盈亏数据和监管态度。让 AI 管钱听着酷,但如果只是把散户情绪化交易换成模型幻觉驱动,风险一点没少。这点先别太激动。
HKR 分解
hook knowledge resonance
打开信源
94
SCORE
H1·K0·R1
14:00
20d ago
● P1TechCrunch AI· rssEN14:00 · 05·29
Aaron Levie认为多数CEO高估了AI对工作岗位的替代能力
Box创始人Aaron Levie说很多CEO搞不清AI到底能替代什么工作,他把这叫做“AI精神病”。他举例ClickUp最近裁了22%的员工,换成AI agent干活。2026年科技公司裁员人数已经快赶上2025全年了。Levie认为,最不懂你工作内容的人,恰恰是决定AI能不能取代你的人。正文没披露播客里完整的争论细节。
#Agent#Aaron Levie#Box#ClickUp
精选理由
Levie 的“AI 精神病”说法有话题性,加上 ClickUp 裁员 22% 这个实锤,H 和 R 都够强。但 K 只靠一个数字撑着,播客里的完整论证正文没披露,所以分数压在 60–71 区间。
一句话点评
Box 创始人 Aaron Levie 把 CEO 们高估 AI 替代能力叫“AI 精神病”,因为拍板裁人的人往往最不懂一线岗位在干什么。
锐评
Aaron Levie 给这种现象起了个很直白的名字——“AI 精神病”,指的就是管理层对 AI 能力的判断已经脱离实际。核心矛盾在于:决定用 AI 替换岗位的人,恰恰是最不了解那些岗位具体做什么的人。文章举了 ClickUp 的例子,这家公司最近裁了 22% 的员工,直接让 AI 代理顶上。TechCrunch 还提到,2026 年刚过半,科技行业的裁员规模已经快赶上 2025 全年了。 这些数字说明,用 AI 替代人力的冲动正在加速,但文章没给出任何数据来证明替代后的效率或产出是否真的持平。Levie 的观点更多是基于观察和行业直觉,而不是对照实验。我会先打个折:这更像一个警示,而不是一份诊断报告。 还缺什么?缺被裁岗位的具体类型、AI 代理接手后的实际表现数据,以及这些公司后续的营收或客户满意度变化。没有这些,我们很难判断这到底是理性降本,还是管理层在拿组织做一场高风险实验。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
05:15
20d ago
● P1新智元 · 公众号· rssZH05:15 · 05·29
Claude Opus 4.8 实测:高级工程师基准冲到 63 分,但高强度任务掉到 42 分,Max 用户几小时就撞速率墙
这篇来自新智元的实测文章目前页面被微信环境验证挡住了,正文内容没抓到。从标题和摘要信息看,Claude Opus 4.8 在 Extra-High 级别的高级工程师基准测试里拿了 63 分,比上一代 Opus 4.7 高出 30 分,这个涨幅挺夸张。但切换到 High 强度任务时分数掉到 42 分,说明模型在持续高压场景下稳定性还有问题。另外,每月 2...
#Agent#Reasoning#Code#Anthropic
精选理由
Anthropic/Claude 相关度天然高,加上有实测跑分和配额吐槽,HKR 三项都站得住。钩子是强但贵且 High 档拉胯,K 有基准分和额度细节,R 直接戳中 Agent 场景下的成本焦虑。来源是媒体评测而非官方公告,所以定在 P1 低位。
一句话点评
Claude Opus 4.8 在高级工程师基准测试里拿了 63 分,比上一代涨了 30 分,但高强度任务下掉到 42 分,稳定性存疑。每月 200 美元的 Max 用户跑复杂 agent 任务几小时就撞速率限制,贵且不耐用。
锐评
这条消息最值得看的是两个数字:63 分和 42 分。Opus 4.8 在 Extra-High 级别的高级工程师基准上拿了 63 分,比 Opus 4.7 高出 30 分,涨幅确实夸张,说明模型在单次高难度推理任务上进步明显。但切换到 High 强度任务时分数掉到 42 分,差了 21 分,这个落差说明模型在持续高压场景下不够稳,可能跟资源分配或推理策略有关。 另一个关键信息是定价和实际体验的脱节。每月 200 美元的 Max 订阅用户反馈,跑复杂 agent 任务几小时内就撞速率限制,等于花了大价钱却用不爽。正文因为微信页面被验证挡住,没抓到具体测试方法和样本量,所以 63 分这个数字的含金量要打折——不知道是几道题、什么题型、有没有对比其他模型。 还缺的信息:Opus 4.8 在代码、长文本、多轮对话上的表现如何,以及 Anthropic 有没有调整推理成本结构。如果只是峰值高但日常用起来卡手,那这个"封神"更多是实验室里的神。
HKR 分解
hook knowledge resonance
打开信源
86
SCORE
H1·K1·R1
03:00
20d ago
● P1OpenAI 博客· rssEN03:00 · 05·29
OpenAI推出Rosalind Biodefense生物防御工具
OpenAI 宣布了两件事:一是启动 Rosalind Biodefense 项目,赞助经过审查的开发者用 GPT‑Rosalind 模型去搭建生物防御工具,比如流行病建模、早期检测、DNA 合成筛查这些;二是把 GPT‑Rosalind 的访问权限扩大给部分美国政府和盟友机构,用于公共卫生和生物防御任务。正文没披露具体定价、配额、上线时间表,也没给出...
#Safety#OpenAI#Product update#Safety/alignment
精选理由
这篇是 OpenAI 给生物防御模型开闸的公告,但正文只说了谁能用,没提价格、名额和具体上线时间。我会先打个折:信息增量就卡在“开放给谁”这一步,实际落地规模完全没交代。标题的安全钩子够硬,所以能进 featured,但别指望看到成本或效果数据。
一句话点评
OpenAI 把最强的生物模型开放给特定合作方做防御工具,但正文没披露任何实测数据,效果先打五折。
锐评
OpenAI 推出了一个叫 Rosalind Biodefense 的项目,简单说就是把自家最强的生物推理模型 GPT‑Rosalind 拿出来,给经过审查的开发者和政府机构用,让他们去建疫情预警、DNA 合成筛查这类防御工具。这相当于 OpenAI 在生物安全上选了一条“只帮防守方”的路,通过控制谁能用模型来降低滥用风险。 目前公布的第一批合作方包括做 DNA 合成筛查的 Fourth Eon 和 SecureDNA 等,方向覆盖从早期检测到医疗对策开发。但整篇公告没给出任何关于 Rosalind 在这些任务上的准确率、误报率或实际部署效果的量化数据,也没说明“经过审查”的具体门槛是什么。 还缺的是:这个模型在真实生物防御场景下比现有工具好多少,以及 OpenAI 打算怎么持续评估这些合作方有没有把模型用在别的地方。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K1·R1

更多

频道

后台