ax@ax-radar:~/feed $ tail -f signal.log
40 srcsignal 12%cycle 04:32

热点聚合 · 2026-06-14

15 signals · updated 3m ago
live · 238 today·policy v2
AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·AI HOT 精选OpenAI 上市前连挖两人:Transformer 论文作者 Noam Shazee…88·AI HOT 精选SK 电信怎么卷进了 Anthropic 的 Mythos 出口管制风波86·AI HOT 精选GPT-5.5 Instant 把前沿健康问答能力带给了免费用户,医生盲评得分比真人写…82·THE VERGE · AIAnthropic 被自己人也看不懂的出口管制规则搞停了服务82·AI HOT 精选DeepSeek 识图模式在 App 和网页端上线,App 端仍标注“内测中”78·TECHCRUNCH AI各国想要美国 AI,但不想让美国能随时关掉它78·OPENAI 博客OpenAI 发布 LifeSciBench:由博士科学家出题、审题,专门考模型做真实…78·HACKER NEWS 首页本地 Qwen 不是缩水版 Opus,它是另一种工具78·COMPUTING LIFE · SHA推理模型四年史:你以为的石破天惊,其实早有暗线78·AI HOT 精选阿里开源 LOGOS 科学模型,用 1/56 参数量在多项任务上超过微软 Nature…78·AI HOT 精选开源模型当程序员助手够格吗?Hugging Face 拿自家代码库做了个摸底测试78·彭博科技微软靠转卖 OpenAI 模型在中国 AI 市场撕开一道口子78·
RSS live
2026-06-14 · 星期日2026年6月14日
22:04
4d ago
● P1Hacker News 首页· rssEN22:04 · 06·14
Bram Cohen 批评 Claude 变得过度杠精和防守
Bram Cohen 发现 Claude 从 Opus 4.7 开始变得爱抬杠,到 Fable 版本已经让人受不了。它会把每次对话都当成辩论,揪着无关紧要的语义细节不放,默认用户想骗它做坏事。他拿 Fable 和 Opus 4.6 做对比测试,连旧版模型都觉得 Fable 的回复很烦人。Cohen 推测了四个原因:一是安全对齐的护栏做得太过火,把防越狱...
#Code#Anthropic#Claude Opus 4.6#Claude Opus 4.7
精选理由
这是一篇带名字、带版本号、带实验方法的第一人称吐槽。Bram Cohen 拿 Claude Opus 4.6 和 Fable 做对照,连旧模型都觉得新模型烦人,把“安全对齐做过头”这个问题讲得很具体。标题自带传播力,内容有干货,不是官方公告但踩中了社区高频抱怨,78 分放在 featured 档位合理。
一句话点评
Bram Cohen 说 Claude 从 Opus 4.7 开始变得爱抬杠,Fable 版最严重,连代词指谁都常搞错。
锐评
Bram Cohen 的体验是 Claude 越来越像在跟你吵架,而不是帮你干活。他点名 Fable 版本最严重,动不动就把对话当成辩论,揪着无关紧要的语义细节不放,还总预设你在诱导它干坏事。他猜测原因可能有几个:一是安全护栏加得太糙,模型默认把用户当坏人防;二是为了纠正“过度讨好”而矫枉过正,训练它多争论,结果变成了无礼抬杠;三是训练数据里可能混进了太多论坛骂战或员工对话,学了一身阴阳怪气。还有一个更根本的观察:Claude 的聊天能力在持续退化,和编程能力的提升成反比。Fable 连代词指代都经常猜错,而这是早期 ChatGPT 就能稳定做对的基准测试。Cohen 认为行业只看编程跑分,没人关心聊天质量,这个问题只会更糟。不过文章没给出系统性的对比测试数据,所有判断都基于他个人的使用感受和与旧版 Opus 4.6 的交叉询问,样本量有限。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
14:44
4d ago
● P1Hacker News 首页· rssEN14:44 · 06·14
Gabriel Weinberg 数据分析:美国仅三分之一人活跃使用AI
DuckDuckGo 创始人 Gabriel Weinberg 引用了盖洛普、微软遥测和 Datos 等多家数据,指出美国 AI 使用情况更接近“三分之一活跃、三分之一偶尔、三分之一不用”。其中,Z 世代的使用率同比几乎没涨,但对 AI 的愤怒情绪涨了约 40%。人们限制使用的主要原因包括担心失业、侵犯隐私、传播错误信息,以及觉得 AI 用处不大。文章...
#Gabriel Weinberg#Gallup#Microsoft
精选理由
DuckDuckGo 创始人拿多来源数据反驳行业共识,把美国用户分成清晰的三档,还点出 Z 世代使用率没涨但愤怒值涨了四成。我会先打个折,因为这是评论而非产品发布或研究论文,但数据扎实、角度稀缺,给 featured 没问题。
一句话点评
美国只有约三分之一的人在积极用 AI,跟“人人都在用 AI 做所有事”的叙事差很远。
锐评
Gabriel Weinberg 把好几份 2025-2026 年的调查和实际使用数据拼在一起,结论很直接:美国人对生成式 AI 的使用大致是“三分之一活跃、三分之一偶尔、三分之一从来不用”。微软基于后台遥测的数据显示,约 30% 的美国劳动年龄人口每月使用 AI 至少 90 分钟,Datos 的桌面访问数据也指向约 20% 的人每月访问 AI 工具 10 次以上。这些数字跟盖洛普对 Z 世代的追踪基本对得上——Z 世代里仍有近两成人完全不用 AI,三成多的人只是每月或几个月用一次。 值得留意的是,过去半年到一年里使用率没怎么涨,但负面情绪涨了不少。盖洛普的数据里,Z 世代对 AI 感到愤怒的比例同比跳升了约 40%。Searchlight Institute 的调查给出了原因:人们最担心的是 AI 抢饭碗(42%)、侵犯隐私(35%)和传播虚假信息(33%),而且多数人宁愿美国放慢 AI 发展速度也要先把安全和隐私规则立好。另外,受访者对 AI 社会影响的净正面评价只有 +8%,跟加密货币差不多,说明很多人还没觉得这东西真有用。 文章没给出“活跃使用”的精确定义在不同调查之间是否完全可比,也没深入分析不用 AI 的人群是“用不起、不会用、还是不想用”。如果只看美国市场,这个三分之一的比例对做 AI 产品的人来说是个重要的现实校准:你的潜在用户可能远没有你想象的那么多,而且抵触情绪在变强。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
14:01
4d ago
● P1Hacker News 首页· rssEN14:01 · 06·14
KPMG撤回AI报告 因文中引用造假和AI幻觉
KPMG 发了一份讲自己员工怎么用 AI 的报告,被 TechCrunch 发现里面引用的学术论文根本不存在、提到的公司否认参与过相关项目、数据也对不上公开来源,整份报告很可能是用 AI 生成时编出来的。KPMG 随后撤回了报告,只说“没达到质量标准”,没解释是哪个环节出了问题,也没说会不会出修正版。
#KPMG
精选理由
KPMG 用 AI 写 AI 报告被当场抓包,编造引用和数据,讽刺感和证据都很足。但 KPMG 的回应太模糊,没披露根因,故事停在“被抓包”这一步,深度有限,所以分数没给到 featured 级别。
一句话点评
毕马威一份鼓吹AI好处的报告,被扒出引用了AI自己编的数据和案例,报告已撤回。这事讽刺在:四大审计行自己都分不清AI真话假话,还敢教企业怎么用AI。正文没披露具体编了哪些数据,但撤回本身说明问题不小。对AI从业者的提醒:别迷信大机构背书,幻觉不分贵贱。
HKR 分解
hook knowledge resonance
打开信源
90
SCORE
H1·K1·R1
14:00
4d ago
● P1彭博科技· rssEN14:00 · 06·14
苹果新Siri功能改进测试:跨应用操作和屏幕理解能力
Bloomberg 的 Mark Gurman 在 iOS 27 和 macOS 27 上实测了新 Siri。它能看懂屏幕上的内容,也能跨 App 干活——比如用一句语音指令找到一张照片、编辑后再通过信息发出去。复杂任务还是要等 11 秒以上,偶尔会漏步骤。Gurman 的评价是“刚好够用”:比老 Siri 进步巨大,但仍落后于 Google Astr...
#Agent#Multimodal#Apple#Siri
精选理由
Gurman 的实测比官方演示更有参考价值,因为他直接报了延迟和失败情况。我会先打个折:这不是正式发布,只是开发者预览版的表现,而且他自己也承认仍落后于 Google Astra。分数定在 78,是因为这算一次重要的进度检查,但远没到“成了”的程度。
一句话点评
新Siri能跨应用操作和看懂屏幕了,但实测表现只是“刚好够用”,别指望它一步登天。
锐评
彭博记者上手了苹果新版Siri,结论是它终于能做一些跨应用操作和屏幕内容理解了,比如从短信里提取地址直接导航,或者根据屏幕上的餐厅信息帮忙订位。这些功能让Siri从“语音开关”变成了能干活的小助手,算是勉强追上了竞争对手几年前的水平。 但文章也直说,这版Siri只是“刚好够用”来缓解苹果的AI危机,远没到惊艳的程度。测试中暴露了响应延迟和部分场景理解不准的老毛病,而且这些改进目前还锁在iOS 27和macOS 27的测试版里,普通用户摸不到。文章没给出具体的任务成功率或延迟数据,只说有“7个改善例子”,所以实际稳定性和覆盖范围还得等大规模公测才能验证。 最关键的缺口是:苹果没公布这些功能背后的模型规模、是本地跑还是云端跑,以及耗电和隐私处理细节。如果全是云端大模型撑着,那离线场景和响应速度可能还是硬伤。
HKR 分解
hook knowledge resonance
打开信源
88
SCORE
H1·K1·R1
00:03
5d ago
● P1TechCrunch AI· rssEN00:03 · 06·14
Meta开始拆解二十亿美元Manus收购交易
TechCrunch 发了一条标题快讯,说 Meta 已经开始拆解对 AI 公司 Manus 的 20 亿美元收购案,原因是北京方面下令交易必须逆转。正文没披露北京的具体理由、时间表,也没说 Meta 打算怎么拆——目前只有一句话,我会先打个折,等后续报道补细节。
#Meta#Manus#Policy
精选理由
20 亿美元收购被北京叫停,故事本身分量很重,但现在只有一条标题快讯,没理由、没时间、没拆法,只能先打个折。等后续报道补上细节再重新评估。
一句话点评
Meta 开始拆解 20 亿美元收购 Manus 的交易,直接原因是北京以国家安全为由要求撤销。这笔钱能不能拿回来、怎么拿,正文没细说。
锐评
这事说白了就是一笔大买卖被地缘政治卡住了。Meta 花 20 亿美元买下中国团队创办的 AI 公司 Manus,现在北京下令必须吐出来,Meta 已经切断了 Manus 访问内部系统的权限,员工也不能再用 Manus 的工具做内部项目。这是两个月前北京否决交易以来,Meta 最实质的退让动作。 目前能看到的信息主要来自彭博的报道,TechCrunch 做了转述。Manus 的联合创始人已经在聊新一轮融资,大概想筹 10 亿美元来把公司从 Meta 手里买回去。但 10 亿和当初的 20 亿之间差了一倍,这笔账怎么算平,报道里没提。Meta 官方也没公开回应拆解进度和财务处理方式。 还缺几个关键信息:Meta 已经付了多少钱、有没有违约金条款、Manus 的技术和人员会不会回流中国。这些直接决定这笔交易最后是亏是赚,但正文都没披露。
HKR 分解
hook knowledge resonance
打开信源
92
SCORE
H1·K0·R1

更多

频道

后台