下个月 WWDC 苹果会展示 Siri 和端侧 AI 的升级,核心思路是把谷歌 Gemini 模型“蒸馏”成一个小号版本,直接在 iPhone 芯片上本地跑,主打隐私和省 token 费。但整个技术栈对外依赖很重:本地模型源自 Gemini 蒸馏,手机处理不了的复杂请求会路由到谷歌云,还用了英伟达的机密计算。苹果之前承诺的 Private Cloud ...
#Agent#Inference-opt#Tools#Apple
精选理由
这条消息我会先打个折,因为目前只有单一信源,正文没披露模型参数量、延迟、成本或合同细节。但它的信息量对从业者来说很实在:苹果在 WWDC 前被曝出用 Gemini 蒸馏模型救急,本地跑小模型保隐私,重活还是得走 Google 云和 Nvidia 机密计算,等于承认自研大模型没跟上。这个技术栈组合本身就说明苹果在端侧 AI 上选择了外部依赖,跟它一贯的全栈控制路线反差很大,所以给了 82 分,放在 featured 位置。
三家公司在同一天发了同一张“PC 新纪元”的预告图,指向一台传闻中由英伟达主导设计的笔记本 N1X。目前流出的配置是 20 核 Arm 架构 CPU、Blackwell GPU、6144 个 CUDA 核心和 128GB LPDDR5X 统一内存,听起来像一台给 AI 开发者准备的移动工作站。不过正文没披露具体跑分和实测数据,内存带宽和 x86 转译效...
#Inference-opt#Agent#NVIDIA#Microsoft
精选理由
我会先打个折:这目前是三家同一天发暗示拼出来的硬件传闻,发布日期、价格、量产计划正文都没给。但“英伟达自研 CPU 塞进笔记本”这个组合拳,加上 128GB 统一内存这种能跑大模型的规格,确实值得当一条强信号来看。先别太激动,等实锤。
一句话点评
英伟达、微软、Arm 同一天发了同一张预告图,指向一台 20 核 Arm CPU + Blackwell GPU 的笔记本,但正文没给任何跑分和实测数据,先别太激动。
锐评
这条消息最值得关注的点不是配置表,而是三家巨头在同一天用同一张图造势,说明这不是某个小厂的试水机,而是英伟达认真想推的“AI 开发者移动工作站”。目前流出的规格听起来很猛:20 核 Arm 架构 CPU、Blackwell GPU、6144 个 CUDA 核心、128GB LPDDR5X 统一内存。统一内存这个设计对跑大模型很友好,不用在 CPU 和 GPU 之间来回搬数据,理论上本地推理会快不少。
但正文没披露任何实测数据,连内存带宽都没提。Arm 架构跑 x86 软件要靠转译,效率打几折完全未知。128GB 内存看着大,如果带宽跟不上,跑大模型照样卡在数据搬运上。另外,这台机器到底卖多少钱、续航怎么样、软件兼容性如何,正文一概没说。这些才是决定它能不能用的关键,不是 CUDA 核心数。
我会先打个折看待这条消息。三家联合预告说明产品是真的,但“PC 新纪元”这种说法得等实测出来再判断。目前缺跑分、缺带宽、缺价格、缺续航,缺的东西比给的东西多。