FEATUREDr/LocalLLaMA· rssEN00:32 · 05·29
StepFun 3.7 Flash:196B 总参数、11B 激活的 MoE 模型,带 1.8B 视觉模块,能在 128GB 内存的本地机器上跑
StepFun 放出了 Step 3.7 Flash,一个混合专家(MoE)模型,总参数量 196B,但每次推理只激活 11B 参数,所以对算力要求没那么夸张。它内置了一个 1.8B 参数的视觉 Transformer(ViT),可以直接处理图像输入。官方说这个模型能在配备 128GB 内存的本地环境里运行,不用非得连云端。不过 Reddit 原帖被网...
#Agent#Multimodal#Code#StepFun
精选理由
StepFun 扔了个新模型,196B 参数但只激活 11B,还带了个 1.8B 的视觉模块,最抓眼球的是说能在 128GB 内存的机器上本地跑。我会先打个折:Reddit 上的信源比较散,授权协议、具体评测方法和能不能公开用都没说清楚,所以分数没给太高。但光凭这个规格和本地运行的承诺,对玩硬件和关注成本的人来说已经值得看一眼了。
一句话点评
StepFun 出了个196B总参数、推理只激活11B的混合专家模型,能跑图,官方说128GB内存本地可跑,但原帖被Reddit屏蔽,具体实测信息看不到。
锐评
这个模型的核心卖点是“大模型的身子,小模型的胃口”。196B总参数听着吓人,但混合专家架构让它每次推理只动用11B参数,对显卡和内存的压力小很多。官方说128GB内存就能在本地跑,还内置了1.8B参数的视觉模块,可以直接看图,这对想在本地玩多模态的人来说是个好消息。
不过现在能说的也就这么多。Reddit原帖被网络屏蔽,我们拿不到任何实测数据、跑分对比或者社区反馈。官方宣称的本地运行条件、推理速度、实际显存占用,以及那个视觉模块到底好不好用,正文都没披露。这点先别太激动,等有人真跑起来再说。
HKR 分解
hook ✓knowledge ✓resonance ✓