FEATUREDr/LocalLLaMA· rssEN15:26 · 05·17
MiroThinker-1.7 开源版深度研究 agent 发布,基于 Qwen3 MoE,mini 版总参数量 30B 但推理时只激活 3B
MiroMindAI 把他们的深度研究 agent MiroThinker-1.7 放出来了,权重直接挂在 HuggingFace 上。mini 版挺有意思:总参数量 30B,但用了 MoE(混合专家)架构,实际干活时只激活 3B 参数,所以对本地消费级硬件比较友好。上下文管理这块,他们用了滑动窗口 K=5 加 episode 重启的策略,相当于每轮对...
#Agent#Reasoning#Tools#MiroMindAI
精选理由
这条消息来自 Reddit 帖子,实验室也不是一线大厂,所以重要性我打个折,但信息量够上 featured。开源权重加上 MoE 的 30B/3B 配置,对想自己跑 deep research 的人是个实在的钩子;滑窗和 episode 重启的上下文管理方案也给了可复现的细节。正文没披露具体 tok/s 数据,这点先别太激动,但话题本身会引发本地部署的性能讨论,值得放出来。
一句话点评
30B 总参数只激活 3B 的 MoE 架构,本地跑深度研究 agent 的门槛又低了,但正文没披露实际推理速度。
锐评
MiroMindAI 把他们的深度研究 agent 放出来了,权重直接挂在 HuggingFace 上。mini 版用了 MoE 架构,30B 总参数但干活时只激活 3B,这对本地消费级硬件是个好消息——显存占用和推理延迟理论上会低不少。上下文管理用了滑动窗口 K=5 加 episode 重启的策略,相当于每轮对话只保留最近几轮的关键信息,超长任务跑崩的概率会小一些。
不过这条信息来自 Reddit 帖子,原文被屏蔽了,我们拿到的只是摘要。实际推理速度、显存占用、任务完成质量这些关键指标都没披露。MoE 模型在消费级硬件上的吞吐量波动很大,3B 激活参数不代表就能在树莓派上跑,还得看路由机制和内存带宽。另外深度研究 agent 的核心是工具调用和长链推理的稳定性,光看架构参数判断不了实际好不好用。
如果是真的,30B 模型只激活 3B 就能做深度研究,对本地部署场景确实挺省钱。但没看到实测数据之前,这点先别太激动。
HKR 分解
hook ✓knowledge ✓resonance ✓