FEATUREDr/LocalLLaMA· rssEN09:05 · 06·12
华为发布 openPangu 2.0,6 月 30 日开源:Pro 版总参数 505B 但只激活 18B
华为在 HDC 2026 上发了 openPangu 2.0,两个版本都是稀疏模型,Pro 版总参数 505B、实际干活只激活 18B,Flash 版总参数 92B、激活 6B,稀疏比拉到 28:1。上下文窗口 512K,专门为昇腾芯片做了优化,单卡吞吐量号称是主流开源模型的 2 倍。余承东解释总参数量做这么大,是因为华为把大部分算力分给了其他国内企业...
#Huawei#Richard Yu#openPangu 2.0#Open source
精选理由
华为在 HDC 上发了 openPangu 2.0,两个版本都是稀疏模型,Pro 版总参数 505B、激活 18B,Flash 版总参数 92B、激活 6B,上下文窗口 512K,6 月 30 号开源。28:1 的稀疏比是个技术钩子,昇腾单卡 2 倍吞吐的宣称需要独立验证,所以分数没给到 80 以上。余承东说总参数量做这么大是因为华为把大部分算力分给了其他国内企业,这个解释有点意思,但正文没展开讲具体怎么分的。
一句话点评
华为把模型总参数堆到505B但实际只激活18B,稀疏比28:1,说是算力不够才这么干。这点先别太激动,正文没给绝对跑分,只有相对提升百分比。
锐评
openPangu 2.0 走了一条很极端的稀疏路线:Pro 版总参数 505B,干活时只激活 18B,Flash 版 92B 里激活 6B,稀疏比拉到 28:1。余承东的解释挺直白——华为把大部分算力分给了其他国内企业,留给自己的不多,所以重点放在降低延迟和提升吞吐量上。上下文窗口给到 512K,专门为昇腾芯片优化,单卡吞吐量号称是主流开源模型的 2 倍。
这些数字听起来不错,但眼下能判断的东西有限。帖子只给了相对提升的百分比,没有 MMLU、HumanEval 这类绝对分数,也没说跟哪个具体模型比。6 月 30 号开源时会放出权重、推理代码、训练代码和训练算子,到时候才能验证实际效果。另外,512K 长上下文在实际任务里的召回率、注意力衰减情况也没提,这些对长文档处理比窗口大小本身更重要。
如果是真的,单卡吞吐翻倍对本地部署挺省钱,但前提是得用昇腾卡跑,通用 GPU 上的表现还是未知数。
HKR 分解
hook ✓knowledge ✓resonance ✓