FEATUREDr/LocalLLaMA· rssEN17:33 · 05·14
MOOSE-Star:用 7B 小模型和 10 万篇论文做科学假设发现,ICML 2026 接收
MiroMind 放出了 MOOSE-Star 系列,包含三个 7B 模型和一个叫 TOMATO-Star 的数据集,里面有 108,717 篇 NCBI 论文。其中 MS-IR-7B 在“灵感检索”任务上准确率到了 54.37%,底子是 DeepSeek-R1-Distill-Qwen-7B,fp16 跑起来大概占 14GB 显存,支持 llama....
#RAG#Reasoning#Fine-tuning#MiroMind
精选理由
我会先打个折:正文没披露 54.37% 这个准确率是在什么基准上测的、对比了哪些方法,所以这个数字先别太激动。但整套东西的钩子很实在——用 7B 小模型加 10.8 万篇 NCBI 论文搭一个科学假设发现的流程,fp16 才 14GB,本地就能跑。对想做科研 RAG 或让模型进文献分析流程的团队来说,这是个现成的起点,数据集和模型权重都公开了。
一句话点评
一个7B模型在10万篇论文里找科研灵感,准确率刚过半,但能本地跑、显存只要14GB,值得试试看。
锐评
MiroMind 放出的 MOOSE-Star 是个专门从论文里挖科研灵感的模型,7B 参数,底子是 DeepSeek-R1-Distill-Qwen-7B。它带着一个叫 TOMATO-Star 的数据集,里面有 108,717 篇 NCBI 论文。其中 MS-IR-7B 这个版本在“灵感检索”任务上拿到了 54.37% 的准确率。
这个准确率不算高,但考虑到模型只有 7B,fp16 跑起来大概占 14GB 显存,还支持 llama.cpp、vLLM 和 SGLang,本地部署门槛很低。论文被 ICML 2026 接收,方法上应该有些新东西,但正文没披露具体是怎么训练和评估的,也没说这个准确率在同类任务里算什么水平。
我会先打个折:54% 的准确率意味着将近一半的检索结果可能不相关,实际用起来还得人工筛选。另外,数据集只覆盖 NCBI 论文,跨领域效果未知。如果是真的能在单卡上跑通科研灵感挖掘的流程,这个方向挺有意思,但离“好用”还有距离。
HKR 分解
hook ✓knowledge ✓resonance ✓