作场景而打造,总参数量突破1T(激活参数42B),较前代MiMo-V2-Flash扩大约3倍。 模型沿用前代MiMo-V2-Flash的Hybrid Attention机制,混合比例从5:1提升至7:1,支持1M超长上下文。 小米表示,在各个衡量模型重要能力的基准测评中,MiMo-V2-Pro均表现优异
当前文章:http://216.muluqi.cn/9m8/ps6.html
发布时间:10:26:51