华体会体育app官网华文大模子测评出炉: 豆包置身公共第一梯队小米MiMo上榜

2026-03-30 17:50 点击次数：148

快科技3月30日音书，华文大模子基准测评SuperCLUE发布2026年3月最新效果，22款国表里主流模子参与角逐。

字节跨越旗下豆包（Doubao-Seed-2.0-pro-260215(high)）以71.53分拿下国内第一，告捷置身公共第一梯队；小米集团的MiMo-V2系列两款模子均奏凯上榜。

本次测评粉饰数学推理、科学推理、代码生成等六大中枢任务，全面测验模子详尽才调。外洋闭源模子依旧占据总分前方，Anthropic的Claude-Opus-4.6(max)、Google的Gemini-3.1-Pro-Preview(high)和OpenAI的GPT-5.4(xhigh)分列前三。

豆包则紧随后来，总分仅与GPT-5.4进出0.95分，杀青全标的追逐，在智能体任务策动维度更是反超部分外洋模子，华体会体育置身公共前五。

小米这次有两款模子入选测评榜单，其中MiMo-V2-Pro以60.67分位列闭源模子前方，在数学推理任务中获取84.03分的亮眼收获；开源版块MiMo-V2-Flash虽以49.97分名次靠后，但在代码生成等细分场景中阐述出一定后劲。

测评还裸露，国产模子举座阐述亮眼，开源赛说念尤为隆起，Kimi-K2.5-Thinking、Qwen3.5-397B-A17B-Thinking等国产开源模子包揽开源榜前三，大幅率先外洋同类模子。

华体会体育app官网

AG百家乐APP官方网站

华体会体育app官网 华文大模子测评出炉: 豆包置身公共第一梯队 小米MiMo上榜