新闻资讯

小米开源首个推理大模型Xiaomi MiMo

  新浪科技讯 4月30日上午消息,小米开源首个为推理(Reasoning)而生的大模型‘Xiaomi MiMo’,联动预训练到后训练,全面提升推理能力。

  据介绍,在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

  随着DeepSeek-R1引发业界强化学习(RL)共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。在相同RL训练数据情况下,MiMo-7B 的数学&代码领域的强化学习潜力显著领先。

  值得注意的是,MiMo-7B全系列模型均已开源。据了解,MiMo 来自小米全新成立不久的“小米大模型Core团队”的初步尝试。(闫妍)

  • 阿里深夜突袭,Qwen3登顶全球最强开源模型!AI催化不断,把握核心互联网,阿里健康涨逾8%
  • 马斯克宣布“隐退”后特朗普政府拟加强对联邦雇员的人事管控
  • 今晚一码一肖免费公开,揭秘中奖秘籍!
  • 德国下调经济增长预期 预计经济今年将陷入停滞
  • 一季度净利30.2亿 同比增长11.4% 上汽发布2024年年报及2025年一季报
  • 欣灵电气一季度净利润同比降5% 营收同比增8.2%
  • 大众汽车第一季度利润锐减40% 美国关税政策令前景蒙上阴影
  • 春立医疗早盘一度涨超18% 中银证券给予买入评级
  • 这就是上海!
  • 长安期货范磊:板块波动加剧 沥青强势或逐步展现
  • ST摩登:公司股票被实施退市风险警示,停牌一天
  • 美国3月成屋销售创2009年以来同期最低
  • 早睡1小时,变化有多惊人?第一个就没想到
  • 石油大亨、特朗普最大的业内捐款人之一誓言只购买美国制造的设备
  • 民航局:持续推动国际客运增班鼓励航司布局新兴市场
  • 关键词: