小米推出三款自研大模型,雷军称今年在AI领域将投入超160亿

频道:综合广播 日期: 浏览:3

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

  3月19日,小米宣布推出三款自研大模型Xiaomi MiMo-V2-Pro、Xiaomi MiMo-V2-Omni与Xiaomi MiMo-V2-TTS。据悉,MiMo-V2-Pro、MiMo-V2-Omni已正式开放API服务。

  据小米官方介绍,三款模型中,MiMo-V2-Pro 是旗舰文本基座,专为高强度 Agent 工作场景而生,主打推理、规划与工具调用。MiMo-V2-Omni 是全模态 Agent 基座,原生融合文本、视觉与音频感知,打通从理解到执行的完整链路。MiMo-V2-TTS 是语音合成大模型,目标是为 Agent 赋予有温度、有情感的声音表达能力,构成全栈的最后一环。

  MiMo-V2-Pro作为旗舰基座模型,专为Agent场景深度优化,针对复杂多样的智能体架构进行了监督微调和强化学习,具备更强工具调用与多步推理能力,并最终交付结果。从架构上看,该模型总参数规模突破1万亿(1T),其中激活参数为42B,采用改进后的混合注意力机制(Hybrid Attention),在保证推理效率的同时大幅提升模型容量。其上下文窗口进一步扩展至100万Token,可以支持超长任务链和复杂工作流。

  同步亮相的MiMo-V2-Omni与MiMo-V2-TTS,则补齐了感知与表达的两块拼图。前者的核心价值在于实现了音频、图像、视频的对齐。后者支持细粒度控制的情感表达引擎,让Agent具备了更接近人类的表达能力。

  定价方面,MiMo-V2-Pro的API价格比同级别竞品低。256K上下文以内,输入每百万tokens定价1美元,输出3美元;1M 上下文范围内,则为输入2美元,输出6美元。目前,MiMo-V2-Pro已正式开放API服务。MiMo-V2-Omni也已开放API,支持256K上下文长度,输入定价每百万tokens 0.4美元,输出2美元。

  MiMo-V2-Pro 和Claude的API服务收费标准

  此外,小米还联合 OpenClaw、OpenCode、KiloCode、Blackbox及Cline五大Agent 框架团队,提供为期一周的限时免费接口支持,进一步推动其在开发者社区的渗透。

  这也被视为小米全面押注智能体(Agent)时代的重要信号。当天一早,小米创始人雷军在社交平台发文称:“在AI领域,我们今年的研发和资本投入就将超过160亿元。”

  据雷军透露,万亿参数大模型 MiMo-V2-Pro在全球大模型综合智能排行榜 Artificial Analysis 上,位列全球第八。按大模型品牌来排名,排在全球第五。“我们模型刚刚完成,未来一段时间,还会快速迭代增强。”

  值得一提的是,小米MiMo大模型负责人罗福莉也在社交平台公开表示,此前上线的“Hunter Alpha”正是旗舰模型MiMo-V2-Pro的内部测试版本。95后罗福莉被业界称为“AI才女”。

  3月11日,代号为“Hunter Alpha”的神秘模型上线全球更大API聚合平台OpenRouter。据悉,短短七天,该模型累计调用量突破1万亿Token,连续多日登顶榜单,引起热议,一度被误认为是“DeepSeek V4”的早期版本。。

  巧合的是,罗福莉曾在DeepSeek任职。她的职业生涯始于阿里达摩院,主导开发了多语言预训练模型VECO,并推动了AliceMind的开源工作。2022年,罗福莉加入DeepSeek母公司幻方量化从事深度学习相关工作,后又担任DeepSeek的深度学习研究员,参与研发DeepSeek-V2等模型。

  去年12月,在小米“人车家全生态”合作伙伴大会上,罗福莉首次公开亮相。

  12月17日,小米集团合伙人、集团总裁卢伟冰宣布小米自研AI大模型Xiaomi MiMo-V2-Flash正式开源上线。卢伟冰当时透露,小米已在AI领域启动“压强式投入”,大模型与应用进展“远超预期”,未来将聚焦“AI与物理世界的深度结合”这一核心方向。