小米开源首个推理大模型 曾说不做OpenAI类大模型,现开出百万元年薪给团队“招兵买马”

花花2025-05-02债务科普50

每经记者 杨卉每经编辑 魏官红

曾说不做OpenAI类大模型的小米变了。

4月30日,小米开源其首个推理大模型Xiaomi MiMo,同时公开了一个此前未曾公开露面的团队:小米大模型Core团队。根据小米自己的说法,该模型只是团队的初步尝试。至于为何还是赶了“晚班车”,小米方面称,2025年虽看似是大模型逐梦的后半程,不过还是坚信AGI(通用人工智能)征途仍漫长。

参数方面,根据介绍,小米经强化学习训练形成的MiMo-7B-RL模型,在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,用7B参数规模,得分超过了OpenAI的闭源推理模型o1-mini和阿里Qwen开源推理模型QwQ-32B-Preview。

在这篇推介自家大模型的文章末尾,小米还默默公开了一个简历投递邮箱,为刚成立不久的团队“招兵买马”。

《每日经济新闻》记者注意到,在部分招聘软件上,小米已经上线了大量与大模型相关的招聘信息,如“大模型算法专家”“大模型推理工程师”“大模型数据策略工程师”等,其中公布的年薪最高可达128万元。此外,从招聘详情里也能看到小米给大模型落地找到的一些场景,如智能门锁、智能音箱、智能招聘、AI(人工智能)面试、AI会议助理、AI办公助手、智能客服、智能审核等,大多与其自身现有业务或产品相关。

4月30日,一个顶着黑底白字头像的微信公众号仅凭首条推送,就单枪匹马掀起了大模型产业的又一轮热议。仔细来看,这个头像传递的信息简单且直接,黑色背景内的一行白字说明了来处:Xiaomi MiMo;账户归属为北京小米移动软件有限公司,于4月24日将新注册公众号改名为“Xiaomi MiMo”。

改名后不到一周,小米放出个“大招”,直接官宣开源首个推理大模型。

根据推文内容,从参数来看,随着DeepSeek-R1引发业界强化学习(RL)共创潮,DeepSeek-R1-Distill-7B和Qwen2.5-32B已成为广泛使用的强化学习起步模型。根据小米方面的说法,Xiaomi MiMo是公司首个为推理而生的大模型,可联动预训练到后训练。在数学推理(AIME 24-25)和代码竞赛(LiveCodeBench v5)公开测评集上,MiMo用7B的参数规模,超越了OpenAI的闭源推理模型o1-mini和阿里Qwen更大规模的开源推理模型QwQ-32B-Preview。

图片来源:微信公众号“Xiaomi MiMo”推文截图

图片来源:微信公众号“Xiaomi MiMo”推文截图

值得关注的是,小米这次开源的模型参数规模只有7B,这就意味着可以在端侧设备上进行本地运行,主打一个经济高效。

至于推文中提到的预训练和后训练,据悉,MiMo推理能力的提升是由预训练和后训练阶段中数据和算法等多层面的创新联合驱动。其中,预训练的核心是让模型见过更多推理模式,着重挖掘富推理语料,并合成约200B tokens推理数据。训练方面共进行了三阶段训练,逐步提升训练难度,总训练25T tokens。

而后训练的核心则是高效稳定的强化学习算法和框架,其算法提出Test Difficulty Driven Reward来缓解困难算法问题中的奖励稀疏问题,并引入Easy Data Re-Sampling策略,以稳定RL训练。框架方面,设计了Seamless Rollout系统,使得RL训练加速2.29倍,验证可加速1.96倍。

小米方面称,MiMo是新成立不久的小米大模型Core团队的初步尝试。其实,严格来说,小米的大模型团队Core虽然是第一次带着作品亮相,但小米有大模型团队这件事并不是“全网首秀”,小米集团早在2023年4月就组建了AI实验室大模型团队。

值得深究的是,大模型火热至今,已经从“卷”参数、“卷”模型进入了“卷”落地应用的“下半程”,小米此时赶这个“晚班车”意欲何为?

其实,小米曾公开表示不会做大模型。2023年5月24日,小米集团披露了2023年第一季度业绩,小米集团总裁卢伟冰还在同日的电话财报会上谈到了彼时大厂开启的“大模型竞赛”。那时,卢伟冰直言,小米集团不会做OpenAI类的大模型,但会积极拥抱AI,将其与自身业务深度结合,提高智能化水平。

时隔两年,小米的态度为何变了?4月30日下午,《每日经济新闻》记者向小米集团方面咨询大模型团队的更多信息,截至发稿未获有效回复。不过,根据微信公众号Xiaomi MiMo的推文,小米显然也意识到了现在入场并不算早。至于入场原因,小米方面的说法是:“2025年虽看似是大模型逐梦的后半程,但我们坚信AGI的征途仍漫长。”

值得关注的是,不管原因为何,小米集团在做大模型这件事上确实“上心”了。《每日经济新闻》记者注意到,在某招聘平台上,北京小米移动软件有限公司,也就是Xiaomi MiMo公众号的账号归属方,已经开始了“招兵买马”,放出大量与大模型相关的岗位招聘信息。

具体来看,在招岗位不少,有“大模型算法”“大模型推理工程师”“大模型数据策略工程师”“大模型高性能优化工程师”“多模态大模型算法工程师”“端到端大模型算法工程师”“具身大模型算法工程师”等,部分招聘信息中还写明了“急招”。

图片来源:招聘软件截图

相关文章

“对等关税”后,美国人生活变贵了:一双运动鞋涨100美元,新车涨1万美元

“对等关税”后,美国人生活变贵了:一双运动鞋涨100美元,新车涨1万美元

美国总统特朗普打出的“关税子弹”,最终射中的,恐怕是普通美国老百姓。 当地时间4月9日,美国的所谓对等关税政策正式落地生效。 根据特朗普签署的行政令,美国此前已于4月5日开始对所有贸易伙伴加征10%的...

翁富豪:技术性回调还是趋势反转 黄金下周操作策略

翁富豪:技术性回调还是趋势反转 黄金下周操作策略

5月18日,周五(5月16日)国际黄金价格出现下滑,并可能录得六个月以来的最大单周跌幅。这一走势主要归因于美元的走强以及中美贸易战担忧的缓解,这些因素共同削弱了黄金作为避险资产的吸引力。金价在周五一度...

行业组织称欧盟应将半导体领域支出增至四倍

行业组织称欧盟应将半导体领域支出增至四倍

行业组织国际半导体产业协会(SEMI)周二在其针对欧盟即将出台的投资预算所进行的咨询的官方回复中表示,欧盟应将其在芯片领域的支出增加到原来的四倍,并为此单独拨出一笔预算。 欧洲的立法者和行业组织正积极...

证监会副主席李明:社保、保险、年金等中长期资金累计净买入A股超过2000亿 A股稳中有涨良性循环正在形成

证监会副主席李明:社保、保险、年金等中长期资金累计净买入A股超过2000亿 A股稳中有涨良性循环正在形成

专题:深交所2025全球投资者大会:新质生产力 投资中国新机遇——开放创新的深圳市场 5月19日,由深圳证券交易所主办的2025全球投资者大会在深圳举行,大会以“新质生产力:投资中国新机遇——开放创新...

原油:WTI原油下跌 OPEC+考虑再度大幅增产

原油:WTI原油下跌 OPEC+考虑再度大幅增产

油价重挫,OPEC+讨论将日产量进一步提高,引发了对全球供应过剩的担忧。这一担忧今年已拖累原油价格下跌。 WTI原油期货下跌1.6%,收于每桶58美元附近,本周下跌逾7%。价格维持在2021年初以来的...

降至“1字头” 多家银行下调大额存单产品利率

降至“1字头” 多家银行下调大额存单产品利率

5月20日,新一轮存款降息来袭,包括工行、中行、建行等多家银行纷纷下调了活期存款、定期存款以及通知存款等多个产品利率。 《金融时报》记者注意到,随着银行存款“降息潮”的延续,曾被视为“揽储利器”的大额...