MiniMax发布开源混合架构推理模型M1

2025-06-17 17:00:47 377

【导(dǎo)语(yǔ)】6月(yuè)17日(rì)，上(shàng)海(hǎi)AI独(dú)角(jiǎo)兽(shòu)MiniMax宣(xuān)布(bù)开(kāi)源(yuán)其(qí)推(tuī)理(lǐ)模(mó)型(xíng)MiniMax-M1，标(biāo)志(zhì)着(zhe)全球(qiú)首(shǒu)个(gè)开(kāi)放(fàng)权(quán)重(zhòng)的(de)大(dà)规(guī)模(mó)混(hùn)合(hé)注(zhù)意(yì)力(lì)推(tuī)理(lǐ)模(mó)型(xíng)面(miàn)世(shì)。M1结(jié)合混合门控专家架构与Lightning Attention技术，在长上下文理解、代码生成等场景中表现卓越，接近顶尖闭源系统水平。同时，M1在算力成本上实现显著降低，展现出高效推理能力。此次开源不仅填补了长上下文技术的空白，更以“开源+场景化”战略打破技术垄断，为国产大模型实用化树立新典范。

6月17日，上海AI独角兽MiniMax正式开源推理模型MiniMax-M1（以下简称“M1”）。MiniMax称，这是全球首个开放权重的大规模混合注意力推理模型。凭借混合门控专家架构（Mixture-of-Experts，MoE）与 Lightning Attention 的结合，M1在性能表现和推理效率方面实现了显著突破。实测数据显示，M1系列在长上下文理解、代码生成等生产力场景中超越多数闭源模型，仅微弱差距落后于顶尖闭源系统。

开源报告截图来源：MiniMax提供

M1支持目前业内最高100万token上下文输入，同时支持最多8万token输出。成本表现方面，在进行8万Token的深度推理时，M1所需的算力仅为DeepSeek R1的约30%；生成10万token时，推理算力只需要DeepSeek R1的25%。MiniMax表示，M1整个强化学习阶段只用到512块H800三周时间，租赁成本为53.74万美元。

天使投资人、资深人工智能专家郭涛向澎湃科技（www.thepaper.cn）分析认为，目前国内大模型市场格局早已形成，大模型竞争不仅仅是技术的竞争，而是算力、数据、应用场景等整个生态的竞争。此次MiniMax更新填补了开源领域长上下文技术的空白，更以“开源+场景化”路径打破技术垄断，为国产大模型迈向实用化树立新标杆。

微信公众号搜索“ 新能源 ”加关注，最新环卫前沿洞察、企业动态、产品公告全面了解。推荐关注!

【微信扫描下方二维码可直接关注】

上一篇：2025伦敦科技周落幕奔流城市对话圆满举行下一篇：AI 驱动研发，如何破解高质量数据缺乏困境？

官方网站-首页

关于

>about

产品中心

>Product Center

应用场景

>Application Scenarios

动态

>News center

运营平台

>Operation platform

合作模式

>

售后服务

>after-sale service

联系我们

>

MiniMax发布开源混合架构推理模型M1

【微信扫描下方二维码可直接关注】

为美好出行续航

快速充电，随时满电出行～

咨询电话

400-8610 2258

售后服务热线

0755-9956 3377

E-mail：pgSoft@sjzshunbang.com