官方网站-首页官方网站-首页

MiniMax发布开源混合架构推理模型M1

2025-06-17 17:00:47 377

【导(dǎo)语(yǔ)】6月(yuè)17日(rì),上(shàng)海(hǎi)AI独(dú)角(jiǎo)兽(shòu)MiniMax宣(xuān)布(bù)开(kāi)源(yuán)其(qí)推(tuī)理(lǐ)模(mó)型(xíng)MiniMax-M1,标(biāo)志(zhì)着(zhe)全球(qiú)首(shǒu)个(gè)开(kāi)放(fàng)权(quán)重(zhòng)的(de)大(dà)规(guī)模(mó)混(hùn)合(hé)注(zhù)意(yì)力(lì)推(tuī)理(lǐ)模(mó)型(xíng)面(miàn)世(shì)。M1结(jié)合混合门控专家架构与Lightning Attention技术,在长上下文理解、代码生成等场景中表现卓越,接近顶尖闭源系统水平。同时,M1在算力成本上实现显著降低,展现出高效推理能力。此次开源不仅填补了长上下文技术的空白,更以“开源+场景化”战略打破技术垄断,为国产大模型实用化树立新典范。

6月17日,上海AI独角兽MiniMax正式开源推理模型MiniMax-M1(以下简称“M1”)。MiniMax称,这是全球首个开放权重的大规模混合注意力推理模型。凭借混合门控专家架构(Mixture-of-Experts,MoE)与 Lightning Attention 的结合,M1在性能表现和推理效率方面实现了显著突破。实测数据显示,M1系列在长上下文理解、代码生成等生产力场景中超越多数闭源模型,仅微弱差距落后于顶尖闭源系统。

开源报告截图 来源:MiniMax提供

M1支持目前业内最高100万token上下文输入,同时支持最多8万token输出。成本表现方面,在进行8万Token的深度推理时,M1所需的算力仅为DeepSeek R1的约30%;生成10万token时,推理算力只需要DeepSeek R1的25%。MiniMax表示,M1整个强化学习阶段只用到512块H800三周时间,租赁成本为53.74万美元。

天使投资人、资深人工智能专家郭涛向澎湃科技(www.thepaper.cn)分析认为,目前国内大模型市场格局早已形成,大模型竞争不仅仅是技术的竞争,而是算力、数据、应用场景等整个生态的竞争。此次MiniMax更新填补了开源领域长上下文技术的空白,更以“开源+场景化”路径打破技术垄断,为国产大模型迈向实用化树立新标杆。