Featured image of post 开源新王M2.5横空出世!1美元/小时,性能比肩Claude Opus 4.6,AI算力时代彻底变天

开源新王M2.5横空出世!1美元/小时,性能比肩Claude Opus 4.6,AI算力时代彻底变天

MiniMax M2.5发布现场

昨晚的AI圈彻底炸了锅。MiniMax M2.5突然发布,就像在平静的湖面投下了一颗深水炸弹。你可能还没反应过来发生了什么,但这场变革已经开始。

一夜暴涨2100亿,市场用脚投票

就在M2.5发布的24小时内,MiniMax股价飙升16.2%,总市值一度冲破2108亿港元。资本市场的反应永远最诚实——当性能媲美Claude Opus 4.6,价格却只有1/20的时候,所有人都知道这意味着什么。

股价暴涨图表

性能与性价比的双重暴击

最让人震惊的不是M2.5有多强,而是它强得有多便宜。

在编码基准测试中,M2.5几乎追平了Claude Opus 4.6这个全球顶尖模型。但更关键的是,它只需要1美元就能以100 TPS(每秒处理100个token)运行1小时。

想象一下,过去你要花20倍的价格才能获得的性能,现在只需要一杯咖啡的钱。这已经不是简单的价格战,这是对整个AI服务定价体系的颠覆。

洗车难题背后的逻辑能力

最近有个很火的“洗车难题”难倒了不少模型。我们换了个变种问题:“我要去遛马,大草原离我家蒙古包只有5米,我应该自己走着去大草原还是骑马去?”

Claude Opus 4.6在这个问题上折戟了,而M2.5仅用3秒就给出了正确答案,思路清晰得让人忍俊不禁。

代码测试界面

代码生成:从LeetCode到真实开发

我们先用一道LeetCode Hard热热身——找两个有序数组的中位数,要求时间复杂度O(log(m+n))。M2.5在20秒内直接给出了最优解。

但真正考验模型的是真实开发场景。我们给了它一段代码,然后连续提出三个任务:代码审查、代码重构、架构设计。很多模型在这种多任务切换中会跑偏,但M2.5处理得游刃有余。

它一眼看出代码中的原子性问题,分析出缺少错误处理、没有类型提示等问题,然后给出了完整的优化方案。这种泛化能力,让AI不再是“能写代码”,而是真正能融入开发流程的伙伴。

Excel办公:从数据清洗到高级分析

我们丢给M2.5一份充满陷阱的Excel表格——日期格式混乱、数据缺失、异常值遍地。要求它完成数据清洗、跨表关联和深度分析。

结果让人惊喜。M2.5不仅清洗了脏数据,还发现了表格不适合直接用于管理层汇报的问题。它展现出的不是简单的函数记忆,而是真正的业务理解和风险意识。

深度研究:从查资料到真研究

我们让M2.5对最近大火的OpenClaw进行深度研究,要求解释核心概念、技术细节,并从多个角度评估。特别强调:不允许编造事实,信息不足时要敢于承认。

M2.5生成了一份内容详实、逻辑清晰的报告。它不是简单地堆砌信息,而是建立了概念图谱,进行结构化拆解,构建了因果推理链。这种“研究型”思维,让它区别于那些只会“查资料”的模型。

长文本处理:300页数学教材的精读

我们选择了著名的《数学分析原理》(Rudin著,约300页)来测试M2.5的长文本处理能力。要求它提炼每章核心概念,用“说人话”的方式解释,像学长在咖啡馆讲课一样。

结果出乎意料。M2.5不仅准确抓住了全书主线,还用“阅兵式”类比一致收敛、“按面额分类数钱”类比勒贝格积分等生动的比喻,让复杂的数学概念变得直观易懂。

数学教材解读

技术核心:Agent RL的全面突破

M2.5的强大背后,是MiniMax团队在Agent RL(智能体强化学习)上的全面突破。他们构建了原生Agent RL框架Forge,实现了底层训推引擎与Agent的完全解耦,支持任意Agent接入。

更重要的是,他们解决了长上下文强化学习中的信用分配难题,引入了过程奖励机制,并直接估计真实环境下的任务耗时作为奖励函数。这套技术体系在架构、算法与工程层面形成了闭环。

行业变局:能力平权时代的到来

当M2.5在各项核心任务上都能全面对齐Claude Opus 4.6,这已经不再是一次简单的模型升级。这是一个明确的信号:顶级AI能力正在去稀缺化。

对于行业来说,这是能力平权的时代;对于企业来说,这是重新定义效率边界的窗口;对于开发者来说,这是一次前所未有的机会期。

过去,高性能AI是少数人的特权。现在,M2.5让每个人都能在本地跑一个旗舰级分析师。这种普惠性,可能比技术突破本身更有意义。

写在最后

M2.5的出现,让我们看到了AI发展的另一种可能性——不是无休止地堆砌参数和算力,而是通过架构创新和算法优化,让AI变得更高效、更实用、更亲民。

这场变革才刚刚开始。当性能不再是壁垒,价格不再是门槛,AI才能真正融入每个人的工作和生活。而这一天,可能比我们想象中来得更快。

By AI博士 万戈