36氪深度文章 · 站内详情
对话 MiniMax 择因:Agent 终会超过人类,我们又将何去何从?
山雨欲来。
- 来源
- 36氪深度文章
- 时间
- 2026/6/8 10:52:02
- 标签
- Agent
- 分类
- 智能体与研发效率
正文
Agent 的世界,四月还是山雨欲来。五月尚未结束,已然血雨腥风。
整个行业的加速快到不讲道理。Vibe Coding 已经不再是新名词,编程这条赛道也从未如此拥挤:Claude Code、Codex、Cursor 贴身肉搏,Trae、Qoder、CodeBuddy 杀成一团。
黑话一个接一个流行起来,支配所有人的注意力。去年还是 skill(技能)的天下,如今 harness(脚手架)站上了王座。
热词之下,模型已经卷到几近一条平直的线:不同的基准测试会给不同的答案,但总体来说,无论是 Opus、GPT,还是 Qwen、GLM、Kimi 和 MiniMax 们,无论是写代码还是执行越来越复杂的任务,都已不在话下。
模型之间仍然存在差距,但拉开模型公司之间真正差距的,早已不再是模型本身,而是套在外面的那层壳。
之前一份研究报告拆解了 Claude Code 泄露的代码,发现真正属于模型决策的代码只有 1.6%,剩下 98.4%,全是管权限、管上下文、兜错的 harness。
为了进一步发挥模型的优势,全新一代的 agent 产品如排山倒海而来。Grok Build、Qoder 1.0、TRAE SOLO 纷纷推出。连一直以来低调沉默的 DeepSeek 都挂出多岗位招聘,组建 agent 开发队伍。
早于业界布局 agent 的 MiniMax,在混战中落下自己的子。桌面端产品先是在 5 月中推出主打全新多 agent 编排架构的 Agent Team 功能。 而随着 M3 旗舰模型,MiniMax 桌面端全面升级为 MiniMax Code,再次搅动了大厂、小龙云集的 agent 市场。
Agent Team 的内核是一套 Leader-Worker-Verifier(领导-执行-验证)的「对抗式」架构。负责干活和负责挑错的职责,被拆成不同的 agent,受到经过代码逻辑固化的状态机去管理,彼此之间上下文隔离。
这味药,治的是长程 agent 任务中那些出了名的顽疾:上下文污染、上下文焦虑、agent 之间的「共谋」。
有趣的是,正如前述 MiniMax 并没有等 M3 发布,而是率先在 M2.7 上就将 Agent Team 推了出来。M2 这一代,被 MiniMax 称为「大巧若拙」,模型和脚手架之间的共融共生已经看到了黎明前的曙光。预料之中,M3 只会更强。
在训练 M3 的最关键时刻,APPSO 与 MiniMax Agent研发工程师(周淳辅)做了一场对谈。
我们聊了Agent Team 的设计原则及其所体现的 MiniMax 认知,探索了 Agent Team 的技术内核,浅析其它玩家对于 agentic 模型如何约束与放任。
业界有一种观点正盛:Anthropic 拥有最好的模型和最烂的工程。在择因看来,Anthropic 骨子里不信任模型,预设模型会作弊、耍小聪明,于是到处加以约束。OpenAI 的 harness 核心却是一个极简的 agentic loop。
一个极简框架养出了遵循度极好的模型,一个约束极强的框架却养出了「黑天鹅」。MiniMax 做 agent 的思路,既将两者融合,又不完全相同:要相信模型,给它和人一样的操作权限,但也要在脚手架中加入合理的约束。
这些思路在业界独树一帜,但业界追赶新东西并将之确立为共识的节奏,早已快过于新思想诞生的速度。在 agent 上,MiniMax 没有壁垒——没有任何人有。择因发给我一篇 71 页的论文,告诉APPSO:
「关于 agent 的所有东西,都在这篇论文里了。如果一篇就能说清楚,还有什么壁垒?」
但 MiniMax 仍有绝活。
来源说明
本站展示来自正式来源同步的内容摘录与本地观察,不默认跳转外网;需要核验上下文时可查看来源记录。