36氪深度文章 · 站内详情

对话 MiniMax 择因：Agent 终会超过人类，我们又将何去何从？

2026/6/8 10:52:02 · Agent

山雨欲来。

正文

Agent 的世界，四月还是山雨欲来。五月尚未结束，已然血雨腥风。

整个行业的加速快到不讲道理。Vibe Coding 已经不再是新名词，编程这条赛道也从未如此拥挤：Claude Code、Codex、Cursor 贴身肉搏，Trae、Qoder、CodeBuddy 杀成一团。

黑话一个接一个流行起来，支配所有人的注意力。去年还是 skill（技能）的天下，如今 harness（脚手架）站上了王座。

热词之下，模型已经卷到几近一条平直的线：不同的基准测试会给不同的答案，但总体来说，无论是 Opus、GPT，还是 Qwen、GLM、Kimi 和 MiniMax 们，无论是写代码还是执行越来越复杂的任务，都已不在话下。

模型之间仍然存在差距，但拉开模型公司之间真正差距的，早已不再是模型本身，而是套在外面的那层壳。

之前一份研究报告拆解了 Claude Code 泄露的代码，发现真正属于模型决策的代码只有 1.6%，剩下 98.4%，全是管权限、管上下文、兜错的 harness。

为了进一步发挥模型的优势，全新一代的 agent 产品如排山倒海而来。Grok Build、Qoder 1.0、TRAE SOLO 纷纷推出。连一直以来低调沉默的 DeepSeek 都挂出多岗位招聘，组建 agent 开发队伍。

早于业界布局 agent 的 MiniMax，在混战中落下自己的子。桌面端产品先是在 5 月中推出主打全新多 agent 编排架构的 Agent Team 功能。而随着 M3 旗舰模型，MiniMax 桌面端全面升级为 MiniMax Code，再次搅动了大厂、小龙云集的 agent 市场。

Agent Team 的内核是一套 Leader-Worker-Verifier（领导-执行-验证）的「对抗式」架构。负责干活和负责挑错的职责，被拆成不同的 agent，受到经过代码逻辑固化的状态机去管理，彼此之间上下文隔离。

这味药，治的是长程 agent 任务中那些出了名的顽疾：上下文污染、上下文焦虑、agent 之间的「共谋」。

有趣的是，正如前述 MiniMax 并没有等 M3 发布，而是率先在 M2.7 上就将 Agent Team 推了出来。M2 这一代，被 MiniMax 称为「大巧若拙」，模型和脚手架之间的共融共生已经看到了黎明前的曙光。预料之中，M3 只会更强。

在训练 M3 的最关键时刻，APPSO 与 MiniMax Agent研发工程师（周淳辅）做了一场对谈。

我们聊了Agent Team 的设计原则及其所体现的 MiniMax 认知，探索了 Agent Team 的技术内核，浅析其它玩家对于 agentic 模型如何约束与放任。

业界有一种观点正盛：Anthropic 拥有最好的模型和最烂的工程。在择因看来，Anthropic 骨子里不信任模型，预设模型会作弊、耍小聪明，于是到处加以约束。OpenAI 的 harness 核心却是一个极简的 agentic loop。

一个极简框架养出了遵循度极好的模型，一个约束极强的框架却养出了「黑天鹅」。MiniMax 做 agent 的思路，既将两者融合，又不完全相同：要相信模型，给它和人一样的操作权限，但也要在脚手架中加入合理的约束。

这些思路在业界独树一帜，但业界追赶新东西并将之确立为共识的节奏，早已快过于新思想诞生的速度。在 agent 上，MiniMax 没有壁垒——没有任何人有。择因发给我一篇 71 页的论文，告诉APPSO：

但 MiniMax 仍有绝活。

本站展示来自正式来源同步的内容摘录与本地观察，不默认跳转外网；需要核验上下文时可查看来源记录。