MiniMax 内部人手一个的 AI 实习生，现在你也能用了-品玩

上周，Anthropic 发布了 Claude Cowork，把 Claude 从一个“聊天框里的助手”变成了能操作本地文件、自动执行任务的“桌面员工”。这未必是 AI Agent 真正实用化的标志，但它确实把 Agent 能力从概念演示，推到了更接近真实生产力的桌面工作流里。

就在这个节点上，MiniMax 也推出了自己的桌面端 Agent。MiniMax 内部其实一直在用 Agent 辅助工作，运维用它分析告警、销售用它写客户私信、研发用它并行跑任务，他们管这种工作方式叫“Agent 实习生”，据说内部绝大多数的员工都在用。现在，这套理念被做成了产品开放给所有人。MiniMax Agent 桌面版 Mac 和 Windows 都支持，目前还限时免费。

如果你之前用过 MiniMax Agent，可能会觉得它就是个还不错的 AI 对话助手，能搜索、能写东西、能处理文档、能调用工具，但本质上还是在对话框里完成一切。这次的 2.0 版本想做的事情不太一样，它要走出对话框，进入你的本地文件夹和浏览器，真正动手帮你干活。

Minimax Agent 桌面版

这次更新了什么

MiniMax 把这次更新定义为“AI-native Workspace”，拆开来看其实是三件事。

Desktop App 让 Agent 从浏览器走向本地，在你的授权下，能直接操作你电脑上的文件，还能接管浏览器执行自动化任务。Expert Agents 允许用户上传私有知识库、配置专属指令，打造特定领域的“专家分身”，比如把一本 SEO 指南喂给它，它就能变成你的 SEO 顾问。个性化 Experts 设置通过注入私有知识库和独家 SOP，复刻你的专业逻辑。

听起来很美好，但实际体验如何？我花了一天时间把核心功能都跑了一遍。

瞬间整理好一个乱成粥的桌面

作为一个 P 人，我的电脑桌面早已经乱成一锅粥，截图、文档、视频、不知道哪来的压缩包堆在一起，正好用来当测试案例。

打开 MiniMax Agent 桌面端，指定桌面为工作空间，输入 Prompt：“我的桌面太乱了，帮我分门别类整理一下。”

Agent 先弹出了权限确认，让你知道它要动哪些文件，不会偷偷摸摸搞事情。

确认后它开始分析文件，我什么都没动，就看着桌面上的图标一个个消失、归类到新建的文件夹里。整个过程大概几十秒，比我自己整理快多了。

结果让人很满意。图片、文档、视频、压缩包各归各位，它甚至能区分“电影”和“其他视频”，分别放进不同文件夹。有个未命名的大型爬虫数据文件夹，也被单独识别出来。

中间还有个小插曲，某个文件名带空格导致移动失败，Agent 自己检测到问题、修复、继续执行，全程不需要我介入。

整理文件这种事，说大不大，但每次要做的时候都很烦。能外包给 AI，确实省心。

让 AI 帮我刷 Hacker News

这个测试更贴近我的真实需求。我每天都要刷 Hacker News 看看有什么新动态、找找选题灵感。能不能让 AI 把这件事自动化？

打开桌面端，输入 Prompt：“你去浏览一下 Hacker News，看看今天的热门帖子，把 AI 相关的内容整理成一个 Markdown 文档保存到本地，包含标题、链接、内容摘要、点赞数、评论数。”

然后 Agent 打开了一个内置浏览器，不是占用我的 Chrome，而是在内置的浏览器里自己操作。这意味着等待期间我可以继续干别的事，完成后会有桌面通知。

几十秒钟后结果出来了。一个 Markdown 文件，整整齐齐列着今天 HN 上的 AI 相关热帖，链接都能点开，信息准确。

但我还想继续加码，“把刚才整理的内容按热度排序，用表格形式呈现，另外帮我总结一下今天 HN 上 AI 领域的主要讨论方向。”

随后 Agent 对 Markdown 文件进行了更新，加入了表格和总结分析，最后还给出了“核心洞察”。

再来，“把这些数据生成一个简洁优雅的 HTML 页面，用卡片形式展示每个帖子。”速度很快，生成了一个可视化网页。所有链接正常，排版清爽，比 Hacker News 原版那种密密麻麻的文字舒服多了。

这是整个测试中比较惊艳的部分。从信息抓取到整理到可视化，完整链路都跑通了。如果每天定时跑一遍或者设置为定期任务，能省掉不少重复劳动。按这个思路，感觉还可以 vibe coding 一个“清爽版 Hacker News 精选”出来，谁赞成谁反对？

不过测试中唯一的遗憾是因为没有指定抓取数量，只抓了首页一页内容，更大量的抓取可能需要进一步调教指令。

喂了一整本书，造了个经济学人风格写作专家 Agent

测完桌面端，来看网页端的 Expert Agents 功能。

这个功能的逻辑是，你可以上传自己的知识库、设定专属指令，创建一个特定领域的“专家”（Expert）。之后无论谁来用这个 Expert，它都会按照你设定的规则和知识来工作。MiniMax 内部的说法是，一位资深 SEO 专家可以把自己独家的关键词挖掘逻辑封装进去，让入职第一天的新人也能快速上手。

刚才整理桌面发现我有一本从来没有打开过的《经济学人风格指南》电子版，浓缩了经济学人几十年的写作标准，如何把复杂问题讲清楚、讲紧凑、讲得有判断力。用它来创建一个“经济学人风格写作专家”试试。

打开网页端，进入 Explore Experts，点击创建，把整本书丢给它。因为文件太大，Agent 进行了分批读取，然后开始构建 Expert。

这个过程可能是整个测试中体验不太好的部分。大概花了 10 分钟，中间还卡顿了一次，没有任何提示，我催了一句它才继续。希望后续能加个进度条或状态提示，不然用户会以为它挂了。

完成后的 Expert 长这样：

Expert 创建完成后，实际上已经能用了，但我想给它增加更多复杂度。为了让这个 Expert 尽可能参考写作守则的细节，我继续让 Agent 将整本指南拆分成多个 skills。

完成了 Expert 的创建，我们直接来派活。最近“牢 A”话题很火，我让它写一篇热点话题：检索“哈佛女孩怒批牢 A”相关信息，按照你的风格写一篇文章。

Agent 检索信息后，产出了一篇时评。理性、数据驱动、有阶级分析视角，确实有点经济学人那味儿了。

但仔细看，还是能感觉到一些 AI 感，某些表达略显模板化，缺少人类作者那种微妙的判断力和文字节奏感。不知道是需要继续调教指令，还是受限于基础模型本身的写作能力。不过作为初稿生成器，已经能省不少事。

这个功能适合需要反复使用某套知识体系的场景，比如内容审核、风格统一、SOP 执行。创建一次，之后谁都能用。

和 Claude Cowork 比，到底各有什么长短？

聊桌面端 AI Agent，逃不开和 Claude Cowork 的对比。两边几乎同时发力这个方向，简单看一下各自的长短。

平台支持上，MiniMax 同时支持 Mac 和 Windows，Cowork 目前只有 macOS。价格上差距更大，MiniMax 限时免费，Cowork 需要订阅。对国内用户来说，MiniMax 原生可用，Cowork 需要特殊网络环境。

Cowork 的优势在于底层模型能力更强，Opus 4.5 的推理能力确实是目前的天花板，而且和 Claude Code 生态打通，对开发者更友好。MiniMax 的优势在于低门槛和本土化，普通用户更容易上手。

两边都在做的核心功能，本地文件操作、Web 自动化、专家/技能系统，思路几乎一致。这说明行业对“AI 桌面员工”该长什么样已经形成了初步共识。

这个 AI 实习生，好用吗？

测试了半天之后，我的结论是：能用，但要管好预期。

文件整理、信息收集、网页抓取、数据可视化这类重复性工作，MiniMax Agent 已经能很好地接手。尤其是 Hacker News 那个测试，从抓取到整理到生成可视化网页，完整链路跑通，确实能省掉不少机械劳动。Expert Agents 的思路也很对，把经验封装成可复用的系统，适合团队协作场景。

但它还不是一个能完全放手的员工。复杂写作任务仍有 AI 感需要润色，Expert 创建过程缺少进度反馈体验不够好，Web 自动化的深度也有待验证。这些都是当前阶段的局限。

Figma CEO Dylan Field 说过一句话：我们现在直觉上还在 AI 的 MS-DOS 时代。Karpathy 也有类似的判断，他说 LLM 是新的"操作系统"，但我们还在“1960 年代的 OS 设计”阶段，有了计算能力，但还没有鼠标、窗口和桌面隐喻。

Claude Cowork、MiniMax Agent 这些产品，某种程度上就是在尝试给 AI 造“鼠标和窗口”。让 AI 不只是在对话框里回答问题，而是真正进入你的文件系统、你的浏览器、你的工作流。

这个进化刚刚开始。今天的产品只是第一步，但方向已经有了，至于能做到什么程度，大概需要整个行业用接下来几年的时间来回答。

MiniMax Agent 2.0 不是终点，但如果你想提前体验一下这个方向，现在是个不错的时机，毕竟还限时免费。