上周,Anthropic 发布了 Claude Cowork,把 Claude 从一个“聊天框里的助手”变成了能操作本地文件、自动执行任务的“桌面员工”。这未必是 AI Agent 真正实用化的标志,但它确实把 Agent 能力从概念演示,推到了更接近真实生产力的桌面工作流里。
就在这个节点上,MiniMax 也推出了自己的桌面端 Agent。MiniMax 内部其实一直在用 Agent 辅助工作,运维用它分析告警、销售用它写客户私信、研发用它并行跑任务,他们管这种工作方式叫“Agent 实习生”,据说内部绝大多数的员工都在用。现在,这套理念被做成了产品开放给所有人。MiniMax Agent 桌面版 Mac 和 Windows 都支持,目前还限时免费。
如果你之前用过 MiniMax Agent,可能会觉得它就是个还不错的 AI 对话助手,能搜索、能写东西、能处理文档、能调用工具,但本质上还是在对话框里完成一切。这次的 2.0 版本想做的事情不太一样,它要走出对话框,进入你的本地文件夹和浏览器,真正动手帮你干活。
Minimax Agent 桌面版
这次更新了什么
MiniMax 把这次更新定义为“AI-native Workspace”,拆开来看其实是三件事。
Desktop App 让 Agent 从浏览器走向本地,在你的授权下,能直接操作你电脑上的文件,还能接管浏览器执行自动化任务。Expert Agents 允许用户上传私有知识库、配置专属指令,打造特定领域的“专家分身”,比如把一本 SEO 指南喂给它,它就能变成你的 SEO 顾问。个性化 Experts 设置通过注入私有知识库和独家 SOP,复刻你的专业逻辑。
听起来很美好,但实际体验如何?我花了一天时间把核心功能都跑了一遍。
瞬间整理好一个乱成粥的桌面
作为一个 P 人,我的电脑桌面早已经乱成一锅粥,截图、文档、视频、不知道哪来的压缩包堆在一起,正好用来当测试案例。
打开 MiniMax Agent 桌面端,指定桌面为工作空间,输入 Prompt:“我的桌面太乱了,帮我分门别类整理一下。”
Agent 先弹出了权限确认,让你知道它要动哪些文件,不会偷偷摸摸搞事情。
确认后它开始分析文件,我什么都没动,就看着桌面上的图标一个个消失、归类到新建的文件夹里。整个过程大概几十秒,比我自己整理快多了。
结果让人很满意。图片、文档、视频、压缩包各归各位,它甚至能区分“电影”和“其他视频”,分别放进不同文件夹。有个未命名的大型爬虫数据文件夹,也被单独识别出来。
中间还有个小插曲,某个文件名带空格导致移动失败,Agent 自己检测到问题、修复、继续执行,全程不需要我介入。
整理文件这种事,说大不大,但每次要做的时候都很烦。能外包给 AI,确实省心。
让 AI 帮我刷 Hacker News
这个测试更贴近我的真实需求。我每天都要刷 Hacker News 看看有什么新动态、找找选题灵感。能不能让 AI 把这件事自动化?
打开桌面端,输入 Prompt:“你去浏览一下 Hacker News,看看今天的热门帖子,把 AI 相关的内容整理成一个 Markdown 文档保存到本地,包含标题、链接、内容摘要、点赞数、评论数。”
然后 Agent 打开了一个内置浏览器,不是占用我的 Chrome,而是在内置的浏览器里自己操作。这意味着等待期间我可以继续干别的事,完成后会有桌面通知。
几十秒钟后结果出来了。一个 Markdown 文件,整整齐齐列着今天 HN 上的 AI 相关热帖,链接都能点开,信息准确。
但我还想继续加码,“把刚才整理的内容按热度排序,用表格形式呈现,另外帮我总结一下今天 HN 上 AI 领域的主要讨论方向。”
随后 Agent 对 Markdown 文件进行了更新,加入了表格和总结分析,最后还给出了“核心洞察”。
再来,“把这些数据生成一个简洁优雅的 HTML 页面,用卡片形式展示每个帖子。”速度很快,生成了一个可视化网页。所有链接正常,排版清爽,比 Hacker News 原版那种密密麻麻的文字舒服多了。
这是整个测试中比较惊艳的部分。从信息抓取到整理到可视化,完整链路都跑通了。如果每天定时跑一遍或者设置为定期任务,能省掉不少重复劳动。按这个思路,感觉还可以 vibe coding 一个“清爽版 Hacker News 精选”出来,谁赞成谁反对?
不过测试中唯一的遗憾是因为没有指定抓取数量,只抓了首页一页内容,更大量的抓取可能需要进一步调教指令。
喂了一整本书,造了个经济学人风格写作专家 Agent
测完桌面端,来看网页端的 Expert Agents 功能。
这个功能的逻辑是,你可以上传自己的知识库、设定专属指令,创建一个特定领域的“专家”(Expert)。之后无论谁来用这个 Expert,它都会按照你设定的规则和知识来工作。MiniMax 内部的说法是,一位资深 SEO 专家可以把自己独家的关键词挖掘逻辑封装进去,让入职第一天的新人也能快速上手。
刚才整理桌面发现我有一本从来没有打开过的《经济学人风格指南》电子版,浓缩了经济学人几十年的写作标准,如何把复杂问题讲清楚、讲紧凑、讲得有判断力。用它来创建一个“经济学人风格写作专家”试试。
打开网页端,进入 Explore Experts,点击创建,把整本书丢给它。因为文件太大,Agent 进行了分批读取,然后开始构建 Expert。
这个过程可能是整个测试中体验不太好的部分。大概花了 10 分钟,中间还卡顿了一次,没有任何提示,我催了一句它才继续。希望后续能加个进度条或状态提示,不然用户会以为它挂了。
完成后的 Expert 长这样:
Expert 创建完成后,实际上已经能用了,但我想给它增加更多复杂度。为了让这个 Expert 尽可能参考写作守则的细节,我继续让 Agent 将整本指南拆分成多个 skills。
完成了 Expert 的创建,我们直接来派活。最近“牢 A”话题很火,我让它写一篇热点话题:检索“哈佛女孩怒批牢 A”相关信息,按照你的风格写一篇文章。
Agent 检索信息后,产出了一篇时评。理性、数据驱动、有阶级分析视角,确实有点经济学人那味儿了。
但仔细看,还是能感觉到一些 AI 感,某些表达略显模板化,缺少人类作者那种微妙的判断力和文字节奏感。不知道是需要继续调教指令,还是受限于基础模型本身的写作能力。不过作为初稿生成器,已经能省不少事。
这个功能适合需要反复使用某套知识体系的场景,比如内容审核、风格统一、SOP 执行。创建一次,之后谁都能用。
和 Claude Cowork 比,到底各有什么长短?
聊桌面端 AI Agent,逃不开和 Claude Cowork 的对比。两边几乎同时发力这个方向,简单看一下各自的长短。
平台支持上,MiniMax 同时支持 Mac 和 Windows,Cowork 目前只有 macOS。价格上差距更大,MiniMax 限时免费,Cowork 需要订阅。对国内用户来说,MiniMax 原生可用,Cowork 需要特殊网络环境。
Cowork 的优势在于底层模型能力更强,Opus 4.5 的推理能力确实是目前的天花板,而且和 Claude Code 生态打通,对开发者更友好。MiniMax 的优势在于低门槛和本土化,普通用户更容易上手。
两边都在做的核心功能,本地文件操作、Web 自动化、专家/技能系统,思路几乎一致。这说明行业对“AI 桌面员工”该长什么样已经形成了初步共识。
这个 AI 实习生,好用吗?
测试了半天之后,我的结论是:能用,但要管好预期。
文件整理、信息收集、网页抓取、数据可视化这类重复性工作,MiniMax Agent 已经能很好地接手。尤其是 Hacker News 那个测试,从抓取到整理到生成可视化网页,完整链路跑通,确实能省掉不少机械劳动。Expert Agents 的思路也很对,把经验封装成可复用的系统,适合团队协作场景。
但它还不是一个能完全放手的员工。复杂写作任务仍有 AI 感需要润色,Expert 创建过程缺少进度反馈体验不够好,Web 自动化的深度也有待验证。这些都是当前阶段的局限。
Figma CEO Dylan Field 说过一句话:我们现在直觉上还在 AI 的 MS-DOS 时代。Karpathy 也有类似的判断,他说 LLM 是新的"操作系统",但我们还在“1960 年代的 OS 设计”阶段,有了计算能力,但还没有鼠标、窗口和桌面隐喻。
Claude Cowork、MiniMax Agent 这些产品,某种程度上就是在尝试给 AI 造“鼠标和窗口”。让 AI 不只是在对话框里回答问题,而是真正进入你的文件系统、你的浏览器、你的工作流。
这个进化刚刚开始。今天的产品只是第一步,但方向已经有了,至于能做到什么程度,大概需要整个行业用接下来几年的时间来回答。
MiniMax Agent 2.0 不是终点,但如果你想提前体验一下这个方向,现在是个不错的时机,毕竟还限时免费。




0 条评论
请「登录」后评论