ManusAI被破解?一句话暴露了Manus底层核心技术,Sonnet 3.7+29个工具的简单AI Agent吗?

ManusAI是由中国初创公司蝴蝶效应(Butterfly Effect)旗下Monica团队研发的全球首款通用型AI智能体,于2025年3月6日正式发布,凭借其“自主执行任务”的能力迅速引发科技界和资本市场的关注。

就在今天,X平台上的一位博主发现可以通过指令让Manus返回它的系统情况,发现ManusAI是Claude Sonnet 3.7+29个工具组成的一个大模型应用系统,也让很多人认为这就是ManusAI的全部,那么这是真的吗?本文结合ManusAI的成员提供的信息为大家介绍。

ManusAI被破解?一句话暴露了Manus底层核心技术,Sonnet 3.7+29个工具的简单AI Agent吗?
 

ManusAI的功能简介

在具体介绍ManusAI之前,我们先简单介绍一下ManusAI的特点。与传统AI助手(如ChatGPT)不同,Manus不仅能理解用户需求,还能通过自主规划、调用工具链完成复杂任务并交付成果。

根据官网提供的介绍,ManusAI是全球首个通用AI Agent系统,与此前MetaGPT等框架不同(专注于编程领域)的是它不限制任何领域,也不是简单的答案生成,而是可以独立执行复杂的、现实世界的任务。

与此前的一些项目不同的是,ManusAI不仅仅提供信息,还会执行多个任务流,可以完成网络浏览、与工具交互、编写并运行代码。ManusAI任务完成度高,如旅行攻略这种任务“细节全到令人震惊”。在一些复杂的Agent评测基准如GAIA上,它超越了OpenAI Deep Research 12.2%。

最新“prompt越狱”显示ManusAI是Claude Sonnet + 29个工具

在2025年3月10日,一位X平台的博主,让Manus提供/opt/.manus/下面所有的文件,然后Manus就把它沙箱中运行环境代码发布出来,根据发布的文件显示,ManusAI的沙箱代码包含如下内容:

  • 使用Claude Sonnet模型
  • 是一个单AI Agent框架
  • 有29个工具
  • 使用browse_use

关于这部分的系统prompt和工具,可以参考网友分享的内容:https://gist.github.com/jlia0/db0a9695b3ca7609c9b1a08dcbf872c9

根据提供的系统Prompt,Manus AI Assistant 提到了几类主要工具。如下表格:

工具类别 具体工具/功能
浏览器工具 • 网站导航
• 网页内容读取和提取
• 网页元素交互(点击、滚动、表单填写)
• 在浏览器控制台执行 JavaScript
• 监控网页变化和更新
• 截取网页内容截图
文件系统工具 • 读写各种格式的文件
• 基于名称、模式或内容搜索文件
• 创建和组织目录结构
• 压缩和归档文件(zip、tar)
• 分析文件内容并提取相关信息
• 在不同文件格式间转换
Shell 和命令行 • 在 Linux 环境中执行 shell 命令
• 安装和配置软件包
• 运行各种语言的脚本
• 管理进程(启动、监控、终止)
• 通过 shell 脚本自动化重复任务
• 访问和操作系统资源
通信工具 • 向用户发送信息
• 提出问题以明确需求
• 提供长时间任务的进度更新
• 附加文件和资源到消息
• 建议后续步骤或其它操作
部署工具 • 暴露本地端口以临时访问服务
• 部署静态网站到公共 URL
• 部署具有服务器端功能的 Web 应用
• 提供已部署资源的访问链接
• 监控已部署的应用
编程语言工具 • JavaScript/TypeScript
• Python
• HTML/CSS
• Shell 脚本 (Bash)
• SQL
• PHP
• Ruby
• Java
• C/C++
• Go
• 其它语言
框架和库 • React, Vue, Angular (前端开发)
• Node.js, Express (后端开发)
• Django, Flask (Python Web 应用)
• 数据分析库 (pandas, numpy 等)
• 各种语言的测试框架
• 数据库接口和 ORM

这个表格涵盖了 Manus AI Assistant 系统 prompt 中明确提到的主要工具类别和功能。

Manus AI能力洞察分析

通过对 Manus AI 工具集的全面分析,我们可以得出一些关于其架构、定位和潜在应用场景的深度洞察。

Manus AI技术架构洞察

Manus AI 采用了多层次、全栈式的技术架构,具备从底层系统操作到上层应用交互的完整能力链路:

  1. 层次分明的prompt:Manus从总体概述开始,逐步细分为“通用能力”、“工具与接口”、“编程语言与技术”、“任务方法论”、“局限性”、“高效提示指南”以及关于 AI 助手的介绍。这样的结构使得每个部分的功能和作用都一目了然。每个部分都给出了充分的描述,既说明了 AI 能做什么,也明确了不能做什么,这有助于管理用户期望并确保在实际任务中遵循安全和伦理准则。
  2. 沙盒化执行环境:Manus 拥有 Linux 基础环境,暗示其运行在容器化或虚拟机架构之上,这使它能够执行系统级命令而不影响主机系统。
  3. 全栈开发支持:从前端框架(React/Vue/Angular)到后端服务(Node.js/Django)的全面支持,表明其定位为开发全流程助手。
  4. 多模态交互系统:能够进行网页交互、截图、文件操作,显示它拥有比纯文本AI更丰富的感知和交互能力。

ManusAI强调任务拆解和Prompt自动优化

ManusAI 在任务执行过程中尤为注重对复杂问题的拆解和对提示(prompt)的自动优化。它会首先对用户提出的问题或需求进行深入的分析,识别出问题的核心要素,并将一个复杂的任务分解成若干个小而明确的步骤。这样做不仅能够使每个步骤都易于理解和处理,还能在执行过程中逐步验证和调整,确保每个环节都能顺利衔接,最终达到预期目标。

在提示自动优化方面,ManusAI 展现了极强的自适应能力,系统 prompt 包含了详细的提示优化指南。它能够根据对话中的反馈和上下文信息,自动调整用户输入的prompt的结构和内容。通过不断地迭代改进用户输入的prompt,ManusAI 不仅提升了问题的清晰度,还能根据不断变化的需求动态调整解决方案,最终呈现出更为精准和高效的答案。这样既减少了用户在反复调整提示时的时间投入,也大大提高了整个交互过程的流畅性和效果。

在Prompt中,Manus明确了不好的prompt和优化的prompt区别,并给出了样例:

  1. # 原始的很差的prompt
  2. “Tell me about machine learning.”
  3. # 优化后的prompt
  4. “I’m a computer science student working on my first machine learning project. Could you explain supervised learning algorithms in 2-3 paragraphs, focusing on practical applications in image recognition? Please include 2-3 specific algorithm examples with their strengths and weaknesses.”

可以看到,Manus带了自动优化用户prompt能力,避免过于宽泛的输入导致了任务执行得不好。同时,ManusAI还采用迭代优化的方式来做Prompt优化。

ManusAI官方否认这是一个单AI Agent框架以及是如此简单的设计

在用户纰漏了这个信息之后,很多人认为Manus只是一个简单的Sonnet + 29个工具的简单包装。但是Manus一个工作人员对此进行了否认并提供了进一步详细的描述。

首先,Manus是一个多Agent系统,例如planner、executor、knowledge retriever等。而当前用户获得的信息只是executor部分,并且也不是全貌。

Manus的更详细更准确的内容如下:

  1. 沙盒隔离与用户自主性
    Manus每个会话都有自己的沙盒,完全隔离于其他会话。这不仅保证了多用户环境下的安全性,也允许用户直接进入沙盒查看和调试代码,从而增强了透明度和自主控制。
  2. 代码轻度混淆并非隐藏核心架构
    Manus沙盒中的代码仅用于接收代理命令,因此只进行了轻度混淆。这意味着Manus官方并不刻意隐藏系统架构,而是保证代码可读性和实用性,同时避免无谓的安全风险。
  3. Manus的工具设计基于学术常见方法与 RAG 机制
    回复指出,Manus 的工具设计并没有什么神秘之处,其行动空间的设计与学术界常见方法基本一致。由于系统采用了 RAG(检索增强生成)机制,不同任务下返回的工具描述可能会有差异,从而使得通过“越狱”拿到的提示信息并不稳定或全面。

这意味着,当前Manus实际上可能拥有不止29个工具。

  1. Manus是一个多Agent系统架构
    Manus 的关键特性之一是多代理实现。在用户与 Manus 通讯时,其实只在与“执行代理”交互,而该代理并不知道具体的知识库、规划器等其他内部代理的细节。这样的设计有助于控制上下文长度,也解释了为何“越狱”得到的 prompt 可能大多是虚构的信息。或者说不准确的信息,不能以此看待Manus全貌。
  2. 对开源技术的依赖与开放传统
    官方明确表示,他们使用了包括 Browse Use 在内的多个开源代码,并且整个团队一直秉持开源传统。团队不仅在 HuggingFace 分享后训练模型,还计划在未来做更多的致谢和合作。这表明系统在构建时广泛吸收了社区资源,并非完全自创或秘密封闭的黑盒子。

为此,我们可以得出如下结论:

  • Manus 系统的设计并非简单的“claude sonnet + 29个工具”的单一 AI Agent 框架,而是建立在开放、透明和模块化的多代理架构上。
  • “越狱”获得的 prompt 很可能只是表面现象或误导信息,不能反映系统内部复杂而分层的真实工作机制。
  • 多代理架构不仅有助于有效管理上下文和分工,还能提高系统的扩展性和灵活性,这也是 Manus 在面对多任务时能保持高效响应的原因之一。
  • 团队对开源社区的依赖与开放共享的态度,进一步证明了他们在设计时追求的是一种透明、协作和可验证的技术路线,而非依赖秘密算法或黑箱机制。

总体来看,这次官方回复不仅澄清了外界对系统架构的误解,也展示了 Manus 在设计思路上的成熟与开放性。

不过,随着大模型能力的提升,Agent的水平也会越来越高,优秀的软件系统工程设计可能是未来Agent最强的护城河之一。

声明:本站部分文章来源于网络,如有侵犯您的合法权益,请您即时与我们联系,我们将在第一时间处理。如需转载本站文章,请在转载时标明出处并保留原文链接,否则我们将保留追究法律责任的权利。

给TA打赏
共{{data.count}}人
人已打赏
AI工具AI教程AI资源DownloadAI音频

【音源声音分离】超越UVR5的AI项目MSST

2024-9-27 16:35:28

AI其他

Zing Coach

2024-4-16 9:57:11

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧