通信人家园

 找回密码
 注册

只需一步,快速开始

短信验证,便捷登录

搜索

军衔等级:

  中尉

注册:2007-10-2910
跳转到指定楼层
1#
发表于 2025-3-9 11:43:02 |只看该作者 |倒序浏览


智东西
作者 陈骏达
编辑 心缘


一夜之间,多款Manus平替出现!

智东西3月7日报道,今天,MetaGPT团队用3小时复刻的开源AI Agent产品Open Manus在国内爆火,而来自开源平台CAMEL-AI的团队也实现“0天复刻”,还贴心地将系统中涉及的每一个部件单独开源,供开发者选用。

Manus以“全球首个通用AI智能体”的称号横空出世,在KOL的助力之下刷屏全网,又凭借一码难求,被炒到5万块的内测邀请码引爆营销狂欢。不过,在部分用户在研究、体验这款产品后,提出了“套壳”、运行速度过慢、token使用量惊人、性能并不出色等质疑。

多个开源复刻项目的出现,验证了一个被热烈讨论的话题:Manus或许并不具备壁垒。

MetaGPT团队的开源项目名为Open Manus,仅由4人打造,分别为梁新兵、张佳钇、向劲宇、于兆洋,发布不到1天,该项目已在GitHub上收获了7000多颗星星。Open Manus能自主浏览网页,查询、总结信息,与Manus的基础功能类似。开源后,其开发者社区微信群全部爆满,目前已经编号到第十个群了。




项目链接:https://github.com/mannaandpoem/OpenManus?tab=readme-ov-file

开源社区CAMEL-AI打造的OWL则直接霸榜,成为了智能体测试基准GAIA开源榜单的性能之首,得分达57.7%,超越了之前开源社区Hugging Face打造的Open Deep Research(OpenAI Deep Research“被开源”:24小时成功复现,揭秘背后技术细节)。OWL背后的团队还对Manus的技术路线进行了逆向工程,将其拆解为6大核心步骤。




项目链接:https://github.com/camel-ai/owl

Open Manus背后的团队来自国内AI Agent创企DeepWisdom(深度赋智),其明星产品MetaGPT能让多个智能体协同合作,完成复杂任务。而OWL背后的CAMEL-AI则是国内知名的AI开源社区,之前也曾发布过跨平台操作系统的通用智能体CRAB。

一、4个人成功复刻Manus大部分功能,单次运行竟用掉24万tokens

作为一款本地部署的Manus平替,Open Manus基本实现了前者的主要功能。用户在下载相关代码、部署环境并为其配备大模型API接口后便可以正常使用。

根据项目放出的实测视频,Open Manus能浏览多个网页,查询、整理信息,并生成特定格式的文件。案例中,Open Manus根据用户提示词,自动打开了AI大牛Andrej Karpathy的个人主页,针对这一网页提出了搜索引擎优化的详细建议。




Open Manus团队介绍,Anthropic的Computer use项目和开源项目broswer-use给Open Manus提供了基本的支持。

目前,已有许多网友成功在本地部署了Open Manus,并分享了一手的实测体验

这位网友测试了Open Manus的信息查询、整合能力。他让Open Manus回答这一问题:“杭州哪些医院支持异地医保直接结算?”Manus成功找到了杭州医保的界面,下载了其中的医院列表,并保存为txt文件。




不过,这一过程十分昂贵,消耗了大量token。这位网友使用的是Claude 3.7模型的API,花费了3.6美元(约合人民币26元)。根据Claude 3.7 API价格(每百万tokens/15美元)进行反向推算,这则问答耗费了整整24万tokens,约等于36万到48万中文字符。




智东西将类似的问题交给开启联网搜索功能的DeepSeek-V3,可以做到秒出答案,且答案的内容、质量都与Open Manus类似。




▲DeepSeek部分回答截图

还有网友让Open Manus去整理Manus相关的信息,生成一份深度研究报告。可以看到,Open Manus快速地浏览了多个网页,大部分是媒体的报道。




最终,Open Manus以网页形式输出了一份深度研究报告。




目前,Open Manus项目处于初步阶段,未来,团队将会让这款开源工具具备更好的规划能力、接入经过强化学习微调的模型,并参与更为全面的基准测试。

Open Manus的热度飙升也让不少人关注到其背后的团队,据其GitHub界面显示,这一项目由4人完成,均是本科毕业不久的年轻AI研究员。

梁新兵

梁新兵硕士毕业于华东师范大学,之前曾参与爆火的AI Agent数据科学家Data Interpreter的开发工作。

张佳钇

张佳钇本科毕业于中国人民大学高瓴人工智能学院,目前在港科大(广州)修读博士学位。他参与研究的智能体框架AFlow在近期被ICLR 2025接收,这是深度学习领域最重要的会议之一。




向劲宇

向劲宇本科毕业于西南交通大学应用物理学专业,目前在深度赋智担任AI算法研究员,之前,他曾在2024年阿里巴巴全球数学竞赛AI赛道中获得全球第二名。




于兆洋

于兆洋本科毕业于中国人民大学高瓴人工智能学院,与校友张佳钇之前曾凭借MathAI方案在阿里巴巴全球数学竞赛AI赛道中获得全球第三名。




二、CAMEL-AI拆解Manus核心工作流,开源OWL未来将能操作所有应用

来自CAMEL-AI的OWL提供的体验则更为接近Manus。在下方案例中,OWL能自动生成任务清单,按步骤执行任务,能滚动网页,输入查询,和人类操作电脑没有太大差别,最终,它给用户生成了一份当日电影的总结报告。




另一个案例中,OWL Agent对一个GitHub仓库进行了调研总结,输出的结果条理性很强,可谓是程序员福音了。




CAMEL-AI团队分享了他们复刻Manus的过程。在他们看来,Manus的核心工作流可以拆解为六步,Agent先是“复习”之前学过的知识,在连接数据源,挂载数据,最后生成任务清单,然后按照清单执行并输出结果。




OWL不仅提供了Manus中Agent用到的操作,还更为灵活。OWL支持在Ubuntu容器中运行,这意味着它可以像Manus那样远程工作,不必本地部署。




每次执行任务时,Manus会学习并记住新知识,而OWL也具备同样的功能,可以实现新知识实时存储,持续进化,并在任务中随时召回过往经验,灵活调度。

CAMEL-AI计划将OWL与他们之前开发的跨平台操作系统的通用智能体CRAB结合,CRAB不止能操控Ubuntu容器,还能直接控制手机和电脑里的任何应用,而不仅仅是浏览器。

目前,上述每个模块都已经被CAMEL-AI单独开源,可以按需下载并使用。未来,CAMEL-AI计划撰写一篇技术博客文章,详细介绍它们在实际任务中对多Agent协作的探索和见解,并开发更复杂的Agent交互模式和通信协议。

工作流复刻:https://github.com/camel-ai/camel/issues/1723

Ubuntu复刻:https://github.com/camel-ai/camel/issues/1724

记忆工具包复刻:https://github.com/camel-ai/camel/blob/master/camel/memories/agent_memories.py

结语:被0天复刻后,Manus的“炸裂”叙事如何长存?

Manus在爆火之后,有观点认为,其核心技术并未突破现有框架,更多是对现有大模型和工具链的整合,缺乏技术壁垒;同时,Manus完成任务的质量也存疑,token消耗量巨大,但似乎并未带来相应的性能提升,这无法满足实际生产场景中对性能、成本的要求。

根据两个开源Manus的架构,这类产品实际上是多个模块的组合,如任务规划、联网查询等。从技术角度来看,实现并不复杂,可复制性较强。

已经用上Manus及其开源版本的网友反映,此类产品在运行速度、复杂任务执行上仍不太理想。未来,这款所谓的“全球首个通用AI智能体”,或许要需要进一步打磨其用户体验,才能将瞬时的爆火转化为产品的成功。


来源:网易

举报本楼

本帖有 1 个回帖,您需要登录后才能浏览 登录 | 注册
您需要登录后才可以回帖 登录 | 注册 |

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图  

GMT+8, 2025-3-10 02:33 , Processed in 0.208894 second(s), 16 queries , Gzip On.

Copyright © 1999-2023 C114 All Rights Reserved

Discuz Licensed

回顶部