三小時復現(xiàn)Manus,開源的OpenManus帶來哪些啟示?
作者:呂倩
凌晨三點敲完代碼,次日早上八點新增三十多個好友申請,在開源社區(qū)GitHub上迅速收獲7000多顆星星——Manus爆紅不足三日,隸屬于國內AI Agent初創(chuàng)公司DeepWisdom(深度賦智)的MetaGPT 團隊,就進行了產品復刻,并將產品Open Manus上傳至開源社區(qū)。
第一財經記者對話MetaGPT團隊,試圖理清此次技術復刻的底層邏輯,以及行業(yè)喧囂背后的意義。這一過程既反映出產品功能復刻離不開DeepWisdom公司具備的技術沉淀,也通過MetaGPT團隊的視角肯定了Manus團隊在規(guī)劃、后訓練、交互方式等方面的投入。
在復刻過程中理解差異
早在2023年,MetaGPT團隊開始研究多智能體框架,并在GitHub上開源相關代碼,獲得了社區(qū)的廣泛關注。2024年10月,團隊開始探索Agent的規(guī)劃能力和工具使用能力,提出Data Interpreter等工作。
Manus火了之后,MetaGPTAI算法研究員向勁宇與MetaGPT算法研究員梁新兵討論:是否可以直接做一個開源版本。
在具體產品屬性上,OpenManus是類Manus的多智能體框架,為開發(fā)者提供了快速上手和定制化開發(fā)的平臺,但向勁宇也不忘提醒:目前OpenManus是demo級(演示版本),暫時還沒有GALA benchmark評測結果,效果可能一般。后續(xù)團隊會進一步投入DeepResearch方向與SWE(軟件工程)代碼方向。
此前Manus披露在GALA Benchmark評測中達到當前最優(yōu)水平(SOTA),超越OpenAI的Deep Research等競品。
向勁宇推測,Manus團隊本身實現(xiàn)了非常復雜的規(guī)劃與后訓練,才能夠如同其demo提供良好的產品交互。Manus面臨效果不理想時的問題也是行業(yè)性問題,OpenManus暫時也沒有達到非常強的效果。
對于三小時便能夠復刻“爆品”Manus,梁新兵對第一財經記者表示,本質在于團隊已儲備的技術積淀,且前兩個月前團隊已經在思考如何通過簡單的、優(yōu)雅的形式,去呈現(xiàn)一個Agent形態(tài)。
從Manus與OpenManus對外披露的演示視頻來看,兩者均屬于AI Agent產品,采用Multi-Agent(多智能體)架構,能夠將復雜任務拆解為多個子任務,并分配給不同的Agent(智能體)執(zhí)行。另外,兩者均具備工具鏈集成屬性,集成多種工具,如網絡搜索、代碼執(zhí)行、文件處理等,以增強智能體的功能。
相較而言,兩者最大差異在于OpenManus的開源屬性。與Manus的技術架構主要依靠使用者猜測不同,OpenManus產品團隊直接在項目致謝中提及Claude廠商Anthropic去年上線的computer-use,YC投資的項目browser-use等。OpenManus作者張佳釔公開總結產品成果結合了computer-use、基本的Agents,以及規(guī)劃能力。
多智能體將普及
與其關注Manus剛剛出圈時的諸多噱頭,不如將目光聚焦在Manus模式給行業(yè)發(fā)展帶來的啟示。
梁新兵認為,Manus讓更多普通人了解到智能體為何物,放大了Multi-Agent這條路徑。
從發(fā)展歷史來看,Multi-Agent概念雛形最早可以追溯至20世紀80年代,分布式人工智能理念興起。2017年以后,隨著大型語言模型成熟,AI Agent應用開始從理論走向實際,例如AutoGPT 的出現(xiàn)標志著AI Agent的雛形誕生。
2024年,微軟、谷歌、蘋果、OpenAI等廠商紛紛布局AI Agent市場。2025年1月,OpenAI發(fā)布首款AI Agent產品Operator,能夠執(zhí)行復雜操作,如編寫代碼、預訂旅行等,但目前僅提供給購買每月200美元ChatGPT Pro服務方案的消費者。直到國內AI廠商Monica通過Manus,讓普通群眾第一次意識到Multi-Agent概念,MetaGPT的開源產品進一步揭開其神秘面紗。
AIGCLINK發(fā)起人、行行AI合伙人占冰強對記者表示,Manus此類產品類型,之前MetaGPT團隊已經實現(xiàn)過,也算是國內首批投入智能體研發(fā)的團隊之一。
MetaGPT NLP/Agent方向研究員洪思睿在交流中表示,目前的行業(yè)發(fā)展狀態(tài)中,通過大模型或Agent去做工具的使用,已經不再新奇。隨著大家對具體產品與技術的關注越來越多,行業(yè)的技術難點在于:當很多相似的工具可解決同樣的問題,如何讓Agent把決策做得更好。另外,如果使用過程中接入的不是比較標準的工具接口,工具參數(shù)也可能出錯,進而導致工具的執(zhí)行效果不理想。
這樣的背景下,通過動態(tài)路由技術優(yōu)化工具選擇與使用,通過知識增強與幻覺抑制提升決策可靠性,采用ReAct、Chain-of-Thought(CoT)或 Tree-of-Thoughts(ToT)等推理框架幫助 Agent 更清晰地展示決策過程,成為可選擇的解決措施。
MCP協(xié)議(Model Context Protocol,模型上下文協(xié)議)目前成為了業(yè)內的主流選項。所謂MCP,是由Anthropic于2024年11月底推出的一種開放標準協(xié)議,旨在統(tǒng)一大型語言模型(LLM)與外部數(shù)據(jù)源和工具之間的通信。它通過標準化接口,使LLM能夠安全、高效地訪問外部資源,從而擴展其功能。
占冰強對記者表示,MCP本身完全可兼容,主要看技術廠商是否愿意支持。目前海外主流廠商已逐步接入,尤其是在AI工具和開發(fā)平臺領域,相信國內廠商也會陸續(xù)跟進。