继DeepSeek之后,内地研发的全球首款通用人工智能体软件(AI Agent)Manus近日上线,该产品在GAIA基准测试中展现出超越OpenAI同层次大模型的性能,发布四小时后,其官网访问量甚至突破千万量级。一夜爆火的Manus让市场惊叹,但争议不断,还被质疑是“套壳”产品。不过,业内专家指出,Manus和DeepSeek是两种不同类型的AI软件,Manus目的是解决“具体如何做”,把智能体技术往前推进一大步。
▲继DeepSeek之后,又一款AI产品Manus出圈。
Manus目的是解决“具体如何做”
Manus被称为全球首款AI智能体。据研发团队公布的信息,Manus弥合概念和执行之间的差距,“当其他人工智能祗是在生产想法时,Manus交付成果。”研发团队发布的演示视频显示,Manus可以完成简历筛选、房产研究、股票分析等任务。
但Manus自发表后就争议不断,由于Manus采用邀请内测的限制,导致多数民众乃至于业内人士无法体验到这一款AI Agent带来的创新体验,被业界质疑为“饥饿行销”。
内地的《科创板日报》还认为,Manus没有自研模型,而是用了目前程式设计开发能力最强的模型Claude以及阿里的通义模型,并加以后训练,功能则是多个应用的拼接。Manus的亮点在于工程创新:技术融合(本质是“套壳”)、顺畅交互(简单易懂的UI介面对使用者更友好)。
华中科技大学计算机科学与技术学院教授魏巍接受中新社访问时表示,“Manus与DeepSeek,不是一回事。”DeepSeek是推理语言模型,核心是信息生成与处理,擅长回答“应该怎麽做”;Manus则是通用型AI智能体,主要是利用大模型或多款不同工具去完成任务,重在解决“具体如何做”,核心是任务分配与协作。
魏巍指出,利用AI智能体完成不同任务并非Manus首创。但Manus创新之处在于把多智能体协同做成产品,将当前最先进的AI能力整合到一个流畅的用户体验中,以更加简单的方式去完成更複杂的任务,把智能体技术往前推进一大步。
效用到底如何有待实践检验
魏巍表示,从目前视频展示效果看,Manus确实非常智能。但当前其仅限于内测,缺乏技术专家综合评测和用户普遍性反馈,具体效用到底如何,仍有待实践检验。
工信部信息通信经济专家委员会委员盘和林认为,Manus作为AI智能体,儘管没有基础算法的创新,但是通过工程应用创新,将诸多大模型混合起来,达成综合效果体验,也是了不起的成果。