迪士尼彩乐园iii 用Manus作念完3个任务后，它概况能替代实习生，但也会偷懒摆烂

发布日期：2024-11-29 05:39 点击次数：124

自从上周初创公司 Monica 发布通用 AI Agent —— Manus 以来迪士尼彩乐园iii，它就像野火一样在蚁集上赶紧扩展传播。

不仅在中国如斯，它在人人鸿沟内同样引起了平日善良，其中不乏 Twitter 集合独创东谈主 Jack Dorsey 和 Hugging Face 的产物讲求东谈主 Victor Mustar 等在内的科技界知名东谈主士齐对其施展拍案叫绝，还有东谈主甚而将 Manus 视为“第二个 DeepSeek”。

Manus 宣称是人人首款信得过真谛真谛上的通用 AI Agent，其整合了多个 AI 模子（如Anthropic 的 Claude 3.5 Sonnet 及巴巴开源的 Qwen 的微调版块）以及多种疏淡入手的智能体，

Manus 不仅能生成和提供想法，更能疏淡念念考并摄取步履，将想法付诸实践来信得过惩处问题，具备从权术到实践全经过自主完成任务的才智，比如撰写讲解、制作表格等。而这，使它永别于基于单一大型言语模子眷属筹画主要用于对话交互的 AI 聊天机器东谈主。

尽管备受善良，但实践上信得过使用过 Manus 的东谈主却很少。

限度当今，在“恭候名单”上唯有不到 1% 的用户收到了邀请码（具体恭候东谈主数尚不明晰，但仅从风趣度来看，Manus 的 Discord 频谈就有向上 186,000 名粉丝）。

如今，《麻省理工科技有计划》赢得了探望 Manus 的契机。在我对其进行深度体验后，嗅觉就像是在与一位高度智能且高效的东谈主类实习生合作。尽管偶尔会误罢职务要求、作念出无理假定，或是为了加速程度而“偷工减料”，但它能够走漏地解释我方的念念考过程，具有很强的顺应性，并在接受详细指挥或反馈后显贵普及性能。

总结来说：它是有长进的，但并非白璧无瑕。

与该公司早先发布的面向人人用户的 AI 助手 Monica 访佛，Manus 默许建立亦然英文界面，筹画比拟简略明了。

首次使用 Manus，用户开端需要输入有用的邀请码，然后系统会率领用户干涉一个与 ChatGPT 或 DeepSeek 相似的登陆页面，左侧骄气之前的会话，中间主体部分是聊天输入框。登陆页面还展示了公司精选的一些示例任务，从营业计谋开辟，到互动学习，再到定制音频冥想课程等。

与其他基于推理的 AI 用具（如 ChatGPT DeepResearch）一样，Manus 能够将任务领会为多个门径，并自主浏览蚁集以获取完成任务所需的信息。

卓尔不群的是“Manus's Computer”窗口，它不仅可以让用户不雅察智能体正在作念什么，还可以在职何时候进行骚扰。

为了测试它的功能，我给 Manus 顶住了三项任务：1、整理一份报谈中国科技规模的知名记者名单；2、搜索纽约市的两居室房源；3、提名《麻省理工科技有计划》每年评比的“35 岁以下科技革命 35 东谈主”候选东谈主。

以下是 Manus 的完成情况。

任务 1：Manus 给出的第一份记者名单唯有戋戋五个名字，并鄙人面列出了五个“荣誉提名”。我凝视到，它对某些记者的代表作进行了标注，但对其他东谈主却莫得这么作念。当我盘考原因时，Manus 的回答稀疏地浅显：它偷懒了。

“由于试图加速整理过程，时刻限制导致部单干作作念得不够精粹。”Manus 告诉我。在我坚合手要求保合手一致性和竣工性之后，Manus 提供了一份包含 30 名记者的详细名单，注明了他们当今的责任单元和代表作。（我很雀跃看到我方和许多垂青的同业齐在名单上。）

令我印象深远的是，我可以像指挥东谈主类实习生或助手一样冷漠修改建议，而 Manus 也能够安妥地恢复。天然开端它忽略了某些记者老板变更的信息，但在我的要求下重新搜检后，它很快就进行了修正；另外一个可以的功能是，输出终结可以下载为 Word 或 Excel 文献，便于裁剪或共享。

可是，当尝试探望付费新闻著述时，Manus 遇到了祸患，频繁遇到考证码阻遏。由于我能够一步情状进行跟进，是以可以常常接办并匡助完成这些任务，毕竟有好多媒体网站以可疑行动为由龙套 Manus 探望。我合计在这方面有很大的修订空间，要是异日的 Manus 版块能在遇到这类限制时主动寻求匡助将会进一步普及后果。

任务 2：关于房源搜索任务，我给出了一系列限制条款，迪士尼彩乐园app包括预算、浩荡的厨房、户外空间、曼哈顿市中心的可达性，以及距离主要火车站七分钟走路鸿沟内等要求。

Manus 开端对抵赖的要求，比如“某种形状的户外空间”调解过于字面化，全齐排斥了莫得私东谈主露台或阳台的房源。不外，在我进一步指挥和知道后，它生成了一个更平日且有用的清单，分端倪冷漠建议，并提供了简略的重点抽象。

它最毕生成的终结看起来就像出自 Wirecutter（知名产物评测网站），包含诸如“最好综合弃取”、“最好性价比”和“豪华选项”等副标题。这个任务（包括来去相通）破钞不到半小时，少于整理记者名单所需的一个多小时，这概况是由于房源信息在网上愈加公开和结构化。

任务 3：这亦然最具挑战性的任务，我让 Manus 为本年的“35 岁以下科技革命 35 东谈主”评比提名 50 东谈主。出于对 Manus 的施展十分兴趣，我很想望望它能作念到什么程度。要知谈，这项任务量远大，咱们常常每年会收到数百份报名肯求。

来到 Manus 这里，它开端将任务领会成了几个门径，包括总结以往的名单以了解采纳圭臬、制定搜索计谋以识别候选东谈主、蚁集姓名并确保候选东谈主的万般性等。

制定搜索计谋是统统这个词过程最耗时的部分，天然 Manus 莫得明确证明其门径，但从“Manus's Computer”窗口可以看到它赶紧浏览了大批驰名研究型大学网站、科技奖项公告以及新闻。可是，就像在实践任务 1 时那样，当 Manus 尝试探望学术论文和付费内容时再次遇到了阻遏。

蚁集搜索长达三个多小时，在此时刻 Manus 屡次盘考我是否可以放松搜索鸿沟，但它只提供了三名具有竣工配景府上的候选东谈主。在我要求提供竣工的 50 东谈主名单时，它最毕生成了一份名单，但某些学术机构和规模的局域代表性异常高，似乎反应出它的研究过程并不全面。

在我指出这个问题并要求它从中国寻找五位候选东谈主后，它编制了一份可靠的五位候选东谈主名单，不外这些候选东谈主似乎齐偏向于在中国媒体上备受善良的东谈主物。最终，由于系统教导接续输入过多文本可能会裁减 Manus 的性能，我不得不弃取废弃。

我的不雅点：总体而言，我发现 Manus 是一款异常直不雅的用具，即就是莫得编程配景的用户也能常常上手使用。在三项任务中，它有两项任务提供的终结优于 ChatGPT DeepResearch，尽管完成这些任务所需的时刻更长。

Manus 似乎比拟合适那些需要平日使用怒放互联网进行研究但鸿沟相对有限的分析任务。换句话说，它最适用于处理访佛于老到东谈主类实习生在一天责任时刻内能够完成的责任。

可是，并非一切齐异常凯旋。Manus 还常常际遇崩溃和系统不庄重的问题，在处理大批文本时可能会遇到卡顿。比如，当我尝试启动新请求时，“由于现时工作负载较高，无法创建任务，请几分钟后重试”这一音信在我屏幕上显现了好几次，偶尔“Manus's Computer”也会在一个页面上万古刻冻结。

据 Manus 首席科学家（Peak Ji）所说，“它的故障率高于 ChatGPT DeepResearch，团队当今正在入辖下手惩处这个问题。”

值得注主见是，有媒体报谈，Manus 每项任务的资本约为 2 好意思元，仅为 DeepResearch 资本的十分之一。要是 Manus 团队加强其工作器基础设施，我合计该用具或将成为个东谈主用户的首选，尤其是白领专科东谈主士、疏淡开辟者和袖珍团队。

终末，我合计 Manus 的责任过程相对透明且具有合营性，这极少异常有价值。它在实践过程中会主动发问，并将关节辅导看成“常识”存储在其牵记中以备将来使用，从而提供了一个“易于定制的智能体”体验。此外，每次会话齐可以回放和共享，这也很便捷。

我瞻望我会在日常活命以及责任中接续使用 Manus 来完成万般任务。天然我不祥情将其与 DeepSeek 进行比拟是否全齐安妥，但这进一步讲明了中国的 AI 公司并不是在侍从西方同业的脚步：不仅在基础模子上进行革命，还在以我方的方式积极股东自主 AI 智能体的阁下和发展。

https://www.technologyreview.com/2025/03/11/1113133/manus-ai-review/