-
友情链接:
当深度想考遇上Agent妹妹 自慰,真万能的AI来了?
智谱AI在OpenDay上发布了巨匠首个集深度议论和操作奉行于一体的Agent家具——AutoGLM千里想。有别于大多数只会打嘴炮的AI,这款堪称“边想边干”的家具不仅能想考,还能及时操作浏览器,像真东说念主相似掀开网页、检索信息、生成陈述。
咱们第一时刻进行了一手评测,用三个骨子责任场景测试后不得不说:此次不是PPT家具,此次是简直能用!
通用Agent一直面对的最浩劫题是C端场景过于复杂多变,导致阐明性和准确性难以保证。智谱通过“先想考再奉行”的政策处理了一部分准确性的痛点。AutoGLM千里想会先制定完好议论计算,再一步步奉行,终末进行系统追忆,大大裁减了幻觉率和操作相当率。
AutoGLM千里想之是以能真能用,枢纽在于其背后的技能栈。它基于智谱自研的推理模子GLM-Z1-Air查考,这个模子堪称性能并排DeepSeek-R1,但速率耕作最高8倍,价钱仅需其1/30。深度推明智商让它不仅能像OpenAI的Deep Research相似进行深度想考,AutoGLM框架则赋予了它的确的操作智商,能自动浏览和操作网页,得回更多高质地信源。
而且对于打工东说念主来说,AutoGLM千里想皆备免费且不限次数使用,现场智谱用它演示了“如何赚到100块钱”以及“14天小红书起号计算”,咱们实测下来,AutoGLM千里想冲破了“通用Agent等于玩物”的刻板印象,不外由于“边想边干”的责任方式,它完成一项复杂任务往往需要5-20分钟不等,后果如实有待提高。但探究到它能完成的任务复杂度和准确性,这个时刻资本其实仍是比东说念主工低得多。
当深度调研与骨子操作智商相讨好,通用Agent终于要从主张走向实用了?
以下是硅星东说念主针对自媒体常见三个场景:热门分析、财务分析和计算制定,对AutoGLM进行了实测。
一、热搜话题驳倒分析
我让AutoGLM千里想分析一下微博上对于“胖东来店长月薪近8万”这个热门话题的主要不雅点、大致占比和能得出什么论断,AutoGLM千里想扫数运作的历程如下。
本文视频均经过倍速处理妹妹 自慰
接到任务后,AutoGLM千里想先去了解了胖东来这家公司和这个话题的基本情况,阐明了音信源流和薪资数据。它尝试径直去微博执取和分析商讨,但好像遭受了点技能艰难,可以执取微博帖子,但没法径直看大宗的驳倒。
于是,它换了个想路,启动凡俗搜索议论的新闻报说念、创举东说念主于东来的发言、以过火他酬酢平台(像知乎、小红书)上对于这个话题的商讨和帖子。通过阅读这些替代源流的信息,终点是小红书上的一些帖子和驳倒。
最终如故给出了一个信息量丰富、逻辑分解的分析陈述。值得谛视的是不仅修起了我的问题,还深挖了布景信息和买卖逻辑,让论断更有劝服力。
从这个历程来看AutoGLM千里想挺天真,蹊径堵了知说念换条说念走,终末如故把任务完成了。不及是因为没径直看微博,不雅点比例是靠其他平台的信息,莫得严格恪守用户的条款,如果能径直处理微博数据,分析会更塌实。
二、特斯拉股票分析
咱们让AutoGLM深想作念一份全面的特斯拉股票分析陈述,条款包含财务、商场心扉、技能面、竞品对比等方面。
AutoGLM深想接到任务后,先是征集了特斯拉的基本情况和最新动态,了解了大致的事迹。然后它启动深入挖掘,找详备的财务数据,固然尝试径直读官方年报没见效,但如故从其他财经网站把枢纽数据(像营收、利润、现款流)扒拉出来了。接着,它又去查了分析师们怎么看这只股票、商场心扉怎么样、股价图走势如何,还要点相比了特斯拉和比亚迪等竞争敌手的优劣。
终末,它把这些信息汇总起来,从价值投资的角度分析了后劲和风险,作念了个SWOT追忆,并针对不同类型的投资者给出了忽视,酿成了一份详备的陈述。
和上头热搜驳倒分析的情况肖似,AutoGLM深想能按照给出的框架一步步去征集和分析信息,隐敝面很全。即使遭受信息得回的小抑制(比如径直读年报失败),也能换个阶梯把任务完成。不外扫数历程看起来挺繁琐,搜了好屡次,花了些时刻。
骨子上这个股票分析的任务亦然Manus的官有计算例之一(https://manus.im/share/xFgpHb15vKqfRPWIs3JJPJ?replay=1),对比两个家具完成任务的历程来看,Manus像一个自动化分析师 + 设立者。它明确地奉行计算、调用用具、得回特定数据(如股价、财务主义)、进行计较(如DCF估值、技能主义)、生成图表,而且历程异常透明,用户能看到它一步步在作念什么。除了生成了详备陈述,还作念出了一个交互式的数据看板。AutoGLM千里想在信息征集和追忆方面作念得可以,但显得用具化和分析智商稍弱一些。
三、日本七日游旅行计算
咱们连接让AutoGLM千里想和Manus同题“打擂”,让AutoGLM千里想筹划为一双好意思国公民筹整齐个4月中从西雅图登程的7天日本行程:预算在2500-5000好意思元,心爱历史文化(终点是剑说念、茶说念)、想看奈良的鹿,而且想象在此次旅行中求婚,需要保举个终点地点,终末还要个浮浅的网页版旅行手册。
接到任务后,AutoGLM千里想先去查了西雅图到东京的航班大致价钱和时刻,阐明了好意思国公民去日本无用签证。然后它议论了在日本几个城市间怎么走最便捷(主若是新主线),接着就针对兴味点(历史、文化体验)去搜东京、京都、奈良的景点和行径,终点找到了东京可以体验茶说念和剑说念的处所(从小红书上找的信息)。还查了4月份天气怎么样,而且凭证别东说念主的素质保举了东京塔下的公园动作求婚地点。
终末,它把这些信息整合起来,作念了一个每天的详备行程安排,加了些日语短语和旅行提醒,还生成了一个浮浅的HTML款式的旅行手册,但可视化进程有限,基本上是索取了一些要点。
追忆:
对比来看,AutoGLM千里想坚贞是尊府得回和信息荟萃,但历程有点“黑箱”,不太明晰它怎么筛选信息、怎么作念的决策,但遭受问题知说念换个挨次试试,很心爱小红书这类酬酢平台,这让它可能更擅长找到一些过去用户共享的、非官方的、致使有点“网红”性质的地点或体验。这可能是个上风,能挖到那种更依赖官方或结构化数据的 AI 找不到的信息。对于想径直“抄功课”的用户来说,可能更径直、更省事。
而Manus的历程(https://manus.im/share/brWKUSp51ItvVMBpcXNCZ1?replay=1任务演示视频)更透明,用的挨次更千般,终末给的东西(行程、求婚指南、手册分开)更规整、更专科。
举座来看,经过此次AutoGLM千里想的评测体验,固然有一些槽点,但不得不说,AutoGLM千里想给东说念主的印象如实是劳苦得令东说念主印象潜入,而且探究到其免费特质,它很可能是你能搏斗到的最佳用的免费AI劳能源了。它就像一位不知疲顿的实习生,缄默在后台为你征集信息、整合分析,而且皆备免费。这意味着你可以释怀尝试千般不同场景,探索它的智商限制。免费的最大平正等于极低的试错资本,用户可以释怀地让它尝试千般不同的行使场景和任务。探索它的智商限制。
幼女白丝天然,它也有显然的短板。任务处理速率不算快,有时一个分析可能需要半小时以上。不外好在你不必干等着,皆备可以让它在后台缄默责任,我方行止理其他事情。独一的小苦恼是,它会每每地自动掀开新网页,如果你正在Chrome浏览器中责任,可能会有些侵犯。
这无意是东说念主类与Agent之间的第一次“领地争夺战”——谁才是电脑的真确主东说念主?(笑)妹妹 自慰