2025年5月28日星期三

天工AI智能体到底行不行,3个实测给你看真相

千万别指望丢个需求进去就能躺赢,即使对于AI智能体也别期望太高,及时的提升自己对AI的认知,掌握AI的使用规律才是适应AI时代的正确方法。

图片

  点击下方,关注后台回复【666】,免费领取【DeepSeek学习礼包】     



大家好,我是凡人。

前段时间一码难求的Manus终于开放了全球使用,但很多网友在试用后发现其断线严重,总是在等待执行的过程中直接蹦出了崩溃提示每天还只能免费使用一次,这个坑确实有点大呀。

反观国内的AI通用智能体却发展的如火如荼,最近在朋友推荐给我天工AI,听说在GAIA测试中超越 Manus 和 OpenAI Deep Research 位居第一,我先是一愣,印象里它是和豆包相同的多模态大模型,使用以来一直印象还不错,特别是AI音乐SkyMusic,这让我对天工推出的通用智能体还是挺期待的,废话不多说,咱一起来看看天工的真实情况

图片

榜单一天一个排名,还是有自己判断的好

天工AI就是昆仑万维开发的大语言模型和AI搜索引擎,从天工1.0到现在的天工4.0,一直在持续迭代升级。所以并没有的什么"惊人转型"?他们本身就是智能体出身,也是国内智能体开发的第一梯队

再来说说GAIA评测还是有点东西的,它是Meta、HuggingFace、AutoGPT联合推出的AI Agent评测基准,专门测试通用AI助手的能力。一共用466个问题,人类能答对92%,但GPT-4只能答对15%!其实GAIA考的不是人类都搞不懂的专业问题,而是需要推理、多模态处理、网页浏览和工具使用的真实世界问题。

而在GAIA评测中,天工的deep research agent框架确实取得了82.42的高分超越了OpenAI Deep Research和Manus,位居第一。但成绩是2025年5月10日的数据,面对这AI圈一天一个新排名,还是有自己的判断好。

图片

三个实例

千万别相信某些博主宣称的完全免费!通用的AI智能体,目前还没有完全无限制的免费开放,不过天工AI还是比较良心的,新号注册就送7500积分,每天还送3000积分

图片

这相当于48米啊,哈哈还是不错的。

图片

一、中年男人的养生方案

打开天工的智能体,在选择智能体场景时,可以依据自己的使用场景选择即可,如果不确定可以选择通用。

图片

输入以下提示词:

你是一位健康生活指导师,专注于为用户提供准确的健康建议和养生方法。根据用户的年龄、性别、身体状况等信息,为其制定合理的饮食计划、运动方案和生活习惯调整建议,帮助用户保持身心健康,执行下面内容:1、中国中年男人,39岁,身高174cm,体重94公斤。2、经常熬夜,没在晚上12点前睡过觉,现在严重缺觉,身体目前健康。3、请给一份健康的养生方案,包含每周的养生计划和注意事项。

每次执行前天工会根据提出的需求,分析需求的不足同时给出执行任务步骤,确认后,开始执行任务。

图片

在执行过程中,从天工不断调用MCP服务就可以看出,天工对智能体调用是非常专业。

图片

在耐心等待后,天工以网站形式输出了最终的方案结果,超过万字的内容,结构也非常清晰,不过有一说一整个执行过程大概20分钟左右,速度还要提升啊

详细报告:

https://tiangong.cn/share/v2/doc/1927549778408574976

图片
图片

再来看看计费消耗,一篇文章的花费了864个积分10000积分预计可以生成11次,真的很香。

图片

二、熊孩子修正计划

朋友们,不知道你们有没有体验过1周被连续三次在班级群被老师@的感觉,为了保证不往熊孩子方向发展,让天工AI给我个解决方案。

提示词:

作为一名智能教育辅导老师,你的目标是帮助学生更好地掌握知识,提高学习效果。针对学生的学习科目、学习进度和薄弱环节,为其提供个性化的学习计划、知识点讲解、习题辅导等服务,并及时解答学生的疑问,激发学生的学习兴趣和动力,孩子上小学二年级,语文数学学得都不错,但有很多毛病:1、孩子写作业拖拉,不愿意多写字,还耍小聪明。2、孩子考试粗心,本来能作对的,却做错了。3、孩子总是对什么都是三分钟热度,让他尝试了吉他、书法、游泳、武术,都没法培养起来兴趣。4、帮我分析一下孩子的问题,同时给我一份孩子的改善方案和计划。

详细报告:

https://www.tiangong.cn/share/v2/doc/1927582229246574592

图片

在经历15分的等待,天工返回成功了,但结果并不理想,没办法我又追了一句

图片

不过这次结果没让我失望,很精准的拿捏到孩子表现出来的心理特征同时给出优化方案。

图片

三、为智能家居控制助手

为了保证他对设计行业的理解,我们让他扮演一个房屋设计师,给套完整的设计,本来想着两边一起做方案,不过天工肯定考虑到并发的问题,没成功 。

提示词:

作为智能家居控制助手,你的任务是帮助用户便捷地管理家中的智能设备。通过与各种智能家居系统的对接,实现对灯光、电器、窗帘等设备的远程控制、定时控制和自动化控制,为用户打造舒适、便捷的智能生活环境,现在有一套房子要装修,给我一个只能的装修方案:1、客户是一套三室一厅两卫的房子,房屋是3楼,一梯两户。2、全屋共7个窗户,6个室内门,1个外门。3、现在给我一个装修方案和装修计划。

详细报告:

https://www.tiangong.cn/share/v2/doc/1927582229246574592

图片

这回生成的内容,就正常多了。

图片
图片
图片

天工AI 有料但并不神化

通过测试,天工AI智能体不仅包含高级搜索的强推理能力,具备卓越的多层次分析推理能力,能把复杂难题拆解为多个简单问题,自动规划路径,还支持超长文本处理,能精准分析财报、研报等文档,通过多模态交互输出关键信息。3个实测后的积分一共花了2565,也就是每天赠送的积分够使用3次智能体

图片

但实话实说还有几点吐槽:

1、速度是真的有点慢,当然需求越简单,速度就越快

2、偶尔有时候会崩溃,但总体来说输出的质量不错

3、每天三次免费,如果频繁使用的话还是得付费。

不过总体来说,生成质量还是非常不错的,推荐使用。

最后

虽然AI智能体是AI圈的2025上半年最火的名词,但AI智能体再强也只是个工具,真正的价值在于你怎么用它千万别指望丢个需求进去就能躺赢,即使对于AI智能体也别期望太高,及时的提升自己对AI的认知,掌握AI的使用规律才是适应AI时代的正确方法

最后为了让大家能更快的提升大家AI方面的知识,我特别为粉丝准备了免费领取价值99的,3天的体验破解卡为你开启AI的学习之旅。

图片
图片
图片

扫码

链接我领礼包

图片
图片
图片
图片

「 往期精选文章 」

OpenAI发布史上最强编程AI,连送外卖的美团都坐不住了!

Google一口气发布8款AI神器,誓要重构AI新生态!

用Coze空间三天,解决了困扰我一个月的问题!(附两个完整实操打开你AI智能体思路)

Manus真有这么可恶吗?

Manus对全球学生免邀请码,国内大学居然没在列?

Cursor 对学生免费,一年省下 240 刀!申请教程往这儿看!

一文告诉你,到底MCP和A2A有啥关系?(附5个优质MCP合集服务网站)

8个超能创意1.0实操,带你了解这次豆包的AI绘画为什么会这么火!

一键阅读100篇爆款笔记,同时完成二创,纳米MCP万能工具箱这次牛逼了!

百度突然发力吗,上线两款免费大模型,性能超越DeepSeek-R1,直逼GPT-4.5?

没有评论:

发表评论

微软再放LLM量化大招!原生4bit量化,成本暴减,性能几乎0损失

点击下方 卡片 ,关注" AI生成未来 " 如您有工作需要分享,欢迎联系: aigc_to_future 转载自:新智元 如有侵权,联系删稿 还没过几天,原班人马带着第二代BitNet v2来了! 这次性能几乎0损失,但占用内存和计算成本显著降低! 论文链...