千万别指望丢个需求进去就能躺赢,即使对于AI智能体也别期望太高,及时的提升自己对AI的认知,掌握AI的使用规律才是适应AI时代的正确方法。
点击下方,关注后台回复【666】,免费领取【DeepSeek学习礼包】
前段时间一码难求的Manus终于开放了全球使用,但很多网友在试用后发现其断线严重,总是在等待执行的过程中直接蹦出了崩溃提示,每天还只能免费使用一次,这个坑确实有点大呀。
反观国内的AI通用智能体却发展的如火如荼,最近在朋友推荐给我天工AI,听说在GAIA测试中超越 Manus 和 OpenAI Deep Research 位居第一,我先是一愣,印象里它是和豆包相同的多模态大模型,使用以来一直印象还不错,特别是AI音乐SkyMusic,这让我对天工推出的通用智能体还是挺期待的,废话不多说,咱一起来看看天工的真实情况。
榜单一天一个排名,还是有自己判断的好
天工AI就是昆仑万维开发的大语言模型和AI搜索引擎,从天工1.0到现在的天工4.0,一直在持续迭代升级。所以并没有的什么"惊人转型"?他们本身就是智能体出身,也是国内智能体开发的第一梯队。
再来说说GAIA评测还是有点东西的,它是Meta、HuggingFace、AutoGPT联合推出的AI Agent评测基准,专门测试通用AI助手的能力。一共用466个问题,人类能答对92%,但GPT-4只能答对15%!其实GAIA考的不是人类都搞不懂的专业问题,而是需要推理、多模态处理、网页浏览和工具使用的真实世界问题。
而在GAIA评测中,天工的deep research agent框架确实取得了82.42的高分,超越了OpenAI Deep Research和Manus,位居第一。但成绩是2025年5月10日的数据,面对这AI圈一天一个新排名,还是有自己的判断好。
三个实例
千万别相信某些博主宣称的完全免费!通用的AI智能体,目前还没有完全无限制的免费开放,不过天工AI还是比较良心的,新号注册就送7500积分,每天还送3000积分。
这相当于48米啊,哈哈还是不错的。
一、中年男人的养生方案
打开天工的智能体,在选择智能体场景时,可以依据自己的使用场景选择即可,如果不确定可以选择通用。
输入以下提示词:
你是一位健康生活指导师,专注于为用户提供准确的健康建议和养生方法。根据用户的年龄、性别、身体状况等信息,为其制定合理的饮食计划、运动方案和生活习惯调整建议,帮助用户保持身心健康,执行下面内容:
1、中国中年男人,39岁,身高174cm,体重94公斤。
2、经常熬夜,没在晚上12点前睡过觉,现在严重缺觉,身体目前健康。
3、请给一份健康的养生方案,包含每周的养生计划和注意事项。
每次执行前天工会根据提出的需求,分析需求的不足,同时给出执行任务步骤,确认后,开始执行任务。
在执行过程中,从天工不断调用MCP服务就可以看出,天工对智能体调用是非常专业。
在耐心等待后,天工以网站形式输出了最终的方案结果,超过万字的内容,结构也非常清晰,不过有一说一整个执行过程大概20分钟左右,速度还要提升啊。
详细报告:
https://tiangong.cn/share/v2/doc/1927549778408574976
再来看看计费消耗,一篇文章的花费了864个积分,10000积分预计可以生成11次,真的很香。
二、熊孩子修正计划
朋友们,不知道你们有没有体验过1周被连续三次在班级群被老师@的感觉,为了保证不往熊孩子方向发展,让天工AI给我个解决方案。
提示词:
作为一名智能教育辅导老师,你的目标是帮助学生更好地掌握知识,提高学习效果。针对学生的学习科目、学习进度和薄弱环节,为其提供个性化的学习计划、知识点讲解、习题辅导等服务,并及时解答学生的疑问,激发学生的学习兴趣和动力,孩子上小学二年级,语文数学学得都不错,但有很多毛病:
1、孩子写作业拖拉,不愿意多写字,还耍小聪明。
2、孩子考试粗心,本来能作对的,却做错了。
3、孩子总是对什么都是三分钟热度,让他尝试了吉他、书法、游泳、武术,都没法培养起来兴趣。
4、帮我分析一下孩子的问题,同时给我一份孩子的改善方案和计划。
详细报告:
https://www.tiangong.cn/share/v2/doc/1927582229246574592
在经历15分的等待,天工返回成功了,但结果并不理想,没办法我又追了一句。
不过这次结果没让我失望,很精准的拿捏到孩子表现出来的心理特征同时给出优化方案。
三、为智能家居控制助手
为了保证他对设计行业的理解,我们让他扮演一个房屋设计师,给套完整的设计,本来想着两边一起做方案,不过天工肯定考虑到并发的问题,没成功 。
提示词:
作为智能家居控制助手,你的任务是帮助用户便捷地管理家中的智能设备。通过与各种智能家居系统的对接,实现对灯光、电器、窗帘等设备的远程控制、定时控制和自动化控制,为用户打造舒适、便捷的智能生活环境,现在有一套房子要装修,给我一个只能的装修方案:
1、客户是一套三室一厅两卫的房子,房屋是3楼,一梯两户。
2、全屋共7个窗户,6个室内门,1个外门。
3、现在给我一个装修方案和装修计划。
详细报告:
https://www.tiangong.cn/share/v2/doc/1927582229246574592
这回生成的内容,就正常多了。
天工AI 有料但并不神化
通过测试,天工AI智能体不仅包含高级搜索的强推理能力,具备卓越的多层次分析推理能力,能把复杂难题拆解为多个简单问题,自动规划路径,还支持超长文本处理,能精准分析财报、研报等文档,通过多模态交互输出关键信息。3个实测后的积分一共花了2565,也就是每天赠送的积分够使用3次智能体。
但实话实说还有几点吐槽:
1、速度是真的有点慢,当然需求越简单,速度就越快。
2、偶尔有时候会崩溃,但总体来说输出的质量不错。
3、每天三次免费,如果频繁使用的话还是得付费。
不过总体来说,生成质量还是非常不错的,推荐使用。
最后
虽然AI智能体是AI圈的2025上半年最火的名词,但AI智能体再强也只是个工具,真正的价值在于你怎么用它。千万别指望丢个需求进去就能躺赢,即使对于AI智能体也别期望太高,及时的提升自己对AI的认知,掌握AI的使用规律才是适应AI时代的正确方法。
最后为了让大家能更快的提升大家AI方面的知识,我特别为粉丝准备了免费领取价值99的,3天的体验破解卡,为你开启AI的学习之旅。
扫码
链接我领礼包
「 往期精选文章 」
OpenAI发布史上最强编程AI,连送外卖的美团都坐不住了!
用Coze空间三天,解决了困扰我一个月的问题!(附两个完整实操打开你AI智能体思路)
Cursor 对学生免费,一年省下 240 刀!申请教程往这儿看!
一文告诉你,到底MCP和A2A有啥关系?(附5个优质MCP合集服务网站)
8个超能创意1.0实操,带你了解这次豆包的AI绘画为什么会这么火!
没有评论:
发表评论