2025年4月19日星期六

就在昨晚扣子竟然干掉了扣子,一句话生成工作流的时代已出雏形,跟舰长一起来领内测邀请码吧


点击上方卡片关注 不要错过精彩文章


🎉

读完这篇文章,别忘记给舰长点一个关注!舰长的智能体搭建文章,不仅是节点的构建,也有思路的分享。智能体搭建最重要的就是思路。最希望,能给大家带来不一样的搭建思路和方法。 

点一点上方的🔵蓝色小字关注,你的支持是我最大的动力!🙏谢谢啦!🌟" 



     大家好!我是舰长🙏 就在昨天晚上Coze迎来大动作"扣子出了个产品把扣子干掉了"这句话是不是很懵。


在这里舰长也不和大家卖关子了,这次Coze出来的产品叫"扣子空间"类似于manus一样,可以自动完成一些较为复杂的任务,将工作流能实现的能力变成一句话大白话。


在圈内容直接热度暴涨,刚开始只开放了一些邀请码,很多人就开始求邀请码,舰长还是有幸收到了官方一手的邀请码。很多有商业的人直接挂咸鱼卖邀请码了,最离谱的是闲鱼上的邀请码卖到了200多。没错体验【扣子空间】是需要邀请码


【扣子空间】但是毕竟也是刚出身,很多地方还不够完善,这不舰长团队成员一起进行测试,并写下这篇长文。大家可以详细看一下有缺点的地方,作为参考。看完这篇文章领取一个【扣子空间】邀请码,开始体验吧!


当然,各位大厂的MCP都陆续面世,扣子的MCP也在《扣子空间》上线,且上线则打通飞书生态的存储功能:

高德地图、飞书云文档、飞书多维表格、飞书电子表格、墨迹天气、图像工具、语音合成、Notion、Github、MySQL、Clickhouse


本次给大家主要测评的内容有:

· 查询上海的天气,并存入飞书多维表格

· 年轻女孩的音色朗读文章

· 将文章保存到飞书云文档、notion

· 写一篇养生文章,并生成html卡片图

· 为情侣定制与ishowspeed(甲亢哥)同款行程规划(超详细测评)

· 抓取今日最热10条新闻,汇总制作漂亮的网页

· 制作成语消消乐HTML游戏

· 分析财报并做成网页

· 测试中遇到一些内容


进入扣子首页,选择"扣子空间"入口,填入你的邀请码,就可以使用扣子空间功能了。


扣子空间有2种模式可以选择:探索模式和规划模式。默认是探索模式。

我们先用探索模式来试试:


输入你的任务后,会进入对话页面。


选择下面的【扩展】入口,查看MCP插件,就可以看到MCP的插件


输入你的任务要求,它就会思考你的工作需要拆分成几步,然后逐步执行,省去了工作流编排的时间。


我们测试了一些案例,一起来看看:


舰长团队五津:

查询上海的天气,并存入飞书多维表格

选择【探索模式】

🎨

我的任务是:查询一下最近3天上海的天气,保存到飞书多维表格中

它自己调用了墨迹天气插件,并且思考之后,把信息存到了多维表格中。

效果不错,它直接创建一个新的多维表格、并且填写了各个字段,省去了很多配置飞书多维表格的步骤,用过工作流的都知道多维表格的配置有多费力。


选择【规划模式】

这个模式会在一开始把任务步骤安排好,你需要确认,然后它再执行后续的操作。

处理起来比较慢,任务简单也会耗费2分钟,一会又变成了3分钟,5分钟,速度比较慢。

最终生成了2天的数据,而且还是过去2天,这个执行效果不佳

重要!舰长仅剩少量内测邀请码,提供给大家内测,感谢您给文章一键三连, 评论区回复 "邀请码申请",并扫描文章底部微信二维码截图发送给舰长  先到先得


年轻女孩的音色朗读文章

当它帮我生成了一篇文章,我希望让它用年轻女孩的声音读出来,它生成了一个mp3链接,声音确实是年轻女孩:https://lf-bot-studio-plugin-resource.coze.cn/obj/bot-studio-platform-plugin-tos/artist/image/60f882bd750b422ca00cdf1afec7c466.mp3

舰长团队 五津:

将文章保存到飞书云文档、Notion

我让它把前面生成的各种信息汇总,存入飞书文档,它也很丝滑的完成了:


存入notion文档,只是链接没有加超链接:

舰长团队 五津:

写一篇养生文章,并生成Html卡片图

帮我写一篇养生类的小红书爆文的文案、标题,把文案用html生成几张卡片图

它先搜索相关资料、写文章、生成网页、部署网页。


最终,它帮我生成了一个网页。虽然效果欠佳,但UI还是不错的,而且它帮我生成了几个图放到网页中,可以再继续通过语言调整UI。

https://space.coze.cn/web?uri=7494619243582488588%2F%E7%A7%8B%E5%AD%A3%E5%85%BB%E7%94%9F%E5%B0%8F%E7%BA%A2%E4%B9%A6%E7%88%86%E6%96%87%E6%96%87%E6%A1%88%E6%A0%87%E9%A2%98%E5%8F%8A%E5%8D%A1%E7%89%87%E5%9B%BE%E5%88%B6%E4%BD%9C%E9%9C%80%E6%B1%82-04446a74fa.jsx

舰长团队 三秦:

为情侣定制与ishowspeed(甲亢哥)同款行程规划,汇总进飞书多维表格

为了测试扣子空间能否完成

  • 识别意图,理解需求
  • 搜索网页、自媒体贴文和视频切片,调取相关信息
  • 信息汇总、整理
  • 信息分析,根据用户需求进行合理推测
  • 重新生成新信息(信息仿写)
  • 信息输入至新终端

等能力。我给扣子空间设计了一个任务,promp如下:

给我一个和ishowspeed(甲亢哥)中国行一模一样的行程规划,包括各项活动以及相对应的时间,入驻的酒店,就餐的餐厅、预算,但是给我和我女朋友一共两个人定制,最后放进飞书多维表格里。要求:一步一步规划,给出每一步的行程和建议,提供理由。

使用的是扣子空间的【规划模式】

调用的MCP扩展是【高德地图】【墨迹天气】【飞书多维表格】

好啦,该干的我都干了,解放双手,等到她把饭喂到嘴里面,耶!(^-^)V

Round 1:扣管家小心翼翼做规划,秦大爷潇洒放手任她干

接活就干,扣管家先是本本分分地直奔搜索而去

下一秒我就明白了【规划模式】是什么意思。哦·········原来是先给我列一个行动计划

看起来也还说得过去,虽然没有告诉我要调用什么工具,依据哪些细节进行深入分析,查询哪天的天气,查询人流量、交通状况,搜索各种消费场景的费用············等等100条细节吧

但是咱是那种斤斤计较的小男人吗?必然不是啊。AI,人工智能,我要是人工了还要智能干啥?用人不疑疑人不用,让她干吧!

Round 2:扣管家强搜甲亢行程,却忽略若干需求

第二轮的搜索是激动人心的,咱倒了杯茶翘起了脚坐等扣子搞一搞搜索这样的累活。眼见着她一板一眼地搜索着ishowspeed"行程""内容""时间安排""酒店",确实看起来有模有样的啊

详细信息出炉了,赶紧点开看一下!

嗯,中规中矩,就是网上信息的提要。接着看。

这一看我就不开心了。咱明明说了要包含对应的时间,预算,而且ishowspeed是全程直播的,很多信息通过网络上的切片以及分发是可以找到的,但最后提供的信息就·········挺模糊的,有些让人失望。

只有香港行给了个酒店,但具体去哪里吃饭呢?吃了什么?花了多少钱?全球上千万的粉丝都看到了,但扣管家看不到。emmmmm

算了,大人不计小人过。看看她还能整出点啥新花样

Round 3:扣管家无视核心需求,只知一味"独立"思考

上一轮略有失望的一顿操作后,扣管家倒是不就地躺平,开始询问一些"定制"信息了

怎么说呢,有想法,但不多。问体力和偏好当然可以,不过这不是我最关心的。我再次强调了预算的问题。毕竟这是我一开始就提的需求。

一顿指令过后,扣管家·······

真是忍不了了,我刚刚提了预算,预算,还tm是预算,可是她满不在乎,依旧满面春风地问"······体力情况?""······兴趣偏好?"嗯,我好像嗅到了一点点人工智障的气息了。不跟她周旋了,弃疗了,赶紧干正事吧。

Round 4:扣管家知错就改,朕心略慰。可是·······

这扣管家的脑回路有点意思,我上上条信息指令她关注预算,可是她还是一味地询问"体力""偏好",等到我终于弃疗了,才反应过来我刚才抓狂的是什么,这种反应弧啊,真是配得上一个著名网红:

点击调整过后的行程信息看一看!

嗯,中规中矩

看起来,新加入的内容包括酒店、预算,看起来还不错,不过真的是看起来

要不是咱真的在北京待过几年,大概知道长城的位置,差点被这老小子蒙过去了!

看看她推荐的北京华尔道夫酒店吧,你把这个叫做"靠近景点"?

更有意思的是,北京上海推荐的是四星级酒店,高大上,小钱包直接掏空的那种,可是到了成都,就······


咱就是说,虽然现实中的游客不乏住完五星级酒店,再换一个小清新民宿换换口味,但作为旅游规划者,你是不是没有把游客的消费能力层次整明白呢?

还有就是交通的问题。机票确实是浮动的,但火车票总归是大体稳定的吧,调取12306不行,第三方网站总能找到的吧。看看扣管家的交通预算

全是整数,连一点零头都没有,哪怕有个区间呢?你强大的计算能力和归纳能力到哪里去了呢?

还有,要不是咱熟悉京沪高铁的价位,也差点被她蒙过去了。这是我查的京沪高铁的票价:

这个价位基本是最低价位了,很明显,页面上没有低于550元的(其实也有低价的,但车次很少,主流就是这个价格),两个人加一块至少1100元,再说"穷家富路",路费的预算准备不应该高于普遍价格以备不测么?扣管家啊扣管家,你这个数学题做得不太妙啊。

Round 5:扣管家自顾自梳理已有信息,越等越焦躁

扣管家开始自顾自地干活了,根本没给我插嘴的机会,开始梳理已有的信息。


干活是好的,生成UI网页也是好的,而且超出我的预期,不过执行时间·······有点漫长了。

我掐了掐表,执行1分钟,2分钟,3分钟·········直到10分钟,还没做完。嗯········

Round Final:出图,出网页,出最终结果,打开一看······

不bb了,赶紧去看!打开网页瞧瞧!

https://space.coze.cn/web?uri=7494603032567971903%2F%E6%83%85%E4%BE%A317%E5%A4%A98%E5%9F%8E%E4%BB%BFishowspeed%E4%B8%AD%E5%9B%BD%E8%A1%8C%E5%AE%9A%E5%88%B6%E8%A1%8C%E7%A8%8B%E8%A7%84%E5%88%92%E5%8F%8A%E9%A2%84%E7%AE%97-0ac01de45a.jsx

我俩的活动安排在哪里?

城市路线图永远在加载中

城市行程就·······这么简单?哪怕有一点景点介绍呢?哪怕放张图呢?每一项的预算哪里去了?


啊,预算放这了。可是只有一个总价,没有分项吗?没有范围吗?没有试着,哪怕尝试一下分阶梯预算情况吗?

没有了,就这些了。诸君可以点开看看,链接里全部就这些了。

最后的碎碎念

我想肯定会有人说,你的Prompt写得不行啊,本来就没那么多指令,怎么给扣子提那么多要求。

咱就是说,就算是用大模型,比如deepseek一下旅游攻略,这输出效果也比她强啊。

不信?看看deepseek的效果


没有附加的prompt,没有像和扣管家那样反复提需求,deepseek输出的虽然不够多,但总体上还算全面。

所以灵魂问题来了:

🦄

用大模型都能做到的事,而且做得还更好,我为什么用扣管家呢?

真心希望扣子团队继续加油,优化功能,我们这些扣子重度用户比谁都希望扣子能做出来最牛X的MCP能力,千万不要辜负我们的期待啊!


舰长团队 阿军:

抓取今日最热10条新闻,汇总制作漂亮的网页


prompt:收集今天最热的10条新闻,然后用漂亮的图片表格做出来汇总

最终效果:


一.搜索阶段:

分别查询了最热新闻、热门新闻、头条新闻、新闻排行、十大新闻等网站,然后右侧"浏览器"中又会分别对各个网站进行若干条新闻的解索


二.然后对收集的内容进行深度思索、UI设计、网页代码编写、网页部署等流程


三.最终本次任务大概耗时3分钟左右,实现了可交互式网页展示最新热点前10新闻网页,直接显示在右侧


也可以点击"新标签页面打开"按钮打开网页


总结:总体效果还是非常赞的,以后这种可交互式的搜集、报表、总结性的网页完全可以用它来"一键"生成!👍

扣子空间生成的网址:👇👇👇

https://space.coze.cn/web?uri=7494619514420871209%2F2025%E5%B9%B44%E6%9C%8818%E6%97%A5%E6%9C%80%E7%83%AD10%E6%9D%A1%E6%96%B0%E9%97%BB%E6%B1%87%E6%80%BB-5f7d42142a.jsx


舰长团队 伊登:

制作成语消消乐HTML游戏

帮我做一个成语文字游戏,类似消消乐的方式,做成html游戏

https://space.coze.cn/web?uri=7494583469914390538%2F%E6%88%90%E8%AF%AD%E6%B6%88%E6%B6%88%E4%B9%90html%E6%B8%B8%E6%88%8F-dba4ee780d.jsx


舰长团队 大壮:

分析财报并做成网页

我上传了苹果24 年q1 季度财务报表.pdf,让他给我做分析。用的探索模式


分析效果还是可以的,但是感觉跟我用普通大模型做分析没啥区别,感受不到它有多强。从它的思考过程可以看到,他对这个任务的思考只是在汇报:它如何利用内置工具去执行任务的过程。并没有啥真正的思考


不过有个惊喜的地方是:生成的网页能直接分享。这功能真心还不错

https://space.coze.cn/web?uri=7494634981240209408%2F%E8%8B%B9%E6%9E%9C24%E5%B9%B4Q1%E5%AD%A3%E5%BA%A6%E8%B4%A2%E5%8A%A1%E6%8A%A5%E8%A1%A8%E5%88%86%E6%9E%90%E6%8A%A5%E5%91%8A%E7%BD%91%E9%A1%B5%E7%89%88%E5%86%85%E5%AE%B9-b79f30f7c3.jsx


但是,难受的是,财报分析是中文的,我让他做个网页,结果给我做了个英文网页


我再让它给我做成中文,结果还是英文的。这么简单的需求,随便找个大模型都能做的东西,它居然做不了!智障!!!


为了好好验证它的能力,我换成【规划模式】把这个任务再做一遍


这个模式的好处是,他真的思考一下怎么给你完成任务,但不多。还是比较浅层的。但是好处是你可以修改任务,用你专业的意见让这个任务改得都更细节一点,简单来说就是你可以干预它的COT。


然后接下来的流程跟探索模式是一样的,不过他会深度探索,什么意思呢?


大家看上一张图片,他出来了 3 个任务步骤。当开始任务之后,扣子会对每一个步骤用深度模式跑一遍


体验下来总结几点:

  • 【规划模式】比【探索模式】更灵活,且更智能,复杂任务千万别搞【探索模式】
  • 现在市面上能说得出来的大模型,完成报表分析+生成网页代码这么一个简单的任务只需要 1-3 分钟,这个扣子空间硬生生给我干了 16 分钟(而且生成了个白板网站,我谢谢你)。这玩意,你说他想太多,它这个思考过程好像也没想太多,就是想得慢,就有种假装在思考,实际在摸鱼的感觉

然后我把代码下载下来放进cursor,好家伙,一堆关于符号的报错


舰长团队 阿唐:

测试中遇到一些内容

1、偶尔运行结束的时候,结果也拿到了,但反而出现出错了的提示。或者确实出错的时候,不单独出现报错的位置,而是整个页面都切换成了这个报错界面。

2、生成的图片文字乱码率很高,生成2次,2次全有乱码。

3、把上面这几个账号按点赞量生成可视化的柱状图,并保存到飞书多维表格中

上图中,未把信息提取全;


上图中,柱状图是生成了,但坐标上都是乱码。

4、我在武汉江汉路地铁站,我要查到1000m内离我最近的5家火锅店,并推荐去评分最高的火锅店的规划路线和交通方式。我没有任何交通工具。把你生成的结果保存到飞书云文档中,并把那5家火锅店的评分和位置保存到飞书多维表格中,飞书云文档的任务OK了,但多维表格失败了


结语:工作流的硬控制仍是关键


在字节跳动的新产品展现出类似manus的agent能力的同时,我们需要清醒认识到一个事实——当前的AI系统虽然强大,但在自主规划与完成复杂任务链条时仍有局限。工作流(workflow)的重要性在这个阶段尤为突出。


自动化技术无疑将在未来20年继续发光发热,重塑我们的工作方式和生产效率。然而,值得注意的是,在模型能力尚未完全收敛的现阶段,过度依赖所谓的"软控制"方法可能带来不稳定的结果。所谓软控制,即完全依赖AI自主判断和规划,这在当前技术条件下仍存在不小的风险。


相比之下,workflow提供的"硬控制"机制——预设明确的步骤、定义清晰的输入输出、建立可靠的检验机制——仍然是确保AI系统稳定产出高质量结果的基石。这不是对AI能力的不信任,而是对技术发展阶段性特征的理性认知。


当我们欣喜于字节跳动等公司推动AI Agent能力边界的同时,也应该珍视工作流设计的价值,在人类智慧与人工智能的结合点上,寻找最优的协作模式。未来属于那些既能拥抱AI创新,又能构建稳健工作流的企业和个人。


在这个AI快速迭代的时代,工作流不是桎梏创新的枷锁,而是确保我们能从AI中持续获益的基础设施。随着模型能力的不断提升,软硬结合的控制方式将成为主流,但在当下,workflow的硬控制依然是通往AI应用成功的可靠桥梁。


重要!舰长仅剩少量内测邀请码,提供给大家内测,感谢您给文章一键三连, 评论区回复 "邀请码还有不",并扫描文章底部微信二维码截图发送给舰长   先到先得



关注公众号并添加舰长微信,领取智能体学习资料,并参与Coze技术直播讲解

另外非常欢迎大家加入[唐舰长AI落地智能体交流群],主要交流群每周都会进行公益直播教大家搭建AI智能体工作流






没有评论:

发表评论

深夜突袭,阿里Qwen3登顶全球开源王座!暴击DeepSeek-R1,2小时狂揽17k星

点击下方 卡片 ,关注" AI生成未来 " 如您有工作需要分享,欢迎联系: aigc_to_future 转载自:新智元 如有侵权,联系删稿 就在今天凌晨,备受全球期待的阿里新一代通义千问模型Qwen3开源! 一经问世,它立刻登顶全球最强开源模型王座。 它...