2025年5月27日星期二

扣子空间上线极致拟人的AI播客,这次真是降维打击了。

这个语气,这个聊天的感觉,我人麻了。

一篇文章,一键转成几乎跟真人无异的十几分钟中文AI播客。
有打断、有语气、有停顿,就特么离谱。
这,就是我用我现在的这篇文章,生成的AI播客。
这个语气,这个聊天的感觉,我人麻了。
这个AI播客,来自于扣子空间。
昨天,很多人在群里说,扣子空间的AI播客更新了,变得超级拟人。
图片
图片
我就去直接试了一下。
当我实际听到扣子空间生成的AI播客音频的时候,我的第一反应是震撼,第二反应是恐惧,然后才是兴奋。

震撼,是因为它生成的声音之真实、之流畅,让我几乎怀疑自己的耳朵。

恐惧,是因为这种效果似乎已经越过了某个阈值,打破了人机声音之间那道隐形的次元壁,我真的无法想象,我在听的东西,是AI生成的聊天。

兴奋,是因为我知道,终于,这个世界上的无数内容创作者们,可以彻底摆脱过去声音内容生产的桎梏了,尽情享受一种前所未有的自由。

这个AI播客,打开扣子空间(就是扣子做的那个Agent平台)就能直接使用。

扣子空间网址在此:https://space.coze.cn/

这里我插一句,扣子空间之前要邀请码,现在已经全量开放了,每个人都可以直接使用。

图片
想要做一个类似的AI播客,非常简单。
你什么都不用管,把你想要转成播客的文件素材,上传或者发送过去,然后说一句Prompt:
"根据____,生成____分钟的双人播客,然后输出一个音频文件。"
就完成了。
不需要添加MCP,不需要引用任何插件,直接说一句话。
比如我前天写了一篇豆包视频通话的文章,大家反馈非常好,点赞啥的也很高。
图片
就是有朋友跟我说,文章明明写的很感动,但是她在早上开车的时候听,听AI念稿,还是很出戏的。。
我们就可以直接把那篇文章的地址从公众号里复制下来,然后跟着Prompt一起发送给扣子空间。
图片
很快啊,它就会用一个网页读取的MCP,直接把我的所有文字扒下来。
图片
然后,大概几分钟,一个播客,就给我生成完了。
图片
你可以直接点击链接进行下载,大家可以听一听这个效果。
而且最抽象的是,它不仅给我生成了播客,还预判了我的预判,给我写了一个网页。
图片
https://space.coze.cn/s/94Zt6a9WO9Y/
把播客,变成了可视化的播客,在这个网页上,不仅可以听音频,还能看到所有的字幕。
虽然NotebookLM前不久也支持了中文,但是坦诚的说,就是那个中文我是真的听不下去,听的我直皱眉头,太朗诵腔了。
不过扣子空间也有一个小问题,就是时长问题,我在Prompt里面明明说的是10分钟,但是我跑了起码5次,都是5分钟以内,直觉上是扣子的人因为算力,所以做了一些限制,要不然10分钟理论上应该没啥问题的。
不知道大家怎么看AI播客这个事。
也不知道大家听不听播客,真的想做个调研,听过播客的举个手(可惜我看不到哈哈哈)。
说实话,我自己还是爱听的,因为确实有很多真知灼见,而且,是我为数不多的,能在内容形式上,感受到互动感和陪伴感的。
有时候楼下溜达,或者在车上通勤的时候,我就会习惯性的打开播客,来听一集。

过去,我们谈内容,大多都是文字或视频,这两种形式统治互联网这么多年,但它们各自有明显的缺陷。

文字虽然有深度、有效率,我也是靠文字为生,但坦诚的讲,文字这个东西天然缺乏情绪,读者的共鸣度除了笔力之外,其实大多数时候,完全取决于读者本人的代入感和想象力。

而视频虽然声画并茂,但创作成本极高,比如我的一期短视频,动效比较重,2分钟的视频我的剪辑几乎都要剪6个多小时,而且对于消费者来说,它几乎要消耗全部的注意力。

但播客不同,它只占用你最闲散、最被浪费的注意力,而不占用你必须投入的视觉通道,你甚至可以闭上眼睛,只需要倾听。

它本该是最平衡、最温暖、最有人情味的媒介,却一直处于一个尴尬的位置。

人类主播的音频质量高但生产成本高昂,周期冗长,而传统TTS虽快速便宜,但是缺少互动感,特别是一些干货内容,TTS读出来的东西,我自己真的很难听下去。

就像微信自带的这个听全文,我就想问你,当你在开车的时候来听我的文章,你是更想听一个冰冷冷的TTS呢,还是听一个类似于播客的形式,两人有来有回以聊天和讨论的方式,将其表达出来呢?

答案不言自喻。

而AI播客,填补上了人类创作者数量不足的空白。

AI播客不仅仅会成为内容的载体,我觉得也像可视化网页一样,可能演化成一种新的媒介。

比如未来人们可能更愿意在开车、洗澡、做饭时听新闻,听小说,甚至听公众号文章,而非用眼睛去盯着屏幕。

AI播客的普及,会逐渐模糊听觉和视觉内容的边界。

内容不再是内容本身,而是一种,流动的状态。

文字转AI播客、PDF转AI播客、音频转AI播客、视频转AI播客等等,实在太有意思了

比如我们不想在上班的时候公然摸鱼吃瓜,那其实,就可以把一个吃瓜PDF,直接转成AI播客,两人聊,可比看文字,更有意思。

这个PDF是我文章里的老演员了,AI生成的,但是很对瓜味。

图片

只需几分钟。

图片

一个比吃瓜文档更沉浸式吃瓜的AI播客,就完成了。

https://space.coze.cn/s/r2CZypIP6RQ/

图片

推荐听,超好听,我自己听的,津津有味的。。。

甚至不仅是文件,你还可以,扔一段B站视频上去,让它给你生成AI播客+网页。

图片

https://space.coze.cn/s/5gMvrjjqjHI/

而且不止是扔一个文件上去,你其实提出一个问题,你让他搜索完以后跟你说,其实也没问题。

比如最近闹得沸沸扬扬的特厨隋卞和MCN的事,大家肯定都知道了,然后有一个梗特别的火,叫i人团队。

如果你没听过这个梗,不知道的话,其实完全可以跟扣子空间说一句:

图片

无需文件,无需素材,直接一句话,他就会去搜索,搜索完然后给你生成,AI播客,让你最快速最生动最沉浸式的看懂,i人团队这是什么梗。

https://space.coze.cn/s/arJLN3JEbbA/

图片

最后我想聊聊替代。

诚然,很多人也在讨论,AI播客会不会对真人播客产生冲击。

我觉得,这个问题是对所有内容创作者都是一样的。

我依然认为,人类播客的独特吸引力仍不可替代。

真人主播通过长时间陪伴,与听众建立的是一种拟社交关系,听众喜欢的是主播鲜明的个性、真实的情感交流,这种由人性火花构筑的纽带并非AI一串流畅的话语能复制。

AI播客可以提供知识和娱乐,但很难让听众对背后的AI人格产生认同和喜爱,因为大家都知道那不是真实的人。

所以我觉得,其实扣子空间的这个AI播客,是把整个播客的盘子给扩大了,让更多人,理解、尝试播客的乐趣。

而不是替代。

多个模态之间的相互流转,一定会是未来最主要的旋律。
无需抵制,大胆去用就行了。
不过,我也还是觉得。
AI播客很酷,很有趣,但是再有趣的场景,也不能替代真实的人际交流。
毕竟,没有什么比和朋友面对面地聊天,一起分享观点和笑声更让人愉快的了。
所以,最后。
你要不要一起找个时间,跟你的朋友,坐下来好好聊聊天啊?
说一句:
"我请客,咱们边吃火锅边聊聊天,怎么样?"

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

>/ 作者:卡兹克

>/ 投稿或爆料,请联系邮箱:wzglyay@virxact.com

没有评论:

发表评论

爆火论文颠覆RL认知!「错误奖励」让LLM推理暴涨24。6%,学界惊了

点击下方 卡片 ,关注" AI生成未来 " 如您有工作需要分享,欢迎联系: aigc_to_future 转载自:新智元 如有侵权,联系删稿 今早的一篇爆火论文,彻底颠覆了人们对「强化学习」的传统认知。 仅用随机奖励,甚至是错误答案,也能让AI在数学推理中...