2025年6月25日星期三

隐藏在Google Labs里的5个神级AI应用。

有趣又有用。

最近感觉大家对一些主流的模型更新都有点疲了。

我自己也是,我越来越想看到一些,更好玩、更有用、更丰富的AI的应用,而不只是各种参数的增强,以及普通人感知不到的高高在上的东西。

所以,今天想给大家分享一个我觉得挺好玩的东西,是Google自己的一个官方大合集,名叫:

Google labs。

图片

老粉丝可能还记得,我之前分享过两个AI工具,Notebooklm和Whisk,这辆其实都是从Google labs里干出来的。

Notebooklm做出了当时看来极具开创性的AI播客,直接开启了一整条全新的赛道,Whisk则是当时简化了生图的交互方式,让角色和场景一致性保持的非常好,虽然最后被GPT4o锤爆了,但是我现在依然觉得,它是一个在当时,非常好玩的应用。

Google labs的整体调性其实一直是:

用更有趣的方式帮你学习,或者用更简便的交互提升生产力和创造力,或者用具体的小需求让AI和你的日常生活紧密结合。

现在,Google Labs里面已经有三十多个已经开放或即将开放的AI产品,在创新方面,交出了很不错的答卷。

图片

今天也给大家分享一下,其中我自己觉得很有趣的五个产品。

它们有些还不够完美,规模也不够大,但也许能让你看到一些,AI更有趣更多元的模样。

那,让我们开始。


1. National Gallery Mixtape

这可能是整个Google labs里,最有创新精神的工具之一。

作用很简单,给它一幅画,它会自动根据这幅画,生成一段配乐,同时给出配乐的乐器种类和风格。

图片

添加画作,就可以自动生成音乐。

图片

你可以基于这个画作上,添加音乐,diy新的音乐。

图片

我也跑了几个case。

首先是梵高的向日葵,鲜艳明快的画作背后,音乐却是以忧伤舒缓的大提琴为主。

图片

在画面和音乐的交错之下,你似乎更能看到灿烂的向日葵背后,梵高充满苦难的灵魂。

非常符合当时梵高的心境。

然后是这幅画。

这是一个很有戏剧张力的画面,来源于圣经:一个巴比伦国王不知天高地厚抢了耶路撒冷的圣器用来宴请宾客,玩得正开心呢,上帝来抓他了,还用希伯来文写了一行字警告他,国王看到上帝写的字,吓得宴会也不开了,慌忙逃窜,结果还是没多久就死掉了。

配合这个故事,音乐的风格就充满了紧张感,还有些错拍和混乱,告诉你:这国王内心已经彻底慌麻痹了。

遇到这种清新明快的风景画,它就会生成悠扬的乡村音乐。

最后还有这个。

当我看到这幅画的时候,直接笑喷了。画家是和模特多大仇啊?

图片

配乐就做了那种很诙谐的风格,让我联想到一群欢快跳舞的小哥布林。

不过就是还有很多提升空间,比如只支持内容库里的画作,不能自己导入文件,但是完成度已经很高了。

比起厚重的艺术史书本,这种用音乐来理解画作的方式,更直观,也有意思的多。



2. Learn About

Learn About这是一个AI辅助学习知识的工具。

图片

不同于传统搜索引擎的东一榔头西一哨子,Learn About会帮助你用结构化的方法去学习一个新知识。

拿Agent这个知识点举例。

结构化的第一步,是总结知识框架。

左边的The Big Picture就是它为你总结的知识框架,包含定义、目的、特征等等,右边就是具体的知识内容。

可以先看左边,获得一个整体认知,再去右边详细学习。

图片

结构化第二步,卡片式笔记。

具体的知识内容包含图文形式的介绍,相关内容探索,每个卡片都可以点进去单独学习,确保没有知识遗漏。

图片

结构化第三步,知识沉淀。

全都讲完之后,它会给你三个选项。简化相当于用初中生能听懂的方式给你概括总结,深入了解相当于用大学生的标准给你深入讲解,获取图像就是帮你把知识搜索一下,找到匹配的可视化成思维导图、结构图。

图片

用这个方法帮你更好地深入和总结。

图片

中间还有一些非常好玩的互动式学习手法,比如你学着学着,他会让你,停下来思考一下。

图片

你想一想,想完了之后,点击显示,来印证一下你想的和答案是不是匹配的。

图片

结构化最后一步,考试。

一切结束之后,就来到了自我检测环节,Learn About提出问题,你来回答,它给你评估。

图片

还不是那种一般的选择题,是真的那种,让你好好答题的。。。

图片

在你答完以后,还会给你非常详细的建议。

图片

这才是AI时代的学习方法好吧。

这一套组合拳下来,一个知识点很容易就吃透了。


3. Little Language Lessons

这是一个语言学习工具,我觉得在实用性上,可能已经超过了多邻国。

图片

毕竟多邻国上经常要学很多你根本用不到的东西。

我用多邻国学语言时,印象特别深刻的一个例句是,"我没法洗澡,因为有一头奶牛在我的浴室里"。

不是,到底是谁能用得上这样的表达。。。

而Little Language Lessons的实用性,就强多了。

它主要有三个功能:

第一,针对特定话题给出需要用到的词汇;第二,学习地道的本地人对话;第三,拍摄身边的物品,了解如何用外语描述它们。

图片

比如我现在想学粤语。

点开Tiny lesson。

图片

它会给到你需要的词汇,短语,还有注意事项,你看完直接就可以跟司机沟通。

图片

真的,常用语都有。

图片

Slang hang则是给你不同的对话场景,让你理解当地地道俚语。

用词和发音都还挺标准的,虽然腔调有点怪,但是对于初学者来说,已经很够用了。

图片

Word Cam也是我觉得非常实用的一个功能,想不起来的词就拍照让AI给你答案,下一秒就能用到。

多邻国,好好学学。


4. Stitch

也不知道为什么,这个名字总让我感觉它在蹭Sketch。。

图片

Sketch,最著名的UI设计工具之一,也是我曾经做UI设计的时候,吃饭的家伙。

Stitch是Google labs上个月推出的设计工具,前身是UI设计工具Galileo AI。

图片

它支持两种模式。

图片

标准模式,支持用自然语言生成生成UI界面。

比如我随口说一句,生成一个点外卖的APP。

图片

他会跟DeepResaerch一样,问你几个需要你确认的问题,大概一两分钟,5个页面就生成完了。

图片

可以在页面上用嘴直接编辑,也可以将画板导入figma,用figma画布编辑。

图片

而实验模式,支持图片参考生成UI界面,你随手画一张图给它,它也能生成一个你想要的界面。

图片

就像google labs的负责人之前在访谈里说的一样,chatbot是AI最好的交互形态吗?未必。

未来,更直观的交互形态很可能是,直接给AI一张图像,或者一个文件,让它去执行操作。


5. Portraits

一个非常有意思的职场类工具。

图片

这是google labs这个月整出来的新活儿,用真人职场大佬训练出来一个虚拟人专家,专门为你解决职场难题。

原型人物,就是这个戴眼镜的金发女人,kim scott,Google和苹果的前高管。

主要的数据库,来自她之前写过的两本畅销书《彻底坦率:一种有温度而真诚的领导》(radical candor)、《彻底尊重:如何更好地合作》(radical respect),还有她的公开演讲。

图片
进去以后,

你就可以开始和她聊天了。

可以说话,可以打字,也可以按照给定的选择来和她对话。

常见的职场问题,像如何避免被甩锅、有分歧怎么沟通、怎么谈绩效、想跳槽怎么跟领导说,都在她的射程范围内。

她会先给你讲一套理论,然后再和你角色扮演,在实地演习中告诉你该怎么做,最后还会帮你回顾整个流程,加深记忆。

不过呢,她不是什么都跟你聊,比如专业的医疗或者法律问题,她就会建议你去咨询专家。而如果你想和她闲聊,她也会把话题扯回工作上,拒绝摸鱼。

沟通下来的整体感受,就像跟一个雷厉风行的职场老炮取经,她给到的建议虽然不是唯一解,但也能多一个维度的参考。

我觉得这个工具达到了一个平衡:去看kim scott的书,我可能看不下去,也没法看完直接演练。去和AI对话,我又担心它不靠谱。现在这样一个Gemini大模型驱动+真人数据训练的赛博导师,就正正好好。

现在这个portraits上还只有kim scott一个人,但google已经在搞别的AI虚拟人了,预计未来可能推出瑞达利欧跟你聊金融,再往后看,跟爱因斯坦聊物理,跟马斯克聊火星也不是没有可能。

未来的生态还是很有意思的。


写在最后

Google labs的网址在此,记得打开魔法,确保你的环境能够使用。

https://labs.google/

最后,聊聊Google labs本身。

这个项目是从2002年开始运营的。

当时谷歌还年轻,热衷创新,一身使不完的牛劲。

为了激发更多灵感,谷歌出了这么一个策略:所有员工都可以把他们工作中20%的时间投入到非官方的创意项目中,也就是一周里足足有一天时间来搞创新。

在这样的背景下,很多好用的产品诞生了,包括Google shopping、Google map、gmail、Google scholar......很多Google的重要功能,都脱胎于彼时的Google labs。

当时的Google labs是一个大广场,用户可以直接和产品互动并提出反馈,产品快速发布,又在用户的意见下快速迭代,这样开放包容的光景持续了九年。

直到2011年。

这时的谷歌已经成了一个有着数以万计员工的巨型跨国公司,把注意力聚焦在核心业务上成了首要任务。而当初定下的创新策略,已经不再适合谷歌的发展需求。因此,在这一年,Google labs项目被关停。

做匠人,和追时代,很多时候是两难的。

不过在这之后的十年里,Google内部的创新之火并没有完全熄灭,Google X和Area120项目,都是Google在创新和聚焦之间跌跌撞撞寻找平衡的尝试。

再往后,AI时代来了。

得益于AI带来的生产力提升和模型能力提升,探索创新项目的效率提高了。谷歌顺应潮流,整合了很多实验性业务,纳入Google labs。

于是就有了Google labs的这次重出江湖。

Google labs这次回归,在产品构建上,有几个有趣的点。

第一是start small。

Google labs的产品,以10000周活跃用户为首个目标。

在Google这么大的规模下,这个目标可以说是非常非常微小了。

但这样的好处是轻量化,也更容易找到有针对性的用户需求。

第二是快速迭代。

有点子就做,有时候可能连PRD还没做好,工程师已经上去开始干活了。

用50到100天,就能把创意落地并交付给用户。

第三是站在未来的角度去做产品。

从更智能、成本更低、速度更快的角度去思考,如何做创新。

思考未来五年、十年后AI融入人类生活的方式。

可能是因为这三点,让Google labs在Google这样的超级大厂里,还能够保持活力。

在纷繁变化的AI时代。

创新。

才是第一生产力。

以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章,我们,下次再见。

>/ 作者:卡兹克、水杉

>/ 投稿或爆料,请联系邮箱:wzglyay@virxact.com

没有评论:

发表评论

海螺Agent上线,我试了试,结果视频比我剪的还好看!

你有没有想过,只用一张图、几句话,就能做出一条像模像样的视频? 你有没有想过,只用一张图、几句话,就能做出一条像模像样的视频?有节奏、有配音、有运镜,甚至还有字幕和音乐,不用剪辑、不用调色,甚至——连"剪映"都可以不用装。 最近我体验了一个新东西,叫  海...