2024年12月14日星期六

谷歌发布Gemini2。0,全新多模态大模型,Agent带来无限想象

  要用一句话概括谷歌发布Gemini2.0的话,那就是深夜截胡式炸场

为啥呢,因为openai连续12天的发布会,给市场拉满了预期。谷歌趁机发布Gemini2.0,省了一大批宣传费用。

不过Gemini2.0确实是真的很强啊。

在性能方面,Gemini2.0可以支持图片、视频和音频等多模态输入与输出。可以直接生成图像与文本混合的内容,以及原生生成可控的多语言文本转语音(TTS)音频。它还可以原生调用Google Search、代码执行以及第三方用户定义的函数等工具。

看不懂没关系,简单说,多模态的意思以后的Gemini2.0,可以直接输入文字、图片、语音和视频内容,也能直接生成这些个格式的内容,而且都是一站式的,不需要来来回回借助外部工具。

更惊喜的是发布了一大堆惊艳的智能体产品。

还看不懂也没关系,意思是比之前克劳德的个人助手还强大很多倍,能用AI帮你处理日常工作的大部分内容。

重点值得一提的是Project Astra大幅升级

  1. 它在对话上更加流畅。从演示视频可以看出,Project Astra能够轻松切换多种语言,比如法语和泰米尔语,并且能够理解不同的口音和生僻词汇。

2.它能够使用新工具。Project Astra可以通过文本、语音、图像和视频来回答问题和执行任务,同时在需要的时候,还能够调用谷歌的现有应用,比如搜索、地图和摄像头。Bibo Xu在媒体沟通会上提到,"它结合了我们这个时代一些最强大的信息检索系统。"

3.它的记忆力也得到了加强。在演示视频中,Project Astra能够记住门禁密码,即使过了一段时间后被问起,它依然能够准确地回忆起来。在整个测试过程中,Project Astra即使经历了多个不同场景的对话,也能够准确地调取之前存储的信息。

指挥官已经抢先体验到啦

感兴趣的可以挂上网络环境去看看。如果没有谷歌账号怎么办?指挥官早就帮你想到啦!点这里免费谷歌邮箱批量注册工具,白嫖谷歌、Pixverse、可灵和Cursor,不要太爽了

虽然很容易能找到访问入口,但我相信,仍然有很多小伙伴想无脑直接拿到,那么在公众号后台回复1213即可看到。

独乐乐不如众乐乐,好东西要记得和大家分享,欢迎点击下面按钮关注指挥官公众号,加入收藏,点亮看,分享给周围的朋友们。



如果想和更多AI工具、AI绘画提示词、AI视频爱好者和AI+RPA爆文达人们共同交流,可以加指挥官个人微信,加入我们的免费微信群,共同进步!

为避免各种不法账号扫码进群乱发消息,今后改为添加指挥官个人微信后回复"进群",勤劳的机器人会自动把您拉到对应群。会不定期组织抽奖和福利派发等。




一键生成海报的时代来了,,搞笑文案配图也能一次性搞定了,即梦2.1版本绘画模型让设计师们都下岗了,有图有梗也该下岗了

一键免费视频去水印,完美解决白嫖可灵,即梦,Pixverse生成的视频带水印问题

标价9.9元的RPA入门课,讲出了399元的范儿,原来0基础纯小白真的可以轻松搞定一个机器人

指挥官RPA机器人仓库目录 自媒体批量爆文自动化工具0919更新版(1-11号机器人介绍)

3分钟轻松搞定,字节发起史上最简单的副业拉新项目-豆包MarsCode编程插件-普通人无脑赚几千块

字节即梦上线对口型功能,AI视频又上新台阶,数字人口播迎来新挑战

一款能让各种人物和照片会说话的AI对口型的全免费不限次数神器—hedra

没有评论:

发表评论

支持LoRA的文字/图片生成视频工具整合包FramePack-Studio,支持图生视频、文生视频,还能使用混元lora生成视频

AI应用帮,帮你用AI 公众号:AI应用帮 「   文中提供获取方式   」 ▼ 本期 带来 支持LoRA的文字/图片生成视频工具整合包  — —   FramePack-Studio FramePack项目的改进版 本, 支持图生视频、文生视频,还能使用hunyuan Lo...