AI日报 2025-03-13
AI日报 精选每日AI新闻、AI产品、开源AI项目和使用教程,尽量只选取大家值得关心和能用得上的内容,欢迎关注哦
今日封面今日最出圈的就是谷歌Gemini的言出法随,使用自然语言就可以生成、修改图片内容,这图片是上传了一张实景图让加了个宇宙飞船,虽然要求是达到了,但是并没有光影关系
Gemini 2 言出法随
今天出圈的就是谷歌的言出法随,谷歌最新推出的实验性AI模型 Gemini 2.0 Flash Experimental,支持通过自然语言直接生成和编辑图像,大幅降低创意门槛。
对话式图像编辑:像聊天一样用文字修改图片,例如"换背景""调色调",实时迭代优化;
原生图像生成:根据描述生成插画、海报、表情包等,支持多场景(如儿童绘本、广告设计);
低延迟响应:处理速度比前代快2倍,适合实时交互创作;
多模态结合:支持文本和图像输入,生成图文结合的故事或菜谱配图;
小白友好:无需专业设计技能,可快速生成电商宣传图、社交媒体素材。
网址:https://aistudio.google.com/
字节AI音效生成模型SeedFoley上线即梦
字节跳动推出的AI音效生成模型SeedFoley已在即梦平台上线,通过端到端架构实现视频与音效的智能同步,让普通用户也能轻松制作专业级视听内容。
即梦平台用户完成视频创作后,点击"AI音效"按钮即可自动生成匹配方案,支持调节音效强度(如增强油爆声)和风格预设(武侠/科幻等)。
潞晨开源视频模型Open-Sora 2.0
一款以极低成本实现闭源模型性能的开源视频生成工具,完整公开模型权重、代码及训练流程。
• 仅用 20万美元(224张GPU)完成11B参数模型的训练,成本仅为同类闭源模型的 1/5~1/10;
• 通过 低分辨率优先训练(节省40倍算力)、预训练模型复用(FLUX图生视频模型初始化)和 高效并行方案(GPU利用率达99%)实现降本。
项目地址:https://github.com/hpcaitech/Open-Sora
请在微信客户端打开
阿里"新夸克"AI超级框正式上线
阿里推出全新AI旗舰应用"新夸克",基于通义多模态大模型打造"无边界AI超级框",将传统搜索升级为覆盖工作、学习、生活的全能AI助手。
• 整合AI对话、深度思考与执行能力,支持从生成PPT(自动排版+数据搜集)到旅行规划(预算智能分配)等复杂任务
• 已覆盖AI写作、生图、学术研究、健康咨询等20+场景,实测生成专业级内容效率提升200%
下载地址:https://www.quark.cn/
由小刚AI探索收集整理
感谢您的点赞、分享、推荐
没有评论:
发表评论