2025年3月2日星期日

AI日报 I 2025年3月1日 阿里通义万相官方提示词分享

AI日报 2025-03-01

AI日报 精选每日AI新闻、AI产品、开源AI项目和使用教程,尽量只选取大家值得关心和能用得上的内容,欢迎关注哦



今日封面

今天发现阿里通义万相之前就出过一个文生视频的使用指南,看了下还是挺有价值的,顺手用其中的案例提示词跑了下,选了个效果还可以的作为今天的封面图。
通义万相官方提示词指导https://alidocs.dingtalk.com/i/nodes/jb9Y4gmKWrx9eo4dCql9LlbYJGXn6lpz


DeepSeek 开源周第六天

DeepSeek 开源 V3/R1 推理系统,理论利润率高达545%,通过技术优化和开源策略推动行业效率革新。采用跨节点任务分配优化(EP)、任务同步处理等方案,单 GPU 每秒处理超 7 万输入/1.4 万输出 token,速度提升显著。
今天估计是补充,应该不会有第7天了吧~


Sesame 公布AI语音合成模型CSM

Sesame 团队推出了突破性的AI语音合成模型CSM(Conversational Speech Model),其真实性和互动性被认为成功跨越了语音交互的"恐怖谷效应"

• CSM首次将对话上下文与情感背景融入语音生成过程。与传统的文本转语音(TTS)技术不同,CSM将语义信息(内容)与声学细节(音色、语调)分离处理,既保证清晰度,又实现个性化表达。
• 通过"计算摊销"策略优化训练效率,用百万小时英语音频数据集训练出参数规模达80亿的模型,生成语音的自然度与真人录音几乎难以区分。
根据他们CTO的推文,模型会在1-2周内开源,可惜目前还不支持中文。


由小刚AI探索收集整理

感谢您的点赞、分享、推荐




没有评论:

发表评论

牛叉!AI 大模型又起飞了!

别错过! 2025年 , AI 大模型 不仅在 取代 传统CRUD开发模式 , 也在 重构 30+程序员 的职业 命运 ! 业务转型要求用RAG搞知识库,你不会,傻眼了; 接手 AI 项目 , 不知道怎么选预训练模型、准备多少数据; 想转型大模型应用开发工程师等岗位,没0-1...