AI日报 2025-03-01
AI日报 精选每日AI新闻、AI产品、开源AI项目和使用教程,尽量只选取大家值得关心和能用得上的内容,欢迎关注哦
今日封面
今天发现阿里通义万相之前就出过一个文生视频的使用指南,看了下还是挺有价值的,顺手用其中的案例提示词跑了下,选了个效果还可以的作为今天的封面图。
通义万相官方提示词指导:https://alidocs.dingtalk.com/i/nodes/jb9Y4gmKWrx9eo4dCql9LlbYJGXn6lpz
DeepSeek 开源周第六天
DeepSeek 开源 V3/R1 推理系统,理论利润率高达545%,通过技术优化和开源策略推动行业效率革新。采用跨节点任务分配优化(EP)、任务同步处理等方案,单 GPU 每秒处理超 7 万输入/1.4 万输出 token,速度提升显著。
今天估计是补充,应该不会有第7天了吧~
Sesame 公布AI语音合成模型CSM
Sesame 团队推出了突破性的AI语音合成模型CSM(Conversational Speech Model),其真实性和互动性被认为成功跨越了语音交互的"恐怖谷效应"
• CSM首次将对话上下文与情感背景融入语音生成过程。与传统的文本转语音(TTS)技术不同,CSM将语义信息(内容)与声学细节(音色、语调)分离处理,既保证清晰度,又实现个性化表达。
• 通过"计算摊销"策略优化训练效率,用百万小时英语音频数据集训练出参数规模达80亿的模型,生成语音的自然度与真人录音几乎难以区分。
根据他们CTO的推文,模型会在1-2周内开源,可惜目前还不支持中文。
由小刚AI探索收集整理
感谢您的点赞、分享、推荐
没有评论:
发表评论