AI日报 2025-02-26
AI日报 精选每日AI新闻、AI产品、开源AI项目和使用教程,尽量只选取大家值得关心和能用得上的内容,欢迎关注哦
今日封面
昨天ElevenLabs活动领取了FalAI 的50美元优惠码,今天测试了谷歌Veo2视频生成模型,效果确实还蛮不错的,不过Fal貌似不支持图生视频,只测试的文生视频的,画面一致性保持很好,基本很少有崩坏的问题。
感兴趣的别忘了去领优惠,需要GitHub的账号,本来还想多注册个账号去薅羊毛,没想到新注册的账号还不行,领取方法可以翻一下昨天的日报。
阿里Wan2.1已支持在 ComfyUI 运行
阿里开源视频生成模型 Wan2.1 上线仅一天,就由KJ大佬适配到 ComfyUI,支持文生视频、图生视频等任务,消费级显卡可运行。
• 1.3B 基础模型仅需 8G 显存,5 秒 480P 视频生成约 4 分钟;14B 模型支持更高清生成,但需 16G 以上显存。
• 目前来看效果差强人意,整体效果估计勉强能追上可灵1.0,当然毕竟刚刚上线,还有比较大的优化空间。
个人感觉目前图生视频还不太适合本地部署,想尝鲜的可以到RunningHub试试,上面的视频就是我在RH的图生视频测试。
节点网址:https://github.com/kijai/ComfyUI-WanVideoWrapper
RunningHub:https://www.runninghub.cn/search?q=wan
DeepSeek发布DeepGEMM
DeepSeek在开源周第三天推出DeepGEMM,一款专为NVIDIA Hopper架构GPU优化的FP8通用矩阵乘法(GEMM)库,核心代码仅约300行,支持密集矩阵和混合专家(MoE)模型计算,最高性能达1350+ TFLOPS。
极简高效:核心逻辑仅300行代码,无复杂依赖,适合开发者学习GPU优化技术。
性能突破:在Hopper GPU(如H100)上实现接近硬件峰值的计算性能,相比传统库加速1.1-2.7倍,内存带宽峰值达2668 GB/s。
低精度优化:支持FP8(8位浮点)计算,通过CUDA核心二级累加技术解决精度问题,减少内存占用和计算延迟。
即时编译(JIT):运行时动态生成优化代码,适配不同硬件和任务需求,无需预编译。
MoE模型适配:提供连续和掩码两种MoE矩阵布局,加速混合专家模型的训练和推理。
项目地址:https://github.com/deepseek-ai/DeepGEMM
DeepSeek宣布API错峰降价
DeepSeek于2月26日宣布推出API错峰优惠活动,自即日起,每日00:30至08:30的夜间时段,API调用价格大幅下调。
其中DeepSeek-V3降至原价50%,DeepSeek-R1低至25%。此举旨在缓解服务器压力并降低开发者成本。
本来以为算力充足了,官网试了下照常是服务器繁忙。。
请在微信客户端打开
OpenAI高级语音和Deep research调整
语音功能更新:ChatGPT 向所有免费用户推出由 GPT-4o mini 驱动的高级语音版本;Plus 用户仍可按现有日限额使用由 4o 驱动的高级语音功能(限额超免费用户 5 倍以上),且能使用视频和屏幕共享功能;Pro 用户可无限制使用高级语音功能。
Deep research:现向 ChatGPT 的 Plus、Team、Edu 和 Enterprise 用户全面推出。更新后具备嵌入带引用图片、更好理解和引用上传文件等改进。Plus、Team、Enterprise 和 Edu 用户每月有 10 次查询次数 ,Pro 用户每月 120 次。
ElevenLabs推出ElevenReader Publishing
ElevenReader Publishing,允许创作者零成本将文字作品转换为高质量有声书,并通过独立应用面向全球发行,同时获取收益。
• 支持上传EPUB/PDF/TXT/DOCX等格式,几分钟内生成专业级有声书,完全免费。
• 作品通过ElevenReader应用触达全球用户,支持32种语言。
• 创作者可赚取版税:每名听众累计收听11分钟即可获得1.10美元收入(目前仅限美国地区)。
• 提供超32种自然音色,听众可自选偏好声音,打破传统固定音轨模式。
• 支持播放速度调节(0.25x-3x)、同步字幕高亮等交互功能。
网址:https://elevenreader.io/publishing
Adobe推出Photoshop iOS版
Adobe宣布Photoshop正式登陆iPhone,并于26日上线App Store。该版本保留了桌面端核心功能,同时针对移动场景优化操作,安卓版预计下月推出。
• 免费版限制:仅限基础工具(包括图层、蒙版、轻点选择、点愈合画笔、生成填充和扩展),部分AI功能需联网使用。
- 移动&网页版订阅:月费7.99美元/年费69.99美元,解锁Photoshop网页版、20,000+字体、高级AI工具(生成相似图像)、内容感知填充等。
- Creative Cloud用户:已订阅全家桶或摄影套餐的用户可免费使用全部高级功能。
腾讯预告27日发布新模型
腾讯混元大模型团队于2025年2月26日预告,将于2月27日发布新一代旗舰模型,可能为混元Turbo S,面向通用任务设计。
小米27日发布会可能公布AI眼镜
据爆料,小米AI眼镜产品分为国内/国际双版本,国内高配版:集成摄像头、AR显示等完整功能,定价1499-1999元,直接对标Meta Ray-Ban。标准版:砍掉摄像头模块,专注语音交互与基础AI服务,售价或低至千元内,瞄准大众市场。
根据公开报道,小米AI眼镜将搭载三大核心能力:
• 多模态交互:从"看见"到"看懂"
• 设计革新:时尚与科技的平衡
• 生态联动:小米全场景的"钥匙"
由小刚AI探索收集整理
感谢您的点赞、分享、推荐
没有评论:
发表评论