AI日报 2025-02-25
AI日报 精选每日AI新闻、AI产品、开源AI项目和使用教程,尽量只选取大家值得关心和能用得上的内容,欢迎关注哦
今日封面图
今天尝试的万物花开玩法,我这个案例使用了两个Lora,上传实景图到ControlNet使用Depth控制,按照自己的实际图调整控制权重和结束步数就可以了,也可以使用指鹿AI的建筑花开工作流
网址:https://www.liblib.art/modelinfo/c0e7e616ece045caac44e8bc4b3f59c5
领取 ElevenLabs 活动福利
看藏师傅发的ElevenLabs活动,可以领取 ElevenLabs 3 个月会员、Mistral AI 25 美元 API、Fal 50 美元额度等等,最吸引的就是Fal,领取后可以体验谷歌的veo2视频模型,领取方法也很简单,只需要Github账号:
① 先在活动页领取Fal充值码
② 进入Fal 的Billing页面
③ 在右边的 Add Credits 中选择 Custom 填写充值码兑换
领福利网址:https://www.aiengineerpack.com/?success=1
Veo2体验地址:https://fal.ai/models/fal-ai/veo2
Claude 3.7 Sonnet 发布
Anthropic 正式推出新一代 AI 模型 Claude 3.7 Sonnet,这是首个混合推理模型,兼具即时响应与深度思考能力。
核心亮点
- 两种思考模式自由切换 : 即时模式:快速回答日常问题(如天气查询);扩展模式:展示详细推理步骤,解决复杂数学题、编程难题(需付费订阅)
- 编程能力大升级:在真实场景编码测试中表现超越 ChatGPT、DeepSeek 等对手,可自动修复代码错误、生成完整应用程序。Cursor已经上线最新模型。
- 免费开放基础功能:准模式已向所有用户免费开放,开发者可通过 API 精细控制模型思考时长,思考过程也计入Token开销。
配套新工具:Claude Code
• 终端直接调用:开发者可通过命令行让 AI 完成代码调试、版本管理等任务
• 效率提升案例:原本需要 45 分钟的手动编程工作,现可一键自动化完成
DeepSeek 开源 DeepEP
DeepSeek 在开源周第二天发布 DeepEP 通信库,是一款专为混合专家模型(MoE)设计的通信库,可大幅提升 AI 训练和推理效率。简单来说,它像给 GPU 装上了"智能物流系统"——通过优化 GPU 间的数据传输方式,让原本可能堵车的计算任务畅通无阻。
其核心能力包括:
- 双通道通信:用 NVLink(类似城市高速地铁)加速同一服务器内 GPU 的数据传输,用 RDMA(类似跨城直达飞机)实现不同服务器间的高速互联,最高带宽分别达 158GB/s 和 47GB/s;
- 智能调度模式:训练时采用高吞吐模式(如大卡车批量运货),推理时切换低延迟模式(如无人机精准快递),后者延迟最低仅 163 微秒;
- 资源优化黑科技:支持 FP8 低精度传输(类似微信发压缩图),数据量减少 75%,还能让 GPU 边计算边传输数据,避免"停工等货"。
开发者实测显示,该库可缩短 MoE 模型训练周期 40% 以上,并让智能客服等实时推理场景响应速度提升 3 倍。
项目网址:https://github.com/deepseek-ai/DeepEP
阿里开源视频生成模型Wan2.1
万众期待下,阿里终于发布开源视频生成模型Wan2.1。
Wan2.1-T2V-14B 在 VBench 排行榜位列第一,在复杂运动动力学、物理模拟和文本渲染方面表现出色。
Wan2.1-T2V-1.3B 是轻量级模型,创建 480P、5 秒视频仅需 8.19GB VRAM,性能超越部分 50 亿参数模型。
项目网址:https://github.com/Wan-Video/Wan2.1
请在微信客户端打开
阿里的推理模型上线通义千问
推理模式由 QwQ-Max-Preview 模型提供支持,这是一个基于通义千问 2.5-Max 的推理模型。这个模型仍处于预览阶段,在数学理解、编码、智能体等方面具有很强的能力。
很快会发布正式版开源,还会提供QwQ-32B在本地设备上使用。正式发布时还会发布安卓和IOS版APP。
网址:https://chat.qwen.ai/
谷歌发布代码助手 Gemini Code Assist
谷歌推出面向个人开发者的免费AI编程工具 Gemini Code Assist,凭借超大使用额度与深度集成能力,成为开发者生态的新标杆。
免费额度:
每月提供 18万次代码生成(是GitHub Copilot免费版90倍);每日允许 240次聊天交互; 支持 VS Code/JetBrains插件集成,实现IDE内无缝交互。
智能代码全流程支持
代码生成:基于Gemini 2.0微调模型,支持22种主流语言;错误检测:GitHub版可自动扫描Pull Request,识别风格/逻辑问题;代码解释:128K上下文窗口支持复杂代码库推理。可以在vscode中直接搜索安装。
DeepSeek R2 可能在5月前发布
宇树机器人展示功夫
由小刚AI探索收集整理
感谢您的点赞、分享、推荐
没有评论:
发表评论