2025年2月25日星期二

DeepSeek开源第三天,300行代码性能赶超英伟达?

AI 开源大战进入白热化!

DeepSeek 开源周持续加码,今天第三个项目 DeepGEMM 正式上线。

与此同时,阿里昨晚也放出了大招,全球最强开源视频生成模型 万相 2.1 重磅登场!

此外,据报道 DeepSeek 正在加速推出其 R2 人工智能模型,最初计划五月份推出,目前正在努力争取尽快。

显然,现在不仅是「开卷」的时代,也是争相「开源」的时代!

各大 AI 机构纷纷抛出王牌,整个 AI 赛道热度飙升。

一、DeepGEMM

DeepSeek 持续开源第三天:

DeepSeek 这次带来了 DeepGEMM,一款专为 FP8 矩阵乘法(GEMM)设计的高效计算库。

开源项目地址:

https://github.com/deepseek-ai/DeepGEMM

它完全用 CUDA 编写,主打「轻量级、极致性能、即装即用」,不需要编译,所有核心计算内核都能 JIT(即时编译)运行,兼顾高效和易用

DeepGEMM 到底强在哪里?

高效 FP8 计算:专为 NVIDIA Hopper Tensor Core 设计,直接打破 FP8 计算瓶颈;

MoE 专属优化:针对 MoE(Mixture of Experts)模型进行了特殊优化,提高大模型推理效率;

轻量级 JIT 设计:不像 CUTLASS 那么复杂,核心代码只有 300 行,易读易学,还性能炸裂;

比专家调优的库还快:在 DeepSeek-V3 推理中,性能全面超越 CUTLASS 3.6;

性能测试数据直接看爆表:

  • 64×2112×7168 计算速度高达 206 TFLOPS,内存带宽 1688GB/s,速度提升 2.7 倍

  • 在 MoE 训练任务中,速度提升 1.2 倍以上,让大模型训练推理全面加速!

这么极致的压榨英伟达显卡,让网友直呼,可以从澳洲听到英伟达的尖叫。

还有网友评论说,就300行代码,要不是你们有最厉害的工程师,就是有黑魔法!

怎么用?

只需三步:

1、克隆项目且部署

# Submodule must be cloned
git clone --recursive git@github.com:deepseek-ai/DeepGEMM.git
# Make symbolic links for third-party (CUTLASS and CuTe) include directories
python setup.py develop
# Test JIT compilation
python tests/test_jit.py
# Test all GEMM implements (normal, contiguous-grouped and masked-grouped)
python tests/test_core.py

2、进行环境配置

python setup.py install

3、直接调用 deep_gemm 在你的python文件里,

简洁、强悍、无痛上手,完全是 AI 计算优化的神器!

二、阿里万相 2.1

DeepSeek 开源正如火如荼,阿里昨晚也没闲着,正式开源 万相 2.1

开源项目地址:

https://github.com/Wan-Video/Wan2.1

https://huggingface.co/spaces/Wan-AI/Wan2.1

这个目前的 SOTA 开源视频生成模型,直接在 VBench 基准测试中拿下第一,力压 OpenAI Sora、Adobe、苹果等一众强敌!

万相 2.1 到底强在哪?

真正的开源:代码 & 权重全放出,让所有人都能玩;

超强视频生成:可以生成稳定流畅的复杂人物动作和精准物理交互,远超现有竞品;

直接加字:不用后期剪辑,AI 直接在视频里写字(中文、英文全支持);

家用显卡都能跑:1.3B 版本只需要 RTX 4090 就能流畅生成 480P 视频,比很多 5B 参数模型还强!

让我们来看一下它的效果:

提示词:

在台风肆虐的街头,一只身着亮黄雨衣、背负巨大天使翅膀的橙色小猫,驾驶踏板摩托车勇敢穿行。8K画质下,小猫眼神灵动,毛发细腻,雨衣与头盔色彩鲜明,与灰暗背景形成强烈对比。城市灯光映照在路面积水上,增添一抹柔和,小猫的微笑和闪烁的大眼睛仿佛能驱散所有阴霾,营造出温馨奇幻的氛围,让人仿佛进入了一个充满魔力的梦境。

提示词:一只戴着耳机的小狗正骑着一辆色彩斑斓的滑板车穿越郁郁葱葱的绿野,车篮里装满了各种新鲜蔬菜,宛如一幅流动的田园风景画。特别的是,一只悠然自得的小猫正悠闲地伏在小狗的背上,二者默契配合,尽情享受这风驰电掣的快感。背景中,连绵起伏的山峦与蔚蓝的天空交相辉映,点缀着柔软的白云,营造出一幅宁静而愉悦的画面。小狗专注的神情与小猫惬意的姿态,共同诠释着这场别开生面的骑行之乐。

再比如写个福字:

这下,AI 视频内容创作彻底进入「开源狂飙」模式!

AI 开源大战,谁能笑到最后?

DeepSeek

开了个好头,已经连放 DeepEP(MoE 训练加速)+ DeepGEMM(高效 FP8 计算)+ DeepSeek-V3 训练优化,直接把 AI 计算效率推向新高度;

阿里:万相 2.1 昨晚重磅开源,让 AI 视频创作门槛大幅降低;

OpenAI:据说还要憋个「大活」,GPT-4.5新应用都可能登场。

毫无疑问,现在的 AI 赛道已经进入了「开源就是王道」的阶段,谁能在开源领域站稳脚跟,谁就有可能成为 AI时代的真正霸主!

谁会笑到最后?我们拭目以待。不过对于我们普通用户来说,这绝对是AI史上最激动人心的开源盛世。

你最看好哪家的 AI 能力?留言聊聊你的看法!


·················END·················

没有评论:

发表评论

快速汲取精华——Youtube类高质量视频的深度总结提示词

优质信息源固然重要,但提取信息的效率也非常重要。 优质信息源固然重要, 但提取信息的效率也非常重要。 全球有很多 AI 相关的优质视频内容其实都非常扎实, 但动辄 30 分钟甚至 1 个小时,想完整看完往往要挤时间, 效果不太理想。 分享下最近挺火的高质量视频的总结提示词: ...