记得以前学深度学习的时候,还要在 TensorFlow 、Caffe 和 PyTorch 之间纠结一波。
早在2017 年,我就写过caffe教程。
2018 年,写 TensorFlow 的实战教程。
而这样的选择在 2025 年的今天似乎已经失去了意义。
近十年过去,Caffe2 早在 2018 年 3 月底并入 PyTorch 。
而曾经辉煌一时的 TensorFlow 也已经走上末路。
来看 TensorFlow 的社区活跃度走势图。
现在的人气甚至比刚发布那会儿还要低。
再来看看它和 PyTorch 的对比。
这场竞争谁赢谁输已经是一目了然了。
现在回看我自己写的这些教程,真就是时代的眼泪。
昔日的王者怎么就走到人人嫌弃的地步呢?
一起来回顾一下。
一、TensorFlow 发展历史回顾
2010 年,Google Mind 建立 DistBelief 作为他们的第一代专有的机器学习系统,这也是 TensorFlow 的前身。
接着 DistBelief 的代码库进行了简化和重构,成为了 Google Mind 的第二代机器学习系统,即 TensorFlow ,于 2015 年使用 Apache 2.0 开源许可证正式发布。
次年,PyTorch 随后由 Facebook 发布。
PyTorch 凭借 Python 化 和更巧妙的 API 设计等灵活易用特点迅速崛起。
时间来到 2019 年,机器学习框架之争只剩下 PyTorch 和 TensorFlow 两个主要竞争者。
当时在工业界,TensorFlow 仍然是首选平台。
但在学术界,PyTorch 已经靠迅猛的涨势占领了绝对的优势。
有小伙伴可能会好奇为什么这两个框架在工业界和学术界会有这么大的差异。
主要的答案是:惯性。
工业界采用新技术的速度比研究人员慢,从而早问世的 TensorFlow 就有了时间上的优势。
再加上 TensorFlow 的构建概念本就是为生产环境服务,而 PyTorch 更偏向于围绕研究需求构建。
回来时间线上,在 PyTorch 的巨大威胁下,同年 9 月,TensorFlow 2.0 发布。
2.0 版本在很多方面借鉴了 PyTorch 的方案,比如自动微分、运行时定义等,并且在 GPU 上的性能取得了显著改进。
但即使在易用性上较 1.x 有了巨大提升,但在性能和调试体验上仍然不如 PyTorch 。
再加上生态兼容性不足,旧版本的代码迁移起来复杂,以及更大的新 API 学习成本,2.0 版本并没有成功挽留住纷纷转向 PyTorch 的用户。
至此,PyTorch 的社区覆盖率也正式超过了 TensorFlow ,这场竞争也决出了胜负。
前两天,外滩大会上,蚂蚁开源发布的「大模型开源开发全景与趋势」2.0 版本也已经将 TensorFlow 正式除名。
从 2015 年到现在,TensorFlow 的故事写了 10 年。
如果你有关注蚂蚁开源发布的开源社区数据,你会发现在当前的 AI 时代下,10 年已经是一个不那么短暂的故事。
随着技术的创新迭代迅猛加速,很多技术或者产品的"寿命"已经缩短到以月、甚至是周为单位。
二、AI 时代浪潮:旧王破、新王立
一百天前,蚂蚁开源就发布了「大模型开源开发全景与趋势」1.0 版本,收录了 19 个技术领域的 135 个社区核心项目。
最新发布的 2.0 版本和旧版比起来,新增了 39 个项目,占 35% 。
60 个旧项目因为不满足 OpenRank 指标标准而未入选。
OpenRank 评价体系
为了更深入明白 2.0 数据,我们先来了解一下蚂蚁开源使用的 OpenRank 评价体系。
OpenRank 是一种基于社区协作关联关系,计算生态中所有项目的相对影响力的算法。
它在评价网页质量的 PageRank 算法的基础之上进行优化和扩展,旨在体现出开源社区的全域影响力和开发者们对社区的贡献度。
更多相关信息请移步:
https://open-digger.cn/docs/user_docs/metrics/openrank
由于众多 AI 项目涌现速度极快,并且热度不低,所以在 2.0 版本中蚂蚁开源也是将标准提升到 OpenRank 指标大于 50 。
数据洞察
消失的项目
除了 TensorFlow ,还有更多曾经的"明星"项目正在走进" AI 墓园",并且它们更加昙花一现。
比如今年 3 月爆火的 OpenManus,还有 OWL 、NextChat 、Bolt.new 等。
开源新秀
这次新入选的 39 个项目主要集中在 Agent 层面,特别是在 AI Coding、Chatbot 和开发框架为主的领域。还有像小智 AI 聊天机器人、Genesis 这种和具身智能应用相关的项目。
这些新秀之中的 top 10 项目如下:
top 10 开源项目
说完了被拍在岸上的前浪和正强劲的后浪,我们一起来看看当下最热门的 top 10 开源项目:
相信都是大家的老熟人了。
从深度学习框架、数据处理、推理部署框架到 Agent 开发平台,代码开发工具,都包含到榜单里了。
除了这些热门项目,蚂蚁开源也归纳了一些虽然还没有出现在全景图 2.0 上面,但是很有潜力的开源项目,大家可以关注一波。
技术领域的发展趋势
再来看看各大技术领域的发展趋势。
我是真没想到, AI coding 都已经卷成红海了,竟然还保持着向上的增长的斜率,而且还是 8 大领域中唯一一个势头向上的。
而 Agent Framework 和 AI data 领域已经触底了。
全球开发者分布画像
蚂蚁开源解析了 124351 位开发者的位置信息,并对他们的国家分布和在大模型开发生态中的贡献度分布进行了统计。
可以看出:中美引领了 AI 领域的开源贡献,两者加起来已经占到了总比例的一半以上,并且断层领先于第三名的德国( 6.5% )。
三、最后
看完 2.0 报告,不得不感慨一句:时代潮流,浩浩汤汤。世界的故事或许就是这样,新旧交替,源源不绝,而 AI 给这样的过程按下了加速键。
作为一名内容创作者,我总是需要不停去找最新的热点、最前沿的技术,却很少去关注那些过去的技术、项目现状怎么样,整体局势有了什么样的变化。
就像蚂蚁集团开源技术委员会副主席王旭说的那样:
我们应该可以主动利用社区数据,形成自己对技术趋势的洞察。
>/ 本期作者:Tashi & JackCui
>/ JackCui:AI领域从业者,毕业于东北大学,大厂算法工程师,热爱技术分享。
没有评论:
发表评论