2026年2月10日星期二

AI大神Andrej Karpathy公开92个高质量技术信息源及个人开源项目,覆盖GPT构建、AI学习及深度内容获取指南

Andrej Karpathy 是 AI 领域公认的大神。

他是 OpenAI 的创始成员,后面被马斯克挖走,领导了特斯拉自动驾驶团队。离开特斯拉后,他回到 OpenAI 参与了 GPT-4 的后续研发。

图片

现在,他成立一家 AI 教育公司 Eureka Labs,经常在 X 和 YouTube 上活跃。

如果你想学 AI 尤其是技术原理,去搜 Andrej Karpathy 的 YouTube 频道,那是目前世界上最好的学习路径。

如果你经常看我的公众号文章,会看到之前推荐过的两个项目:

01

它的开源项目

① nanoGPT:极简主义的预训练标杆

nanoGPT 是 Karpathy 为了教学和研究而开发的最简约、最清晰的 GPT 训练库。

它被公认为理解大语言模型原理的入门神作。

它剥离掉工业级代码中繁杂的工程包装,只保留 Transformer 架构最核心的逻辑。

图片

通过这个项目,开发者可以清晰地看到一个类似 GPT-2 的模型是如何从零开始,通过 PyTorch 编写并在自己的数据上进行预训练的。

图片

它的核心代码极其精炼,主要由两个约 300 行的文件组成:model.py 定义了复杂的 Transformer 数学结构,而 train.py 则实现了完整的训练循环。

尽管代码量极小,但它完整支持了现代深度学习的关键技术,如分布式训练、混合精度加速(Flash Attention)以及与 OpenAI 官方权重的兼容。

开源地址:https://github.com/karpathy/nanoGPT

② nanochat:从会写字到能聊天的全链路指南

这个 4 万人 Star 的开源项目。

可以让你用 100 美元训练一个小型的 ChatGPT。

图片

如果说 nanoGPT 关注的是预训练,让模型学会预测下一个字,那么 nanochat 则是进阶版的全栈式大模型训练框架。

它不仅涵盖了预训练,还补齐了将原始模型转化为类似 ChatGPT 的对话模型所需的完整链路,包括:分词器训练、有监督微调和强化学习。

这个项目只用约 8000 行代码实现了一个端到端的系统,还自带了一个现 Web 聊天界面,让用户在训练结束后能立刻与自己的模型对话。

图片

02

大神的信息源

最近 Andrej Karpathy 在自己的 X 上发了一个帖子,它认为目前的社交媒体充斥着为了诱导点击和情绪而生成的 AI 垃圾内容。

为了获取高质量、长篇且具有深度思考的内容,他强烈建议回归 RSS 订阅。

它觉得 RSS 是对抗信息茧房算法操控的最后堡垒。

图片
地址:https://gist.github.com/emschwartz/e6d2bf860ccc367fe37ff953ba6de66b#file-hn-popular-blogs-2025-opml
他个人主要使用 RSS 阅读器,去订阅那些由人类亲自撰写、具有长效价值的长篇文章,而不是被算法优化的碎片化短文。
比如上面这个订阅源,收集了 2025 年 Hacker News 中 92 个最受欢迎的博客,涵盖了深度技术探讨、编程艺术、数学以及科学研究。

Hacker News 是 YC 运营的新闻聚合网站。

它在科技界、程序员圈子和创业圈子中拥有极高的地位,被许多人视为获取高质量科技资讯和进行深度讨论的圣地。

03

如何像 Karpathy 一样获取信息?

① 下载 opml 文件
首先需要打开上面的那个链接,把 opml 文件下载到本地。
图片
② 下载一个 RSS 订阅器
你可以选择我之前推荐过的开源的 RSS 订阅工具:Folo
图片
开源地址:https://github.com/RSSNext/Folo
除了 Folo 你也可以使用其他的 RSS 预览工具,比如 NetNewsWire 啥的。
图片
开源地址:https://github.com/Ranchero-Software/NetNewsWire
③ 导入 opml 文件
下载之后,只需要导入刚刚下载的 opml 文件就行了。
图片
图片
当你导入成功,你就能看到这个几个热门的博客列表了。
图片

04

这个信息源有啥

这份信息源有几个我也在关注,都在里面了。
比如 Simon Willison,他是 Django 框架的联合创始人,现在专注于研究如何务实地使用 AI。

不同于炒作概念的人,他会手写代码测试各种新模型,分享详细的 Prompt 工程技巧、API 使用心得以及安全漏洞。

图片

还有 Neal Agarwal,他不做枯燥的技术分享,而是做好玩的网页。

他的代表作《Stimulation Clicker》刺激点击器是对现代互联网多巴胺成瘾的讽刺游戏。

他的作品经常霸榜 Hacker News,代码不仅可以用来创造工具,也可以用来创造快乐和艺术。

图片

当然还有技术元老 比如 Paul Graham ,YC 创始人,虽然不常更但每篇必火、John Gruber 经常做苹果生态评论。

底层技术大佬: 比如 Julia Evans ,用漫画解释 Linux 内核/网络协议。做数学与科学的: 比如 Terence Tao ,陶哲轩的博客,数学界顶流。

05

点击下方卡片,关注逛逛 GitHub

这个公众号历史发布过很多有趣的开源项目,如果你懒得翻文章一个个找,你直接关注微信公众号:逛逛 GitHub ,后台对话聊天就行了:

图片

没有评论:

发表评论

AI大神Andrej Karpathy公开92个高质量技术信息源及个人开源项目,覆盖GPT构建、AI学习及深度内容获取指南

Andrej Karpathy 是 AI 领域公认的大神。 他是  OpenAI 的创始成员 ,后面 被马斯克挖走,领导了 特斯拉自动驾驶 团队。离开特斯拉后,他回到 OpenAI 参与了  GPT-4  的后续研发。 现在,他成立一家 AI 教育公司  Eureka Lab...