AI I024: 免费大模型 API全景指南：20+平台白嫖攻略，从注册到上手

2026年6月22日星期一

免费大模型 API全景指南：20+平台白嫖攻略，从注册到上手

想用大模型API但不想花钱？这篇文章整理了目前市面上所有能免费拿到token或API key的平台，从国内的智谱AI、硅基流动到国外的OpenRouter、Google AI Studio，按"值不值得注册"帮你排了个优先级。

先说重点

这篇文章盘了国内外20多个免费AI API平台。不聊聊天工具（ChatGPT网页版那种），只聊能拿到API key、写代码调用的。分成三个梯队：第一梯队是"注册就送、额度充足"，第二梯队是"永久免费但有限速"，第三梯队是"新产品/额度较小，看你需要"。

第一梯队：必注册

智谱AI（GLM系列）

智谱是国内免费额度最壕的。新用户注册送2000万tokens，GLM-4、GLM-4V这些模型都能用。

注册方式：手机号注册，地址 open.bigmodel.cn，不需要信用卡。

2000万tokens什么概念？大概能跑几万次普通对话请求，个人开发和测试绰绰有余。而且智谱的GLM-4在中文理解和生成上表现不错，日常用是够的。

硅基流动（SiliconFlow）

硅基流动注册送14元初始额度，同时提供多款永久免费模型：Qwen3-8B、DeepSeek-R1-Distill-Qwen-7B、GLM-4-9B-Chat等，速率1000 RPM，每模型50K TPM。

地址：siliconflow.cn。国内直连，速度快，模型选择多。免费模型虽然参数小一些（8B-9B级别），日常对话和轻量任务倒也够用。

NVIDIA NIM（build.nvidia.com）

NVIDIA的NIM平台可能是"一个key解锁最多模型"的选择。注册送1000 inference credits，还能再申请4000，合计5000 credits。支持100+模型，包括DeepSeek R1、Llama系列、Kimi K2.5、MiniMax等，API格式跟OpenAI兼容。

速率限制40 RPM，key有效期可设12个月。不需要信用卡，邮箱+手机号注册。

有一点要注意：平台最近比较火，高峰期容易出现timeout和503。遇到这种情况多retry几次，或者错开高峰时段用。

Google AI Studio

如果只能选一个免费API平台，我会推荐Google AI Studio。Gemini 2.5 Pro、2.5 Flash免费用，速率5-15 RPM，每日约25万tokens。

注册方式：Google账号登录，地址 ai.google.dev，生成API key即可。不需要信用卡。

Gemini系列的多模态能力（文本+图片+代码）在免费API里算是最强的之一。写作、编程、图片理解都能覆盖。

第二梯队：永久免费，速率有限

OpenRouter

OpenRouter的卖点是一个API key调用所有模型。免费模型列表很长：NVIDIA Nemotron系列、MiniMax M2.5、DeepSeek R1、Llama 4、Qwen3等，30+款免费模型。

速率限制20 RPM，每天约50次请求。免费层不需要信用卡，注册地址 openrouter.ai。

免费额度不算多，模型选择倒是最丰富的。如果你需要横向对比不同模型，或者想一个key搞定多个模型调用，OpenRouter是首选。

Groq

Groq的卖点是速度。自研LPU硬件，推理速度每秒300+ tokens，基本上延迟可以忽略。免费模型包括Llama 3.3 70B、Llama 4 Scout、Qwen3 32B等。

速率30 RPM（8B模型60 RPM），70B模型每天1000次请求，8B模型每天14400次。不需要信用卡。

适合交互式应用、实时对话这类对延迟敏感的场景。

Cerebras

Cerebras跟Groq类似，走的是超快推理路线。推理速度约每秒2600 tokens，比Groq还快。免费层每天100万tokens。

模型包括Llama 3.1-8B、Qwen3-32B等，速率30 RPM。免费版上下文窗口限制8K，这比原版模型的128K砍了不少。

地址：cerebras.ai。不需要信用卡，注册即可用。

Mistral AI

Mistral的免费套餐每月约10亿tokens，覆盖Mistral Small 4、Mistral Medium 3、Mistral Large 3、Codestral等。速率约1 RPS、500K TPM。

地址：console.mistral.ai。不需要信用卡。法国公司，主打欧洲高性能模型，多模态支持也在跟进。

GitHub Models

用GitHub账号就能用，提供GPT-4o、GPT-4.1、o3、Grok-3等商业模型的免费访问。速率10-15 RPM，每天50-150次请求。

API地址：models.github.ai/inference。不需要信用卡。对已经用GitHub生态的开发者来说最方便，不用额外注册。

Cloudflare Workers AI

Cloudflare的免费AI套餐，每天10000 neurons。模型包括Llama 3.2、Mistral 7B、FLUX.2（图像生成）等。

地址：dash.cloudflare.com。需要Cloudflare账号，不需要信用卡。模型不算最新，但胜在稳定，而且在Cloudflare的边缘网络上运行，全球延迟低。

Cohere

免费试用版每月1000次调用，模型包括Command R+、Embed 4。速率20 RPM。不需要信用卡。

地址：api.cohere.ai。适合需要高质量嵌入向量（embedding）的场景，文本分类、语义搜索这类。

HuggingFace

HuggingFace是开源模型的"超市"，免费额度虽然有限且每月变化，但模型种类多到没法比。适合研究和横向对比不同架构。

地址：huggingface.co。部分模型需要申请访问。

第三梯队：可选

火山引擎

火山引擎每日200万tokens自动刷新，适合批量调用。需要注册，地址 volcengine.com。额度有每日刷新的也有永久的，建议优先用有期限的额度。

月之暗面Kimi

Kimi有API免费额度，具体看官网 moonshot.cn。主打长上下文能力。

腾讯混元

新用户有测试额度，数学方向比较强。地址 cloud.tencent.com，需要申请。

讯飞星火

新用户测试额度，支持联网搜索和绘图。地址 xinghuo.xfyun.cn，需要申请。

书生（Intern-AI）

10 RPM，密钥有效期6个月，适合研究和测试。

LLM7.io

英国平台，基础使用不需要注册，支持30+模型。极简无门槛。

SambaNova

提供5美元credit加免费层，模型包括Llama 3.3 70B、Qwen 2.5 72B，速率10-30 RPM。不需要信用卡。

一张表总结

平台	免费额度	速率限制	需要信用卡	推荐场景
智谱AI	2000万tokens	-	否	中文任务，额度最壕
硅基流动	14元+永久免费模型	1000 RPM	否	国内直连，模型多
NVIDIA NIM	5000 credits	40 RPM	否	100+模型，一键解锁
Google AI Studio	约25万tokens/天	5-15 RPM	否	多模态，综合最强
OpenRouter	30+免费模型	20 RPM	否	模型对比，一key多用
Groq	1K-14.4K请求/天	30-60 RPM	否	极速推理
Cerebras	100万tokens/天	30 RPM	否	超高速推理
Mistral	10亿tokens/月	1 RPS	否	欧洲模型，代码生成
GitHub Models	50-150请求/天	10-15 RPM	否	商业模型免费尝鲜
Cloudflare	10000 neurons/天	-	否	边缘推理，全球低延迟
Cohere	1000次/月	20 RPM	否	嵌入向量，语义搜索
HuggingFace	每月可变	-	部分	开源模型研究

实操建议

如果你是第一次接触免费AI API，我建议这样上手：

第一步，注册智谱AI和Google AI Studio。一个搞定中文场景，一个搞定多模态和英文场景，两个加起来能覆盖80%的日常需求。

第二步，注册NVIDIA NIM和硅基流动。NVIDIA的100+模型选择最丰富，硅基流动国内直连速度快。这两个是"大储备"。

第三步，按需注册。写代码多就加Mistral Codestral，追求速度就加Groq或Cerebras，想对比模型就加OpenRouter。

不建议上来就全注册。先用起来，发现哪个平台的限制卡住了你的需求，再补注册对应的平台。

还有一点：免费额度很多有期限。优先消耗有期限的（NVIDIA credits、硅基流动14元），永久免费模型和每日刷新额度留着长期用。

最后，这些免费API都不允许商用。个人学习、原型开发、测试完全没问题，但如果要做商业产品，还是得乖乖付费。

关注「未来之路AI」，带你用最低成本玩转AI。

没有评论:

发表评论

订阅：博文评论 (Atom)