2026年6月22日星期一

免费大模型 API全景指南:20+平台白嫖攻略,从注册到上手

想用大模型API但不想花钱?这篇文章整理了目前市面上所有能免费拿到token或API key的平台,从国内的智谱AI、硅基流动到国外的OpenRouter、Google AI Studio,按"值不值得注册"帮你排了个优先级。

先说重点

这篇文章盘了国内外20多个免费AI API平台。不聊聊天工具(ChatGPT网页版那种),只聊能拿到API key、写代码调用的。分成三个梯队:第一梯队是"注册就送、额度充足",第二梯队是"永久免费但有限速",第三梯队是"新产品/额度较小,看你需要"。

第一梯队:必注册

智谱AI(GLM系列)

智谱是国内免费额度最壕的。新用户注册送2000万tokens,GLM-4、GLM-4V这些模型都能用。

注册方式:手机号注册,地址 open.bigmodel.cn,不需要信用卡。

2000万tokens什么概念?大概能跑几万次普通对话请求,个人开发和测试绰绰有余。而且智谱的GLM-4在中文理解和生成上表现不错,日常用是够的。

硅基流动(SiliconFlow)

硅基流动注册送14元初始额度,同时提供多款永久免费模型:Qwen3-8B、DeepSeek-R1-Distill-Qwen-7B、GLM-4-9B-Chat等,速率1000 RPM,每模型50K TPM。

地址:siliconflow.cn。国内直连,速度快,模型选择多。免费模型虽然参数小一些(8B-9B级别),日常对话和轻量任务倒也够用。

NVIDIA NIM(build.nvidia.com)

NVIDIA的NIM平台可能是"一个key解锁最多模型"的选择。注册送1000 inference credits,还能再申请4000,合计5000 credits。支持100+模型,包括DeepSeek R1、Llama系列、Kimi K2.5、MiniMax等,API格式跟OpenAI兼容。

速率限制40 RPM,key有效期可设12个月。不需要信用卡,邮箱+手机号注册。

有一点要注意:平台最近比较火,高峰期容易出现timeout和503。遇到这种情况多retry几次,或者错开高峰时段用。

Google AI Studio

如果只能选一个免费API平台,我会推荐Google AI Studio。Gemini 2.5 Pro、2.5 Flash免费用,速率5-15 RPM,每日约25万tokens。

注册方式:Google账号登录,地址 ai.google.dev,生成API key即可。不需要信用卡。

Gemini系列的多模态能力(文本+图片+代码)在免费API里算是最强的之一。写作、编程、图片理解都能覆盖。

第二梯队:永久免费,速率有限

OpenRouter

OpenRouter的卖点是一个API key调用所有模型。免费模型列表很长:NVIDIA Nemotron系列、MiniMax M2.5、DeepSeek R1、Llama 4、Qwen3等,30+款免费模型。

速率限制20 RPM,每天约50次请求。免费层不需要信用卡,注册地址 openrouter.ai。

免费额度不算多,模型选择倒是最丰富的。如果你需要横向对比不同模型,或者想一个key搞定多个模型调用,OpenRouter是首选。

Groq

Groq的卖点是速度。自研LPU硬件,推理速度每秒300+ tokens,基本上延迟可以忽略。免费模型包括Llama 3.3 70B、Llama 4 Scout、Qwen3 32B等。

速率30 RPM(8B模型60 RPM),70B模型每天1000次请求,8B模型每天14400次。不需要信用卡。

适合交互式应用、实时对话这类对延迟敏感的场景。

Cerebras

Cerebras跟Groq类似,走的是超快推理路线。推理速度约每秒2600 tokens,比Groq还快。免费层每天100万tokens。

模型包括Llama 3.1-8B、Qwen3-32B等,速率30 RPM。免费版上下文窗口限制8K,这比原版模型的128K砍了不少。

地址:cerebras.ai。不需要信用卡,注册即可用。

Mistral AI

Mistral的免费套餐每月约10亿tokens,覆盖Mistral Small 4、Mistral Medium 3、Mistral Large 3、Codestral等。速率约1 RPS、500K TPM。

地址:console.mistral.ai。不需要信用卡。法国公司,主打欧洲高性能模型,多模态支持也在跟进。

GitHub Models

用GitHub账号就能用,提供GPT-4o、GPT-4.1、o3、Grok-3等商业模型的免费访问。速率10-15 RPM,每天50-150次请求。

API地址:models.github.ai/inference。不需要信用卡。对已经用GitHub生态的开发者来说最方便,不用额外注册。

Cloudflare Workers AI

Cloudflare的免费AI套餐,每天10000 neurons。模型包括Llama 3.2、Mistral 7B、FLUX.2(图像生成)等。

地址:dash.cloudflare.com。需要Cloudflare账号,不需要信用卡。模型不算最新,但胜在稳定,而且在Cloudflare的边缘网络上运行,全球延迟低。

Cohere

免费试用版每月1000次调用,模型包括Command R+、Embed 4。速率20 RPM。不需要信用卡。

地址:api.cohere.ai。适合需要高质量嵌入向量(embedding)的场景,文本分类、语义搜索这类。

HuggingFace

HuggingFace是开源模型的"超市",免费额度虽然有限且每月变化,但模型种类多到没法比。适合研究和横向对比不同架构。

地址:huggingface.co。部分模型需要申请访问。

第三梯队:可选

火山引擎

火山引擎每日200万tokens自动刷新,适合批量调用。需要注册,地址 volcengine.com。额度有每日刷新的也有永久的,建议优先用有期限的额度。

月之暗面Kimi

Kimi有API免费额度,具体看官网 moonshot.cn。主打长上下文能力。

腾讯混元

新用户有测试额度,数学方向比较强。地址 cloud.tencent.com,需要申请。

讯飞星火

新用户测试额度,支持联网搜索和绘图。地址 xinghuo.xfyun.cn,需要申请。

书生(Intern-AI)

10 RPM,密钥有效期6个月,适合研究和测试。

LLM7.io

英国平台,基础使用不需要注册,支持30+模型。极简无门槛。

SambaNova

提供5美元credit加免费层,模型包括Llama 3.3 70B、Qwen 2.5 72B,速率10-30 RPM。不需要信用卡。

一张表总结

平台
免费额度
速率限制
需要信用卡
推荐场景
智谱AI
2000万tokens
-
中文任务,额度最壕
硅基流动
14元+永久免费模型
1000 RPM
国内直连,模型多
NVIDIA NIM
5000 credits
40 RPM
100+模型,一键解锁
Google AI Studio
约25万tokens/天
5-15 RPM
多模态,综合最强
OpenRouter
30+免费模型
20 RPM
模型对比,一key多用
Groq
1K-14.4K请求/天
30-60 RPM
极速推理
Cerebras
100万tokens/天
30 RPM
超高速推理
Mistral
10亿tokens/月
1 RPS
欧洲模型,代码生成
GitHub Models
50-150请求/天
10-15 RPM
商业模型免费尝鲜
Cloudflare
10000 neurons/天
-
边缘推理,全球低延迟
Cohere
1000次/月
20 RPM
嵌入向量,语义搜索
HuggingFace
每月可变
-
部分
开源模型研究

实操建议

如果你是第一次接触免费AI API,我建议这样上手:

第一步,注册智谱AI和Google AI Studio。一个搞定中文场景,一个搞定多模态和英文场景,两个加起来能覆盖80%的日常需求。

第二步,注册NVIDIA NIM和硅基流动。NVIDIA的100+模型选择最丰富,硅基流动国内直连速度快。这两个是"大储备"。

第三步,按需注册。写代码多就加Mistral Codestral,追求速度就加Groq或Cerebras,想对比模型就加OpenRouter。

不建议上来就全注册。先用起来,发现哪个平台的限制卡住了你的需求,再补注册对应的平台。

还有一点:免费额度很多有期限。优先消耗有期限的(NVIDIA credits、硅基流动14元),永久免费模型和每日刷新额度留着长期用。

最后,这些免费API都不允许商用。个人学习、原型开发、测试完全没问题,但如果要做商业产品,还是得乖乖付费。


关注「未来之路AI」,带你用最低成本玩转AI。

没有评论:

发表评论

免费大模型 API全景指南:20+平台白嫖攻略,从注册到上手

想用大模型API但不想花钱?这篇文章整理了目前市面上所有能免费拿到token或API key的平台,从国内的智谱AI、硅基流动到国外的OpenRouter、Google AI Studio,按"值不值得注册"帮你排了个优先级。 先说重点 这篇文章盘了国内外2...