想用大模型API但不想花钱?这篇文章整理了目前市面上所有能免费拿到token或API key的平台,从国内的智谱AI、硅基流动到国外的OpenRouter、Google AI Studio,按"值不值得注册"帮你排了个优先级。
先说重点
这篇文章盘了国内外20多个免费AI API平台。不聊聊天工具(ChatGPT网页版那种),只聊能拿到API key、写代码调用的。分成三个梯队:第一梯队是"注册就送、额度充足",第二梯队是"永久免费但有限速",第三梯队是"新产品/额度较小,看你需要"。
第一梯队:必注册
智谱AI(GLM系列)
智谱是国内免费额度最壕的。新用户注册送2000万tokens,GLM-4、GLM-4V这些模型都能用。
注册方式:手机号注册,地址 open.bigmodel.cn,不需要信用卡。
2000万tokens什么概念?大概能跑几万次普通对话请求,个人开发和测试绰绰有余。而且智谱的GLM-4在中文理解和生成上表现不错,日常用是够的。
硅基流动(SiliconFlow)
硅基流动注册送14元初始额度,同时提供多款永久免费模型:Qwen3-8B、DeepSeek-R1-Distill-Qwen-7B、GLM-4-9B-Chat等,速率1000 RPM,每模型50K TPM。
地址:siliconflow.cn。国内直连,速度快,模型选择多。免费模型虽然参数小一些(8B-9B级别),日常对话和轻量任务倒也够用。
NVIDIA NIM(build.nvidia.com)
NVIDIA的NIM平台可能是"一个key解锁最多模型"的选择。注册送1000 inference credits,还能再申请4000,合计5000 credits。支持100+模型,包括DeepSeek R1、Llama系列、Kimi K2.5、MiniMax等,API格式跟OpenAI兼容。
速率限制40 RPM,key有效期可设12个月。不需要信用卡,邮箱+手机号注册。
有一点要注意:平台最近比较火,高峰期容易出现timeout和503。遇到这种情况多retry几次,或者错开高峰时段用。
Google AI Studio
如果只能选一个免费API平台,我会推荐Google AI Studio。Gemini 2.5 Pro、2.5 Flash免费用,速率5-15 RPM,每日约25万tokens。
注册方式:Google账号登录,地址 ai.google.dev,生成API key即可。不需要信用卡。
Gemini系列的多模态能力(文本+图片+代码)在免费API里算是最强的之一。写作、编程、图片理解都能覆盖。
第二梯队:永久免费,速率有限
OpenRouter
OpenRouter的卖点是一个API key调用所有模型。免费模型列表很长:NVIDIA Nemotron系列、MiniMax M2.5、DeepSeek R1、Llama 4、Qwen3等,30+款免费模型。
速率限制20 RPM,每天约50次请求。免费层不需要信用卡,注册地址 openrouter.ai。
免费额度不算多,模型选择倒是最丰富的。如果你需要横向对比不同模型,或者想一个key搞定多个模型调用,OpenRouter是首选。
Groq
Groq的卖点是速度。自研LPU硬件,推理速度每秒300+ tokens,基本上延迟可以忽略。免费模型包括Llama 3.3 70B、Llama 4 Scout、Qwen3 32B等。
速率30 RPM(8B模型60 RPM),70B模型每天1000次请求,8B模型每天14400次。不需要信用卡。
适合交互式应用、实时对话这类对延迟敏感的场景。
Cerebras
Cerebras跟Groq类似,走的是超快推理路线。推理速度约每秒2600 tokens,比Groq还快。免费层每天100万tokens。
模型包括Llama 3.1-8B、Qwen3-32B等,速率30 RPM。免费版上下文窗口限制8K,这比原版模型的128K砍了不少。
地址:cerebras.ai。不需要信用卡,注册即可用。
Mistral AI
Mistral的免费套餐每月约10亿tokens,覆盖Mistral Small 4、Mistral Medium 3、Mistral Large 3、Codestral等。速率约1 RPS、500K TPM。
地址:console.mistral.ai。不需要信用卡。法国公司,主打欧洲高性能模型,多模态支持也在跟进。
GitHub Models
用GitHub账号就能用,提供GPT-4o、GPT-4.1、o3、Grok-3等商业模型的免费访问。速率10-15 RPM,每天50-150次请求。
API地址:models.github.ai/inference。不需要信用卡。对已经用GitHub生态的开发者来说最方便,不用额外注册。
Cloudflare Workers AI
Cloudflare的免费AI套餐,每天10000 neurons。模型包括Llama 3.2、Mistral 7B、FLUX.2(图像生成)等。
地址:dash.cloudflare.com。需要Cloudflare账号,不需要信用卡。模型不算最新,但胜在稳定,而且在Cloudflare的边缘网络上运行,全球延迟低。
Cohere
免费试用版每月1000次调用,模型包括Command R+、Embed 4。速率20 RPM。不需要信用卡。
地址:api.cohere.ai。适合需要高质量嵌入向量(embedding)的场景,文本分类、语义搜索这类。
HuggingFace
HuggingFace是开源模型的"超市",免费额度虽然有限且每月变化,但模型种类多到没法比。适合研究和横向对比不同架构。
地址:huggingface.co。部分模型需要申请访问。
第三梯队:可选
火山引擎
火山引擎每日200万tokens自动刷新,适合批量调用。需要注册,地址 volcengine.com。额度有每日刷新的也有永久的,建议优先用有期限的额度。
月之暗面Kimi
Kimi有API免费额度,具体看官网 moonshot.cn。主打长上下文能力。
腾讯混元
新用户有测试额度,数学方向比较强。地址 cloud.tencent.com,需要申请。
讯飞星火
新用户测试额度,支持联网搜索和绘图。地址 xinghuo.xfyun.cn,需要申请。
书生(Intern-AI)
10 RPM,密钥有效期6个月,适合研究和测试。
LLM7.io
英国平台,基础使用不需要注册,支持30+模型。极简无门槛。
SambaNova
提供5美元credit加免费层,模型包括Llama 3.3 70B、Qwen 2.5 72B,速率10-30 RPM。不需要信用卡。
一张表总结
实操建议
如果你是第一次接触免费AI API,我建议这样上手:
第一步,注册智谱AI和Google AI Studio。一个搞定中文场景,一个搞定多模态和英文场景,两个加起来能覆盖80%的日常需求。
第二步,注册NVIDIA NIM和硅基流动。NVIDIA的100+模型选择最丰富,硅基流动国内直连速度快。这两个是"大储备"。
第三步,按需注册。写代码多就加Mistral Codestral,追求速度就加Groq或Cerebras,想对比模型就加OpenRouter。
不建议上来就全注册。先用起来,发现哪个平台的限制卡住了你的需求,再补注册对应的平台。
还有一点:免费额度很多有期限。优先消耗有期限的(NVIDIA credits、硅基流动14元),永久免费模型和每日刷新额度留着长期用。
最后,这些免费API都不允许商用。个人学习、原型开发、测试完全没问题,但如果要做商业产品,还是得乖乖付费。
关注「未来之路AI」,带你用最低成本玩转AI。