太香了
如果你也像我一样,每天都在跟各种 AI 工具打交道,那你一定懂那种「Token 焦虑症」。
我一直在寻找一个既能打,又足够慷慨的 API 平台。
市面上虽然也有不少选择,但要么是模型能力差点意思,要么就是免费额度抠抠搜搜,刚开始用就提示要充值了。
直到我挖到了 Cerebras 这个宝藏。
每天 100 万免费 Tokens,支持 Llama、Qwen 等一众顶级开源模型,最爽的是,它还完美兼容 OpenAI 的 API。
体验下来,四个字:相见恨晚。
Cerebras 是个什么来头?
在聊这个平台的羊毛有多香之前,先来认识一下 Cerebras。
简单来说,Cerebras 是一家硬核的 AI 硬件公司,他们把一整块披萨那么大的硅晶圆,直接做成了一颗超级芯片,上面集成了几万亿个晶体管。
这颗「巨无霸」芯片的算力,约等于把一个机柜的服务器都压缩了进去。
算力猛,成本就能降下来。
如何注册并使用?
好了,回到我们最关心的部分——如何白嫖。
Cerebras 平台的注册非常简单,只需要打开 Cerebras 的官网👉 https://www.cerebras.ai/
点击 GET API KEY。
新用户需要注册一个账户并完成邮箱验证,之后便可登录到平台控制台,不用邀请码,也不用绑信用卡。
登录后,在用户控制台,能看到一个叫做「Playground 」的页面,在这里,在这里,可以直接跟 AI 对话。
注意看右上角的模型选择菜单,除了我们熟悉的 Llama 系列和 Qwen 等顶级开源模型外,一个特别的名字出现了:gpt-oss-120b。
gpt-oss-120b正是 OpenAI 在 8 月放出的两款开源大模型之一。
根据 OpenAI 官方说法,这款拥有 1170 亿参数的混合专家模型(MoE),在核心性能上,几乎达到了 GPT o4-mini 的水平。
我在这边测试的体感,速度飙到了惊人的 1205 Tokens/s。
这是什么概念?
真的就是你问题刚发出去,答案直接就「唰」地一下就铺满了整个屏幕,整个过程一秒都不用。
无缝衔接第三方 AI 工具
除了可以在平台默认提供的游乐场进行使用,还可以作为 API 进行使用,只需要获取一个 API Keys。
在主页面左侧,有一个「API Keys」的按钮,可以在这里创建新的 API 密钥 ,也可以直接复制默认创建好的。
拿到 API Keys 之后,可以做的事情就很多了。
可以用它来驱动 Obsidian 里的 AI 插件,或者配合 Cherry Studio、Chatbox 这类客户端工具进行使用。
因为完全兼容 OpenAI 的 API 格式,迁移过程几乎是零成本。
举个栗子🌰,以我目前高频使用的 Obsidian 为例,只需要做两步:
把 API 的基地址(Base URL)从 OpenAI 的官方地址,换成 Cerebras 的 https://api.cerebras.ai/v1
。把原来 OpenAI 的密钥,换成刚刚申请到的 Cerebras 密钥。
配置完成之后,GPT 就顺利接入进来了,来试试看效果如何。
如果你的动手能力强一些的话,还可以把 Cerebras 接入到你的代码里,在首页直接提供了完整接入代码。
如果有更进阶的需求,可以看看他们的 API 文档。
顺带一提,Cerebras 在官网也明确承诺,不会使用你的请求进行任何模型训练,隐私安全这块可以放心。
写在最后
体验下来,Cerebras 给我的感觉,就是纯粹的「爽」。
因为我一直在使用 Gemini,没有充值 ChatGPT Pro,这下好了,可以没有任何负担,也能使用性能接近 GPT-4 的顶级模型了。
如果你也想体验,官网在这里👉 https://www.cerebras.ai/
我是艾康,会持续分享AI时代下的思考方式,如果想第一时间收到推送,欢迎关注公众号,并设为星标⭐。
扫描下方二维码,备注「公众号」,免费送你一份《AI编程与智能体从 0 到 1完整手册》。
如果觉得这篇文章有用的话,感谢点赞、在看➕关注👆,我是艾康,咱们下篇见!
没有评论:
发表评论