开源"免费 API 永动机",聚合 14 家白嫖额度,单月 13 亿 Token 随便造
兄弟们,咱们现在调 API 是不是有点尴尬:
跑本地开源模型?显卡风扇一转,电费先扛不住,显存稍微大点的模型直接 OOM 教你做人。
调大厂的 API?账单像流水,刚把 Agent 跑通,余额一看就剩两位数了。
想薅羊毛?各家都送免费额度——Google 送几百万 Token , Groq 送几千次请求, Kimi 也送一堆。结果呢?为了用这几家免费模型,你得接十几个 SDK ,配十几个 Key ,还得拿个小本本记着谁家的限频到了。
这谁顶得住?
今天给大伙安利一个刚冒头的神器:FreeLLMAPI。
这项目不生产模型,它就是免费算力的“包工头”。它把全球 14 家主流厂商(包括 Google 、 Groq 、 Kimi 、 MiniMax 等)的免费 Tier 打包在一起,聚合成一个每月约 13 亿 Token 的超级算力池。
最关键的是:它支持自动故障转移。 Google 封了,自动切 Groq ; Kimi 限频了,自动切智谱。你代码里只需要指一个地址,剩下的它全管。
这玩意儿到底解决了什么痛点?
项目地址: github.com/tashfeenahmed/freellmapi
简单说,它把最麻烦的“路由调度”给干了。
以前你写个 Agent ,得在代码里写一堆
try-except:先调 Google ,报错了就调 OpenAI ,再报错调 Groq... 代码写得像座山雕。有了 FreeLLMAPI ,你在本地起一个服务,它就变成了一个永远在线的 OpenAI 接口。•对外统一:不管底层是 Llama 还是 Gemini ,对外都是 /v1/chat/completions。你的 Python 、 Node.js 、甚至 Cursor ,只需要改一行 base_url。•无感切换:比如你的 Google Key 今天额度用完了,程序请求过来,路由器发现“哎哟,这个 Key 429 了”,毫秒级 自动把请求转给下一家。你的程序根本感觉不到报错,照样跑。•国产支持:智谱( GLM-4 )、 Moonshot ( Kimi )、 MiniMax 直接支持。不用自己写适配器,拿来就能用。手把手教你搭建"API 永动机"别光看着,这项目部署贼简单,甚至扔在树莓派上都能跑(内存才占 40MB )。1. 一键启动gitclonehttps://github.com/tashfeenahmed/freellmapi.git cdfreellmapi npminstall cp.env.example.env echo"ENCRYPTION_KEY=$(node-e"console.log(require('crypto').randomBytes(32).toString('hex'))")">>.env npmrundev跑起来后,打开 http://localhost:5173,你会看到一个很清爽的管理后台。💡 TIP生产环境小贴士:正式用的时候别跑 `dev` 模式,跑 `npm run build` 然后 `node server/dist/index.js`。这样服务更稳,而且全跑在 3001 端口,不容易被误杀。
2. 进货:把免费 Key 填进去要跑起来,得先去各家进货。以下是我亲测最稳的白嫖组合:•Google AI Studio: Gemini 2.5 Pro/Flash ,额度最大方,适合做主力。•Groq:速度极快, Llama 3.3 70B 免费额度够够的,适合当二备。•智谱 / Kimi:国产双子星,中文任务还得看它们,注册就送钱。拿到 Key 之后,回到 Dashboard 的 Keys 页面,挨个粘贴进去。3. 配置故障转移链( Fallback Chain )这一步是灵魂。你得告诉路由器:如果老大不行了,老二顶上,还是老三顶上?推荐顺序:
1. 首选: Gemini-2.5-Flash (聪明且快)
2. 备选: Groq 上的 Llama 3.3 70B (速度起飞)
3. 兜底:智谱 GLM-4-Flash (中文兜底)保存后,它会给你一个 Unified API Key。这玩意儿就是你以后的“万能钥匙”。4. 见证奇迹:一行代码调用“永动机”以后你的代码长这样:fromopenaiimportOpenAIclient=OpenAI(base_url="http://localhost:3001/v1",api_key="freellmapi-你的万能 Key",)resp=client.chat.completions.create(model="auto",messages=[{"role":"user","content":"鲁迅打周树人,谁赢?"}],)print(resp.choices[0].message.content)print("路由路径:",resp.headers.get("x-routed-via"))
实测效果:你故意把 Google 的 Key 禁掉,发请求。你会发现请求依然秒回,而且 x-routed-via 显示的是 groq。这就叫无感切换,对于做高可用 Agent 的人来说,简直不要太爽。
ℹ️ INFO
进阶玩法:它透传 Tool Calling!你可以直接用它跑 Function Calling Agent ,而且它有个 Sticky Sessions (粘性会话) 功能——同一个对话 30 分钟内锁定同一个模型,防止聊到一半模型换了,导致“精神分裂”。
为什么它值得我们玩?
这项目火,不是因为“免费”,而是因为它解决了不安全感。
以前用免费 Tier ,总担心下一秒就封号。现在,当你把 14 个免费源聚合在一起时,只要地球上一个节点还活着,你的服务就不会断。
单月 13 亿 Token 什么概念?足够你跑几百个 Agent 实验,或者把自家的小应用跑上线。
⚠️ WARNING
友情提醒:虽然叫 FreeLLMAPI ,但各家大厂的条款( ToS )还是得遵守。自己折腾、做 Demo 、非盈利项目随便用,如果要拿去大规模商用赚钱,建议还是老老实实充钱,别把号薅封了。
说实话,这项目最牛的地方不是省钱,而是把“薅羊毛”这件事给工程化了。
以前为了蹭免费额度,得自己写脚本轮询 Key、自己处理重试,累得跟孙子似的。现在,路由器帮你全自动化搞定。只要地球上一个节点还活着,你的服务就不会断。
去 GitHub 上把项目拉下来,配上国产模型的 Key,赶紧体验一下什么叫“算力自由”。
🤖 AI 深度洞见 — 前沿 AI ,深度拆解。每天 3 分钟,看透 AI 底层逻辑。
扫码关注,获取最新 AI 干货 👇