什么是 LLM 网关？

LLM 网关是一个单一的 API 端点，坐落在众多模型供应商前面，把你的请求路由到你所要的那个模型。与其为每个实验室分别持有一把密钥、一个基础 URL 和各自的 SDK 怪癖，不如持有一把密钥和一个兼容 OpenAI 的端点，其余的交给网关处理。这与经典后端工作中的 API 网关是同一个想法，只是用到了语言模型上。下面讲它给你带来什么。

朴素的定义

网关暴露一个兼容 OpenAI 的接口，通常是 /v1/chat/completions，并在幕后把你请求中的 model 字段映射到一个真实供应商。你每次发送同样形状的请求；网关挑选上游，附上正确的供应商凭证，翻译任何怪癖，并把响应以流的形式传回。换模型时你的代码不变，因为你编程所针对的契约保持恒定。

它为何有帮助

三处收益。一次集成：针对一个端点编程，你就能使用网关承载的每个模型，无需按供应商各设一个客户端。一张账单：跨所有供应商的用量落在一个余额上，而不是十几张分开的发票。以及轻松切换：改一个模型只是一行编辑，于是你可以按任务追逐最佳价格或质量，而无需重新铺设你的应用。对多数构建者而言，单是在集成上省下的时间，就是全部的理由。

它在底层如何运作

当一个请求到来，网关读取 model 中的名称，查出匹配的上游供应商，换入该供应商的凭证，重写供应商特有的请求体字段，再把调用转发出去。流式的 token 经由同一连接返回，所以在你这边看起来就是一次普通的 OpenAI 调用。好的网关会加上对瞬时错误的重试、用量与成本的记账，以及一份最新的模型目录，于是新发布会自行出现，而你什么都不必动。

谁真正需要它

如果你使用不止一个模型、打算随价格和质量变动而换模型，或者要构建任何不该被硬接到单一实验室的东西，你就会想要一个网关。编码代理、聊天应用、角色扮演前端和内部工具都会受益。如果你真的只调用一个供应商的一个模型，且从不指望更换，那么直接的供应商密钥更简单。其余所有人都能用网关省下真实的功夫。

简而言之

LLM 网关把众多供应商变成一个端点、一把密钥和一张账单，于是你集成一次，便能自由换模型。UnoRouter 正是这种模子里的兼容 OpenAI 的网关：一把密钥为代码和聊天同样触达 200 多个模型，配上不会过期的按用量付费额度。如果你触及不止一个模型，网关是更干净的根基。

自己试一个网关：创建免费账户，或浏览模型。