已發佈
工程

什麼是 LLM 閘道?

LLM 閘道是一個端點和一把金鑰,把請求路由到眾多模型供應商。下面講它做什麼、為何有幫助,以及誰真正需要它。

·閱讀約 3 分鐘·作者:UnoRouter團隊
產品

LLM 閘道是一個單一的 API 端點,坐落在眾多模型供應商前面,把你的請求路由到你所要的那個模型。與其為每個實驗室分別持有一把金鑰、一個基礎 URL 和各自的 SDK 怪癖,不如持有一把金鑰和一個相容 OpenAI 的端點,其餘的交給閘道處理。這與經典後端工作中的 API 閘道是同一個想法,只是用到了語言模型上。下面講它給你帶來什麼。

樸素的定義

閘道暴露一個相容 OpenAI 的介面,通常是 /v1/chat/completions,並在幕後把你請求中的 model 欄位對應到一個真實供應商。你每次傳送同樣形狀的請求;閘道挑選上游,附上正確的供應商憑證,翻譯任何怪癖,並把回應以串流的形式傳回。換模型時你的程式碼不變,因為你程式設計所針對的合約保持恆定。

它為何有幫助

三處收益。一次整合:針對一個端點程式設計,你就能使用閘道承載的每個模型,無需按供應商各設一個用戶端。一張帳單:跨所有供應商的用量落在一個餘額上,而不是十幾張分開的發票。以及輕鬆切換:改一個模型只是一行編輯,於是你可以按任務追逐最佳價格或品質,而無需重新鋪設你的應用程式。對多數建構者而言,單是在整合上省下的時間,就是全部的理由。

它在底層如何運作

當一個請求到來,閘道讀取 model 中的名稱,查出相符的上游供應商,換入該供應商的憑證,重寫供應商特有的請求主體欄位,再把呼叫轉發出去。串流的 token 經由同一連線返回,所以在你這邊看起來就是一次普通的 OpenAI 呼叫。好的閘道會加上對瞬時錯誤的重試、用量與成本的記帳,以及一份最新的模型目錄,於是新發布會自行出現,而你什麼都不必動。

誰真正需要它

如果你使用不止一個模型、打算隨價格和品質變動而換模型,或者要建構任何不該被硬接到單一實驗室的東西,你就會想要一個閘道。編碼代理、聊天應用程式、角色扮演前端和內部工具都會受益。如果你真的只呼叫一個供應商的一個模型,且從不指望更換,那麼直接的供應商金鑰更簡單。其餘所有人都能用閘道省下真實的功夫。

簡而言之

LLM 閘道把眾多供應商變成一個端點、一把金鑰和一張帳單,於是你整合一次,便能自由換模型。UnoRouter 正是這種模子裡的相容 OpenAI 的閘道:一把金鑰為程式碼和聊天同樣觸達 200 多個模型,配上不會過期的按用量付費額度。如果你觸及不止一個模型,閘道是更乾淨的根基。

自己試一個閘道:建立免費帳戶,或瀏覽模型

相關文章
什麼是 LLM 閘道?|UnoRouter