Dostępne teraz
Azure
Microsoft

phi-4

Microsoft Research Phi-4 is designed to perform well in complex reasoning tasks and can operate efficiently in situations with limited memory or where quick responses are needed. At 14 billion...

TextOpen Weights128K
WejścieDarmowe
WyjścieDarmowe
Kontekst128K
Endpointyopenai

Możliwości

Strukturalne

Modalności

Wejście
text
Wyjście
text

Szybkie statystyki

Okno kontekstu128K
Maks. wyjście16.4K
Trybchat
TokenizerOther
Granica wiedzy2024
Kwantyzacjabf16
Hugging Facemicrosoft/phi-4

Wydajność

Ładowanie danych wydajności...

Obsługiwane parametry

ParametrZawszeDomyślne
frequency_penalty-
logit_bias--
logprobs--
max_tokens-
min_p--
presence_penalty-
repetition_penalty-
response_format-
seed-
stop-
structured_outputs-
temperature-
top_k--
top_logprobs--
top_p-
§ 01

Cennik

Cena wejścia$0.00 · 1M tokenów
Cena wyjścia$0.00 · 1M tokenów
Okno kontekstu128K tokenów
Kompatybilne endpointyopenai
DostawcaMicrosoft
§ 02

Wywołaj phi-4 ze swojego kodu

Skieruj dowolny SDK kompatybilny z OpenAI na UnoRouter i zażądaj modelu po nazwie. Zastąp YOUR_API_KEY prawdziwym kluczem z twojego panelu.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "phi-4",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Zaloguj się, aby automatycznie wypełnić klucz API

§ 03

Często zadawane pytania

Ile kosztuje phi-4 za 1M tokenów?

Wejście kosztuje $0.00 za 1M tokenów, wyjście $0.00 za 1M tokenów. Rozliczanie jest per token, bez zaokrąglania do rozmiarów batcha.

Jak uzyskać dostęp do phi-4 przez API?

Wysyłaj zapytania na endpoint UnoRouter /v1/chat/completions z model=phi-4. Działa każda biblioteka klienta kompatybilna z OpenAI. Uwierzytelnianie używa standardowego tokenu Bearer.

Jakie jest okno kontekstu phi-4?

phi-4 obsługuje okno kontekstu 128K tokenów, dzielone między twój prompt a odpowiedź modelu.

§ 04

Podobne modele

Wypróbuj phi-4 teraz

Utwórz klucz API i zacznij wysyłać zapytania w mniej niż minutę.

Zobacz wszystkie modele