Disponível agora
Google

gemini-3.5-flash

Gemini 3.5 Flash is Google's high-efficiency multimodal model, bringing near-Pro level coding and reasoning at Flash-tier cost and speed. It is highly optimized for coding proficiency and parallel agentic execution...

TextReasoningToolsFilesVisionAudio200KVideoCacheWebSearch
Entrada$0.67/ 1M
Saída$4.01/ 1M
Contexto200K
Endpointsgemini, openai

Capacidades

RaciocínioFerramentasFerramentas paralelasVisãoÁudio entradaVídeoArquivosCacheEstruturadoBusca webNível de serviçoContexto URLStreamingMsg sistema

Modalidades

Entrada
textimagevideofileaudio
Saída
text

Estatísticas rápidas

Janela de contexto200K
Saída máxima65.5K
Modochat
TokenizadorGemini
Corte de conhecimento2025

Desempenho

Carregando dados de desempenho...

Parâmetros suportados

ParâmetroSemprePadrão
frequency_penalty-(não enviar)
include_reasoning-
max_tokens-
presence_penalty-(não enviar)
reasoning-
repetition_penalty-(não enviar)
response_format-
seed-
stop-
structured_outputs-
temperature(não enviar)
tool_choice-
tools-
top_k-(não enviar)
top_p(não enviar)
§ 01

Preços

Preço de entrada$0.67 · 1M tokens
Preço de saída$4.01 · 1M tokens
Janela de contexto200K tokens
Endpoints compatíveisgemini, openai
FornecedorGoogle
§ 02

Chamar gemini-3.5-flash do seu código

Aponte qualquer SDK compatível com OpenAI para UnoRouter e solicite o modelo pelo nome. Substitua YOUR_API_KEY por uma chave real do seu painel.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "gemini-3.5-flash",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Entre para preencher automaticamente sua chave API

§ 03

Perguntas frequentes

Quanto custa gemini-3.5-flash por 1M tokens?

A entrada custa $0.67 por 1M tokens, a saída $4.01 por 1M tokens. A cobrança é por token, sem arredondamento para tamanhos de lote.

Como acesso gemini-3.5-flash via API?

Envie solicitações ao endpoint /v1/chat/completions de UnoRouter com model=gemini-3.5-flash. Qualquer biblioteca cliente compatível com OpenAI funciona. A autenticação usa um token Bearer padrão.

Qual é a janela de contexto de gemini-3.5-flash?

gemini-3.5-flash suporta uma janela de contexto de 200K tokens, compartilhada entre seu prompt e a resposta do modelo.

§ 04

Modelos similares

Experimente gemini-3.5-flash agora

Crie uma chave API e comece a fazer solicitações em menos de um minuto.

Ver todos os modelos