지금 사용 가능
Google
gemini-3.5-flash
Gemini 3.5 Flash is Google's high-efficiency multimodal model, bringing near-Pro level coding and reasoning at Flash-tier cost and speed. It is highly optimized for coding proficiency and parallel agentic execution...
TextReasoningToolsFilesVisionAudio200KVideoCacheWebSearch
입력$0.67/ 1M
출력$4.01/ 1M
컨텍스트200K
엔드포인트gemini, openai
기능
추론도구병렬 도구비전오디오 입력비디오파일캐시구조화웹 검색서비스 등급URL 컨텍스트스트리밍시스템 메시지
모달리티
입력
textimagevideofileaudio
출력
text
빠른 통계
컨텍스트 윈도우200K
최대 출력65.5K
모드chat
토크나이저Gemini
지식 컷오프2025
성능
성능 데이터 로딩 중...
지원 파라미터
| 파라미터 | 항상 | 기본값 |
|---|---|---|
| frequency_penalty | - | (보내지 않음) |
| include_reasoning | - | |
| max_tokens | - | |
| presence_penalty | - | (보내지 않음) |
| reasoning | - | |
| repetition_penalty | - | (보내지 않음) |
| response_format | - | |
| seed | - | |
| stop | - | |
| structured_outputs | - | |
| temperature | (보내지 않음) | |
| tool_choice | - | |
| tools | - | |
| top_k | - | (보내지 않음) |
| top_p | (보내지 않음) |
§ 01
요금
| 입력 가격 | $0.67 · 100만 토큰 |
| 출력 가격 | $4.01 · 100만 토큰 |
| 컨텍스트 윈도우 | 200K 토큰 |
| 호환 엔드포인트 | gemini, openai |
| 공급자 |
§ 02
코드에서 gemini-3.5-flash 호출
OpenAI 호환 SDK를 UnoRouter으로 향하게 하고 이름으로 모델을 요청하세요. YOUR_API_KEY를 대시보드의 실제 키로 교체하세요.
bash
curl https://api.unorouter.com/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "gemini-3.5-flash",
"messages": [{"role": "user", "content": "Hello!"}]
}'§ 03
자주 묻는 질문
gemini-3.5-flash은 100만 토큰당 얼마인가요?
입력은 100만 토큰당 $0.67, 출력은 100만 토큰당 $4.01입니다. 청구는 토큰 단위이며 배치 크기로 반올림하지 않습니다.
API를 통해 gemini-3.5-flash에 어떻게 액세스하나요?
model=gemini-3.5-flash으로 UnoRouter /v1/chat/completions 엔드포인트에 요청을 보내세요. OpenAI 호환 클라이언트 라이브러리가 작동합니다. 인증은 표준 Bearer 토큰을 사용합니다.
gemini-3.5-flash의 컨텍스트 윈도우는 무엇인가요?
gemini-3.5-flash은 프롬프트와 모델 응답 간에 공유되는 200K 토큰의 컨텍스트 윈도우를 지원합니다.
§ 04