ModelRouter/.env.example at main · HC-ONLINE/ModelRouter · GitHub

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
# Configuración de la aplicación
APP_ENV=development
APP_NAME=ModelRouter
APP_VERSION=1.0.0
LOG_LEVEL=INFO

# Servidor
HOST=0.0.0.0
PORT=8000

# Redis
REDIS_URL=redis://localhost:6379/0

# Claves API de proveedores
GROQ_API_KEY=tu_clave_groq_aqui
OPENROUTER_API_KEY=tu_clave_openrouter_aqui
OPENAI_API_KEY=tu_clave_openai_aqui
# OLLAMA_API_KEY=  # Opcional, Ollama local no requiere autenticación

# Configuración de proveedores
GROQ_BASE_URL=https://api.groq.com/openai/v1
OPENROUTER_BASE_URL=https://openrouter.ai/api/v1
OPENAI_BASE_URL=https://api.openai.com/v1
OLLAMA_BASE_URL=http://localhost:11434

# Modelos por defecto por proveedor
GROQ_DEFAULT_MODEL=llama-3.3-70b-versatile
OPENROUTER_DEFAULT_MODEL=openai/gpt-3.5-turbo
OPENAI_DEFAULT_MODEL=openai/gpt-3.5-turbo
OLLAMA_DEFAULT_MODEL=llama3.2:1b

# Timeouts (en segundos)
PROVIDER_TIMEOUT=30
FIRST_CHUNK_TIMEOUT=3.0
MAX_OPERATION_TIMEOUT=120

# Backoff y reintentos
MAX_RETRIES=2
BACKOFF_BASE_SECONDS=5
BACKOFF_MAX_SECONDS=300

# Rate limiting
# Límite global por defecto (requests por minuto)
RATE_LIMIT_REQUESTS_PER_MINUTE=60
MAX_CONCURRENT_STREAMS=10

# Rate limiting por proveedor (opcional)
# Si no se definen, se usa RATE_LIMIT_REQUESTS_PER_MINUTE
# Útil para ajustar planes o límites específicos del proveedor
# GROQ_RATE_LIMIT=30
# OPENROUTER_RATE_LIMIT=20
# OPENAI_RATE_LIMIT=30
# OLLAMA_RATE_LIMIT=100

# Autenticación
API_KEY=tu_api_key_para_clientes