FROM nemotron-cascade-2:latest

# --- PARAMETERS (Spec-Driven & Resource Management) ---
# Imposta la context window a 256k (262144 token)
PARAMETER num_ctx 262144
# Temperatura bilanciata per il thinking mode (0.7 è lo standard NVIDIA)
PARAMETER temperature 0.7
PARAMETER top_p 0.95
# Gestione dei tempi di risposta per contesti lunghi
PARAMETER num_predict -1
# Forza il caricamento sulla GPU Phoenix (780M)
PARAMETER num_gpu 100

