FROM nemotron-cascade-2:latest # --- PARAMETERS (Spec-Driven & Resource Management) --- # Imposta la context window a 256k (262144 token) PARAMETER num_ctx 262144 # Temperatura bilanciata per il thinking mode (0.7 รจ lo standard NVIDIA) PARAMETER temperature 0.7 PARAMETER top_p 0.95 # Gestione dei tempi di risposta per contesti lunghi PARAMETER num_predict -1 # Forza il caricamento sulla GPU Phoenix (780M) PARAMETER num_gpu 100