Files
Ollama-Modelfiles/nemotron-cascade-2:latest/Modelfile-Nemotron-256k
Luca Sacchi Ricciardi 8e17722311 first commit
2026-03-30 16:35:05 +00:00

14 lines
434 B
Plaintext

FROM nemotron-cascade-2:latest
# --- PARAMETERS (Spec-Driven & Resource Management) ---
# Imposta la context window a 256k (262144 token)
PARAMETER num_ctx 262144
# Temperatura bilanciata per il thinking mode (0.7 è lo standard NVIDIA)
PARAMETER temperature 0.7
PARAMETER top_p 0.95
# Gestione dei tempi di risposta per contesti lunghi
PARAMETER num_predict -1
# Forza il caricamento sulla GPU Phoenix (780M)
PARAMETER num_gpu 100