14 lines
434 B
Plaintext
14 lines
434 B
Plaintext
FROM nemotron-cascade-2:latest
|
|
|
|
# --- PARAMETERS (Spec-Driven & Resource Management) ---
|
|
# Imposta la context window a 256k (262144 token)
|
|
PARAMETER num_ctx 262144
|
|
# Temperatura bilanciata per il thinking mode (0.7 è lo standard NVIDIA)
|
|
PARAMETER temperature 0.7
|
|
PARAMETER top_p 0.95
|
|
# Gestione dei tempi di risposta per contesti lunghi
|
|
PARAMETER num_predict -1
|
|
# Forza il caricamento sulla GPU Phoenix (780M)
|
|
PARAMETER num_gpu 100
|
|
|