first commit
This commit is contained in:
13
nemotron-cascade-2:latest/Modelfile-Nemotron-256k
Normal file
13
nemotron-cascade-2:latest/Modelfile-Nemotron-256k
Normal file
@@ -0,0 +1,13 @@
|
||||
FROM nemotron-cascade-2:latest
|
||||
|
||||
# --- PARAMETERS (Spec-Driven & Resource Management) ---
|
||||
# Imposta la context window a 256k (262144 token)
|
||||
PARAMETER num_ctx 262144
|
||||
# Temperatura bilanciata per il thinking mode (0.7 è lo standard NVIDIA)
|
||||
PARAMETER temperature 0.7
|
||||
PARAMETER top_p 0.95
|
||||
# Gestione dei tempi di risposta per contesti lunghi
|
||||
PARAMETER num_predict -1
|
||||
# Forza il caricamento sulla GPU Phoenix (780M)
|
||||
PARAMETER num_gpu 100
|
||||
|
||||
Reference in New Issue
Block a user