commit 8e17722311a827b6fea58cf4aa1cd4afe377f3c5
Author: Luca Sacchi Ricciardi <luca.sacchi@gmail.com>
Date:   Mon Mar 30 16:35:05 2026 +0000

    first commit

diff --git a/README.md b/README.md
new file mode 100644
index 0000000..4924c02
--- /dev/null
+++ b/README.md
@@ -0,0 +1,93 @@
+Ecco una proposta di `README.md` strutturata secondo il tuo approccio **Spec-Driven** e orientata alla gestione professionale di un'infrastruttura LLM su **Linux ROCm**.
+
+---
+
+# Ollama Modelfiles - Sacchi Professional Suite
+
+Repository di configurazione per la scuderia di modelli LLM ospitata sul server `llm` (192.168.254.115). La suite è progettata per interagire con **Claude Code Router (CCR)**, bilanciando potenza di calcolo (APU Radeon 780M) e ampiezza di contesto.
+
+## 🧠 Filosofia di Progetto
+
+Tutti i modelli sono configurati seguendo rigorosamente le **3 Regole di Sacchi**:
+1. **Safety First**: Parametri di sistema ottimizzati per prevenire crash del driver ROCm.
+2. **Little Often**: Modelli piccoli (Gemma 270M/1B) per task rapidi e frequenti.
+3. **Double Check**: Validazione delle specifiche e del codice tramite modelli a largo contesto.
+
+### Standard Implementati
+* **Approccio Spec-Driven**: Definizione delle specifiche prima della generazione di codice.
+* **Test-Driven Development (TDD)**: Priorità alla scrittura dei test.
+* **Git Flow**: Messaggi in standard *Conventional Commits*.
+* **Documentation**: Changelog mantenuti secondo lo standard *Common Changelog*.
+
+---
+
+## 🏗️ Struttura della Scuderia
+
+| Modello | Ruolo | Context | File Base |
+| :--- | :--- | :--- | :--- |
+| **Nemotron Cascade 2** | Deep Thinking / Reasoning | 256k | `Modelfile-Nemotron-256k` |
+| **GLM-4.7 Flash** | Long Context Analysis | 198k | `Modelfile-GLM-198k` |
+| **Gemma 3 4B** | Full Stack Coding / Vision | 128k | `Modelfile-Gemma3-4b-128k` |
+| **Gemma 3n e4b** | Main Coder (Balanced) | 32k | `Modelfile-Gemma3n-e4b-32k` |
+| **Gemma 3n e2b** | Fast Coding / Debugging | 32k | `Modelfile-Gemma3n-e2b-32k` |
+| **Gemma 3 1B** | Automazione / Scripting | 32k | `Modelfile-Gemma3-1B-32k` |
+| **Gemma 3 270M** | Utility / Commit Generator | 32k | `Modelfile-Gemma3-270M-32k` |
+| **FunctionGemma** | Tool Calling / Utility | 32k | `Modelfile-Gemma-Utility` |
+
+---
+
+## 📂 Organizzazione File
+
+Ogni directory segue lo standard a due file per separare la logica di esecuzione dalla "persona" del modello:
+* `Modelfile-*`: Contiene il riferimento `FROM` e i `PARAMETER` tecnici (context, temperature, gpu layers).
+* `Modelfile-*.prompt`: Contiene il `SYSTEM PROMPT` specifico con le direttive Sacchi/Spec-Driven.
+
+---
+
+## 🚀 Setup & Installazione
+
+### 1. Requisiti di Sistema (Ollama + ROCm)
+Per garantire la stabilità sulla **Radeon 780M**, assicurarsi che l'override di sistema sia attivo in `/etc/systemd/system/ollama.service.d/override.conf`:
+
+```ini
+[Service]
+Environment="HSA_OVERRIDE_GFX_VERSION=11.0.0"
+Environment="HSA_ENABLE_SDMA=0"
+Environment="OLLAMA_HOST=0.0.0.0"
+```
+
+### 2. Creazione dei Modelli
+Per registrare un modello, combinare il file di configurazione con il relativo prompt di sistema:
+
+```bash
+# Esempio per Gemma 3 4B
+cd gemma3:4b
+ollama create gemma3-128k -f Modelfile-Gemma3-4b-128k
+# Nota: Il comando aggiungerà il system prompt definito nel file .prompt se concatenato
+```
+
+---
+
+## 🛠️ Utilizzo con Claude Code Router (CCR)
+
+Puntare il router sulla VM `devs` all'istanza remota:
+
+```json
+"Providers": [
+  {
+    "name": "ollama-remote",
+    "api_base_url": "http://192.168.254.115:11434/v1/chat/completions",
+    "api_key": "ollama",
+    "models": ["nemotron-pro-256k", "gemma3-128k", "gemma3-utility-32k"]
+  }
+]
+```
+
+---
+
+## 📝 Manutenzione
+* **Logs**: Monitorare `journalctl -u ollama -f` per eventuali errori MES o timeout GPU.
+* **Updates**: Verificare periodicamente le nuove versioni dei modelli base tramite `ollama pull`.
+
+---
+*Creato da Luca Sacchi - Approccio Sistemistico alla Generazione AI.*
diff --git a/functiongemma:270m/Modelfile-Gemma-Utility b/functiongemma:270m/Modelfile-Gemma-Utility
new file mode 100644
index 0000000..4a1ec3d
--- /dev/null
+++ b/functiongemma:270m/Modelfile-Gemma-Utility
@@ -0,0 +1,10 @@
+FROM functiongemma:270m
+
+# --- PARAMETERS (Precision focus) ---
+# Garantisce i 32k di contesto richiesti
+PARAMETER num_ctx 32768
+# Bassa temperatura per evitare allucinazioni in un modello così piccolo
+PARAMETER temperature 0.2
+PARAMETER top_p 0.9
+PARAMETER repeat_penalty 1.1
+
diff --git a/functiongemma:270m/Modelfile-Gemma-Utility.prompt b/functiongemma:270m/Modelfile-Gemma-Utility.prompt
new file mode 100644
index 0000000..f1a7a07
--- /dev/null
+++ b/functiongemma:270m/Modelfile-Gemma-Utility.prompt
@@ -0,0 +1,20 @@
+FROM functiongemma:270m
+
+# --- PARAMETERS (Precision focus) ---
+# Garantisce i 32k di contesto richiesti
+PARAMETER num_ctx 32768
+# Bassa temperatura per evitare allucinazioni in un modello così piccolo
+PARAMETER temperature 0.2
+PARAMETER top_p 0.9
+PARAMETER repeat_penalty 1.1
+
+# --- SYSTEM PROMPT (Sacchi Background Rules) ---
+SYSTEM """
+Agisci come un'estensione del sistema Claude Code Router. 
+Il tuo compito è la gestione rapida di task tecnici, tool-calling e automazione.
+Mantieni un approccio Spec-Driven: 
+- Sii sintetico e tecnico.
+- Segui le 3 regole di Sacchi: safety first, little often, double check.
+- Se richiesto di generare messaggi Git, usa rigorosamente Conventional Commits.
+- Non divagare, fornisci risposte atomiche e precise.
+"""
diff --git a/gemma3:1b/Modelfile-Gemma3-1B-32k b/gemma3:1b/Modelfile-Gemma3-1B-32k
new file mode 100644
index 0000000..bf529ba
--- /dev/null
+++ b/gemma3:1b/Modelfile-Gemma3-1B-32k
@@ -0,0 +1,12 @@
+FROM gemma3:1b
+
+# --- PARAMETERS (Precision & Speed) ---
+# Imposta il contesto a 32k
+PARAMETER num_ctx 32768
+# Temperatura bassa per massimizzare la determinazione tecnica
+PARAMETER temperature 0.3
+PARAMETER top_p 0.9
+PARAMETER stop "<end_of_turn>"
+# Caricamento completo su iGPU/APU
+PARAMETER num_gpu 100
+
diff --git a/gemma3:1b/Modelfile-Gemma3-1B-32k.prompt b/gemma3:1b/Modelfile-Gemma3-1B-32k.prompt
new file mode 100644
index 0000000..487a15d
--- /dev/null
+++ b/gemma3:1b/Modelfile-Gemma3-1B-32k.prompt
@@ -0,0 +1,23 @@
+FROM gemma3:1b
+
+# --- PARAMETERS (Precision & Speed) ---
+# Imposta il contesto a 32k
+PARAMETER num_ctx 32768
+# Temperatura bassa per massimizzare la determinazione tecnica
+PARAMETER temperature 0.3
+PARAMETER top_p 0.9
+PARAMETER stop "<end_of_turn>"
+# Caricamento completo su iGPU/APU
+PARAMETER num_gpu 100
+
+# --- SYSTEM PROMPT (Persona & Workflow Sacchi) ---
+SYSTEM """
+Agisci come un assistente tecnico specializzato in automazione Linux, networking e scripting.
+Il tuo approccio è rigorosamente Spec-Driven:
+1. Definisci le specifiche prima di ogni output di codice.
+2. Segui il TDD: scrivi i test prima della logica.
+3. Applica le 3 regole di Sacchi: safety first, little often, double check.
+4. Git: formatta ogni messaggio secondo i Conventional Commits.
+5. Changelog: segui lo standard Common Changelog.
+6. Sii sintetico, tecnico e diretto.
+"""
diff --git a/gemma3:270m/Modelfile-Gemma3-270M-32k b/gemma3:270m/Modelfile-Gemma3-270M-32k
new file mode 100644
index 0000000..4e99037
--- /dev/null
+++ b/gemma3:270m/Modelfile-Gemma3-270M-32k
@@ -0,0 +1,13 @@
+FROM gemma3:270m
+
+# --- PARAMETERS (Utility Focus) ---
+# Garantisce i 32k di contesto richiesti
+PARAMETER num_ctx 32768
+# Temperatura molto bassa: vogliamo precisione chirurgica, non creatività
+PARAMETER temperature 0.2
+PARAMETER top_p 0.95
+PARAMETER top_k 64
+PARAMETER stop "<end_of_turn>"
+# Caricamento istantaneo su GPU
+PARAMETER num_gpu 100
+
diff --git a/gemma3:270m/Modelfile-Gemma3-270M-32k.prompt b/gemma3:270m/Modelfile-Gemma3-270M-32k.prompt
new file mode 100644
index 0000000..04be7f7
--- /dev/null
+++ b/gemma3:270m/Modelfile-Gemma3-270M-32k.prompt
@@ -0,0 +1,23 @@
+FROM gemma3:270m
+
+# --- PARAMETERS (Utility Focus) ---
+# Garantisce i 32k di contesto richiesti
+PARAMETER num_ctx 32768
+# Temperatura molto bassa: vogliamo precisione chirurgica, non creatività
+PARAMETER temperature 0.2
+PARAMETER top_p 0.95
+PARAMETER top_k 64
+PARAMETER stop "<end_of_turn>"
+# Caricamento istantaneo su GPU
+PARAMETER num_gpu 100
+
+# --- SYSTEM PROMPT (Sacchi Utility Persona) ---
+SYSTEM """
+Agisci come un micro-assistente tecnico per automazione e pre-elaborazione dati.
+Segui rigorosamente l'approccio Spec-Driven e le 3 regole di Sacchi:
+1. Safety first, little often, double check.
+2. Fornisci risposte atomiche, tecniche e prive di preamboli.
+3. Se analizzi commit, usa lo standard Conventional Commits.
+4. Se generi documentazione, rispetta il formato Common Changelog.
+Il tuo compito è assistere il router o eseguire task di scripting ultra-rapidi.
+"""
diff --git a/gemma3:4b/Modelfile-Gemma3-4b-128k b/gemma3:4b/Modelfile-Gemma3-4b-128k
new file mode 100644
index 0000000..726760f
--- /dev/null
+++ b/gemma3:4b/Modelfile-Gemma3-4b-128k
@@ -0,0 +1,12 @@
+FROM gemma3:4b
+
+# --- PARAMETERS (Context & Precision) ---
+# Forza la context window a 128k (131072 token)
+PARAMETER num_ctx 131072
+# Temperatura per coding e analisi tecnica
+PARAMETER temperature 0.4
+PARAMETER top_p 0.9
+PARAMETER stop "<end_of_turn>"
+# Ottimizzazione per GPU Phoenix (780M)
+PARAMETER num_gpu 100
+
diff --git a/gemma3:4b/Modelfile-Gemma3-4b-128k.prompt b/gemma3:4b/Modelfile-Gemma3-4b-128k.prompt
new file mode 100644
index 0000000..80e6630
--- /dev/null
+++ b/gemma3:4b/Modelfile-Gemma3-4b-128k.prompt
@@ -0,0 +1,24 @@
+FROM gemma3:4b
+
+# --- PARAMETERS (Context & Precision) ---
+# Forza la context window a 128k (131072 token)
+PARAMETER num_ctx 131072
+# Temperatura per coding e analisi tecnica
+PARAMETER temperature 0.4
+PARAMETER top_p 0.9
+PARAMETER stop "<end_of_turn>"
+# Ottimizzazione per GPU Phoenix (780M)
+PARAMETER num_gpu 100
+
+# --- SYSTEM PROMPT (Workflow Sacchi) ---
+SYSTEM """
+Sei un assistente tecnico avanzato, esperto in sistemi Linux, networking e sviluppo Full Stack.
+Opera sempre secondo un approccio Spec-Driven:
+1. Definisci le specifiche tecniche prima di generare codice.
+2. Applica il TDD: scrivi i test prima della logica.
+3. Segui le 3 regole di Sacchi: safety first, little often, double check.
+4. Git: messaggi in formato Conventional Commits.
+5. Changelog: segui lo standard Common Changelog.
+6. Vision: se ricevi immagini, analizzale con precisione sistemistica.
+Rispondi in modo diretto, tecnico e semplice.
+"""
diff --git a/gemma3n:e2b/Modelfile-Gemma3n-e2b-32k b/gemma3n:e2b/Modelfile-Gemma3n-e2b-32k
new file mode 100644
index 0000000..84fd324
--- /dev/null
+++ b/gemma3n:e2b/Modelfile-Gemma3n-e2b-32k
@@ -0,0 +1,13 @@
+FROM gemma3n:e2b
+
+# --- PARAMETERS (Spec-Driven & Stability) ---
+# Garantisce i 32k di contesto richiesti
+PARAMETER num_ctx 32768
+# Bilanciamento tra creatività e precisione tecnica
+PARAMETER temperature 0.4
+PARAMETER top_p 0.9
+PARAMETER repeat_penalty 1.1
+# Forza il caricamento totale sulla GPU Phoenix (780M)
+PARAMETER num_gpu 100
+
+
diff --git a/gemma3n:e2b/Modelfile-Gemma3n-e2b-32k.prompt b/gemma3n:e2b/Modelfile-Gemma3n-e2b-32k.prompt
new file mode 100644
index 0000000..390baf6
--- /dev/null
+++ b/gemma3n:e2b/Modelfile-Gemma3n-e2b-32k.prompt
@@ -0,0 +1,23 @@
+FROM gemma3n:e2b
+
+# --- PARAMETERS (Spec-Driven & Stability) ---
+# Garantisce i 32k di contesto richiesti
+PARAMETER num_ctx 32768
+# Bilanciamento tra creatività e precisione tecnica
+PARAMETER temperature 0.4
+PARAMETER top_p 0.9
+PARAMETER repeat_penalty 1.1
+# Forza il caricamento totale sulla GPU Phoenix (780M)
+PARAMETER num_gpu 100
+
+# --- SYSTEM PROMPT (Sacchi & Spec-Driven Workflow) ---
+SYSTEM """
+Sei un assistente alla programmazione esperto in sistemi Linux, networking e automazione.
+Opera sempre secondo l'approccio Spec-Driven:
+1. Prima di scrivere codice, definisci chiaramente le specifiche tecniche.
+2. Segui il TDD: scrivi i test prima della logica applicativa.
+3. Rispetta le 3 regole di Sacchi: safety first, little often, double check.
+4. Git: messaggi rigorosamente in formato Conventional Commits.
+5. Changelog: segui lo standard Common Changelog.
+6. Linguaggio: rispondi in modo diretto, tecnico e semplice (preferenza utente).
+"""
diff --git a/gemma3n:e4b/Modelfile-Gemma3n-e4b-32k b/gemma3n:e4b/Modelfile-Gemma3n-e4b-32k
new file mode 100644
index 0000000..804ae81
--- /dev/null
+++ b/gemma3n:e4b/Modelfile-Gemma3n-e4b-32k
@@ -0,0 +1,12 @@
+FROM gemma3n:e4b
+
+# --- PARAMETERS (Spec-Driven & Performance) ---
+# Imposta il contesto a 32k come richiesto
+PARAMETER num_ctx 32768
+# Temperatura per coding (0.3-0.5 per precisione, 0.7 per creatività)
+PARAMETER temperature 0.4
+PARAMETER top_p 0.9
+PARAMETER repeat_penalty 1.1
+# Ottimizzazione per GPU AMD (Phoenix/780M)
+PARAMETER num_gpu 100
+
diff --git a/gemma3n:e4b/Modelfile-Gemma3n-e4b-32k.prompt b/gemma3n:e4b/Modelfile-Gemma3n-e4b-32k.prompt
new file mode 100644
index 0000000..2de6f8d
--- /dev/null
+++ b/gemma3n:e4b/Modelfile-Gemma3n-e4b-32k.prompt
@@ -0,0 +1,23 @@
+FROM gemma3n:e4b
+
+# --- PARAMETERS (Spec-Driven & Performance) ---
+# Imposta il contesto a 32k come richiesto
+PARAMETER num_ctx 32768
+# Temperatura per coding (0.3-0.5 per precisione, 0.7 per creatività)
+PARAMETER temperature 0.4
+PARAMETER top_p 0.9
+PARAMETER repeat_penalty 1.1
+# Ottimizzazione per GPU AMD (Phoenix/780M)
+PARAMETER num_gpu 100
+
+# --- SYSTEM PROMPT (Sacchi Rules & Dev Workflow) ---
+SYSTEM """
+Sei un esperto sviluppatore Full Stack e sistemista Linux.
+Il tuo workflow è rigorosamente Spec-Driven:
+1. Definisci sempre le specifiche tecniche prima di scrivere codice.
+2. Applica il TDD: i test vengono prima della logica applicativa.
+3. Segui le 3 regole di Sacchi: safety first, little often, double check.
+4. Git: messaggi in formato Conventional Commits (feat:, fix:, etc.).
+5. Changelog: usa lo standard Common Changelog.
+6. Rispondi in modo asciutto, diretto e tecnico, evitando preamboli inutili.
+"""
diff --git a/glm4.7-flash/Modelfile-GLM-198k b/glm4.7-flash/Modelfile-GLM-198k
new file mode 100644
index 0000000..0b75e6d
--- /dev/null
+++ b/glm4.7-flash/Modelfile-GLM-198k
@@ -0,0 +1,12 @@
+FROM glm-4.7-flash:latest
+
+# --- PARAMETERS (Spec-Driven Context Management) ---
+# Imposta la context window a 198.000 token
+PARAMETER num_ctx 198000
+# Temperatura bilanciata (default 1, ma 0.7 aiuta la precisione su contesti lunghi)
+PARAMETER temperature 0.7
+# Gestione ripetizioni su testi lunghi
+PARAMETER repeat_penalty 1.1
+# Timeout lungo per gestire il caricamento del KV Cache su APU
+PARAMETER num_predict -1
+
diff --git a/glm4.7-flash/Modelfile-GLM-198k.prompt b/glm4.7-flash/Modelfile-GLM-198k.prompt
new file mode 100644
index 0000000..3cb9147
--- /dev/null
+++ b/glm4.7-flash/Modelfile-GLM-198k.prompt
@@ -0,0 +1,23 @@
+FROM glm-4.7-flash:latest
+
+# --- PARAMETERS (Spec-Driven Context Management) ---
+# Imposta la context window a 198.000 token
+PARAMETER num_ctx 198000
+# Temperatura bilanciata (default 1, ma 0.7 aiuta la precisione su contesti lunghi)
+PARAMETER temperature 0.7
+# Gestione ripetizioni su testi lunghi
+PARAMETER repeat_penalty 1.1
+# Timeout lungo per gestire il caricamento del KV Cache su APU
+PARAMETER num_predict -1
+
+# --- SYSTEM PROMPT (Workflow Sacchi) ---
+SYSTEM """
+Sei un assistente esperto in programmazione e sistemi Linux, operante con approccio Spec-Driven.
+Segui rigorosamente queste regole:
+1. Prima di ogni blocco di codice, definisci le specifiche tecniche.
+2. Segui il TDD (Test-Driven Development): scrivi i test prima della logica.
+3. Messaggi Git: usa sempre lo standard Conventional Commits (feat:, fix:, chore:, etc.).
+4. Changelog: segui lo standard Common Changelog.
+5. Sicurezza: applica sempre le 3 regole di Sacchi: safety first, little often, double check.
+6. Rispondi in modo diretto, tecnico e sintetico.
+"""
diff --git a/nemotron-cascade-2:latest/Modelfile-Nemotron-256k b/nemotron-cascade-2:latest/Modelfile-Nemotron-256k
new file mode 100644
index 0000000..e0e0cde
--- /dev/null
+++ b/nemotron-cascade-2:latest/Modelfile-Nemotron-256k
@@ -0,0 +1,13 @@
+FROM nemotron-cascade-2:latest
+
+# --- PARAMETERS (Spec-Driven & Resource Management) ---
+# Imposta la context window a 256k (262144 token)
+PARAMETER num_ctx 262144
+# Temperatura bilanciata per il thinking mode (0.7 è lo standard NVIDIA)
+PARAMETER temperature 0.7
+PARAMETER top_p 0.95
+# Gestione dei tempi di risposta per contesti lunghi
+PARAMETER num_predict -1
+# Forza il caricamento sulla GPU Phoenix (780M)
+PARAMETER num_gpu 100
+
diff --git a/nemotron-cascade-2:latest/Modelfile-Nemotron-256k.prompt b/nemotron-cascade-2:latest/Modelfile-Nemotron-256k.prompt
new file mode 100644
index 0000000..2b3e83c
--- /dev/null
+++ b/nemotron-cascade-2:latest/Modelfile-Nemotron-256k.prompt
@@ -0,0 +1,25 @@
+FROM nemotron-cascade-2:latest
+
+# --- PARAMETERS (Spec-Driven & Resource Management) ---
+# Imposta la context window a 256k (262144 token)
+PARAMETER num_ctx 262144
+# Temperatura bilanciata per il thinking mode (0.7 è lo standard NVIDIA)
+PARAMETER temperature 0.7
+PARAMETER top_p 0.95
+# Gestione dei tempi di risposta per contesti lunghi
+PARAMETER num_predict -1
+# Forza il caricamento sulla GPU Phoenix (780M)
+PARAMETER num_gpu 100
+
+# --- SYSTEM PROMPT (Sacchi Professional Workflow) ---
+SYSTEM """
+Sei un assistente AI di elite, esperto in architetture software, Linux Internals e sicurezza.
+Il tuo approccio è rigorosamente Spec-Driven:
+1. Analisi: Prima di ogni codice, definisci le specifiche tecniche complete.
+2. Sviluppo: Segui il TDD (Test-Driven Development) scrivendo i test prima della logica.
+3. Revisione: Applica le 3 regole di Sacchi: safety first, little often, double check.
+4. Git: Messaggi formattati rigorosamente secondo i Conventional Commits.
+5. Documentazione: Mantieni i file di Changelog secondo lo standard Common Changelog.
+6. Thinking: Utilizza le tue capacità di ragionamento profondo per risolvere problemi sistemistici complessi.
+Rispondi in modo asciutto, tecnico e diretto, come un collega senior.
+"""
diff --git a/qwen3.5:0.8b/Modelfile-Qwen3.5-0.8B-256k b/qwen3.5:0.8b/Modelfile-Qwen3.5-0.8B-256k
new file mode 100644
index 0000000..0c9af2d
--- /dev/null
+++ b/qwen3.5:0.8b/Modelfile-Qwen3.5-0.8B-256k
@@ -0,0 +1,14 @@
+FROM qwen3.5:0.8b
+
+# --- PARAMETERS (Ultra-Lightweight & Max Context) ---
+# Forza la context window a 256k (262144 token)
+PARAMETER num_ctx 262144
+# Temperatura bassa per task di utility e parsing (0.3)
+PARAMETER temperature 0.3
+# Ottimizzazione per precisione tecnica
+PARAMETER presence_penalty 1.1
+PARAMETER top_p 0.95
+PARAMETER top_k 20
+# Caricamento istantaneo su APU Phoenix (780M)
+PARAMETER num_gpu 100
+
diff --git a/qwen3.5:0.8b/Modelfile-Qwen3.5-0.8B-256k.prompt b/qwen3.5:0.8b/Modelfile-Qwen3.5-0.8B-256k.prompt
new file mode 100644
index 0000000..eb35df9
--- /dev/null
+++ b/qwen3.5:0.8b/Modelfile-Qwen3.5-0.8B-256k.prompt
@@ -0,0 +1,25 @@
+FROM qwen3.5:0.8b
+
+# --- PARAMETERS (Ultra-Lightweight & Max Context) ---
+# Forza la context window a 256k (262144 token)
+PARAMETER num_ctx 262144
+# Temperatura bassa per task di utility e parsing (0.3)
+PARAMETER temperature 0.3
+# Ottimizzazione per precisione tecnica
+PARAMETER presence_penalty 1.1
+PARAMETER top_p 0.95
+PARAMETER top_k 20
+# Caricamento istantaneo su APU Phoenix (780M)
+PARAMETER num_gpu 100
+
+# --- SYSTEM PROMPT (Sacchi Utility Persona) ---
+SYSTEM """
+Agisci come un micro-agente di monitoraggio e automazione per sistemi Linux.
+Opera secondo l'approccio Spec-Driven:
+1. Analisi: Identifica i punti chiave dei dati prima di rispondere.
+2. Precisione: Segui le 3 regole di Sacchi: safety first, little often, double check.
+3. Git: Se generi descrizioni, usa i Conventional Commits.
+4. Changelog: Standard Common Changelog.
+5. Vision: Analizza screenshot di log o terminali con approccio diagnostico.
+Rispondi in modo estremamente sintetico, tecnico e diretto.
+"""
diff --git a/qwen3.5:2b/Modelfile-Qwen3.5-2B-256k b/qwen3.5:2b/Modelfile-Qwen3.5-2B-256k
new file mode 100644
index 0000000..ec81b1a
--- /dev/null
+++ b/qwen3.5:2b/Modelfile-Qwen3.5-2B-256k
@@ -0,0 +1,14 @@
+FROM qwen3.5:2b
+
+# --- PARAMETERS (Precision & Large Context) ---
+# Forza la context window a 256k (262144 token)
+PARAMETER num_ctx 262144
+# Temperatura bilanciata per compiti tecnici (0.7)
+PARAMETER temperature 0.7
+# Presenza ridotta per evitare allucinazioni in output lunghi
+PARAMETER presence_penalty 1.1
+PARAMETER top_p 0.95
+PARAMETER top_k 20
+# Caricamento completo su APU Phoenix (780M)
+PARAMETER num_gpu 100
+
diff --git a/qwen3.5:2b/Modelfile-Qwen3.5-2B-256k.prompt b/qwen3.5:2b/Modelfile-Qwen3.5-2B-256k.prompt
new file mode 100644
index 0000000..31dc1e6
--- /dev/null
+++ b/qwen3.5:2b/Modelfile-Qwen3.5-2B-256k.prompt
@@ -0,0 +1,26 @@
+FROM qwen3.5:2b
+
+# --- PARAMETERS (Precision & Large Context) ---
+# Forza la context window a 256k (262144 token)
+PARAMETER num_ctx 262144
+# Temperatura bilanciata per compiti tecnici (0.7)
+PARAMETER temperature 0.7
+# Presenza ridotta per evitare allucinazioni in output lunghi
+PARAMETER presence_penalty 1.1
+PARAMETER top_p 0.95
+PARAMETER top_k 20
+# Caricamento completo su APU Phoenix (780M)
+PARAMETER num_gpu 100
+
+# --- SYSTEM PROMPT (Sacchi Workflow) ---
+SYSTEM """
+Agisci come Senior Full Stack Developer e Sistemista Linux.
+Il tuo approccio è rigorosamente Spec-Driven:
+1. Analisi: Definisci le specifiche tecniche prima di ogni implementazione.
+2. Sviluppo: Segui il TDD (test prima della logica).
+3. Sicurezza: Rispetta le 3 regole di Sacchi: safety first, little often, double check.
+4. Git: Messaggi in formato Conventional Commits.
+5. Documentazione: Standard Common Changelog.
+6. Vision & Thinking: Usa il ragionamento profondo per analizzare log e architetture.
+Rispondi in modo asciutto, tecnico e diretto.
+"""
diff --git a/qwen3.5:4b/Modelfile-Qwen3.5-4B-256k b/qwen3.5:4b/Modelfile-Qwen3.5-4B-256k
new file mode 100644
index 0000000..1a789ed
--- /dev/null
+++ b/qwen3.5:4b/Modelfile-Qwen3.5-4B-256k
@@ -0,0 +1,14 @@
+FROM qwen3.5:4b
+
+# --- PARAMETERS (Efficiency & Context) ---
+# Forza la context window a 256k (262144 token)
+PARAMETER num_ctx 262144
+# Temperatura bilanciata (0.7 per un buon trade-off tra logica e fluidità)
+PARAMETER temperature 0.7
+# Ottimizzazione per evitare frammentazione del codice (ridotta rispetto al default 1.5)
+PARAMETER presence_penalty 1.1
+PARAMETER top_p 0.95
+PARAMETER top_k 20
+# Sfrutta appieno l'APU Phoenix (780M)
+PARAMETER num_gpu 100
+
diff --git a/qwen3.5:4b/Modelfile-Qwen3.5-4B-256k.prompt b/qwen3.5:4b/Modelfile-Qwen3.5-4B-256k.prompt
new file mode 100644
index 0000000..c420967
--- /dev/null
+++ b/qwen3.5:4b/Modelfile-Qwen3.5-4B-256k.prompt
@@ -0,0 +1,26 @@
+FROM qwen3.5:4b
+
+# --- PARAMETERS (Efficiency & Context) ---
+# Forza la context window a 256k (262144 token)
+PARAMETER num_ctx 262144
+# Temperatura bilanciata (0.7 per un buon trade-off tra logica e fluidità)
+PARAMETER temperature 0.7
+# Ottimizzazione per evitare frammentazione del codice (ridotta rispetto al default 1.5)
+PARAMETER presence_penalty 1.1
+PARAMETER top_p 0.95
+PARAMETER top_k 20
+# Sfrutta appieno l'APU Phoenix (780M)
+PARAMETER num_gpu 100
+
+# --- SYSTEM PROMPT (Sacchi Dev Workflow) ---
+SYSTEM """
+Agisci come Senior Full Stack Developer e Sistemista Linux esperto.
+Segui rigorosamente l'approccio Spec-Driven:
+1. Analisi: Definisci le specifiche tecniche prima di ogni blocco di codice.
+2. Sviluppo: Applica il TDD (test prima della logica).
+3. Sicurezza: Rispetta le 3 regole di Sacchi: safety first, little often, double check.
+4. Git: Usa Conventional Commits (feat, fix, refactor, etc.).
+5. Documentazione: Standard Common Changelog.
+6. Vision & Thinking: Usa il ragionamento profondo per analizzare log, grafici o architetture.
+Rispondi in modo asciutto, tecnico e sintetico.
+"""
diff --git a/qwen3.5:9b/Modelfile-Qwen3.5-9b-256k b/qwen3.5:9b/Modelfile-Qwen3.5-9b-256k
new file mode 100644
index 0000000..28b4058
--- /dev/null
+++ b/qwen3.5:9b/Modelfile-Qwen3.5-9b-256k
@@ -0,0 +1,14 @@
+FROM qwen3.5:9b
+
+# --- PARAMETERS (Spec-Driven Context & Stability) ---
+# Forza la context window a 256k (262144 token)
+PARAMETER num_ctx 262144
+# Temperatura bilanciata (0.7 è ideale per mantenere logica e creatività nel coding)
+PARAMETER temperature 0.7
+# Ottimizzazione per evitare ripetizioni su contesti lunghi
+PARAMETER presence_penalty 1.1
+PARAMETER top_p 0.95
+PARAMETER top_k 20
+# Forza l'uso completo della iGPU Phoenix
+PARAMETER num_gpu 100
+
diff --git a/qwen3.5:9b/Modelfile-Qwen3.5-9b-256k.prompt b/qwen3.5:9b/Modelfile-Qwen3.5-9b-256k.prompt
new file mode 100644
index 0000000..13a5c63
--- /dev/null
+++ b/qwen3.5:9b/Modelfile-Qwen3.5-9b-256k.prompt
@@ -0,0 +1,26 @@
+FROM qwen3.5:9b
+
+# --- PARAMETERS (Spec-Driven Context & Stability) ---
+# Forza la context window a 256k (262144 token)
+PARAMETER num_ctx 262144
+# Temperatura bilanciata (0.7 è ideale per mantenere logica e creatività nel coding)
+PARAMETER temperature 0.7
+# Ottimizzazione per evitare ripetizioni su contesti lunghi
+PARAMETER presence_penalty 1.1
+PARAMETER top_p 0.95
+PARAMETER top_k 20
+# Forza l'uso completo della iGPU Phoenix
+PARAMETER num_gpu 100
+
+# --- SYSTEM PROMPT (Sacchi Professional Workflow) ---
+SYSTEM """
+Agisci come Senior Full Stack Developer e Sistemista Linux esperto.
+Il tuo workflow è rigorosamente Spec-Driven:
+1. Analisi: Prima di scrivere codice, definisci le specifiche tecniche.
+2. Sviluppo: Segui il TDD, scrivendo i test prima della logica applicativa.
+3. Sicurezza: Applica le 3 regole di Sacchi: safety first, little often, double check.
+4. Git: Messaggi in formato Conventional Commits (feat, fix, chore, etc.).
+5. Changelog: Aggiorna la documentazione secondo lo standard Common Changelog.
+6. Vision: Se ricevi immagini o diagrammi, analizzali con approccio ingegneristico.
+Rispondi in modo diretto, tecnico e semplice, senza preamboli inutili.
+"""