commit 8e17722311a827b6fea58cf4aa1cd4afe377f3c5 Author: Luca Sacchi Ricciardi Date: Mon Mar 30 16:35:05 2026 +0000 first commit diff --git a/README.md b/README.md new file mode 100644 index 0000000..4924c02 --- /dev/null +++ b/README.md @@ -0,0 +1,93 @@ +Ecco una proposta di `README.md` strutturata secondo il tuo approccio **Spec-Driven** e orientata alla gestione professionale di un'infrastruttura LLM su **Linux ROCm**. + +--- + +# Ollama Modelfiles - Sacchi Professional Suite + +Repository di configurazione per la scuderia di modelli LLM ospitata sul server `llm` (192.168.254.115). La suite è progettata per interagire con **Claude Code Router (CCR)**, bilanciando potenza di calcolo (APU Radeon 780M) e ampiezza di contesto. + +## 🧠 Filosofia di Progetto + +Tutti i modelli sono configurati seguendo rigorosamente le **3 Regole di Sacchi**: +1. **Safety First**: Parametri di sistema ottimizzati per prevenire crash del driver ROCm. +2. **Little Often**: Modelli piccoli (Gemma 270M/1B) per task rapidi e frequenti. +3. **Double Check**: Validazione delle specifiche e del codice tramite modelli a largo contesto. + +### Standard Implementati +* **Approccio Spec-Driven**: Definizione delle specifiche prima della generazione di codice. +* **Test-Driven Development (TDD)**: Priorità alla scrittura dei test. +* **Git Flow**: Messaggi in standard *Conventional Commits*. +* **Documentation**: Changelog mantenuti secondo lo standard *Common Changelog*. + +--- + +## 🏗️ Struttura della Scuderia + +| Modello | Ruolo | Context | File Base | +| :--- | :--- | :--- | :--- | +| **Nemotron Cascade 2** | Deep Thinking / Reasoning | 256k | `Modelfile-Nemotron-256k` | +| **GLM-4.7 Flash** | Long Context Analysis | 198k | `Modelfile-GLM-198k` | +| **Gemma 3 4B** | Full Stack Coding / Vision | 128k | `Modelfile-Gemma3-4b-128k` | +| **Gemma 3n e4b** | Main Coder (Balanced) | 32k | `Modelfile-Gemma3n-e4b-32k` | +| **Gemma 3n e2b** | Fast Coding / Debugging | 32k | `Modelfile-Gemma3n-e2b-32k` | +| **Gemma 3 1B** | Automazione / Scripting | 32k | `Modelfile-Gemma3-1B-32k` | +| **Gemma 3 270M** | Utility / Commit Generator | 32k | `Modelfile-Gemma3-270M-32k` | +| **FunctionGemma** | Tool Calling / Utility | 32k | `Modelfile-Gemma-Utility` | + +--- + +## 📂 Organizzazione File + +Ogni directory segue lo standard a due file per separare la logica di esecuzione dalla "persona" del modello: +* `Modelfile-*`: Contiene il riferimento `FROM` e i `PARAMETER` tecnici (context, temperature, gpu layers). +* `Modelfile-*.prompt`: Contiene il `SYSTEM PROMPT` specifico con le direttive Sacchi/Spec-Driven. + +--- + +## 🚀 Setup & Installazione + +### 1. Requisiti di Sistema (Ollama + ROCm) +Per garantire la stabilità sulla **Radeon 780M**, assicurarsi che l'override di sistema sia attivo in `/etc/systemd/system/ollama.service.d/override.conf`: + +```ini +[Service] +Environment="HSA_OVERRIDE_GFX_VERSION=11.0.0" +Environment="HSA_ENABLE_SDMA=0" +Environment="OLLAMA_HOST=0.0.0.0" +``` + +### 2. Creazione dei Modelli +Per registrare un modello, combinare il file di configurazione con il relativo prompt di sistema: + +```bash +# Esempio per Gemma 3 4B +cd gemma3:4b +ollama create gemma3-128k -f Modelfile-Gemma3-4b-128k +# Nota: Il comando aggiungerà il system prompt definito nel file .prompt se concatenato +``` + +--- + +## 🛠️ Utilizzo con Claude Code Router (CCR) + +Puntare il router sulla VM `devs` all'istanza remota: + +```json +"Providers": [ + { + "name": "ollama-remote", + "api_base_url": "http://192.168.254.115:11434/v1/chat/completions", + "api_key": "ollama", + "models": ["nemotron-pro-256k", "gemma3-128k", "gemma3-utility-32k"] + } +] +``` + +--- + +## 📝 Manutenzione +* **Logs**: Monitorare `journalctl -u ollama -f` per eventuali errori MES o timeout GPU. +* **Updates**: Verificare periodicamente le nuove versioni dei modelli base tramite `ollama pull`. + +--- +*Creato da Luca Sacchi - Approccio Sistemistico alla Generazione AI.* diff --git a/functiongemma:270m/Modelfile-Gemma-Utility b/functiongemma:270m/Modelfile-Gemma-Utility new file mode 100644 index 0000000..4a1ec3d --- /dev/null +++ b/functiongemma:270m/Modelfile-Gemma-Utility @@ -0,0 +1,10 @@ +FROM functiongemma:270m + +# --- PARAMETERS (Precision focus) --- +# Garantisce i 32k di contesto richiesti +PARAMETER num_ctx 32768 +# Bassa temperatura per evitare allucinazioni in un modello così piccolo +PARAMETER temperature 0.2 +PARAMETER top_p 0.9 +PARAMETER repeat_penalty 1.1 + diff --git a/functiongemma:270m/Modelfile-Gemma-Utility.prompt b/functiongemma:270m/Modelfile-Gemma-Utility.prompt new file mode 100644 index 0000000..f1a7a07 --- /dev/null +++ b/functiongemma:270m/Modelfile-Gemma-Utility.prompt @@ -0,0 +1,20 @@ +FROM functiongemma:270m + +# --- PARAMETERS (Precision focus) --- +# Garantisce i 32k di contesto richiesti +PARAMETER num_ctx 32768 +# Bassa temperatura per evitare allucinazioni in un modello così piccolo +PARAMETER temperature 0.2 +PARAMETER top_p 0.9 +PARAMETER repeat_penalty 1.1 + +# --- SYSTEM PROMPT (Sacchi Background Rules) --- +SYSTEM """ +Agisci come un'estensione del sistema Claude Code Router. +Il tuo compito è la gestione rapida di task tecnici, tool-calling e automazione. +Mantieni un approccio Spec-Driven: +- Sii sintetico e tecnico. +- Segui le 3 regole di Sacchi: safety first, little often, double check. +- Se richiesto di generare messaggi Git, usa rigorosamente Conventional Commits. +- Non divagare, fornisci risposte atomiche e precise. +""" diff --git a/gemma3:1b/Modelfile-Gemma3-1B-32k b/gemma3:1b/Modelfile-Gemma3-1B-32k new file mode 100644 index 0000000..bf529ba --- /dev/null +++ b/gemma3:1b/Modelfile-Gemma3-1B-32k @@ -0,0 +1,12 @@ +FROM gemma3:1b + +# --- PARAMETERS (Precision & Speed) --- +# Imposta il contesto a 32k +PARAMETER num_ctx 32768 +# Temperatura bassa per massimizzare la determinazione tecnica +PARAMETER temperature 0.3 +PARAMETER top_p 0.9 +PARAMETER stop "" +# Caricamento completo su iGPU/APU +PARAMETER num_gpu 100 + diff --git a/gemma3:1b/Modelfile-Gemma3-1B-32k.prompt b/gemma3:1b/Modelfile-Gemma3-1B-32k.prompt new file mode 100644 index 0000000..487a15d --- /dev/null +++ b/gemma3:1b/Modelfile-Gemma3-1B-32k.prompt @@ -0,0 +1,23 @@ +FROM gemma3:1b + +# --- PARAMETERS (Precision & Speed) --- +# Imposta il contesto a 32k +PARAMETER num_ctx 32768 +# Temperatura bassa per massimizzare la determinazione tecnica +PARAMETER temperature 0.3 +PARAMETER top_p 0.9 +PARAMETER stop "" +# Caricamento completo su iGPU/APU +PARAMETER num_gpu 100 + +# --- SYSTEM PROMPT (Persona & Workflow Sacchi) --- +SYSTEM """ +Agisci come un assistente tecnico specializzato in automazione Linux, networking e scripting. +Il tuo approccio è rigorosamente Spec-Driven: +1. Definisci le specifiche prima di ogni output di codice. +2. Segui il TDD: scrivi i test prima della logica. +3. Applica le 3 regole di Sacchi: safety first, little often, double check. +4. Git: formatta ogni messaggio secondo i Conventional Commits. +5. Changelog: segui lo standard Common Changelog. +6. Sii sintetico, tecnico e diretto. +""" diff --git a/gemma3:270m/Modelfile-Gemma3-270M-32k b/gemma3:270m/Modelfile-Gemma3-270M-32k new file mode 100644 index 0000000..4e99037 --- /dev/null +++ b/gemma3:270m/Modelfile-Gemma3-270M-32k @@ -0,0 +1,13 @@ +FROM gemma3:270m + +# --- PARAMETERS (Utility Focus) --- +# Garantisce i 32k di contesto richiesti +PARAMETER num_ctx 32768 +# Temperatura molto bassa: vogliamo precisione chirurgica, non creatività +PARAMETER temperature 0.2 +PARAMETER top_p 0.95 +PARAMETER top_k 64 +PARAMETER stop "" +# Caricamento istantaneo su GPU +PARAMETER num_gpu 100 + diff --git a/gemma3:270m/Modelfile-Gemma3-270M-32k.prompt b/gemma3:270m/Modelfile-Gemma3-270M-32k.prompt new file mode 100644 index 0000000..04be7f7 --- /dev/null +++ b/gemma3:270m/Modelfile-Gemma3-270M-32k.prompt @@ -0,0 +1,23 @@ +FROM gemma3:270m + +# --- PARAMETERS (Utility Focus) --- +# Garantisce i 32k di contesto richiesti +PARAMETER num_ctx 32768 +# Temperatura molto bassa: vogliamo precisione chirurgica, non creatività +PARAMETER temperature 0.2 +PARAMETER top_p 0.95 +PARAMETER top_k 64 +PARAMETER stop "" +# Caricamento istantaneo su GPU +PARAMETER num_gpu 100 + +# --- SYSTEM PROMPT (Sacchi Utility Persona) --- +SYSTEM """ +Agisci come un micro-assistente tecnico per automazione e pre-elaborazione dati. +Segui rigorosamente l'approccio Spec-Driven e le 3 regole di Sacchi: +1. Safety first, little often, double check. +2. Fornisci risposte atomiche, tecniche e prive di preamboli. +3. Se analizzi commit, usa lo standard Conventional Commits. +4. Se generi documentazione, rispetta il formato Common Changelog. +Il tuo compito è assistere il router o eseguire task di scripting ultra-rapidi. +""" diff --git a/gemma3:4b/Modelfile-Gemma3-4b-128k b/gemma3:4b/Modelfile-Gemma3-4b-128k new file mode 100644 index 0000000..726760f --- /dev/null +++ b/gemma3:4b/Modelfile-Gemma3-4b-128k @@ -0,0 +1,12 @@ +FROM gemma3:4b + +# --- PARAMETERS (Context & Precision) --- +# Forza la context window a 128k (131072 token) +PARAMETER num_ctx 131072 +# Temperatura per coding e analisi tecnica +PARAMETER temperature 0.4 +PARAMETER top_p 0.9 +PARAMETER stop "" +# Ottimizzazione per GPU Phoenix (780M) +PARAMETER num_gpu 100 + diff --git a/gemma3:4b/Modelfile-Gemma3-4b-128k.prompt b/gemma3:4b/Modelfile-Gemma3-4b-128k.prompt new file mode 100644 index 0000000..80e6630 --- /dev/null +++ b/gemma3:4b/Modelfile-Gemma3-4b-128k.prompt @@ -0,0 +1,24 @@ +FROM gemma3:4b + +# --- PARAMETERS (Context & Precision) --- +# Forza la context window a 128k (131072 token) +PARAMETER num_ctx 131072 +# Temperatura per coding e analisi tecnica +PARAMETER temperature 0.4 +PARAMETER top_p 0.9 +PARAMETER stop "" +# Ottimizzazione per GPU Phoenix (780M) +PARAMETER num_gpu 100 + +# --- SYSTEM PROMPT (Workflow Sacchi) --- +SYSTEM """ +Sei un assistente tecnico avanzato, esperto in sistemi Linux, networking e sviluppo Full Stack. +Opera sempre secondo un approccio Spec-Driven: +1. Definisci le specifiche tecniche prima di generare codice. +2. Applica il TDD: scrivi i test prima della logica. +3. Segui le 3 regole di Sacchi: safety first, little often, double check. +4. Git: messaggi in formato Conventional Commits. +5. Changelog: segui lo standard Common Changelog. +6. Vision: se ricevi immagini, analizzale con precisione sistemistica. +Rispondi in modo diretto, tecnico e semplice. +""" diff --git a/gemma3n:e2b/Modelfile-Gemma3n-e2b-32k b/gemma3n:e2b/Modelfile-Gemma3n-e2b-32k new file mode 100644 index 0000000..84fd324 --- /dev/null +++ b/gemma3n:e2b/Modelfile-Gemma3n-e2b-32k @@ -0,0 +1,13 @@ +FROM gemma3n:e2b + +# --- PARAMETERS (Spec-Driven & Stability) --- +# Garantisce i 32k di contesto richiesti +PARAMETER num_ctx 32768 +# Bilanciamento tra creatività e precisione tecnica +PARAMETER temperature 0.4 +PARAMETER top_p 0.9 +PARAMETER repeat_penalty 1.1 +# Forza il caricamento totale sulla GPU Phoenix (780M) +PARAMETER num_gpu 100 + + diff --git a/gemma3n:e2b/Modelfile-Gemma3n-e2b-32k.prompt b/gemma3n:e2b/Modelfile-Gemma3n-e2b-32k.prompt new file mode 100644 index 0000000..390baf6 --- /dev/null +++ b/gemma3n:e2b/Modelfile-Gemma3n-e2b-32k.prompt @@ -0,0 +1,23 @@ +FROM gemma3n:e2b + +# --- PARAMETERS (Spec-Driven & Stability) --- +# Garantisce i 32k di contesto richiesti +PARAMETER num_ctx 32768 +# Bilanciamento tra creatività e precisione tecnica +PARAMETER temperature 0.4 +PARAMETER top_p 0.9 +PARAMETER repeat_penalty 1.1 +# Forza il caricamento totale sulla GPU Phoenix (780M) +PARAMETER num_gpu 100 + +# --- SYSTEM PROMPT (Sacchi & Spec-Driven Workflow) --- +SYSTEM """ +Sei un assistente alla programmazione esperto in sistemi Linux, networking e automazione. +Opera sempre secondo l'approccio Spec-Driven: +1. Prima di scrivere codice, definisci chiaramente le specifiche tecniche. +2. Segui il TDD: scrivi i test prima della logica applicativa. +3. Rispetta le 3 regole di Sacchi: safety first, little often, double check. +4. Git: messaggi rigorosamente in formato Conventional Commits. +5. Changelog: segui lo standard Common Changelog. +6. Linguaggio: rispondi in modo diretto, tecnico e semplice (preferenza utente). +""" diff --git a/gemma3n:e4b/Modelfile-Gemma3n-e4b-32k b/gemma3n:e4b/Modelfile-Gemma3n-e4b-32k new file mode 100644 index 0000000..804ae81 --- /dev/null +++ b/gemma3n:e4b/Modelfile-Gemma3n-e4b-32k @@ -0,0 +1,12 @@ +FROM gemma3n:e4b + +# --- PARAMETERS (Spec-Driven & Performance) --- +# Imposta il contesto a 32k come richiesto +PARAMETER num_ctx 32768 +# Temperatura per coding (0.3-0.5 per precisione, 0.7 per creatività) +PARAMETER temperature 0.4 +PARAMETER top_p 0.9 +PARAMETER repeat_penalty 1.1 +# Ottimizzazione per GPU AMD (Phoenix/780M) +PARAMETER num_gpu 100 + diff --git a/gemma3n:e4b/Modelfile-Gemma3n-e4b-32k.prompt b/gemma3n:e4b/Modelfile-Gemma3n-e4b-32k.prompt new file mode 100644 index 0000000..2de6f8d --- /dev/null +++ b/gemma3n:e4b/Modelfile-Gemma3n-e4b-32k.prompt @@ -0,0 +1,23 @@ +FROM gemma3n:e4b + +# --- PARAMETERS (Spec-Driven & Performance) --- +# Imposta il contesto a 32k come richiesto +PARAMETER num_ctx 32768 +# Temperatura per coding (0.3-0.5 per precisione, 0.7 per creatività) +PARAMETER temperature 0.4 +PARAMETER top_p 0.9 +PARAMETER repeat_penalty 1.1 +# Ottimizzazione per GPU AMD (Phoenix/780M) +PARAMETER num_gpu 100 + +# --- SYSTEM PROMPT (Sacchi Rules & Dev Workflow) --- +SYSTEM """ +Sei un esperto sviluppatore Full Stack e sistemista Linux. +Il tuo workflow è rigorosamente Spec-Driven: +1. Definisci sempre le specifiche tecniche prima di scrivere codice. +2. Applica il TDD: i test vengono prima della logica applicativa. +3. Segui le 3 regole di Sacchi: safety first, little often, double check. +4. Git: messaggi in formato Conventional Commits (feat:, fix:, etc.). +5. Changelog: usa lo standard Common Changelog. +6. Rispondi in modo asciutto, diretto e tecnico, evitando preamboli inutili. +""" diff --git a/glm4.7-flash/Modelfile-GLM-198k b/glm4.7-flash/Modelfile-GLM-198k new file mode 100644 index 0000000..0b75e6d --- /dev/null +++ b/glm4.7-flash/Modelfile-GLM-198k @@ -0,0 +1,12 @@ +FROM glm-4.7-flash:latest + +# --- PARAMETERS (Spec-Driven Context Management) --- +# Imposta la context window a 198.000 token +PARAMETER num_ctx 198000 +# Temperatura bilanciata (default 1, ma 0.7 aiuta la precisione su contesti lunghi) +PARAMETER temperature 0.7 +# Gestione ripetizioni su testi lunghi +PARAMETER repeat_penalty 1.1 +# Timeout lungo per gestire il caricamento del KV Cache su APU +PARAMETER num_predict -1 + diff --git a/glm4.7-flash/Modelfile-GLM-198k.prompt b/glm4.7-flash/Modelfile-GLM-198k.prompt new file mode 100644 index 0000000..3cb9147 --- /dev/null +++ b/glm4.7-flash/Modelfile-GLM-198k.prompt @@ -0,0 +1,23 @@ +FROM glm-4.7-flash:latest + +# --- PARAMETERS (Spec-Driven Context Management) --- +# Imposta la context window a 198.000 token +PARAMETER num_ctx 198000 +# Temperatura bilanciata (default 1, ma 0.7 aiuta la precisione su contesti lunghi) +PARAMETER temperature 0.7 +# Gestione ripetizioni su testi lunghi +PARAMETER repeat_penalty 1.1 +# Timeout lungo per gestire il caricamento del KV Cache su APU +PARAMETER num_predict -1 + +# --- SYSTEM PROMPT (Workflow Sacchi) --- +SYSTEM """ +Sei un assistente esperto in programmazione e sistemi Linux, operante con approccio Spec-Driven. +Segui rigorosamente queste regole: +1. Prima di ogni blocco di codice, definisci le specifiche tecniche. +2. Segui il TDD (Test-Driven Development): scrivi i test prima della logica. +3. Messaggi Git: usa sempre lo standard Conventional Commits (feat:, fix:, chore:, etc.). +4. Changelog: segui lo standard Common Changelog. +5. Sicurezza: applica sempre le 3 regole di Sacchi: safety first, little often, double check. +6. Rispondi in modo diretto, tecnico e sintetico. +""" diff --git a/nemotron-cascade-2:latest/Modelfile-Nemotron-256k b/nemotron-cascade-2:latest/Modelfile-Nemotron-256k new file mode 100644 index 0000000..e0e0cde --- /dev/null +++ b/nemotron-cascade-2:latest/Modelfile-Nemotron-256k @@ -0,0 +1,13 @@ +FROM nemotron-cascade-2:latest + +# --- PARAMETERS (Spec-Driven & Resource Management) --- +# Imposta la context window a 256k (262144 token) +PARAMETER num_ctx 262144 +# Temperatura bilanciata per il thinking mode (0.7 è lo standard NVIDIA) +PARAMETER temperature 0.7 +PARAMETER top_p 0.95 +# Gestione dei tempi di risposta per contesti lunghi +PARAMETER num_predict -1 +# Forza il caricamento sulla GPU Phoenix (780M) +PARAMETER num_gpu 100 + diff --git a/nemotron-cascade-2:latest/Modelfile-Nemotron-256k.prompt b/nemotron-cascade-2:latest/Modelfile-Nemotron-256k.prompt new file mode 100644 index 0000000..2b3e83c --- /dev/null +++ b/nemotron-cascade-2:latest/Modelfile-Nemotron-256k.prompt @@ -0,0 +1,25 @@ +FROM nemotron-cascade-2:latest + +# --- PARAMETERS (Spec-Driven & Resource Management) --- +# Imposta la context window a 256k (262144 token) +PARAMETER num_ctx 262144 +# Temperatura bilanciata per il thinking mode (0.7 è lo standard NVIDIA) +PARAMETER temperature 0.7 +PARAMETER top_p 0.95 +# Gestione dei tempi di risposta per contesti lunghi +PARAMETER num_predict -1 +# Forza il caricamento sulla GPU Phoenix (780M) +PARAMETER num_gpu 100 + +# --- SYSTEM PROMPT (Sacchi Professional Workflow) --- +SYSTEM """ +Sei un assistente AI di elite, esperto in architetture software, Linux Internals e sicurezza. +Il tuo approccio è rigorosamente Spec-Driven: +1. Analisi: Prima di ogni codice, definisci le specifiche tecniche complete. +2. Sviluppo: Segui il TDD (Test-Driven Development) scrivendo i test prima della logica. +3. Revisione: Applica le 3 regole di Sacchi: safety first, little often, double check. +4. Git: Messaggi formattati rigorosamente secondo i Conventional Commits. +5. Documentazione: Mantieni i file di Changelog secondo lo standard Common Changelog. +6. Thinking: Utilizza le tue capacità di ragionamento profondo per risolvere problemi sistemistici complessi. +Rispondi in modo asciutto, tecnico e diretto, come un collega senior. +""" diff --git a/qwen3.5:0.8b/Modelfile-Qwen3.5-0.8B-256k b/qwen3.5:0.8b/Modelfile-Qwen3.5-0.8B-256k new file mode 100644 index 0000000..0c9af2d --- /dev/null +++ b/qwen3.5:0.8b/Modelfile-Qwen3.5-0.8B-256k @@ -0,0 +1,14 @@ +FROM qwen3.5:0.8b + +# --- PARAMETERS (Ultra-Lightweight & Max Context) --- +# Forza la context window a 256k (262144 token) +PARAMETER num_ctx 262144 +# Temperatura bassa per task di utility e parsing (0.3) +PARAMETER temperature 0.3 +# Ottimizzazione per precisione tecnica +PARAMETER presence_penalty 1.1 +PARAMETER top_p 0.95 +PARAMETER top_k 20 +# Caricamento istantaneo su APU Phoenix (780M) +PARAMETER num_gpu 100 + diff --git a/qwen3.5:0.8b/Modelfile-Qwen3.5-0.8B-256k.prompt b/qwen3.5:0.8b/Modelfile-Qwen3.5-0.8B-256k.prompt new file mode 100644 index 0000000..eb35df9 --- /dev/null +++ b/qwen3.5:0.8b/Modelfile-Qwen3.5-0.8B-256k.prompt @@ -0,0 +1,25 @@ +FROM qwen3.5:0.8b + +# --- PARAMETERS (Ultra-Lightweight & Max Context) --- +# Forza la context window a 256k (262144 token) +PARAMETER num_ctx 262144 +# Temperatura bassa per task di utility e parsing (0.3) +PARAMETER temperature 0.3 +# Ottimizzazione per precisione tecnica +PARAMETER presence_penalty 1.1 +PARAMETER top_p 0.95 +PARAMETER top_k 20 +# Caricamento istantaneo su APU Phoenix (780M) +PARAMETER num_gpu 100 + +# --- SYSTEM PROMPT (Sacchi Utility Persona) --- +SYSTEM """ +Agisci come un micro-agente di monitoraggio e automazione per sistemi Linux. +Opera secondo l'approccio Spec-Driven: +1. Analisi: Identifica i punti chiave dei dati prima di rispondere. +2. Precisione: Segui le 3 regole di Sacchi: safety first, little often, double check. +3. Git: Se generi descrizioni, usa i Conventional Commits. +4. Changelog: Standard Common Changelog. +5. Vision: Analizza screenshot di log o terminali con approccio diagnostico. +Rispondi in modo estremamente sintetico, tecnico e diretto. +""" diff --git a/qwen3.5:2b/Modelfile-Qwen3.5-2B-256k b/qwen3.5:2b/Modelfile-Qwen3.5-2B-256k new file mode 100644 index 0000000..ec81b1a --- /dev/null +++ b/qwen3.5:2b/Modelfile-Qwen3.5-2B-256k @@ -0,0 +1,14 @@ +FROM qwen3.5:2b + +# --- PARAMETERS (Precision & Large Context) --- +# Forza la context window a 256k (262144 token) +PARAMETER num_ctx 262144 +# Temperatura bilanciata per compiti tecnici (0.7) +PARAMETER temperature 0.7 +# Presenza ridotta per evitare allucinazioni in output lunghi +PARAMETER presence_penalty 1.1 +PARAMETER top_p 0.95 +PARAMETER top_k 20 +# Caricamento completo su APU Phoenix (780M) +PARAMETER num_gpu 100 + diff --git a/qwen3.5:2b/Modelfile-Qwen3.5-2B-256k.prompt b/qwen3.5:2b/Modelfile-Qwen3.5-2B-256k.prompt new file mode 100644 index 0000000..31dc1e6 --- /dev/null +++ b/qwen3.5:2b/Modelfile-Qwen3.5-2B-256k.prompt @@ -0,0 +1,26 @@ +FROM qwen3.5:2b + +# --- PARAMETERS (Precision & Large Context) --- +# Forza la context window a 256k (262144 token) +PARAMETER num_ctx 262144 +# Temperatura bilanciata per compiti tecnici (0.7) +PARAMETER temperature 0.7 +# Presenza ridotta per evitare allucinazioni in output lunghi +PARAMETER presence_penalty 1.1 +PARAMETER top_p 0.95 +PARAMETER top_k 20 +# Caricamento completo su APU Phoenix (780M) +PARAMETER num_gpu 100 + +# --- SYSTEM PROMPT (Sacchi Workflow) --- +SYSTEM """ +Agisci come Senior Full Stack Developer e Sistemista Linux. +Il tuo approccio è rigorosamente Spec-Driven: +1. Analisi: Definisci le specifiche tecniche prima di ogni implementazione. +2. Sviluppo: Segui il TDD (test prima della logica). +3. Sicurezza: Rispetta le 3 regole di Sacchi: safety first, little often, double check. +4. Git: Messaggi in formato Conventional Commits. +5. Documentazione: Standard Common Changelog. +6. Vision & Thinking: Usa il ragionamento profondo per analizzare log e architetture. +Rispondi in modo asciutto, tecnico e diretto. +""" diff --git a/qwen3.5:4b/Modelfile-Qwen3.5-4B-256k b/qwen3.5:4b/Modelfile-Qwen3.5-4B-256k new file mode 100644 index 0000000..1a789ed --- /dev/null +++ b/qwen3.5:4b/Modelfile-Qwen3.5-4B-256k @@ -0,0 +1,14 @@ +FROM qwen3.5:4b + +# --- PARAMETERS (Efficiency & Context) --- +# Forza la context window a 256k (262144 token) +PARAMETER num_ctx 262144 +# Temperatura bilanciata (0.7 per un buon trade-off tra logica e fluidità) +PARAMETER temperature 0.7 +# Ottimizzazione per evitare frammentazione del codice (ridotta rispetto al default 1.5) +PARAMETER presence_penalty 1.1 +PARAMETER top_p 0.95 +PARAMETER top_k 20 +# Sfrutta appieno l'APU Phoenix (780M) +PARAMETER num_gpu 100 + diff --git a/qwen3.5:4b/Modelfile-Qwen3.5-4B-256k.prompt b/qwen3.5:4b/Modelfile-Qwen3.5-4B-256k.prompt new file mode 100644 index 0000000..c420967 --- /dev/null +++ b/qwen3.5:4b/Modelfile-Qwen3.5-4B-256k.prompt @@ -0,0 +1,26 @@ +FROM qwen3.5:4b + +# --- PARAMETERS (Efficiency & Context) --- +# Forza la context window a 256k (262144 token) +PARAMETER num_ctx 262144 +# Temperatura bilanciata (0.7 per un buon trade-off tra logica e fluidità) +PARAMETER temperature 0.7 +# Ottimizzazione per evitare frammentazione del codice (ridotta rispetto al default 1.5) +PARAMETER presence_penalty 1.1 +PARAMETER top_p 0.95 +PARAMETER top_k 20 +# Sfrutta appieno l'APU Phoenix (780M) +PARAMETER num_gpu 100 + +# --- SYSTEM PROMPT (Sacchi Dev Workflow) --- +SYSTEM """ +Agisci come Senior Full Stack Developer e Sistemista Linux esperto. +Segui rigorosamente l'approccio Spec-Driven: +1. Analisi: Definisci le specifiche tecniche prima di ogni blocco di codice. +2. Sviluppo: Applica il TDD (test prima della logica). +3. Sicurezza: Rispetta le 3 regole di Sacchi: safety first, little often, double check. +4. Git: Usa Conventional Commits (feat, fix, refactor, etc.). +5. Documentazione: Standard Common Changelog. +6. Vision & Thinking: Usa il ragionamento profondo per analizzare log, grafici o architetture. +Rispondi in modo asciutto, tecnico e sintetico. +""" diff --git a/qwen3.5:9b/Modelfile-Qwen3.5-9b-256k b/qwen3.5:9b/Modelfile-Qwen3.5-9b-256k new file mode 100644 index 0000000..28b4058 --- /dev/null +++ b/qwen3.5:9b/Modelfile-Qwen3.5-9b-256k @@ -0,0 +1,14 @@ +FROM qwen3.5:9b + +# --- PARAMETERS (Spec-Driven Context & Stability) --- +# Forza la context window a 256k (262144 token) +PARAMETER num_ctx 262144 +# Temperatura bilanciata (0.7 è ideale per mantenere logica e creatività nel coding) +PARAMETER temperature 0.7 +# Ottimizzazione per evitare ripetizioni su contesti lunghi +PARAMETER presence_penalty 1.1 +PARAMETER top_p 0.95 +PARAMETER top_k 20 +# Forza l'uso completo della iGPU Phoenix +PARAMETER num_gpu 100 + diff --git a/qwen3.5:9b/Modelfile-Qwen3.5-9b-256k.prompt b/qwen3.5:9b/Modelfile-Qwen3.5-9b-256k.prompt new file mode 100644 index 0000000..13a5c63 --- /dev/null +++ b/qwen3.5:9b/Modelfile-Qwen3.5-9b-256k.prompt @@ -0,0 +1,26 @@ +FROM qwen3.5:9b + +# --- PARAMETERS (Spec-Driven Context & Stability) --- +# Forza la context window a 256k (262144 token) +PARAMETER num_ctx 262144 +# Temperatura bilanciata (0.7 è ideale per mantenere logica e creatività nel coding) +PARAMETER temperature 0.7 +# Ottimizzazione per evitare ripetizioni su contesti lunghi +PARAMETER presence_penalty 1.1 +PARAMETER top_p 0.95 +PARAMETER top_k 20 +# Forza l'uso completo della iGPU Phoenix +PARAMETER num_gpu 100 + +# --- SYSTEM PROMPT (Sacchi Professional Workflow) --- +SYSTEM """ +Agisci come Senior Full Stack Developer e Sistemista Linux esperto. +Il tuo workflow è rigorosamente Spec-Driven: +1. Analisi: Prima di scrivere codice, definisci le specifiche tecniche. +2. Sviluppo: Segui il TDD, scrivendo i test prima della logica applicativa. +3. Sicurezza: Applica le 3 regole di Sacchi: safety first, little often, double check. +4. Git: Messaggi in formato Conventional Commits (feat, fix, chore, etc.). +5. Changelog: Aggiorna la documentazione secondo lo standard Common Changelog. +6. Vision: Se ricevi immagini o diagrammi, analizzali con approccio ingegneristico. +Rispondi in modo diretto, tecnico e semplice, senza preamboli inutili. +"""