LLM · Vision · Whisper · Audit log

Sviluppo piattaforme con assistenza AI in Laravel: LLM, vision, trascrizioni

Piattaforme dove l'AI fa il lavoro pesante — estrazione dati da documenti e foto, trascrizione audio, generazione di documenti strutturati, validazione automatica — mantenendo audit log immutabile e responsabilità sempre umana.

Cosa facciamo

Costruiamo piattaforme web che integrano LLM, vision AI e trascrizione audio per automatizzare i passaggi più costosi in tempo del lavoro umano: estrarre dati da documenti fotografati o caricati, trascrivere registrazioni audio, generare bozze di documenti strutturati, validare la completezza di un fascicolo rispetto a regole esterne.

Lavoriamo con il Laravel AI SDK ufficiale e un'architettura multi-provider (Anthropic Claude, OpenAI, modelli locali Ollama, Whisper per audio) astratta dietro un servizio unico: il codice di dominio non dipende mai dal provider specifico. Puoi cambiare fornitore, attivare un mix tra cloud e on-premise, o fare benchmarking, senza riscrivere la business logic.

Quando ha senso

  • Hai un workflow dove gli operatori spendono ore a compilare form da fonti già esistenti (foto, PDF, registrazioni) che l'AI potrebbe pre-compilare.
  • Devi produrre documenti strutturati ripetitivi (verbali, report, sintesi, contratti standard) partendo da materiali eterogenei.
  • Ti serve validazione automatica di un fascicolo rispetto a una checklist di regole (compliance, completezza, conformità procedurale).
  • I dati sono sensibili o regolamentati (sanità, PA, legale, finanza): vuoi opzione on-premise con modelli locali invece di cloud puro.
  • La responsabilità rimane umana: l'AI accelera, ma ogni output va revisionato e firmato da un operatore qualificato.

Cosa includiamo

  • Architettura multi-provider AI: Anthropic, OpenAI, modelli locali Ollama, Whisper per audio. Cambio provider via configurazione, senza toccare il codice di dominio.
  • Audit log immutabile di ogni chiamata AI: prompt, modello, costo, latenza, output, decisione finale dell'operatore (accettato / modificato / rifiutato). Indispensabile in contesti regolamentati.
  • Anti-hallucination: system prompt rigorosi che impongono "se il dato non è nei materiali, dichiara NON DETERMINABILE", confidence score per campo, source media reference. Niente invenzioni che possono finire in atti ufficiali.
  • Opzione on-premise: per dati sensibili, modelli locali (Ollama, Whisper self-hosted) eseguiti sull'infrastruttura del cliente. Niente API esterne, niente data retention di terze parti.
  • Vision AI per estrazione dati da foto e documenti scansionati (documenti d'identità, targhe, schermate, ricevute).
  • Trascrizione audio con Whisper (locale o API) per dettature, interviste, registrazioni di campo.
  • Generazione documenti PDF branded con Browsershot/Chromium headless: verbali, report, certificati.
  • Compliance Checker a regole estensibili: ogni regola ha riferimento normativo nel commento, output documentato per audit esterni.

Tecnologie usate

Laravel AI SDK Anthropic Claude OpenAI Ollama (locale) Whisper Filament Livewire Browsershot PDF

Domande frequenti

No. L'architettura è multi-provider per design: Anthropic Claude, OpenAI, modelli locali Ollama, Whisper per audio. Ogni capability (text, vision, transcription) può puntare a un provider diverso ed essere cambiata via configurazione, senza toccare il codice di business. Questo evita vendor lock-in e permette mix cloud + on-premise.
Solo se vuoi. Per dati regolamentati offriamo opzione on-premise con modelli locali (Ollama per LLM, Whisper self-hosted per audio): tutto resta sulla tua infrastruttura. Per casi meno sensibili usiamo le API commerciali con tier "zero data retention" attivato esplicitamente.
Mitighiamo il problema su tre livelli. (1) System prompt rigorosi che impongono "se l'informazione non è presente nei materiali, indica NON DETERMINABILE". (2) Per ogni campo estratto registriamo confidence score e media di provenienza. (3) Ogni output AI è una bozza che l'operatore qualificato deve esplicitamente accettare/modificare/rifiutare prima della firma. La responsabilità resta umana; l'AI accelera, non sostituisce.
Ogni chiamata AI è loggata in modo immutabile prima ancora di mostrare l'output: prompt hash, provider, modello, input, output, costo, latenza, decisione finale dell'operatore (timestamp + chi). Per progetti con valenza legale aggiungiamo hash chain (audit log non manomissibile). Questo audit trail è parte centrale del valore: a fronte di una contestazione hai la prova completa di cosa l'AI ha proposto e cosa l'operatore ha deciso.
Una fase di analisi (1-2 settimane) dove mappiamo il workflow attuale, identifichiamo i passaggi candidati ad assistenza AI, valutiamo i vincoli (privacy, normativa, on-premise vs cloud) e costruiamo un prototipo verificabile su materiali reali. Solo dopo la validazione del prototipo procediamo con l'integrazione nella piattaforma vera.
Gestione Cookie