Anche l’Italia vuole il suo LLM, sono in cinque a provarci


L’ecosistema dei modelli linguistici sviluppati in Italia ha smesso di essere una curiosità accademica e oggi conta almeno cinque attori operativi. Sapienza, Cineca, Domyn (ex iGenius), Almawave, Fastweb e altri gruppi industriali stanno costruendo modelli pretrained direttamente sulla lingua italiana, non come fine-tuning di basi anglofone. L’obiettivo è una sovranità linguistica e tecnologica che il cloud globale non garantisce, e la finestra di mercato per provarci si sta restringendo.

Il tema interessa chi gestisce procurement AI in azienda per due ragioni concrete. I modelli generalisti di OpenAI, Anthropic e Google sono ottimizzati su corpus prevalentemente inglesi. Le sfumature giuridiche, il lessico contrattuale, i contesti normativi locali, la struttura del linguaggio amministrativo italiano vengono trattati come variazioni minori dell’inglese, con perdite di accuratezza misurabili sui task verticali. Un LLM addestrato direttamente sull’italiano restituisce risposte più vicine alla realtà operativa di chi lavora qui, soprattutto su documenti legali, contratti, atti amministrativi e procedure tecniche.




L’altro motivo è il quadro normativo. Tom’s Hardware ha già raccontato che l’AI Act europeo impone vincoli stringenti sui sistemi ad alto rischio, e ospitare modelli sovranamente europei semplifica la conformità documentale, riduce il rischio di trasferimento extra-UE dei dati personali e abbatte le frizioni con i Data Protection Officer aziendali.

I cinque progetti da conoscere davvero

I principali nomi attivi oggi sono cinque, ognuno con un posizionamento diverso. La mappatura non è esaustiva ma copre i casi più maturi e quelli con maggiori prospettive di uso enterprise.

  1. Minerva della Sapienza di Roma, sviluppato dal gruppo NLP di Roberto Navigli in collaborazione con FAIR sull’infrastruttura Cineca-Leonardo. È il primo LLM addestrato da zero in italiano, pubblicato come famiglia di modelli open con licenze permissive. Le dimensioni vanno da 350 milioni a 7 miliardi di parametri, e i benchmark sul corpus italiano superano i concorrenti aperti di dimensioni equivalenti;
  2. Italia-10B di Domyn (ex iGenius), pensato per servizi finanziari, pubblica amministrazione e industria pesante, disponibile anche su Nvidia NIM per integrazione enterprise plug-and-play. La finestra di contesto da 16k token e l’addestramento su un mix di italiano e dati di settore regolato lo rendono adatto a workflow documentali su atti, sentenze, normative;
  3. Colosseum-355B, sempre di Domyn, modello molto più grande pensato per casi d’uso che richiedono ragionamento complesso o contesti molto lunghi. È in produzione su clienti enterprise in settori regolati con esigenze di on-premise puro;
  4. Velvet di Almawave, famiglia di modelli con attenzione specifica alle lingue europee, GDPR enterprise e architetture multilingua. Il posizionamento commerciale punta esplicitamente alla PA e ai contact center;
  5. Modelli minori e verticali finanziati da Fastweb, atenei e consorzi pubblici PNRR. Ancora in fase prototipale o early access, ma già operativi per task specifici (legal, sanità, customer service in italiano).

Cinque progetti, una sola lingua. Per la prima volta l’italiano è il dato, non la traduzione.

Quando un LLM italiano batte davvero il globale

La domanda pratica per chi gestisce procurement AI è capire quando l’alternativa locale supera il modello globale e quando invece resta inferiore. Tre casi concreti rendono il confronto sensato.

Settori regolati con data residency UE obbligatoria. Banche, assicurazioni e pubblica amministrazione hanno vincoli espliciti di tenere i dati sul territorio europeo, e nei casi più sensibili sul territorio nazionale. Italia-10B e Velvet, ospitabili on-premise o in cloud sovrani europei, eliminano la frizione contrattuale con i grandi provider USA, accorciano il time-to-market dei progetti e riducono il rischio sanzionatorio. Tom’s Hardware ha già raccontato la consolidazione dell’AI sovrana europea con l’acquisizione di Aleph Alpha da parte di Cohere, segnale che il mercato si sta strutturando velocemente.

Compiti dominati dalla lingua italiana. Estrazione di informazioni da contratti notarili, analisi di sentenze, classificazione di documenti della PA, sintesi di articoli di stampa italiana, supporto a contact center in lingua. Su questi task un modello addestrato direttamente sul corpus italiano resta competitivo anche con dimensioni inferiori a GPT-5 o Claude. Tom’s Hardware ha già mostrato che il mito che più grandi sia meglio non regge sui task verticali: per molti casi d’uso, modelli specializzati più piccoli battono i giganti generalisti.

Budget limitato e infrastruttura on-premise. I 10 miliardi di parametri di Italia-10B girano su GPU enterprise standard, mentre GPT-5 o Claude richiedono API a consumo che scalano linearmente coi token. Per processi documentali ricorrenti, l’on-premise diventa più economico oltre una certa soglia di volume mensile, tipicamente alcune decine di milioni di token. Tom’s Hardware ha già indicato come strutturare un programma di adozione LLM in azienda in sei passi in cui la scelta della modalità di hosting è centrale.

La sovranità linguistica non è patriottismo: è governance dei dati e dei costi.

Cosa manca ancora alla scena italiana

Il gap rispetto ai modelli statunitensi resta sostanziale su due fronti precisi. Capacità agentica e tool use: la generazione di codice complessa, la chiamata di funzioni esterne in catene multi-step, l’integrazione con browser, terminali e ambienti sandbox sono ancora dominio dei modelli grandi addestrati su flussi misti. Gli LLM italiani per ora sono assistenti specializzati su task linguistico-documentali, non agenti generalisti per workflow autonomi. Tom’s Hardware ha già mostrato come l’agente AI sia fatto di percorsi, non di forme, e i modelli italiani non hanno ancora la traiettoria di prove necessaria a competere come agenti.

Il secondo fronte è la continuità di finanziamento. Sapienza, Cineca e gli atenei italiani lavorano con fondi pubblici PNRR e progetti europei Horizon, che hanno orizzonti finiti. Senza un canale di revenue chiaro o un’integrazione industriale (come quella di Domyn con Nvidia, o come quella che Almawave cerca con clienti enterprise paganti), la sostenibilità di questi modelli oltre il 2027 non è garantita. L’investimento iniziale produce modelli, ma senza un mercato che li paga si esauriscono i fondi per gli aggiornamenti successivi, ed è esattamente lì che si gioca la differenza tra un esperimento accademico e una piattaforma di lungo periodo.

Il quadro strategico e la finestra in chiusura

La situazione europea evolve rapidamente. Mistral francese ha consolidato il proprio posizionamento e raccoglie capitali. Cohere ha comprato Aleph Alpha in Germania. I governi europei iniziano a riconoscere che dipendere da fornitori americani per le interfacce linguistiche di banche, ospedali e pubblica amministrazione è un rischio strategico che si valuta in decenni, non in trimestri. L’Italia, attraverso il piano nazionale AI e gli investimenti Cineca, ha messo sul tavolo risorse importanti, ma il rischio di disperdere gli sforzi su troppi progetti paralleli senza coordinamento industriale resta alto.

Tom’s Hardware ha già segnalato che l’Italia (e l’Europa) è in affitto e ora ha paura dello sfratto: per chi acquista AI in azienda, conoscere i progetti italiani non è questione di tifo, è questione di avere alternative reali quando la dipendenza da OpenAI o Anthropic diventerà troppo costosa o vincolata da clausole di prezzo via via meno favorevoli.

Si potrebbe obiettare che inseguire OpenAI sul terreno generalista è una battaglia persa in partenza, e che l’Italia farebbe meglio a comprare API americane invece di sviluppare modelli propri. L’argomento ha solidità sul puro confronto di capability, ma ignora il valore strategico della sovranità tecnologica: dipendere al 100% da fornitori esteri quotati su mercati esteri per le interfacce linguistiche di servizi essenziali è una vulnerabilità industriale che è il quadro normativo europeo a riconoscere esplicitamente. La mappa di oggi non è vincente in assoluto, ma è il punto di partenza necessario, e va sostenuta con commesse pubbliche e private prima che la finestra di mercato si chiuda.


#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
 Davide Greco

Source link

Di