Il 72% degli IT leader mondiali dichiara che la mancanza di infrastruttura dati in tempo reale blocca la scalabilità dell’AI nelle proprie organizzazioni. È il dato principale del 2026 Data Streaming Report di Confluent, condotto su 4.625 responsabili IT in 14 Paesi, giunto al quinto anno consecutivo: un osservatorio longitudinale che permette di leggere le tendenze nel tempo, non un’istantanea isolata.
Questo numero rovescia la narrativa che ha dominato il discorso enterprise sull’AI negli ultimi due anni. La conversazione pubblica si è concentrata su budget, accesso ai modelli, competenze interne. Il report di Confluent sposta il problema a monte: la vera barriera è il carburante, non il modello. E il carburante, nelle architetture enterprise tipiche, arriva sporco, frammentato e in ritardo.
Solo il 32% ha agenti AI in produzione: il collo di bottiglia è nei dati.
Solo il 32% degli IT leader interpellati ha agenti AI effettivamente in produzione. Non in sperimentazione, non in pilota: in produzione, con utenti reali e processi operativi dipendenti. Il 66% di chi ancora non ci è arrivato cita esplicitamente infrastruttura dati e qualità dati come barriera principale all’adozione agentica. Come emerge da analisi precedenti, i progetti AI finiscono in rosso secondo Gartner proprio quando il gap tra promessa del modello e qualità dell’input non viene affrontato in fase progettuale.
Il report identifica tre problemi ricorrenti che si presentano insieme, non in sequenza. Il primo è l’elaborazione insufficiente dei dati in tempo reale, citata dal 72% del campione. Il secondo è l’incertezza su tracciabilità dei dati, aggiornamento tempestivo e qualità complessiva, segnalata dal 66%. Il terzo è la frammentazione dell’ownership sui dati, che riguarda il 65% degli intervistati. Tre numeri ravvicinati, tre sintomi dello stesso problema strutturale: l’infrastruttura dati enterprise è stata costruita per la reportistica periodica, non per l’inferenza continua.
Buttare benzina su un motore senza olio: così funziona l’AI senza dati in tempo reale
Shaun Clowes, Chief Product Officer di Confluent (ora parte di IBM), sintetizza la situazione con una chiarezza che raramente si trova nei comunicati aziendali: “La maggior parte delle organizzazioni non ha un problema di investimenti AI, ha un problema di dati.” L’infrastruttura esistente, aggiunge, “non era progettata per l’intelligenza continua”. È una distinzione che vale la pena tenere ferma: un sistema pensato per elaborare dati in lotti periodici non diventa adatto agli agenti AI aggiungendo un layer di orchestrazione sopra. La struttura sottostante rimane quella che è.
Il problema della tracciabilità dei dati merita attenzione separata. Un agente AI che deve prendere decisioni operative ha bisogno di sapere non solo cosa dicono i dati, ma quando sono stati prodotti, da quale sistema, attraverso quale catena di trasformazioni. Senza questa visibilità, l’agente ragiona su informazioni di cui non conosce l’affidabilità. È un rischio operativo, non solo tecnico: una decisione presa su dati obsoleti o di provenienza incerta può avere conseguenze concrete su processi di business, approvvigionamento, customer experience. Come spiega un’analisi sull’AI agentica che comincia dai dati, la qualità dell’output agentico è vincolata alla qualità dell’input strutturale molto più di quanto i vendor di modelli tendano ad ammettere.
L’infrastruttura dati non era progettata per l’intelligenza continua.
La frammentazione dell’ownership aggiunge un livello di complessità organizzativa che si sovrappone a quella tecnica. In molte aziende i dati rilevanti per un caso d’uso AI attraversano tre o quattro domini diversi, ciascuno con il proprio responsabile, le proprie policy di accesso, i propri cicli di aggiornamento. Coordinare questa frammentazione è un lavoro di governance che precede qualsiasi decisione tecnologica. Chi salta questa fase e installa direttamente gli agenti si trova a gestire output incoerenti senza strumenti per diagnosticare perché. È esattamente il profilo di errore che emerge quando i dati sono spazzatura anche in assenza di consapevolezza interna che lo siano.
Il dato sul data streaming è forse quello che più sorprende. L’88% degli IT leader interpellati considera le piattaforme di data streaming una priorità chiave, superando AI e ML all’82%. Non è un risultato scontato, considerando che la conversazione dominante nel settore continua a essere sui modelli, non sulle infrastrutture di dati. Significa che chi lavora sul campo ha già aggiornato le proprie priorità, anche se la comunicazione esterna dell’industria non lo ha ancora riflesso pienamente. Il 94% afferma che il data streaming aumenta l’impatto degli investimenti AI, e l’80% lo considera una priorità di business primaria per l’uso di dati enterprise in sistemi AI-based. TechRadar e HPCwire/BigDataWire sottolineano entrambi come questi numeri segnalino un cambio di maturità nella lettura del problema, non una semplice preferenza tecnologica.
Esiste poi la questione dei sistemi sorgente. In molte architetture enterprise i dati operativi più critici vivono in ERP e gestionali che espongono le informazioni con interfacce progettate per la consultazione umana, non per l’estrazione continua da parte di macchine. L’agente AI che interroga questi sistemi lavora su esportazioni periodiche, spesso ritardate e parziali, non su dati live. Come emerge da un’analisi specifica, i dati sono tuoi ma non puoi usarli è una condizione strutturale che richiede intervento architetturale, non configurazione del modello. Anche il RAG come infrastruttura aziendale richiede che i documenti recuperati siano aggiornati, indicizzati correttamente e con provenienza verificabile: condizioni che la maggior parte delle organizzazioni non soddisfa al momento dell’adozione.
Il ciclo di feedback che si innesca in produzione è difficile da interrompere. Un agente che ragiona su dati obsoleti produce raccomandazioni imprecise; quelle raccomandazioni alimentano decisioni operative; le decisioni errate generano nuovi dati distorti che rientrano nel sistema. L’infrastruttura dati non è un problema a monte da risolvere una volta: è una condizione continuativa che richiede monitoraggio attivo, audit periodici e ownership chiara su ogni flusso. Chi progetta un sistema agentico senza definire questi meccanismi di qualità dati in ingresso sta costruendo un amplificatore di errori, non uno strumento decisionale.
Sulla sequenza degli investimenti, la posizione è netta. La pressione del mercato e dei board spinge verso il lancio rapido degli agenti, con l’ipotesi implicita che i problemi di dati si risolvano strada facendo. Questa ipotesi è sbagliata, e il report di Confluent lo documenta su scala globale. I problemi di dati non si risolvono in produzione: si amplificano, perché ogni output errato dell’agente diventa potenzialmente input per una decisione operativa successiva. Un agente AI va governato prima di accenderlo, e la governance comincia dall’audit dei sistemi sorgente, non dalla scelta del modello.
Chi sta pianificando un’adozione agentica nel 2026 ha davanti un’agenda precisa. Prima: mappare i sistemi sorgente e verificare quali dati sono disponibili in tempo reale e quali no. Secondo: identificare chi possiede ogni flusso di dati rilevante e costruire un modello di governance condiviso. Terzo: verificare la tracciabilità dei dati lungo tutta la catena, dalla produzione all’integrazione nel contesto dell’agente. Solo dopo questi tre passaggi la messa in produzione degli agenti ha fondamenta su cui reggere.
La visione esiste. Il punto è che viene applicata su un’infrastruttura non progettata per supportarla. Confluent ha un interesse diretto nel promuovere questa lettura del problema, essendo una piattaforma di data streaming. Ma il dato del 72% su un campione di 4.625 IT leader in 14 Paesi, al quinto anno consecutivo di rilevazione, non è un artefatto del metodo: è una misura della distanza tra dove le organizzazioni vogliono essere con l’AI e dove sono effettivamente con i loro dati.
Dagli agenti AI personalizzati alla formazione.
C’è molto che possiamo fare insieme.
#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
Davide Greco
Source link



