Il cloud è ancora protagonista, ma con gli agenti cambia tutto


L’AWS Summit di Milano del 28 maggio ha riempito Rho Fiera con circa cinquemila partecipanti e una scaletta dominata dagli agenti AI in ogni verticale: retail, automotive, sanità, accessibilità, finanza. Sul palco e nelle aree demo si è visto come Amazon stia spingendo Bedrock e AgentCore verso una funzione precisa, quella di infrastruttura per agenti enterprise, mentre i partner italiani raccontavano dove l’AI funziona davvero in produzione e dove invece resta più demo che soluzione.

Il cloud, dato per scontato dopo quindici anni di adozione, sta tornando al centro perché i progetti AI senza cloud non si fanno, e perché il modello agentico sposta il baricentro economico da chi vende l’inferenza a chi vende perimetro, governance e orchestrazione. Allo stesso tempo, lo abbiamo detto molte volte, le soluzioni ibride sono sempre più comuni, come soluzioni concrete ai problemi di gestione dei dati e costi di esecuzione dei carichi. 




Ma il cloud, appunto, resta l’unica vera opzione in molti scenari. E le opzioni per chi cerca un fornitore sono limitate. Capire come si sta riposizionando AWS aiuta a leggere anche cosa stanno preparando i suoi diretti concorrenti.

Quando il modello è solo l’1% del codice

Una battuta passata quasi inosservata in un panel cattura bene il momento. Il leak del codice sorgente di Claude Code aveva mostrato che solo l’1% circa del codebase erano chiamate di inferenza all’LLM, mentre il resto era harness, perimetro, governance, orchestrazione. È una metrica spia: il valore non sta più nell’LLM, ma nel software deterministico che lo circonda e lo contiene. Sul palco AWS lo dicono in modo più morbido (Bedrock AgentCore “gestisce memoria persistente e contesto operativo durante le interazioni”), ma la sostanza è quella.

Se l’inferenza è una componente marginale, i fornitori di modelli diventano fungibili e il margine si sposta sulla piattaforma agentica che li orchestra. Bedrock oggi supporta 105 modelli da 17 provider (Anthropic, OpenAI, Mistral, Meta, AI21, Cohere e gli stessi Nova di Amazon), e il discorso commerciale si è spostato dal modello al runtime. Per AWS è una buona notizia, per i vendor che hanno scommesso solo sul modello molto meno.

Il cloud non è più la storia, è la condizione preliminare per qualunque progetto AI serio.

Agenti in produzione

Reply ha spiegato che gli agenti AI portano alla chiusura del ticket nel 60% dei casi nei perimetri ben definiti del conversational AI presso istituzioni finanziarie, e che il vero salto in produttività si vede nello sviluppo software, con casi di clienti che hanno recuperato l’equivalente di vent’anni di lavoro tecnico in tempi rapidi. Tre i casi d’uso maturi citati: conversational AI in perimetri stretti, generazione codice e knowledge expansion. Molti altri casi d’uso, invece, non sono ancora usciti dalla fase pilota; ma i tempi sono ormai maturi. 

Il dettaglio del perimetro stretto è la differenza decisiva. Quando il dominio è definito e i task sono ricorrenti, l’agente regge; appena si allarga, si sbriciola. Per le aziende è la prima indicazione operativa: partire da processi ad alta densità e basso ambiguità prima di tentare casi orizzontali. Dopo anni di pilotite, per citare Giulia Gasparini, Country Manager AWS Italia, bisogna passare al livello successivo. E potrà farcela solo  chi ha imparato a circoscrivere.

Il perimetro stretto fa la differenza tra un agente che funziona e una demo che invecchia.

I casi italiani: A2A, Satispay, Latitudo 40, ENS, ADR

Le storie raccontate dai clienti italiani danno la misura concreta di cosa significhi “AI in produzione” fuori dal marketing.

A2A ha sviluppato con il proprio team di venture building un sistema di tracciamento dei flussi di materia in ingresso agli impianti di trattamento rifiuti, con computer vision e modelli custom per riconoscere stream eterogenei: l’algoritmo è oggi al 85% di accuratezza, in formazione continua, e diventa una leva per i bilanci di sostenibilità certificabili dei clienti industriali.

Satispay ha portato Cloudfront e WAF nativi per filtrare il traffico legittimo da quello fraudolento su sei milioni di utenti e quasi mezzo milione di esercenti. Latitudo 40 ha mostrato come elaborare terabyte di dati satellitari ESA Sentinel già residenti su Amazon S3, con un’accelerazione del 70% nei tempi di elaborazione, per uscire dalla nicchia tecnica e portare informazioni leggibili alle smart city e alle utility.

Ernesto ed Ente Nazionale Sordi hanno presentato una piattaforma di traduzione automatica italiano-lingua dei segni verticalizzata sui trasporti, oggi installata a Roma Termini, Milano Centrale e all’aeroporto di Cagliari, con l’obiettivo di scalare a quattordici lingue dei segni europee. Aeroporti di Roma gestisce oltre diecimila conversazioni quotidiane con il proprio assistente WhatsApp basato su Bedrock, con rating 4,6 su 5 e capacità di scalare automaticamente del 75% durante le allerte meteo. Sono esempi che hanno una caratteristica comune: l’AI è una componente di un’esperienza più ampia, non il prodotto.

Le due cose che fanno discutere

Restano almeno due punti che chi è uscito da Rho Fiera dovrebbe tenere a mente. Il primo è il rapporto sull’adozione AI presentato da AWS: il 40% delle imprese italiane usa l’AI con un incremento del 33% sull’anno precedente, ma il gap con il resto d’Europa rischia di allargarsi anziché chiudersi. È un dato che AWS amplifica perché vende cloud, ma che resta vero anche tenendo conto del bias commerciale: l’Italia parte da una posizione di spesa IT su PIL più bassa della media europea, e la transizione AI rischia di replicare il ritardo strutturale già accumulato sul cloud nel decennio scorso.

Il secondo è il lock-in di nuova generazione. Bedrock AgentCore, Kiro, Strands, Nova: l’integrazione tra runtime agentico e servizi nativi AWS è ottima dal punto di vista tecnico, ma costruisce dipendenze profonde che vanno oltre il calcolo. Chi sceglie di scrivere agenti sopra AgentCore avrà difficoltà a portarli altrove, perché la logica di memoria persistente, gli skill e la chain of thought sono incollati a primitive specifiche del fornitore. Il lock-in si è spostato dall’IaaS al runtime agentico, e il costo di switching si paga al primo cambio di policy commerciale del vendor.

Il lock-in si è spostato dall’IaaS al runtime agentico e nessuno lo racconta apertamente.

La lettura politica del Summit

Anche guardando il quadro con simpatia per AWS, due segnali politici emergono dal Summit. Il primo è che AWS si sta posizionando come infrastruttura sovrana in chiave europea, con il European Sovereign Cloud che ospiterà la piattaforma di partner come Nutanix in regime di confinamento dei dati nell’Unione Europea. È una mossa difensiva contro il rischio normativo, costruita con sufficiente anticipo da svuotare l’argomento della concorrenza europea ancora prima che decolli.

Il secondo è che il discorso sulla “democratizzazione dell’AI” funziona meglio quando il vendor è già egemonico. Un’azienda che usa S3, Bedrock e Nova ha un percorso accelerato, vero, ma costruisce il proprio prodotto sopra una piattaforma che potrà cambiare regole, prezzi e disponibilità senza che il cliente possa negoziare. È il paradosso degli ecosistemi aperti finché ti convengono, chiusi quando ti servono.

La lezione di metodo è semplice: il cloud è la base, gli agenti sono la frontiera, ma dual vendor strategy e portabilità dei dati restano il vero bene da difendere, soprattutto quando ogni vendor propone runtime proprietari.


#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
 Valerio Porcu

Source link

Di