Le aziende stanno rallentando l’adozione dell’AI generativa per ragioni economiche. I numeri raccolti da TechXplore presso diverse fonti di settore segnalano un salto della scala dei costi: per un singolo ingegnere di Uber l’uso di Claude Code costa tra cinquecento e duemila dollari al mese, e la compagnia ha bruciato il proprio budget AI annuale da 3,4 miliardi di dollari in quattro mesi. Un consulente ha riferito il caso di un’azienda cliente arrivata a cinquecento milioni di dollari di spesa Claude Code in un solo mese, perché nessuno aveva impostato un tetto di consumo.
Finisce l’epoca dell’AI sussidiata, quella in cui i grandi laboratori bruciavano capitale degli investitori per offrire potenza di calcolo sotto costo, costruendo abitudini di utilizzo che ora vanno pagate al prezzo reale. La spesa globale in AI nel 2026 è prevista a 2.500 miliardi di dollari, con la sola infrastruttura a 401 miliardi, e Microsoft ha cancellato molte licenze Claude Code interne perché il conto era diventato superiore allo stipendio degli sviluppatori che lo usavano.
L’epoca dell’AI sotto costo è finita, ora arriva il prezzo vero.
Dal tokenmaxxing alla resa dei conti
Per due anni il messaggio dei vendor è stato che gli sviluppatori dovevano massimizzare l’uso dei token, perché ogni richiesta era una palestra di apprendimento e un vantaggio competitivo. Meta ha incoraggiato i propri ingegneri a fare proprio questo, salvo poi vedere il responsabile tecnologia dichiarare che non si dovrebbe usare l’AI tanto per usarla. La metafora del “tokenmaxxing” si è diffusa nelle redazioni quando ha smesso di essere una strategia e ha cominciato a essere un problema.
Uber ha raccontato pubblicamente che il proprio responsabile operations ha trovato sempre più difficile giustificare la spesa AI a fronte di guadagni di produttività non misurabili. Il salto da 31 al 63 per cento delle organizzazioni che dichiarano l’AI come voce critica della propria gestione FinOps, in un solo anno, dà la misura del problema. I carichi AI e ML rappresentano ora il 22 per cento dei costi cloud totali nelle aziende SaaS e IT, e in molti casi superano la spesa hardware tradizionale.
Tom’s Hardware aveva raccontato in settembre come questa storia replichi la dinamica del cloud di qualche anno fa, quando le aziende avevano scoperto a posteriori che la spesa variabile poteva esplodere senza preavviso. Allora la categoria FinOps è nata per gestire proprio quella sorpresa, oggi rinasce in versione AI con due anni di ritardo sulle abitudini di consumo già consolidate.
Senza tetti di spesa, l’AI diventa il nuovo cloud sovradimensionato.
Il problema non è il prezzo, è non sapere quanto vale
Sarebbe sbagliato leggere la notizia come “l’AI è troppo cara”. Il problema vero è che pochissime aziende sanno quanto vale ogni caso d’uso, e quindi non hanno modo di decidere se cinquecento dollari al mese per ingegnere sono pochi o tanti. Senza un KPI definito al primo giorno del pilot, ogni fattura è uno shock, e ogni rinnovo contrattuale diventa una trattativa al buio.
Il report MIT NANDA “GenAI Divide”, uscito a luglio 2025, aveva già documentato che il 95 per cento dei pilot enterprise non genera ROI misurabile, e che Gartner stima il 30-40 per cento dei pilot abbandonati. Non perché la tecnologia non funzioni, ma perché chi la introduce non ha costruito il sistema di misura prima di accendere la fattura. È il problema dei “trophy pilot” adottati per fare bella figura in consiglio di amministrazione, tipologia di adozione che esplode appunto quando arriva il conto.
La spinta verso modelli open-source, modelli più piccoli, modelli specializzati nasce da questa esigenza concreta. Diverse aziende stanno spostando i carichi meno critici su modelli locali o open-weight, tenendo i modelli di frontiera per i casi in cui il valore aggiunto è dimostrato. Il movimento è razionale, e replica quello che era successo nel cloud quando le aziende avevano scoperto di non poter mettere tutto su AWS senza distinzione: alcuni carichi tornano on-premise, altri vanno su provider più economici, altri restano sull’hyperscaler perché il caso d’uso lo giustifica.
Chi resta solo con la fattura
Il vero spartiacque dei prossimi dodici mesi sarà tra le aziende che hanno costruito metriche e quelle che hanno solo costruito abitudini. Le prime potranno rinegoziare i contratti con dati alla mano, dimostrare ai vendor quanto valore producono i loro casi d’uso, sostituire i fornitori che alzano troppo il prezzo. Le seconde si troveranno davanti a una scelta binaria: pagare quello che il fornitore chiede, oppure spegnere tutto e tornare al mondo precedente, con sviluppatori che hanno disimparato a programmare senza Claude e produttività che non si sa più ricostruire senza l’assistente.
I grandi laboratori sanno benissimo questo, e la loro strategia di prezzo ne è la dimostrazione. OpenAI e Anthropic stanno spingendo per diventare profittevoli in vista delle proprie quotazioni in borsa, e la fase di “intelligenza sussidiata” finanziata dagli investitori si chiude proprio mentre il mercato enterprise è agganciato. Il timing non è casuale, è il classico modello del software business in cui l’utente paga sopra il valore percepito una volta che la dipendenza è creata. Chi non ha negoziato un contratto pluriennale con prezzi bloccati ora paga la differenza.
Esiste un’obiezione plausibile da parte del decisore che si trova oggi davanti al problema, ed è la più diffusa: rallentare l’adozione AI significa restare indietro rispetto ai concorrenti che invece accelerano. L’obiezione è seria, ma la risposta è altrettanto netta. Accelerare senza misurare è il modo migliore per restare indietro davvero, perché si bruciano risorse senza costruire competenze interne e si crea dipendenza da fornitori che la prossima volta alzeranno ancora il prezzo. Chi rallenta oggi per costruire FinOps, KPI di caso d’uso, soglie di consumo per ingegnere, sarà nella posizione di accelerare bene domani.
La chiusura è meno drammatica di quanto la notizia suggerisca. Le aziende non stanno abbandonando l’AI, stanno entrando nella fase in cui devono dimostrare di sapere cosa farne. È la stessa transizione che il cloud ha vissuto tra il 2018 e il 2022, e il risultato finale è stato un mercato più maturo, con governance chiare, con clausole di prezzo più trasparenti, con responsabili IT che oggi sanno leggere una fattura AWS. Per l’AI il percorso sarà più rapido, perché la lezione del cloud è ancora fresca e i decisori che la stanno affrontando hanno già visto il film. Chi non lo ha visto, paga il biglietto due volte.
#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
Marco Ferretti
Source link

