L’inversione a U: prima spingevano l’AI, ora la razionano


Il “tokenmaxxing” — massimizzare il consumo di token come indicatore di adozione AI — ha avuto il suo apice tra la fine del 2024 e i primi mesi del 2026. Amazon aveva costruito una leaderboard interna che classificava i dipendenti per numero di token consumati, spingendo implicitamente all’uso intensivo degli strumenti AI. Accenture aveva alzato la posta ancora di più: chi non adottava l’AI rischiava di perdere le promozioni.

La logica era semplice: più token consumi, più usi l’AI, più sei produttivo. L’assunzione — che il consumo di token fosse un proxy affidabile di produttività — si è rivelata sbagliata. I token consumano, i costi crescono, i risultati misurabili non crescono di pari passo.




Amazon ha già cancellato la leaderboard. Il gesto è simbolico ma racconta un cambio di postura reale: il tokenmaxxing come metrica di successo è finito.

Incentivavano il consumo AI. Poi sono arrivate le bollette.

Cosa è successo in Accenture: il leak audio che racconta tutto

Il caso Accenture è il più documentato. 404 Media ha pubblicato un audio interno in cui Justice Kwak, responsabile della strategia AI agentica dell’azienda, si rivolge ai colleghi con una chiarezza insolita per una comunicazione interna: “Stiamo raggiungendo un punto di svolta in cui l’AI diventa materiale per la struttura dei costi.”

La frase chiave è quella successiva: “La spesa è imprevedibile e i dirigenti — CFO, COO, CIO — chiedono se stiamo ottenendo valore.” Non è un segnale di allarme estemporaneo: è l’ammissione che il modello di incentivazione aggressiva ha prodotto una bolletta che nessun dirigente sa giustificare.

Il paradosso è evidente. Pochi mesi prima, Accenture comunicava ai dipendenti che l’adozione AI era collegata alle promozioni. Ora il messaggio è opposto: razionare, misurare, giustificare. Il pendolo ha oscillato da “usate più AI possibile” a “dobbiamo capire se stiamo spendendo bene” senza passare per una fase intermedia di misurazione seria del valore. Dopo un crollo in borsa del 20% legato alle aspettative sull’AI, l’azienda deve dimostrare agli investitori che la trasformazione digitale genera profitti reali, non solo token consumati.

Convertire PDF in slide: il simbolo dello spreco di token

Kwak, nell’audio interno, identifica il problema con precisione chirurgica: i token vengono sprecati su compiti banali che i dipendenti non tecnici delegano all’AI senza nessuna valutazione del costo. L’esempio emblematico è la conversione di PDF in presentazioni PowerPoint.

È un compito che chiunque potrebbe fare in pochi minuti, che un agente AI esegue automaticamente, e che consuma token in proporzione alla lunghezza del documento. Scalato su migliaia di dipendenti, diventa un costo operativo significativo senza nessun ritorno misurabile sulla produttività. L’AI viene usata perché è disponibile, non perché sia la soluzione più efficiente.

Questo pattern è strutturale: quando lo strumento è incluso nel piano aziendale, il costo sparisce dalla visibilità individuale e si accumula nel budget centralizzato. Il consumo di token è già un problema enorme per molte organizzazioni, che non sanno quanti strumenti AI usano i dipendenti né quanto costano complessivamente. La proliferazione di tool AI ha reso il problema ancora più opaco: ci sono abbonamenti personali non approvati, tool non tracciati dall’IT, costi che non compaiono nei budget ufficiali.

Convertire un PDF in slide costa token. Scalato su mille dipendenti, costa un bilancio.

Il caso Accenture non è isolato. Uber ha bruciato l’intero budget AI nei primi quattro mesi del 2026 e ha introdotto tetti mensili di spesa per strumento: 1.500 dollari per Cursor, 1.500 per Claude Code. Il budget era dimensionato per un anno intero.

Meta ha tagliato l’uso AI dei dipendenti secondo quanto riportato da The Information. I dettagli non sono pubblici, ma la direzione è inequivocabile: anche le aziende che producono AI stanno razionando il suo uso interno. Quando i produttori del bene cominciano a razionarne il consumo, il mercato riceve un segnale preciso sulla sostenibilità del modello corrente.

Le organizzazioni più avanzate, come Databricks, stanno introducendo soglie automatiche per utente con alert al raggiungimento del budget. Ma si tratta ancora di una minoranza. La maggior parte delle aziende che raziona lo fa in modo reattivo, non pianificato: arriva quando la bolletta supera una soglia di tolleranza, non come risultato di una strategia deliberata.

Il mercato reagisce: l’AI selloff del 23 giugno

Il 23 giugno 2026 i mercati finanziari hanno cominciato a prezzare i dubbi sul modello di business AI. I titoli dei produttori di chip di memoria, esposti alle aspettative di crescita infinita del consumo AI, hanno subito cali significativi.

Non è stato un crollo improvviso: è la correzione di aspettative costruite sull’assunzione che le aziende avrebbero continuato a spendere senza vincoli di ROI. I dati che emergono da Accenture, Uber e Amazon raccontano il contrario. Il mercato segue la realtà operativa delle aziende con un ritardo di qualche settimana: la realtà è già cambiata da mesi.

L’AI selloff non segnala la fine del mercato AI. Segnala la correzione del segmento consumption — chip di memoria, storage ad alta densità, infrastruttura per la domanda illimitata di token — quando diventa chiaro che la domanda non è illimitata. Le aziende stanno imponendo limiti. I mercati lo prezzano.

Il mercato credeva alla crescita infinita del consumo AI. Le aziende la stanno smentendo.

Razionare non basta: serve misurare il ROI per token consumato

La lezione del tokenmaxxing è quella che ogni ciclo tecnologico produce: la metrica sbagliata genera comportamenti sbagliati. Usare il consumo di token come indicatore di adozione AI è come usare le ore passate in riunione come indicatore di produttività. Si ottimizza la metrica, non il risultato.

Chi guida un’organizzazione deve porre oggi la domanda giusta: non “quanti token stiamo consumando” ma “a quale outcome arriviamo per token consumato”. Un agente che automatizza un processo di riconciliazione contabile che richiedeva quattro ore umane produce valore misurabile. Un dipendente che usa l’AI per convertire PDF in slide produce token consumati.

Le organizzazioni che stanno imponendo tetti di spesa stanno affrontando il problema in modo parziale. Razionare i token senza sapere quali task producono valore non è gestione: è taglio indiscriminato. Rischia di fermare gli usi ad alto valore mentre lascia intatto lo spreco distribuito su mille micro-task banali.

Il costo delle bollette AI crescerà ancora con l’adozione degli agenti, che consumano ordini di grandezza in più rispetto a una singola chat. La risposta matura non è il razionamento: è costruire la governance prima che la bolletta arrivi. Definire quali processi giustificano il consumo, misurare il costo per outcome, allocare budget per use case concreti — non per dipendente o per strumento.

Il tokenmaxxing è finito. Resta da vedere se le aziende che lo stanno abbandonando abbiano già una risposta strutturata, o stiano soltanto reagendo al costo.

Giulia Bianchi


#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
 Giulia Bianchi

Source link

Di