8×8, fornitore di software quotato al Nasdaq nel mercato delle comunicazioni unificate e dei contact center, ammette a Wired che il consumo di token di Claude in produzione è “pretty crazy” e sta cambiando il modo in cui i manager guardano alla scommessa sull’intelligenza artificiale. L’azienda guidata da Samuel Wilson è tra le prime a integrare i modelli Anthropic via Agent SDK nei propri servizi di customer experience, e la voce di costo che emerge è una bolletta variabile, non una licenza piatta, e si gonfia ogni volta che un agente conversa con un cliente.
La spesa AI sta migrando dal capitolo “licenze” al capitolo “costo del calcolo variabile”, molto più simile al cloud che al software tradizionale. I CFO che hanno approvato i piani 2025-2026 ragionavano in logica SaaS, con un canone prevedibile per posto di lavoro; nel 2026 i listini dei modelli di punta sono raddoppiati e i flussi agentici consumano da cinque a trenta volte i token di una chat semplice. La scommessa AI raccontata ai board come investimento una tantum più licenza ricorrente non torna più.
▶” frameborder=”0″ allow=”accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture” allowfullscreen title=”Vedi il video”>
8×8 mette i numeri in chiaro, il margine si sposta
Nel trimestre Q1 FY26 i contratti dell’Intelligent Customer Assistant di 8×8 sono cresciuti del 75% anno su anno, e i ricavi a consumo (AI più CPaaS) del 60%, secondo i dati ufficiali della società. Sono numeri che entusiasmano gli analisti finanziari, ma il management 8×8 spiega a Wired la faccia nascosta della crescita: ogni conversazione gestita da un agente AI brucia token, e i token costano in proporzione alla complessità del compito. L’azienda ha appena annunciato AI Studio, una piattaforma multi-LLM che lascia ai clienti la scelta tra Claude, Gemini, Grok e ChatGPT, e ha integrato Claude via Agent SDK perché in molti scenari di assistenza Anthropic resta il modello di riferimento.
Il dirigente che pronuncia “pretty crazy” sta facendo una cosa rara nel mercato dei grandi clienti aziendali: esce dal copione celebrativo “abbiamo integrato l’AI e tutto va benissimo” e racconta il costo reale. È trasparenza che i board dovrebbero pretendere prima di approvare il prossimo round di investimento, e che oggi manca quasi sempre nei comunicati di partnership con Anthropic, OpenAI o Google. Anthropic stima che una conversazione di customer service media consumi circa 3.700 token, per un costo intorno a 37 dollari ogni 10.000 ticket, prima delle chiamate agli strumenti esterni. Quando l’agente diventa autonomo e svolge ricerche in autonomia, quel numero si moltiplica.
La voce di costo che i manager non avevano messo in budget
Lo schema 8×8 è lo stesso che ha già fatto saltare il bilancio AI di Uber. Tom’s Hardware ha raccontato come la piattaforma di mobilità abbia bruciato un anno di budget AI in quattro mesi, arrivando a 3,4 miliardi di consumo cassa su strumenti agentici con singoli ingegneri che spendevano tra 500 e 2.000 dollari al mese in Claude Code. La risposta dell’azienda è stata un tetto a 1.500 dollari per dipendente al mese, una decisione che il CFO ha dovuto comunicare ai team prodotto come misura non negoziabile. Quando l’AI diventa infrastruttura di lavoro quotidiana, la bolletta dell’inferenza assomiglia a quella elettrica più che a una sottoscrizione Microsoft 365.
Il budget AI è una spesa operativa (“OpEx”) variabile, cugina del cloud, non un capitolo software prevedibile a inizio anno. Cresce con l’uso, esplode quando si introducono flussi agentici autonomi, scende con prompt caching e lavorazione in batch ma solo se qualcuno in azienda ha competenza tecnica per ottimizzare. Le aziende che ora vedono il conto a fine fase gratuita stanno scoprendo che i pilota a costo zero erano una promozione commerciale, non un riferimento operativo. La promozione finisce, il calcolo continua a girare, qualcuno deve pagarlo.
Anthropic raddoppia il listino e cambia le regole
Anthropic ha raddoppiato il listino dei token con Fable 5 e Mythos 5, portando i nuovi modelli di punta a 10 dollari per milione di token in input e 50 in output, il doppio esatto di Opus 4.8. La giustificazione ufficiale parla di capacità di frontiera, ma l’editoriale di Tom’s Hardware ha argomentato che Fable 5 è 99% fuffa e serve a giustificare un riallineamento dei prezzi che la finanza della società richiedeva con urgenza. La narrazione del “modello migliore al doppio del prezzo” è il manuale classico dell’aggiornamento forzato: il cliente che vuole restare sul livello di prestazioni che aveva ieri deve pagare di più oggi.
Si aggiunge il passaggio a consumo del 15 giugno 2026, che chiude la fase del canone fisso per gli agenti e introduce un credito Agent SDK per il piano Enterprise Premium e un puro “pay-as-you-go” per Enterprise Standard. Gli unici sconti reali rimasti sono il prompt caching, che taglia fino al 90% sull’input in cache, e la lavorazione in batch, che dimezza il prezzo per i carichi di lavoro asincroni. Entrambe richiedono lavoro di ingegneria; nessuna è attiva di default. I CFO che speravano in una stabilizzazione dei prezzi al ribasso, sull’onda delle promesse di efficienza dei modelli più piccoli, stanno scoprendo che il listino si muove nella direzione opposta.
Dalla scommessa alla governance del consumo
Chi nel 2024 ha venduto l’AI ai board come investimento una tantum più licenza prevedibile ha venduto una favola. La realtà del 2026 è che l’AI in produzione è uno strato di costo variabile e va trattata come si tratta il cloud: tetti, allerte, responsabilità per progetto, cruscotti di consumo, revisioni mensili sul rapporto tra token consumati e valore generato. Le aziende che oggi non hanno un AI FinOps interno stanno gestendo un capitolo di spesa potenzialmente milionario con strumenti pensati per il canone software. È un disallineamento organizzativo che si traduce in sorprese di bilancio a fine trimestre.
Il listino dei fornitori AI è una leva di potere sui prezzi, non un dato esterno e neutro. Il raddoppio Fable 5 e Mythos 5, il passaggio a consumo di Anthropic, le finestre di contesto che arrivano al milione di token allo stesso prezzo, il modello Agent SDK con misurazione granulare: ogni mossa sposta margine dal cliente al fornitore. I CFO che firmano contratti AI multimilionari senza modellare scenari di consumo sotto stress stanno prezzando la promessa, non l’incertezza. È la stessa ingenuità che vent’anni fa portò a sottoscrivere licenze Oracle senza leggere le clausole sul “True-Up”.
Lo spartiacque competitivo del prossimo biennio sarà la governance del consumo dietro al modello scelto: chi misura, chi taglia, chi ottimizza, chi decide che un flusso agentico non vale i token che brucia. La scommessa AI si vince con la disciplina contabile applicata al calcolo, non con il modello più grande. Le aziende che hanno fatto AI per la borsa stanno gonfiando il fatturato a consumo dei propri fornitori; quelle che la fanno per il conto economico stanno introducendo tetti, scegliendo modelli più piccoli dove bastano, accettando di rinunciare a qualche capacità in cambio di prevedibilità. A fine 2027 i bilanci diranno chi ha capito la differenza, e chi ha solo recitato la parte.
#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
Sara Romano
Source link



