Anthropic cambia dal 15 giugno le regole del gioco e chiude l’epoca dell’abbonamento flat per chi usa Claude in modalità agente. Chi paga 20, 100 o 200 dollari al mese resta con la chat illimitata, ma ogni chiamata via Agent SDK, Claude Code headless o tool di terze parti scala una quota mensile dedicata e poi passa a pagamento a consumo. L’utente che faceva girare agenti automatici 24/7 sotto il flat perde l’opzione, e si trova a pagare ogni token oltre il credito incluso.
La separazione fra chat e agente chiude un capitolo durato due anni, quello in cui un singolo seat copriva qualsiasi automazione attaccata al modello. L’abbonamento flat per gli agenti si è dimostrato insostenibile sui margini, perché un agente che lavora ininterrottamente brucia token a tassi che nessun forfait riesce ad assorbire. Anthropic prende atto e sposta il consumo programmatico su una voce a parte, mentre il flat continua a coprire la chat interattiva del singolo utente.
â–¶” frameborder=”0″ allow=”accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture” allowfullscreen title=”Vedi il video”>
La nuova quota inclusa varia per tier: Pro a 20 dollari/mese porta in dote 5 dollari di credito SDK, Max a 100 dollari ne include 50, Team a 200 dollari arriva a 100 dollari di credito. Sul fronte enterprise cambia tutto: il seat Enterprise Standard parte da zero credito incluso e va in pay-as-you-go puro, mentre il seat Enterprise Premium ha il credito SDK negoziato individualmente. Oltre la quota, l’addebito segue il listino API standard, 3 dollari per milione di token in input e 15 in output su Sonnet 4.6.
Il flat resta per la chat, l’agente paga a consumo dal 15 giugno.
Il tassametro acceso sull’agente che non dorme
La distinzione tecnica è netta. La chat web, la sessione desktop e Claude Code in modalità interactive con utente davanti restano dentro la subscription, senza scalare il credito. Il consumo via API diretta resta sul suo binario di pricing storico. Il credito SDK misura solo le chiamate che partono da automazioni, pipeline e agenti senza umano alla tastiera.
Sotto il forfait flat un singolo seat poteva sostenere agenti che giravano ininterrottamente, scaricando il costo sul margine del fornitore. Anthropic ha lasciato il modello in piedi per mesi, raccogliendo il segnale del mercato sugli agenti autonomi. Claude Code headless ha cambiato la curva dei consumi, portando aziende con pipeline CI/CD continue a usare il modello come worker permanente.
I numeri arrivano già dai ticket di supporto. Una pipeline di build che gira 100 esecuzioni al giorno con Claude Code headless consuma fra 200 e 400 dollari/mese aggiuntivi sopra il piano Team, una volta esaurito il credito incluso. Un background agent lanciato da Cursor sull’intera codebase può raddoppiare la bolletta mensile di una squadra enterprise, perché genera chiamate senza intervento umano per ore consecutive.
Il flat fee per agenti che girano 24/7 è tecnicamente impraticabile.
Enterprise Standard a zero credito, la riga che cambia il procurement
La riga del listino più facile da non leggere è anche la più costosa. Il seat Enterprise Standard non include credito SDK. Le aziende che hanno firmato contratti enterprise pensando di avere tutto incluso scopriranno il 15 giugno che ogni chiamata programmatica passa per il pay-as-you-go puro, sul listino API.
Chi ha negoziato il pacchetto Enterprise Premium ha invece il credito separato, dimensionato sul volume previsto e rivisto a scadenze contrattuali. La differenza si misura in decine di migliaia di euro l’anno per ogni squadra di sviluppo che usa Claude Code in pipeline serie. Procurement e IT devono rileggere i contratti prima di domenica, contando quante automazioni dipendono dal modello.
Le aziende italiane già clienti di Anthropic in fascia enterprise sono diverse, e il caso Generali è il più documentato, con un case study pubblicato nel 2025 sul lavoro di sviluppo interno. Sulla lista pubblica figurano anche Unipol, Pirelli, Bending Spoons e Satispay, oltre a Telepass citato per uso interno. I CIO si trovano davanti una domanda secca: quanti seat Standard stanno per diventare voci di costo a consumo.
Le metriche di assorbimento sono il dato che gli uffici acquisti non hanno mai dovuto guardare. Una squadra di 50 sviluppatori che esegue agenti automatici due ore al giorno consuma più della quota Team già nella prima settimana del mese, con sforamenti che crescono linearmente. Il tetto del credito non funziona come un freno: serve monitorare le pipeline e impostare alert sui consumi, altrimenti la bolletta a fine mese arriva senza preavviso. Le piattaforme FinOps che fino a ieri seguivano spesa cloud e SaaS adesso devono integrare il consumo token come voce a sé.
Milano apre, AGID arriva tardi
La cornice italiana è cambiata da poche settimane. Anthropic ha aperto ufficialmente la sede di Milano il 28 maggio 2026, primo paese del sud Europa dopo Dublino. La guida è affidata a Federico Marengo, ex Microsoft, con un team commerciale dedicato alle grandi aziende e una pipeline di proof of concept già avviata nel manifatturiero e nei servizi finanziari.
L’apertura di Milano cambia il canale enterprise con contratti firmati in italiano, fatturazione locale e referenti tecnici sul fuso orario europeo. La timeline coincide con il rollout del credit pricing, e non è un caso: la sede serve per spiegare il nuovo modello commerciale alle direzioni finance prima che la bolletta arrivi a sorpresa. Marengo e il team hanno già incontrato le squadre IT di alcuni dei clienti dichiarati pubblicamente.
Il vuoto resta sulla PA. AGID e Consip non hanno ancora pubblicato accordi quadro per Anthropic, mentre Microsoft Copilot e Google Workspace risultano già in convenzione e accessibili a comuni, regioni e ministeri tramite procedura semplificata. L’amministrazione che vuole portare Claude in produzione deve passare da gara individuale, con tempi medi di 6-12 mesi.
Stesso schema in arrivo da OpenAI e Google
La mossa di Anthropic non resta isolata. OpenAI ha già in beta un sistema di Operator credits che applica la stessa logica di separazione fra uso umano e uso agentico, con quote distinte per i piani Business ed Enterprise. Google ha portato Gemini Enterprise sul consumption pricing per l’uso programmatico, lasciando la chat web dentro la subscription Workspace.
Il flat-fee illimitato per chiamate API agentiche esce dal listino dei tre fornitori che contano. Le tariffe a consumo diventano la norma per qualsiasi automazione, e i CFO si trovano davanti una voce di costo nuova che cresce con il numero di pipeline, non con il numero di dipendenti.
Il forfait illimitato per agenti automatici esce dal listino dei tre big.
Anthropic ridisegna il software AI da abbonamento illimitato a infrastruttura misurata. Chi ha comprato seat pensando di pagare l’accesso al modello scopre il 15 giugno che sta pagando l’accesso alla chat, mentre l’agente automatico è una voce di costo separata, contabilizzata token per token.
I CFO entrano nella prima vera contabilità FinOps sull’AI generativa, dopo mesi di subscription gestite come licenze software ordinarie. Contare i token, non le utenze, diventa la metrica di controllo, e ogni pipeline va valutata per ritorno sul consumo che genera. Le squadre più mature avevano già iniziato a misurare il costo per build, le altre partono adesso con una rincorsa di sei mesi.
Per Anthropic la mossa permette di servire i clienti enterprise senza dover sussidiare i power user automatici, riportando i margini su valori sostenibili sul lungo periodo. Per il mercato italiano la sede di Milano apre un canale diretto con referenti locali, ma l’assenza in convenzione AGID lascia la PA fuori dal radar commerciale per almeno 6-12 mesi. Le grandi aziende private hanno già il telefono di Marengo, gli enti pubblici devono aspettare che Consip si muova.
#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
 Davide Greco
Source link



