Claude a consumo via SDK, Anthropic fa un passo indietro


Anthropic ha sospeso, nel giorno stesso in cui sarebbe entrata in vigore, la riforma di fatturazione che dal 15 giugno avrebbe spostato Claude Agent SDK, Claude Code in modalità non interattiva e i tool di terze parti su un credito mensile separato a tariffe API piene. La comunicazione ai clienti è asciutta: “Nothing changes for now”. Tradotto, il consumo a token degli agenti continua a essere coperto dall’abbonamento Pro, Max, Team o Enterprise, esattamente come prima. La fonte primaria è la pagina di supporto ufficiale, aggiornata in calce con l’avviso di sospensione.

La riforma era stata annunciata il 15 giugno come svolta verso un modello a consumo per chi usa Claude in pipeline automatizzate. Doveva chiudere l’asimmetria tra abbonamento flat da 20 o 200 dollari al mese e consumo reale di token, che nelle pipeline agentiche più aggressive sfora di un ordine di grandezza il prezzo dichiarato. La marcia indietro arrivata dopo poche ore racconta qualcosa di diverso: il modello a consumo puro non era ingestibile per Anthropic, era diventato ingestibile per i suoi clienti.

Il modello a consumo puro è ingestibile per i clienti, non per Anthropic.

Quando il conto a consumo lo paga il fornitore, qualcosa non torna

La logica del piano sospeso era trasparente, e seguiva la stessa traiettoria con cui Anthropic aveva già chiuso i rubinetti a OpenClaw ad aprile. Pro a 5 dollari di credito mensile separato, Max a 50, Team a 100, Enterprise Standard a zero. Esaurito il credito, fatturazione a tariffe API piene sui token consumati, con sospensione automatica delle richieste se l’overflow billing non era stato attivato manualmente. Una pipeline che gira cento volte al giorno con prompt non banali arriva a quattrocento dollari di credito bruciato in pochi giorni: nessun budget mensile da cinquanta dollari poteva sopravvivere. La stampa specializzata aveva descritto il piano come la fine del sussidio implicito che gli abbonati ricevevano sul consumo agentico.

Pipeline che girano cento volte al giorno bruciano quattrocento dollari di credito.

L’impatto stimato sui clienti più pesanti era un aumento di costo effettivo tra cinque e dieci volte. Per i tool di terze parti costruiti sopra Claude, da Zed a Cursor, lo spostamento avrebbe spostato a sua volta i propri prezzi al rialzo, oppure costretto a riscrivere l’integrazione su modelli concorrenti. La voce di chi opera al confine tra abbonamento e SDK, come gli sviluppatori di Zed, era stata netta nel descrivere il piano come incompatibile con qualunque flusso di lavoro non interattivo.

Il vero motivo della marcia indietro: i conti aziendali esplosi

L’argomento spinto in queste ore dalla stampa internazionale, da The New Stack a The Decoder, è che la riforma è saltata sotto il peso di una catena di incidenti enterprise già diventati pubblici. ServiceNow e Uber hanno bruciato il budget annuale per l’intelligenza artificiale del 2026 con mesi di anticipo, su carichi agentici che, nelle parole di Microsoft, scalano come infrastruttura, non come persone. La traduzione contabile è che un team di venti sviluppatori che usa Claude Code in modo intenso può generare, sul lato token, un consumo paragonabile a quello di un servizio in produzione. Il piano del 15 giugno avrebbe trasferito quel rischio dal fornitore al cliente in una settimana.

Nessun direttore finanziario approva un budget che non riesce a prevedere a meno del cinquanta per cento. La sospensione vale come ammissione tecnica: il consumo agentico è troppo volatile per essere gestito con la fatturazione a token piena, almeno finché non esistono strumenti maturi di circuit breaker e quote graduate per tipo di carico. Nei mesi precedenti Tom’s Hardware aveva raccontato come le aziende stessero vedendo il conto e iniziando a frenare gli esperimenti con i modelli generativi, proprio sulla scia di consumi che si rivelavano dieci volte superiori alle previsioni. La riforma sospesa avrebbe accelerato la fuga, non aumentato i ricavi.

La sospensione è ammissione tecnica: gli abbonati pagavano dieci volte meno del costo reale.

Guerra dei prezzi con OpenAI e quotazione in vista

Il contesto competitivo rende la marcia indietro ancora più leggibile. OpenAI prepara tagli ai prezzi token sui propri modelli di punta per riconquistare quota di mercato sugli sviluppatori, e Tom’s Hardware ha descritto la dinamica come guerra dei prezzi aperta. Anthropic ha alzato il listino due settimane fa con Fable 5 e Mythos 5, raddoppiando i prezzi dei token rispetto a Opus 4.8. Aggiungere a quel rialzo la fine del sussidio sull’abbonamento sarebbe stata la condizione perfetta per consegnare clienti a OpenAI, Mistral e ai tool open source come Goose, che Tom’s Hardware aveva descritto tra le alternative open source a Claude Code.

Tra quotazione imminente e taglio prezzi di OpenAI, alzare il conto era suicida.

C’è poi il fattore borsistico. Anthropic prepara la quotazione in vista del prossimo round miliardario, e l’editoriale di Tom’s Hardware aveva già messo il dito sul punto debole della costruzione finanziaria della società. Il confronto con OpenAI sui bilanci mostra una dipendenza strutturale dal cloud e dai grandi clienti enterprise che non tollera ondate di abbandono. Far esplodere il conto agli sviluppatori a due passi dalla quotazione sarebbe stato un autogol. La sospensione risponde a un calcolo finanziario preciso: rimanda la riforma a una fase in cui il quadro contabile sia meno esposto al giudizio degli investitori.

Cosa devono fare adesso i clienti con pipeline su Agent SDK

La sospensione resta un congelamento temporaneo. La comunicazione di Anthropic parla di voler aggiornare il piano per supportare meglio come gli utenti costruiscono sopra gli abbonamenti, formula che lascia aperto ogni scenario. La riforma può tornare in tre mesi con soglie più alte, quote per tipo di carico, sconti enterprise negoziati caso per caso. Nel frattempo le aziende con pipeline pesanti su Agent SDK hanno una finestra utile per misurare il proprio consumo reale in token, costruire circuit breaker che blocchino le esecuzioni fuori scala, valutare overflow billing manuale prima di una riforma futura.

L’errore opposto sarebbe leggere la sospensione come ritorno duraturo al consumo flat, quando in realtà quel modello di pricing è già archiviato nei piani di tutti i grandi fornitori. La fase in cui un abbonamento da venti dollari copriva mille dollari di token reali è finita, e finirà comunque, ma nessuno tra i grandi fornitori ha ancora trovato il modo di dichiararlo senza perdere clienti. Il prossimo tentativo arriverà con un’architettura di prezzi più sofisticata, probabilmente con quote graduate per tipo di carico anziché un credito separato a tariffe API piene.

L’era del consumo flat non finisce, viene rimandata a data da definirsi.

Per chi sta scegliendo oggi su quale modello costruire un agente in produzione restano due indicazioni concrete. La sospensione restituisce una finestra di costo prevedibile, utile a chiudere progetti pilota in tempi rapidi, ma conferma anche che il listino dei grandi fornitori è instabile e che ogni architettura agentica costruita oggi deve prevedere astrazioni capaci di sostituire il modello sottostante in pochi giorni. Vincolarsi all’API di un singolo fornitore, anche tramite un SDK comodo come Agent SDK, è una scommessa sulla stabilità del listino di quel fornitore. Anthropic ha appena dimostrato che quel listino può cambiare due volte in un mese, e tornare indietro nello stesso giorno.

La sospensione del 15 giugno resta una mossa tattica per guadagnare tempo, senza alcun cambio di direzione strategica. I clienti che leggono “Nothing changes for now” come una pace duratura stanno leggendo male la formula: il peso della frase cade tutto sulle ultime due parole.


#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
 Marco Ferretti

Source link

Di