Claude Code perde l’80% delle istruzioni, Anthropic dice che il modello “non le vuole”


Secondo quanto riportato da the-decoder.com, Anthropic ha rimosso circa l’80% del system prompt di Claude Code in coincidenza con l’adozione dei modelli Fable 5 (classe “Mythos”). A rivelarlo è stato Thariq Shihipar, membro dello staff tecnico che lavora sul prodotto: il vecchio prompt era pieno di regole rigide, esempi dettagliati, istruzioni del tipo “non fare X”. Il nuovo è drasticamente più corto.

Shihipar descrive un cambio di approccio preciso: dai vincoli espliciti si passa allo “steering by context”, cioè guidare il modello con il contesto della conversazione piuttosto che con un elenco di divieti scritti in anticipo. La logica dichiarata è che i modelli più recenti non hanno più bisogno di essere ingabbiati in una sequenza di istruzioni passo-passo, perché già interpretano correttamente l’intenzione dietro una richiesta.

Meno regole scritte, più fiducia nel modello: o solo meno token da pagare?

Il racconto che ne fa Shihipar ha anche una componente storica interessante. I primi modelli richiedevano prompt brevi ma fitti di esempi e paletti, perché da soli capivano poco. Con l’aumento delle capacità, i prompt sono cresciuti in lunghezza, fino a diventare documenti corposi. Ora, dice Anthropic, la tendenza si inverte di nuovo: il prompt si accorcia perché il modello non ne ha più bisogno, non perché sia tornato indietro in capacità.


“Il modello non vuole essere istruito”, la tesi di Anthropic

La frase chiave, tradotta, è questa: gli esempi scritti nel prompt “tendono a limitarlo, perché in realtà ha più immaginazione degli esempi che gli forniamo”. È una personificazione tecnica: il modello “vuole” qualcosa, ha una preferenza, quasi un’opinione sul modo in cui viene istruito. Il linguaggio scelto sposta l’attenzione dal fornitore alla presunta volontà del prodotto, e questo è già un dato editoriale prima ancora che tecnico.

Sul piano tecnico, l’idea non è priva di fondamento. Anthropic pubblica da tempo una propria guida su come costruire il contesto per agenti AI, dove parla esplicitamente di trovare la “giusta altitudine” per un prompt: né troppo rigido, con regole fragili da mantenere nel tempo, né troppo vago, senza alcun segnale utile. Un prompt sovraccarico di esempi può restringere lo spazio di ricerca di un modello già ben allineato, peggiorandone l’output invece di migliorarlo. È un fenomeno reale, documentato, non un’invenzione buona solo per il comunicato.

Il problema è che questa spiegazione tecnica, per quanto plausibile, resta l’unica versione raccontata. Anthropic non pubblica il diff del prompt, non mostra cosa esattamente è stato tolto, non offre modo di verificare in modo indipendente quanto della riduzione sia dovuto a capacità reali del modello e quanto a semplice sfoltimento di materiale ridondante accumulato nel tempo.

Shihipar ha ripreso lo stesso concetto anche in altri interventi pubblici, tra cui il podcast “How I AI” di Claire Vo, il che suggerisce che la narrazione non sia improvvisata per un singolo articolo ma una linea di comunicazione coerente adottata dall’azienda. Coerenza non significa però automaticamente verità: un messaggio ripetuto più volte, con le stesse parole, resta comunque un messaggio a senso unico finché non viene affiancato da dati verificabili sul comportamento reale del modello prima e dopo il taglio.

Meno prompt, meno costi: la lettura che Anthropic non fa

Il system prompt di Claude Code non è un dettaglio invisibile all’utente: è testo che viene fatturato a ogni singola chiamata, perché è “always-on”, cioè parte automaticamente di ogni richiesta inviata al modello. Tagliarlo dell’80% significa, con ogni probabilità, meno token consumati per ogni sessione, meno latenza, un margine più comodo per chi eroga il servizio.


Il tempismo non aiuta la lettura più generosa. Dal 15 giugno 2026 Claude Code headless, Agent SDK e strumenti di terze parti fatturano a consumo oltre la quota di credito mensile, mentre la chat in abbonamento resta a tariffa flat. In questo contesto, un prompt più leggero non è mai una scelta neutra sul piano commerciale: riduce direttamente il costo per chiamata, proprio mentre l’azienda ha appena introdotto un meccanismo che fa pagare l’uso a consumo.

Non significa che la spiegazione tecnica sia falsa. Le due letture, quella dell’ottimizzazione dei costi e quella della maturità del modello, non si escludono a vicenda: possono essere entrambe vere insieme. Ma Anthropic ne comunica solo una, quella che sposta l’attenzione sulla capacità del prodotto invece che sul risparmio per chi lo vende. È una scelta di framing, e come tale merita di essere segnalata, non solo replicata.

Vale la pena guardare anche al contesto più largo dei prezzi. Con il lancio dei modelli Fable 5, Anthropic ha raddoppiato i prezzi dei token parlando di modelli “frontier” che giustificherebbero il costo più alto. Un system prompt più corto, nello stesso momento in cui il prezzo per token sale, ha l’effetto pratico di limitare l’impatto dell’aumento sulla bolletta finale del cliente che usa Claude Code in modo intensivo. Le due mosse insieme, taglio del prompt e rialzo dei prezzi, raccontano una gestione dei costi più attenta di quanto il comunicato lasci intendere.

Il prompt si accorcia, la fattura di Claude Code resta da verificare.

Non è solo Anthropic: il settore converge su prompt più corti

Il pattern non è un’esclusiva di Anthropic. OpenAI, nella propria guida ufficiale per GPT-5.5, raccomanda esplicitamente di non trascinare avanti prompt legacy sovra-specificati pensati per modelli precedenti, perché “aggiungono rumore” e restringono lo spazio di ricerca del modello più recente. La convergenza tra i due principali laboratori rafforza la plausibilità tecnica della tesi.


Allo stesso tempo, però, rafforza anche la lettura scettica: se tutto il settore sta arrivando alla stessa conclusione nello stesso periodo, in cui i margini sull’inferenza restano sotto pressione e i prezzi dei modelli di punta salgono, la coincidenza tra “il modello lo vuole” e “il modello costa meno da istruire” diventa difficile da ignorare. È vero, probabilmente, ma è anche comodo.

Il precedente Claude Code: quando “meno” ha già significato “peggio”

Non è la prima volta che un cambiamento a Claude Code, presentato come scelta tecnica neutra, coincide con una riduzione delle risorse effettivamente dedicate a ogni richiesta. Un’analisi di aprile 2026 su un campione di 6.852 sessioni ha documentato un calo di qualità coinciso con un aggiornamento che riduceva le letture di contesto (da una media di 6,6 file consultati a 2) e oscurava i passaggi di ragionamento del modello dalla versione 2.1.69.

Anche in quel caso la spiegazione ufficiale ha parlato di ottimizzazione tecnica, omettendo il tema del risparmio computazionale. Il lettore che ha già seguito quella vicenda riconosce lo schema: una riduzione delle risorse spese per ogni richiesta, raccontata come un miglioramento del prodotto. Non è una prova che la stessa cosa stia accadendo ora con il taglio dell’80% del prompt, però resta un precedente che invita alla cautela prima di prendere per buona la versione ufficiale senza verifica.

Cosa deve fare chi usa Claude Code in azienda

Chi ha costruito flussi di lavoro, file `agent.md` personalizzati o automazioni CI/CD attorno al comportamento del vecchio system prompt deve rivalutare cosa succede oggi con lo stesso identico input. Un prompt più corto, con meno vincoli espliciti, può produrre output diversi da quelli attesi su casi limite che prima erano coperti da una regola scritta e ora sono affidati all’interpretazione del modello.

La verifica indipendente resta impossibile finché Anthropic non pubblica il contenuto effettivo del nuovo prompt o almeno un resoconto dettagliato di cosa è stato rimosso. Chi vuole farsi un’idea di cosa conteneva la versione precedente può consultare il repository comunitario che raccoglie i leak del prompt storico di Claude Code, non ufficiale ma ampiamente citato.


Un confronto pratico, prompt vecchio contro prompt nuovo, sugli stessi task ripetuti più volte, resta lo strumento più concreto per capire se il modello si comporta davvero meglio con meno regole o solo in modo diverso. Chi gestisce processi critici (revisione codice automatica, generazione di pull request, task che toccano ambienti di produzione) farebbe bene a non fidarsi della sola rassicurazione ufficiale. Un’azienda che comunica un cambiamento tecnico enfatizzando solo il beneficio per l’utente quasi mai sta raccontando tutta la storia.

Chi paga, in questa storia, è sempre lo stesso soggetto: l’azienda che usa Claude Code a consumo e si ritrova un prodotto diverso da quello per cui aveva tarato i propri flussi, senza un changelog che lo spieghi. Chi vince è Anthropic, che riduce i costi di ogni chiamata e lo racconta come un salto di maturità del modello. Prima di fidarsi della nuova “autonomia” promessa, conviene testare i casi limite che per il proprio flusso di lavoro contavano con il vecchio comportamento, non limitarsi a leggere il comunicato.


#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
 Sara Romano

Source link

Di