Se uno vuole capire davvero un nuovo modello AI, una buona regola è ignorare il comunicato del fornitore e andare a leggere quello che dicono le persone che ci provano a lavorare. Per Fable 5 il punto di osservazione più onesto è la subreddit r/ClaudeAI, dove sono iscritte centinaia di migliaia di persone che con Claude ci scrivono codice, ci preparano analisi, ci costruiscono prodotti, e per il privilegio di farlo pagano i 100 o i 200 dollari al mese del piano Max.
Questo pubblico dovrebbe essere il primo evangelista naturale di ogni nuovo rilascio Anthropic; sicuramente queste persone sono le uniche che in qualche modo creano una debole speranza che il business plan di Anthropic (ma non che OpenAI sia messa meglio) prima o poi avrà un senso. Proprio questo pubblico, in questi giorni, sta restituendo il giudizio più impietoso che si potesse immaginare.
Il thread di riferimento, aperto poche ore dopo il rilascio, ha un titolo che già fotografa il problema: “Fable 5 è incredibilmente buono, ma fai attenzione al tuo utilizzo: stavo bruciando il 2% al minuto sul piano 20x”. Sotto, centinaia di commenti riassunti dal moderatore in una sintesi automatica (l’ironia non manca) che vale la pena leggere per intero, perché è il manifesto di un disastro silenzioso.
“il verdetto è arrivato, e la comunità è concorde con OP: Fable 5 è potente, ma consuma token a un ritmo assolutamente folle. Gli utenti di tutti i livelli del piano Max segnalano di aver esaurito i loro limiti di utilizzo in appena 10-45 minuti, un risultato che non avevano mai sfiorato con Opus 4.8.”
Quaranta minuti. Per esaurire un piano da 200 dollari al mese che, sulla carta, dovrebbe farti lavorare molto intensamente. Un utente lo dice senza giri di parole, in inglese, traduco letteralmente: “ho bruciato un intero piano 20x Max in 45 minuti, è un divoratore”. Un altro scrive di essere arrivato al 100% del consumo settimanale “in pochi minuti”, senza nemmeno ricevere una risposta completa. Un terzo descrive un’esperienza che varrebbe la pena incorniciare: “Ho chiesto a Fable 5 di rivedere la mia sessione attiva su Opus 4.8 e di farmi suggerimenti. Ha consumato il resto della mia sessione in 20 minuti. Non posso permettermi Fable 5 o i modelli futuri. Spero che non eliminino Opus 4.8. Sto pensando a una soluzione autonoma.”
E qui c’è già metà della diagnosi: il nuovo modello premium si compra solo per scoprire che non lo si può permettere, e si torna al modello precedente come default operativo. Il “modello del futuro” è un oggetto che esiste in vetrina, non sul banco di lavoro.
Il prezzo, e il prezzo dietro al prezzo
Uno degli utenti del thread ha messo in fila i numeri puri, e ogni CFO dovrebbe stamparseli e tenerli sul tavolo. Fable 5 sull’API costa 10 dollari per milione di token in input e 50 dollari per milione in output. Opus 4.8 costa 5 e 25. Esattamente il doppio.
Il listino è la parte facile del calcolo. Questi nuovi modelli di ragionamento generano molti più token per ogni richiesta, perché “pensano” più a lungo: passaggi di pianificazione, chiamate a sub-agenti, loop di tool-use, ripetizioni, autoverifica. Una singola richiesta enterprise complessa può espandersi facilmente in decine di milioni di token. A cinquanta dollari per milione in output, una sola query diventa una fattura a quattro cifre.
In quel commento un utente ricorda il caso Uber, che ha bruciato il budget annuale dedicato all’AI per developer in quattro mesi, sotto un regime di prezzi ancora vecchio. Adesso le aziende devono ricominciare la conta da zero, su un listino doppio. Su Tom’s Hardware ne abbiamo parlato come del primo vero specchio del costo reale dell’inferenza.
Plan in Fable, execute in Opus: la sopravvivenza diventa strategia.
Gli utenti si sono così inventati una strategia per sopravvivere, che si chiama “plan in Fable, execute in Opus”: Fable 5 con il contagocce come pianificatore, poi ritorno a Opus 4.8 per eseguire le decisioni, altrimenti il piano mensile evapora prima del tramonto. E, vale la pena ricordarlo, non è che Opus 4.8 sia esattamente economico.
Dunque, il nuovo prodotto di Anthropic è giudicato con sufficienza (a voler essere generoso) anche dal pubblico di riferimento, quegli early user che in genere sono piuttosto entusiasti delle novità e poco attenti a questioni terrene come il prezzo. Stavolta le cose però stanno andando diversamente.
Ho chiesto al nostro head developer, una persona che usa l’AI ogni giorno dentro flussi reali di lavoro, cosa pensasse del nuovo modello. La risposta è arrivata in cinque parole secche, che non scriverò per non perdere (troppa) eleganza.
Il teatrino del “è troppo pericoloso” e quei fastidiosi limiti
Le critiche toccano anche un punto su cui Anthropic ha costruito buona parte della propria immagine pubblica, la safety. Sul thread ClaudeAI il moderatore lo sintetizza così, cito fedelmente: “molti utenti non riescono nemmeno a far funzionare Fable 5 perché il suo filtro di sicurezza è ridicolmente troppo sensibile. Si riporta che torna a Opus 4.8 per ‘motivi di sicurezza’ su un’ampia gamma di richieste innocue, comprese matrici hermitiane, domande filosofiche, revisioni di codice e persino una ricetta per una torta al cioccolato.”
Una ricetta per una torta al cioccolato. Un concetto matematico di base. Una domanda filosofica. Una revisione del codice. Tutte cose per cui Fable 5 si dichiara “non sicuro” e dirotta la richiesta su Opus 4.8, che è il modello precedente, quello più economico, quello che dovrebbe essere meno capace ma che evidentemente è considerato adatto a pericolosi personaggi che chiedono come si prepara un ganache.
Un utente del settore medicale dichiara di avere un tasso di rifiuto vicino all’ottanta per cento sulle richieste dei propri clienti, che sono produttori di dispositivi medici. Ottanta su cento. Il modello che dovrebbe ridisegnare l’industria del software enterprise rifiuta sistematicamente di parlare con la sanità.
Il filtro di sicurezza funziona come “rate limiter” occulto.
Quando Fable 5 dirotta una richiesta su Opus 4.8, sta semplicemente facendo capacity management mascherato da safety. Ogni richiesta sicura che resta su Fable consuma il token premium a velocità doppia; ogni richiesta dirottata libera capacità sul nuovo modello e la sposta sul vecchio, che brucia meno cassa.
E uno potrebbe pensare che alla fine è un problema degli utenti, no? Che tutto sommato chi se ne frega se Pierino vuole bruciarsi 200 euro per fare una torta, no? No, perché in verità Anthropic sta ancora vendendo in perdita.
Quale che fosse l’intento originario, il filtro di sicurezza funziona da “rate limiter” occulto. Più elegante che dire “abbiamo aperto le code” o “ti diamo accesso a singhiozzo”.
Tutto questo scherzo è impacchettato dentro la cornice etica della Responsible Scaling Policy (versione 3 pubblica di Anthropic) e raccontato come prudenza necessaria a maneggiare modelli frontier. La narrativa trova sponde nella regolamentazione europea, che sui modelli con rischio sistemico chiede valutazioni, test avversariali e reporting degli incidenti (articolo 55 dell’AI Act, linee guida EU sui modelli sistemici). Che Fable 5 rientri nella casistica immaginata dai regolatori, però, è tutto da dimostrare.
Il rischio esiste davvero, comunque, almeno parzialmente. Discutibile è il modo in cui ogni release viene confezionata come soglia storica usando il linguaggio del pericolo. L’analisi pubblica del backlash sui rilasci frontier lo spiega bene: il packaging safety è anche un meccanismo tecnico che si presta benissimo a diventare materiale da marketing.
L’utente Reddit `Anonimos66` lo sintetizza meglio di tutti, e merita di essere citato testualmente per la chiarezza con cui dice quello che molti analisti finanziari pensano. “Ottima mossa da parte di Anthropic. Immagina se riuscissero ad addestrare un Opus migliore al 50% in più del costo, per poi farlo pagare il doppio e marchiarlo con un nuovo nome. Grande miglioramento nei margini, strategia intelligente.”
Sarcasmo da forum, ma è la descrizione più onesta del business che ho letto in settimane.
Perché è vero: Fable 5 poteva benissimo chiamarsi Opus 4.9, ma sarebbe stato molto più difficile raddoppiare il prezzo senza cambiare nome.
Perché lo fanno: la finanza imbarazzante dietro l’industria
Dunque, perché diavolo Anthropic e OpenAI stanno giocando la partita in questo modo? In poche parole: non hanno un vero modello di business, e debiti per centinaia di miliardi di dollari. Anche solo pensare che con gli abbonamenti si produca quel tipo di capitale può suscitare solo ilarità.
Gli investimenti privati globali in intelligenza artificiale hanno toccato i 252 miliardi di dollari nel 2024 (Stanford HAI AI Index Report, sintesi Cerved). Tecnicamente parliamo ancora di startup, con le relative dinamiche di finanziamento, ma le cifre in gioco sono davvero una cosa fuori dal mondo.
OpenAI ha chiuso a marzo 2025 un round da 40 miliardi guidato da SoftBank (Reuters), seguito a febbraio 2026 dal mega-round record da 110 miliardi a una valutazione di 840 miliardi (Reuters via Virginia Business). Lo split degli investitori dà l’idea della cosa: Amazon 50 miliardi, Nvidia 30, SoftBank altri 30. Microsoft, intanto, è cumulato a 13 miliardi dal 2019.
I ricavi 2025 hanno chiuso a 13,1 miliardi annualizzati, sopra il forecast di 100 milioni (Reuters). Marzo 2026: ARR a 25 miliardi, due miliardi al mese di fatturato fresco in arrivo. Più veloce di Alphabet e Meta nei loro periodi corrispondenti.
Numeri da capogiro. Ma il bilancio sotto la riga del fatturato racconta tutta un’altra storia.
Nel primo trimestre 2026 OpenAI brucia un dollaro e ventidue centesimi per ogni dollaro fatturato (CBS News sul deposito S-1). Il margine lordo “adjusted” del 2025 è crollato al 33%, contro un target del 46%. Perché? Costi di inferenza quadruplicati nello stesso anno (MLQ).
Le proiezioni depositate alla SEC a febbraio 2026 parlano di una traiettoria peggiorata di 112 miliardi rispetto alle stime precedenti.
Cassa bruciata 2026: 25 miliardi.
Cassa bruciata 2027: 57 miliardi.
Cumulato 2030: 665 miliardi (CNBC su compute spend 2030).
Il compute spend totale è stato ridotto da 1,4 trilioni (stima Morgan Stanley dell’autunno 2025) a circa 600 miliardi entro la stessa scadenza. *Ma il quadro complessivo è andato peggio, non meglio.* I costi di training nel solo 2026 valgono 32 miliardi, nel 2027 salgono a 65. Il flusso di cassa positivo arriva non prima del 2030. Anthropic, sullo stesso fronte, prevede di chiudere in attivo già nel 2028.
Trilione di valutazione, ottantadue miliardi di cassa bruciata in due anni.
Con questi numeri sotto braccio, OpenAI ha fatto la mossa più aggressiva possibile. Il 22 maggio 2026 ha depositato in via confidenziale alla SEC il prospetto S-1. Annuncio pubblico l’8 giugno (TechCrunch). Debutto a Wall Street atteso per settembre 2026 a una valutazione superiore al trilione di dollari. Goldman Sachs, Morgan Stanley e JPMorgan guidano il libro.
Sam Altman l’ha buttata lì: “depositare l’S-1 confidenziale non equivale a essere pronti per il listing”. *Tradotto: ci riserviamo di slittare se i mercati non collaborano.* Ma la corsa è ufficialmente partita.
L’azienda dichiara 40 miliardi in cassa e trattative per altri 100 in arrivo. Senza l’IPO, la finestra di sopravvivenza si misura in mesi, non in anni. A 25 più 57 miliardi di burn nei prossimi due anni, i 40 miliardi cash si esauriscono prima del 2028. La quotazione non è strategia, è una necessità di cassa pubblica.
Una settimana prima, il 1 giugno, Anthropic aveva già fatto la stessa cosa (Fortune). Filing S-1 confidenziale, prima a esporsi ai mercati pubblici. Alle spalle una Series H da 65 miliardi che l’ha portata a 965 miliardi di valutazione post-money, sopra OpenAI nel ranking privato. Sponsor Goldman Sachs e JPMorgan, target debutto ottobre 2026 sopra il trilione.
Sulla traiettoria di ricavi Anthropic batte tutti: ARR passato da 9 miliardi a gennaio a 47 miliardi a maggio 2026 (rassegna Simon Willison). Il solo Q2 2026 vale 10,9 miliardi previsti, più di tutto il 2025 (CNBC). Il primo profitto operativo trimestrale è atteso proprio nel Q2.
Per quanto possa valere un profitto operativo trimestrale in un settore dove il cash flow resta rosso a tre cifre.
Google le ha riconosciuto un altro miliardo a gennaio 2025 (CNBC). Amazon era già dentro per oltre 8 miliardi complessivi. Gli investitori non sono solo finanziari: Microsoft, Amazon, Google e Nvidia comprano equity, ma soprattutto comprano controllo di ecosistema — cloud, chip, distribuzione. Il confine fra cliente, fornitore, partner industriale e azionista è sparito. E adesso si aggiunge il piano pubblico: dentro la finestra di sei-otto mesi entrambi i laboratori passeranno dal regime delle slide a porta chiusa a quello dei filing trimestrali da spiegare agli analisti. La narrativa della svolta storica diventa carta legale. Non più solo materiale da keynote.
OpenAI ha siglato un contratto da 200 milioni col Pentagono (Reuters) e ha aperto ChatGPT a tutte le agenzie federali al simbolico costo di un dollaro per agenzia (ExecutiveGov).
Anthropic ha avuto il suo contratto con il Pentagono, finito poi in rotta sul tema dei limiti d’uso militare (statement ufficiale Anthropic), al punto che il governo degli Stati Uniti l’ha classificata come “supply-chain risk” in alcune fasi del braccio di ferro (New York Times).
La voragine si chiama inferenza, e nessuno la sta colmando davvero
Il training di un modello frontier costa fra 2 e 5 miliardi di dollari per singola corsa, ma è un costo capitale una tantum. Ed è relativamente facile da recuperare.
L’inferenza invece è un nodo molto più difficile da sciogliere, perché rappresenta il costo di far girare il modello ogni volta che un utente lo usa. Ogni token generato attiva miliardi di parametri, e una singola query complessa costa decine di centesimi di puro compute (approfondimento IHAL). A differenza di una ricerca Google, dove la query costa frazioni millesimali di centesimo, qui ogni risposta ha un prezzo industriale che cresce con l’uso, non scende con la scala. Su Tom’s Hardware abbiamo già fatto i conti sulla bolletta token che spaventa.
L’industria sta migliorando l’efficienza, va riconosciuto. Le indiscrezioni parlano di un margine di calcolo OpenAI passato dal 35% di inizio 2023 al 70% di fine 2025. Migliorare il margine di calcolo non risolve il margine operativo complessivo: ogni miglioramento di qualità si paga in compute.
Le proiezioni più caute parlano di costi computazionali cumulati per oltre 600 miliardi entro il 2030. Bisogna costruire infrastruttura per far funzionare tutto questo, e bisogna pagarla. E i soldi non sono infiniti.
I modelli di ragionamento bruciano margine più velocemente di qualsiasi prodotto precedente.
A questo si aggiunge il fenomeno strutturale dei nuovi modelli di “ragionamento”: pensano più a lungo, usano tool, lanciano sub-agenti, fanno autoverifica. Generano cinque, dieci, venti volte più token per la stessa richiesta utente percepita. Gli utenti Reddit stanno vivendo esattamente questo sulla bolletta.
Anthropic chiama questo “capacità superiore”. Ma è come quei personaggi di Dragonball che si limitano a gonfiare i muscoli, ma che poi, sotto sotto, non sono veramente più forti.
Fable 5 è come Freezer tutto gonfio. Fa impressione al primo sguardo, ma se hai la saggezza di Goku puoi capire che è tutta scena. E che dietro forse c’è un po’ di paura come fattore motivante.
E intanto ogni nuovo utente è una piccola perdita che si aggiunge alle altre piccole perdite. E altre non tanto piccole.
Se fai i conti ti spaventi
Se Anthropic e OpenAI dovessero stare in piedi solo con quello che fatturano in abbonamento, senza il rubinetto del capitale e la pazienza degli investitori (ma non hanno scelta), il prezzo dei loro servizi non sarebbe quello attuale.
I 20 dollari del piano consumer dovrebbero verosimilmente raddoppiare. I 200 dollari del piano Max dovrebbero diventare 400, 1.000, forse 4.000 al mese, a seconda di quanto un utente medio consuma davvero. Sono i conti di un imprenditore davanti a un P&L, non di un analista davanti a una slide.
Il caso Uber lo conferma: 1.500 dollari al mese di tetto introdotto per ogni developer dopo aver scoperto utenti che bruciavano 40.000 dollari mensili sotto regimi all-you-can-eat.
Quaranta-Mila.
Per una persona.
In un mese.
Quello è il costo vero del power user enterprise, ed è esattamente quello che Anthropic sta scoprendo di non potersi più permettere di sussidiare. Ma un’azienda con quei soldi ci paga parecchi dipendenti umani, che magari non saranno cool ma alla fine conta che il lavoro sia fatto.
Se Anthropic alzasse i prezzi al livello del costo reale, il prodotto si svuoterebbe in un trimestre. Lo dicono gli utenti Reddit, quelli che oggi pagano 200 dollari al mese: “non posso permettermi Fable 5 o i modelli futuri”.
Resterebbero in piedi le grandi aziende con budget enterprise, ma solo in un primo momento, finché quei costi folli non diventassero insostenibili anche per loro. Da subito, sparirebbero gli sviluppatori indipendenti, le startup, i prosumer. Il mercato di Anthropic è oggi anche e soprattutto quel pubblico tecnico medio-alto che si paga il piano con la propria carta. Toglilo, e la storia di crescita su cui si reggono i 965 miliardi di valutazione perde il proprio motore narrativo.
La terza via si chiama hype: serve a giustificare i prezzi alti e a nascondere le magagne.
Due opzioni, entrambe poco sostenibili: sussidiare e bruciare cassa (dipendendo dai mega-round per arrivare a fine trimestre), oppure alzare i prezzi e perdere il mercato. L’unica terza via praticabile la vediamo applicata in questi giorni: lanciare un nuovo modello al doppio del prezzo, raccontarlo come la svolta che giustifica il salto tariffario, nascondere il rate limiting dietro la patina della safety.
Ma comunque, se anche dovesse funzionare e decine di migliaia accettassero di pagare di più… comunque non basterebbe.
Ecco, allora senza la narrativa pompata della “svolta storica” il salto tariffario sarebbe ingiustificabile. Il “99% fuffa” del titolo è il rapporto fra capacità reale del modello e racconto che lo accompagna. Senza il racconto, il listino non regge. Senza il listino, i mega-round non si chiudono. Senza i mega-round, l’infrastruttura non si finanzia. Senza l’infrastruttura, l’azienda non sopravvive ai prossimi diciotto mesi.
Sanders, Trump, Altman e la grande barzelletta del salvataggio in giacca democratica
In mezzo a questa cassa che brucia e a queste IPO da forzare, è arrivata sul tavolo della politica americana una proposta che sembra una mossa di sinistra radicale e a guardarla meglio è qualcosa di molto diverso.
Il senatore Bernie Sanders, autoproclamato socialista democratico, ha annunciato all’inizio di giugno 2026 l’American AI Sovereign Wealth Fund Act. Una legge che imporrebbe un’imposta una tantum del 50% pagata in azioni (non in cash) alle grandi AI americane: OpenAI, Anthropic e xAI in testa (op-ed sul Senate). Il governo otterrebbe diritti di voto e seggi nei consigli di amministrazione pari alla partecipazione. I ricavi del fondo finanzierebbero un dividendo diretto ai cittadini americani. Modello: il Permanent Fund dell’Alaska sui proventi del petrolio.
Detta così suona populista standard: socializziamo i profitti come abbiamo fatto col petrolio.
Poi il 5 giugno 2026 è arrivato il colpo di scena. Donald Trump ha dichiarato che il suo governo sta valutando di prendere equity stakes diretti in OpenAI, Anthropic e xAI, e che ne parlerà con i CEO alla Casa Bianca (Fortune sull’allineamento Trump–Sanders). Sotto Trump il Tesoro detiene già partecipazioni in una ventina di aziende private. Il giorno dopo l’amministrazione ha confermato i colloqui con OpenAI per definire la struttura (CNBC).
E Sam Altman? Ha trovato l’idea così promettente da incontrarsi in privato con Sanders un’ora dopo l’annuncio (Fortune sull’incontro). Ha detto che la conversazione è stata “ottima”, che è d’accordo sul fondo pubblico, ma che il 50% è troppo. Preferirebbe una “donazione volontaria” molto più piccola.
Dimentichiamoci che Altman aveva già abbozzato una proposta simile in un policy paper di aprile, e che la stava facendo circolare nei corridoi del governo dal 2025.
Sul piano politico è l’unione più strana del decennio. Un settantacinquenne socialista democratico, il presidente repubblicano che ha smontato EPA e NIH, un CEO della Silicon Valley con tendenze libertarie. Tutti e tre d’accordo: lo Stato entri nel capitale delle big AI.
Sul piano economico, l’allineamento ha senso eccome.
Bastava guardare i numeri della sezione precedente. OpenAI brucia 25 miliardi nel 2026, 57 nel 2027, e la cassa disponibile copre poco più di un anno. Senza un soggetto disposto a sottoscrivere debito pubblico a fondo perduto, l’IPO da un trilione diventa difficile da chiudere. Lo dice un analista del New York Times via Tom’s Hardware: OpenAI potrebbe esaurire la cassa entro metà 2027 senza nuova liquidità in massa.
Sanders propone, Trump endorsa, Altman ringrazia: socialismo e capitalismo si baciano sulla bolletta del compute.
Ed eccoci al punto che fa girare le scatole.
*Nazionalizzare il 50% di un’azienda che brucia decine di miliardi all’anno non è redistribuzione della ricchezza. È redistribuzione delle perdite.*
Il fondo sovrano di Sanders riceverebbe azioni di aziende che non hanno mai pagato un dividendo, hanno margini lordi al 33% (calanti) e prevedono cash flow positivo non prima del 2030. *Tradotto: il fondo sovrano dovrebbe finanziare il proprio mantenimento con la liquidità di altre fonti, fino al giorno in cui OpenAI, Anthropic e xAI cominceranno a generare profitti veri. Se arriverà.*
Nel frattempo, il debito pluriennale, i 665 miliardi di impegni cumulati al 2030, gli affitti per i data center, i contratti pluriennali con Nvidia: tutto diventa corresponsabilità del Tesoro statunitense. Il contribuente americano si compra, senza saperlo, metà di una voragine.
Sam Altman lo sa benissimo, ed è per questo che gli piace. Avere lo Stato come socio è il sogno di un fondatore con un wall di pagamenti da centinaia di miliardi. Scarica metà del rischio sui contribuenti senza perdere il controllo operativo, perché il governo come azionista è notoriamente meno aggressivo del consiglio privato. Altman si toglie le castagne dal fuoco, gli investitori privati monetizzano in IPO una valutazione altrimenti impossibile, e il cittadino medio scopre solo dopo che il suo “dividendo” è in realtà la rateizzazione del salvataggio.
Tagliare il debito ai privati col denaro pubblico ha un nome storico, e non si è mai chiamato “redistribuzione”.
Non sono il solo a pensarla così. David Sacks, ex AI czar dell’amministrazione Trump, ha definito la proposta Sanders una “stupidity tax” e ha messo in guardia contro la “corporate-government fusion” già in corso (Fortune su Sacks). Elizabeth Warren ha interrogato il CFO di OpenAI Sarah Friar dopo che lei aveva chiesto pubblicamente un “government backstop” per i data center, e ha pubblicato la corrispondenza (Warren sul caso Friar). Diversi senatori repubblicani hanno preso le distanze dalla linea Trump.
Quindi il fronte non è uniforme. Persino dentro il GOP qualcuno ha capito.
E qui devo dire la mia, anche se controcorrente. La risposta giusta a una bolla di queste dimensioni non è socializzarla a metà. È lasciare che funzioni come una bolla.
Significa permettere che chi ha fatto male i conti li rifaccia da privato. Che gli investitori che hanno scommesso troppo perdano la scommessa. Che — nel caso peggiore — qualcuna di queste aziende chiuda o venga assorbita da un acquirente con tasche più profonde.
La tecnologia non scompare con l’azienda che la possiede. I pesi del modello sono replicabili, gli ingegneri che li hanno addestrati cercano un nuovo lavoro il giorno dopo, l’open source recupera quello che il proprietario fallito lascia per strada. È esattamente quello che è successo con le ferrovie nell’Ottocento, con i big-name della prima dotcom, con le compagnie aeree dopo l’11 settembre. Chi non sapeva fare i conti è uscito dal mercato, la tecnologia è rimasta, e qualcun altro ha trovato il modo di renderla redditizia.
Lo so, suona contro-intuitivo. Sembra che voglia che gli investitori americani buttino centinaia di miliardi. Ma quando il sistema sta dicendo a gran voce che il prodotto non è sostenibile ai prezzi attuali, l’errore peggiore è coprire il buco con denaro pubblico per altri tre anni.
Il liberismo, qui, non è ideologia: è il modo meno costoso per i cittadini.
Una politica liberista ostinata su questo fronte è paradossalmente la migliore garanzia per il contribuente nel lungo periodo. La storia delle nazionalizzazioni di emergenza, da Lockheed nel 1971 a General Motors nel 2009, dice una cosa sola: chi entra nel capitale per salvare un’azienda non esce mai in profitto, e il contribuente paga la differenza.
Sulla nostra storia di Fable 5 questo ha un peso molto concreto. Se Anthropic e OpenAI possono contare sullo Stato che copre metà delle perdite, perdono il vincolo di mercato che oggi le costringe a raccontare ogni release come la svolta storica per giustificare il prossimo round. Quel poco di disciplina che la valutazione privata impone (cap rate, milestone, breakeven entro 2028-2030) si annacqua nel tempo lungo della politica.
E a quel punto Fable 5 non sarebbe più semplicemente un upgrade incrementale travestito da svolta storica. Sarebbe un upgrade incrementale travestito da svolta storica pagato due volte dallo stesso utente — col piano Max e col dividendo a credito.
Una barzelletta in giacca democratica.
Le voci che lo dicono da anni, e che adesso suonano profetiche
Dentro l’accademia e in una parte del venture capital sono ormai anni che si dicono le cose come stanno. Mentre i CEO parlano di svolte storiche, le voci con meno conflitti di interesse hanno già scritto il copione di questo momento nel decennio scorso.
Emily Bender della University of Washington e Timnit Gebru, ex co-lead dell’etica AI di Google, hanno coniato nel 2021 il termine “pappagalli stocastici” in un paper diventato pietra di paragone (On the Dangers of Stochastic Parrots, versione open access). La tesi: i Large Language Models cuciono insieme sequenze di forme linguistiche basate su informazioni probabilistiche, senza alcun riferimento al significato. Non capiscono, calcolano. Presentarli come quasi-pensanti è un’operazione retorica funzionale al business, non una descrizione tecnica.
Gary Marcus, scienziato cognitivo e voce critica costante, scriveva già nel 2022 il celebre “Deep learning is hitting a wall” su Nautilus (e da allora aggiorna i conti sul proprio Substack), e documenta i casi in cui i modelli falliscono in modi che un umano normale non sbaglierebbe. Per Marcus i modelli migliorano in superficie, restano fragili nel ragionamento. Ogni rilascio “epocale” del settore è stato smontato nei mesi successivi da utenti che ne hanno trovato i limiti strutturali.
Yann LeCun, Chief AI Scientist di Meta e premio Turing, è un insider che dice cose scomode al suo stesso campo. Ha dichiarato pubblicamente, più volte, che *”auto-regressive LLMs are doomed”* (profilo IEEE Spectrum). Per arrivare a sistemi davvero intelligenti, sostiene, serve un’architettura diversa che oggi non c’è, e ha messo nero su bianco la proposta nel paper “A Path Towards Autonomous Machine Intelligence”. Quando uno dei pionieri dell’AI ti dice che la strada attuale è un vicolo cieco, e tu vendi un nuovo prodotto su quella stessa strada al doppio del prezzo, qualcosa nella propaganda della “svolta storica” si incrina.
Regulatory capture: la safety chiude la porta dietro di sé.
Meredith Whittaker, presidente della Signal Foundation, e Andrew Ng, pioniere del deep learning, hanno smontato in modo coincidente quello che chiamano regulatory capture (Politico, Whittaker su doom narrative e potere, Stanford HAI su Andrew Ng). Chiedere ai governi licenze e agenzie di controllo severe è una mossa di lobbying che, dietro la facciata della responsabilità, serve a chiudere la porta dietro di sé. Solo chi ha miliardi può superare quegli ostacoli burocratici, e startup, open-source e innovazione esterna restano fuori dal recinto del mercato premium.
Goldman Sachs e Sequoia Capital pongono da tempo domande pubbliche sul ROI dell’AI generativa, calcolando che gli investimenti enormi in CapEx richiedono ricavi che, allo stato attuale, non si vedono ancora. Se l’AI si rivelasse “solo” uno strumento eccellente per automatizzare email e riassumere PDF (e nei fatti, oggi, è soprattutto questo), i modelli di business attuali collasserebbero sotto il peso dei costi operativi.
Cosa sto comprando davvero, quando pago Claude
Quando pago Claude o ChatGPT, e lo pago volentieri perché li uso e li trovo utili nei loro limiti, sto comprando due cose contemporaneamente. La prima è il servizio: il modello che mi risponde, lo strumento che mi accelera il lavoro nei task per cui è bravo davvero (scrittura strutturata, drafting, organizzazione di pensiero).
La seconda è una scommessa che non ho mai firmato. Scommetto, di fatto, che entro tre o cinque anni le cose andranno a sistemarsi da sole, i modelli frontieri si integreranno con quelli open source e con gli Small Language Model, e in qualche modo avremo strumenti potentissimi a prezzi ragionevoli. E l’inferenza diventerà super-efficiente, così, finalmente, i conti dei fornitori cominceranno a chiudere senza più bisogno di mega-round.
Un bellissimo sogno, tutto da costruire.
Una scommessa silenziosa che non ho mai firmato.
Se la scommessa si avvera, tutto fila. Se non si avvera, qualcosa salta. Molte di queste aziende hanno asset solidi al di là dell’offerta AI: Microsoft, Amazon, Google, Nvidia… loro possono anche permettersi che l’AI fallisca domani. Anthropic e OpenAI? Non tanto.
Forse salta il prezzo, e quello che oggi pago 20 dollari diventa 60 o 100… o 1000. Forse salta la concorrenza, e restano in piedi due o tre giganti consolidati che chiudono il mercato e dettano prezzi da monopolio. Forse salta la promessa epocale, e l’industria entra nella sua fase noiosa, fatta di buoni strumenti enterprise senza più keynote da rivoluzione.
Nel frattempo, ogni release viene confezionata come la soglia storica che giustifica il prossimo round, il prossimo raddoppio di prezzo, il prossimo strato di safety theater. Fable 5 è uno di questi rilasci. Sostanzialmente alla pari di un Opus 4.8 ottimizzato — i suoi stessi utenti tornano al modello precedente entro mezz’ora di sessione — costa il doppio e rifiuta domande su ricette di torte al cioccolato. Viene venduto come la prova che l’AGI è dietro l’angolo.
Scoppia o non scoppia?
Questi strumenti possono produrre valore reale, possono renderti capace di fare cose che altrimenti non avresti potuto fare (se non magari mettendoci giorni). Ti danno i super-poteri, in un certo senso.
Che ci sia del buono, non si può negare. Quando vedo Fable 5 venduto come “troppo potente per il pubblico”, quando incontro headline scritte come trailer della Marvel, quando gli utenti che pagano duecento dollari al mese dicono che il loro piano si dissolve in quaranta minuti, quando un modello frontier rifiuta una ricetta di torta come “potenzialmente pericolosa”, riconosco del rumore. Tanto rumore, tantissimo; e ti viene da domandarti *cosa ci sia dietro a quel rumore, che cosa stanno cercando di nascondere.*
Vent’anni di mestiere mi hanno insegnato a sentirlo a distanza: lo stesso si è alzato attorno al 3D, al metaverso, al Web3, allo IoT consumer. Di storie simili ne ho viste a dozzine, tranne che per la dimensione del capitale in questione. Cifre del genere non si sono mai viste prima.
È il rumore di un settore che ha bisogno di alzare la voce perché non può ancora alzare i prezzi senza svuotare il mercato. Un’industria che finanzia il proprio futuro con capitale anticipato e aspettative di scala che devono restare alte, sempre, sempre più alte.
Incrementalità travestita da rivoluzione: la formula del momento.
L’AI generativa è incrementale come industria, e Fable 5 è una buona prova di questa incrementalità travestita da svolta. È epocale come strategia di racconto, e ogni mese leggo cose che non torneranno mai dentro a un P&L. Due piani diversi, oggi inseparabili, lo resteranno fino a quando i conti non torneranno davvero. Nessuno sa quando sarà.
Fino ad allora, continuiamo a cascarci anche noi. Io continuo a leggere ogni comunicato con due paia di occhi, uno per quello che davvero il modello fa, l’altro per quello che il bilancio sta cercando di farmi credere.
Il primo paio, su Fable 5, vede un upgrade modesto venduto a prezzo doppio. Il secondo paio, sull’industria, vede una corsa contro il tempo che non può permettersi di rallentare. Conviene tenerli entrambi aperti, e ascoltare chi paga e prova davvero, prima dei comunicati ufficiali.
Se i costi di inferenza calano davvero entro tre anni, ha fatto un buon affare. Se restano dove sono, si troverà a rinegoziare condizioni in posizione di debolezza, oppure a pagare il prezzo pieno che oggi è sussidiato dai mega-round. E magari dai contribuenti americani, se la barzelletta in giacca democratica andrà in porto. Conviene scriverlo nei contratti, non darlo per scontato nelle slide.
#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
Valerio Porcu
Source link









