GitHub ha cambiato il modello di pricing di Copilot da abbonamento piatto a tariffazione per richiesta, e la reazione degli sviluppatori è stata aspra. Chi pagava dieci dollari al mese per uso illimitato si sta vedendo recapitare fatture da trecento dollari e oltre per lo stesso volume di lavoro, mentre il marketing parla di “modello più equo” e “trasparenza sui consumi”. Ars Technica ha raccolto le testimonianze degli utenti più colpiti, e il quadro che emerge è il manuale di scuola di come si trasforma una community fedele in un esodo verso i competitor.
Il passaggio al modello consumo non è una decisione opportunistica, è la conseguenza tecnica del fatto che gli LLM costano davvero. Microsoft paga OpenAI per ogni token elaborato, e l’aumento di capability dei modelli (finestre più ampie, ragionamento multi-step, tool use complesso) ha fatto crescere il costo per richiesta in modo non lineare. Tenere il listino piatto significava sussidiare gli utenti pesanti, e nel 2026 questi rappresentano una quota di traffico che non si può più assorbire. La logica finanziaria è quella, e in qualche modo la cosa era inevitabile. Quello che non era inevitabile è il modo in cui la transizione è stata comunicata, e questo merita un approfondimento.
▶” frameborder=”0″ allow=”accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture” allowfullscreen title=”Vedi il video”>
L’errore di comunicazione consiste nell’aver promesso prevedibilità senza fornirla. Le interfacce mostrano i consumi a posteriori, gli stimatori di costo sono approssimativi, le quote massime per utente non sono configurabili in modo granulare. Lo sviluppatore che apre Cursor o Copilot la mattina non sa quanto costerà la giornata, e questo introduce un’ansia da bolletta che corrode la produttività. Chi ha lavorato a sei dollari al milione di token su un agente non sapendo se la sessione del pomeriggio costerà cento dollari o mille capisce di cosa si parla. Il passaggio al consumo dovrebbe portare con sé strumenti di previsione e cap che oggi non ci sono, e questo problema attraversa l’intero ecosistema agentico.
Lo sviluppatore che apre l’IDE non sa quanto costerà la giornata di lavoro.
Il flat-rate non regge il costo dei token
Il modello SaaS flat-rate dell’AI sta morendo, non per scelta ma per matematica. Quando il sottostante ha un costo variabile diretto sui volumi (token in ingresso e uscita, capacità GPU, tempo di inferenza), il listino piatto funziona solo nei primi mesi quando i power user sono pochi. Appena la base utenti matura, i power user diventano la quota dominante del consumo e il sussidio incrociato non regge. È un copione già visto nel cloud computing del decennio precedente, dove i listini flat per storage e compute sono evaporati a favore del pay-per-use granulare.
La differenza con il cloud è che gli sviluppatori si erano già fatti i conti con la bolletta variabile di AWS o Azure, mentre l’utenza Copilot era stata formata sull’idea di una sottoscrizione mensile prevedibile, identica all’esperienza di Netflix o Spotify. Il salto cognitivo da “pago dieci dollari, uso quanto voglio” a “ogni richiesta ha un costo, controllerai a fine mese” è violento, e Microsoft non ha investito nella formazione necessaria a renderlo digeribile. Le aziende che hanno comprato licenze enterprise scoprono che il budget annuale Copilot è diventato non prevedibile, e questa è la cosa peggiore che possa capitare a un responsabile IT che ha già fatto firmare il piano economico.
L’effetto immediato è la migrazione. Cursor, Codeium, Continue stanno raccogliendo utenti che cercano un’esperienza Copilot-like a costo più prevedibile, anche se molti di questi stanno attraversando o attraverseranno lo stesso passaggio al consumo. Cursor in particolare ha mantenuto un’opzione a piano fisso aggressivo per la fascia individuale, e questo gli sta valendo una migrazione massiccia di sviluppatori indipendenti. Per le aziende il quadro è più complesso: switchare significa riscrivere integrazioni con i sistemi interni, ricostruire i flussi di review, ritarare le policy di sicurezza. Il costo dello switch non è banale, e questo trattiene molti clienti enterprise dal partire pur volendolo. Si tratta di un caso da manuale di lock-in non tecnico ma di processo.
Il vero costo dell’AI viene a galla
Il piano si allarga rapidamente. Chi ha comprato strumenti AI nel triennio 2023-2025 lo ha fatto su listini che nascondevano il costo reale dell’inferenza, perché il vendor sussidiava con capitale di rischio per costruire la base utenti. Nel 2026 il capitale di rischio è meno disponibile, i vendor devono trovare l’unit economics positiva, e il listino sale o cambia struttura. Chiunque pianifichi un’adozione AI nel 2026 deve assumere fatturazione variabile come scenario base, e proteggersi con cap, allertistiche e strumenti di osservabilità del consumo dal giorno uno.
Chi firma un contratto enterprise oggi deve mettere in conto accortezze contrattuali più stringenti rispetto a un anno fa. Cap mensili per utente configurabili dall’amministratore, allertistica al cinquanta e ottanta per cento di consumo, possibilità di sospendere temporaneamente l’accesso oltre soglia senza penali, reportistica granulare per dipartimento, clausola di rinegoziazione del prezzo per richiesta a sei mesi. Nessuna di queste clausole è standard nei listini Copilot enterprise 2026, e questo è il segnale per il committente di non firmare a scatola chiusa. Le condizioni si rinegoziano, soprattutto quando la concorrenza sta cannibalizzando la base utenti.
C’è anche una dimensione lavoro che il pezzo Ars Technica tocca solo di sfuggita. Nei team di sviluppo dove Copilot era diventato infrastruttura, gli sviluppatori senior avevano integrato l’assistente in flussi quotidiani profondi: generazione boilerplate, refactoring guidato, code review preliminare, scrittura di test. Togliere l’uso libero significa razionare uno strumento di produttività già internalizzato nel modo di lavorare, e questo provoca una caduta misurabile di performance percepita. Il danno non è solo economico, è di cultura interna, e si misura nei mesi successivi sul morale del team. Le aziende che ne sottovalutano l’impatto si ritrovano sviluppatori demotivati o in uscita verso competitor che mantengono accesso senza limiti.
Il modello SaaS flat-rate dell’AI sta morendo perché i token costano davvero.
La lezione vale oltre il caso Copilot
Il caso Copilot anticipa quello che succederà su molti altri tool AI nei prossimi diciotto mesi. Notion AI, Slack AI, Google Workspace AI, Microsoft 365 Copilot sono già o stanno per essere riposizionati su listini misti: una quota flat per le feature base e un consumo variabile per le capability avanzate. Chi sta pianificando l’adozione di questi strumenti sul prossimo budget annuale deve costruire scenari di costo che includano sia il floor flat sia il consumo variabile stimato, e deve farlo con dati interni di utilizzo, non con le proiezioni del vendor.
Sul piano contrattuale, la richiesta minima da inserire in trattativa è la trasparenza sui costi unitari. Quanto costa la richiesta standard, quanto la richiesta con context esteso, quanto il tool use con esecuzione di codice, quanto la generazione lunga di output. Senza queste cifre il committente non può costruire previsioni, e firmare un contratto a consumo senza prevedibilità è la garanzia di soprese a tre mesi. I vendor che resistono alla trasparenza vanno trattati come fornitori commodity, non come partner strategici.
C’è una dimensione politica dentro questo passaggio che merita di essere nominata. Il modello a consumo trasferisce sull’utente finale tutto il rischio del costo variabile, mentre il vendor mantiene il margine. Sui power user questo significa fatture che possono essere multiplo del piano flat precedente, sui light user fatture più basse. Il risultato netto è che gli sviluppatori produttivi pagano di più, mentre quelli marginali pagano di meno. È esattamente l’opposto di quello che un’azienda razionale vorrebbe incentivare. Le aziende che cercano di mantenere la produttività si trovano nella posizione assurda di disincentivare l’uso dello strumento che hanno comprato per aumentarla.
La domanda finale per chi firma è semplice: vale la pena pagare il vendor leader a costo variabile crescente, o investire in stack ibridi con modelli più piccoli per task di routine e modelli grandi solo per task complessi? La seconda strada è più rumorosa da gestire, ma riporta sotto controllo il budget. Per il committente che vuole evitare di rifare il pezzo a metà anno fiscale, è la scelta più ragionevole. Chi può aspettare sei-dodici mesi farebbe bene a vedere come si stabilizzano i listini di Cursor e degli alternativi prima di rinnovare a scatola chiusa con il vendor incumbent. Le condizioni del mercato AI cambiano in fretta, e bloccarsi su un contratto pluriennale oggi è quasi sempre il peggior consiglio possibile.
#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
Sara Romano
Source link



