Microsoft Copilot diventa a consumo, porta DeepSeek dentro Windows


Microsoft sposta Copilot Cowork a un modello a consumo e valuta DeepSeek V4 come opzione meno costosa, ospitata sui server Azure. Lo dichiara ad Axios Charles Lamanna, vicepresidente esecutivo Copilot, agenti e piattaforma, spiegando che il canone piatto non regge utenti che lanciano centinaia di task a settimana. La transizione si inserisce in un mercato degli agenti che sta uscendo dal modello SaaS classico: GitHub Copilot è già passato ai crediti il primo giugno, Anthropic ha annunciato e poi ritirato la separazione del piano Agent SDK dall’abbonamento fisso, OpenAI continua a ricordare che i token costano. Cambia il modo in cui i CIO devono ragionare sull’investimento in agenti: non più costo prevedibile per postazione, ma scenari di consumo legati al numero e alla complessità delle operazioni autonome.

Chi firma il contratto si trova davanti a una voce di spesa che cambia natura. Fino a ieri stava in una colonna stabile del budget IT, da adesso diventa una bolletta variabile, agganciata a quanti task ciascun dipendente delega all’agente, e con che frequenza. Microsoft 365 E7 “Frontier Suite” era stato presentato a 99 dollari per utente al mese, una cifra leggibile come canone. Quella cifra resta solo come riferimento storico per costruire scenari di confronto.

Il forfait sull’agente non regge centinaia di task a settimana per utente.

Il canone piatto sull’agente non regge i conti

La frase di Lamanna ad Axios è secca: “We have users who do hundreds of tasks a week, which is great — they’re way productive — but the consequence is the costs can go very high”. Tradotta in italiano commerciale, Microsoft perdeva soldi sui clienti più produttivi. L’agente che lavora bene è anche l’agente che brucia token, e il forfait per postazione assorbe solo fino a un certo livello di intensità. Sopra quel livello la matematica diventa insostenibile.

Il fenomeno non è isolato. Su Tom’s Hardware abbiamo raccontato come la bolletta dei token salga in azienda e come alcune aziende stiano frenando sulla spinta massima sul consumo di token (quello che in inglese viene chiamato “tokenmaxxing”), proprio per i conti che non tornano. Fino a qualche mese fa il problema era del cliente, che pagava la fattura cloud o le API. Adesso il problema è del fornitore di agenti, che ha venduto un forfait su un servizio il cui costo marginale non è zero come per il software tradizionale.

Sam Altman l’aveva riconosciuto pubblicamente: i token costano troppo per sostenere modelli di business basati sull’illimitato. Gartner sostiene che i prezzi dell’intelligenza artificiale sono nel caos, e il movimento di queste settimane lo conferma. Il giorno stesso in cui Microsoft annuncia il passaggio, Anthropic ha dovuto rinviare la separazione Agent SDK dal piano flat per la protesta degli sviluppatori. Ogni fornitore cerca il proprio equilibrio fra margine industriale e pazienza del cliente.

“I costi possono salire molto” dice Lamanna: traduzione, Microsoft perdeva soldi.

DeepSeek dentro Windows, la scorciatoia sui margini che apre il vaso di Pandora

La parte più interessante dell’intervista riguarda il modello sotto il cofano. Oggi Copilot Cowork usa Anthropic e OpenAI, dopo essere nato su Claude. Nelle prossime settimane Microsoft valuta di aggiungere una versione fine-tuned di DeepSeek V4, il modello cinese open weight che ha rotto gli equilibri di prezzo del mercato. L’hosting sarebbe completamente su Azure, con i controlli enterprise sulla sicurezza e sulla residenza dei dati standard del cloud Microsoft. Lamanna sottolinea che il fine-tuning include interventi per ridurre i bias del modello, coerentemente con il framing di sicurezza già adottato da Microsoft sui modelli aperti.

La lettura editoriale non può essere quella della strategia multi-modello come apertura. Microsoft non sta facendo politica industriale per la pluralità dei fornitori. Sta cercando un modello che costi meno per token, in modo da ricostruire un margine sostenibile sulla nuova tariffazione a consumo. Il cliente accederà a un menù di modelli con costi diversi: Anthropic e OpenAI per i task pregiati, DeepSeek per quelli di volume. Sulla carta, ognuno paga per quello che usa. Nella pratica, ogni reparto IT dovrà costruire una griglia di scelta che oggi nessuno ha pronta in cassetto.

Un fornitore statunitense come Microsoft espone modelli cinesi dentro Windows, in ambienti enterprise, su task autonomi che toccano email, documenti, fogli di calcolo. La residenza dei dati su Azure copre lo storage, non l’origine del modello né il dataset su cui è stato addestrato. DeepSeek resta cinese sul piano della provenienza, anche se i pesi vengono caricati su server europei. Il Garante italiano aveva già messo nel mirino DeepSeek all’inizio dell’anno, con un’istruttoria sulla privacy degli utenti italiani. Una cosa è scaricare l’app cinese sul telefono, un’altra è far processare un documento aziendale a un modello cinese ospitato sul cloud Microsoft.

Il multi-modello non è apertura, è strategia per scaricare costi sui clienti.

Le quattro decisioni che il CIO deve prendere subito

Il passaggio impone al responsabile IT quattro scelte concrete.

Scenari di consumo. Serve una matrice di utilizzo per famiglia di task (sintesi documentale, ricerca interna, automazione su Outlook, Teams, Excel), con una stima del numero di chiamate al modello per ciascun task. Da qui si costruiscono scenari a 90 giorni su tre livelli di intensità e si confrontano con il costo del precedente canone Frontier Suite. Senza alert di soglia per utente e per unità di business, la prima fattura arriverà piena di sorprese.

Modelli ammessi. Va stabilita una lista di modelli abilitabili dentro Cowork (Anthropic, OpenAI, opzionale DeepSeek), con regole di default per ruolo. Legale e finanza vincolati a modelli con SLA contrattualizzati, ricerca e marketing aperti al modello a basso costo. Va definito chi può attivare il modello cinese e con quale flusso di approvazione, altrimenti la scelta resta in mano al singolo utente.

Vincoli geografici. Va mappato quali carichi ricadono sotto GDPR, NIS2, DORA, AI Act, e se l’opzione DeepSeek è disattivabile a livello tenant per business unit regolate o per geografia. Il cloud sovrano non basta da solo, e l’aggiunta di un modello extra-europeo nello stack agentico richiede una valutazione di investimento aggiornata.

Dati sensibili. Vanno censiti i dati che entrano nei prompt (informazioni personali, dati sanitari, segreti industriali, codice proprietario) e definita una regola di abbinamento: dato sensibile alto a modello vincolato, dato non sensibile a modello a basso costo. Senza logging granulare per audit ex post, sarà impossibile giustificare a un revisore la scelta del modello su un singolo task autonomo.

La residenza dei dati copre lo storage, non l’origine del modello.

La sovranità dei dati non basta se il modello viene da Hangzhou

Microsoft ammette implicitamente che il canone piatto sugli agenti era un’illusione di mercato. Il modello a consumo è la prima fase di un riprezzamento sistemico che riguarda tutti i fornitori, e arriva nel momento in cui tre aziende su quattro non sanno ancora orchestrare gli agenti che già hanno comprato. Senza un’orchestrazione capace di scegliere quale task va su quale modello, il consumo diventa una bolletta cieca: si paga senza sapere bene cosa, perché, per chi.

La valutazione di DeepSeek non è una scelta neutra di efficienza. Sposta la domanda dalla geografia dei dati alla genealogia del modello, e introduce un asse di rischio che il CIO non ha mai dovuto governare prima. Fino a ieri la lista delle domande era se i dati restavano in Europa e chi gestiva le chiavi di cifratura. Da adesso la lista include la nazionalità del modello che processa quei dati, il dataset su cui è stato addestrato, i bias documentati e quelli ancora non documentati. L’hosting Azure copre la prima metà del problema, non la seconda. La seconda metà richiede regole interne che oggi non esistono in nessuna procedura standard.

Per chi compra agenti nel 2026 la lezione è che l’era del costo prevedibile è finita, e con essa l’illusione che la sovranità dei dati si esaurisca nella scelta del cloud provider. Ogni decisione sul modello è una decisione su tre assi insieme (costo, prestazioni, sovranità), e nessuno dei tre può essere ignorato. Il mercato sta riprezzando gli agenti tutto insieme, e ognuno cerca un equilibrio diverso fra il proprio margine e la pazienza del cliente. Chi compra deve separare il prezzo basso di oggi dal costo totale di domani.


#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
 Marco Ferretti

Source link

Di