Nuove competenze: si cerca FinOps per l’AI. Cos’è e come funziona


Il rapporto State of FinOps 2026 della FinOps Foundation mette la gestione della spesa AI/ML al primo posto delle priorità per il secondo anno consecutivo. Il 98% dei manager FinOps intervistati lo dichiara, contro il 63% del 2025 e il 31% del 2024. Tre anni, e una pratica considerata di nicchia è diventata skill di sopravvivenza per il finance.

È la prima volta che una disciplina nata per governare il cloud si estende così rapidamente a un nuovo dominio di spesa. Chi non conta i token non sa quanto costa l’intelligenza artificiale che ha già attivato in azienda, e procede a vista su una voce di bilancio che cresce ogni mese.




Il salto numerico in tre anni racconta una crescita esplosiva della consapevolezza, ma la maggior parte delle aziende è ancora ferma alla prima fase del metodo. Vedere il consumo è solo l’inizio: ottimizzarlo e governarlo richiede strumenti, competenze e una cultura aziendale che oggi manca quasi ovunque.

Tre anni fa nessuno contava i token. Oggi è la priorità numero uno.

Inform, Optimize, Operate: tre passaggi che valgono milioni

Il “FinOps” applicato all’AI estende i principi classici della disciplina (visibilità, ottimizzazione, accountability) al consumo di token, GPU, training compute e inference. La struttura resta quella nota: tre fasi sequenziali che ogni organizzazione attraversa con tempi diversi.

La fase Inform serve a vedere il consumo in tempo reale: chi spende, su quale modello, per quale progetto. La maggioranza delle aziende si ferma a questo livello base, senza procedere oltre. La fase Optimize entra nel merito tecnico, sceglie il modello giusto per il task, attiva il caching sui prompt ricorrenti, batcha le chiamate non urgenti, comprime gli input.

La fase Operate trasforma il dato in governance: chargeback ai team, budget per progetto, alert automatici, policy di approvazione sopra soglia. Qui il FinOps smette di essere reporting e diventa processo aziendale strutturato.

I pattern di waste rilevati dalla FinOps Foundation sono ricorrenti e quasi sempre evitabili. Modello sovradimensionato per il task semplice, come un GPT-4o per una classificazione binaria che farebbe Haiku a un decimo del prezzo. Nessun caching sui prompt ricorrenti, quando lo sconto applicato dai vendor arriva al 90% sul contesto già visto. Background agent dimenticato attivo, che continua a girare in idle mentre il developer è in ferie. Mancato uso delle batch API, dove Anthropic e OpenAI applicano sconti del 50% per chiamate non sincrone. Output verbose dove servirebbe un solo token di risposta.

Uber ha messo il cap a 1.500 dollari per developer, e l’ha pubblicato

Il caso più eloquente lo ha raccontato Uber sul proprio engineering blog a maggio 2026. L’azienda ha introdotto un cap di 1.500 dollari al mese per developer sull’uso di Cursor e Claude Code dopo aver scoperto utenti che arrivavano a consumare 40.000 dollari mensili. La causa principale: background agent lasciati attivi, che continuavano a ragionare e generare token mentre nessuno guardava.

Casi analoghi circolano da mesi nelle community di engineering, ma raramente pubblicati con cifre nette. La pubblicazione del caso da parte di Uber ha avuto un effetto di legittimazione del cap come strumento di governance, dopo mesi in cui le aziende del settore tech avevano lasciato carta bianca agli sviluppatori per non frenare la produttività. Il modello all-you-can-eat lascia spazio a un chargeback per team con budget allocato a priori.

Gli strumenti che permettono questo livello di controllo esistono da almeno due anni, ma la loro adozione è esplosa solo quando la bolletta è diventata visibile al CFO. Cap individuali, alert automatici sopra soglia, dashboard per project leader, kill switch sui background agent inattivi. Sono funzioni base nelle piattaforme di sviluppo AI-native più recenti, ma vanno configurate con criterio.

Quarantamila dollari al mese per un developer. Senza cap, nessuno se ne accorgeva.

AWS lancia l’agente che conta la bolletta agli altri agenti

Il 9 giugno 2026 AWS ha annunciato la preview del FinOps Agent, assistente AI integrato direttamente nella Cost Management Console. Identifica spesa anomala su Bedrock e SageMaker, suggerisce ottimizzazioni concrete, prevede il consumo nelle settimane successive sulla base degli andamenti recenti. È il primo vendor cloud a integrare un agente FinOps nativo dentro la propria console di fatturazione.

Il mercato degli strumenti FinOps AI di terze parti si è popolato in fretta. Vantage Token Analytics offre un livello di dettaglio per modello e per prompt che la console del vendor difficilmente eguaglia. Datadog AI Cost Insights aggrega consumo da provider diversi nella stessa dashboard di osservabilità che i team usano per le metriche applicative. CloudZero AI Spend Intelligence si concentra sull’attribuzione del costo per feature di prodotto, utile a chi vuole capire quanto costa ogni funzionalità AI per utente attivo. Azure Cost Management permette tagging granulare su risorse AI per allocare il costo ai centri di responsabilità.

Accanto agli strumenti orizzontali ci sono le API native dei vendor di modelli. Anthropic ha una Usage API dettagliata, Google la traccia su Vertex AI, OpenAI espone dashboard per organizzazione e progetto. Lo stack tecnico per fare FinOps AI è quindi disponibile e in larga parte già pagato dalle aziende. Manca chi sappia usarlo.

In Italia si cerca chi sa contare, e si paga bene

I dati italiani raccontano un mercato del lavoro che sta correndo dietro alla domanda. Excelsior Unioncamere registra a maggio 2026 una crescita del 210% anno su anno nelle ricerche di personale con competenze in AI cost management presso le grandi imprese. KPMG Italia, in una survey di marzo, segnala che l’82% dei manager IT dichiara di non avere visibilità sul costo AI attualmente sostenuto dall’azienda.

Il quadro peggiora scendendo nella fascia PMI. Gli Osservatori del Politecnico di Milano rilevano che il 76% delle piccole e medie imprese italiane non ha piani AI strutturati. Chi non ha piano AI non ha nemmeno FinOps AI, e il gap rispetto alle grandi si allarga su un fronte ulteriore. Quando la fattura arriverà, troveranno il consuntivo senza strumenti per leggerlo.

I salari riflettono la scarsità di profili. Hays Italy Salary Guide 2026 colloca un FinOps AI Lead a Milano nella fascia 70-95 mila euro RAL, un Cloud FinOps Architect senior tra 85 e 110 mila euro, con una crescita del 18% anno su anno sui livelli equivalenti del 2025. Sono numeri da mercato tirato, su un profilo che combina competenze finance, cloud e AI difficili da trovare nello stesso curriculum.

Più 210% sulle ricerche. Più 18% sui salari. Il mercato non aspetta.

La fattura è arrivata sul desk del CFO

Il FinOps per AI è la diretta conseguenza di un cambio strutturale nel modo in cui le aziende pagano l’intelligenza artificiale. Fino al 2023 il costo era invisibile, perché il training restava centralizzato e veniva ammortizzato su tempi lunghi. Oggi è visibile e variabile: ogni chiamata API ha un prezzo, ogni token genera una riga di consumo, ogni agente dimenticato attivo brucia budget in tempo reale. La curva 31-63-98 in tre anni registra il rumore di sottofondo della prima vera fattura AI che arriva sul desk del CFO.

Le aziende italiane che pensano di poter saltare la fase FinOps stanno semplicemente accumulando waste invisibile, finché il fornitore non rivede i prezzi o l’ufficio acquisti non chiama per chiedere conto della voce in crescita. È lo stesso errore commesso un decennio fa con il cloud, quando il pay-per-use sembrava ovvio e poi è esploso in bollette inattese che hanno costretto a ricostruire il governo della spesa a posteriori. Stavolta il copione è noto e gli strumenti esistono, ma la competenza tecnica per usarli scarseggia.

Chi assume un FinOps AI Lead oggi sta comprando visibilità su una voce di spesa che entro diciotto mesi sarà la terza in budget IT, dopo personale e cloud generale. È un investimento che si ripaga prima del primo bonus, perché il primo intervento serio su modelli sovradimensionati, caching mancante e agent dimenticati produce risparmi a doppia cifra sul costo AI annuale. Le aziende che hanno già attraversato la curva FinOps cloud lo sanno, e infatti partono avvantaggiate. Le altre scopriranno la disciplina nel modo classico: con una bolletta che non torna e una riunione di emergenza in CDA.


#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
 Marco Ferretti

Source link

Di