NVIDIA Vera è la nuova CPU pensata per gli agenti

Il mercato dei processori per i data center è sul punto di attraversare una trasformazione. Durante il Computex 2026, il colosso dei chip capitanato da Jensen Huang ha presentato ufficialmente NVIDIA Vera, la sua prima CPU progettato specificamente per l’era dell’intelligenza artificiale agentiva — quella in cui i modelli non si limitano più a rispondere a domande, ma eseguono codice, utilizzano strumenti, orchestrano processi complessi e valutano autonomamente i risultati. La CPU è ora in piena produzione e vanta un ecosistema di adozione che include alcuni dei nomi più importanti del settore tecnologico mondiale.

Il dato tecnico che più colpisce è la promessa di prestazioni 1,8 volte superiori rispetto alle CPU x86 nel completamento di carichi di lavoro agentivi, con ricadute dirette sulla quantità di token generabili per unità di tempo in un centro elaborazione dati. Questo parametro (i token per dollaro anziché dei core per dollaro) rappresenta la nuova metrica economica intorno a cui ruota la progettazione dei processori nell’era AI, e NVIDIA ha costruito Vera esattamente attorno a questa logica.

Al cuore di Vera risiede un core personalizzato denominato Olympus, sviluppato internamente da NVIDIA per gestire il lavoro computazionale tipico delle pipeline agentive: runtime Python, esecuzione di codice in ambienti isolati (sandbox), logica di orchestrazione e pipeline di analisi dei dati. L’architettura integra 88 core Olympus, la tecnologia Spatial Multithreading e un sottosistema di memoria LPDDR5X capace di offrire una larghezza di banda fino a 1,2 TB/s — un valore pensato per ridurre al minimo i tempi di attesa delle GPU sulle fasi legate alla CPU.

Vera costruisce sulle fondamenta di NVIDIA Grace, i processori ARM-based di precedente generazione che hanno raggiunto quasi 2,5 milioni di unità spedite, portando le prestazioni e l’efficienza energetica a un livello superiore. Per i sistemi NVIDIA Vera Rubin, il processore si interfaccia con le GPU tramite interconnessione NVLink-C2C di seconda generazione, che garantisce una larghezza di banda coerente tra CPU e GPU fino a 1,8 TB/s. Una specifica che, in un contesto di addestramento o inferenza distribuita, può fare la differenza tra colli di bottiglia e throughput ottimale.

Durante il suo keynote, Jensen Huang ha inquadrato la filosofia alla base del prodotto: “Gli agenti AI saranno i maggiori utilizzatori di capacità di calcolo. Vera è la prima CPU progettata per quell’orizzonte futuro — costruita per eseguire AI agentiva su scala iperscalare con prestazioni, efficienza e programmabilità straordinarie.” Una visione che si traduce concretamente nell’architettura del chip, capace di gestire simultaneamente un elevato numero di ambienti concorrenti, query parallele e operazioni di elaborazione dati.

Le prestazioni di Vera sono state validate dalla suite di benchmark open source di Phoronix, che ha registrato le performance più elevate nei carichi di lavoro agentivi — tra cui compilazione di codice, Python, Java e database processing — rispetto alle soluzioni x86 concorrenti. Questi carichi si trovano sul percorso critico delle moderne fabbriche AI, dove una CPU più veloce si traduce direttamente in maggiore interattività e throughput degli agenti.

Sul fronte dell’adozione, Anthropic (la società dietro Claude), OpenAI e SpaceXAI stanno valutando l’integrazione di Vera per scalare i carichi agentivi ad alta intensità CPU. James Bradbury, responsabile del calcolo ad Anthropic, ha commentato: “Siamo entusiasti di vedere Vera emergere come una componente promettente dell’ecosistema per i carichi agentivi.” Tra i fornitori di servizi cloud, figurano ByteDance, CoreWeave, Oracle Cloud Infrastructure (OCI), Lambda, Nebius, Nscale, Akamai, Cloudflare, Crusoe, Together AI e Vultr.

Un caso d’uso particolarmente interessante viene dal settore finanziario: la NYSE (Borsa di New York) ha dichiarato l’intenzione di adottare Vera — in collaborazione con Redpanda e HPE — per gestire gli oltre 1,1 trilioni di messaggi al giorno che transitano sulla sua infrastruttura. Lynn Martin, presidente di NYSE Group, ha sottolineato come l’obiettivo sia ottimizzare latenza, throughput e affidabilità dei sistemi sottostanti, puntando a costruire un’infrastruttura di mercato ad alte prestazioni, resiliente e pronta per l’AI.

Vera non è pensata per operare solo come CPU standalone: è il processore host per le piattaforme NVIDIA Vera Rubin e alimenta anche il processore NVIDIA Vera BlueField-4 STX, che integra rete ad alte prestazioni, accelerazione dello storage e sicurezza implementata direttamente nel silicio per creare piattaforme di storage AI-native con sicurezza by design. La CPU estende inoltre il framework NVIDIA Confidential Computing su scala rack, proteggendo i carichi agentivi a livello hardware.

Sul fronte produttivo, l’ecosistema di partner costruttori di sistemi è già ampiamente strutturato e include Dell Technologies, HPE, Lenovo e Supermicro come produttori principali di sistemi server Vera standalone — segnando di fatto la prima alternativa CPU standard al duopolio x86 di Intel e AMD. Completano il quadro produttori come ASUS, Compal, Foxconn, GIGABYTE, Pegatron, Quanta Cloud Technology (QCT), Wistron, Wiwynn, Aivres, ASRock Rack, Hyve Solutions, Inventec, MiTAC Computing e MSI. I sistemi saranno disponibili sia in configurazioni a rack denso con raffreddamento a liquido per ambienti di addestramento e reinforcement learning su larga scala, sia in configurazioni a due socket con raffreddamento ad aria per deployment enterprise e cloud.

La disponibilità commerciale dei sistemi basati su NVIDIA Vera è attesa a partire dall’autunno 2026, sia attraverso i partner produttori di sistema sia tramite i fornitori di servizi cloud. La vera sfida, a quel punto, sarà verificare se le promesse prestazionali reggono nei deployment reali su larga scala — e se l’ecosistema software saprà sfruttare appieno le peculiarità architetturali di Olympus rispetto alle implementazioni x86 consolidate.

#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
Marco Pedrani

Source link

Di

Di

Articoli correlati

Da bene confiscato a presidio di legalità, inaugurata la nuova caserma dei carabinieri di Lazzaro

Il caldo alimenta l’ameba magia-cervello, l’infezione killer che uccide in silenzio. Sintomi, come si contrae e dove si trova

Maltempo, Reggio Emilia conta i danni e lavora per la normalità

You missed

Da bene confiscato a presidio di legalità, inaugurata la nuova caserma dei carabinieri di Lazzaro

Il caldo alimenta l’ameba magia-cervello, l’infezione killer che uccide in silenzio. Sintomi, come si contrae e dove si trova

Maltempo, Reggio Emilia conta i danni e lavora per la normalità

ecco come, dove e quando verranno utilizzati i 145 milioni per la depurazione

#Adessonews - #Finsubito - Adessonews - Finsubito