Nvidia ha costruito il sistema di raffreddamento per i data center Rubin NVL72 in modo da eliminare completamente i ventilatori, chiudere il ciclo dell’acqua in un loop sigillato e portare il consumo idrico netto a zero. Il liquido refrigerante entra nei server a 45°C e ne esce tra i 55 e i 65°C, scaldato dal calore delle GPU, e viene poi dissipato da “dry cooler” all’aperto senza evaporare. Il risultato è un’infrastruttura che gira senza fan e senza serbatoio d’acqua da reintegrare.
Questo conta perché il consumo idrico dei data center è diventato uno dei punti critici del dibattito sull’impatto ambientale dell’AI. L’ONU stima che il consumo idrico legato all’intelligenza artificiale potrebbe raggiungere, entro fine decennio, il fabbisogno annuo di 1,3 miliardi di persone. I data center hanno un problema con l’acqua che fino ad oggi nessun costruttore aveva affrontato in modo strutturale a livello di architettura hardware. Nvidia lo ha fatto.
▶” frameborder=”0″ allow=”accelerometer; autoplay; encrypted-media; gyroscope; picture-in-picture” allowfullscreen title=”Vedi il video”>
Il fluido usato nel loop è una miscela di 75% acqua e 25% glicole propilenico, ricircolata indefinitamente senza dispersione. Ali Heydari, responsabile dell’ingegneria dei data center per Nvidia, ha spiegato che “con questo sistema abbiamo eliminato enormi quantità di consumo energetico e quasi tutto il consumo idrico”. La dichiarazione riflette una scelta architetturale precisa, presa fin dalla fase di progettazione, che ha eliminato sia i chiller (macchine frigorifere a compressore, grandi consumatori energetici) sia la torre evaporativa.
A 45 gradi il liquido scorre, il chiller si ferma, l’acqua rimane nel loop.
Un loop chiuso a 45°C: come Nvidia ha eliminato i chiller e quasi tutta l’acqua
La scelta di operare il liquido a 45°C in ingresso è tecnica e architetturale insieme. A quella temperatura, il ciclo non richiede chiller per abbassare la temperatura del fluido prima di rimandarlo nei server: basta un dry cooler (un radiatore all’aperto con ventilatori) che disperde il calore per convezione, senza acqua evaporativa. Questo è il salto rispetto ai sistemi convenzionali che operano con acqua fredda a 15-20°C, richiedono chiller con compressori ad alta potenza, e usano torri di raffreddamento evaporative che consumano acqua dolce ogni ora.
Il consumo energetico si riduce perché vengono eliminati i compressori dei chiller, che nelle architetture tradizionali assorbono una quota rilevante della potenza elettrica totale dell’impianto. Nvidia cita una riduzione del consumo energetico complessivo del data center, oltre all’azzeramento del consumo idrico. Entrambi i benefici derivano dalla stessa scelta a monte: operare il ciclo termico a temperatura più alta, abbastanza da dissipare calore nell’ambiente senza raffreddamento attivo.
Il sistema è stato progettato specificamente per i rack NVL72 che montano le GPU Rubin e i relativi componenti. Ogni componente è raffreddato a liquido: GPU, CPU, unità di memoria, switch di rete. Non ci sono ventilatori interni ai server, il che elimina anche il rumore e semplifica la manutenzione meccanica. La potenza per rack sale a 600 kW con l’architettura Rubin, un dato che rende il raffreddamento ad aria tradizionale impraticabile indipendentemente dall’efficienza idrica.
Niente chiller, niente fan, niente acqua evaporata: il costo è nel retrofit.
Il problema che Nvidia non risolve: i data center che esistono già
La soluzione è elegante per i nuovi impianti. Per i data center esistenti è un problema di retrofit che Nvidia non affronta, e che nessuno ha ancora affrontato in modo sistematico. La stragrande maggioranza dell’infrastruttura globale è già costruita con architetture ad aria e raffreddamento ad acqua convenzionale. Convertire un data center esistente a raffreddamento liquido chiuso richiede interventi strutturali alle tubature, ai rack, all’infrastruttura di distribuzione del fluido, e in molti casi alla struttura portante degli edifici.
Il costo di conversione è ordini di grandezza superiore al costo di un data center nuovo progettato nativamente per il raffreddamento liquido. I grandi operatori cloud stanno valutando la transizione, ma la tempistica è vincolata ai cicli di ammortamento dell’infrastruttura esistente, non alle tempistiche di disponibilità della tecnologia. Il gap tra la disponibilità della soluzione e la scala del problema da risolvere resterà ampio per almeno un decennio.
C’è poi la questione della distribuzione geografica. I dry cooler funzionano efficacemente dove le temperature ambientali lo consentono. In climi caldi o ad alta umidità, le performance si degradano, e potrebbe rendersi necessario integrare con sistemi di raffreddamento supplementari. La soluzione Nvidia è ottimale per climi temperati; la sua applicabilità in zone climatiche diverse richiede verifiche caso per caso che Nvidia non ha ancora documentato pubblicamente.
La tecnologia c’è. Il problema è dove si trovano i data center che già esistono.
Il dettaglio tecnico di Rubin NVL72 è rilevante non solo per chi deve costruire un nuovo data center per Blackwell o per Rubin. È rilevante come indicatore di dove va l’industria: il raffreddamento liquido chiuso a temperatura elevata è la direzione obbligata per le architetture GPU di prossima generazione, perché la densità di potenza rende l’aria non più praticabile. Chi deve pianificare l’infrastruttura per i prossimi cinque anni deve tenerlo in conto indipendentemente dal vendor scelto.
L’eliminazione del consumo idrico è un beneficio reale e misurabile. Il punto che vale la pena tenere presente è che si applica all’infrastruttura nuova, progettata e costruita per Rubin, in climi dove i dry cooler sono efficaci. Proiettare questo dato sull’impatto idrico complessivo dell’AI è una semplificazione che non tiene conto della base installata, dei cicli di sostituzione, e delle differenze geografiche. Il problema dell’acqua nei data center è reale; la soluzione di Nvidia è reale; la distanza tra le due scale temporali e geografiche è altrettanto reale.
#Adessonews seleziona nella rete articoli di particolare interesse.
Se vuoi leggere l’articolo completo clicca sul seguente link
Davide Greco
Source link



