I consumi energetici dell’intelligenza artificiale sono osservati speciali. Vale anche per Gemini, uno dei sistema di AI di casa Google, che ha deciso di sviluppare un metodo per misurare il suo impatto. Secondo un recente report pubblicato dall'Agenzia internazionale dell'energia, sistemi come ChatGPT richiedono un quantitativo sempre maggiore di elettricità e acqua per il loro funzionamento e l’addestramento dei modelli di AI. Queste risorse energetiche sono necessarie per sostenere data center e processi informatici complessi, il cui consumo, secondo il report, è destinato a raddoppiare entro il 2030. Per questo motivo è necessario disporre di parametri validi che garantiscano che questi modelli vengano sviluppati nel modo più efficiente possibile e riducano la propria incidenza ambientale.Per limitare l'impatto dell'intelligenza artificiale è fondamentale avere una comprensione chiara e completa della sua impronta ambientale. Fino ad ora i dati completi sull'impatto energetico e ambientale dell'inferenza dell'intelligenza artificiale sono stati limitati. Molti calcoli attuali includono solo il consumo attivo delle macchine, trascurando tutti gli altri fattori. In questo contesto, Google ha sviluppato una metodologia completa per misurare l’impatto ambientale dell’AI, che include energia, acqua ed emissioni di Co2, e considera Cpu, Ram e overhead dei data center.Il documento di GooglePer comprendere al meglio il carico energetico dei modelli di intelligenza artificiale di Google, il colosso di Mountain View ha pubblicato un paper dettagliato. Il documento analizza tutti gli elementi fondamentali della fornitura di AI a livello globale, offrendo una visione quanto più completa dell'impatto di un singolo prompt di testo. Secondo il documento tecnico, il median prompt (prompt medio in termini di energia) di Gemini utilizza 0,24 wattora (Wh) di energia, emette 0,03 grammi di anidride carbonica equivalente (Co2e) e consuma 0,26 millilitri d’acqua, un impatto energetico per prompt che equivale a guardare la tv per meno di nove secondi.Secondo il documento, i sistemi di AI di Google stanno diventando sempre più efficienti grazie alle innovazioni, alla ricerca e alle migliorie in termini di hardware e software. L’adozione di energia senza emissioni di carbonio e la rigenerazione delle risorse idriche ha portato in 12 mesi alla diminuzione di 33 volte e 44 volte dell’energia e dell’impronta totale di carbonio del prompt di testo mediano di Gemini.Per calcolare l’impronta ambientale dell’AI, Google ha sviluppato un metodo che tiene conto di diversi fattori, che includono tutti i consumi reali del sistema, come l’acqua e l’energia utilizzate. Tra gli elementi che vengono tenuti in considerazione ci sono le risorse inattive, macchine e chip pronti all’uso che consumano energia, Cpu e la Ram, l’infrastruttura che supporta i sistemi, come la distribuzione dell’energia, i sistemi di raffreddamento, l’overhead dei data center e il consumo idrico degli stessi.L'impatto dell'intelligenza artificialeSecondo il documento, i progressi in termini di efficienza di Gemini derivano dall’ecosistema integrato che Google ha sviluppato attorno ai propri modelli di intelligenza artificiale. Gemini sfrutta l’architettura Transformer, che è molto più efficiente rispetto alle soluzioni precedenti, e ha introdotto tecniche come i Mixture-of-Experts, che permettono di usare solo una parte del modello quando serve, riducendo così i calcoli e i consumi, o tecnologie come la decodifica speculativa o l’elaborazione batch di grandi quantità di richieste in maniera efficiente. Anche gli algoritmi vengono ottimizzati, ad esempio con la quantizzazione, che mantiene la qualità delle risposte ma consuma meno energia. Un elemento cruciale è l’hardware: da oltre dieci anni Google progetta Tpu dedicate all’AI, molto più efficienti delle Cpu generiche, e l’ultima generazione, chiamata Ironwood, offre miglioramenti enormi in termini di prestazioni per watt.A questo si aggiunge un uso dinamico delle risorse, che riduce i tempi di inattività spostando i modelli tra Cpu e Tpu in base alla domanda quasi in tempo reale. L’efficienza è sostenuta anche dal software, con strumenti come il compilatore Xla e i sistemi Pathways, che permettono di eseguire in modo veloce ed efficiente i calcoli dei modelli scritti in linguaggi come Jax sull’hardware Tpu. Tutto questo ecosistema opera all’interno di data center tra i più efficienti al mondo, alimentati sempre più da energia pulita e progettati per restituire più acqua di quanta ne consumino, con sistemi di raffreddamento ottimizzati in base alle condizioni locali.