Si chiama Jalapeño il primo chip custom progettato da OpenAI in collaborazione con Broadcom. Lo scopo? Ottimizzare l’inferenza dei modelli linguistici di grandi dimensioni, quindi di fatto rendere ancora più efficiente la fase di uso: ad esempio quando si chiede a un chatbot di scrivere un testo, quella è inferenza.
L’acceleratore, che OpenAI ha presentato ieri come Intelligence Processor, è stato sviluppato da zero, senza adattare architetture preesistenti. Secondo le dichiarazioni delle due aziende i primi test condotti internamente mostrano un rapporto prestazioni per watt superiore allo stato dell’arte. Da ricordare che a parità di lavoro svolto un chip IA più efficiente consuma meno elettricità, scalda meno e costa meno da gestire nei data center. La prima implementazione è prevista entro la fine del 2026, nell’ambito di una piattaforma multi-generazionale.
Un progetto nato dall’interno
Jalapeño non è un acceleratore generalista riadattato, ma un chip concepito specificamente per i modelli di OpenAI. La progettazione ha tenuto conto dell’intera catena operativa dell’azienda, fino ad arrivare alle esigenze dei prodotti consumer come ChatGPT e le architetture agentiche future. Secondo il comunicato ufficiale, i campioni ingegneristici del chip sono già in esecuzione nei laboratori di OpenAI a frequenza e potenza di produzione, e girano carichi di lavoro reali tra cui GPT-5.3-Codex-Spark. Il primo campione fisico è stato consegnato a Sam Altman e Greg Brockman direttamente dai vertici di Broadcom, Hock Tan e Charlie Kawwas, come svelano le foto della nota stampa ufficiale.










