Daybreak OpenAI: come l’AI genera patch contro le vulnerabilità - Agenda Digitale

Daybreak riunisce Codex Security, GPT-5.5-Cyber e Patch the Planet per spostare l’IA dalla scoperta delle vulnerabilità alla verifica e correzione delle falle, con accesso controllato, benchmark in crescita e un banco di prova decisivo nei progetti open source

giovedì 25 giugno 2026 New tab

Il problema non è più soltanto trovare una falla. È riuscire a chiuderla prima che venga sfruttata, senza introdurre nuovi errori e senza travolgere di segnalazioni i gruppi che mantengono il software.Con la piattaforma Daybreak, OpenAI scommette che l’intelligenza artificiale possa intervenire proprio in questo passaggio, trasformando la ricerca automatizzata delle vulnerabilità in un processo continuo di verifica, correzione e collaudo delle patch.Indice degli argomenti

Daybreak OpenAI: dalla vulnerabilità alla patchCodex Security e il passaggio da AardvarkCodex Security nel sistema Daybreak di OpenAIPatch, falsi positivi e regressioni da verificareGPT-5.5-Cyber e il rischio dual use nella cybersicurezzaBenchmark e accesso controllato per GPT-5.5-CyberOpen source, Patch the Planet e sicurezza in DaybreakIl carico sui manutentori open sourceLe metriche decisive per Daybreak nella cybersicurezzaDal laboratorio alle patch in produzioneFontiPresentato il 22 giugno 2026, Daybreak non è un singolo prodotto, ma un’infrastruttura che riunisce Codex Security, i modelli GPT-5.5, un programma di accesso controllato e una rete di partner industriali e istituzionali. L’idea di fondo parte da un cambiamento già visibile nella sicurezza informatica. I modelli più avanzati riescono a esaminare grandi repository, seguire percorsi di attacco e formulare ipotesi su difetti difficili da individuare manualmente. La scoperta, però, non coincide con la protezione. Ogni risultato deve essere riprodotto, valutato nel contesto del sistema, corretto e infine verificato. Daybreak concentra l’automazione su questa catena, lasciando agli operatori umani la decisione su quali modifiche accettare e distribuire.Codex Security e il passaggio da AardvarkIl punto più concreto dell’iniziativa è l’evoluzione di Codex Security, nato dalla precedente sperimentazione denominata Aardvark. Lo strumento costruisce un modello delle minacce specifico per il progetto, analizza la raggiungibilità del codice vulnerabile, cerca prove riproducibili e propone una modifica coerente con il comportamento dell’applicazione. Può inoltre rielaborare risultati provenienti da scanner, bug bounty o sistemi di ticketing e restituirli nei formati già utilizzati dai team di sicurezza, compresi SARIF e query CodeQL. Secondo i dati comunicati dall’azienda, dalla preview di marzo il servizio ha esaminato oltre 30 milioni di commit in più di 30.000 codebase; più di 70.000 problemi sono stati contrassegnati manualmente come risolti e oltre 500.000 sono stati classificati automaticamente come già corretti. Sono numeri operativi dichiarati da OpenAI, non una valutazione indipendente dell’efficacia del sistema.Codex Security nel sistema Daybreak di OpenAIL’approccio si discosta dalla scansione statica convenzionale, che tende a seguire il flusso dei dati da un ingresso non affidabile verso una funzione sensibile. Codex Security prova invece a ricostruire l’intenzione del programma e a verificare se le condizioni di sicurezza restino valide dopo trasformazioni, decodifiche e cambiamenti di stato. È una distinzione importante per vulnerabilità legate alla logica applicativa, alle autorizzazioni o all’ordine delle operazioni, casi nei quali il semplice rilevamento di una sorgente e di una destinazione pericolosa può non essere sufficiente.Patch, falsi positivi e regressioni da verificareCiò non rende obsolete le piattaforme SAST, il fuzzing o l’analisi delle dipendenze. OpenAI stessa presenta il nuovo sistema come un livello complementare, orientato ai problemi che richiedono contesto e verifica dinamica. Il vantaggio promesso consiste nel ridurre il tempo speso sui falsi positivi e nel consegnare al revisore non soltanto un avviso, ma una spiegazione, una prova e una patch da esaminare. Resta aperta la questione più delicata, ovvero quanto spesso una correzione generata automaticamente riesca a eliminare il difetto senza modificare comportamenti legittimi o introdurre regressioni difficili da osservare.GPT-5.5-Cyber e il rischio dual use nella cybersicurezzaDaybreak comprende la versione completa di GPT-5.5-Cyber, destinata a professionisti verificati che svolgono attività autorizzate di red teaming, analisi degli exploit e test di penetrazione. OpenAI riporta un risultato dell’85,6% su CyberGym, contro l’81,8% di GPT-5.5. Su ExploitGym il modello raggiungerebbe il 39,5%, rispetto al 25,95% della versione generalista, mentre su SEC-bench Pro il confronto sarebbe del 69,8% contro il 63,1%.Benchmark e accesso controllato per GPT-5.5-CyberI tre benchmark osservano competenze differenti. CyberGym misura la capacità di riprodurre vulnerabilità note in ambienti software reali, ExploitGym valuta la trasformazione di un difetto in un exploit capace di produrre un impatto concreto e SEC-bench Pro esamina attività prolungate di ricerca e generazione di proof of concept su software complessi. I risultati indicano un progresso sostanziale, ma devono essere letti all’interno delle specifiche configurazioni sperimentali. Differenze negli agenti, negli strumenti disponibili, nei tempi concessi e nei criteri di successo possono rendere improprio il confronto diretto fra valutazioni condotte da gruppi diversi.La stessa capacità di convalidare un exploit è intrinsecamente ambivalente. Può dimostrare con precisione che una patch è necessaria, ma può anche abbassare il costo tecnico di un attacco. Per questo l’accesso più permissivo non viene distribuito automaticamente. Trusted Access for Cyber prevede verifiche sull’identità, sul contesto operativo e sull’autorizzazione a esaminare i sistemi. GPT-5.5-Cyber richiede controlli ulteriori e non è incluso per il solo fatto di avere un rapporto commerciale con OpenAI. Le attività devono inoltre restare confinate a infrastrutture possedute o esplicitamente autorizzate.Open source, Patch the Planet e sicurezza in DaybreakIl programma Patch the Planet porta questa strategia nei progetti open source, dove la capacità di ricevere segnalazioni supera spesso quella di analizzarle. L’iniziativa, sviluppata con Trail of Bits e altri partner, affianca ai manutentori ricercatori incaricati di validare i risultati, eliminare i duplicati e seguire le correzioni fino all’integrazione. Nel primo ciclo di lavoro, Trail of Bits riferisce attività su 19 progetti, 64 pull request e 51 issue pubbliche, con 37 patch già incorporate; oltre 30 progetti avrebbero aderito complessivamente.Il carico sui manutentori open sourceIl modello risponde a una fragilità strutturale. Una ricerca della Linux Foundation e di Harvard ha rilevato che, nel campione analizzato, il 94% dei progetti open source più utilizzati disponeva di meno di dieci sviluppatori responsabili di oltre il 90% del codice aggiunto in un anno. In questo scenario, moltiplicare automaticamente i rapporti di vulnerabilità rischia di peggiorare il problema. Il valore di Patch the Planet dipenderà quindi dalla capacità di consegnare correzioni verificabili, rispettare le procedure di divulgazione e ridurre davvero il lavoro dei manutentori.Le metriche decisive per Daybreak nella cybersicurezzaDaybreak fotografa una transizione più ampia. L’IA per la sicurezza non viene più proposta soltanto come un rilevatore di anomalie, ma come un agente inserito nel ciclo di sviluppo, capace di formulare ipotesi, eseguire test e preparare modifiche. È un cambiamento potenzialmente rilevante per imprese e infrastrutture pubbliche, ma sposta il problema dalla precisione del singolo modello all’affidabilità dell’intero processo.Dal laboratorio alle patch in produzioneI benchmark continueranno a misurare ciò che i sistemi sanno fare in laboratorio. Nelle organizzazioni conteranno altri indicatori, come il tempo medio di correzione, il numero di regressioni, la quota di segnalazioni realmente utilizzabili e il carico lasciato ai revisori. Daybreak potrà dirsi riuscito non quando troverà più vulnerabilità, ma quando un numero maggiore di patch corrette raggiungerà il software in produzione prima degli attaccanti.FontiOpenAI, “Daybreak: Tools for securing every organization in the world”, 22 giugno 2026OpenAI, “Daybreak – Frontier AI for defenders”OpenAI, “Codex Security: now in research preview”, 6 marzo 2026OpenAI, “Why Codex Security Doesn’t Include a SAST Report”, 16 marzo 2026OpenAI Help Center, “Daybreak – Trusted Access for Cyber Overview”Trail of Bits, “Introducing Patch the Planet”, 22 giugno 2026Zhun Wang et al., “CyberGym: Evaluating AI Agents’ Cybersecurity Capabilities with Real-World Vulnerabilities at Scale”, arXiv, 2025Zhun Wang et al., “ExploitGym: Can AI Agents Turn Security Vulnerabilities into Real Attacks?”, arXiv, 2026Hwiwon Lee et al., “SEC-bench Pro: Can Language Models Solve Long-Horizon Software Security Tasks?”, arXiv, 2026Linux Foundation e Laboratory for Innovation Science at Harvard, “Census II of Free and Open Source Software”, 2022

Daybreak OpenAI: come l’AI genera patch contro le vulnerabilità - Agenda Digitale

giovedì 25 giugno 2026 New tab

Daybreak OpenAI: come l’AI genera patch contro le vulnerabilità - Agenda Digitale

Daybreak OpenAI: come l’AI genera patch contro le vulnerabilità - Agenda Digitale

Other newsrooms on this story

Related reading

OpenAI Daybreak si espande: GPT-5.5-Cyber supera Mythos e arriva Patch the…

OpenAI punta sull'automazione delle patch: Daybreak e la nuova frontiera della…

OpenAI Daybreak e Codex Security, cosa cambia nella cybersecurity - AI4Business

Cos’è e come funziona Daybreak, la risposta di OpenAi a Mythos di Anthropic

Cos’è e come funziona Daybreak, la risposta di OpenAi a Mythos di Antropic

OpenAI e Trail of Bits lanciano Patch the Planet per correggere i bug dell'open…

Other newsrooms on this story

Related reading

OpenAI Daybreak si espande: GPT-5.5-Cyber supera Mythos e arriva Patch the…

OpenAI punta sull'automazione delle patch: Daybreak e la nuova frontiera della…

OpenAI Daybreak e Codex Security, cosa cambia nella cybersecurity - AI4Business

Cos’è e come funziona Daybreak, la risposta di OpenAi a Mythos di Anthropic

Cos’è e come funziona Daybreak, la risposta di OpenAi a Mythos di Antropic

OpenAI e Trail of Bits lanciano Patch the Planet per correggere i bug dell'open…