JaiLIP: la tecnica che bypassa i guardrail di sicurezza IA con immagini innocue

Ricercatori della Florida International University hanno sviluppato JaiLIP, una nuova tecnica che sfrutta sottili modifiche alle immagini per eludere le protezioni di sicurezza dei modelli AI multimodali, rivelando una nuova potenziale via d'attacco

lunedì 29 giugno 2026 New tab

Ricercatori della Florida International University (FIU) hanno sviluppato una nuova tecnica, battezzata JaiLIP (Jailbreaking with Loss-guided Image Perturbation), che permette di aggirare le barriere di sicurezza dei modelli di intelligenza artificiale. A differenza dei tradizionali "jailbreak" che sfruttano prompt testuali appositamente elaborati, JaiLIP si basa su modifiche minime alle immagini, impercettibili all'occhio umano ma capaci di indurre l'AI a generare risposte non sicure.

La tecnica � stata testata contro BLIP-2, un modello di intelligenza artificiale multimodale, dimostrando un'efficacia importante nell'aumentare la probabilit� di risposte dannose. Lo studio evidenzia come l'approccio JaiLIP abbia superato i precedenti metodi di "jailbreak" basati su immagini, arrivando a raddoppiare la quantit� di output non sicuri generati durante i test. I sistemi di sicurezza attuali, quindi, sono davvero sicuri?

Queste scoperte mettono in luce un rischio di sicurezza concreto per le aziende che implementano sistemi di intelligenza artificiale capaci di elaborare sia immagini che testo. Mentre la maggior parte delle discussioni sulla sicurezza dell'IA si concentra sui prompt, la ricerca suggerisce che le immagini, apparentemente innocue, possano rappresentare un vettore di attacco altrettanto efficace, se non pi� subdolo. La strada tracciata da questa ricerca impone una riflessione sui compromessi necessari nello sviluppo di tali tecnologie.

JaiLIP: la tecnica che bypassa i guardrail di sicurezza IA con immagini innocue

JaiLIP: la tecnica che bypassa i guardrail di sicurezza IA con immagini innocue

Other newsrooms on this story

Related reading

Sicurezza AI, i limiti strutturali dei guardrail nei modelli generativi -…

Cybersecurity, da AI4I valutazione su robustezza modelli di frontiera

Ricercatori riescono ad aggirare la sicurezza dei browser web basati su IA -…

Ricerca scopre un metodo per aggirare le censure dell’Intelligenza Artificiale

Lo spionaggio tecnico entra nell’era degli strumenti commerciali

Cybersecurity, anche i modelli IA più avanzati sono vulnerabili

Related reading

Sicurezza AI, i limiti strutturali dei guardrail nei modelli generativi -…

Cybersecurity, da AI4I valutazione su robustezza modelli di frontiera

Ricercatori riescono ad aggirare la sicurezza dei browser web basati su IA -…

Ricerca scopre un metodo per aggirare le censure dell’Intelligenza Artificiale

Lo spionaggio tecnico entra nell’era degli strumenti commerciali

Cybersecurity, anche i modelli IA più avanzati sono vulnerabili

Other newsrooms on this story