Ricercatori della Florida International University (FIU) hanno sviluppato una nuova tecnica, battezzata JaiLIP (Jailbreaking with Loss-guided Image Perturbation), che permette di aggirare le barriere di sicurezza dei modelli di intelligenza artificiale. A differenza dei tradizionali "jailbreak" che sfruttano prompt testuali appositamente elaborati, JaiLIP si basa su modifiche minime alle immagini, impercettibili all'occhio umano ma capaci di indurre l'AI a generare risposte non sicure.

La tecnica � stata testata contro BLIP-2, un modello di intelligenza artificiale multimodale, dimostrando un'efficacia importante nell'aumentare la probabilit� di risposte dannose. Lo studio evidenzia come l'approccio JaiLIP abbia superato i precedenti metodi di "jailbreak" basati su immagini, arrivando a raddoppiare la quantit� di output non sicuri generati durante i test. I sistemi di sicurezza attuali, quindi, sono davvero sicuri?

Queste scoperte mettono in luce un rischio di sicurezza concreto per le aziende che implementano sistemi di intelligenza artificiale capaci di elaborare sia immagini che testo. Mentre la maggior parte delle discussioni sulla sicurezza dell'IA si concentra sui prompt, la ricerca suggerisce che le immagini, apparentemente innocue, possano rappresentare un vettore di attacco altrettanto efficace, se non pi� subdolo. La strada tracciata da questa ricerca impone una riflessione sui compromessi necessari nello sviluppo di tali tecnologie.