I primi risultati dei test dedicati allo sviluppo Android hanno messo in evidenza alcune difficolt� inattese per Gemini 3.5 Flash, il nuovo modello di intelligenza artificiale di Google. Nonostante la posizione premium e le aspettative elevate dell'azienda, i benchmark mostrano che il sistema non riesce a superare modelli pi� vecchi in determinati compiti legati alla programmazione Android.
La classifica Android Bench, utilizzata per valutare la capacit� dei modelli AI nel completare attivit� di sviluppo mobile, ha inserito Gemini 3.5 Flash per la prima volta. Tuttavia, il nuovo modello di Google non � riuscito a entrare tra i primi cinque classificati. Al vertice della graduatoria si � posizionato GPT 5.5 di OpenAI con un punteggio di 74, seguito da GPT 5.4 e da Gemini 3.1 Pro Preview, entrambi con 72,4 punti. Anche alcune varianti pi� recenti di Claude hanno ottenuto risultati superiori rispetto al modello Flash.
Gemini 3.5 Flash ha raggiunto un punteggio di 63,7, classificandosi al sesto posto. L'aspetto pi� sorprendente riguarda per� il rapporto tra prestazioni e costo. Secondo i dati del benchmark, il modello ha utilizzato una quantit� media di circa 355,9 token complessivi per esecuzione, arrivando a un costo medio stimato di 147,1 dollari per test. Questo lo rende il modello pi� costoso presente nella graduatoria, nonostante risultati inferiori rispetto ad alcune alternative.






