À l’occasion d’I/O, sa conférence dédiée aux développeurs, le géant californien frappe tous azimuts : montée en puissance de la vidéo générative, agents capables de faire des courses à votre place ou encore retour de lunettes connectées... Attention de bien en garder le contrôle.Alors que les démonstrations de robots humanoïdes chinois impressionnent le monde entier, la bataille autour de l’IA générative reste toujours aussi vive. Pendant que les champions chinois – Baidu, Alibaba avec son modèle Qwen, ou encore DeepSeek – rivalisent d’ambition, mais Google met au point avec Gemini, un outil dont objectif est clair : transformer l’IA en outil capable de prendre des initiatives. Ses rivaux ne sont plus seulement OpenAI, la maison-mère de ChatGPT, mais aussi Anthropic et ses modèles Claude.On s’en est rendu compte ce mardi 19 mai 2026, à l’occasion de sa conférence I/O dédiée aux développeurs : l’idée pour Google tente de faire oublier son retard initial, lorsqu’il n’avait pas pleinement mesuré le potentiel de l’article de recherche Transformers, publié en 2017 par huit de ses chercheurs. Et aujourd’hui, le moteur de recherche fondé il y a près de trente ans veut s’appuyer sur des puces maison TPU de 8e génération – des processeurs taillés sur mesure pour l’IA, qui avalent des milliards de calculs bien plus vite que les GPU traditionnels – pour imaginer un monde peuplé d’agents autonomes. Pour notre bien ? Revue de détail des principales annonces.1. Gemini 3.5 Flash, toujours plus rapideCe dont il s’agit : Un modèle qui surpasse le précédent modèle e plus avancé de la gamme – Gemini 3.1 Pro. La dernière version de son outil d’IA maison s’impose sur la quasi-totalité des bancs d’essai du secteur. Sa vitesse de génération est quatre fois supérieure en termes de « tokens », ces unités élémentaires du langage que l’IA produit mot après mot. Une version ultra-optimisée, intégrée directement à la plateforme Antigravity, multiplie même cette vitesse par 12, à qualité égale.Ce que cela change : Grâce à sa rapidité d’exécution sans temps d’attente, ce modèle permet à Google de concevoir des IA capables de développer des logiciels entiers et s’impose comme le leader mondial pour la réparation de vrais bugs selon le test SWE-bench Verify. Face à lui, la concurrence s’organise : OpenAI rivalise sur ce même terrain de la vitesse avec ses modèles GPT-4.1 et GPT-5, tandis qu’Anthropic (Claude 4) conserve sa position de référence pour le raisonnement pur. Pour maintenir la cadence, Google annonce déjà la sortie de Gemini 3.5 Pro pour le mois prochainGoogle vise des agents capables de construire des systèmes complexes, jusqu’à des environnements logiciels entiers. Le modèle s’impose notamment sur SWE-bench Verify, le test de référence mondial qui mesure l’aptitude d’une IA à corriger de vrais bugs dans des conditions réelles.Du côté de la concurrence : OpenAI s’aligne sur ce segment vitesse/coût avec GPT-4.1 et GPT-5. Anthropic, avec Claude Sonnet 4 et Claude Opus 4, reste la référence sectorielle sur le raisonnement avancé. Google annonce par ailleurs le déploiement de Gemini 3.5 Pro pour le mois prochain.2. Gemini Omni Flash, la génération de la vidéo coûte que coûteCe dont il s’agit : Un modèle multimodal – c’est-à-dire conçu dès l’origine pour traiter texte, son et image – capable de générer et d’éditer des vidéos à partir de n’importe quelle combinaison d’entrées. Il fusionne l’intelligence de Gemini avec les modèles médias de Google, Veo 3.1 Lite pour la vidéo et Nano Banana 2 pour l’image.Ce que cela change : La démonstration – une explication en claymation (pâte à modeler animée) du repliement des protéines – illustre sa capacité à marier connaissances scientifiques et génération visuelle. L’outil permet également de modifier une vidéo existante – changer un personnage, basculer le style visuel – en maintenant une cohérence narrative : vous représenter avec différents costumes, du Moyen Âge à la cour de Versailles… Omni applique une logique physique intuitive sur l’ensemble des données reçues. L’idée est de mettre au point une IA de plus en plus consciente du monde qui l’entoure, un peu comme les modèles de représentation du monde défendus par Fei Fei Li à Stanford ou encore Yann Le Cun en France.Disponibilité : Dès mardi pour les abonnés Google AI+, Pro et Ultra, dans l’application Gemini, Google Flow et YouTube Shorts. Les accès développeurs via API arriveront dans les prochaines semaines, avant une version Omni Pro plus puissante. Tous les contenus intègrent le tatouage numérique invisible SynthID, pour lutter contre les deepfakes.Du côté de la concurrence : OpenAI a mis entre parenthèses son outil de génération de vidéos Sora, mais Runway ML, Pika et Kling de Kuaishou se disputent le marché de la vidéo. Adobe intègre des fonctions similaires dans Firefly. L’enjeu clé reste la cohérence temporelle – la stabilité des visages, objets et éclairages d’une image à l’autre – tout comme la consommation énergétique, qui reste exponentielle sur ce type d’outils.3. Antigravity 2.0, l’usine à agentsCe dont il s’agit : Initialement orienté vers le code, l’outil Antigravity devient une plateforme complète de développement et d’orchestration d’agents autonomes. Elle réunit une application pour ordinateur, une interface en ligne de commande et un kit de développement clé en main, le tout optimisé pour les modèles Gemini.Ce que cela change : Concrètement, plusieurs IA spécialisées collaborent simultanément : un agent écrit le code d’un site Web, un deuxième conçoit les visuels, pendant qu’un troisième supervise l’architecture globale. L’infrastructure gère désormais des sessions autonomes de plusieurs heures – pipelines de code complexes ou projets de recherche itératifs.Sécurité et concurrence : Alors que tout le monde a en tête Mythos, une IA si puissante qu’Anthropic, la maison mère de Claude, hésite à le rendre accessible au grand public, Google introduit CodeMender, un outil de cybersécurité qui exploite le raisonnement de Gemini pour chercher à corriger les vulnérabilités critiques au cœur des programmes. Cette course aux agents mobilise aussi Anthropic et son Claude Code, OpenAI avec Operator ou encore Microsoft et son environnement Agent 365.4. Quand la machine fait le shopping à votre placeCe dont il s’agit : Fini le temps perdu à ouvrir dix onglets, comparer les prix, remplir vos coordonnées et valider trois paniers différents. On passe d’un mode actif – où vous devez tout faire vous-même – à un mode dans lequel vous donnez une mission à votre IA (par exemple : « Trouve-moi cet après-shampoing au meilleur prix, réserve l’hôtel pour notre week-end et commande des sushis pour ce soir ») et elle s’occupe de tout, de A à Z. Disponible aux Etats-Unis, au Canada, en Australie et au Royaume-Uni, on ne sait pas encore quand cet outil sera disponible en France.Mais si la machine devient folle ? L’utilisateur doit pouvoir fixer ses propres limites (par exemple : « ne jamais dépenser plus de 50 euros sans mon accord » Google met également en avant Universal Cart : un panier multimarchands actif partout où vous naviguez sur le moteur de recherche mais aussi sur Gemini, ou encore YouTube. Il peut vous aider à détecter les erreurs avant que vous ne payiez : par exemple, il vous alerte si la pièce auto n’est pas compatible avec votre voiture. Il n’empêche : il y a quelque chose de troublant de laisser la machine payer à sa place…5. Le rêve d’un majordome personnelCe dont il s’agit : Google veut promouvoir un agent personnel actif y compris lorsque votre ordinateur est éteint ! L’application Gemini bénéficie en outre d’une nouvelle interface baptisée « Neural Expressive » qui s’appuie sur des animations et de légers retours tactiles.Ce que cela change : L’application intègre le « Daily Brief », un résumé matinal généré la nuit qui trie, priorise et planifie vos e-mails et rendez-vous. L’outil Spark propose d’autres services : fiches de révision pour les étudiants, suivi des e-mails clients pour les entrepreneurs et gestion des plannings familiaux. Du côté de la concurrence : L’idée est de se rendre indispensable alors qu’OpenAI mise sur son ChatGPT Memory ou encore Microsoft avec Copilot intégré à Office. Chacun se bat sur le contrôle des données personnelles qui nourrissent l’agent. L’application Gemini, elle, est passée de 400 à 900 millions d’utilisateurs en un an.6. Après l’échec des Google Glass, le retour des lunettes connectéesOnze ans après l’échec des Google Glass, Google revient sur le marché des lunettes connectées. Un modèle mise sur l’audio et une caméra pour interagir avec Gemini, l’autre intègre des écrans dans les verres pour afficher la navigation ou encore des traductions instantanées. Pour séduire le grand public, Google s’est associé aux fabricants Gentle Monster, Samsung et Warby Parker. De telles lunettes permettent la navigation piétonne ou encore la prise de photo à la voix, comme on a pu le voir à Google I/O.Du côté de la concurrence : Le marché est dominé par, la maison mère de Facebook, Meta qui, en lançant ses Ray-Ban, a réussi à convaincre le grand public. Samsung promet ses propres lunettes connectées avant fin 2026, et le chinois Xreal avance son projet Aura, avec un champ de vision de 70 degrés. 6. L’IA au service de la scienceDemis Hassabis, Prix Nobel de chimie 2024, est monté sur scène à Google I/O pour présenter Gemini for Science, une plateforme regroupant des outils d’IA pour les chercheurs, dont un Co-Scientist, partenaire IA conçu pour accélérer les découvertes scientifiques.Le modèle WeatherNext a déjà fait ses preuves lors de l’ouragan Melissa en 2025, en offrant des prévisions plus précises et des alertes plus précoces aux populations menacées. Dans un tout autre domaine, le premier médicament anticancéreux entièrement conçu par une IA doit entrer en phase 1 d’essais cliniques en 2026, via Isomorphic Labs, avec un portefeuille de 17 programmes actifs couvrant l’oncologie, l’immunologie et les maladies cardio-vasculaires. Pour Hassabis, l’âge d’or de la découverte scientifique est proche.7. Ce qu’il faut retenirLe principal enseignement de cette Google I/O 2026 n’est pas tant la prouesse technique que l’immense changement de paradigme imposé à l’utilisateur. Nous ne sommes plus invités à utiliser des outils, mais à déléguer notre quotidien. L’ambition de Google est totale : devenir l’infrastructure invisible de nos vies professionnelles et privées. Toutefois, si la technologie est prête, la société l’est-elle ? Confier sa carte bancaire, la gestion de ses courriels ou l’organisation de son emploi du temps à une machine exige un niveau d’abandon que les géants du Net devront mériter. Au-delà de la bataille des modèles et des parts de marché, le véritable défi de l’entreprise de Mountain View sera de prouver, au fil du temps, que ces agents autonomes agissent strictement dans notre intérêt et dans le respect absolu de notre vie privée. Enfin, la présence remarquée de Demis Hassabis, Prix Nobel de chimie 2024, qui a conclu la conférence, rappelle fort à propos que l’intelligence artificielle retrouve sa raison d’être lorsqu’elle délaisse la course en avant pour s’attaquer aux grands défis de notre époque. La recherche contre le cancer par exemple.