Internet - 2024

L'un des points les plus frappants de cette I/O fut la démonstration des progrès rapides des modèles d'IA. Sundar Pichai a souligné l'amélioration spectaculaire des scores Elo, qui mesurent la performance des modèles, avec une augmentation de plus de 300 points depuis la première génération de Gemini Pro. Aujourd'hui, Gemini 2.5 Pro domine le classement LMArena dans toutes les catégories, témoignant de l'engagement de Google à repousser les limites de l'intelligence artificielle.
Cette performance est rendue possible par une infrastructure de pointe. La septième génération de TPU de Google, nommée Ironwood, a été présentée comme une révolution. Conçue spécifiquement pour l'IA à des fins de raisonnement et d'inférence à grande échelle, elle offre des performances 10 fois supérieures à celles de la génération précédente, avec un processeur de calcul incroyable de 42,5 exaflops par pod. Cette puissance décuplée permet non seulement d'accélérer les modèles, mais aussi de réduire significativement leurs coûts, prouvant la capacité de Google à proposer les meilleurs modèles au prix le plus efficace. Google ne se contente pas de dominer la frontière de Pareto, elle la déplace carrément.
Une Adoption Massive de l'IA à Travers le Monde
Les chiffres parlent d'eux-mêmes : l'adoption de l'IA par Google est exponentielle. Il y a un an, Google traitait 9,7 billions de jetons par mois. Aujourd'hui, ce chiffre a bondi à plus de 480 billions, soit 50 fois plus. Cette croissance fulgurante se reflète également dans l'écosystème des développeurs : plus de 7 millions d'entre eux utilisent Gemini, un chiffre multiplié par cinq en un an. L'utilisation de Gemini sur Vertex AI a quant à elle été multipliée par 40.
L'application Gemini compte désormais plus de 400 millions d'utilisateurs actifs par mois, avec une croissance particulièrement forte pour la série de modèles 2.5, où l'utilisation a augmenté de 45 % pour les utilisateurs de 2.5 Pro. Ces statistiques illustrent clairement que l'intelligence est désormais plus largement accessible à tous, partout, et que le monde l'adopte à une vitesse inédite.
De la Recherche à la Réalité : L'IA au Quotidien
La Google I/O 2025 a été l'occasion de voir comment des décennies de recherche en IA se concrétisent aujourd'hui en solutions tangibles pour les individus, les entreprises et les communautés.
Project Starline devient Google Beam : La Communication Réinventée
Lancé il y a quelques années, Project Starline, la technologie vidéo 3D révolutionnaire de Google, a évolué pour devenir Google Beam. Cette nouvelle plateforme de communications vidéo, optimisée par l'IA, transforme les flux vidéo 2D en une expérience 3D réaliste. Grâce à six caméras et à l'IA, Beam fusionne les flux vidéo pour les afficher sur un écran 3D à champ lumineux, offrant un suivi de la tête quasi parfait, au millimètre près, à 60 images par seconde. Le résultat est une conversation beaucoup plus naturelle et immersive. En partenariat avec HP, les premiers appareils Google Beam seront disponibles pour les clients initiaux plus tard cette année.
Parallèlement, Google Meet intègre désormais la traduction vocale en temps quasi réel. Cette fonctionnalité reproduit la voix, le ton et même les expressions du locuteur, pour des conversations fluides et naturelles dans différentes langues. La traduction en anglais et en espagnol est déjà en cours de déploiement en version bêta pour les abonnés Google AI Pro et Ultra, avec d'autres langues à venir. Les clients Workspace professionnels pourront tester cette fonctionnalité cette année.
Project Astra s'incorpore dans Gemini Live : L'Assistant IA Universel
Project Astra, un projet de recherche explorant les capacités futures d'un assistant IA universel capable de comprendre le monde qui nous entoure, est désormais intégré à Gemini Live. Cette fonctionnalité permet le partage de caméra et d'écran, offrant aux utilisateurs des possibilités créatives, de la préparation d'entretiens d'embauche à l'entraînement pour un marathon. Gemini Live est déjà disponible pour tous les utilisateurs Android et est en cours de déploiement pour les utilisateurs iOS. Des fonctionnalités similaires sont également disponibles dans la recherche Google.
Project Mariner et le Mode Agent : Des Systèmes qui Agissent pour Vous
Google voit les agents comme des systèmes combinant l'intelligence de modèles d'IA avancés et l'accès à des outils pour effectuer des actions sous le contrôle de l'utilisateur. Le prototype de recherche Project Mariner est un premier pas vers la création d'agents capables d'interagir avec le Web et d'effectuer des tâches. Grâce à de nouvelles fonctionnalités de multitâche et à la méthode "enseigner et répéter", les agents apprennent à réaliser des tâches similaires. Les fonctionnalités de Project Mariner sont mises à la disposition des développeurs via l'API Gemini et seront plus largement disponibles cet été.
Pour faciliter le développement de l'écosystème des agents, Google a annoncé que son API et son SDK Gemini sont désormais compatibles avec les outils MCP (Model Context Protocol) d'Anthropic, permettant aux agents de communiquer entre eux et d'accéder à d'autres services.
De plus, des fonctionnalités agentives sont intégrées à Chrome, à la recherche Google et à l'application Gemini. Le nouveau Mode Agent de l'application Gemini aidera les utilisateurs à accomplir davantage, comme trouver un appartement, ajuster des filtres, accéder à des annonces et même planifier des visites. Une version expérimentale du Mode Agent dans l'application Gemini sera bientôt disponible pour les abonnés.
La Puissance de la Personnalisation et le Mode IA dans la Recherche Google
La personnalisation est au cœur de la vision de Google pour rendre l'IA vraiment utile. Grâce au contexte personnel, les modèles Gemini peuvent utiliser des informations pertinentes issues des applications Google de l'utilisateur (avec son autorisation et sous son contrôle total) de manière privée et transparente.
Un exemple concret est la fonction de réponses suggérées personnalisées dans Gmail. Si un ami demande des conseils sur un road trip, Gemini peut rechercher dans les e-mails et les fichiers Google Drive de l'utilisateur pour suggérer une réponse détaillée, reprenant le ton et le style de l'utilisateur. Cette fonctionnalité sera disponible pour les abonnés plus tard dans l'année.
Les modèles Gemini rendent également la recherche Google plus intelligente, plus agentive et plus personnalisée. Les Aperçus IA, lancés l'an dernier, sont désormais utilisés par plus de 1,5 milliard d'utilisateurs dans 200 pays et territoires. Ils améliorent la satisfaction des utilisateurs et génèrent une croissance de plus de 10 % des requêtes concernées.
Pour une expérience de recherche entièrement optimisée par l'IA, Google a lancé un tout nouveau Mode IA. Cette refonte complète de la recherche Google permet aux utilisateurs de poser des questions plus longues et plus complexes, avec des requêtes deux à trois fois plus longues que les recherches traditionnelles. Le Mode IA sera disponible pour tous les utilisateurs aux États-Unis dès aujourd'hui, offrant des réponses de qualité et d'une rapidité inégalée grâce aux derniers modèles Gemini, dont Gemini 2.5, qui sera également disponible dans la recherche aux États-Unis cette semaine.
Des Modèles Multimédias Génératifs Améliorés et des Opportunités Futures
Google a continué d'améliorer ses modèles multimédias génératifs. Veo 3, le dernier modèle de génération de vidéos, intègre désormais la génération audio. Imagen 4 est le modèle de génération d'images le plus performant à ce jour. Ces deux fonctionnalités sont disponibles dans l'application Gemini, ouvrant une nouvelle ère de créativité. De plus, un nouvel outil appelé Flow permet aux réalisateurs de créer des séquences cinématographiques et de transformer de courts extraits en scènes plus longues.
Sundar Pichai a conclu en soulignant l'immense opportunité que l'IA offre pour améliorer la vie des gens. Des projets de recherche comme la robotique, la technologie quantique, AlphaFold et Waymo, qui ont déjà montré leur capacité à transformer le quotidien, ne sont que le début. La Google I/O 2025 a clairement démontré que Google est déterminé à mener cette révolution de l'IA, en mettant à disposition des outils puissants et en permettant aux développeurs et aux créateurs de s'assurer que ces avancées profitent au plus grand nombre.
Inquiétudes et Défis à l'Horizon de l'IA
Si l'enthousiasme pour ces avancées technologiques est palpable, l'intégration massive de l'IA soulève également des questions et des inquiétudes légitimes, tant du côté des internautes que de celui des créateurs de contenu et des éditeurs de sites web.
Pour les Internautes : Fiabilité, Vie Privée et Dépendance
La première préoccupation majeure pour les internautes est la fiabilité des informations générées par l'IA. Si les "Aperçus IA" et le "Mode IA" promettent des réponses synthétisées, la question de la véracité et de la nuance de ces résumés se pose. Comment s'assurer que l'IA ne déforme pas l'information ou ne propage pas de biais, même involontairement ? La tentation de ne plus cliquer sur les sources originales pour vérifier les faits pourrait entraîner une diminution de l'esprit critique et une acceptation passive des informations fournies par l'IA.
Ensuite, la vie privée est un point sensible. Le "contexte personnel" qui permet à Gemini d'accéder à vos e-mails, fichiers Drive et autres données pour personnaliser les réponses, bien que soumis à l'autorisation de l'utilisateur, soulève des questions sur la gestion et la sécurisation de ces informations hautement personnelles. La confiance des utilisateurs sera primordiale pour l'adoption de ces fonctionnalités.
Enfin, une dépendance accrue à l'IA pourrait émerger. Si les agents IA commencent à effectuer des tâches complexes (rechercher un appartement, planifier des visites), les internautes pourraient perdre une partie de leur autonomie numérique ou la capacité à effectuer ces tâches manuellement, créant une nouvelle forme de dépendance technologique.
Pour les Blogueurs, Sites Web et Créateurs de Contenu : Trafic, Monétisation et Visibilité
Du côté des éditeurs et créateurs de contenu, les annonces de la Google I/O 2025 peuvent générer une appréhension significative concernant leur modèle économique et leur visibilité.
La principale inquiétude réside dans le trafic organique. Si le "Mode IA" de Google fournit des réponses synthétisées et complètes directement dans les résultats de recherche (via les "Aperçus IA"), cela pourrait réduire drastiquement le besoin pour les internautes de cliquer sur les liens vers les sites web sources. Moins de clics signifie moins de trafic, ce qui impacte directement la monétisation via la publicité ou les abonnements. Pour de nombreux sites, le trafic via la recherche Google est vital.
Les blogueurs et les petits éditeurs pourraient être particulièrement touchés, car leur modèle repose souvent sur un volume important de visites. La valeur de la création de contenu long et détaillé est remise en question si l'IA peut en extraire l'essence en quelques secondes. Comment justifier l'investissement dans la production de contenu de qualité si les utilisateurs n'atteignent plus la source ?
La question de l'attribution et du crédit se pose également. Si l'IA résume des informations provenant de dizaines de sources, comment s'assurer que le travail original des créateurs est correctement reconnu et valorisé ? Bien que Google puisse citer des sources, l'impact sur le trafic reste une préoccupation majeure.
En somme, si les avancées de l'IA promettent une efficacité et une personnalisation accrues pour les internautes, elles posent un défi existentiel aux modèles d'affaires des sites web et des créateurs de contenu. L'équilibre entre l'innovation par l'IA et la durabilité de l'écosystème web sera l'une des problématiques centrales à résoudre dans les années à venir.
Auteur: Jo KCK
Cet autre article pourrait vous intéresser : Maîtriser les Majuscules avec Accent sur Windows : Guide Détaillé avec Plusieurs Astuces