Nouvelle ère de l’assistance IA avec des outils capables d’agir
Avec l’Agent ChatGPT, une nouvelle phase de l’utilisation de l’IA commence : pour la première fois, ChatGPT peut accomplir de manière autonome et proactive des tâches complexes, y compris l’interaction directe avec des sites web et des applications.
- Ce que l’Agent ChatGPT sait faire
- De Operator & Deep Research à l’Agent
- Outils et mode de fonctionnement
- Exemples d’utilisation au quotidien et au travail
- Résultats de benchmarks et performances
- Activation et utilisation
- Mesures de sécurité et protection des données
- Disponibilité et quotas
- Limitations & développement continu
Ce que l’Agent ChatGPT sait faire
Le nouvel Agent ChatGPT dote ChatGPT de la capacité d’accomplir de façon autonome des tâches, de la recherche à l’action concrète. Il s’appuie pour cela sur un ordinateur virtuel et une sélection d’outils spécialisés, afin d’analyser des calendriers, créer des présentations, comparer des concurrents ou même planifier et effectuer des achats directement.
Des tâches comme la recherche d’actualités pour des rendez-vous clients, la planification et la commande d’ingrédients pour un petit-déjeuner japonais ou la création de présentations et de tableaux éditables sont désormais automatisées par ChatGPT. L’IA peut visiter des sites web, filtrer les résultats, demander une authentification sécurisée si nécessaire, exécuter du code, réaliser des analyses et fournir les résultats dans des formats modifiables.
Le contrôle reste toujours entre les mains de l’utilisateur : avant chaque action importante, une confirmation est demandée et les processus peuvent être arrêtés ou repris à tout moment.
De Operator & Deep Research à l’Agent
L’Agent ChatGPT réunit les atouts de deux systèmes jusqu’ici distincts : alors que Operator permettait d’interagir avec des sites web et d’effectuer des actions comme cliquer ou saisir du texte, Deep Research se concentrait sur l’analyse et la structuration de l’information. Ces deux approches, auparavant séparées, sont désormais réunies dans un seul système, enrichi de nouveaux outils. ChatGPT peut ainsi passer de la recherche à l’interaction ou à l’action, le tout de manière fluide dans une même conversation.
Outils et mode de fonctionnement
Pour fonctionner, l’Agent s’appuie sur plusieurs composants spécialisés :
- Navigateur visuel – interagit graphiquement avec les sites web, à la manière d’un humain.
- Navigateur textuel – pour des requêtes web efficaces et orientées texte.
- Terminal – permet des analyses complexes et l’exécution de code.
- Accès direct à l’API – par exemple pour accéder à des calendriers, des e-mails ou des applications tierces.
- Connecteurs ChatGPT – interfaces avec des services comme Gmail ou Github pour intégrer des informations pertinentes (en savoir plus sur les Connecteurs).
Les utilisateurs peuvent eux-mêmes se connecter à des sites web et ainsi donner à l’Agent un accès plus large. L’IA choisit alors de manière autonome l’outil le plus adapté à chaque étape, par exemple l’accès API pour les données de calendrier, l’analyse textuelle pour de grands volumes de données ou l’interaction visuelle avec des interfaces web complexes.
Toutes les actions s’effectuent dans un environnement virtuel isolé, qui conserve le contexte entre les différents outils. Ainsi, l’état d’avancement est toujours sauvegardé, même en cas d’interruption ou de nouvelles instructions.
Exemples d’utilisation au quotidien et au travail
Ces nouvelles capacités font passer ChatGPT à un niveau supérieur, aussi bien dans la vie privée que professionnelle. Voici quelques exemples typiques d’utilisation :
- Transformation de captures d’écran ou de tableaux de bord en présentations éditables
- Reprogrammation et réservation automatique de réunions
- Mise à jour de données financières dans des tableaux sans perte de formatage
- Planification et réservation de voyages ou d’événements
- Recherche de spécialistes et prise de rendez-vous
L’IA peut accomplir des tâches en temps réel, se connecter à des applications, générer automatiquement des rapports récurrents et informer l’utilisateur par notification dès qu’une tâche est terminée.
Résultats de benchmarks et performances
Les performances de l’Agent ChatGPT ont été démontrées lors de divers benchmarks et tests réalistes :
- Lors du très exigeant Humanity’s Last Exam, le modèle a atteint un nouveau record (SOTA) de 41,6 au score pass@1, avec jusqu’à 44,4 en mode parallèle.
- Au benchmark FrontierMath, qui comprend des tâches mathématiques de niveau expert, l’Agent atteint une précision de 27,4% avec l’utilisation d’outils, dépassant nettement les modèles précédents.
- Dans des benchmarks pratiques comme DSBench (analyse de données), SpreadsheetBench (traitement de tableaux) et BrowseComp (recherche web), l’Agent ChatGPT surpasse à de nombreuses reprises aussi bien d’autres solutions IA que les performances humaines. Par exemple, pour l’édition de tableaux .xlsx sous LibreOffice, l’Agent obtient un score de 45,5%, contre 20,0% pour Copilot sous Excel.
- L’Agent affiche également de bien meilleurs résultats sur des tâches complexes de modélisation en banque d’investissement que les modèles précédents.
- Au test WebArena pour des tâches web réelles, l’Agent fait aussi mieux que ses prédécesseurs.
Tous les benchmarks, la méthodologie ainsi que de nombreuses autres informations et vidéos sont documentés en détail dans l’article en anglais d’OpenAI.
Activation et utilisation
Les nouvelles fonctions d’agent peuvent être activées dans ChatGPT pour les abonnés Pro, Plus et Team directement via le menu déroulant « Outils » dans le Composer. L’utilisation est très simple : il suffit de décrire la tâche, de choisir le mode agent et ChatGPT démarre avec une exécution visible étape par étape. Le contrôle peut être repris à tout moment si besoin.
Après authentification, il est aussi possible d’utiliser les Connecteurs, par exemple pour résumer sa boîte mail ou analyser automatiquement les entrées du calendrier. Les tâches récurrentes peuvent être programmées directement, par exemple pour des rapports hebdomadaires.
Mesures de sécurité et protection des données
Le champ d’action élargi s’accompagne de nouveaux risques. L’Agent ChatGPT travaille directement avec les données utilisateur, via les Connecteurs ou après connexion à des sites web. Les mécanismes de sécurité existants issus de la préversion Operator ont donc été largement renforcés :
- Confirmation explicite de l’utilisateur avant chaque action ayant un impact réel (par ex. achats).
- Surveillance active (« Watch Mode »), par exemple lors de l’envoi d’e-mails.
- Prévention proactive des risques : les actions à haut risque comme les virements bancaires sont systématiquement refusées.
- Protection contre l’injection de prompt : le modèle est entraîné à détecter et contrer les tentatives de manipulation, y compris via des instructions cachées sur des sites web.
- Protection des données : d’un simple clic, toutes les données de navigation peuvent être supprimées et les sessions web actives terminées. Lors des sessions « Takeover », aucune donnée sensible comme les mots de passe n’est enregistrée ou traitée.
- Sécurité biologique et chimique : l’Agent est traité comme « High Biological and Chemical capabilities » selon le Preparedness Framework d’OpenAI et bénéficie des mécanismes de sécurité les plus avancés à ce jour, incluant le Dual-Use-Refusal-Training et une surveillance continue.
OpenAI collabore étroitement avec des experts externes en recherche, sécurité et biodéfense pour améliorer en permanence les mesures de protection. Un programme de bug bounty a également été lancé pour corriger rapidement les vulnérabilités. Les détails de l’architecture de sécurité sont disponibles dans la System Card d’OpenAI.
Disponibilité et quotas
Le déploiement commence dès maintenant pour les abonnés Pro, Plus et Team. Les utilisateurs Pro bénéficient de 400 messages par mois, les autres abonnements payants de 40 messages mensuels, avec la possibilité d’acheter des crédits supplémentaires. L’accès pour les entreprises et les établissements d’enseignement suivra dans les prochaines semaines. Le service n’est pas encore disponible dans l’Union européenne et en Suisse, mais un lancement est prévu.
La préversion Operator reste accessible encore quelques semaines, puis sera arrêtée. La fonction Deep Research reste disponible via le menu déroulant dans le Composer.
Limitations & développement continu
L’Agent ChatGPT n’en est qu’à ses débuts. Même si de nombreuses tâches peuvent déjà être prises en charge, des erreurs restent possibles. La fonction de création de présentations est encore en phase bêta et peut parfois présenter des mises en forme simples. À l’export, il peut y avoir des différences entre l’aperçu et le fichier exporté. L’édition de présentations téléchargées n’est pas encore disponible, mais devrait arriver dans les prochaines versions.
OpenAI travaille en continu à l’amélioration de l’efficacité, de la flexibilité et de l’ergonomie. L’objectif est de trouver le meilleur équilibre entre contrôle utilisateur et automatisation, afin de rendre l’Agent ChatGPT aussi sûr que polyvalent.