Présentation d’OpenAI o1-Preview

OpenAI a dévoilé une nouvelle série de modèles avancés de raisonnement, connue sous le nom de OpenAI o1-preview. Ces modèles sont conçus pour résoudre des problèmes complexes dans les domaines de la science, de la programmation et des mathématiques, tout en démontrant une capacité de résolution de problèmes nettement améliorée par rapport aux modèles précédents.

Mode de fonctionnement

Ces modèles ont été entraînés pour consacrer davantage de temps à la réflexion sur les tâches, de manière similaire à un humain. Ils affinent leur processus de pensée, testent différentes stratégies et détectent les erreurs. La prochaine mise à jour a obtenu des résultats comparables à ceux de doctorants en physique, chimie et biologie lors de tests. En mathématiques et en programmation, le modèle a particulièrement démontré des compétences exceptionnelles.

Disponibilité et utilisation

Les premiers modèles de la série o1 sont désormais disponibles dans ChatGPT et via l’API. Des mises à jour régulières et des améliorations sont prévues. Les modèles peuvent être sélectionnés manuellement dans le menu des modèles de ChatGPT, avec les versions o1-preview et o1-mini disponibles dès maintenant. Les utilisateurs de ChatGPT Plus et Team y ont accès dès aujourd’hui, tandis que les utilisateurs de ChatGPT Enterprise et Edu y auront accès à partir de la semaine prochaine.

Mesures de sécurité

Un aspect crucial du développement de ces modèles est la sécurité. Une nouvelle approche de la formation à la sécurité exploite les capacités de raisonnement des modèles pour respecter les directives de sécurité et d’alignement. Un indicateur de sécurité clé est la capacité du modèle à suivre ses directives de sécurité, même face à des tentatives de contournement (« Jailbreaking »). Lors d’un des tests de jailbreaking les plus exigeants, le modèle o1-preview a obtenu 84 points sur 100, tandis que le GPT-4o n’en a obtenu que 22.

Pour ces nouveaux modèles, les mesures de sécurité, la gouvernance interne et la collaboration avec le gouvernement fédéral ont été intensifiées. Cela inclut des tests rigoureux, des évaluations via le Preparedness Framework, des mesures de Red-Teaming et des processus de révision au niveau du conseil d’administration, incluant le Safety & Security Committee.

Applications et publics cibles

Les capacités de raisonnement avancées des modèles o1 sont particulièrement utiles pour les utilisateurs cherchant à résoudre des problèmes complexes dans des domaines comme la science, la programmation, les mathématiques et d’autres domaines similaires. Les modèles o1 peuvent être utilisés par des chercheurs en santé pour annoter des données de séquençage cellulaire, par des physiciens pour créer des formules mathématiques complexes en optique quantique, et par des développeurs pour élaborer et exécuter des workflows multi-étapes.

OpenAI o1-mini

En complément du modèle o1-preview, OpenAI propose également le modèle o1-mini, qui est plus rapide et plus économique, et particulièrement efficace pour la programmation. Le modèle o1-mini est 80 % moins cher que le modèle o1-preview et constitue une solution puissante et rentable pour des applications nécessitant du raisonnement sans dépendre d’une vaste connaissance du monde.

Développements futurs

Cette publication constitue un aperçu précoce des nouveaux modèles de raisonnement intégrés à ChatGPT et à l’API. En plus des mises à jour des modèles, des fonctionnalités supplémentaires telles que la navigation, les téléversements de fichiers et d’images sont prévues pour rendre les modèles encore plus utiles. D’autres évolutions de la série GPT et de la série OpenAI o1 sont également en préparation.

Avec ces nouveaux modèles, OpenAI franchit une étape significative vers un nouveau niveau de capacités d’intelligence artificielle, en particulier dans le domaine du raisonnement et de la résolution de problèmes dans des champs d’application complexes.