
OpenAI a effectivement annulé la sortie de o3, qui était censé être le prochain grand modèle d'IA de l'entreprise, au profit de ce que le PDG Sam Altman appelle une offre de produit 'simplifiée'.
Dans un post sur X mercredi, Altman a déclaré que dans les mois à venir, OpenAI lancera un modèle appelé GPT-5 qui 'intègre beaucoup de [la] technologie' d'OpenAI, y compris o3, dans sa plateforme de chatbot alimentée par IA ChatGPT et API. En raison de cette décision de feuille de route, OpenAI n'a plus l'intention de lancer o3 en tant que modèle autonome.
L'entreprise avait initialement déclaré en décembre qu'elle visait à sortir o3 quelque part en début d'année. Il y a quelques semaines à peine, Kevin Weil, directeur des produits chez OpenAI, a déclaré dans une interview que o3 était en bonne voie pour un lancement 'février-mars'.
Altman a également annoncé qu'OpenAI prévoit d'offrir un accès illimité au chat à GPT-5 au 'paramètre d'intelligence standard', soumis à des 'seuils d'abus', une fois le modèle disponible généralement. (Altman a refusé de fournir plus de détails sur ce paramètre - et ces seuils d'abus.) Les abonnés à ChatGPT Plus pourront exécuter GPT-5 à un 'niveau d'intelligence supérieur', a déclaré Altman, tandis que les abonnés à ChatGPT Pro pourront exécuter GPT-5 à un 'niveau d'intelligence encore plus élevé'.
Avant le déploiement de GPT-5, OpenAI prévoit de sortir GPT-4.5, un modèle codé 'Orion', dans les prochaines semaines, selon Altman. Altman dit que ce sera le dernier 'modèle non enchaîné de pensée'. Contrairement à o3 et aux autres modèles 'de raisonnement' d'OpenAI, les modèles non enchaînés de pensée ont tendance à être moins fiables dans des domaines comme les mathématiques et la physique.
Il semble qu'OpenAI embrasse pleinement la tendance des modèles de raisonnement qu'elle a probablement initiée avec son premier modèle de raisonnement, o1, fin de l'année dernière. Les modèles de raisonnement se fact-checkent efficacement, ce qui les aide à éviter certaines des embûches qui peuvent normalement piéger les modèles. Ce processus de vérification des faits entraîne une certaine latence - les modèles de raisonnement mettent un peu plus de temps, généralement quelques secondes à quelques minutes de plus, pour arriver à des solutions. Mais ils ont tendance à être à la fois plus fiables et capables.
Le laboratoire d'IA chinois DeepSeek a récemment capté l'attention du monde entier avec son modèle R1, qui a égalé o1 sur plusieurs benchmarks. Contrairement à o1, R1 est un modèle 'ouvert' sous licence permissive, ce qui signifie qu'il peut être téléchargé et utilisé comme les développeurs le souhaitent.
Dans des publications récentes sur les réseaux sociaux, Altman a admis que DeepSeek avait atténué l'avance technologique d'OpenAI en matière d'IA, et a déclaré qu'OpenAI allait 'publier quelques versions' pour mieux concurrencer.
GPT-4.5, ou Orion, aurait rencontré un certain nombre de défis liés à la performance et des revers techniques. Bloomberg, The Information et The Wall Street Journal ont rapporté de manière indépendante qu'Orion présentait moins d'amélioration par rapport à son prédécesseur, GPT-4o, que ce que GPT-4 avait fait par rapport à GPT-3.