Flex Processing d'OpenAI : IA Abordable avec Vitesse Réduite

18/04/2025 Intelligence Artificielle

OpenAI introduit une nouvelle option d'API appelée Flex Processing, conçue pour offrir des prix plus compétitifs pour l'utilisation des modèles d'IA. Cette initiative semble être une réponse directe à la concurrence croissante d'entreprises comme Google, qui se concentrent également sur des solutions d'IA plus économiques.

Flex Processing est actuellement en version bêta et disponible pour les modèles de raisonnement o3 et o4-mini d'OpenAI. Le principal compromis est un coût réduit en échange de temps de réponse plus lents et d'une indisponibilité potentielle des ressources. Cela le rend adapté aux tâches qui ne sont pas urgentes ou critiques pour la production.

Plus précisément, OpenAI cible les tâches de priorité inférieure et non liées à la production telles que les évaluations de modèles, l'enrichissement des données et les charges de travail asynchrones avec Flex Processing. En acceptant un traitement plus lent, les utilisateurs peuvent réduire considérablement leurs dépenses d'API.

Économies de Coûts avec Flex Processing

La réduction des coûts est substantielle. Pour le modèle o3, Flex Processing est tarifé à 5 $ par million de jetons d'entrée et à 20 $ par million de jetons de sortie. C'est la moitié du prix des tarifs standard, qui sont respectivement de 10 $ et 40 $. De même, pour le modèle o4-mini, le prix passe de 1,10 $ à 0,55 $ par million de jetons d'entrée et de 4,40 $ à 2,20 $ par million de jetons de sortie.

Cette stratégie de tarification est particulièrement pertinente à mesure que le coût de l'IA avancée continue d'augmenter. D'autres entreprises, comme Google, lancent des modèles plus efficaces et économiques, tels que Gemini 2.5 Flash, ce qui incite OpenAI à trouver de nouvelles façons d'offrir des solutions d'IA abordables.

Vérification d'Identité pour un Accès Graduel

En plus de Flex Processing, OpenAI a annoncé que les développeurs des niveaux 1 à 3 de son système de niveaux d'utilisation devront effectuer une vérification d'identité pour accéder au modèle o3. Ces niveaux sont déterminés par le montant dépensé pour les services OpenAI. Les fonctionnalités telles que les résumés de raisonnement et la prise en charge de l'API de streaming sont également bloquées derrière ce processus de vérification.

OpenAI a déclaré que le processus de vérification d'identité vise à empêcher l'utilisation abusive de sa plate-forme par des acteurs malveillants et à garantir la conformité à ses politiques d'utilisation. Cette mesure s'inscrit dans un effort plus large visant à maintenir l'intégrité et la sécurité de l'utilisation des modèles d'IA.

L'introduction de Flex Processing et la mise en œuvre de la vérification d'identité représentent des étapes importantes pour OpenAI afin d'équilibrer le rapport coût-efficacité, les performances et la sécurité dans le paysage de l'IA en évolution rapide. À mesure que la concurrence s'intensifie, ces mesures pourraient être cruciales pour maintenir la position d'OpenAI en tant que fournisseur d'IA de premier plan.

Source: TechCrunch