
Gemini 2.5 de Google: Révolutionner l'IA avec un raisonnement amélioré
Google vient de lancer Gemini 2.5, une nouvelle famille de modèles d'IA conçus avec des capacités de raisonnement améliorées. Cela signifie que l'IA s'arrête et "réfléchit" avant de fournir une réponse, visant des réponses plus précises et perspicaces.
Gemini 2.5 Pro Experimental : Le modèle le plus intelligent de Google à ce jour
En tête de liste se trouve Gemini 2.5 Pro Experimental, un modèle d'IA multimodal que Google affirme être sa création la plus intelligente à ce jour. Il est désormais disponible sur Google AI Studio, leur plateforme de développement, et via l'application Gemini pour les abonnés à Gemini Advanced.
Google souligne que tous les futurs modèles d'IA intégreront ces capacités de raisonnement avancées. Ce changement fait suite à la tendance lancée par o1 d'OpenAI en septembre 2024, qui a déclenché une course au développement d'une IA dotée de capacités de raisonnement similaires ou supérieures. Des entreprises comme Anthropic, DeepSeek et xAI ont depuis rejoint la mêlée.
Ces modèles de raisonnement utilisent une puissance de calcul et un temps supplémentaires pour vérifier les faits et analyser minutieusement les problèmes avant de fournir une réponse. Cette approche a conduit à des améliorations significatives des performances de l'IA, en particulier dans des domaines comme les mathématiques et le codage.
Beaucoup pensent que les modèles de raisonnement sont essentiels au développement d'agents d'IA, des systèmes autonomes capables d'effectuer des tâches avec une intervention humaine minimale. Cependant, il convient de noter que ces modèles entraînent également des coûts plus élevés en raison des demandes de calcul plus importantes.
Gemini 2.5 Pro est conçu pour exceller dans la création d'applications web visuellement attrayantes et d'applications de codage d'agents. Selon Google, Gemini 2.5 Pro a obtenu un score de 68,6 % sur Aider Polyglot, qui est une évaluation mesurant l'édition de code, surpassant les meilleurs modèles d'IA d'OpenAI, Anthropic et du laboratoire chinois d'IA DeepSeek. Cependant, sur SWE-bench Verified, Gemini 2.5 Pro a obtenu un score de 63,8 %, surpassant o3-mini d'OpenAI et R1 de DeepSeek, mais sous-performant Claude 3.7 Sonnet d'Anthropic, qui a obtenu un score de 70,3 %.
La version initiale de Gemini 2.5 Pro dispose d'une fenêtre de contexte de 1 million de jetons, permettant à l'IA de traiter environ 750 000 mots à la fois. Google prévoit de doubler cette longueur d'entrée à 2 millions de jetons prochainement. Les détails des prix de l'API Gemini 2.5 Pro devraient être annoncés dans les prochaines semaines.
Source: TechCrunch