ChatGPT Bénéficie de la Génération d'Images GPT-4o: Une Mise à Jour Majeure

25/03/2025 Intelligence Artificielle

Le PDG d'OpenAI, Sam Altman, a récemment annoncé une mise à niveau significative des capacités de génération d'images de ChatGPT. Cela marque la première amélioration majeure depuis plus d'un an, apportant la création et la modification d'images natives à la plateforme.

ChatGPT peut désormais exploiter la puissance du modèle GPT-4o d'OpenAI pour générer et modifier des images et des photos directement dans l'interface du chatbot. Auparavant, bien que GPT-4o alimentait la plateforme, ses capacités étaient limitées à la génération et à l'édition de texte.

Altman a déclaré que la génération d'images natives de GPT-4o est immédiatement disponible dans ChatGPT et Sora, le produit de génération vidéo par IA d'OpenAI, pour les utilisateurs disposant de l'abonnement Pro à 200 $ par mois. La fonctionnalité sera bientôt déployée pour les utilisateurs Plus et gratuits de ChatGPT, ainsi que pour les développeurs utilisant le service API de l'entreprise.

Qualité d'Image et Édition Améliorées

OpenAI affirme que GPT-4o "pense" plus longtemps que son prédécesseur, DALL-E 3, ce qui se traduit par des images plus précises et détaillées. De plus, GPT-4o peut modifier des images existantes, y compris celles contenant des personnes, permettant aux utilisateurs de les transformer ou de "remplir" des détails tels que les objets de premier plan et d'arrière-plan.

Données d'Entraînement et Considérations Éthiques

Pour alimenter cette nouvelle fonctionnalité d'image, OpenAI a entraîné GPT-4o sur des "données accessibles au public" ainsi que sur des données propriétaires obtenues grâce à des partenariats avec des entreprises comme Shutterstock, comme l'a rapporté le Wall Street Journal. OpenAI souligne son engagement à respecter les droits des artistes et a mis en œuvre des politiques pour empêcher la génération d'images qui imitent directement le travail d'artistes vivants.

OpenAI propose également un formulaire de désinscription aux créateurs qui souhaitent que leur travail soit retiré des ensembles de données d'entraînement. L'entreprise respecte les demandes d'interdiction aux robots d'exploration Web de collecter des données d'entraînement, y compris des images, à partir de sites Web.

Concurrence dans le Paysage de la Génération d'Images par IA

Cette mise à niveau des capacités de génération d'images de ChatGPT fait suite à la récente sortie expérimentale d'images natives de Google pour Gemini 2.0 Flash. Cependant, Gemini 2.0 Flash a été confronté à des difficultés avec des protections insuffisantes, entraînant la suppression des filigranes et la création d'images représentant des personnages protégés par le droit d'auteur.

Source: TechCrunch