
Nouveaux Modèles de Génération de Médias par IA de Google
Google a récemment présenté ses dernières avancées en matière de génération de médias par IA lors de sa conférence I/O. La révélation la plus importante est Veo 3, un modèle révolutionnaire capable de générer des vidéos avec un son correspondant. Cette technologie permet la création de clips très réalistes, comme le chant des oiseaux synchronisé avec des images d'oiseaux ou des rues de ville avec des sons de circulation réalistes. Google souligne l'excellence de Veo 3 en matière de simulation de physique du monde réel et de synchronisation labiale précise.
Extension des capacités de l'IA
Actuellement, Veo 3 est disponible exclusivement pour les abonnés à Gemini Ultra aux États-Unis via l'application Gemini et pour les utilisateurs professionnels sur Vertex AI. Il s'intègre également à Flow, un nouvel outil de création de films basé sur l'IA conçu pour simplifier la création de vidéos. Flow combine Veo, Imagen et Gemini pour permettre aux utilisateurs de décrire leur sortie vidéo souhaitée en langage naturel, laissant les aspects techniques à l'IA.
Lors du lancement de Veo 3, Google n'a pas abandonné son prédécesseur. Veo 2 reste accessible, offrant aux utilisateurs un contrôle amélioré au sein de Flow. Les utilisateurs peuvent utiliser des images comme références, manipuler les angles de caméra, ajuster les rapports d'aspect et même ajouter ou supprimer des objets de leurs vidéos.
Imagen 4 et SynthID Detector
Parallèlement à Veo 3, Google a également présenté Imagen 4, son dernier modèle de génération d'images. Imagen 4 offre des détails exceptionnels, restituant avec précision des textures complexes comme les tissus et la fourrure des animaux. Ses capacités de typographie améliorées et sa capacité à générer des images haute résolution (jusqu'à 2K) dans différents rapports d'aspect en font un outil puissant. Imagen 4 est disponible via l'application Gemini, Vertex AI et les applications Workspace telles que Docs et Slides.
Pour répondre à la difficulté croissante d'identifier le contenu généré par l'IA, Google a lancé le SynthID Detector. Ce portail permet aux utilisateurs de télécharger des médias pour analyse, déterminant la présence de SynthID, la technologie de filigrane IA de Google. Bien que non infaillible, car tous les générateurs d'IA n'utilisent pas SynthID, il s'agit d'une étape importante vers un usage responsable de l'IA.
1 Image de Génération Média IA:

Source: Engadget