Google Fait Progresser les Modèles d'IA pour les Entreprises

09/04/2025 Intelligence Artificielle

Google a annoncé des mises à jour significatives de sa suite de modèles d'IA, visant à consolider sa position sur le marché des entreprises. Ces améliorations couvrent divers formats de médias, y compris la génération de **musique**, de **vidéo**, de **voix** et d'**image**, tous accessibles via sa plateforme cloud Vertex AI.

Lyria : Modèle de Texte à Musique

Lyria, le modèle de texte à musique de Google, est désormais disponible en version préliminaire pour certains clients. Ce modèle offre une alternative aux bibliothèques de musique libres de droits, permettant aux utilisateurs de créer des chansons dans divers styles et genres, allant des **solos de piano jazzy** aux **pistes lo-fi**.

Veo 2 : Création Vidéo Améliorée

Veo 2, le modèle de création vidéo de Google, a reçu des mises à jour axées sur l'édition et la personnalisation des effets visuels. Les nouvelles fonctionnalités incluent la possibilité de supprimer les images d'arrière-plan, les logos et les objets des vidéos existantes. De plus, Veo 2 peut étendre les trames vidéo (par exemple, convertir le paysage en portrait), ajuster les angles de caméra et créer des timelapses et des clips de style drone. Il peut également interpoler entre les trames de début et de fin spécifiées. Ces fonctionnalités sont actuellement disponibles en version préliminaire.

Chirp 3 : Technologie de Clonage Vocal

Chirp 3, le modèle de compréhension audio de Google, alimente désormais une fonctionnalité de clonage vocal appelée Instant Custom Voice. Cette fonctionnalité, désormais généralement disponible, peut cloner une voix en utilisant seulement 10 secondes d'audio. Chirp 3 prend également en charge un nouvel outil appelé Transcription with Diarization, disponible en version préliminaire, qui sépare et identifie les locuteurs dans les enregistrements avec plusieurs participants. Google met l'accent sur un processus de "diligence" pour vérifier les autorisations d'utilisation vocale appropriées pour Instant Custom Voice, évitant ainsi les abus.

Imagen 3 : Génération d'Images Améliorée

Imagen 3, le générateur d'images de Google, offre désormais des performances considérablement améliorées, notamment en matière de suppression d'objets et de reconstruction de parties d'images endommagées ou manquantes. Cette amélioration augmente l'utilité du modèle dans les tâches d'édition et de restauration d'images.

Mesures de Sécurité et Filigrane

Tous les médias générés par Imagen, Veo et Lyria (à l'exclusion de Chirp) sont filigranés à l'aide de la technologie SynthID de Google. Google souligne que tous ses modèles d'IA génératifs sont dotés de protections intégrées pour se prémunir contre la création de contenu préjudiciable. L'entreprise propose également des mécanismes de désinscription pour la formation aux modèles et une politique d'indemnisation pour protéger les clients de Google Cloud et de Vertex AI contre les litiges liés aux droits d'auteur en matière d'IA.

Ces mises à jour témoignent de l'engagement de Google à fournir des outils d'IA complets et puissants pour le marché des entreprises, en concurrence directe avec des plateformes comme Bedrock d'Amazon.

Source: TechCrunch