Google frappe fort avec Veo 2, son générateur de vidéos par intelligence artificielle dévoilé récemment. Succédant à la première version sortie en mai, ce nouvel outil se positionne en concurrent direct de Sora, l’alternative proposée par OpenAI… Et il semble déjà tenir tête.
Créer des vidéos, mais pas n’importe comment
Avec Veo 2, Google promet une meilleure maîtrise des fondamentaux cinématographiques. L’outil peut interpréter des commandes complexes comme « un travelling en contre-plongée » ou encore simuler un effet de faible profondeur de champ (vous savez, ce fameux flou artistique derrière le sujet). Les résultats sont des vidéos atteignant une définition jusqu’à 4K et s’étirant sur plusieurs minutes, un avantage certain comparé aux 1080p et 20 secondes proposées par Sora.
Grâce à son entraînement intensif sur des données issues de YouTube (on parle ici d’une immense base visuelle et sonore), Veo 2 affiche une compréhension plus fine des mouvements humains et des lois physiques du monde réel… De quoi éviter les fameuses « hallucinations » qui peuvent rendre un contenu créé par IA absurde ou irréaliste (comme ces doigts supplémentaires qui apparaissent parfois dans les images générées).
Imagen 3 et SynthID : l’autre volet de l’offensive Google
En parallèle, Google mise aussi sur Imagen 3 pour enrichir son arsenal créatif. Ce générateur d’images avancé, rival direct de DALL-E d’OpenAI, se démarque notamment grâce à SynthID, une technologie intégrée qui appose un filigrane invisible sur chaque contenu produit. Objectif affiché ? Lutter contre la désinformation en permettant d’identifier facilement les créations issues de l’intelligence artificielle.
Les deux outils, Veo 2 et Imagen 3, restent accessibles via les plateformes VideoFX et ImageFX sur Google Labs. Petit bémol cependant : ils ne sont pas encore disponibles en Europe. Une stratégie prudente qui laisse penser que Google souhaite affiner son approche avant un déploiement global.
Et Sora dans tout ça ?
De son côté, OpenAI mise sur la simplicité et l’accessibilité. Avec une interface utilisateur intuitive via ChatGPT Pro et une disponibilité immédiate pour le grand public, Sora a déjà conquis bon nombre d’utilisateurs. Cependant, certaines démonstrations mettent en lumière ses limites face à Veo 2 : prompts mal interprétés ou animations moins réalistes… Des détails qui pourraient faire pencher la balance en faveur de Google si ces derniers jouent bien leurs cartes.
Bien que les deux géants suivent des stratégies différentes, Google optant pour une montée en puissance progressive tandis qu’OpenAI privilégie la rapidité, la compétition entre Veo 2 et Sora ne fait que commencer. Pour nous autres utilisateurs (et curieux), c’est surtout une promesse excitante : celle d’un futur où créer des vidéos dignes d’un réalisateur pourrait être aussi simple que taper quelques mots sur un clavier…