Imagen : le futur de la création de vidéo par Google

Google a présenté, il y a quelques jours, Imagen Video, son outil de création de vidéo par commande textuelle

Les outils de génération d’images IA ont le vent en poupe. Ils s’appellent Midjourney, Stable Diffusion ou encore Dall-E et permettent de créer facilement des images en entrant des mots clés. Après avoir été l’apanage des initiés, ces outils sont désormais accessibles au grand public.

À peine arrivés à maturité, ces outils doivent faire la place à une nouvelle révolution : la création de vidéo par commande textuelle

Imagen ou comment créer une vidéo avec une simple requête

C’est Meta qui a lancé les hostilités en présentant Make-A-Video, sa solution Text-To-Video basée sur l’intelligence artificielle.  

Il n’aura fallu que quelques jours pour que Google réponde à Meta avec Imagen Video.

Le principe est le même que les solutions Text-To-Image : vous entrez vos mots clés et l’outil créé une vidéo. Par exemple, si vous tapez « Des germes en forme de texte Imagen »  sortant d’un livre de contes de fées », vous obtenez la vidéo suivante :

Le résultat est impressionnant que ce soit au niveau du rendu que de la créativité.

Imagen Video est capable de générer des vidéos en haute définition (1280 x 768 pixels) avec 24 images par seconde . Il gère l’animation de texte. Il peut également produire des vidéos dans différents styles artistiques. Certaines frappent par leur photoréalisme.

D’autres ont un style cartoon.

Par ailleurs, l’outil Text-to-Video dispose d’une compréhension des objets 3D. 

Pour ce faire, Google a entraîné son intelligence artificielle en lui faisant « ingurgiter » plus de 60 millions d’images associées à du texte et 14 millions de vidéos. 

Allons-nous bientôt tous devenir des vidéastes en herbe en créant des vidéos aussi facilement et rapidement que nous tapons des requêtes Google

Pour l’instant, Imagen Video n’est pas accessible au grand public. Pour Google, le produit est encore perfectible. Les séquence vidéo sont limitées à 5 secondes même si Google dispose d’un autre outil appelé Phenaki, qui peut aller jusqu’à 2 minutes et 30 secondes (aux dépens de la qualité de la vidéo). Il y a la crainte qu’il soit utilisé avec des intentions malveillantes pour produire du contenu raciste ou encore des Deep Fakes. 

Laisser un commentaire