Sam Altman & OpenAI dévoilent une avancée majeure dans la création de vidéo par Intellignece Artificielle avec SORA, un nouveau modèle capable de créer une vidéo réaliste d’une minute à partir d’un texte.
Créer une vidéo à partir d’un texte
Les premières secondes de cette vidéo ont été créées via intelligence artificielle grâce à un simple prompt qui dit:
Une portée de chiots golden retriever jouant dans la neige. Le neige recouvre leur tete.
il y a au moins 2 indices qui permettent de savoir que cette vidéo a été générée par L’I A:
- Le petit logo ChatGpt en bas à droite
- A force de jouer dans la neige ces adorables chiots devraient quand même finir par être un tout petit peu mouillées et ce n’est pas le cas…
Mais c’est quand-même…wow!
Il y a un an, on commençait à voir des créations de vidéos via intelligence artificielle comme Will Smith mangeant des spaghettis et même si ça a pu faire sourire sur le moment, de nos jours on ne saurait pas vraiment quoi faire avec ça.
Aujourd’hui ou plus exactement demain ou dans les jours voire semaines qui viennent,
parce que l’outil n’est pas encore disponible pour le grand public, la vidéo générée par intelligence artificielle ce sera autrement plus intérressant et utilisable.
Pas question ici d’assemblage maladroit d’extraits vidéos libres de droit choppés par-ci ou par-là sur Internet: Ici il s’agit vraiment de création à partir de rien ou plus exactement à partir d’un prompt un texte, et en tant que créateur Youtube on est en droit de se poser la question de savoir combien de temps il va se passer entre ça et la possibilité de pouvoir créer une vidéo complète de 10 minutes grâce à l’IA?
Sora est capable de générer une vidéo d’une minute à partir d’un prompt GPT.
Tout comme Dalle-E est capable d’interpréter du texte et le transformer en image
À la différence que dans une vidéo tout ce qui est couleur texture, reflet, loi de la physique etc, ce n’est pas figé comme sur image, mais ça change dans la durée et le résultat doit correspondre à une vidéo de qualité acceptable.
Il y a une série d’exemples assez incroyables sur le site d’openAI.
Il est important de garder à l’esprit que les vidéos que vous allez voir, vous savez que ce sont des vidéos générées via l’ intelligence artificielle mais pour certaines d’entre elles ça vaut la peine de se mettre dans l’état d’esprit de quelqu’un qui n’est pas au courant de ça
Ce n’est pas parfait, il y a des erreurs, des imperfections mais beaucoup d’entre elles sont imperceptibles si on regarde la vidéo sans savoir qu’elle a été créée grâce à un outil comme Sora
Un résulta qualitatif de plus en plus vite
Si on regarde les exemples sur le site d’openai il y a toujours moyen de trouver quelque chose qui ne va pas mais ce qui est surprenant c’est la vitesse à laquelle les choses s’améliorent, se corrigent
Avec Dall-E c’était pareil au début on demandait de la création d’une image, d’un personnage il y avait toujours quelque chose à redire sur les mains, les oreilles mais avec le temps ça s’est bien amélioré Il y a quoi parier qu’il en sera de même pour les vidéos avec Sora
Quand on regarde celle-ci il y a des erreurs sur le mouvement des pages mais les couleurs les textures, le ton de la peau, tout ça est parfaitment réaliste et il y aura moyen de créer des vidéos qui ne seront pas perçues comme étant générées par l’intelligence artificielle, aux yeux des gens qui ne font pas spécialement attention.
Qui va profiter de la vidéo par IA?
Au-delà des dérives possibles voire même probables qui vont découler de la création de vidéo via un outil comme Sora (imaginez de faire dire à un politicien des choses qu’il n’a jamais dites surtout en période électorale… ), il y a un secteur qui va grandement bénéficier de la création de vidéo via intelligence artificielle c’est les services qui offrent des extraits vidéos libres de droit, que les créateurs peuvent utiliser pour enrichir leurs propres vidéos ou que gestionnaires de campagnes marketing utilisent pour créer des vidéos publicitaires ou que les managers peuvent intégrer dans une présentation powerpoint pour illustrer l’ un ou l’autre slide…
Et ça à terme ça aura inévitablement des conséquences sur le boulot des pilotes de drone, les photographes, les vidéastes qu’il ne faudra plus engager pour obtenir un certain type de vidéo et ce sera également un manque à gagner pour les vidéastes qui produisent des vidéos destinées à enrichir les catalogues des sites qui proposent des vidéos libres de droit
Combien de temps?
Alors je répète ma question combien de temps est-ce quil va se passer avant de pouvoir créer une vidéo de 10 minutes pour YouTube avec Sora?
On est encore loin du compte il y a pas de musique par exemple il y a pas de voix
Et l’outil n’est pas encore disponible au grand public et en ce moment il est simplement ouvert à ceux qu’on appelle les Red Teamers, c’est-à-dire les gens qui essayent de trouver les défauts du système, qui essaient de le faire capoter et lui faire des choses qu’il n’est pas censé faire ainsi que à certains créateurs triés sur le volet, dans le but de recueillir leur feedback afin d’améliorer l’outil