Voici un nouveau progrès technologique utilisant l'intelligence artificielle qui peut révolutionner la photographie. Microsoft a dévoilé le projet VASA-1, qui permet de générer "des visages parlants réalistes à partir d'une seule image statique et d'un clip audio vocal". En résumé, vous prenez une photographie en mode portrait d'une personne, et vous enregistrez un son de cette même personne pour obtenir une vidéo réalisée par l'IA. Une démonstration est partagée par Bindu Reddy, PDG d'Abacus.ai, entreprise spécialisée dans l'intelligence artificielle.
The First AI-Generated Video That Looks Super Real
— Bindu Reddy (@bindureddy) April 17, 2024
Microsoft Research announced VASA-1.
It takes a single portrait photo and speech audio and produces a hyper-realistic talking face video with precise lip-audio sync, lifelike facial behavior, and naturalistic head movements… pic.twitter.com/6bxd4mEgFR
"La vidéo générée par l'IA semble très réelle !", souligne la dirigeante. Cette technologie "prend une seule photo de portrait et un son vocal et produit une vidéo hyper réaliste, avec une synchronisation audio-labiale précise, un comportement facial réaliste et des mouvements de tête naturalistes générés en temps réel", décrit la PDG.
À noter aussi que les chercheurs de Microsoft ont également utilisé cette technologie pour faire parler des œuvres artistiques très célèbres, à l'image de La Joconde de Léonard de Vinci.
Microsoft vient de sortir VASA-1
— Yyov (@DisizYyov) April 18, 2024
Cette IA peut faire chanter et parler n'importe quelle image à partir d'un audio de référence.
C'est incroyable pic.twitter.com/9wUgXqSME4
Pas (encore) disponible pour le grand public
Sur sa page Web consacrée au projet VASA-1, Microsoft précise que les exemples de portraits transformés en vidéo "sont des identités virtuelles et inexistantes". Le géant de l'informatique tient aussi à rassurer quant à l'utilisation de cette technologie : "Il s'agit uniquement d'une démonstration de recherche, et il n'y a pas de plan de sortie de produit".
Et face aux risques potentiels de détournement, que pourrait permettre ce logiciel s'il est un jour commercialisé, le groupe américain précise qu'il "n'est pas destiné à créer du contenu utilisé pour induire en erreur ou tromper". "Nous n'avons pas l'intention de publier une démo en ligne, un produit ou toute offre connexe tant que nous ne sommes pas certains que la technologie sera utilisée de manière responsable et conformément aux réglementations appropriées", se défend l'entreprise.
Il faut rappeler que Microsoft s'est imposé l'année dernière comme un acteur essentiel de l'IA grâce à son partenariat avec OpenAI, la start-up qui a créé le célèbre agent conversationnel ChatGPT.