WO2023088080A1

WO2023088080A1 - Procédé et appareil de génération de vidéo parlante, dispositif électronique et support de stockage

Info

Publication number: WO2023088080A1
Application number: PCT/CN2022/128584
Authority: WO
Inventors: 王宇欣; 吴文岩
Original assignee: Shanghai Sensetime Intelligent Technology Co Ltd
Current assignee: Shanghai Sensetime Intelligent Technology Co Ltd
Priority date: 2021-11-22
Filing date: 2022-10-31
Publication date: 2023-05-25
Anticipated expiration: 2024-05-22
Also published as: CN114093384B; CN114093384A

Abstract

Sont divulgués un procédé et un appareil de génération de vidéo parlante, ainsi qu'un dispositif et un support de stockage. Le procédé comprend les étapes consistant à : acquérir des caractéristiques de phonèmes et des caractéristiques acoustiques de données de commande vocale, les données de commande vocale comportant un contenu audio et/ou un texte ; en fonction des caractéristiques des phonèmes et des caractéristiques acoustiques, acquérir au moins un ensemble d'informations sur les points clés du visage d'un objet cible dans une première image ; en fonction dudit au moins un ensemble d'informations sur les points clés du visage et d'une seconde image comportant le visage de l'objet cible, obtenir au moins une image du visage cible correspondant aux données de commande vocale, une zone définie comportant une partie spécifique de l'objet cible dans la seconde image étant bloquée ; et obtenir une vidéo parlante de l'objet cible en fonction des données de commande vocale et de ladite au moins une image du visage cible.