WO2024201995A1

WO2024201995A1 - Dispositif d'étiquetage de locuteur, procédé d'étiquetage de locuteur et programme

Info

Publication number: WO2024201995A1
Application number: PCT/JP2023/013520
Authority: WO
Inventors: マークデルクロア; 章子荒木; 智広中谷; 厚徳小川; 直弘俵
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: NTT Inc
Priority date: 2023-03-31
Filing date: 2023-03-31
Publication date: 2024-10-03
Anticipated expiration: 2025-09-30
Also published as: JPWO2024201995A1

Abstract

Une extension de VBx est proposée afin de permettre le traitement d'un vecteur d'incorporation de locuteur à flux multiples. À cet effet, un dispositif d'étiquetage de locuteur selon la présente divulgation utilise un modèle de Markov caché dans lequel une séquence de vecteurs d'incorporation de locuteur sert d'informations d'observation et une séquence d'étiquettes de locuteur sert d'état caché dont les éléments consistent en combinaisons de locuteurs dans un signal audio. Le dispositif d'étiquetage de locuteur comprend une unité d'initialisation de modèle de Markov caché qui initialise un modèle de Markov caché dans lequel une probabilité de sortie d'état est exprimée en tant que produit de fonctions gaussiennes pour chaque locuteur.