JPH09258788A - 音声分離方法およびこの方法を実施する装置 - Google Patents

音声分離方法およびこの方法を実施する装置

Info

Publication number
JPH09258788A
JPH09258788A JP8063141A JP6314196A JPH09258788A JP H09258788 A JPH09258788 A JP H09258788A JP 8063141 A JP8063141 A JP 8063141A JP 6314196 A JP6314196 A JP 6314196A JP H09258788 A JPH09258788 A JP H09258788A
Authority
JP
Japan
Prior art keywords
sound
voiced
extracted
unvoiced
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP8063141A
Other languages
English (en)
Inventor
Tomohiro Nakatani
智広 中谷
Hiroshi Okuno
博 奥乃
Takeshi Kawabata
豪 川端
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP8063141A priority Critical patent/JPH09258788A/ja
Publication of JPH09258788A publication Critical patent/JPH09258788A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】 【課題】 混合音声の音色或は基本周波数が近接してい
る場合であってもこれらの音声を適切に区別分離するこ
とができると共に、音源の数に制限されない、分離音声
の品質の良好な音声の分離をすることができる音声分離
方法および装置を提供する。 【解決手段】 入力音響信号中に含まれる音声信号の有
声音部分と無声音部分の内の有声音部分は有声音の音源
方向の情報を加味しながら個別に抽出し、抽出された有
声音部分を複数の有声音に分化して有声音の群として抽
出し、音声信号の無声音部分は入力音響信号から有声音
部分を減算して抽出した残差から各有声音の群の無声音
に相当する音響信号の成分として抽出し、各別に抽出さ
れた有声音の群に無声音を補充して音声信号を抽出する
音声分離方法および装置。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、音声分離方法お
よびこの方法を実施する装置に関し、特に、複数の音声
が生成される環境中に配置される複数のマイクロフォン
から音響信号が入力される場合に、これら音響信号中に
含まれる個別の音声信号を、音声の発話者の空間的位置
と共に抽出する音声分離方法およびこの方法を実施する
装置に関する。
【0002】
【従来の技術】音響分離装置の従来例を図2を参照して
説明する。図2において、201は音響信号を入力する
音響入力端子である。202は入力音響信号から音声の
有声音部分を抽出する有声音抽出部である。203は有
声音を有声音の群に分けて抽出する有声音群化部であ
る。205は入力音響信号から有声音を減算した残差を
抽出する残差抽出部である。204は残差を各有声音の
群に補完する残差補充部である。ここで、有声音抽出部
202は入力音響信号中に含まれる有声音を個別の音と
して抽出し、有声音群化部203は個々の有声音を各有
声音の属性に基づいて特定の数の群に分配し、残差補充
部204は残差抽出部205が抽出した有声音以外のす
べての残差をすべての有声音の群に割り当てることによ
り音声分離する。
【0003】音響分離装置の他の従来例を図3を参照し
て説明する。この音響分離装置は複数の入力端子301
および302を具備している。303は入力音響信号中
に含まれる音源の方向を特定する音源定位部であり、3
04は特定の音源方向の音響信号成分だけを取り出す音
源方向成分抽出部である。ここで、入力音響信号から音
源定位部303が抽出した音声信号の音源の方向につい
て、音源方向成分抽出部304がその方向に由来する音
響信号だけを抽出することにより音声分離する。
【0004】
【発明が解決しようとする課題】上述された先の従来例
は、一つの入力端子に対して動作する様に設定されたも
のであり、複数の入力端子の音響信号から得られる音源
方向の属性を利用することはできない。従って、異なる
方向属性を持つ有声音であっても、音色或は基本周波数
が近接している場合は適切に区別することはできず、更
に、無声音部分を有声音の群に適切に分配することがで
きなかった。
【0005】また、他の従来例は音源の方向属性のみを
使用して音声を分離するものであるので、周波数帯或は
音源の数に制限があり、更に、調波構造の様な有声音の
分離に好都合な手がかりを使用することができないとこ
ろから、分離音声の品質が良好であるとは言い難かっ
た。この発明は、上述の問題を解消した音声分離方法お
よびこの方法を実施する装置を提供するものである。
【0006】
【課題を解決するための手段】入力音響信号中に含まれ
る音声信号の有声音部分と無声音部分の内の有声音部分
は有声音の音源方向の情報を加味しながら個別に抽出
し、抽出された有声音部分を複数の有声音に分化して有
声音の群として抽出し、音声信号の無声音部分は入力音
響信号から有声音部分を減算して抽出した残差から各有
声音の群の無声音に相当する音響信号の成分として抽出
し、各別に抽出された有声音の群に無声音を補充して音
声信号を抽出する音声分離方法を構成した。
【0007】そして、音響信号を入力する複数の音響入
力端子101および102を具備し、各音響入力端子1
01および102の入力信号から音声の有声音部分を個
別に抽出する有声音抽出部103を具備し、有声音抽出
部103が抽出する各有声音の音源方位を抽出する音源
定位部104を具備し、有声音抽出部103が抽出した
個別の有声音を、各話者毎の有声音の群に分けて抽出す
る有声音群化部106を具備し、入力音響信号から有声
音を減算した残差を抽出する残差抽出部105を具備
し、残差抽出部105が抽出した残差から有声音群化部
106が抽出した各有声音の群の無声音に相当する音響
成分を抽出する無声音抽出部108を具備し、無声音抽
出部108が抽出した無声音を各有声音の群に割り当て
る無声音補充部107を具備する音声分離装置を構成し
た。
【0008】
【発明の実施の形態】この発明の実施の形態を図1、図
4、図5を参照して説明する。ここにおいては、複数の
話者が同時に発生する音声をダミーヘッドを使用してバ
イノーラル録音した混合音を個別の音声に分離する場合
について説明する。この場合の入力端子数は2である。
【0009】図1において、101および102は音響
信号を入力する複数の音響入力端子を示す。103は有
声音抽出部であり、各音響入力端子101および102
の入力音響信号から音声の有声音部分を各別に抽出す
る。104は音源定位部であり、有声音抽出部103が
抽出する各有声音の音源方位を抽出するところである。
ところで、この有声音分抽出部103および音源定位部
104の技術内容は以下の通りである。即ち、特願平7
−180283号明細書には、図4を参照して音源方向
を抽出しながら整次倍音構造を有する音を分離する技術
が説明されている。整次倍音構造を有する音とは1個の
音が基本周波数成分の音とその周波数の整数倍の周波数
の成分の音とにより構成されている音をいい、音声の有
声部分は整次倍音構造を有している。この技術説明にお
いては、有声音抽出部と有声音の音源定位部とが画然と
説明されていた訳ではないが、これを図4に示される通
り、音響信号分配部403および404、音響信号数制
御部405および406、音響信号追跡部407、40
8、409および410、音響信号数調整部411、音
響信号抽出部412および413より成る有声音抽出部
103と、音源定位部104とに分割して示すことがで
きる。これにより、有声音抽出部103は、抽出した個
々の有声音をそれぞれバイノーラル音響信号として合成
した2チャネルの波形を出力する。
【0010】以下、図1および図4を参照して説明する
に、音響入力端子101および102から音響信号数調
整部411に到るブロックは、電子計算機により構成さ
れるこの音響分離装置が無音の状態にあるところを示し
ている。この無音状態において、一つの音が新規に音響
入力端子101および102に入力されたものとする
と、音響信号分配部403および404はそれぞれ入力
をそのまま音響信号数制御部405および406に出力
する。音響信号数制御部405および406は、各チャ
ネルch(=1か2)の入力信号中において、幾つかの
基本周波数ωについて、各倍音の強さAi,chを(1)式
に基づいて求め、次に、倍音群の強さIchを(2)式に
基づいて求める。そして、音響信号数調整部411は、
その倍音群の強さの総計Eを(3)式に基づいて求め
る。
【0011】 Ai,ch=‖Σtch(t)・exp(−j(iω)t)‖ (1) Ich=Σn i=12 i,ch (2) E=Σ2 ch=1ch (3) ここで、t:時刻 i:第i番目の倍音成分 xch(t):時刻tにおけるch番目の入力端子の音響入
力 ω:基本周波数 である。
【0012】求められた倍音の強さAi,chの内、或る閾
値を超えているものがある場合、音響信号数制御部40
5および406は音の存在を検知する。音響信号数制御
部405および406の何れかが音の存在を検知した
時、音響信号数調整部411は倍音群の強さの総計Eの
最大を与える基本周波数ωを求め、求められた周波数近
傍に基本周波数を有する倍音群を追跡する音響信号追跡
部407および408を、各音響信号数制御部405お
よび406により、図4に示される如くそれぞれ1個ず
つ生成し、同時に音響信号抽出部412を生成する。以
降、各入力信号に対して、音響信号追跡部407および
408は、(2)式により追跡している音響信号の各入
力信号中での強さを求める。求められた音響信号の各入
力信号中の強さIchを使用して、音響信号抽出部412
は(3)式を極大にする周波数ωを求めることにより基
本周波数を追跡する。音響信号追跡部407および40
8は、求められた基本周波数に対して倍音成分の周期と
強さAi,chと位相φi,chを式(1)、式(4)より求
め、次に、Ai,ch、φi,chより作られる正弦波をすべて
の倍音について加算することにより音響信号を合成す
る。
【0013】 φi,ch=arg(Σtch(t)・exp(−j(iω)t)) (4) 音響信号追跡部407および408は合成した音響信号
およびAi,ch、φi,chの値を音響信号抽出部412に渡
す。音響信号抽出部412は、音響信号追跡部407お
よび408から受けとった音響信号を、2チャネルのバ
イノーラル音響信号として出力する。これと同時に音響
信号抽出部412は、音響信号追跡部407および40
8から受けとったA i,ch、φi,chの値を音源定位部10
4に送り込み、これにより音響信号の由来する音源のダ
ミーヘッドから見た存在方向を決定する。一般に、単一
音源が存在する時に、バイノーラル録音された2チャネ
ルの音響信号から音源の方向を決定するには、二つの音
響信号の位相差および強度差を利用する方法が知られて
いる。混合音から音響信号追跡部407および408が
取り出した各音響信号の強度および位相は、近似的に単
一音源の位相および強度とみなせるので、音響信号抽出
部412および音源定位部104は次の位相差ωi 、強
度比It,kの値を用いて音源方向を決定する。
【0014】Δωi=φi,1−φi,2 ΔIi=Ai,1/Ai,2 このために、音源定位部104は、これらの値をもとに
音響信号抽出部412が抽出した信号についての方向ヒ
ストグラムを作成する。方向ヒストグラムは、配列変数
であって、配列の各要素は特定の方向の候補Dを表わ
す。先ず、音源定位部104は、音響信号抽出部412
が抽出した各倍音について、すべての方向候補Dに関し
て、次の二つの条件式が満足されるか否かを調べる。
【0015】 (D−θ1)・ω≦Δωi+2nπ≦(D+θ1)・ω ΔIt,k>0、 if D>2θ1 ΔIt,k<0、 if D<2θ1 θ2 >ΔIt,k>−θ2、otherwise ここで、ω:倍音の周波数、θ1=0.08ms、θ2
0.4msである。
【0016】或る方向候補Dに関して、上の条件が満た
された時、Dに相当する配列の要素に、この倍音のA
i,chの値を加算する。これを、すべての倍音について加
算した結果、最大値をとる配列要素に相当する方向候補
Dを、音源の方向とする。一旦、音源の方向が求まる
と、以後、音響信号抽出部412および音源定位部10
4は、音響信号追跡部407および408に、音源と同
一の方向から来る音響成分だけをもとに、音響信号を追
跡させる。このために、音響信号抽出部412は、音響
信号追跡部407および408に基本周波数追跡時に一
時刻前に求めた各倍音の方向Dが音源方向と一致してい
た倍音だけを用いて(1)式の加算式を計算させる様に
する。この方法により、音響信号抽出部412は、音源
と同一方向から来る倍音だけを用いて基本周波数を追跡
する様になるので、より正確な基本周波数の値を得るこ
とができる様になる。各チャネル毎に、音響信号分配部
403および404が音響信号を分配する機構について
は、参考文献[中谷93]の方法を利用するものとす
る。一つの音が入力信号中からなくなった時、対応する
音響的信号追跡部407および408は、(3)式の値
が或る閾値より小さくなることを条件として音の特徴の
追跡に失敗したものと判断する。この時、対応する音響
信号追跡部407或は408と音響信号抽出部412は
自動的に消滅する。
【0017】図1において、106は有声音群化部であ
り、有声音抽出部103が抽出した各別の有声音を各話
者毎の有声音の群に分けて抽出する。この有声音群化部
106は特願平7−180282号明細書に開示される
図5の音源数制御部503、音源追跡部504および5
05により構成する。これにより、有声音群化部106
は、継続的に生成される有声音を有声音抽出部103よ
り受けとり、各話者の音声に含まれる一連の有声音群に
まとめて、バイノーラル音響信号として、その音源の方
向dと共に出力する。
【0018】ここで、図1および図5を参照して説明す
る。図5に着目するに、音響入力端子501ないし音源
数制御部503は電子計算機により構成されるこの音響
分離装置が無音状態において一つの音源も検知していな
い初期状態を示している。この初期状態において、一つ
の音が音響入力端子501に入力されると連続信号分離
部502は、この音を検知してからこの音が再び無音に
なる迄一つの連続音として出力する。この時、連続信号
分離部502は、この音の基本周波数、およびこの音を
発生している音源の入力装置から見た空間的方向も同時
に抽出して出力する。なお、連続信号分離部502が混
合音を連続した個別の音に分離する方法、および基本周
波数と音源の方向を抽出する方法については、先に図4
を参照して説明した通りである。即ち、図5において有
声音抽出部103を構成する連続信号分離部502の出
力する信号は、図4において有声音抽出部103が出力
する信号と同一のものである。
【0019】有声音群化部106を構成する音源数制御
部503に、連続信号分離部502が分離した音響信号
が入力されると、音源数制御部503は新規の音源が音
を発生したものと判断し、新しく音源追跡部504を生
成し、この時の音響信号を音源追跡部504に渡す。以
後、音源追跡部504は連続信号分離部502が出力す
る個別の連続音響信号の内の基本周波数および音源の方
向が近接した音響信号を一連の音として接続、群化して
出力する。即ち、音源追跡部504は連続信号分離部5
02が新たな音響信号を出力する度に、先ずその音響信
号とその直前に音源追跡部504が追跡していた音響信
号との間において、基本周波数の差および方向属性の差
を計算する。そして、これらの値が或る閾値以下である
場合に音源追跡部504は、この時の音響信号を音源追
跡部504が追跡している音源に由来するものと判断す
る。音源追跡部504は、この音響信号を受けとって音
源追跡部504が追跡している音に加えると共にこの音
が音源数制御部503には渡されない様にする。一方、
音源数制御部503は、音源追跡部504が受けとらな
かった音響信号を受けとると新規の音源が音を発生した
ものと判断し、新しく音源追跡部505を生成し、この
時の音響信号を音源追跡部505に渡す。以後、音源追
跡部505は、音源追跡部504と同様の操作により一
つの音源に由来する音を分離群化して出力する。
【0020】二つ以上の音源追跡部504および505
が生成されている場合、連続信号分離部502が分離し
た一つの音響信号を、二つ以上の音源追跡部504およ
び505が、それぞれが自身の追跡している音源に由来
する音であると判定する場合がある。この場合、その音
響信号と音源追跡部504および505が追跡している
音響信号との間の次式で定義される距離Dが最小になる
音源追跡部が、排他的にその音響信号を受けとるものと
する。
【0021】 D=α|Ff−Fs|+(1−α)|Df−Ds| ここで、Ff:連続音響信号の基本周波数 Fs:連続音響信号が生成される直前に音源追跡部が追
跡していた音響信号の基本周波数 Df:連続音響信号の音源方向 Ds:連続音響信号が生成される直前に音源追跡部が追
跡していた音響信号の音源方向 α:或る重み定数 である。
【0022】これにより、連続信号分離部502が分離
した音響信号は、音源数制御部503、音源追跡部50
4および505の内の何れか一つだけに、必ず、渡され
ることになる。音源追跡部505は、一定時間以上対応
する連続音響信号を受けとらなかった時、対応する音源
の音の生成が終了したものと判断する。この時、音源追
跡部505は自動的に消滅する。
【0023】図1において、105は残差抽出部であ
る。残差抽出部105は、2個の音響入力端子101お
よび102から入力した混合音響入力信号波形から有声
音抽出部103から入力したすべての有声音の波形を減
算することにより残差を計算して出力する。ここで、残
差は無声音と有声音の抽出誤差より成る混合音である。
無声音抽出部108は、残差抽出部105から残差を入
力し、有声音群化部106から各有声音の群の音源方向
dを受けとり、残差中の各音源方向の音響成分を抽出し
て出力する。残差中の特定の音源方向の音響成分抽出
は、以下の方法により行なう。
【0024】先ず、残差信号を離散時間フーリエ変換し
て各入力チャネル毎に周波数領域の信号に変換して以下
の値を得る。 Ich(fi ):各チャネルの周波数fi における残差の
強度 φch(fi ):各チャネルの周波数fi における残差の
位相 ここで、fi :離散時間フーリエ変換に用いられる離散
周波数の各値、 i:離散周波数のインデックス(=1,…,n) ch:チャネルを表すインデックス(=1か2) バイノーラル録音された信号の場合、特定の方向から到
来する音響信号は、2つのチャネル間でIch(fi )、
φch(fi )の値の差は或る一定の範囲に収まることが
わかっている。即ち、特定の方向dから到来する音の場
合、次の2つの関係が成り立つ。
【0025】 ここで、Δφl (fi ,d):チャネル間の位相差の閾
値関数 γl (fi ,d):チャネル間の強度比の閾値関数 各閾値関数、Δφl (fi ,d)、γl (fi ,d)は
バイノーラル録音に使用するダミーヘッドの音響特性で
ある頭部音響伝達関数をもとに決まる関数である。この
関係式を使用して、各チャネルの値が特定の方向dに由
来する音であるか否かを判定し、この方向dと異なる方
向であると判定された周波数に関しては、各チャネルの
対応する周波数の強度Ich(fi )を0とする。その結
果、以上の操作により得られる周波数領域の信号I
ch(fi )、φch(fi )を各チャネル毎に離散時間逆
フーリエ変換を行なうことにより、残差中の特定方向d
の音響成分を抽出する。
【0026】図1の無声音補充部107は、有声音群化
部106から各有声音の群を受けとると共に、無声音抽
出部108から各有声音の群と同一方向の残差中の音響
成分として抽出された無声音を受けとり、各有声音の群
の波形に無声音の波形を加算することにより各音声を抽
出する。ここで、複数の話者が同時に発生した音声より
成る混合音声を分離する場合についてこの発明の効果を
実証する。音響入力として、ダミーヘッドの正面から見
て左右30度の位置に配置された2個のスピーカから、
2つの女性の声“うちわ”と“いっしゅん”とを、開始
時刻を150msずらして発生させることにより形成さ
れる混合音声をバイノーラル録音し、これを12kHz
により標本化し、16bitでAD変換し、30msの
ハミング窓をかけたものを使用する。フレーム周期は
7.5msである。図6は入力として与えられた二つの
女性の声の波形601および602、およびその混合音
声の波形603を示す。
【0027】図7はこの発明により分離した二つの女性
の声の波形701および702を示す。横軸は時間を表
わし、縦軸は振幅を表わす。図7の分離音声701およ
び702を、それぞれ、図6の入力音声601および6
02と比較してみると、分離音声の品質は良好であると
することができる。
【0028】
【発明の効果】以上の通りであって、この発明は、複数
の音響入力端子から音響信号を入力して入力音響信号中
に含まれる音声信号の有声音部分を有声音の音源方向の
情報を加味しながら個別に抽出して音源方向の属性を利
用することにより、混合音声の音色或は基本周波数が近
接している場合であってもこれらの音声を適切に区別分
離することができる。そして、無声音部分については、
混合音声から抽出された有声音をすべて減算した残差に
ついて、方向属性を利用して、各話者の有声音を付加す
ることによって、調波構造だけを用いて分離を行なう場
合よりも、適切な無声音部分の割り当てをすることがで
きる。また、単に音源の方向属性のみを使用して音声を
分離するものとは異なり、音声の調波構造を有する有声
音の分離に好都合な有声音部分を追跡処理するものであ
り、音源の数に制限されない、分離音声の品質の良好な
音声の分離をすることができる。
【図面の簡単な説明】
【図1】実施例を説明するロック図。
【図2】従来例を説明するロック図。
【図3】他の従来例を説明するロック図。
【図4】有声音分離部を説明するブロック図。
【図5】有声音群化部を説明するブロック図。
【図6】入力音声の波形を示す図。
【図7】分離した二つの音声の波形を示す図。
【符号の説明】
101 音響入力端子 102 音響入力端子 103 有声音抽出部 104 音源定位部 105 残差抽出部 106 有声音群化部 107 無声音補充部 108 無声音抽出部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力音響信号中に含まれる音声信号の有
    声音部分と無声音部分の内の有声音部分は有声音の音源
    方向の情報を加味しながら個別に抽出し、 抽出された有声音部分を複数の有声音に分化して有声音
    の群として抽出し、 音声信号の無声音部分は入力音響信号から有声音部分を
    減算して抽出した残差から各有声音の群の無声音に相当
    する音響信号の成分として抽出し、 各別に抽出された有声音の群に無声音を補充して音声信
    号を抽出することを特徴とする音声分離方法。
  2. 【請求項2】 音響信号を入力する複数の音響入力端子
    を具備し、各音響入力端子の入力信号から音声の有声音
    部分を個別に抽出する有声音抽出部を具備し、有声音抽
    出部が抽出する各有声音の音源方位を抽出する音源定位
    部を具備し、有声音抽出部が抽出した個別の有声音を、
    各話者毎の有声音の群に分けて抽出する有声音群化部を
    具備し、入力音響信号から有声音を減算した残差を抽出
    する残差抽出部を具備し、残差抽出部が抽出した残差か
    ら有声音群化部が抽出した各有声音の群の無声音に相当
    する音響成分を抽出する無声音抽出部を具備し、無声音
    抽出部が抽出した無声音を各有声音の群に割り当てる無
    声音補充部を具備することを特徴とする音声分離装置。
JP8063141A 1996-03-19 1996-03-19 音声分離方法およびこの方法を実施する装置 Pending JPH09258788A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP8063141A JPH09258788A (ja) 1996-03-19 1996-03-19 音声分離方法およびこの方法を実施する装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP8063141A JPH09258788A (ja) 1996-03-19 1996-03-19 音声分離方法およびこの方法を実施する装置

Publications (1)

Publication Number Publication Date
JPH09258788A true JPH09258788A (ja) 1997-10-03

Family

ID=13220695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP8063141A Pending JPH09258788A (ja) 1996-03-19 1996-03-19 音声分離方法およびこの方法を実施する装置

Country Status (1)

Country Link
JP (1) JPH09258788A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005066927A1 (ja) * 2004-01-09 2005-07-21 Toudai Tlo, Ltd. 多重音信号解析方法
JP2007233239A (ja) * 2006-03-03 2007-09-13 National Institute Of Advanced Industrial & Technology 発話イベント分離方法、発話イベント分離システム、及び、発話イベント分離プログラム
WO2009034686A1 (ja) * 2007-09-11 2009-03-19 Panasonic Corporation 音判定装置、音検知装置及び音判定方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005066927A1 (ja) * 2004-01-09 2005-07-21 Toudai Tlo, Ltd. 多重音信号解析方法
JP2007233239A (ja) * 2006-03-03 2007-09-13 National Institute Of Advanced Industrial & Technology 発話イベント分離方法、発話イベント分離システム、及び、発話イベント分離プログラム
WO2009034686A1 (ja) * 2007-09-11 2009-03-19 Panasonic Corporation 音判定装置、音検知装置及び音判定方法
US8352274B2 (en) 2007-09-11 2013-01-08 Panasonic Corporation Sound determination device, sound detection device, and sound determination method for determining frequency signals of a to-be-extracted sound included in a mixed sound

Similar Documents

Publication Publication Date Title
US11966660B2 (en) Method, system and artificial neural network
Kitahara et al. Instrument identification in polyphonic music: Feature weighting to minimize influence of sound overlaps
Nakatani et al. Harmonic sound stream segregation using localization and its application to speech stream segregation
Ikemiya et al. Singing voice separation and vocal F0 estimation based on mutual combination of robust principal component analysis and subharmonic summation
Li et al. Monaural musical sound separation based on pitch and common amplitude modulation
TWI742486B (zh) 輔助歌唱系統、輔助歌唱方法及其非暫態電腦可讀取記錄媒體
CN108206026A (zh) 确定音频内容音高偏差的方法及装置
Pertusa et al. Multiple fundamental frequency estimation using Gaussian smoothness
US20120234158A1 (en) Auto-synchronous vocal harmonizer
WO2021089544A1 (en) Electronic device, method and computer program
Munoz-Montoro et al. Multichannel blind music source separation using directivity-aware MNMF with harmonicity constraints
Gao et al. Personalized Singing Voice Generation Using WaveRNN.
Itoyama et al. Integration and adaptation of harmonic and inharmonic models for separating polyphonic musical signals
Marxer et al. Low-latency instrument separation in polyphonic audio using timbre models
Viste et al. A method for separation of overlapping partials based on similarity of temporal envelopes in multichannel mixtures
JPH09258788A (ja) 音声分離方法およびこの方法を実施する装置
Hung et al. Transcription is all you need: Learning to separate musical mixtures with score as supervision
Koo et al. Self-refining of pseudo labels for music source separation with noisy labeled data
Goto A predominant-F0 estimation method for polyphonic musical audio signals
Duan et al. Harmonically Informed Multi-Pitch Tracking.
Dong et al. Salsaasst: Beat counting system empowered by mobile devices to assist salsa dancers
Sinith et al. Raga recognition through tonic identification using flute acoustics
Han et al. Reconstructing completely overlapped notes from musical mixtures
Chakraborty et al. BEAT ESTIMATION FROM MUSICIAN VISUAL CUES
CN108962268A (zh) 确定单声道的音频的方法和装置