JPS628800B2 - - Google Patents
Info
- Publication number
- JPS628800B2 JPS628800B2 JP54165578A JP16557879A JPS628800B2 JP S628800 B2 JPS628800 B2 JP S628800B2 JP 54165578 A JP54165578 A JP 54165578A JP 16557879 A JP16557879 A JP 16557879A JP S628800 B2 JPS628800 B2 JP S628800B2
- Authority
- JP
- Japan
- Prior art keywords
- feature
- parameter
- normalization
- value
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Complex Calculations (AREA)
Description
【発明の詳細な説明】
本発明は、音声認識装置において、音声パタン
における、特徴ベクトルの時系列として表現され
る特徴パタンの個人差による変動を大局的に正規
化または補正するパタンの前処理装置に関する。
における、特徴ベクトルの時系列として表現され
る特徴パタンの個人差による変動を大局的に正規
化または補正するパタンの前処理装置に関する。
音声パタンの特徴ベクトルの各成分の大きさを
表わす特徴パラメータとしては、 (i) 音声の周波数帯域をいくつかのチヤネルに分
割したときの各チヤネルに対応するフイルタバ
ンクの出力値 (ii) 自己相関係数 (iii) 偏自己相関係数{………PARTIAL AUTO
−CORRELATION COEFFICIENT(以下、
PARCOR係数と呼ぶ)} など種々の量を用いることが可能である。
表わす特徴パラメータとしては、 (i) 音声の周波数帯域をいくつかのチヤネルに分
割したときの各チヤネルに対応するフイルタバ
ンクの出力値 (ii) 自己相関係数 (iii) 偏自己相関係数{………PARTIAL AUTO
−CORRELATION COEFFICIENT(以下、
PARCOR係数と呼ぶ)} など種々の量を用いることが可能である。
しかし、いづれの量を用いても、音声情報の個
人差にもとづいて特徴パラメータに種々の変動が
生ずる結果、抽出された特徴パラメータの誤差も
大きくなり、音声パタンの正しい認識が困難にな
る問題があつた。
人差にもとづいて特徴パラメータに種々の変動が
生ずる結果、抽出された特徴パラメータの誤差も
大きくなり、音声パタンの正しい認識が困難にな
る問題があつた。
音声パタンの場合、個人差にもとづく変動の代
表例としては、 (1) 入力レベルの変動にもとづく特徴パラメータ
の絶対レベルの変動 (2) フイルタバンクの出力値を特徴パラメータと
した場合におけるフオルマント周波数の変動な
どがあり、これらの変動にもとづく認識精度の
低下を防止するために次のような方法が考えら
れている。
表例としては、 (1) 入力レベルの変動にもとづく特徴パラメータ
の絶対レベルの変動 (2) フイルタバンクの出力値を特徴パラメータと
した場合におけるフオルマント周波数の変動な
どがあり、これらの変動にもとづく認識精度の
低下を防止するために次のような方法が考えら
れている。
(1)に対しては、たとえばフイルタバンクの出力
値を特徴パラメータとした場合における各時刻で
の周波数方向の正規化(フイルタ出力の相対値
化)がおこなわれている。
値を特徴パラメータとした場合における各時刻で
の周波数方向の正規化(フイルタ出力の相対値
化)がおこなわれている。
(2)に対しては、フオルマント周波数の変動が各
個人の声道長の違いによることから、音声情報よ
り声道長を推定して、この声道長を正規化するこ
とがおこなわれている。
個人の声道長の違いによることから、音声情報よ
り声道長を推定して、この声道長を正規化するこ
とがおこなわれている。
しかし、(1)に対する従来の正規化方法では、た
とえば特徴パラメータの時間方向における絶対的
な大小関係に関する構造が破壊され、その結果と
して音声情報の有する本質的情報の一部が失なわ
れてしまう欠点があつた。
とえば特徴パラメータの時間方向における絶対的
な大小関係に関する構造が破壊され、その結果と
して音声情報の有する本質的情報の一部が失なわ
れてしまう欠点があつた。
また、(2)に対する従来の方法では声道長を正確
に推定することが困難で、推定にともなう誤差が
生ずるために正しい正規化が不可能になる欠点が
あつた。
に推定することが困難で、推定にともなう誤差が
生ずるために正しい正規化が不可能になる欠点が
あつた。
したがつて、本発明の第1の目的は音声パタン
の有する本質的情報を失なうことなく、音声パタ
ンから抽出された特徴パラメータに存在する個人
差にもとづく特性の変動を吸収するパタン前処理
方法を提供することにある。
の有する本質的情報を失なうことなく、音声パタ
ンから抽出された特徴パラメータに存在する個人
差にもとづく特性の変動を吸収するパタン前処理
方法を提供することにある。
さらに、本発明の第2の目的は前記特徴パラメ
ータの時間方向における構造を保持しつつ、終局
的には個人差にもとづく周波数特性の変動として
のホルマント周波数の変動をも吸収するパタン前
処理方法を提供することにある。
ータの時間方向における構造を保持しつつ、終局
的には個人差にもとづく周波数特性の変動として
のホルマント周波数の変動をも吸収するパタン前
処理方法を提供することにある。
上記の目的を達成するため本発明においては、
2次元平面を構成する座標軸の一方を時間軸と
し、他方を周波数軸としておき、この周波数軸上
の一点に対する上記時間軸上の一連の点における
特徴パラメータについて、 (a) 上記一連の特徴パラメータの最大値による各
特徴パラメータの除算をおこなう。
2次元平面を構成する座標軸の一方を時間軸と
し、他方を周波数軸としておき、この周波数軸上
の一点に対する上記時間軸上の一連の点における
特徴パラメータについて、 (a) 上記一連の特徴パラメータの最大値による各
特徴パラメータの除算をおこなう。
(b) 対数による非線形な補正をおこなう
(c) 対数による非線形な補正をおこなつた一連の
特徴パラメータに対してその最大値による除算
をおこなう など、特徴パラメータの時間軸方向における値の
大小関係を保持した前処理をおこなう。
特徴パラメータに対してその最大値による除算
をおこなう など、特徴パラメータの時間軸方向における値の
大小関係を保持した前処理をおこなう。
以下、第1図を参照して本発明の原理を説明す
る。
る。
第1図は、音声のフイルタバンク出力値を特徴
パラメータとした場合のある特定のチヤネルにお
ける異なる話者が発する同一音声内容によるフイ
ルタバンク出力値の相違を示したものである。
パラメータとした場合のある特定のチヤネルにお
ける異なる話者が発する同一音声内容によるフイ
ルタバンク出力値の相違を示したものである。
第1図によれば、極大点や極小点を与える時間
軸上の位置は類似しているが、振巾値は大巾に異
なつていることがわかる。上記異なる話者による
音声パタンA,B間の類似度を通常のユークリツ
ド距離を尺度として求めると、話者の相意にもと
づく変動が音声パタンそのものの相違にもとづく
変動よりも大きくなつてしまうから、音声パタン
の差を正しく検出することができないことになつ
てしまう。
軸上の位置は類似しているが、振巾値は大巾に異
なつていることがわかる。上記異なる話者による
音声パタンA,B間の類似度を通常のユークリツ
ド距離を尺度として求めると、話者の相意にもと
づく変動が音声パタンそのものの相違にもとづく
変動よりも大きくなつてしまうから、音声パタン
の差を正しく検出することができないことになつ
てしまう。
したがつて、上記振巾値を正規化または補正し
て話者の相違にもとづく変動を小さくすることが
必要になる。本発明では上記振巾値を正規化また
は補正するために、以下に述べる2ステツプのい
づれか一方またはこれらを組み合わせた方法をと
る。
て話者の相違にもとづく変動を小さくすることが
必要になる。本発明では上記振巾値を正規化また
は補正するために、以下に述べる2ステツプのい
づれか一方またはこれらを組み合わせた方法をと
る。
以下、たとえば2ステツプを組み合わせた前処
理法について説明するが、ステツプ1のみによる
前処理法やステツプを省略した前処理法も可能で
ある。
理法について説明するが、ステツプ1のみによる
前処理法やステツプを省略した前処理法も可能で
ある。
音声パタンから抽出された、時刻i(i=1、
2、………、I)における特徴ベクトルa1と、a1
の時系列として表現される特徴パタンAとをつぎ
のように定義しておく。
2、………、I)における特徴ベクトルa1と、a1
の時系列として表現される特徴パタンAとをつぎ
のように定義しておく。
〓〓=(ai1、ai2、………、aiJ)
A=a1、a2、………、a
ここで、aij(j=1、2、………J)は時刻
iにおける第j番目のチヤネルのフイルタバンク
出力値に相当する特徴パラメータ量である。
iにおける第j番目のチヤネルのフイルタバンク
出力値に相当する特徴パラメータ量である。
ステツプ1:対数による補正
人間の聴特性を近似した振巾の補正のために、
10またはeなどを底とする対数によるaijの非線
形な補正をおこなう。
10またはeなどを底とする対数によるaijの非線
形な補正をおこなう。
補正後の特徴パラメータに対応する量a′ijは次
の(1)式により与えられる。
の(1)式により与えられる。
a′ij=log(1+aij/A0)A0:定数 (1)
(1)式における1はaij/A0が0に近い値になつ
たときのa′ijの急峻な変動を防止するために加算
されたものである。
たときのa′ijの急峻な変動を防止するために加算
されたものである。
ステツプ2:時間軸方向の正規化
周波数軸方向の各チヤネル毎に時間軸方向の大
局的正規化をおこなう。
局的正規化をおこなう。
周波数軸方向の第jチヤネルにおける前記a
′1j、a′2j、………、a′Ijのうちの最大値を
Mjとす
るとき、前記特徴パラメータaijに対応する正規
化後の特徴パラメータa″ijは(2)式により与えられ
る。
′1j、a′2j、………、a′Ijのうちの最大値を
Mjとす
るとき、前記特徴パラメータaijに対応する正規
化後の特徴パラメータa″ijは(2)式により与えられ
る。
a″ij=a′ij/Mj (2)
ただし、
Mj=Max(a′ij、a2j………、a′Ij) (3)
上記2ステツプからなる正規化または補正法
は、前述のごとく、特徴パラメータの時間方向に
おける大小関係を保持し、かつ原音声情報の有す
る本質的特徴を明確に表現している新たな特徴パ
ラメータa″ijを得ることを可能にするものであ
る。
は、前述のごとく、特徴パラメータの時間方向に
おける大小関係を保持し、かつ原音声情報の有す
る本質的特徴を明確に表現している新たな特徴パ
ラメータa″ijを得ることを可能にするものであ
る。
このa″ijは下記の点で前記特徴パラメータaij
よりもすぐれた特徴パラメータといえる。
よりもすぐれた特徴パラメータといえる。
(α) 周波数軸方向の各チヤネル毎に、特徴パラ
メータの時間軸方向の最大値を同一レベル(た
とえば0〜1のレベルに正規化する場合の最大
レベル1)へ変換する写像であるため、従来問
題となつていた特徴パラメータの絶対レベルの
変動を吸収したことになる。
メータの時間軸方向の最大値を同一レベル(た
とえば0〜1のレベルに正規化する場合の最大
レベル1)へ変換する写像であるため、従来問
題となつていた特徴パラメータの絶対レベルの
変動を吸収したことになる。
特に上記ステツプ2だけによる正規化、すな
わち a″ij=aij/Max(a1j、a2j、………、aIj) によると、aijの振巾値が小さい範囲において
は絶対レベルの変動が小さいのに、正規化後の
相対レベルでみると変動が拡大されるという不
都合が生じ得るが、ステツプ1による補正はこ
の不都合を除去する点で有効である。
わち a″ij=aij/Max(a1j、a2j、………、aIj) によると、aijの振巾値が小さい範囲において
は絶対レベルの変動が小さいのに、正規化後の
相対レベルでみると変動が拡大されるという不
都合が生じ得るが、ステツプ1による補正はこ
の不都合を除去する点で有効である。
(β) 上記ステツプ2の正規化は、話者が異なつ
た場合でも、同一内容の音声の特徴パラメータ
を従来よりも大局的かつ明確に抽出する写像と
なつている。
た場合でも、同一内容の音声の特徴パラメータ
を従来よりも大局的かつ明確に抽出する写像と
なつている。
たとえば、周波数軸上の各チヤネル毎の特徴
パラメータの変化を強調したり、全時間にわた
り値の小さい特徴パラメータを有するチヤネル
においては、逆に値の小さいことが特徴となつ
てa″ijの値を大きくする変換になつている。
パラメータの変化を強調したり、全時間にわた
り値の小さい特徴パラメータを有するチヤネル
においては、逆に値の小さいことが特徴となつ
てa″ijの値を大きくする変換になつている。
(γ) とくにフイルタバンクの出力値を特徴パラ
メータとした場合における上記ステツプ2の正
規化は、話者間の差にもとづく周波数軸方向に
おける変動(たとえば話者間のホルマント周波
数の隣接チヤネルへの変動)を吸収する効果が
ある。
メータとした場合における上記ステツプ2の正
規化は、話者間の差にもとづく周波数軸方向に
おける変動(たとえば話者間のホルマント周波
数の隣接チヤネルへの変動)を吸収する効果が
ある。
これは、周波数軸上の第jチヤネルにおける
特徴パラメータの最大値を与える時刻iにおい
ては、隣接する第(j−1)チヤネルや第(j
+1)チヤネルにおける特徴パラメータが最大
になる確率が大きいので、ステツプ2で得られ
る特徴パラメータは周波数分析におけるQ(共
振尖鋭度)を下げたことに相当する。これは、
話者間の差にもとづく特徴パラメータの変動を
小さくしたことに相当し、前記(2)に対する解決
策を与えるものである。
特徴パラメータの最大値を与える時刻iにおい
ては、隣接する第(j−1)チヤネルや第(j
+1)チヤネルにおける特徴パラメータが最大
になる確率が大きいので、ステツプ2で得られ
る特徴パラメータは周波数分析におけるQ(共
振尖鋭度)を下げたことに相当する。これは、
話者間の差にもとづく特徴パラメータの変動を
小さくしたことに相当し、前記(2)に対する解決
策を与えるものである。
なお、これまでは、本発明による前処理を音
声パタンのフイルタバンク出力値に適用する場
合を主にして説明をおこなつてきたが、自己相
関係数PARCOR係数に適用することも可能で
あり、またPARCOR係数に適用する場合には
たとえばPARCOR係数に対して適応逆フイル
タリング処理を施して反射係数に相当する量に
変換することにより絶対レベル変動に対する線
形性がなりたつようにすればよい。
声パタンのフイルタバンク出力値に適用する場
合を主にして説明をおこなつてきたが、自己相
関係数PARCOR係数に適用することも可能で
あり、またPARCOR係数に適用する場合には
たとえばPARCOR係数に対して適応逆フイル
タリング処理を施して反射係数に相当する量に
変換することにより絶対レベル変動に対する線
形性がなりたつようにすればよい。
以下、本発明を実施例を参照して詳細に説明す
る。
る。
第2図は、本発明による前処理方法を実現する
回路の一実施例を示すブロツク構成図で、入力音
声から求められた前記特徴パラメータaijは各チ
ヤネルj毎に(a1j,a2j,………,aIj)を1
ブロツクデータとして入力バツフア21から読み
出されて対数変換・正規化部22の対数変換部2
21へ入力される。対数変換部221において
は、前記(1)式の演算が行され、その結果得られた
ブロツクデータa′1j,a′2j,………,a′Ij
が出力
線222を通して、最大値検出部223と正規化
部224へ入力される。最大値検出部223にお
いては前記(3)式の演算が実行され、その結果得ら
れたMjがまた前記正規化部224へ入力され
る。正規化部224においては前記(2)式の演算が
実行され、その結果得られたブロツクデータa
″1j,a″2j,………,a″Ijが出力バツフア2
3へ格
納される。
回路の一実施例を示すブロツク構成図で、入力音
声から求められた前記特徴パラメータaijは各チ
ヤネルj毎に(a1j,a2j,………,aIj)を1
ブロツクデータとして入力バツフア21から読み
出されて対数変換・正規化部22の対数変換部2
21へ入力される。対数変換部221において
は、前記(1)式の演算が行され、その結果得られた
ブロツクデータa′1j,a′2j,………,a′Ij
が出力
線222を通して、最大値検出部223と正規化
部224へ入力される。最大値検出部223にお
いては前記(3)式の演算が実行され、その結果得ら
れたMjがまた前記正規化部224へ入力され
る。正規化部224においては前記(2)式の演算が
実行され、その結果得られたブロツクデータa
″1j,a″2j,………,a″Ijが出力バツフア2
3へ格
納される。
上記の演算処理が、たとえばj=1、2、……
…、Jの順に制御部24から出力される制御信号
にしたがつて実行される。
…、Jの順に制御部24から出力される制御信号
にしたがつて実行される。
第2図における対数変換部221はたとえば読
み出し専用メモリ(ROM)により構成すること
ができる。
み出し専用メモリ(ROM)により構成すること
ができる。
この場合、入力バツフア21の出力信号をその
アドレス信号として、アドレスa1j,a2j,……
…,aIjに(1)式の演算結果であるデータa′1j,a
′2j,………,a′Ijを書きこんでおき、制御部2
4
から与えられる読み出し信号にしたがつてこれを
読み出すようにすればよい。
アドレス信号として、アドレスa1j,a2j,……
…,aIjに(1)式の演算結果であるデータa′1j,a
′2j,………,a′Ijを書きこんでおき、制御部2
4
から与えられる読み出し信号にしたがつてこれを
読み出すようにすればよい。
また、最大値検出部223は演算回路と、演算
結果を格納するレジスタから構成され、たとえば
a′1j,a′2j………,a′Ijの順にデータa′
ijを減算回
路に入力し、レジスタに格納されているデータR
との減算をおこない、a′ij−R>0のときに限
り、レジスタの内容を更新し、新たにa′ijを上記
レジスタに格納する処理をi=1、2、……、I
について実行すればよい。
結果を格納するレジスタから構成され、たとえば
a′1j,a′2j………,a′Ijの順にデータa′
ijを減算回
路に入力し、レジスタに格納されているデータR
との減算をおこない、a′ij−R>0のときに限
り、レジスタの内容を更新し、新たにa′ijを上記
レジスタに格納する処理をi=1、2、……、I
について実行すればよい。
正規化部224は通常の除算器で構成できる。
なお、対数変換・正規化部22における上記演
算はソフトウエアにより実行するこも可能であ
る。
算はソフトウエアにより実行するこも可能であ
る。
第3図は第2図における本発明の回路を含む音
声認識システムの一実施例を示すブロツク構成図
で、第2図に記載された部分には同一番号を付し
てある。
声認識システムの一実施例を示すブロツク構成図
で、第2図に記載された部分には同一番号を付し
てある。
入力音声は特徴抽出部31において周波数分析
され、その結果抽出された特徴ベクトルa1,a2,
………,aが時系列的に順次、前記入力バツフ
ア21へ格納される。
され、その結果抽出された特徴ベクトルa1,a2,
………,aが時系列的に順次、前記入力バツフ
ア21へ格納される。
第2図において述べた過程の実行により出力バ
ツフア23に格納された正規化データは認識部3
4に入力される。一方、音声の正規化された標準
パタンが標準パタンメモリ32より順次読み出さ
れ、そのうちの1個が標準パタンバツフア33を
通して、上記認識部34に入力される。
ツフア23に格納された正規化データは認識部3
4に入力される。一方、音声の正規化された標準
パタンが標準パタンメモリ32より順次読み出さ
れ、そのうちの1個が標準パタンバツフア33を
通して、上記認識部34に入力される。
認識部34において、入力音声パタンに対応し
正規化データと、正規化された標準パタンとの類
似度が計算されて認識がこおこなわれ、認識結果
が端子35に出力される。
正規化データと、正規化された標準パタンとの類
似度が計算されて認識がこおこなわれ、認識結果
が端子35に出力される。
第4図は本発明の前処理法を用いた場合と、従
来の前処理法を用いた場合との音声認識の結果の
分離度の差に関する実験データを示す。
来の前処理法を用いた場合との音声認識の結果の
分離度の差に関する実験データを示す。
第4図において、横軸は認識の際に付与される
重み量とし、縦軸は正しい認識結果が得られたと
きの最大類似度S1と次大類似度S2との比(S1/
S2)で与えられる分離度としたとき、()〜
()はそれぞれ下記の前処理をおこなつた場合
を示し、()は従来の方法による場合を示す。
重み量とし、縦軸は正しい認識結果が得られたと
きの最大類似度S1と次大類似度S2との比(S1/
S2)で与えられる分離度としたとき、()〜
()はそれぞれ下記の前処理をおこなつた場合
を示し、()は従来の方法による場合を示す。
():a″ij=log(1+aij/A0)/Mj
ただし、
Mj=Max{log(1+a1j/A0)、log(1+a2j/A0、………、log(1+aIj/A0)}
():a″ij=log(1+aij/A0)
():a″ij=aij/Max(a1j,a2j,………,aIj)
第4図の実験結果から、本発明の前処理法によ
れば、類似度計算における重み量を適当に設定す
ることにより、他の方法より大きい分離度が得ら
れることがわかる。
れば、類似度計算における重み量を適当に設定す
ることにより、他の方法より大きい分離度が得ら
れることがわかる。
以上述べたように、本発明による前処理法は上
記特徴パタンの特徴を明確に抽出した新たな特徴
パタンへの変換を可能にするもので、上記前処理
法で得られた特徴パラメータは分離性が良く(級
内特徴が明確)、認識の信頼性を向上させる効果
があり有効である。上記の効果は、上記前処理正
規化法を組み入れた音声認識装置において認識率
が向上したという結果からも実証されている。
記特徴パタンの特徴を明確に抽出した新たな特徴
パタンへの変換を可能にするもので、上記前処理
法で得られた特徴パラメータは分離性が良く(級
内特徴が明確)、認識の信頼性を向上させる効果
があり有効である。上記の効果は、上記前処理正
規化法を組み入れた音声認識装置において認識率
が向上したという結果からも実証されている。
第1図は同一音声の話者による差をフイルタバ
ンク出力値により示す図、第2図は本発明の前処
理法を実現する回路の一実施例を示す図、第3図
は本発明の前処理法を用いた音声認識装置の一構
成例を示す図、第4図は入力音声パタンの分離度
に関する実験データを示す図である。 21:入力バツフア、22:対数変換・正規化
部、23:出力バツフア、24:制御部。
ンク出力値により示す図、第2図は本発明の前処
理法を実現する回路の一実施例を示す図、第3図
は本発明の前処理法を用いた音声認識装置の一構
成例を示す図、第4図は入力音声パタンの分離度
に関する実験データを示す図である。 21:入力バツフア、22:対数変換・正規化
部、23:出力バツフア、24:制御部。
Claims (1)
- 1 入力音声を分析し求められた特徴パラメータ
ーaij(i=1、2、………、I、j=1、2、
………J)を格納する手段と、該手段からチヤネ
ルj毎に(a1j、a2j、………aIj)を1ブロツ
クデータとして入力し、該ブロツク内の各パラメ
ータの値に対し所定の対数変換補正を行う補正手
段と、該補正手段により補正された1ブロツクデ
ータ内でのパラメータの量大値を検出する最大値
検出手段と、該最大値検出手段により得られる1
ブロツク毎のパラメータの最大値により該当する
上記補正された1ブロツクデータを正規化する正
規化手段とを有することを特徴とする音声認識に
おける前処理装置。
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP16557879A JPS5688199A (en) | 1979-12-21 | 1979-12-21 | Pattern pretreatment method in voice identifier |
| DE19803048107 DE3048107A1 (de) | 1979-12-21 | 1980-12-19 | Verfahren zur mustervorverarbeitung fuer ein spracherkennungssystem |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP16557879A JPS5688199A (en) | 1979-12-21 | 1979-12-21 | Pattern pretreatment method in voice identifier |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5688199A JPS5688199A (en) | 1981-07-17 |
| JPS628800B2 true JPS628800B2 (ja) | 1987-02-24 |
Family
ID=15815011
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP16557879A Granted JPS5688199A (en) | 1979-12-21 | 1979-12-21 | Pattern pretreatment method in voice identifier |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JPS5688199A (ja) |
| DE (1) | DE3048107A1 (ja) |
Families Citing this family (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS57178300A (en) * | 1981-04-27 | 1982-11-02 | Kyosan Electric Mfg | Automatic voice recognition system |
| JPS57178299A (en) * | 1981-04-27 | 1982-11-02 | Kyosan Electric Mfg | Recognition pattern preparation system |
| JPS58136097A (ja) * | 1982-02-08 | 1983-08-12 | 株式会社京三製作所 | 認識パタ−ン照合方式 |
| JPS58136098A (ja) * | 1982-02-08 | 1983-08-12 | 株式会社京三製作所 | 認識パタ−ン学習方式 |
| JPS58145996A (ja) * | 1982-02-24 | 1983-08-31 | 株式会社京三製作所 | 音声認識方式 |
| JPS5979300A (ja) * | 1982-10-28 | 1984-05-08 | 電子計算機基本技術研究組合 | 認識装置 |
| JPH0792673B2 (ja) * | 1984-10-02 | 1995-10-09 | 株式会社東芝 | 認識用辞書学習方法 |
| JPH0727519Y2 (ja) * | 1988-11-21 | 1995-06-21 | ソニー株式会社 | 音声認識装置 |
| EP1139527A3 (en) | 2000-03-27 | 2003-04-23 | Matsushita Electric Industrial Co., Ltd. | High power semiconductor laser array apparatus |
Family Cites Families (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB1435779A (en) * | 1972-09-21 | 1976-05-12 | Threshold Tech | Word recognition |
| GB1433770A (en) * | 1973-01-05 | 1976-04-28 | Xerox Corp | Word recognition system with character string encoding |
| JPS5272504A (en) * | 1975-12-15 | 1977-06-17 | Fuji Xerox Co Ltd | Device for recognizing word audio |
-
1979
- 1979-12-21 JP JP16557879A patent/JPS5688199A/ja active Granted
-
1980
- 1980-12-19 DE DE19803048107 patent/DE3048107A1/de not_active Ceased
Also Published As
| Publication number | Publication date |
|---|---|
| JPS5688199A (en) | 1981-07-17 |
| DE3048107A1 (de) | 1981-09-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11056130B2 (en) | Speech enhancement method and apparatus, device and storage medium | |
| Kim et al. | Power-normalized cepstral coefficients (PNCC) for robust speech recognition | |
| CN106486131B (zh) | 一种语音去噪的方法及装置 | |
| CN110177317B (zh) | 回声消除方法、装置、计算机可读存储介质和计算机设备 | |
| CN112002307B (zh) | 一种语音识别方法和装置 | |
| WO1998043237A1 (en) | Recognition system | |
| JP2010539792A (ja) | スピーチ増強 | |
| JP4050350B2 (ja) | 音声認識をする方法とシステム | |
| CN110176243B (zh) | 语音增强方法、模型训练方法、装置和计算机设备 | |
| WO2022179360A1 (zh) | 一种声纹识别方法、装置及计算机可读存储介质 | |
| CN111599372B (zh) | 一种稳定的在线多通道语音去混响方法及系统 | |
| JPS628800B2 (ja) | ||
| CN112652312A (zh) | 声纹相似度智能识别系统、方法及存储介质 | |
| Savchenko et al. | Scale-invariant modification of COSH distance for measuring speech signal distortions in real-time mode | |
| JP4757775B2 (ja) | 雑音抑圧装置 | |
| CN119694328A (zh) | 一种基于声音特征的录音除噪方法、系统、设备及介质 | |
| CN112185405A (zh) | 一种基于差分运算和联合字典学习的骨导语音增强方法 | |
| JP2817429B2 (ja) | 音声認識装置 | |
| JPS63502304A (ja) | 高雑音環境における言語認識のためのフレ−ム比較法 | |
| JP6827004B2 (ja) | 音声変換モデル学習装置、音声変換装置、方法、及びプログラム | |
| JP6000094B2 (ja) | 話者適応化装置、話者適応化方法、プログラム | |
| US20220199074A1 (en) | A dialog detector | |
| JPH113094A (ja) | ノイズ除去装置 | |
| CN116129928B (zh) | 一种广播通信场景的近端语音可懂度增强方法和系统 | |
| CN117524240A (zh) | 语音变声方法、装置、设备及存储介质 |