JPS60179799A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPS60179799A JPS60179799A JP59036447A JP3644784A JPS60179799A JP S60179799 A JPS60179799 A JP S60179799A JP 59036447 A JP59036447 A JP 59036447A JP 3644784 A JP3644784 A JP 3644784A JP S60179799 A JPS60179799 A JP S60179799A
- Authority
- JP
- Japan
- Prior art keywords
- cumulative
- phoneme
- distance
- transition
- storage means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は音声認識装置に関する。
従来例の構成とその問題点
従来、音声認識装置では入力音声信号を分析することに
よって得られるn次元の特徴ベクトル系列(& 1.
a 2 、・・・・・・aI)に対し辞書としてあらか
じめ装置内に登録しであるP個の標準パターンベクトル
系列(”1 t ”2 t ””” b)) ”””
(b* +’2+・・・・bU) の中からこれと距離
の最も近いもの、もしくは最も類似性の太きいものをも
って認識結果としているが、このとき入力ベクトル系列
(al。
よって得られるn次元の特徴ベクトル系列(& 1.
a 2 、・・・・・・aI)に対し辞書としてあらか
じめ装置内に登録しであるP個の標準パターンベクトル
系列(”1 t ”2 t ””” b)) ”””
(b* +’2+・・・・bU) の中からこれと距離
の最も近いもの、もしくは最も類似性の太きいものをも
って認識結果としているが、このとき入力ベクトル系列
(al。
a 2 、・−、al)と標準パターンベクトル系列の
うちの1つ、例えば(b′、bL・・・・・・、b、4
1(但し1 2’ 7=1〜P)の比較に際して(a 1. a 2 、・
・・・・。
うちの1つ、例えば(b′、bL・・・・・・、b、4
1(但し1 2’ 7=1〜P)の比較に際して(a 1. a 2 、・
・・・・。
a工l の1要素ベクトルa iと(bl 、 bl
、 、;、・、。
、 、;、・、。
2
bM)の中の1要素ベクトルbこの市街距離、もしくは
ユークリッド距離を計算し、これを確からしさの尺度と
し、これをもとに2つのベクトル系列の総距離を、グイ
ナミノクプログラミングや線形伸縮などの手法を用いて
計算するものが大部分である。
ユークリッド距離を計算し、これを確からしさの尺度と
し、これをもとに2つのベクトル系列の総距離を、グイ
ナミノクプログラミングや線形伸縮などの手法を用いて
計算するものが大部分である。
但し、市街距離、ユークリッド距離は次式で与えられる
。
。
ai =(ai 、1 、ai 、2.−− 、 ai
、N’1bt=(bt 、bt ・・・・、b盃、N
lとするときm m’1 m2+ ”l、m−Σ l al、r ”!、rl(市街距離)
−1 7t、m−Σ (a1’ r ”富、r)2(ユ 9リ
パr=1 距離) 以下、確からしさの値の尺度として上記のような距離尺
度を用いた場合を例として説明する。
、N’1bt=(bt 、bt ・・・・、b盃、N
lとするときm m’1 m2+ ”l、m−Σ l al、r ”!、rl(市街距離)
−1 7t、m−Σ (a1’ r ”富、r)2(ユ 9リ
パr=1 距離) 以下、確からしさの値の尺度として上記のような距離尺
度を用いた場合を例として説明する。
上記の原理にもとすく音声認識装置の一つとして、日本
語ワードプロセノザ−への入力を目的として、仮名キー
の入力の代りに、音節単位に区切って発声したもの、例
えば「ア」、「力」、「イ」。
語ワードプロセノザ−への入力を目的として、仮名キー
の入力の代りに、音節単位に区切って発声したもの、例
えば「ア」、「力」、「イ」。
「ハ」、「す」、を認識する単音節認識や、連続音声を
音節単位に分割して、音節単位で認識を行うものが用い
られる。
音節単位に分割して、音節単位で認識を行うものが用い
られる。
ところで上記のような音節型認識装置を日本語ワードプ
ロセッサー(以下ワープロと略す)の入力として用いる
時、ワープロの持つ、カナ漢字変換のだめの単語辞書1
文章辞書もしくは単語辞書と言語処理機能の組合せなど
を用いて音節認識における誤りを訂正するものが有る。
ロセッサー(以下ワープロと略す)の入力として用いる
時、ワープロの持つ、カナ漢字変換のだめの単語辞書1
文章辞書もしくは単語辞書と言語処理機能の組合せなど
を用いて音節認識における誤りを訂正するものが有る。
すなわち、音節認識部において、音節単位のパターンと
してあらかじめ登録されているP個の標埠パターンと入
力パラメータベクトル列との比較に際して、最小距離を
与える標準パターン1つを選ぶ代りに、距離の小さいも
の1個(■は正の整数)を選択し、例えば入力音声がl
個(工は正の整数)の音節から成るとすると、IxJ個
の音節候補マトリックスとその各々についての標準パタ
ーンとの距離d□7.(但し1+]は1≦1≦I。
してあらかじめ登録されているP個の標埠パターンと入
力パラメータベクトル列との比較に際して、最小距離を
与える標準パターン1つを選ぶ代りに、距離の小さいも
の1個(■は正の整数)を選択し、例えば入力音声がl
個(工は正の整数)の音節から成るとすると、IxJ個
の音節候補マトリックスとその各々についての標準パタ
ーンとの距離d□7.(但し1+]は1≦1≦I。
1≦j≦■ なる整数)を用いて、11通りの構成可能
文章の各々について累積距離Sr(、)を工 S −Σ d r(1)1.r(1) +=1 (但しr(1)はiの関数で1の各段において1≦j≦
■ なる】のうちの1つに対応する。)として計算し、
このうち累積距離の小さいものからN個の文章を選びだ
し、あらかじめ記憶されでいる文章辞書(一般のカナ漢
字変換に使われるものが流用可能)を検索し、一致した
ものを文章認識結果とするものが有る。この場合、累積
距離計算のだめの加算回数は11回である。この間の動
作を具体例によってさらに説明する。
文章の各々について累積距離Sr(、)を工 S −Σ d r(1)1.r(1) +=1 (但しr(1)はiの関数で1の各段において1≦j≦
■ なる】のうちの1つに対応する。)として計算し、
このうち累積距離の小さいものからN個の文章を選びだ
し、あらかじめ記憶されでいる文章辞書(一般のカナ漢
字変換に使われるものが流用可能)を検索し、一致した
ものを文章認識結果とするものが有る。この場合、累積
距離計算のだめの加算回数は11回である。この間の動
作を具体例によってさらに説明する。
第1図は、I−6,T−4とした場合の例で、1つの音
節入力に対して4つの音節候補を出力し文章中の音節数
が5の場合で、正しい発声は、「あたらしい」とする。
節入力に対して4つの音節候補を出力し文章中の音節数
が5の場合で、正しい発声は、「あたらしい」とする。
第1音節(i=1)では、音節候補として(ア7゛ハタ
)(下段は距13 62 63 71 離を表わす)が得られたことを示す。I−5゜T=4の
時生成可能な文章は「あだたちい」。
)(下段は距13 62 63 71 離を表わす)が得られたことを示す。I−5゜T=4の
時生成可能な文章は「あだたちい」。
「あただちび」・・・・・「たささいし」で■1−45
−1024通り存在する。
−1024通り存在する。
誤りの訂正には、1024通りの文章中から、先に述べ
た、累積距離の小さいものN個(Nは正の整数)を用い
、あらかじめ記憶されている文章辞書との比較を行う。
た、累積距離の小さいものN個(Nは正の整数)を用い
、あらかじめ記憶されている文章辞書との比較を行う。
第1図の例では
第1候補 (あだたぢい) 累積距離 822 (あだ
だしい) 8θ 3 (あたらちい)87 4 (あたらしい)〃91 となり、辞書中に「あたらしい」という文章のみが存在
するとすると誤りが訂正できる。実際文章中では第1〜
3候補の様な例は存在しないことは明らかであるので誤
り訂正が可能である。
だしい) 8θ 3 (あたらちい)87 4 (あたらしい)〃91 となり、辞書中に「あたらしい」という文章のみが存在
するとすると誤りが訂正できる。実際文章中では第1〜
3候補の様な例は存在しないことは明らかであるので誤
り訂正が可能である。
ところで、この方法では累積距離の計算に際して工1通
りの組合せに対して、これを行う必要が有り、割算量が
膨大であり、処理に時間がかかるという欠点を有する。
りの組合せに対して、これを行う必要が有り、割算量が
膨大であり、処理に時間がかかるという欠点を有する。
発明の目的
本発明は上記欠点に鑑み、複数の音韻もしくは音節認識
候補を用いて、文章辞書検索により誤りの訂正を行なう
場合における計算回数の減少を目的とする。
候補を用いて、文章辞書検索により誤りの訂正を行なう
場合における計算回数の減少を目的とする。
発明の構成
本発明は、この目的を達成するために、入力された音節
の各段において、前段迄の累積距離のうち小さいものN
個を選択して記憶する累積距離記憶手段とその遷移状態
を記憶する遷移記憶手段を′設け、累積距離記憶手段に
記憶されているN個の累積距離と現役における各候補音
節との総距離を計算し、その内の距離の小さいものN個
を選択し、これを新たに累積距離記憶手段に記憶すると
共に、選択された候補とその時の累積距離の順位を遷移
情報として遷移N記憶手段に記憶し、音声入力終了後、
前記遷移N記憶手段の遷移を逆にたどることにより複数
個の文章認識候補を得、文章辞書とのマツチングに供す
るように構成している。
の各段において、前段迄の累積距離のうち小さいものN
個を選択して記憶する累積距離記憶手段とその遷移状態
を記憶する遷移記憶手段を′設け、累積距離記憶手段に
記憶されているN個の累積距離と現役における各候補音
節との総距離を計算し、その内の距離の小さいものN個
を選択し、これを新たに累積距離記憶手段に記憶すると
共に、選択された候補とその時の累積距離の順位を遷移
情報として遷移N記憶手段に記憶し、音声入力終了後、
前記遷移N記憶手段の遷移を逆にたどることにより複数
個の文章認識候補を得、文章辞書とのマツチングに供す
るように構成している。
実施例の説明
以下、本発明の一実施例について図面を参照し外から説
明する。
明する。
第2図は本発明の一実施例における音声認識装置のブロ
ック図である。同図において1は、入力音声をパラン〜
り分析してN次元のパラメータベクトル列(a 1 、
a 2 、・・・・、aIlに遂次変換するパラメー
タ分析部で、フィルタバ7り、7−IJ工変換器、線形
予線系数型分析器々とにより構成される。
ック図である。同図において1は、入力音声をパラン〜
り分析してN次元のパラメータベクトル列(a 1 、
a 2 、・・・・、aIlに遂次変換するパラメー
タ分析部で、フィルタバ7り、7−IJ工変換器、線形
予線系数型分析器々とにより構成される。
2は標準パターン記憶部で、あらかじめパラメータ分析
された音声を音節標準パターン(b11 bl、・・・・・・、b))・・・・・、 (b¥、す
、・・・・・・、bi)トbて記憶する。
された音声を音節標準パターン(b11 bl、・・・・・・、b))・・・・・、 (b¥、す
、・・・・・・、bi)トbて記憶する。
3は比較部で、前記入力パラメータベクトル列(a 1
、 a 2 、・・・・、allと前記パターン記憶
部3に記憶されている標準パターンとの距離を計算する
。
、 a 2 、・・・・、allと前記パターン記憶
部3に記憶されている標準パターンとの距離を計算する
。
4は判定部で、比較部3で得られた距離のうち、小さい
ものから1個(工は正の整数)を選択する。
ものから1個(工は正の整数)を選択する。
これをd09.とする。但し1≦1≦■で、第1番目に
出現した音節を示し、1≦j≦Iで、距離が第1番目に
小さいことを示す添字である。
出現した音節を示し、1≦j≦Iで、距離が第1番目に
小さいことを示す添字である。
6は累積距離記憶部でi番目の音節の処理に先立って発
声された(i−1)個の音節の累積距離5i−In(但
し1≦n≦Nで最終的にN個の文章を文章認識候補とし
て辞書マツチングに供する。)を記憶する。
声された(i−1)個の音節の累積距離5i−In(但
し1≦n≦Nで最終的にN個の文章を文章認識候補とし
て辞書マツチングに供する。)を記憶する。
6は累積距離計算部で、上記累積距離記憶部に記憶され
ている累積距離5i−1,nと、上記判定部4により得
られる距離d□、jのすべての組合せT十N通りに関し
て和S1 をめる。
ている累積距離5i−1,nと、上記判定部4により得
られる距離d□、jのすべての組合せT十N通りに関し
て和S1 をめる。
1、n
すなわち
S、f =S+d、、 ・・・・・・・・・ (1)1
、n ” ’+” 1+1 但し1.n、]は、1≦i≦I、1≦n≦N。
、n ” ’+” 1+1 但し1.n、]は、1≦i≦I、1≦n≦N。
1≦j≦1とする。
7は選択部で、上記累積距離部によって計算された(N
十J)個の累積距@ S、i のうち距離の1、n 小さいものから順にN個を第き音節における累積距離S
1.n(1≦n≦N)として累積距離記憶部5に記憶す
る。
十J)個の累積距@ S、i のうち距離の1、n 小さいものから順にN個を第き音節における累積距離S
1.n(1≦n≦N)として累積距離記憶部5に記憶す
る。
8は遷移記憶部で、上記累積距離Si、nのnの各々に
ついて、その場合の(i 、n)の組合せを要素とする
ベクトル ”よ、n−(+t、nl )を遷移情報とし
て記憶する。但しくj、、n、 )は、1≦j、≦工。
ついて、その場合の(i 、n)の組合せを要素とする
ベクトル ”よ、n−(+t、nl )を遷移情報とし
て記憶する。但しくj、、n、 )は、1≦j、≦工。
1≦nt≦Nのうちの1つの組合せとする。
9は遷移トレース部で、遷移記憶部8に記憶されている
遷移情報r、n−(!t+J )をもとにこれを逆にト
レースすることにより、第N候補迄の文章認識候補を出
力する。10は文章辞書であり、使用に供されるすべて
の文章が記憶されている。
遷移情報r、n−(!t+J )をもとにこれを逆にト
レースすることにより、第N候補迄の文章認識候補を出
力する。10は文章辞書であり、使用に供されるすべて
の文章が記憶されている。
11は辞書マツチング部で、遷移トレース部9により得
られたN個の文章候補を文章辞書10内の文章と順次比
較し、一致したものを最終認識結果λして出力する。
られたN個の文章候補を文章辞書10内の文章と順次比
較し、一致したものを最終認識結果λして出力する。
次に上記のように構成された装置の動作について第1図
に示す具体例を用いて説明する。
に示す具体例を用いて説明する。
全5音節より成る文章「あたらしい」が発声されたとす
る。パラメータ分析部1におけるパラメータ分析、比較
部2における標準パターンとのパターン比較の後、判定
部4の出力として第1図に示すマトリックスが順次出現
するとする。今この中から累積距離の小さい文章のうち
4つ(N=4)を選択する場合について説明する、判定
部で与えられる距離を第1図中()内の数字で示す。
る。パラメータ分析部1におけるパラメータ分析、比較
部2における標準パターンとのパターン比較の後、判定
部4の出力として第1図に示すマトリックスが順次出現
するとする。今この中から累積距離の小さい文章のうち
4つ(N=4)を選択する場合について説明する、判定
部で与えられる距離を第1図中()内の数字で示す。
第3図は本発明の入力音節の各段における処理を説明す
る図である。同図においてマ) IJノクス35なるマ
トリックス全体の音節の配置は第1図のものと同一であ
る。
る図である。同図においてマ) IJノクス35なるマ
トリックス全体の音節の配置は第1図のものと同一であ
る。
同図において先づi=1の時点で音節「あ」が入力する
。このとき判定部4の出力には、4つの認識候補「あ」
「か」「ば」「た」とその距離(dl、1.dl、2.
dl、3.dl、4)=(13,52,6s、7s)が
現れる。
。このとき判定部4の出力には、4つの認識候補「あ」
「か」「ば」「た」とその距離(dl、1.dl、2.
dl、3.dl、4)=(13,52,6s、7s)が
現れる。
1−1段目では、初期値として距離d12.(1≦1≦
4)の小さいもの4つをその″1.寸累積距離として累
積距離記憶部6(第2図)に記憶する。すなわち Sl
、n=d1’; 、 (1≦j≦N)とする0又遷移情
報としてrl、n= (1、n)すなわちrl 、1−
(1,1)rl、2=(1,2)rl、3−(1,3)
rl、4−(1,4)を遷移記憶部4に記憶する。21
゜23.25,27.29に1−1〜5段における累積
距離記憶部の内容を、又22 、24 、26 、28
゜30に遷移記憶部8(第2図)の遷移情報の内容を示
す。i=2段目において、音節「た」が発声された時、
判定部4(第2図)の出力として(た。
4)の小さいもの4つをその″1.寸累積距離として累
積距離記憶部6(第2図)に記憶する。すなわち Sl
、n=d1’; 、 (1≦j≦N)とする0又遷移情
報としてrl、n= (1、n)すなわちrl 、1−
(1,1)rl、2=(1,2)rl、3−(1,3)
rl、4−(1,4)を遷移記憶部4に記憶する。21
゜23.25,27.29に1−1〜5段における累積
距離記憶部の内容を、又22 、24 、26 、28
゜30に遷移記憶部8(第2図)の遷移情報の内容を示
す。i=2段目において、音節「た」が発声された時、
判定部4(第2図)の出力として(た。
か、だ、さ)が得られ、距離として(d2,11d2,
2゜d2,3.d2,4”” (19、32、53、6
2)が得られたとする。この時累積距離S4.nとして
(Sl、11S1,22S1,31S1,4)と(d2
,1 ”2.2 ld2,31d2,4)のすべての組
合せを累積距離計算部6(第2図)によって上記式(1
)により計算する0この結果を第3図31.32,33
.34に示す。選択部7(第2図)では16通りの34
、nから距離の小さいもの4つを選択し、これを1−
2段目における累積距離として累積距離記憶部5(第2
・図)に記憶する。第3図の例では (S2,1#S2,2・”2.3182,4)= (S
2,1・S2,1’S3.S’ )=(32,45,6
6,71)2.1 2.2 (第3図の23) が選択される。この時遷移情報r2.nとして、上記4
つの組合せの添字(tl、J)を遷移記憶部8(第2図
)に記憶する、すなわち r2,1=(1,1) r2,2=(2,1) r2,3−(3,1) r2,4=(1,2) となる。
2゜d2,3.d2,4”” (19、32、53、6
2)が得られたとする。この時累積距離S4.nとして
(Sl、11S1,22S1,31S1,4)と(d2
,1 ”2.2 ld2,31d2,4)のすべての組
合せを累積距離計算部6(第2図)によって上記式(1
)により計算する0この結果を第3図31.32,33
.34に示す。選択部7(第2図)では16通りの34
、nから距離の小さいもの4つを選択し、これを1−
2段目における累積距離として累積距離記憶部5(第2
・図)に記憶する。第3図の例では (S2,1#S2,2・”2.3182,4)= (S
2,1・S2,1’S3.S’ )=(32,45,6
6,71)2.1 2.2 (第3図の23) が選択される。この時遷移情報r2.nとして、上記4
つの組合せの添字(tl、J)を遷移記憶部8(第2図
)に記憶する、すなわち r2,1=(1,1) r2,2=(2,1) r2,3−(3,1) r2,4=(1,2) となる。
i=2段目で行ったと同様の動作をi=3.4゜6につ
いても行う、この結果遷移記憶部8(第2図)には第3
図21〜3oに示す様に累積距離Si、n並びに遷移情
報ri、nの値が得られる。
いても行う、この結果遷移記憶部8(第2図)には第3
図21〜3oに示す様に累積距離Si、n並びに遷移情
報ri、nの値が得られる。
遷移トレース部9では、遷移記憶部8に記憶されている
遷移情報rinO値をもとにN=4個の文章候補を決定
する。すなわち第1段目の第n候補の逆トレースは、遷
移情報をrln−(+4.nt)であるとすると、第3
図のマトリックス35内において(i 、 il )の
マトリ、、pス要素に対応する音節を音節認識結果とし
、1〜1段目の遷移情報のうちr(1−IL”tを(i
−1)段目の遷移情報とする。これは、先に遷移ri、
nが、rl 1.nlから決定されたものであることに
よる。
遷移情報rinO値をもとにN=4個の文章候補を決定
する。すなわち第1段目の第n候補の逆トレースは、遷
移情報をrln−(+4.nt)であるとすると、第3
図のマトリックス35内において(i 、 il )の
マトリ、、pス要素に対応する音節を音節認識結果とし
、1〜1段目の遷移情報のうちr(1−IL”tを(i
−1)段目の遷移情報とする。これは、先に遷移ri、
nが、rl 1.nlから決定されたものであることに
よる。
具体例を用いて説明すると、例えば文章の第3候補N、
=3を逆トレースによって決定する場合、先づi−5段
目の遷移情報 r、3−(1,3) より i=5段目の音節はマトリックス位置 (t’、+()−(5,1)より「い」と決定でき、J
−3より(i−1)−4段目の遷移情報としてr4,3
−(1,2)となる、従って、4段目の音節はマトリッ
クス位置(i 、 1l)=(4,1)より「い」と決
定できnt=2より3段目でr3,2をトレースする。
=3を逆トレースによって決定する場合、先づi−5段
目の遷移情報 r、3−(1,3) より i=5段目の音節はマトリックス位置 (t’、+()−(5,1)より「い」と決定でき、J
−3より(i−1)−4段目の遷移情報としてr4,3
−(1,2)となる、従って、4段目の音節はマトリッ
クス位置(i 、 1l)=(4,1)より「い」と決
定できnt=2より3段目でr3,2をトレースする。
以上の動作を1=1段目迄行い、文章候補として「あた
らちい」を得る。
らちい」を得る。
同様の動作をN−1〜4のすべてについて行うと 第1
候補 「あだたちい」 12 # 「あたたしい」 〃3 〃 「あたらちい」 14N 「あたらしい」 なる結果をうる。辞書マツチング部11では上記4つの
候補を文章辞書10内の標準文章と比較し、一致したも
のを文章認識結果とする。上記の例では第1〜第3候補
のような文章は一般の辞書内には存在しないので第4候
補が選択されることは明らかである。
候補 「あだたちい」 12 # 「あたたしい」 〃3 〃 「あたらちい」 14N 「あたらしい」 なる結果をうる。辞書マツチング部11では上記4つの
候補を文章辞書10内の標準文章と比較し、一致したも
のを文章認識結果とする。上記の例では第1〜第3候補
のような文章は一般の辞書内には存在しないので第4候
補が選択されることは明らかである。
以上の動作により音節認識の第1候補として、「あたた
ちい」という誤シが生じても、複数候補を選択すること
により誤りの訂正が可能となる。
ちい」という誤シが生じても、複数候補を選択すること
により誤りの訂正が可能となる。
上記辞書マツチング部11には、バイナリ−サーチ、ハ
ツシュ関数、D、P、マツチング等を用いる方法が有る
がいずれも公知であるので説明を省略する。又文章辞書
1oの代りに単語辞書を用いてもよく、さらに文法属性
情報を有する単語辞書やい、文法属性情報として品詞情
報、活用情報を用い単語前後の接続関係を決定する文法
解析処理手段を用いることも可能である。文法解析処理
手段については公知のカナ漢字変換技術が流用可能であ
るので説明を省略する。
ツシュ関数、D、P、マツチング等を用いる方法が有る
がいずれも公知であるので説明を省略する。又文章辞書
1oの代りに単語辞書を用いてもよく、さらに文法属性
情報を有する単語辞書やい、文法属性情報として品詞情
報、活用情報を用い単語前後の接続関係を決定する文法
解析処理手段を用いることも可能である。文法解析処理
手段については公知のカナ漢字変換技術が流用可能であ
るので説明を省略する。
以上の説明から明らかなように上記動作において累積距
離計算の加算回数はNx J X I回となり、前述の
公知例における加算回数11に比し著しく少ない、I=
s 、J=4 、N=4の例をとればNx T x I
=a。
離計算の加算回数はNx J X I回となり、前述の
公知例における加算回数11に比し著しく少ない、I=
s 、J=4 、N=4の例をとればNx T x I
=a。
■I=1024 となって10倍以上の差を有する。
以上のように本実施例によれば出現音韻の第1段目にお
ける累積距離を計算する累積距離計算部6と、このうち
のN個を選択する選択部7、この結果を記憶し次段の累
積距離計算に供するだめの累積距離記憶部5と、その遷
移情報を記憶する遷移記憶部8、音声入力終了後その遷
移情報を逆トレースする遷移トレース部9を設けること
により、与えられた音節マトリックスから文章候補を阜
榊T + I回の加算による累積距離計算によって決定
し、文章辞書とのマツチングに供することにより、効率
的な音韻認識誤り訂正を実現することができる。
ける累積距離を計算する累積距離計算部6と、このうち
のN個を選択する選択部7、この結果を記憶し次段の累
積距離計算に供するだめの累積距離記憶部5と、その遷
移情報を記憶する遷移記憶部8、音声入力終了後その遷
移情報を逆トレースする遷移トレース部9を設けること
により、与えられた音節マトリックスから文章候補を阜
榊T + I回の加算による累積距離計算によって決定
し、文章辞書とのマツチングに供することにより、効率
的な音韻認識誤り訂正を実現することができる。
なお本実施例は、この出力をカナ漢字変換機能と組合せ
出力結果を漢字かなまじり文で出力することが可能であ
る。又本実施例はコンピュータを用いプログラム的にこ
れを行うことが可能である。
出力結果を漢字かなまじり文で出力することが可能であ
る。又本実施例はコンピュータを用いプログラム的にこ
れを行うことが可能である。
さらに本実施例では、音韻候補選択の尺度として距離を
用いたが、これを類似度、もしくは確からしさを表現す
る値(確率など)としても同様に適用可能である。
用いたが、これを類似度、もしくは確からしさを表現す
る値(確率など)としても同様に適用可能である。
発明の効果
以上のように本発明の音声認識装置は、複数個の音節認
識候補とその時の距離をもとに、音節の各段において累
積距離の小さいものを複数個選択し、その累積距離を記
憶し、次段の累積距離計算に供し、合せてその遷移情報
を記憶し、最終音節入力後、上記遷移情報を逆にトレー
スすることにより複数個の文章候補を決定し、文章辞書
とのマチングに供することにより、音節候補総当りによ
る候補選択に比し、計算量を著しく減少させ、認識性能
の向上を図ることができ、その工業的価値は大なるもの
が有る。
識候補とその時の距離をもとに、音節の各段において累
積距離の小さいものを複数個選択し、その累積距離を記
憶し、次段の累積距離計算に供し、合せてその遷移情報
を記憶し、最終音節入力後、上記遷移情報を逆にトレー
スすることにより複数個の文章候補を決定し、文章辞書
とのマチングに供することにより、音節候補総当りによ
る候補選択に比し、計算量を著しく減少させ、認識性能
の向上を図ることができ、その工業的価値は大なるもの
が有る。
第1図は本発明の音節認識結果の一例を示す認識図、第
2図は本発明の一実施例における音声認識装置のブロッ
ク図、第3図は本発明の実施例の動作を説明するだめの
説明図である0 1・・・・・・パラメータ分析部、2・・・・・・比較
部、3・・・・・・比較部、4・・・・・・判定部、5
・・・・・・累積距離記憶部、6・・・・・・累積距離
計算部、7・・・・・・選択部、8・・・・・・遷移記
憶部、9・・・・・・遷移トレース部、10・・・・・
・文章辞書、11・・・・・・辞書マツチング部。
2図は本発明の一実施例における音声認識装置のブロッ
ク図、第3図は本発明の実施例の動作を説明するだめの
説明図である0 1・・・・・・パラメータ分析部、2・・・・・・比較
部、3・・・・・・比較部、4・・・・・・判定部、5
・・・・・・累積距離記憶部、6・・・・・・累積距離
計算部、7・・・・・・選択部、8・・・・・・遷移記
憶部、9・・・・・・遷移トレース部、10・・・・・
・文章辞書、11・・・・・・辞書マツチング部。
Claims (2)
- (1)入力音声を音韻識別し、前記各音韻毎に複数個の
識別候補とその確からしさの値を出力する音韻識別手段
と、先に出現した音韻の累積確からしさの値の上位複数
個を記憶し、次音韻出現時における累積確からしさの値
の計算に供する累積確からしさ記憶手段と、前記上位複
数個の累積確からしさの値を持つ音韻候補を選択するに
至る遷移を記憶し文章候補選択に供する遷移記憶手段と
を有することを特徴とする音声認識装置。 - (2)入力音声を音韻識別し、前記各音韻毎に1個(工
は正の整数)の識別候補とその距離を出力する音韻識別
手段と、該当音韻の出現に先立って出現した音韻の累積
距離の小さいものN個(Nは正の整数)を記憶する累積
距離記憶手段と、前記累積距離の小さいものN個を選択
するに至る遷移を記憶する遷移記憶手段と、前記音韻識
別手段の出力として与えられる1個の距離と、前記累積
距離記憶手段のN個の累積距離との組合せにより、その
和を計算する累積距離計算手段と、前記累積距離計算手
段による計算結果、そΩ距離が小さいものからN個を選
択し、その距離を前記累積距離記憶手段に記憶し、どの
音韻候補の第何位の累積距離が選択されたかを前記遷移
記憶手段に記憶する選択手段と、音声入力後、前記遷移
記憶手段に記憶されている遷移情報を逆にトレースし、
N個の判別結果候補を出力する遷移トレース手段とを有
する音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59036447A JPS60179799A (ja) | 1984-02-27 | 1984-02-27 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59036447A JPS60179799A (ja) | 1984-02-27 | 1984-02-27 | 音声認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS60179799A true JPS60179799A (ja) | 1985-09-13 |
Family
ID=12470064
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59036447A Pending JPS60179799A (ja) | 1984-02-27 | 1984-02-27 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS60179799A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06175696A (ja) * | 1992-09-10 | 1994-06-24 | Internatl Business Mach Corp <Ibm> | 音声コード化装置及びその方法並びに音声認識装置及びその方法 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS59132039A (ja) * | 1983-01-17 | 1984-07-30 | Nec Corp | カナ文字列評定方法 |
-
1984
- 1984-02-27 JP JP59036447A patent/JPS60179799A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS59132039A (ja) * | 1983-01-17 | 1984-07-30 | Nec Corp | カナ文字列評定方法 |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH06175696A (ja) * | 1992-09-10 | 1994-06-24 | Internatl Business Mach Corp <Ibm> | 音声コード化装置及びその方法並びに音声認識装置及びその方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR910007531B1 (ko) | 음성인식장치 | |
| JPH03257596A (ja) | 認識距離の差に基づく最良優先探索処理方法 | |
| US8942983B2 (en) | Method of speech synthesis | |
| WO2015118645A1 (ja) | 音声検索装置および音声検索方法 | |
| JP5436307B2 (ja) | 類似文書検索装置 | |
| JP2002278579A (ja) | 音声データ検索装置 | |
| KR20190023169A (ko) | 음소열의 편집 거리를 이용한 웨이크업 단어 선정 방법 | |
| JPS60179799A (ja) | 音声認識装置 | |
| JP4511274B2 (ja) | 音声データ検索装置 | |
| JP2004309928A (ja) | 音声認識装置、電子辞書装置、音声認識方法、検索方法、及びプログラム | |
| JPS61122781A (ja) | 音声ワ−ドプロセツサ | |
| JP3039453B2 (ja) | 音声認識装置 | |
| JPS62134698A (ja) | 多数単語の音声入力方式 | |
| JP3369121B2 (ja) | 音声認識方法および音声認識装置 | |
| JPH049320B2 (ja) | ||
| JPH0652478B2 (ja) | 認識装置 | |
| JPS6283798A (ja) | 連続音声認識装置 | |
| JPS60147797A (ja) | 音声認識装置 | |
| JPS6169099A (ja) | 音声認識装置 | |
| JPH0552506B2 (ja) | ||
| JPH0588479B2 (ja) | ||
| JPS63158599A (ja) | 単語検出方式 | |
| JPH10134150A (ja) | 文字認識結果の後処理方法 | |
| Larar | TOWARD SPEAKER INDEPENDENT ISOLATED WORD RECOGNITION FOR LARGE LEXICONS: A TWO-CHANNEL, TWO-PASS APPROACH. | |
| JPS60159798A (ja) | 音声認識装置 |