JPH0228827A

JPH0228827A - 音声認識装置

Info

Publication number: JPH0228827A
Application number: JP63180800A
Authority: JP
Inventors: Hiroyuki Iwahashi; 岩橋　弘幸; Akira Tsuruta; 彰鶴田
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1988-07-19
Filing date: 1988-07-19
Publication date: 1990-01-30

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】産業上の利用分野本発明は、いゆわる日本語ワードプロセッサやパーソナ
ルコンピュータなどで好適に用いられる音声認識装置に
関する。

従来の技術前記ワードプロセッサやパーソナルコンピュータなどに
おいて、音声による入力では、たとえばキーボードなど
からの入力とは異なり、発声された音声が必ずしも正確
に入力されるとは限らず、したがって入力された音声の
認識結果の候補を言語処理機能等で補正して音声入力と
して用いている。しかしながら実際の音声が認識結果の
下位候補であったり、あるいは候補中にない場合には、
たとえばカーソル指示によってキーボードなどを用いて
音節単位の修正が必要、となる。

第６図は典型的な従来技術の音節候補の表示例を示す図
である。たとえば「こくみんを」と発声した場合、先ず
第６図（１）で示されるように、認識結果の第１候補で
ある「ぼふにんを」が表示される。この認識結果は誤っ
ており、したがって参照符Ａで示されるカーソルを「←
Ｊキーなどを用いて第６図（２）で示されるように移動
し、たとえば「↓」キーを操作することによって第６図
（３）で示される正しい音節候補が表示された状態とな
ると、第１音節の入力が終了し、たとえば「→Ｊキーな
どを用いてカーソルＡを第２音節以降の誤入力箇所に移
動し、再びこのような訂正入力操作が行われ、第６図（
４）で示されるように、入力された音節の全ての訂正入
力操作、すなわち入力音節の確定操作が終了した後、た
とえばカナ漢字変換などが行われる。

発明が解決しようとする課題上述のような従来技術では、入力された音声の認識結果
が最上位の音節候補にない場合、前述のように「→」キ
ーなどを用いてカーソルをその位置に移動し、［↓Ｊキ
ーなどを用いて音節候補を上位から順次的に表示してゆ
く。したがって使用者は、その発声した音声の認識結果
を上位候補から下位候補まで一括して確認することがで
きず、したがって使用者が発声した音節が前記候補中に
ない場合には、無駄なキー操作を行うこととなり、入力
効率が低下してしまう。

本発明の目的は、カーソル移動に伴ってそのカーソル位
置に対応した全ての音節候補を一括表示することによっ
て、前述のような無駄なキー操作を省くとともに、使用
者に認識結果の内部状態を知らしめる表示方法を備えた
音声認識装置を提供することである。

課題を解決するための手段本発明は、入力された音声を予め登録された標準パター
ンとの距離計算を用いて音節毎に認識する音声認識装置
において、各音節に対して１または複数の音節候補を作成する音節
候補作成手段と、前記音節候補作成手段からの出力に応答して、音節の目
視表示を行う表示手段とを備え、前記表示手段にはカー
ソルが表示され、該カーソルが移動された音節における
前記音節候補を一斉に表示することを特徴とする音声認
識装置である。

作　　用本発明に従えば、音声認識装置に音声が入力されると、
音節候補作成手段はその認識結果に基づいて、入力され
た音節毎に１または複数の音節候補を作成する。音節候
補作成手段からの出力は表水手段に与えられており、作
成された音節候補のうち、たとえば第１の音節候補がこ
の表示手段に目視表示される。この表示手段にはまたカ
ーソルが表示されており、このカーソルが移動された音
節においては、音節候補の全てが表示される。

したがって使用者は、自己の音声がどのように認識され
たのかを正確に把握することができ、また発声した音節
が候補中にない場合などでは、不要なキー操作を行う必
要がなく、速やかに訂正入力を行うことができ、入力効
率を向上することができる。

実施例第１図は、本発明の一実施例の音声認識装置１の構成を
示すブロック図である。マイクロホン２で収音された音
声の信号は、音声帯域のみを通過し、増幅を行う増幅部
３を介して、特徴抽出部４に与えられる。特徴抽出部４
は、入力された音声波形から、後述するような音節区間
の抽出やパターンマツチングの距離計算に使用される特
徴パラメータを計算する。

０２０部５では、前記特徴パラメータを基に、音節区間
の決定と、その音節区間の音声パターンを作成し、入カ
バターン記憶部８に記憶する。マツチング部７では、入
力された音声パターンと、標準パターン記憶部６に記憶
されている複数の音声パターンとの距離計算を行なう。

こうして計算されたマツチング結果は再び０２０部５に
送られ、音節候補が作成され、該ＣＰＵ部５内のメモリ
５ａに記憶される。またこの音節候補は、表示部９に表
示される。

表示部９およびカーソルの移動を指示するキーボード１
０は外部装置であり、該音声認識装置１が接続される機
器、たとえばワードプロセッサなどが用いられる。前記
ＣＰＵ部５は、キーボード１０からの入力などに対応し
てカーソルの移動制御を行なう。

上述のように構成された音声認識装置１において、使用
者がたとえば第２図（１）で示されるように、「こくみ
んを」と発声した場合、マツチング部７において、入カ
バターン記憶部８に記憶されている入力音声パターンと
、標準パターン記憶部６に記憶されている標準パターン
との照合結果から、ＣＰＵ部５内のメモリ５ａには第２
図（２）で示されるような各音節候補の認識結果が記憶
される。

前記「こくみんを」という１文節が入力されると、表示
部９の画面上には、第３図で示されるように、各音節候
補の第１候補が表示されるととともに、最後の音節候補
の次の位置には参照符１１で示されるように、次の入力
可能位置を示すカーソルが表示される。

前記第３図より明らがなように、第１〜第３音節の認識
結果は誤りであり、したがって使用者はカーソルを移動
して、入力を希望する文字に修正を行う必要があり、先
ずキーボード１ｏの「←」キーを用いてカーソルを第１
音節に移動する。これによって表示部９の画面上には、
第４図（１）において参照符１２で示されるように、カ
ーソル表示が行われるとともに、このカーソルのある第
１音節の全ての音節候補が表示される。

この状態でキーボード１０の「↑」または「↓」キーの
操作などによって正しい文字の選択を行い、この場合選
択された音節候補は、第１候補の位置に入換えられるよ
うにしてもよく、あるいはまたたとえば点滅表示や、背
景の色と表示文字の色との反転表示などによって他の音
節候補と区分して表示されてもよい。

こうして第１音節の修正が終了すると、キーボード１０
の「→」キーの操作によって第４図（２）において参照
符１３で示されるように、カーソルを第２音節の位置に
移動する。第２音節においても前記第１音節と同様にし
て修正操作が行われ、キーボード１０の「→」キーを操
作することによって第４図（３）において参照符１４で
示される位置にカーソルが移動し、以降第４図〈４）に
おいて参照符１５で示されるようにカーソルを順次的に
移動してゆき、各音節毎に入力文字の修正が行われる。

全ての入力文字の修正が終了し、第４図（５）において
参照符１６で示されるようにカーソルを次の文字の入力
位置に移動した時点で、たとえばカナ漢字変換などが行
われ、再び音声入力が行われる。

第５図は、動作を説明するためのフローチャートである
。ステップｎ１で使用者が発声すると、ステップｒｉ　
２で前述のような標準パターンとの照合が行なわれ、そ
の照合結果に基づいてＣＰＵ部５内のメモリ５ａに各音
節候補の認識結果が記憶される。ステップｎ３では、ス
テップｎ２での認識結果が表示部９に表示される。

ステップｎ４ではキーボード１０の「←」キーや「→」
キーの操作が行なわれたかどうか、すなわち音節候補の
修正があるかどうかが判断され、そうであるときにはス
テップｎ５で前記キー操作によるカーソル移動が行なわ
れる。ステップｎ６ではカーソル位置の音節候補の全て
が表示され、ステップｎ７でこれら音節候補の選択やキ
ー人力などによって音節候補の修正が行なわれ、ステッ
プｎ３に戻る。

ステップｎ４において音節候補の修正が行なわれないと
き、すなわち各音節候補の第１候補が入力音声に一致し
たときには、ステップｎ８でカナ漢字変換などの処理が
行なわれて、ステップｒ１１に戻る。

このように本件音声認識装置１では、カーソルが文節中
にある場合には、そのカーソルの位置における音節候補
の全てを表示するようにしている。

発明の効果以上のように本発明によれば、カーソルのある位置にお
ける音節候補の全てを表示するようにしたので、使用者
は、自己の音声がどのように認識されたのかを把握する
ことができる。また発声した音節が候補中にない場合な
どでは、不要なキー操作を行う必要なく、速やかに訂正
入力を行うことができ、入力効率を向上することができ
る。

【図面の簡単な説明】

第１図は本発明の一実施例の音声認識装置１の構成を示
すブロック図、第２図はマイクロホン２から入力された
音声とその音声のＣＰＵ部５内のメモリ５ａにおける認
識結果の一例を示す図、第３図は１文節の音声入力が終
了した時点における表示部９の表示例を示す図、第４図
はカーソル移動による各音節候補の選択時の表示例を示
す図、第５図は動作を説明するためのフローチャート、
第６図は従来技術の音節候補の表示例を示す図である。１・・・音声認識装置、２・・・マイクロホン、３・・
・増幅部、４・・・特徴抽出部、５・・・ＣＰＵ部、６
・・・標準パターン記憶部、７・・・マツチング部、８
・・・入カバターン記憶部、９・・・表示部、１０・・
・キーボード、１１〜１６・・・カーソル代理人　　弁理士　画数　圭一部ごくみんを１音Ｐ籍峰置

Claims

【特許請求の範囲】　入力された音声を予め登録された標準パターンとの距
離計算を用いて音節毎に認識する音声認識装置において
、各音節に対して１または複数の音節候補を作成する音節
候補作成手段と、前記音節候補作成手段からの出力に応答して、音節の目
視表示を行う表示手段とを備え、前記表示手段にはカーソルが表示され、該カーソルが移
動された音節における前記音節候補を一斉に表示するこ
とを特徴とする音声認識装置。