JPH0228827A - 音声認識装置 - Google Patents
音声認識装置Info
- Publication number
- JPH0228827A JPH0228827A JP63180800A JP18080088A JPH0228827A JP H0228827 A JPH0228827 A JP H0228827A JP 63180800 A JP63180800 A JP 63180800A JP 18080088 A JP18080088 A JP 18080088A JP H0228827 A JPH0228827 A JP H0228827A
- Authority
- JP
- Japan
- Prior art keywords
- syllable
- cursor
- input
- candidate
- candidates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
産業上の利用分野
本発明は、いゆわる日本語ワードプロセッサやパーソナ
ルコンピュータなどで好適に用いられる音声認識装置に
関する。
ルコンピュータなどで好適に用いられる音声認識装置に
関する。
従来の技術
前記ワードプロセッサやパーソナルコンピュータなどに
おいて、音声による入力では、たとえばキーボードなど
からの入力とは異なり、発声された音声が必ずしも正確
に入力されるとは限らず、したがって入力された音声の
認識結果の候補を言語処理機能等で補正して音声入力と
して用いている。しかしながら実際の音声が認識結果の
下位候補であったり、あるいは候補中にない場合には、
たとえばカーソル指示によってキーボードなどを用いて
音節単位の修正が必要、となる。
おいて、音声による入力では、たとえばキーボードなど
からの入力とは異なり、発声された音声が必ずしも正確
に入力されるとは限らず、したがって入力された音声の
認識結果の候補を言語処理機能等で補正して音声入力と
して用いている。しかしながら実際の音声が認識結果の
下位候補であったり、あるいは候補中にない場合には、
たとえばカーソル指示によってキーボードなどを用いて
音節単位の修正が必要、となる。
第6図は典型的な従来技術の音節候補の表示例を示す図
である。たとえば「こくみんを」と発声した場合、先ず
第6図(1)で示されるように、認識結果の第1候補で
ある「ぼふにんを」が表示される。この認識結果は誤っ
ており、したがって参照符Aで示されるカーソルを「←
Jキーなどを用いて第6図(2)で示されるように移動
し、たとえば「↓」キーを操作することによって第6図
(3)で示される正しい音節候補が表示された状態とな
ると、第1音節の入力が終了し、たとえば「→Jキーな
どを用いてカーソルAを第2音節以降の誤入力箇所に移
動し、再びこのような訂正入力操作が行われ、第6図(
4)で示されるように、入力された音節の全ての訂正入
力操作、すなわち入力音節の確定操作が終了した後、た
とえばカナ漢字変換などが行われる。
である。たとえば「こくみんを」と発声した場合、先ず
第6図(1)で示されるように、認識結果の第1候補で
ある「ぼふにんを」が表示される。この認識結果は誤っ
ており、したがって参照符Aで示されるカーソルを「←
Jキーなどを用いて第6図(2)で示されるように移動
し、たとえば「↓」キーを操作することによって第6図
(3)で示される正しい音節候補が表示された状態とな
ると、第1音節の入力が終了し、たとえば「→Jキーな
どを用いてカーソルAを第2音節以降の誤入力箇所に移
動し、再びこのような訂正入力操作が行われ、第6図(
4)で示されるように、入力された音節の全ての訂正入
力操作、すなわち入力音節の確定操作が終了した後、た
とえばカナ漢字変換などが行われる。
発明が解決しようとする課題
上述のような従来技術では、入力された音声の認識結果
が最上位の音節候補にない場合、前述のように「→」キ
ーなどを用いてカーソルをその位置に移動し、[↓Jキ
ーなどを用いて音節候補を上位から順次的に表示してゆ
く。したがって使用者は、その発声した音声の認識結果
を上位候補から下位候補まで一括して確認することがで
きず、したがって使用者が発声した音節が前記候補中に
ない場合には、無駄なキー操作を行うこととなり、入力
効率が低下してしまう。
が最上位の音節候補にない場合、前述のように「→」キ
ーなどを用いてカーソルをその位置に移動し、[↓Jキ
ーなどを用いて音節候補を上位から順次的に表示してゆ
く。したがって使用者は、その発声した音声の認識結果
を上位候補から下位候補まで一括して確認することがで
きず、したがって使用者が発声した音節が前記候補中に
ない場合には、無駄なキー操作を行うこととなり、入力
効率が低下してしまう。
本発明の目的は、カーソル移動に伴ってそのカーソル位
置に対応した全ての音節候補を一括表示することによっ
て、前述のような無駄なキー操作を省くとともに、使用
者に認識結果の内部状態を知らしめる表示方法を備えた
音声認識装置を提供することである。
置に対応した全ての音節候補を一括表示することによっ
て、前述のような無駄なキー操作を省くとともに、使用
者に認識結果の内部状態を知らしめる表示方法を備えた
音声認識装置を提供することである。
課題を解決するための手段
本発明は、入力された音声を予め登録された標準パター
ンとの距離計算を用いて音節毎に認識する音声認識装置
において、 各音節に対して1または複数の音節候補を作成する音節
候補作成手段と、 前記音節候補作成手段からの出力に応答して、音節の目
視表示を行う表示手段とを備え、前記表示手段にはカー
ソルが表示され、該カーソルが移動された音節における
前記音節候補を一斉に表示することを特徴とする音声認
識装置である。
ンとの距離計算を用いて音節毎に認識する音声認識装置
において、 各音節に対して1または複数の音節候補を作成する音節
候補作成手段と、 前記音節候補作成手段からの出力に応答して、音節の目
視表示を行う表示手段とを備え、前記表示手段にはカー
ソルが表示され、該カーソルが移動された音節における
前記音節候補を一斉に表示することを特徴とする音声認
識装置である。
作 用
本発明に従えば、音声認識装置に音声が入力されると、
音節候補作成手段はその認識結果に基づいて、入力され
た音節毎に1または複数の音節候補を作成する。音節候
補作成手段からの出力は表水手段に与えられており、作
成された音節候補のうち、たとえば第1の音節候補がこ
の表示手段に目視表示される。この表示手段にはまたカ
ーソルが表示されており、このカーソルが移動された音
節においては、音節候補の全てが表示される。
音節候補作成手段はその認識結果に基づいて、入力され
た音節毎に1または複数の音節候補を作成する。音節候
補作成手段からの出力は表水手段に与えられており、作
成された音節候補のうち、たとえば第1の音節候補がこ
の表示手段に目視表示される。この表示手段にはまたカ
ーソルが表示されており、このカーソルが移動された音
節においては、音節候補の全てが表示される。
したがって使用者は、自己の音声がどのように認識され
たのかを正確に把握することができ、また発声した音節
が候補中にない場合などでは、不要なキー操作を行う必
要がなく、速やかに訂正入力を行うことができ、入力効
率を向上することができる。
たのかを正確に把握することができ、また発声した音節
が候補中にない場合などでは、不要なキー操作を行う必
要がなく、速やかに訂正入力を行うことができ、入力効
率を向上することができる。
実施例
第1図は、本発明の一実施例の音声認識装置1の構成を
示すブロック図である。マイクロホン2で収音された音
声の信号は、音声帯域のみを通過し、増幅を行う増幅部
3を介して、特徴抽出部4に与えられる。特徴抽出部4
は、入力された音声波形から、後述するような音節区間
の抽出やパターンマツチングの距離計算に使用される特
徴パラメータを計算する。
示すブロック図である。マイクロホン2で収音された音
声の信号は、音声帯域のみを通過し、増幅を行う増幅部
3を介して、特徴抽出部4に与えられる。特徴抽出部4
は、入力された音声波形から、後述するような音節区間
の抽出やパターンマツチングの距離計算に使用される特
徴パラメータを計算する。
020部5では、前記特徴パラメータを基に、音節区間
の決定と、その音節区間の音声パターンを作成し、入カ
バターン記憶部8に記憶する。マツチング部7では、入
力された音声パターンと、標準パターン記憶部6に記憶
されている複数の音声パターンとの距離計算を行なう。
の決定と、その音節区間の音声パターンを作成し、入カ
バターン記憶部8に記憶する。マツチング部7では、入
力された音声パターンと、標準パターン記憶部6に記憶
されている複数の音声パターンとの距離計算を行なう。
こうして計算されたマツチング結果は再び020部5に
送られ、音節候補が作成され、該CPU部5内のメモリ
5aに記憶される。またこの音節候補は、表示部9に表
示される。
送られ、音節候補が作成され、該CPU部5内のメモリ
5aに記憶される。またこの音節候補は、表示部9に表
示される。
表示部9およびカーソルの移動を指示するキーボード1
0は外部装置であり、該音声認識装置1が接続される機
器、たとえばワードプロセッサなどが用いられる。前記
CPU部5は、キーボード10からの入力などに対応し
てカーソルの移動制御を行なう。
0は外部装置であり、該音声認識装置1が接続される機
器、たとえばワードプロセッサなどが用いられる。前記
CPU部5は、キーボード10からの入力などに対応し
てカーソルの移動制御を行なう。
上述のように構成された音声認識装置1において、使用
者がたとえば第2図(1)で示されるように、「こくみ
んを」と発声した場合、マツチング部7において、入カ
バターン記憶部8に記憶されている入力音声パターンと
、標準パターン記憶部6に記憶されている標準パターン
との照合結果から、CPU部5内のメモリ5aには第2
図(2)で示されるような各音節候補の認識結果が記憶
される。
者がたとえば第2図(1)で示されるように、「こくみ
んを」と発声した場合、マツチング部7において、入カ
バターン記憶部8に記憶されている入力音声パターンと
、標準パターン記憶部6に記憶されている標準パターン
との照合結果から、CPU部5内のメモリ5aには第2
図(2)で示されるような各音節候補の認識結果が記憶
される。
前記「こくみんを」という1文節が入力されると、表示
部9の画面上には、第3図で示されるように、各音節候
補の第1候補が表示されるととともに、最後の音節候補
の次の位置には参照符11で示されるように、次の入力
可能位置を示すカーソルが表示される。
部9の画面上には、第3図で示されるように、各音節候
補の第1候補が表示されるととともに、最後の音節候補
の次の位置には参照符11で示されるように、次の入力
可能位置を示すカーソルが表示される。
前記第3図より明らがなように、第1〜第3音節の認識
結果は誤りであり、したがって使用者はカーソルを移動
して、入力を希望する文字に修正を行う必要があり、先
ずキーボード1oの「←」キーを用いてカーソルを第1
音節に移動する。これによって表示部9の画面上には、
第4図(1)において参照符12で示されるように、カ
ーソル表示が行われるとともに、このカーソルのある第
1音節の全ての音節候補が表示される。
結果は誤りであり、したがって使用者はカーソルを移動
して、入力を希望する文字に修正を行う必要があり、先
ずキーボード1oの「←」キーを用いてカーソルを第1
音節に移動する。これによって表示部9の画面上には、
第4図(1)において参照符12で示されるように、カ
ーソル表示が行われるとともに、このカーソルのある第
1音節の全ての音節候補が表示される。
この状態でキーボード10の「↑」または「↓」キーの
操作などによって正しい文字の選択を行い、この場合選
択された音節候補は、第1候補の位置に入換えられるよ
うにしてもよく、あるいはまたたとえば点滅表示や、背
景の色と表示文字の色との反転表示などによって他の音
節候補と区分して表示されてもよい。
操作などによって正しい文字の選択を行い、この場合選
択された音節候補は、第1候補の位置に入換えられるよ
うにしてもよく、あるいはまたたとえば点滅表示や、背
景の色と表示文字の色との反転表示などによって他の音
節候補と区分して表示されてもよい。
こうして第1音節の修正が終了すると、キーボード10
の「→」キーの操作によって第4図(2)において参照
符13で示されるように、カーソルを第2音節の位置に
移動する。第2音節においても前記第1音節と同様にし
て修正操作が行われ、キーボード10の「→」キーを操
作することによって第4図(3)において参照符14で
示される位置にカーソルが移動し、以降第4図〈4)に
おいて参照符15で示されるようにカーソルを順次的に
移動してゆき、各音節毎に入力文字の修正が行われる。
の「→」キーの操作によって第4図(2)において参照
符13で示されるように、カーソルを第2音節の位置に
移動する。第2音節においても前記第1音節と同様にし
て修正操作が行われ、キーボード10の「→」キーを操
作することによって第4図(3)において参照符14で
示される位置にカーソルが移動し、以降第4図〈4)に
おいて参照符15で示されるようにカーソルを順次的に
移動してゆき、各音節毎に入力文字の修正が行われる。
全ての入力文字の修正が終了し、第4図(5)において
参照符16で示されるようにカーソルを次の文字の入力
位置に移動した時点で、たとえばカナ漢字変換などが行
われ、再び音声入力が行われる。
参照符16で示されるようにカーソルを次の文字の入力
位置に移動した時点で、たとえばカナ漢字変換などが行
われ、再び音声入力が行われる。
第5図は、動作を説明するためのフローチャートである
。ステップn1で使用者が発声すると、ステップri
2で前述のような標準パターンとの照合が行なわれ、そ
の照合結果に基づいてCPU部5内のメモリ5aに各音
節候補の認識結果が記憶される。ステップn3では、ス
テップn2での認識結果が表示部9に表示される。
。ステップn1で使用者が発声すると、ステップri
2で前述のような標準パターンとの照合が行なわれ、そ
の照合結果に基づいてCPU部5内のメモリ5aに各音
節候補の認識結果が記憶される。ステップn3では、ス
テップn2での認識結果が表示部9に表示される。
ステップn4ではキーボード10の「←」キーや「→」
キーの操作が行なわれたかどうか、すなわち音節候補の
修正があるかどうかが判断され、そうであるときにはス
テップn5で前記キー操作によるカーソル移動が行なわ
れる。ステップn6ではカーソル位置の音節候補の全て
が表示され、ステップn7でこれら音節候補の選択やキ
ー人力などによって音節候補の修正が行なわれ、ステッ
プn3に戻る。
キーの操作が行なわれたかどうか、すなわち音節候補の
修正があるかどうかが判断され、そうであるときにはス
テップn5で前記キー操作によるカーソル移動が行なわ
れる。ステップn6ではカーソル位置の音節候補の全て
が表示され、ステップn7でこれら音節候補の選択やキ
ー人力などによって音節候補の修正が行なわれ、ステッ
プn3に戻る。
ステップn4において音節候補の修正が行なわれないと
き、すなわち各音節候補の第1候補が入力音声に一致し
たときには、ステップn8でカナ漢字変換などの処理が
行なわれて、ステップr11に戻る。
き、すなわち各音節候補の第1候補が入力音声に一致し
たときには、ステップn8でカナ漢字変換などの処理が
行なわれて、ステップr11に戻る。
このように本件音声認識装置1では、カーソルが文節中
にある場合には、そのカーソルの位置における音節候補
の全てを表示するようにしている。
にある場合には、そのカーソルの位置における音節候補
の全てを表示するようにしている。
発明の効果
以上のように本発明によれば、カーソルのある位置にお
ける音節候補の全てを表示するようにしたので、使用者
は、自己の音声がどのように認識されたのかを把握する
ことができる。また発声した音節が候補中にない場合な
どでは、不要なキー操作を行う必要なく、速やかに訂正
入力を行うことができ、入力効率を向上することができ
る。
ける音節候補の全てを表示するようにしたので、使用者
は、自己の音声がどのように認識されたのかを把握する
ことができる。また発声した音節が候補中にない場合な
どでは、不要なキー操作を行う必要なく、速やかに訂正
入力を行うことができ、入力効率を向上することができ
る。
第1図は本発明の一実施例の音声認識装置1の構成を示
すブロック図、第2図はマイクロホン2から入力された
音声とその音声のCPU部5内のメモリ5aにおける認
識結果の一例を示す図、第3図は1文節の音声入力が終
了した時点における表示部9の表示例を示す図、第4図
はカーソル移動による各音節候補の選択時の表示例を示
す図、第5図は動作を説明するためのフローチャート、
第6図は従来技術の音節候補の表示例を示す図である。 1・・・音声認識装置、2・・・マイクロホン、3・・
・増幅部、4・・・特徴抽出部、5・・・CPU部、6
・・・標準パターン記憶部、7・・・マツチング部、8
・・・入カバターン記憶部、9・・・表示部、10・・
・キーボード、11〜16・・・カーソル 代理人 弁理士 画数 圭一部 ごく みんを 1音P籍峰置
すブロック図、第2図はマイクロホン2から入力された
音声とその音声のCPU部5内のメモリ5aにおける認
識結果の一例を示す図、第3図は1文節の音声入力が終
了した時点における表示部9の表示例を示す図、第4図
はカーソル移動による各音節候補の選択時の表示例を示
す図、第5図は動作を説明するためのフローチャート、
第6図は従来技術の音節候補の表示例を示す図である。 1・・・音声認識装置、2・・・マイクロホン、3・・
・増幅部、4・・・特徴抽出部、5・・・CPU部、6
・・・標準パターン記憶部、7・・・マツチング部、8
・・・入カバターン記憶部、9・・・表示部、10・・
・キーボード、11〜16・・・カーソル 代理人 弁理士 画数 圭一部 ごく みんを 1音P籍峰置
Claims (1)
- 【特許請求の範囲】 入力された音声を予め登録された標準パターンとの距
離計算を用いて音節毎に認識する音声認識装置において
、 各音節に対して1または複数の音節候補を作成する音節
候補作成手段と、 前記音節候補作成手段からの出力に応答して、音節の目
視表示を行う表示手段とを備え、 前記表示手段にはカーソルが表示され、該カーソルが移
動された音節における前記音節候補を一斉に表示するこ
とを特徴とする音声認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63180800A JPH0228827A (ja) | 1988-07-19 | 1988-07-19 | 音声認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63180800A JPH0228827A (ja) | 1988-07-19 | 1988-07-19 | 音声認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0228827A true JPH0228827A (ja) | 1990-01-30 |
Family
ID=16089563
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63180800A Pending JPH0228827A (ja) | 1988-07-19 | 1988-07-19 | 音声認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0228827A (ja) |
-
1988
- 1988-07-19 JP JP63180800A patent/JPH0228827A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN101067780B (zh) | 智能设备的文字输入系统及方法 | |
| EP1701338B1 (en) | Speech recognition method | |
| JP2002116796A (ja) | 音声処理装置、音声処理方法及び記憶媒体 | |
| JP4516112B2 (ja) | 音声認識プログラム | |
| US20100185436A1 (en) | Arabic poetry meter identification system and method | |
| KR101250897B1 (ko) | 전자사전에서 음성인식을 이용한 단어 탐색 장치 및 그 방법 | |
| WO2017159207A1 (ja) | 処理実行装置、処理実行装置の制御方法、および制御プログラム | |
| JPH0228827A (ja) | 音声認識装置 | |
| JP2005234236A (ja) | 音声認識装置、音声認識方法、記憶媒体およびプログラム | |
| JP3762300B2 (ja) | テキスト入力処理装置及び方法並びにプログラム | |
| JP2000250587A (ja) | 音声認識装置及び音声認識翻訳装置 | |
| JP5474723B2 (ja) | 音声認識装置およびその制御プログラム | |
| JPH0630052B2 (ja) | 音声認識表示装置 | |
| KR100404852B1 (ko) | 언어모델적응기능을가진음성인식장치및그제어방법 | |
| JP2010204442A (ja) | 音声認識装置、音声認識方法、音声認識プログラムおよびプログラム記録媒体 | |
| JP6805431B2 (ja) | 音声認識装置 | |
| JPH0338699A (ja) | 音声認識装置 | |
| JPWO2014162356A1 (ja) | 言語リハビリテーション支援システム | |
| JP2755792B2 (ja) | 音声認識装置 | |
| JP2000056796A (ja) | 音声入力装置および方法 | |
| JP7155676B2 (ja) | 名付け支援装置、ロボット、名付け支援方法およびプログラム | |
| JP2000187497A (ja) | 音声による言語入力装置 | |
| JP4797307B2 (ja) | 音声認識装置及び音声認識方法 | |
| JPH04232997A (ja) | 音声認識装置における認識結果表示方式 | |
| JPH0228826A (ja) | 音声認識装置 |