JPS5855993A

JPS5855993A - 音声デ−タ入力装置

Info

Publication number: JPS5855993A
Application number: JP56153694A
Authority: JP
Inventors: 岡村　有人; 重光樋口
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1981-09-30
Filing date: 1981-09-30
Publication date: 1983-04-02

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】本発明は音声鍵、音声リモコンなどにおいて確実に間違
いなく音声暗号を認識し入力するための方法及び装置に
関するものである。

従来音声を認識して千−をＯＮ１０　Ｆ　Ｆするシステ
ムにおいて最も離しいとされている点は誤認識の問題で
ある。一般にこれらのシステムは使用者がある特定のキ
ーワードを発声してこれを認識するが、誤つて認識した
場合、使用者は一体どこの部分のデータ人力が不適当だ
ったか理解できないまま再度頭からキーワードを人力し
なければならず、時間的にもむだが多かったＯ本発明の目的は上記した従来技術の欠点をなくシ、関連
になく確実に音声データを入力するための音声データ入
力装置を提供するにある。

本発明の特徴は複数の要素からなる音声データを装置側
のタイミング信号に同期して１要素ずつ入力し、１要素
のデータを入力するごとに音声ｌ！１ｍ＠路で判断した
結果を利用者に知らせることにより、間違いなく確実に
音声データを人力できる点である。

第１図は、本発明による音声データ人力装置　　。

の一実施例のブロック図である。

１６はタイミング信号発生回路で、本実施例においては
信号は例えば“ピッ“という音な用い増幅器１８を介し
てスピーカ１２０より発生される０１２はマイク１９よ
り人力された音声データの要素を分析、認識するための
音声分析１１ｇ鎗回路である。１３は音声分析認識回路
１２によって認識された内容を音声で知らせるための音
声合成回路である。

音声データは例えば数字で５５１２（さん、ご。

いも−に）とする０この４つの数字の要素からなる音声
のデータを人力する場合のシステムの７０−を第２図に
示す図中、左側は使用者側の作業、右側は装置側の作業
を示す。音声入力作業２１において５（さん）、５（ご
）、１（いち）２（に）の４つの音声の要素Ｂｔっずっ
音声で入力する・人力ざｎたデータは音声認識ルーチン
２５において判断され、その判断結果は音声合成ルーチ
ン２６で音声合一されて使用者側にエコー／ｆ？り２２
される。使用者はそのエコーバッタの内容【聴いて判断
し、２５正しく判断されてぃいれば再度２１に戻つて同
じデータを人力する。

正しく判断されたデータはデータスＦアルーチン２７に
より、ＲＡＭ１２３内にストアされる。

第５図にデータ入力のタイ之ングを示す。５５１２（さ
ん、ご、いち、に）のデータ入力において１（いち）の
データの人力が１度で正、しく行なわれなかった場合の
例を示Ｔｏ図中矩形で示、した“ピッ−はタイ電ングの
パルス信号音、丸で囲んだフミは使用声の大刀音声デー
タ、丸で囲まないかなは装置で判断した結果のエコーパ
ック音声合成音である。この例では５．５゜２は正しく
入力され１が１度ｔｐ−て２度目の人力で正しく人力さ
れた場合を示している。１度目の１（いち）の音声デー
タ人力３４の後に、装置はその内容ｔ−２（に）と誤つ
て認識しこという音声３５を合成して出力する。使用者
は認識結果が間違っていることに気付いて再度音声デー
タいち５７を入力するが、その前に図中５６で示すごと
く使用者は無音状態のブランクを１″′）置く。

このブランクは、直前に判断された内容は間違っている
ことを意味し、再度音声データの人力からやり直す。こ
のようにして再度１（いち）５７を人力し、その結果が
正しく１と判断され合成音声５８が出力されれば使用後
は次の音声データ２（に）５９を人力する０この様にし
て一連のデータ人力を終え、データ入力終了は、図中５
３１１に示すような２つ以上のブランク装置くことで装
置に知らせることができる。第１ｖ！ｉにおいて、ＭＰ
Ｕ（マイクロプロセッサユニツ））１１はＲＯＭ１２２
に納められたシステムソフトに従ってシステムをコント
ロールし、必要に応じて認識された音声データの内容も
しくはそれに付随したデータをインターフェイス１２４
ｆ介シて外部に出力する。ＭＰＵには例えば日立製作所
領の４ビットマイクロプロセッサＨＭＣ８４０シリーズ
を用いて構成することができるインターフェイス１２４
は上記の機能の他に、外部の機器との結合を司る。

音声の認識には例えば、ＰＡＲＣＯＲ分析による距離計
算方式を用いる。

ＰＡＲＣＯ＆分析のアルゴリズムと手法はよく公知され
ており、ここでは詳述しない０ＰＡＲＣＯＲ分析の結果
音声データが持つ物理パラメータ（ＰＡＲＣＯＲ係数、
ピッチ情報、振幅情報など）が計算される〇本実施例においては音声のデータは、例えば０〜９まで
の１０個の要素で構成され、それらのデータは音声の０
（ぜろ）、１（いち）、２（に）、５（さん）＊　４（
ｔ、）、Ｓ（ご）、６（ろ＜）、７（Ｌち）、８（けち
）、９（く）で与えられる。これら音声の特徴はＰＡＲ
ＣＯＲ係数などｎコの物理パラメータで構成されるｎ次
元空間のベクトルとして表わされ、上記１０個の音声の
特徴は、ｎ次元のベクトルのデータとしてＲＯＭ１２２
にあらかじめ収納されるかまたは音声データを人力する
に先がけてあらかじめり７アレンスデータ（ぜろ、いち
、に、ざん。

し、ご、ろく、シち、はち、くの１０個の音声）をマイ
ク１９より人力して分析認識回路１２で物理パラメータ
を計算しＲＡＭ１２５に収納しておく。

従って３（ざん）、５（ご）、１（いち）。

２（に）というデータご音声で人力して認識させる場合
には人力した各々の音声の持つ特徴全分析９ｗｔ−回路
１２で分析し、得られたｎ次元の物理パラメータのベク
トル−ａｋ（ｋ＝０　＊　１　＊・・・。

９）と上述のＲＯＭ１２２もしくはＲＡＭ１２３にあら
かじめ収納されているり７アレンスのベクトルｂ　（Ｊ
−Ｑ、　１　、・・・、９）との距離を求めて０〜９の
いずれに最も近いかを求めることになる。演算はＭＰＵ
１１によりて行なわれる。具体的演算は次の様になるＯ
もし、入力された音声データが持つｎ個のパラメータ（
ＲＡＲＣＯＲ係数など）の値を”Ｊ　（ｋ　＝Ｏｓ　１
　＊　””９＊　ｊ−１，２，・・・、ｎ）、用意され
た基準となる音声データの同様のパラメータをｂｊｊ（
ｊ＝Ｏ−１ｅ　”・、９゜１．２．・・・、ｎ）とする
ならば人力されたデータと基準とのデータの距１１１ｄ
ｋ、ｌは次の様に表わされる。

サフィックス、ｊはｎフの物理パラメータを表ｔ）ｆサ
フィックス、α量はエコの物理ノぐラメータを規格化ま
たは重み付けするための係数である。

ＭＰＵ＋１は入力された音声データに、＝に、の分析結
果ｔｋ、に対して式（１）の計算を全てのｊの１ｊにつ
いて行ないそのうちで最も小ざな値を取るＩ＝１．を認
識結果とする。すなわちに＋）＝ｊ。

のとき音声データは正しく入力されたことになる。

音声合成回路１５は上記した演算結果ｊ−１Ｏに従１て
エコーバックの音声を合成して発声する。認識結果は、
第４図に示すような４ビツトのデータとして表現され、
そのデータ【もとにＲＯＭ１２２内に収納されている音
声合成のためのアドレスデータ（後述）はデータバス１
２５を経て音声合成回路１５へと送られる。

音声合成回路１３は音声合成部１４と音声メモリ部１５
から構成されている。音声メモリ部１５は、合成すべき
音声（ぜろ、いち、・・・、＜）のＰＡＲＣＯＲ係数、
ピッチ情報、振幅情報などのデータを格納しており、例
えば日立製作所製のＨＩ）５８８８２が用いられる。音
声合成部１４はＭＰＵ＋＋から音声合成のために必要な
データが収納　　４されている音声メモリにおける先頭
アドレスの指定を受け、これに基づいて音声ブロックメ
モリ１５から当該データを読取って音声信号を合成する
もので、例えば、日立製作所製の音声合成用のＬＳＩで
あるＨＤ３８８８０が用いられる。

第５図は音声メモリの内容を図式化したちのでるための
データが収納されているブロックの先頭番地（１６進数
４クタ）を表わしている。合成された音声はアンプ１８
を介してスピーカ１２０より発声される。

以上実施例で示したごとく、本発明による音声人力装置
を用いれば、間違うことなく確実に音声のデータを人力
することができる０なお本実施例においては入力音声デ
ータを認。

識した結果を音声合成にてエコーバックする方式につい
て述べているが、これに限ることなく他の手段例えばＣ
ＲＴディスプレイなトラ用イてもその効果に変りはない
。

【図面の簡単な説明】

第１図は本発明による音声データ入力装置の構成を示す
図、第２図は本発明による音声データ入力装置の動作の
フローを示す図、第３図は警音声データの人力のタイ々ングを示す図、第４図は人力
した音声を分析し認識した結果をデータ化する場合のデ
ータのビクＦパターンを示す図、第５図は音声データＲ
ＯＭのアドレスを示す図である。１２・・・音声分析認識回路、１５・・・音声合成回路１６・・・タイ々ング信号発生回路、２１・・・音声入力作業、２２・・・エコーバック、２６・・・音声合成ルーチン。代理人弁理士　薄　１）利　幸４．−２、才１図牙　Ｚ　図２才　＋　図ＭＳＦ３　　　　　　　１−３Ｂ才　　、デ　　目

Claims

【特許請求の範囲】

１１つまたは複数個の要素で構成される音声データを認
識するための音声認識回路と、開議した結果に従りてそ
の認識内容をエコーバックして使用者に伝えるための手
段と上記音声データの入力と音声合成によるエコーバッ
ク発生のタイミングをとるための信号を発生する回路と
以上の回路を制御するための手段を具備し、音声データ
の発生音が上記エコーバックされた内容を判断して、そ
の内容が人力したデータと興なる場合には再度、データ
を人力し、上記の手順を繰返すことにより確実に音声デ
ータを入力できることを特徴とする音声データ人力装置
。