JPS5855993A - 音声デ−タ入力装置 - Google Patents

音声デ−タ入力装置

Info

Publication number
JPS5855993A
JPS5855993A JP56153694A JP15369481A JPS5855993A JP S5855993 A JPS5855993 A JP S5855993A JP 56153694 A JP56153694 A JP 56153694A JP 15369481 A JP15369481 A JP 15369481A JP S5855993 A JPS5855993 A JP S5855993A
Authority
JP
Japan
Prior art keywords
data
voice
voice data
input
manually
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP56153694A
Other languages
English (en)
Inventor
岡村 有人
重光 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP56153694A priority Critical patent/JPS5855993A/ja
Publication of JPS5855993A publication Critical patent/JPS5855993A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は音声鍵、音声リモコンなどにおいて確実に間違
いなく音声暗号を認識し入力するための方法及び装置に
関するものである。
従来音声を認識して千−をON10 F Fするシステ
ムにおいて最も離しいとされている点は誤認識の問題で
ある。一般にこれらのシステムは使用者がある特定のキ
ーワードを発声してこれを認識するが、誤つて認識した
場合、使用者は一体どこの部分のデータ人力が不適当だ
ったか理解できないまま再度頭からキーワードを人力し
なければならず、時間的にもむだが多かったO 本発明の目的は上記した従来技術の欠点をなくシ、関連
になく確実に音声データを入力するための音声データ入
力装置を提供するにある。
本発明の特徴は複数の要素からなる音声データを装置側
のタイミング信号に同期して1要素ずつ入力し、1要素
のデータを入力するごとに音声l!1m@路で判断した
結果を利用者に知らせることにより、間違いなく確実に
音声データを人力できる点である。
第1図は、本発明による音声データ人力装置  。
の一実施例のブロック図である。
16はタイミング信号発生回路で、本実施例においては
信号は例えば“ピッ“という音な用い増幅器18を介し
てスピーカ120より発生される012はマイク19よ
り人力された音声データの要素を分析、認識するための
音声分析11g鎗回路である。13は音声分析認識回路
12によって認識された内容を音声で知らせるための音
声合成回路である。
音声データは例えば数字で5512(さん、ご。
いも−に)とする0この4つの数字の要素からなる音声
のデータを人力する場合のシステムの70−を第2図に
示す図中、左側は使用者側の作業、右側は装置側の作業
を示す。音声入力作業21において5(さん)、5(ご
)、1(いち)2(に)の4つの音声の要素Btっずっ
音声で入力する・人力ざnたデータは音声認識ルーチン
25において判断され、その判断結果は音声合成ルーチ
ン26で音声合一されて使用者側にエコー/f?り22
される。使用者はそのエコーバッタの内容【聴いて判断
し、25正しく判断されてぃいれば再度21に戻つて同
じデータを人力する。
正しく判断されたデータはデータスFアルーチン27に
より、RAM123内にストアされる。
第5図にデータ入力のタイ之ングを示す。5512(さ
ん、ご、いち、に)のデータ入力において1(いち)の
データの人力が1度で正、しく行なわれなかった場合の
例を示To図中矩形で示、した“ピッ−はタイ電ングの
パルス信号音、丸で囲んだフミは使用声の大刀音声デー
タ、丸で囲まないかなは装置で判断した結果のエコーパ
ック音声合成音である。この例では5.5゜2は正しく
入力され1が1度tp−て2度目の人力で正しく人力さ
れた場合を示している。1度目の1(いち)の音声デー
タ人力34の後に、装置はその内容t−2(に)と誤つ
て認識しこという音声35を合成して出力する。使用者
は認識結果が間違っていることに気付いて再度音声デー
タいち57を入力するが、その前に図中56で示すごと
く使用者は無音状態のブランクを1″′)置く。
このブランクは、直前に判断された内容は間違っている
ことを意味し、再度音声データの人力からやり直す。こ
のようにして再度1(いち)57を人力し、その結果が
正しく1と判断され合成音声58が出力されれば使用後
は次の音声データ2(に)59を人力する0この様にし
て一連のデータ人力を終え、データ入力終了は、図中5
311に示すような2つ以上のブランク装置くことで装
置に知らせることができる。第1v!iにおいて、MP
U(マイクロプロセッサユニツ))11はROM122
に納められたシステムソフトに従ってシステムをコント
ロールし、必要に応じて認識された音声データの内容も
しくはそれに付随したデータをインターフェイス124
f介シて外部に出力する。MPUには例えば日立製作所
領の4ビットマイクロプロセッサHMC840シリーズ
を用いて構成することができるインターフェイス124
は上記の機能の他に、外部の機器との結合を司る。
音声の認識には例えば、PARCOR分析による距離計
算方式を用いる。
PARCO&分析のアルゴリズムと手法はよく公知され
ており、ここでは詳述しない0PARCOR分析の結果
音声データが持つ物理パラメータ(PARCOR係数、
ピッチ情報、振幅情報など)が計算される〇 本実施例においては音声のデータは、例えば0〜9まで
の10個の要素で構成され、それらのデータは音声の0
(ぜろ)、1(いち)、2(に)、5(さん)* 4(
t、)、S(ご)、6(ろ<)、7(Lち)、8(けち
)、9(く)で与えられる。これら音声の特徴はPAR
COR係数などnコの物理パラメータで構成されるn次
元空間のベクトルとして表わされ、上記10個の音声の
特徴は、n次元のベクトルのデータとしてROM122
にあらかじめ収納されるかまたは音声データを人力する
に先がけてあらかじめり7アレンスデータ(ぜろ、いち
、に、ざん。
し、ご、ろく、シち、はち、くの10個の音声)をマイ
ク19より人力して分析認識回路12で物理パラメータ
を計算しRAM125に収納しておく。
従って3(ざん)、5(ご)、1(いち)。
2(に)というデータご音声で人力して認識させる場合
には人力した各々の音声の持つ特徴全分析9wt−回路
12で分析し、得られたn次元の物理パラメータのベク
トル−ak(k=0 * 1 *・・・。
9)と上述のROM122もしくはRAM123にあら
かじめ収納されているり7アレンスのベクトルb (J
−Q、 1 、・・・、9)との距離を求めて0〜9の
いずれに最も近いかを求めることになる。演算はMPU
11によりて行なわれる。具体的演算は次の様になるO
もし、入力された音声データが持つn個のパラメータ(
RARCOR係数など)の値を”J (k =Os 1
 * ””9* j−1,2,・・・、n)、用意され
た基準となる音声データの同様のパラメータをbjj(
j=O−1e ”・、9゜1.2.・・・、n)とする
ならば人力されたデータと基準とのデータの距111d
k、lは次の様に表わされる。
サフィックス、jはnフの物理パラメータを表t)fサ
フィックス、α量はエコの物理ノぐラメータを規格化ま
たは重み付けするための係数である。
MPU+1は入力された音声データに、=に、の分析結
果tk、に対して式(1)の計算を全てのjの1jにつ
いて行ないそのうちで最も小ざな値を取るI=1.を認
識結果とする。すなわちに+)=j。
のとき音声データは正しく入力されたことになる。
音声合成回路15は上記した演算結果j−1Oに従1て
エコーバックの音声を合成して発声する。認識結果は、
第4図に示すような4ビツトのデータとして表現され、
そのデータ【もとにROM122内に収納されている音
声合成のためのアドレスデータ(後述)はデータバス1
25を経て音声合成回路15へと送られる。
音声合成回路13は音声合成部14と音声メモリ部15
から構成されている。音声メモリ部15は、合成すべき
音声(ぜろ、いち、・・・、<)のPARCOR係数、
ピッチ情報、振幅情報などのデータを格納しており、例
えば日立製作所製のHI)58882が用いられる。音
声合成部14はMPU++から音声合成のために必要な
データが収納  4されている音声メモリにおける先頭
アドレスの指定を受け、これに基づいて音声ブロックメ
モリ15から当該データを読取って音声信号を合成する
もので、例えば、日立製作所製の音声合成用のLSIで
あるHD38880が用いられる。
第5図は音声メモリの内容を図式化したちのでるための
データが収納されているブロックの先頭番地(16進数
4クタ)を表わしている。合成された音声はアンプ18
を介してスピーカ120より発声される。
以上実施例で示したごとく、本発明による音声人力装置
を用いれば、間違うことなく確実に音声のデータを人力
することができる0なお本実施例においては入力音声デ
ータを認。
識した結果を音声合成にてエコーバックする方式につい
て述べているが、これに限ることなく他の手段例えばC
RTディスプレイなトラ用イてもその効果に変りはない
【図面の簡単な説明】
第1図は本発明による音声データ入力装置の構成を示す
図、第2図は本発明による音声データ入力装置の動作の
フローを示す図、第3図は警 音声データの人力のタイ々ングを示す図、第4図は人力
した音声を分析し認識した結果をデータ化する場合のデ
ータのビクFパターンを示す図、第5図は音声データR
OMのアドレスを示す図である。 12・・・音声分析認識回路、 15・・・音声合成回路 16・・・タイ々ング信号発生回路、 21・・・音声入力作業、 22・・・エコーバック、 26・・・音声合成ルーチン。 代理人弁理士 薄 1)利 幸4.−2、才1図 牙 Z 図 2 才 + 図 MSF3       1−3B 才  、デ  目

Claims (1)

    【特許請求の範囲】
  1. 11つまたは複数個の要素で構成される音声データを認
    識するための音声認識回路と、開議した結果に従りてそ
    の認識内容をエコーバックして使用者に伝えるための手
    段と上記音声データの入力と音声合成によるエコーバッ
    ク発生のタイミングをとるための信号を発生する回路と
    以上の回路を制御するための手段を具備し、音声データ
    の発生音が上記エコーバックされた内容を判断して、そ
    の内容が人力したデータと興なる場合には再度、データ
    を人力し、上記の手順を繰返すことにより確実に音声デ
    ータを入力できることを特徴とする音声データ人力装置
JP56153694A 1981-09-30 1981-09-30 音声デ−タ入力装置 Pending JPS5855993A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP56153694A JPS5855993A (ja) 1981-09-30 1981-09-30 音声デ−タ入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP56153694A JPS5855993A (ja) 1981-09-30 1981-09-30 音声デ−タ入力装置

Publications (1)

Publication Number Publication Date
JPS5855993A true JPS5855993A (ja) 1983-04-02

Family

ID=15568085

Family Applications (1)

Application Number Title Priority Date Filing Date
JP56153694A Pending JPS5855993A (ja) 1981-09-30 1981-09-30 音声デ−タ入力装置

Country Status (1)

Country Link
JP (1) JPS5855993A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6136384A (ja) * 1984-07-30 1986-02-21 Pentel Kk 二重発色インキ
JPS6338996A (ja) * 1986-08-05 1988-02-19 沖電気工業株式会社 音声認識制御方式
JPS6375798A (ja) * 1986-09-19 1988-04-06 株式会社日立製作所 音声入出力装置における入力音声の修正方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6136384A (ja) * 1984-07-30 1986-02-21 Pentel Kk 二重発色インキ
JPS6338996A (ja) * 1986-08-05 1988-02-19 沖電気工業株式会社 音声認識制御方式
JPS6375798A (ja) * 1986-09-19 1988-04-06 株式会社日立製作所 音声入出力装置における入力音声の修正方法

Similar Documents

Publication Publication Date Title
EP1702319B1 (en) Error detection for speech to text transcription systems
JPS5855993A (ja) 音声デ−タ入力装置
JPS597998A (ja) 連続音声認識装置
JPS6126677B2 (ja)
US4790017A (en) Speech processing feature generation arrangement
JPH09179578A (ja) 単音節認識装置
JPH1124693A (ja) 音声認識装置
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPH06175689A (ja) 音声認識反応装置
JP2536896B2 (ja) 音声合成装置
Lazzaro et al. Silicon models for auditory scene analysis
JPH1097270A (ja) 音声認識装置
JPH0556519B2 (ja)
JPS59117632A (ja) 音声入力方式
EP1422691B1 (en) Method for adapting a speech recognition system
JPH02251999A (ja) 標準パタン作成方式
JP3040430B2 (ja) 音声認識装置
JPS6073592A (ja) 特定話者用音声認識装置
JPS59123928A (ja) 音声入出力装置
JPH04267300A (ja) 雑音除去と話者適応の機能を有する音声認識装置
JPH02195398A (ja) 音声処理方法及び装置
JPH0437997B2 (ja)
JPH01285998A (ja) 音声認識装置
JPH06324696A (ja) 音声認識装置及び方法
JPH0567960B2 (ja)