JPS6078499A - 非線形圧縮による音声認識装置 - Google Patents

非線形圧縮による音声認識装置

Info

Publication number
JPS6078499A
JPS6078499A JP58186235A JP18623583A JPS6078499A JP S6078499 A JPS6078499 A JP S6078499A JP 58186235 A JP58186235 A JP 58186235A JP 18623583 A JP18623583 A JP 18623583A JP S6078499 A JPS6078499 A JP S6078499A
Authority
JP
Japan
Prior art keywords
speech recognition
section
memory
button
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58186235A
Other languages
English (en)
Inventor
二ノ宮 正生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Casio Computer Co Ltd
Original Assignee
Casio Computer Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Casio Computer Co Ltd filed Critical Casio Computer Co Ltd
Priority to JP58186235A priority Critical patent/JPS6078499A/ja
Publication of JPS6078499A publication Critical patent/JPS6078499A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の技術分野] 本発明は非線形圧縮による音声認識装置に関する。
「従来技術とその問題点] 従来、特定話者用の音声認識装置に於いては、入力音声
の特徴を抽出し一〇メモリに一時記憶し、標準バタンメ
モリに予め記憶している標準バタンどの比較により音声
認識スるようにしている。この場合、上記音声バタンメ
モリには、一定周期で抽出した特徴をそのままバタンと
して記憶するようにしており、このため−単詔当りの情
報量が非常に多くなるという問題かあった。しかして、
一般に音声のフレー、ム間の変化は小さいものであり、
大きく変化J−る場合は少ない。このため前後フレーム
との距離が小さいフレームだけの情報でも十分に音声認
識することがて・きる。
[発明の目的] 本発明は上記の貞に化み(なされたもので、−単詔当り
の情報量を減少し得ると共に、認識処理を迅速に行ない
得る非線形圧縮による音声認識装置を提供することを目
的とする。
[発明の要点] 本発明は音声認識装置において、前後フレームとの距離
が小さいフレームだけの特徴を抽出して音声認識するこ
とにより、−単詔当、りの情報量を減少するようにし1
〔ものである。
「発明の実施例] 以下図面を参照して本発明の一実施例を説明する。第1
図において11はマイクロフAンで、その音声入力は前
処理部12へ送られる。この前処理部12は入力された
音声信号を前処理し、詳細を後述する特徴抽出部13へ
出力する。この特徴抽出部13には始端終端検出部14
が接続されており、入ノj信号のレベルから入力音声の
始端終端を検出して、その検出信号を制御部15へ出力
している。上記特徴抽出部13は入力音声の特徴を抽出
し、音声バタンとして音声バタンメモリ16へ記憶する
と共に、標準バタンメモリ17へ出力する。上記音声バ
タンメモリ16に一時記憶された入力音声バタンは、認
識部18へ送られ、標準バタンメモリ17に記憶されて
いる標準バタンとの、比較により認識処理される。
この認識部18の認識結果は制御部15へ送られ、表示
部19において表示される。上記制御部15は、上記各
部の制御を行なうと共に、特徴抽出部13にフレーム信
号Tfを供給している。
次に第2図により土配特徴抽出部13の詳細について説
明する。第2図において、21a〜211)はNチャン
ネル例えば8−fVンネルのバンドパスフィルタで、入
力音声の’4Cj ilMを抽出する。上記バンドパス
フィルタ21a−・2111によって抽出された特徴は
A−Dコンバータ22によりデジタル信号に変換。
され、シフトレジスタ23へ入力される。このシフ1〜
レジスタ23は例えば3桁構成で、各桁には8ヒツトレ
ジスタが8側設【ノられている。上記シフトレジスタ2
3はフレーム信号rfによりシフト動作し、最上位桁の
保持データは始端終端検出部14へ送られる。また、上
記シフ1〜レジスタ23の上位2桁の保持データは、距
離81算部24へ送られてフレーム間の距離が81算さ
れ、その計算結果がコンパレータ25へ送られる。この
コンパレータ25には閾値メモリ26が接続されている
。この閾値メモリ2Gにはフレーム間の距1111を判
定する為の閾値THが予め設定されている。上記コンパ
レータ25は、距離計算部24の計算結果が閾値THよ
り大きい場合に“0″、小さい場合に′1″を出力づる
。上記コンパレータ25の出力は、シフトレジスタ27
へ送られる。このシフ1−レジスタ27は2ビット構成
で、フレーム信号Tfに同期してシフ1ル動作覆る。上
記シフトレジスタ27の各ピッ1〜出力は、ナンド回路
28を介してシフトレジスタ23の2桁目のリセット端
子Rに入力される。そして、上記シフI・レジスタ23
の最下位桁から出力される信号が、入力音声バタンとし
て音声バタンメモリ16及び標準バタンメモリ17へ送
られる。また、上記シフトレジスタ23の出力は、オア
回路29を介してアンド回路30へ入力される。このア
ンド回路3’Oは、フレーム信号Tfによってゲート制
御されるもので、その出力が制御部15へ送られる。
次に上H,1実施例の動作を説明覆る。、認識モー1−
において、1単語に対する音声を入力すると、前処理部
12にJ3いて前処理された後、特徴抽出部13に送ら
れる。この特徴抽出部13は、Nチャンネルのバンドパ
スフィルタ21a〜21nにより特徴を抽出し、A−D
コンバータ22によりデジタル信号に変換してシフトレ
ジスタ23へ出力する。このシフ1〜レジスタ23はA
−1)コンバータ22からの信号をフレーム信号Tfに
同期して読込み、距@バ1紳部24および始端終端検出
部14へ出力する。この始端終端検出部14は、信弓人
カレベルから入ツノ音声の始端を検出し、制御部15へ
出力する。この制御部15は始端検出信号が人力される
と、音声バタンメモリ16へのバタン読込みを開始づる
。一方、シフトレジスタ23の上位2桁に保持された各
フレームデータは、距離計幹部24へ送られてフレーム
間距離が計算される。この距前nIn部24の51算結
果はコンパレータ25へ送られ、閾値メモリ26に設定
されている閾値T Hど比較される。このコンパレータ
25は、フレーム間距離が閾値T1−1より小さい場合
に’ 1 ” 、大ぎい場合に0゛を出力し、フレーム
信号Tfに同期してシフトレジスタ27に出込む。この
シフトレジスタ27の保持データは、ナンド回路28を
介し′て出ノJされるのて、入力音声のフレーム間距離
が小さい場合はナンド回路28の出力はO″であり、シ
フ1〜レジスタ23はリセツ]〜されない。従ってA−
Dコンバータ22からシフ1−レジスタ23に入力され
たデータはそのままシフ1−きれ、音声バタンメモリ1
Gへ送られる。また、上記シフ1ヘレジスタ23の出力
は、Aア回路29を介してアンド回路30に入力され、
フレーム信号1fに同期して制御部15へ送られる。制
御部15はアシド回路30から1′”信号が入力される
と、シフトレジスタ23からの入力音声バタンを畜肉パ
タンメモリ16に書込む。しかして、コンパレータ25
におい−C、フレーム間距離が閾値T1−1より大きい
と判断された場合はコンパレータ25の出力が○′°と
なり、シフトレジスタ27の上位桁に書込まれる。この
結果、ナンド回路28の出ツノが++ 1 ++となり
、シフ1〜レジスタ23の2桁目の内容がリセッ1へさ
れる。従って、そのリセットされた桁の内容がジノ1〜
レジスタ23の最下位桁にシフl〜されると、シフトレ
ジスタ23の出力は“O″となり、アンド回路30の出
力もO″となる。アンド回路30の出力がrL O++
の場合、制御部15は、音声バタンメモリ1Gへのバタ
ン読込みは行なわない。以上のようにして音声バタンメ
モリ16には、フレーム間距離の小さい人力音声バタン
のみか内込まれる。しかして、始端終端検出部14が入
力1′5声の終端を検出してその検出信号を制御部15
/\出ツノづるど、制御部15(よ、呂声パタンメモリ
16に保1山シている入ツノ音声パタンを認識部18へ
読出しC認識処理を開始覆る。そして、その認識結果を
制御部15へ出)jし、表示部19において表示する。
なお、上記実施例では、バントパスフィルタによって入
力音声の特i牧を抽出するようにしたが、その他、例え
ばテジタルフィルタ等の周波数分析回路、もしくは、1
41JりLJスス法による波形分析回路を用いてもよい
、。
以上述べたように4L l’l明によれば、フレーム間
距離が小さい定常部5)に+13【ノる特徴を抽出して
バタン認識するようにしたので、−単晶j1当りの情報
mを減少でき、距ml 、’il n処理を少なくでき
ると共に、バタン認識処理を迅速に行なうことができる
また1、定常部分だl−Jの特徴抽出であっても十分に
バタン認識を行ない得るものである。
【図面の簡単な説明】 図面は本光明の−実り径間を示すもので、第1図は回路
構成を示づフ1」ツク図、第2図は第1図におけ特徴抽
出部13部分の詳細を示1回路構成図である。 11・・・マイクロフAン、12・・・前処理部12.
13・・・特徴抽出部、14・・・始Oに:紡!!M:
検出部、15・・・制御部、1G・・・音声バタンメモ
リ、17・・・標準バタンメモリ、18・・・ルΣ識部
、19・・・閥舶判定回路、20・・・カウンタ、21
a〜2111・・・バンドパスフィルタ、22・・・A
−Dコンバータ、23・・・シフ1−Lノジスタ、24
・・・距M it n部、25・・・コンパレータ、2
G・・・閾値メモリ、27・・・シフトレジスタ。 出願人代理人 弁Jlp上 鈴江武彦

Claims (1)

    【特許請求の範囲】
  1. 入力音声の特徴抽出バタンと1?i準バタンメモリに記
    憶している標準バタンとの比較により音声認識を行なう
    音声認識装置において、入力音声バタンの各フレーム間
    距離をai算する手段と、この手段により計算されたフ
    レーム間距離が予め設定された閾値以下であるか否かを
    判断し、閾値以下の場合にのみ対応するフレームのバタ
    ンを出ツノして音声バタンメモリに記憶する手段と、こ
    の音声バタンメモリに記憶した音声バタンに対してu 
    R%切動作行なう手段とを具備したことを特徴とづる非
    線形圧縮による音声認識装置。
JP58186235A 1983-10-05 1983-10-05 非線形圧縮による音声認識装置 Pending JPS6078499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58186235A JPS6078499A (ja) 1983-10-05 1983-10-05 非線形圧縮による音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58186235A JPS6078499A (ja) 1983-10-05 1983-10-05 非線形圧縮による音声認識装置

Publications (1)

Publication Number Publication Date
JPS6078499A true JPS6078499A (ja) 1985-05-04

Family

ID=16184716

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58186235A Pending JPS6078499A (ja) 1983-10-05 1983-10-05 非線形圧縮による音声認識装置

Country Status (1)

Country Link
JP (1) JPS6078499A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5799698A (en) * 1980-12-12 1982-06-21 Matsushita Electric Industrial Co Ltd Voice recognition system

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5799698A (en) * 1980-12-12 1982-06-21 Matsushita Electric Industrial Co Ltd Voice recognition system

Similar Documents

Publication Publication Date Title
US5812201A (en) Data synchronizing apparatus and method thereof
JPS5862699A (ja) 音声認識装置
JPH03289829A (ja) Cm自動確認装置
KR100366057B1 (ko) 인간 청각 모델을 이용한 효율적인 음성인식 장치
EP0537804B1 (en) Speech recording apparatus with compression of soundless sections
JPS6078499A (ja) 非線形圧縮による音声認識装置
JP2002064786A (ja) 映像分割方法および映像分割装置
SU1716498A1 (ru) Устройство дл речевого ввода в электронную вычислительную машину
KR100206937B1 (ko) 데이타 동기화 장치 및 방법
JPS6070496A (ja) 音声認識処理方式
JP2706255B2 (ja) 無音圧縮音声録音装置
JP2585241B2 (ja) 無音圧縮音声録音装置
JPS63175895A (ja) 無音圧縮音声録音装置
JPS60237495A (ja) 音声認識装置
JPS6022196A (ja) ピツチ抽出装置
JPS5882300A (ja) 音声認識方式
JPS5995597A (ja) 音声特徴パラメ−タ作成方式
JPS59211100A (ja) 登録型音声認識方法
JPS58217994A (ja) 単語音声認識装置
JPS6068394A (ja) 簡易型音声認識装置
JPS6075900A (ja) 単語音声認識装置
JPS60140300A (ja) 音声認識装置における鼻音識別装置
JPS59102296A (ja) ピツチ抽出方法
JPH04242300A (ja) 音声認識装置
JPS62289895A (ja) 音声認識方法