JPS6193499A - 音声パタ−ン照合方式 - Google Patents

音声パタ−ン照合方式

Info

Publication number
JPS6193499A
JPS6193499A JP59214594A JP21459484A JPS6193499A JP S6193499 A JPS6193499 A JP S6193499A JP 59214594 A JP59214594 A JP 59214594A JP 21459484 A JP21459484 A JP 21459484A JP S6193499 A JPS6193499 A JP S6193499A
Authority
JP
Japan
Prior art keywords
pattern
registered
silent
matching
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59214594A
Other languages
English (en)
Inventor
潤一郎 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP59214594A priority Critical patent/JPS6193499A/ja
Publication of JPS6193499A publication Critical patent/JPS6193499A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 孜血分界 本発明は、音声認識装置における音声パターン照合方式
に関する。
従来肢止 パターンマツチングを利用した音声認識では認識すべき
音声をあらかじめ登録しておき、入力された音声と登録
された音声のパターンを比較照合して最大類似の音声を
探し、それを認識結果としている。その場合、音声が入
力された時、登録されている音声全部と照合すると時間
がかかるので、他の特徴によってどの登録パターンと照
合すべきかを判断してから照合する方法が知られている
この判断のための特徴として音声区間の中に無音部が存
在するか否かを用いる方法があり(特開昭513−14
2598号)、無音部が存在する音声は無音部を持つ登
録パターンとのみ照合することによって対象を減らし高
速認識を図っている。これは/p/、/l/、/に/音
や促音の前に無音区間が生じることを利用しているが、
単語音声認識の場合、無音区間を有するものが多くなり
やすいため、無音区間保有に分類された場合、そうでな
い場合に比べて照合に時間がかかるという欠点がある。
又、無音区間の有無を利用する場合、/d/、/g/の
音素の前に無音区間の発生が一定しないことから正しく
対象が減らせないという欠点もある。
且迫 本発明は、上述のごとき従来技術の欠点を解決するため
になされたもので、特に、音声中に無音区間を有する単
語を正しく判別し、高速で認識することを目的としてな
されたものである。
1底 本発明は、上記目的を達成するため、音声信号を電気信
号に変換する手段と、該電気信号を特徴パラメータに変
換する手段と、このように作られた音声パターンを登録
しておく手段を備え、入力された音声パターンとすでに
登録されているパターンとを比較照合して認識結果を出
力する音声認識装置において、パターンの特徴的な部分
の数をパターンの一部に添加し、登録すべき一つの音声
について複数のパターンの添加された情報を加え合わせ
たものをパターンと共に登録しておき、未知入力パター
ンが与えられた時に同じ特徴的な部分の数がどの程度一
致するかを登録されたパターンの添加情報と比較し、あ
る程度以上一致した標準パターンとのみ照合することを
特徴としたものである。以下、本発明の実施例に基づい
て説明する。
第1図は、本発明の一実施例を説明するための構成図で
、図中、1はマイク、2は特徴抽出部、3は音声区間検
出部、4はパワー検出部、5はレジスタ、6は一定値以
下判定部、7はカウンタ、8は無音個数パターン、9は
第1照合部、10は単語辞書、11は一定値以下判定部
、12は第2照合部、13は最大類似度算出部、14は
結果出力部で、以下に、パターンの特徴的な部分として
無音区間を採用した場合について説明するが、本発明は
、無音区間に限定するものではなく、高い周波数成分が
多く存在する部分、有声の部分、無声の部分等どのよう
な特徴に注目しても良い。
最初に、辞書作成について説明すると、不特定話者向き
の音声認識では何人かの音声の平均によって一つの辞書
パターンを登録することは知られている(音声研究会資
料581−57)。このような各パターンに無音区間の
数を第2図の如くつけ加える。第2図(a)は話者Aの
ある単語の無音区間数で、8ビツトのメモリーMは順に
無音区間0,1.2・・・7と個数を表わしており、(
a)は無音区間が1個存在したことを示す。このような
8ビツトのパターンを音声パターンの一部につ1けてお
く。話者B、Cは同じ単語でありながら無音区間数はO
であった。ここでは8人のパターンの平均を辞書パター
ンにしており、パターンと共にこの8ビツトパターンも
和がと、られると(i)のような辞書パターンが出来る
。これは各要素を3ビツトで表わしており、8人中6人
が無音区間0.2人が1でそれ以上多い人はいない。こ
の(i)の断面を連続的にして(j)に示す。このよう
なパターンが辞書パターンと共に登録されている。
第1図に戻り、バンドパスフィルタ群などによって音声
の特徴抽出をし、音声区間をレジスタに貯える、一方、
その音声のパワー検出等によって一定値以下、つまり無
音区間がいくつあるかをカウンタで数え、第2図(k)
のような無音個数パターンを作る。先に述べた一定値は
限ずしも0ではなく周辺のノイズ等を考慮して無音区間
とみなせる値に決定すれば良い。次に辞書の第2図(i
)の部分と入力の(k)の部分が、第1照合部で照合さ
れる。この照合は対応するエレメントの積和をとるだけ
で良い。この値が一定値例えばO以下なら8人のパター
291人も同じ無音区間数の人が居なかった訳で全体の
パターンを照合するまでもなく、異なるパターンである
と判断して次の辞書パターンをとり出す。この照合の結
果がある程度の値をもつ辞書パターンについてのみ第2
照合部でパターン全体の照合をする。このように辞書に
登録されている全パターンを照合して最大の類似度のも
のを認識結果とする。
一方、第3図のように、乗算回路15を設け、無音区間
数を予備選択的に用いるのではなく、第1と第2の照合
で得られた類似度の積をもって新たな類似度を定置して
も良い。この場合、どちらかの照合結果が0なら積をと
る必要はないし、類似度の闇値を決めておきそれより大
なる時は以後の演算を打ち切ってそれを認識結果として
も良い。
第4図は、本発明の他の実施例を説明するための構成図
で、図中、16は区間終了判定部、17は予備選択部、
18は照合部で、その他第1図及び第3図と同様の作用
をする部分には、第1図及び第3図と同一の参照番号が
付しである。第4図において、単語辞書には各登録単語
のパターンと共にそれらの単語中の無音区間の数の変化
範囲が記録されている。この変化範囲は特定話者向きの
装置では使用者が何回か同じ単語を発生した時の無音区
間数のバラツキ、不特定話者向きのものなら、多数の人
が同一単語を発声した時の無音区間数のバラツキ具合が
あらかじめ登録されている。
例えば「上」という単語では誰が発声しても無音が存在
しないから0.0と記憶され、「下J/5ita/では
/1/の前に無音部があり、人によらず1区間だけで変
化せず、この場合、1.1が記憶される。一方、「右J
/m1g1/では/g/の前に無音区間が発生する人と
ない人があり、0又は1個できるから0,1が記憶され
る。人によって1個から3個まで変動する単語では1.
3と記憶しておく。
そこでまず、第1図のマイクから未知の音声が入力され
たならバンドパスフィルタ群のような手段で特徴抽出さ
れ音声の区間のみが次のステップへ伝達される。次にバ
ンドパスフィルタ群の場合、全チャンネルの出力合計つ
まりパワーが一定値以下の部分があればカウンタを1つ
だけカウントアツプする。単語全体で一定値以下の部分
がいくつあるか計数する訳であり、一定値以下の部分が
連続してもカウンターは進まない。この一定値は周辺の
ノイズ等から無音区間検出ルベルを決めれば良い。こう
して単語全体でいくつの無音区間が存在するかを求め、
単語辞書内の無音区間の一致するものをみつけて照合す
る。例えば入力単語の無音区間数が「2」なら、0,2
;1,2;2,2;2.3;1,3・・・・・・などの
変化範囲内に2を含む単語と照合し、含まない単語パタ
ーンとは照合しないようにする。こうして照合によって
得られた類似度の最大のものを認識結果として出力する
この場合の照合方法は限定されるものではな(、周知の
DPマツチング(動的計画法による照合)などを用いれ
ば良い。
処理 以上の説明から明らかなように、本発明によると、特徴
的な部分の数が統計的に処理されるため、誤った対象を
選ぶことがなくなる。
【図面の簡単な説明】
第1図は、本発明の一実施例を説明するための電気的ブ
ロック線図、第2図は、辞書登録動作を説明するための
図、第3図及び第4図は、それぞれ本発明の他の実施例
を説明するための構成図である。 1・・・マイク、2・・・特徴抽出部、3・・・音声区
間検出部、4・・・パワー検出部、5・・・レジスタ、
6・・・一定値以下判定部、7・・・カウンタ、8・・
・無音個数パターン、9・・・第1照合部、10・・・
単語辞書、11・・・一定値以下判定部、12・・・第
2照合部、13・・・最大類似度算出部、14・・・結
果出力部、15・・・乗算回路、16・・・区間終了判
定部、17・・・予備選択部、18・・・照合部。 第1図 (C)ロ可旺工四旧回C Ck)口可匹匝W旧E 第3図 第4図

Claims (3)

    【特許請求の範囲】
  1. (1)、音声信号を電気信号に変換する手段と、該電気
    信号を特徴パラメータに変換する手段と、このように作
    られた音声パターンを登録しておく手段を備え、入力さ
    れた音声パターンとすでに登録されているパターンとを
    比較照合して認識結果を出力する音声認識装置において
    、パターンの特徴的な部分の数をパターンの一部に添加
    し、登録すべき一つの音声について複数のパターンの添
    加された情報を加え合わせたものをパターンと共に登録
    しておき、未知入力パターンが与えられた時に同じ特徴
    的な部分の数がどの程度一致するかを登録されたパター
    ンの添加情報と比較し、ある程度以上一致した標準パタ
    ーンとのみ照合することを特徴とする音声パターン照合
    方式。
  2. (2)、未知入力パターンが与えられた時に同じ特徴的
    な部分の数がどの程度一致するかを登録されたパターン
    の添加情報と比較し、その一致度合を類似度に反映させ
    ることを特徴とする特許請求の範囲第(1)項に記載の
    音声パターン照合方式。
  3. (3)、前記特徴的な部分の数の変化範囲をパターンの
    一部に添加しておき、未知入力パターンが与えられた時
    に同じ特徴的な部分の数が標準パターンの変化範囲内に
    入っているもののみ照合することを特徴とする特許請求
    の範囲第(1)項に記載の音声パターン照合方式。
JP59214594A 1984-10-12 1984-10-12 音声パタ−ン照合方式 Pending JPS6193499A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59214594A JPS6193499A (ja) 1984-10-12 1984-10-12 音声パタ−ン照合方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59214594A JPS6193499A (ja) 1984-10-12 1984-10-12 音声パタ−ン照合方式

Publications (1)

Publication Number Publication Date
JPS6193499A true JPS6193499A (ja) 1986-05-12

Family

ID=16658299

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59214594A Pending JPS6193499A (ja) 1984-10-12 1984-10-12 音声パタ−ン照合方式

Country Status (1)

Country Link
JP (1) JPS6193499A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6479797A (en) * 1987-09-21 1989-03-24 Ricoh Kk Pattern collation preselection system
JP2013125119A (ja) * 2011-12-14 2013-06-24 Mitsubishi Electric Corp 音声認識装置および音声認識方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6479797A (en) * 1987-09-21 1989-03-24 Ricoh Kk Pattern collation preselection system
JP2013125119A (ja) * 2011-12-14 2013-06-24 Mitsubishi Electric Corp 音声認識装置および音声認識方法

Similar Documents

Publication Publication Date Title
JPH0352640B2 (ja)
JPS62217295A (ja) 音声認識方式
GB2237135A (en) Speaker recognition
JP2996019B2 (ja) 音声認識装置
JPS6193499A (ja) 音声パタ−ン照合方式
JPH04324499A (ja) 音声認識装置
JPS63213899A (ja) 話者照合方式
JPS61180297A (ja) 話者照合装置
JPH05210397A (ja) 音声認識装置
JP2000148187A (ja) 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体
JPS6167899A (ja) 音声認識装置
JPS6267598A (ja) 音声区間検出方式
JPH02302799A (ja) 音声認識方式
JPS6336678B2 (ja)
JPH06318099A (ja) 話者認識装置
JPS63306499A (ja) 不特定話者音声認識装置
JPH0316038B2 (ja)
KR950002704B1 (ko) 음성인식 시스템의 유사음성 구분장치 및 구분방법
JPS6151197A (ja) 音声認識装置
JPH06100918B2 (ja) 音声認識装置
JPS6151196A (ja) 音声認識装置
JPS61113099A (ja) 音声認識装置における音声区間検出方式
JPS62245295A (ja) 特定話者音声認識装置
JPS63213897A (ja) 話者認識装置における辞書更新方式
JP2000250594A (ja) 話者認識装置