JPS6266300A - 音声認識方法及びその装置 - Google Patents

音声認識方法及びその装置

Info

Publication number
JPS6266300A
JPS6266300A JP60207131A JP20713185A JPS6266300A JP S6266300 A JPS6266300 A JP S6266300A JP 60207131 A JP60207131 A JP 60207131A JP 20713185 A JP20713185 A JP 20713185A JP S6266300 A JPS6266300 A JP S6266300A
Authority
JP
Japan
Prior art keywords
pattern
similarity
speech
degree
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP60207131A
Other languages
English (en)
Other versions
JP2601448B2 (ja
Inventor
潤一郎 藤本
室井 哲也
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP60207131A priority Critical patent/JP2601448B2/ja
Priority to US06/908,681 priority patent/US4827519A/en
Publication of JPS6266300A publication Critical patent/JPS6266300A/ja
Application granted granted Critical
Publication of JP2601448B2 publication Critical patent/JP2601448B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
扱批氷乱 本発明は、音声認識方式に関する。 丈來技! 音声を2値化処理して特徴パターンを求め、この2値化
処理して求めた入カバターンと辞書パターンを線形マツ
チングして認識する所11BTsP(Binary T
ime−3pectrum Pattern)方式によ
る音声認識は本出願人において既に種々提案されている
。 しかし、このBTSP方式では音声を2値処理するため
に音声の大きさを表わすエネルギーやパワーの情報が失
われ誤認識となることがある。例えば、子音部が急速に
立ち上る破裂音である/P/と比較的緩かに立ち上る/
に/の差が区別しにくい。そこで音声のパワー情報を通
常の方法で2値化して2値のTSP(BTSP)パター
ンと共に保持しておくことが考えられるが、この場合、
BTSPとパワ一部の演算方式が異なるため、パワ一部
の類似性を求める専用の演算部が必要となり、装置が複
雑化し折角のBTSP方式の高速演算性が失われてしま
うことになる。 目     的 本発明は、上述のごとき実情に鑑みてなされたもので、
特に、2値化パターンによる認識システムに音声のエネ
ルギー又はパワー情報を加えながらも高精度、高速認識
の可能な認識方式を提供することを目的としてなされた
ものである。 構成 本発明は、上記目的を達成するため、音声の特徴量を抽
出して、標準パターンとして保持しておき、未知入力音
声の音声パターンと照合することによって認識結果を決
定する音声認識方式において、音声のエネルギー又はパ
ワー形状を示す位置又はその近傍をそれ以外の部分と異
なる符号によって2値化して音声パターンを作り、同様
の手順によって作った一つ以上のパターンを重ね合わせ
て加算したものを標準パターンとし、未知入力音声も同
様に2値化し、標準パターンと重ね合わせて類似性を判
別し、最大類似の標準パターンを認識結果とすることを
特徴としたものである。以下、本発明の実施例に基づい
て説明する。 第1図は1本発明の一実施例を説明するための電気的ブ
ロック線図で2図中、1はマイク、2はパワー検出部、
3は音声区間検出部、4は2値化部、5はレジスタ、6
は加算部、7は標準パターン、8は重ね合わせ部、9は
類似度判定部、10は認識結果出力部で、まず、マイク
1から入った音声のパワー検出し、音声区間を求め、音
声区間に関する部分だけパワーを2値化する。パワー検
出は例えば音声波形の振幅の包絡を検波するなどして求
めれば良いし、音声区間の検出はパワー検出部2で求め
たパワーが一定値以上である部分として求められる。又
、2値化部は第2図(A)に示すパワー信号から(B)
に示す2値化情報の如く、音声パワーの形状が示される
部分を「1」、他を「0」で表わす方法で良い。この例
ではパワーの大きさを5段階に量子化しており(B)か
ら(A)の波形を連想することは容易である。標準パタ
ーン作成時にはスイッチSを
【標】側に倒し、一つの音
声例えば/ P a /を3回発声する。まず、1回目
発声パターンをレジスタ5に入れ、2回目のパターンと
重ね合わせ加算し、再びレジスタ5に入れる。次いで、
3回目のパターンとレジスタ5の内容が加算されて標準
パターンとして登録される。つまり第2図の(B)、(
C)、(D)のパターンの加算により標準パターン(E
)が作成されることになり、登録すべき各音声について
これをくり返した後認識に入る。認識の場合、未知の音
声がマイク1から入力され、標準パターン作成時と同じ
過程を経て2値化されたパターンが先に作られたいくつ
かの標準パターンと照合される。 照合は2値化されたパターンと標準パターンの一つが重
ね合わされて類似度を計算することになる。 この時の2値化された未知音声パターンは第2図(B)
と同じ形をしており、両者が類似の波形なら標準パター
ン(E)と重ね合わせることによって(B)のパターン
の「1」のエレメントは(E)の大きな値を示すエレメ
ントに重なることになる。 そこで類似度として両者の重ね合わせによって対応づい
たエレメント同士の積をとりそれらの和として定義して
も良い。こうして登録されている全ての標準パターンと
未知のパターンの類似度を求め、最大の類似度を得たも
のを認識結果として出力する。これによって2値化処理
した中にパワー情報を加えて類似度の計算ができるよう
になった。 しかし、パワーの情報だけによって音声を認識すること
は難しい。 第3図は、上記欠点を解消した他の実施例を示す電気的
ブロック線図で、この実施例は、前記実施例で作成した
パターンと他の特徴量により作成したパターンを合わせ
て用い、両方のパターン間で類似度を求め、一方の類似
度を他方の類似度に作用させて最終的な類似度を求める
ようにしたもので、ここでは、併用する他の方法として
従来技術として説明した2値のTSPを用いる方法を選
んだ。これは2値のTSPパワーパターンと共に2値化
処理されたもので、同じ演算が可能であるからであるが
勿論これ以外の方式と併用しても差し支えない、第3図
においては、音声区間検出部3で音声区間が切り出され
た後、パワー検出部2でパワー検出がなされ、一方では
同じ信号を特徴量変換部11にて特徴量変換を行なう、
特徴量は。 この実施例では、スペクトルが適している。パワーとス
ペクトルの形状を2値化部4で2値化する。この2値化
パターンではスペクトルパターンとパワーパターンを結
合して一つのパターンとする方が後の演算が容易である
。2値化部4でのパターンの例は第4図の如くなり、通
常のBTSPがF、第2図(B)のパターンに相当する
のがGである。これを第1図の例と同じ手順で類似度計
算して結果を引き出せば良い。この場合、類似度判定部
9ではパターンの大きさが大きくなったと考えれば手順
は何ら変る部分がなく、両者のパターンの和の類似度に
より結果を求めることになる。 これにより、第1図の例に比べ精度は最終的に向上する
。この場合、パワーかスペクトルのどちらかのパターン
にウェイトを置いて他を補助的手段として用いることが
できる。 第5図は、上述のごとき観点に立ってなされた実施例を
説明するための電気的ブロック線図で、この実施例によ
ると類似度を求める際、一方の類似度が特定の条件を満
たす或いは満たさない時のみ、他方の類似度も計算して
認識結果を決定することができる。この実施例は、第3
図に示した実施例と同様にスペクトルとパワーを結合し
た第4図の如きパターンを作り、これを何回か重ねて登
録しておく。認識時には2値化部4でできた未知入力パ
ワーのパワ一部とパワーパターン照合部12で照合して
類似性をみる。この類似性が大きく違っているものはス
ペクトル部の類似度を計算しないと判断部13で判断し
、次の標準パターンとの照合に移る。もし判断部13で
スペクトルパターンの類似度計算をすると判断されたも
のは第3図と同様にパターン間の類似度を求めることに
なる。この場合の類似度はパワ一部を含めて計算しても
含めずに計算しても良い。ここでの例はパターン全体の
パワーの比較になっているが、これは一つの音声パター
ン全体でなくパターン中のフレーム毎に行なっても良い
ことは勿論である。 肱−一来 以上の説明から明らかなように、本発明によると2値化
されたスペクトルパターンにもパワー情報が添加され音
声認識の精度を向上させることができる。
【図面の簡単な説明】
第1図は1本発明の一実施例を説明するための電気的ブ
ロック線図、第2図は、本発明の動作説明をするための
2値化パターンを示す図、第3図は、本発明の他の実施
例を説明するための電気的ブロック線図、第4図は、2
値化パターンの例を示す図、第5図は、本発明の他の実
施例を示す電気的ブロック線図である。 1・・・マイク、2・・・パワー検出部、3・・・音声
区間検出部、4・・・2値化部、5・・・レジスタ、6
・・・加算部、7・・・標準パターン、8・・・重ね合
わせ部、9・・・類似度判定部、1o・・・認識結果出
力部、11・・・特徴量変換部、12・・・パワーパタ
ーン照合部、13・・・判断部。 特許出願人  株式会社 リコー 第  1  図 第3図 第4図 F          G

Claims (3)

    【特許請求の範囲】
  1. (1)、音声の特徴量を抽出して、標準パターンとして
    保持しておき、未知入力音声の音声パターンと照合する
    ことによつて認識結果を決定する音声認識方式において
    、音声のエネルギー又はパワー形状を示す位置又はその
    近傍をそれ以外の部分と異なる符号によつて2値化して
    音声パターンを作り、同様の手順によつて作つた一つ以
    上のパターンを重ね合わせて加算したものを標準パター
    ンとし、未知入力音声も同様に2値化し、標準パターン
    と重ね合わせて類似性を判別し、最大類似の標準パター
    ンを認識結果とすることを特徴とする音声認識方式。
  2. (2)、上記パターンを他の特徴量により作成したパタ
    ーンと合わせて用い、各々の種類のパターン間で類似度
    を求め、一方の類似度と他方の類似度を作用させて最終
    的な類似性を判別して認識結果を決定することを特徴と
    する特許請求の範囲第(1)項に記載の音声認識方式。
  3. (3)、前記パターンを他の特徴量により作成したパタ
    ーンと合わせて用い、各々の種類のパターン間で類似度
    を求める際、一方の類似度が特定の条件を満たす時、又
    は満たさない時のみ他方の類似度も計算して認識結果を
    決定することを特徴とする特許請求の範囲第(1)項に
    記載の音声認識方式。
JP60207131A 1985-09-19 1985-09-19 音声認識方法及びその装置 Expired - Fee Related JP2601448B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP60207131A JP2601448B2 (ja) 1985-09-19 1985-09-19 音声認識方法及びその装置
US06/908,681 US4827519A (en) 1985-09-19 1986-09-17 Voice recognition system using voice power patterns

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60207131A JP2601448B2 (ja) 1985-09-19 1985-09-19 音声認識方法及びその装置

Publications (2)

Publication Number Publication Date
JPS6266300A true JPS6266300A (ja) 1987-03-25
JP2601448B2 JP2601448B2 (ja) 1997-04-16

Family

ID=16534704

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60207131A Expired - Fee Related JP2601448B2 (ja) 1985-09-19 1985-09-19 音声認識方法及びその装置

Country Status (1)

Country Link
JP (1) JP2601448B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01159697A (ja) * 1987-12-17 1989-06-22 Matsushita Electric Ind Co Ltd 音声認識装置
JPH04220699A (ja) * 1990-12-21 1992-08-11 Matsushita Electric Ind Co Ltd 音声認識方法
JPH04293095A (ja) * 1991-03-22 1992-10-16 Matsushita Electric Ind Co Ltd 音声認識方法
EP2161715A2 (en) 2008-09-03 2010-03-10 Sony Corporation Music processing method, music processing apparatus and program

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6019199A (ja) * 1983-07-13 1985-01-31 沖電気工業株式会社 音声認識方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6019199A (ja) * 1983-07-13 1985-01-31 沖電気工業株式会社 音声認識方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01159697A (ja) * 1987-12-17 1989-06-22 Matsushita Electric Ind Co Ltd 音声認識装置
JPH04220699A (ja) * 1990-12-21 1992-08-11 Matsushita Electric Ind Co Ltd 音声認識方法
JPH04293095A (ja) * 1991-03-22 1992-10-16 Matsushita Electric Ind Co Ltd 音声認識方法
EP2161715A2 (en) 2008-09-03 2010-03-10 Sony Corporation Music processing method, music processing apparatus and program
JP2010060836A (ja) * 2008-09-03 2010-03-18 Sony Corp 楽曲処理方法、楽曲処理装置、及びプログラム
EP2161715A3 (en) * 2008-09-03 2011-03-30 Sony Corporation Music processing method, music processing apparatus and program

Also Published As

Publication number Publication date
JP2601448B2 (ja) 1997-04-16

Similar Documents

Publication Publication Date Title
GB2208022A (en) Voice interval detection system
JPS6266300A (ja) 音声認識方法及びその装置
US4060695A (en) Speaker identification system using peak value envelop lines of vocal waveforms
WO2003010934A3 (en) Method of and means for recognizing signal edges
JPH01159697A (ja) 音声認識装置
JP2882791B2 (ja) パターン比較方式
JPS59121099A (ja) 音声区間検出装置
JP2844592B2 (ja) 離散単語音声認識装置
JPS61232499A (ja) 音声パターン照合方法
JP3031081B2 (ja) 音声認識装置
JPS6069699A (ja) 音声パタ−ン作成装置
JPS6126089A (ja) 音程検出装置
JPS6064397A (ja) 音声認識装置
JP2892004B2 (ja) 単語音声認識装置
JP2547541B2 (ja) 単音節音声認識装置
JPS6364099A (ja) 音声認識装置
JPS6048100A (ja) 音声認識装置
JPS59125800A (ja) 音声認識装置
JPS63128400A (ja) パターン比較方法
JPS62115498A (ja) 無声破裂子音識別方式
JPS62217298A (ja) 音声認識装置
JPS6193499A (ja) 音声パタ−ン照合方式
JPS60101598A (ja) 音声区間検出装置
JPS60125899A (ja) 音声認識装置
JPH05290201A (ja) 記録票読取装置の信号処理方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees