JPH03201079A - パターンマッチング装置 - Google Patents

パターンマッチング装置

Info

Publication number
JPH03201079A
JPH03201079A JP1339957A JP33995789A JPH03201079A JP H03201079 A JPH03201079 A JP H03201079A JP 1339957 A JP1339957 A JP 1339957A JP 33995789 A JP33995789 A JP 33995789A JP H03201079 A JPH03201079 A JP H03201079A
Authority
JP
Japan
Prior art keywords
pattern
category
score
normalized
matching
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP1339957A
Other languages
English (en)
Other versions
JPH07104952B2 (ja
Inventor
Shin Kamiya
伸 神谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1339957A priority Critical patent/JPH07104952B2/ja
Priority to US07/633,302 priority patent/US5181256A/en
Publication of JPH03201079A publication Critical patent/JPH03201079A/ja
Publication of JPH07104952B2 publication Critical patent/JPH07104952B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/16Speech classification or search using artificial neural networks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈産業上の利用分野〉 この発明は、動的計画法を用いたパターン認識の改良に
関する。
〈従来の技術〉 通常、同じ人が同じ単語を発声してもその長さはそのっ
ど変わり、しかも時間軸に非線形に伸縮する。すなわち
、時間軸に対する不規則な許容歪みを有するのである。
そのため、例えば音声認識の際において、標準パターン
と入力音声の特徴パターンとの同じ音素同士が対応する
ように時間軸を伸縮する必要がある。その具体的な手法
として動的計画法(DP)を用いることができる。DP
マツチングは、このDPを用いて特徴パターンと標準パ
ターンとの時間伸縮マツチングを行う手法であり、音声
認識においては重要な手法である。
近年、発明者等は、DPマツチングを応用して個人差に
よる音声信号の特徴パターン変動に対処する話者適応化
方式を提案しく中用、神谷、坂井:「音声スペクトルの
時間軸・周波数軸・強度軸の同時非線形伸縮に基づく不
特定話者の単語音声の認識」電子通信学会論文誌’81
/2 Vol、J64−D No。
2)、実験によってその有効性を認識した。
上記話者適応化方式は、個人差による特徴パターン変動
は主に周波数軸に対する不規IIIな許容歪みであるこ
とに注目して、DPを周波数伸縮マツチングに用いた方
式である。すなわち、キーワードとして単母音/a/を
発声し、この母音/a/の定常部におけるスペクトルと
標準話者の同じ母音/a/の定常部におけるスペクトル
とを、周波数軸上におけるDPマッチングによって比較
する。そして、標準話者と人力話者との母音/a/のス
ペクトルの周波数軸上のずれの方向を検出し、この検出
された単母音/a/のスペクトルの周波数軸上のずれの
方向を単語認識の際の話者適応化に利用するものである
〈発明が解決しようとする課題〉 しかしながら、上記話者適応化方式においては、単母音
/a/のスペクトルの周波数軸上のずれの方向のみなら
ず、そのずれの度合いもDPマツチングによって正規化
しようとすると、個人差のみならず音韻差まで正規化さ
れてしまい、個人差は除去できても単語が認識できない
場合が生じるという問題がある。
そこで、この発明の目的は、個人差等の許容歪みを有す
るパタ竺ンの許容歪みを必要な範囲で正規化することに
よって、許容歪みを有するパターンのカテゴリを正しく
認識できるパターン認識装置を提供することにある。
く課題を解決するための手段〉 上記目的を達成するため、この発明のパターン認識装置
は、入力された情報の特徴を表す特徴パターンと上記情
報が属するカテゴリを含む複数のカテゴリの夫々を代表
する標準パターンとのDPマツチングを行って、最適経
路に沿った距離の総和を表すDPスコアと上記最適経路
を行列パターンで表現したDPパス・パターンとを生成
するDPマッチング部と、上記DPマツチング部によっ
て生成された上記DPパス・パターンを構成する要素の
値が人力されて、上記特徴パターンが属するカテゴリと
上記標準パターンが属するカテゴリとが同一であるかを
識別して識別の程度を表す識別結果を出力するカテゴリ
識別ニューラル・ネットワークと、上記DPマッチング
部によって生成された上記DPスコアに対して上記カテ
ゴリ識別ニューラル・ネットワークから出力された識別
結果による補正を行って、上記特徴パターンにおける許
容歪みを正規化した正規化DPスコアを生成する正規化
DPスコア生成手段を備えたことを特徴としている。
く作用〉 ある情報の特徴を表す特徴パターンがDPマツチング部
に入力される。そうすると、このDPマツチング部にお
いて、上記情報が属するカテゴリを含む複数のカテゴリ
の夫々を代表する標準パターンと入力された上記特徴パ
ターンとのDPマツチングが行われる。そして、最適経
路に沿った距離の総和を表すDPスコアと上記最適経路
を行列パターンで表現したDPパス・パターンとが生成
される。こうして、上記DPマツチング部によって生成
された上記DPパス・パターンを構成する要素の値がカ
テゴリ識別ニューラル・ネットワークに入力される。そ
うすると、このカテゴリ識別ニューラル・ネットワーク
によって、上記特徴パターンが属するカテゴリと上記標
準パターンが属するカテゴリとが同一であるかが識別さ
れて、識別の程度を表す識別結果が出力される。
そして、上記DPマツチング部によって生成された上記
DPスコアおよび上記カテゴリ識別ニューラル・ネット
ワークからの識別結果が正規化DPスコア生生成段に入
力される。そうすると、この正規化DPスコア生成手段
によって上記DPスコアに対して上記識別結果による補
正が行われ、上記特徴パターンにおける許容歪みが正規
化された正規化DPスコアが生成される。
すなわち、上記カテゴリ識別ニューラル・ネットワーク
の識別能力に応じた度合で上記許容歪みが正規化された
正規化DPスコアが得られるのである。したがって、正
規化したい許容歪みの内容に応じた種類のDPマツチン
グを行い、かつ、正規化したい許容歪みの内容と正規化
したい程度に応じて、学習によって上記カテゴリ識別ニ
ューラル・ネットワークの識別能力を設定することによ
って、特徴パターンにおける正規化したい許容歪みのみ
が必要な範囲で正規化された正規化DPスコアが生成さ
れる。
〈実施例〉 以下、この発明を図示の実施例により詳細に説明する。
第1図はこの発明のパターン認識装置の一実施例を示す
ブロック図である。DPマツチング部lに音声波形ある
いは文字画像等の特徴を表す特徴パターンが入力される
。そうすると、後に詳述するようにして、標準パターン
格納部2に格納された標準パターンと人力された特徴パ
ターンとのDPマツチングが実施されてDPスコアとD
Pパス・パターンが求められて出力される。そして、D
Pババスパターンがカテゴリ識別ニューラル・ネットワ
ーク3に入力される一方、DPスコアが除算器4に人力
される。
上記カテゴリ識別ニューラル・ネットワーク3において
は、DPマツチング部lから人力されたDPパス・パタ
ーンに基づいて、特徴パターンのカテゴリが標準パター
ンのカテゴリに属しているかを識別する。そして、この
カテゴリ識別ニューラル・ネットワーク3からの識別結
果が除算器4に入力され、上記DPスコアとに基づいて
個人差が正規化された正規化DPスコアが算出される。
次に、上記DPマツチング部lによって実施されるDP
マツチングおよびカテゴリ識別ニューラル・ネットワー
ク3について、特徴パターンとして音声波形に基づく特
徴パターンを用いた場合を例に詳細に説明する。
上記DPマツチング部lに人力される特徴パターンは次
のようにして生成される。すなわち、音声波形をLチャ
ンネルのフィルタ・バンクで分析し、loms(フレー
ム)毎にサンプリングする。各フレームにおけるLチャ
ンネルの出力値は、各出力値の二乗和によって正規化さ
れて特徴パターンが生成される。以下、こうして求めら
れた各チャンネルの正規化値からなるチャンネル系列を
パワー・スペクトルと言う。こうして求められた二つの
音声波形に係るパワー・スペクトルをパワー・スペクト
ルAおよびパワー・スペクトルBとし、両パワー・スペ
クトルにおける各チャンネルの正規化された出力値を出
力値aiおよび出力値bj(但し、l≦l、j≦L)と
する。
いま、第2図に示すようなパワー・スペクトルA(例え
ば、標準パターン)とパワー・スペクトルI3(例えば
、人力された特徴パターン)に基づく平面を考える。両
パターンの周波数の対応付けは、この平面上の格子点c
−(i、j)の系列(パス)で表現できる。そうすると
、両パターン間の最適パス(以下、DPババス言う)に
沿った距離の総和G(以下、DPスコアと言う)の値は
、DPマツチングによって(1)式に示される部分和g
(i、Dの値を整合窓の範囲内でi、jを増加させなが
ら繰り返し計算することによって求められる。
G=g(L、L)/2L 7こだし、d(i、j)−1ai−bj(1)式に基づ
いて算出されるDPスコアの値が小さいほど両パターン
間のDPパスに沿った距離の総和が小さく、両パターン
は整合窓の範囲内で周波数伸縮を行った場合によく似た
形状を有するパターンであると言える。つまり、DPス
コアは両パターンが同じカテゴリに属している度合いを
表しているのである。
第3図は(1)式に基づいて求められたDPスコアを与
える格子点c(i、j)の系列、すなわちDPパスを表
現するための行列パターン(以下、このようなりPパス
を表現する行列パターンをDI)バス・パターンと言う
)の−例を示す。このDPパス・パターンは、1つのa
lに1つのbjが対応する(すなわち、g(i、j)が
ただ一つ存在する)場合には、格子点c(ij)に“2
”を与える。また、1つのaiに2つのbjが対応する
(すなわち、g(i、j)が二つ存在する: g(i、
j+)−g(+、jt))場合には、格子点C(i、j
+)とc(i、j、)とに“1”を与え、経路上にない
格子点C(i 、 j)には“0”(第3図においては
記載を省略)を与えたものである。こうして、DPパス
・パターンは(LXL)次元のベクトルとして表される
のである。
第3図のDPババスパターンにおいては、“2”が与え
られた格子点(i、j)がほぼ対角線上に数多くあるた
め、二つのパワー・スペクトルのパターンは周波数軸上
でよく対応付けられていると言える。
ところで、上述のように、同じ音素カテゴリに属する特
徴パターンであっても、話者によっては周波数軸上にお
ける許容歪みを有している。ところが、個人差による周
波数軸上の許容歪みを正規化するためにDPマツチング
における整合窓の範囲を必要以上大きくすると、上述の
ように音韻差までが正規化されてしまうのである。
そこで、この発明においては、ニューラル・ネットワー
クによって、入力された特徴パターンのカテゴリが標準
パターンのカテゴリに属しているかを上記DPパス・パ
ターンに基づいて周波数軸上の歪みを加味して識別し、
その識別結果を用いて上記DPスコアを補正することに
よって個人差を必要な範囲で正規化するのである。
次に、第1図において、入力された音声の特徴パターン
のカテゴリが標準パターンのカテゴリに属しているかを
識別するためのカテゴリ識別ニューラル・ネットワーク
3について詳細に説明する。
第4図はカテゴリ識別ニューラル・ネットワーク3の概
略構成図である。このカテゴリ識別ニューラル・ネット
ワーク3は入力層11.中間層12および出力層13の
3層からなる多層パーセプトロン型ニューラル・ネット
ワークである。入力層11には(LXL)個のノードを
設ける一方、中間層12には6個のノードを設ける。そ
して、中間層12の各ノードと入力層IIの全ノードと
を結合する。さらに、出力層13には1個のノード14
を設け、このノード14を中間層13の全ノードと結合
する。各ノード間の結合には結合の重みを付加し、この
結合の重みの値は学習によって決定する。
」二記入力層11における(LXL)個のノードには、
上記(LXL)次元ベクトルであるDPパス・パターン
の各要素値を人力する。
上述のカテゴリ識別ニューラル・ネットワーク3におけ
る結合の重みの学習は誤差逆伝播法によって実施する。
まず、次のようにして学習用データを作成する。
各音韻カテゴリ毎に、その音韻カテゴリに属するi番目
の特徴パターン(パワー・スペクトル)と標準パターン
(その音韻カテゴリを代表するパワー・スペクトル)と
のDPマツチングを行い、上述のようなりPパス・パタ
ーンTPATHiを求める。さらに、各音韻カテゴリ毎
に、その音韻カテゴリに類似したカテゴリ属するj番目
の特徴パターンとその音韻カテゴリの標準パターンとの
DPマツチングを行い、DPパス・パターンFPATI
ljを求める。
そして、このDPパス・パターンTPATHiおよびD
Pパス・パターンFPATHjを学習データとするので
ある。
次に、上述のような学習データを用いて以下のように学
習を実施する。まず、同一カテゴリに属する2つのパタ
ーンから求めたDPパス・パターンTPAT!Iiの要
素値を入力層11のノードに入力する。その際には、出
力層13のノード14には教師データ“l”を入力する
。さらに、互いに類似したカテゴリに属する2つのパタ
ーンから求めたDPパス・パターンFPATHjの各要
素値を入力層I+のノードに入力する。その際には、出
力層13のノード14には教師データ“0″を入力する
。そうすると、カテゴリ識別ニューラル・ネットワーク
3は、入力されたPDパス・パターンに係る特徴パター
ンと標準パターンとが同一のカテゴリに属する場合には
出力層13のノード14から“l”を出力する一方、同
一のカテゴリに属さない場合にはノードI4から“0”
を出力するように各結合の重みの値を自動的に決定する
のである。
その際に、年令、性別、言語環境0発声癖等を異にする
多くの話者におけるDPパス・ノくターンTPATli
およびDPパス・パターンPPATHjを学習データと
して用いることによって、話者によらず特徴7くターン
が属するカテゴリと標準パターンが属するカテゴリとが
同一であるかを識別できるのである。
上述のような学習によって結合の重みが決定されたカテ
ゴリ識別ニューラル・ネットワーク3は、次のようにし
て入力音声の特徴パターンの属するカテゴリと標準パタ
ーンの属するカテゴリとが同じであるかを識別するので
ある。すなわち、入力層11の(L X L)個のノー
ドに、特徴ノくターンと標準パターンとのDPマツチン
グによって求められた(LXL)次元ベクトルのDPE
<ス・7<ターンを人力する。そうすると、カテゴリ識
別ニューラル・ネットワーク3の各ノードは、学習によ
って決定された結合の重みを用いて所定の出力関数に従
って出力値の算出を行い、算出結果を上層の結合された
ノードに出力する。
その結果、出力層13のノード14からは、特徴パター
ンが属するカテゴリと標準パターンが属するカテゴリと
が全く同一であると識別した場合を“1”とする一方全
く異なると識別した場合を“0”として、識別の程度に
応じた0乃至1の値を識別結果として出力するのである
次に、第1図および第4図に従って、上記DPマッチン
グ部1におけるDPマツチング結果とカテゴリ識別ニュ
ーラル・ネットワーク3における識別結果とに基づいて
実施される正規化DPスコア算出の一連の動作について
述べる。
既に述べたように、上記DPマツチング部lに人力音声
から求められたパワー・スペクトルが特徴パターンとし
て人力される。そうすると、DPマッチング部1は、標
準パターン格納部2に格納されている標準パターンを読
み出し、上述のようにして、特徴パターンと標準パター
ンとにおける周波数伸縮DPマツチングを行ってDPス
コアとDPパス・パターンを生成する。このDPスコア
は、上記DPマツチングを実施する際に設定された整合
窓の制限内において両パターンが同じカテゴリに属して
いる度合いを表していると言える。
ところが、上記整合窓の範囲が必要以上に大きい場合に
(よ音韻差まで正規化されてしまい、DPスコアによっ
て特徴パターンと標準パターンとのカテゴリの同一性を
論することができなくなる。そこで、カテゴリ識別ニュ
ーラル・ネットワーク3による識別結果を用いて、次の
ようにしてDPスコアを補正するのである。
上述のように、上記カテゴリ識別ニューラル・ネットワ
ーク3の入力層11の(LXL)個のノードに、DPマ
ツチング部Iによって得られた(LXL)次元ベクトル
のDPパス・パターンを入力する。そうすると、カテゴ
リ識別ニューラル・ネットワーク3は、結合の重みを用
いて上述のようにして特徴パターンの属するカテゴリが
標準パターンの属するカテゴリと同じであるかを識別し
、出力層13のノードI4から識別の程度に応じた0乃
至lの出力値を出力する。
次に、このカテゴリ識別ニューラル・ネットワーク3か
らの出力値とDPマツチング部lからのDPスコアとが
除算器4に入力される。そして、DPスコアの値をカテ
ゴリ識別ニューラル・ネットワーク3の出力値で除し、
その結果得られた値を正規化DPスコアとして出力する
すなわち、カテゴリ識別ニューラル・ネットワーク3か
らの識別結果によって、特徴パターンの属するカテゴリ
と標準パターンの属するカテゴリとが同一でない度合い
に応じてDPスコアの値を大きくするのである。こうす
ることによって、整合窓の範囲が不必要に大きく設定さ
れたDPマツチング部lによって、異なるカテゴリに属
する特徴パターンと標準パターンが同じカテゴリに属す
ると誤認されることが回避できる。つまり、DPマツチ
ングによる個人差(すなわち、周波数軸に対する許容歪
み)を正規化する際の度合を自動的に設定するのである
。こうすることによって、周波数伸縮範囲を大きくして
個人差を正規化しようとすると音韻差までも正規化され
てしまうというDPマツチングの短所が補正される。一
方、認識の信頼度やマツチング距離に用いることができ
るような中間的な値が出にくいというニューラル・ネッ
トワークの短所も補正されるのである。
換言すれば、正規化DPスコアは、認識の信頼度やマツ
チング距離として使用でき、かつ、話者によらない認識
結果を得ることができる優れた評価値であると言える。
したがって、正規化DPスコアを用いることによって話
者によらない正しい音声認識を容易に実行できるのであ
る。
上述のように、本実施例においては、DPマツチング部
lによって、人力音声波形から得られた特徴パターン(
パワー・スペクトル)と標準パターンとの周波数伸縮D
Pマツチングを行ってDPスコアとDPパス・パターン
を求める。次に、カテゴリ識別ニューラル・ネットワー
ク3によって、DPマツチング部lによって得られたD
Pパス・パターンを入力として特徴パターンの属するカ
テゴリと標準パターンの属するカテゴリとが同一である
かを識別し、識別の程度に応じた識別結果を得る。そし
て、除算器4において、DPスコアに識別結果による補
正を行うことによって個人差が必要範囲で正規化された
DPスコアすなわち正規化DPスコアを得るのである。
したがって、本実施例を用いれば、認識の信頼度やマツ
チング距離として使用可能な中間値を有すると共に個人
差を正規化した正規化DPスコアに基づいて、入力音声
の特徴パターンを正しく認識できる。
上記実施例におけるカテゴリ識別ニューラル・ネットワ
ーク3は3層のパーセプトロン型ニューラル・ネットワ
ークで構成しているが、この発明のカテゴリ識別ニュー
ラル・ネットワーク3はいかなる構造のニューラル・ネ
ットワークであっても構わない。また、学習方法も誤差
逆伝播法に限定されるものではなく、ニューラル・ネッ
トワークの構造に応じた学習方法であればよい。
上記実施例の説明においては、DPマツチング部lにお
けるDPマツチングとして周波数伸縮マツチングを例と
して説明している。しかしながら、この発明はこれに限
定されるものではない。すなわち、特徴パターンが有す
る許容歪みの内容に応じて、例えば時間伸縮マツチング
あるいは空間位置を伸縮する空間位置伸縮マツチング等
を用いてもよい。また、例えば時間伸縮マツチングと周
波数伸縮マツチングとを併用してもよい。
」二足実施例においては、人力音声波形の特徴パターン
を認識する場合を例に上げて説明している。
しかしながら、この発明はこれに限定されるものではな
く、文字画像の特徴パターンを認識する際に用いても何
等差し支えない。その際には、DPマツチング部lにお
けるDPマツチングとして上記空間伸縮マツチングを用
いればよい。
〈発明の効果〉 以上より明らかなように、この発明のパターン認識装置
は、DPマツチング部、カテゴリ識別ニューラル・ネッ
トワークおよび正規化DPスコア生生成を有して、上記
DPマツチング部で特徴パターンと標準パターンとに係
るDPスコアおよびDPパス・パターンを生成し、上記
カテゴリ識別ニューラル・ネットワークで上記特徴パタ
ーンの属するカテゴリが上記標準パターンの属するカテ
ゴリと同一であるかを上記DPババスパターンに基づい
て識別し、上記正規化DPスコア生生成で上記カテゴリ
識別ニューラル・ネットワークからの識別結果と上記D
Pスコアとに基づいて正規化DPスコアを生成するよう
にしたので、上記カテゴリ識別ニューラル・ネットワー
クの識別結果に応じて上記特徴パターンの許容歪みが必
要な範囲で正規化された正規化DPスコアが得られる。
したがって、正規化したい許容歪みの内容に応じてDP
マッチングの種類を選択し、かつ、正規化したい許容歪
みの内容と正規化したい程度に応じて上記カテゴリ識別
ニューラル・ネットワークの識別能力を設定すれば、特
徴パターンにおける正規化したい許容歪みのみが正しく
正規化された正規化DPスコアが生成される。
すなわち、この発明に係る上記正規化DPスコアを用い
れば、個人差等の許容歪みを含むパターンの属するカテ
ゴリを正しく認識できる。
【図面の簡単な説明】
第1図はこの発明のパターン認識装置における一実施例
のブロック図、第2図はDPパス・パターンのひな型を
示す図、第3図はDPパス・パターンの一具体例を示す
図、第4図はカテゴリ識別ニューラル・ネットワークの
概略構造の一例を示す図である。 ■・・・DPマツチング部、 2・・標準パターン格納部、 3・・・カテゴリ識別ニューラル・ネットワーク、4・
・除算器、        11・・・入力層、12・
・・中間層、       13・・・出力層、14・
・・ノード。

Claims (1)

    【特許請求の範囲】
  1. (1)入力された情報の特徴を表す特徴パターンと上記
    情報が属するカテゴリを含む複数のカテゴリの夫々を代
    表する標準パターンとのDPマッチングを行って、最適
    経路に沿った距離の総和を表すDPスコアと上記最適経
    路を行列パターンで表現したDPパス・パターンとを生
    成するDPマッチング部と、 上記DPマッチング部によって生成された上記DPパス
    ・パターンを構成する要素の値が入力されて、上記特徴
    パターンが属するカテゴリと上記標準パターンが属する
    カテゴリとが同一であるかを識別して識別の程度を表す
    識別結果を出力するカテゴリ識別ニューラル・ネットワ
    ークと、上記DPマッチング部によって生成された上記
    DPスコアに対して上記カテゴリ識別ニューラル・ネッ
    トワークから出力された識別結果による補正を行って、
    上記特徴パターンにおける許容歪みを正規化した正規化
    DPスコアを生成する正規化DPスコア生成手段を備え
    たことを特徴とするパターン認識装置。
JP1339957A 1989-12-28 1989-12-28 パターンマッチング装置 Expired - Fee Related JPH07104952B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP1339957A JPH07104952B2 (ja) 1989-12-28 1989-12-28 パターンマッチング装置
US07/633,302 US5181256A (en) 1989-12-28 1990-12-24 Pattern recognition device using a neural network

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1339957A JPH07104952B2 (ja) 1989-12-28 1989-12-28 パターンマッチング装置

Publications (2)

Publication Number Publication Date
JPH03201079A true JPH03201079A (ja) 1991-09-02
JPH07104952B2 JPH07104952B2 (ja) 1995-11-13

Family

ID=18332367

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1339957A Expired - Fee Related JPH07104952B2 (ja) 1989-12-28 1989-12-28 パターンマッチング装置

Country Status (2)

Country Link
US (1) US5181256A (ja)
JP (1) JPH07104952B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006171714A (ja) * 2004-11-22 2006-06-29 Institute Of Physical & Chemical Research 自己発展型音声言語パターン認識システム、そのシステムで用いられる自己組織化ニューラルネットワーク構造の構築方法及びその構築プログラム
JP2007279742A (ja) * 2006-04-06 2007-10-25 Toshiba Corp 話者認証確認方法及び装置

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5697369A (en) * 1988-12-22 1997-12-16 Biofield Corp. Method and apparatus for disease, injury and bodily condition screening or sensing
JPH04194999A (ja) * 1990-11-27 1992-07-14 Sharp Corp 学習を用いた動的計画法
JP3066920B2 (ja) * 1991-06-11 2000-07-17 キヤノン株式会社 音声認識方法及び装置
US5293456A (en) * 1991-06-28 1994-03-08 E. I. Du Pont De Nemours And Company Object recognition system employing a sparse comparison neural network
US5355313A (en) * 1991-10-25 1994-10-11 Texaco Inc. Neural network interpretation of aeromagnetic data
JP3349196B2 (ja) * 1992-06-20 2002-11-20 テキサス インスツルメンツ インコーポレイテツド 対象識別システムおよび方法
TW222337B (ja) * 1992-09-02 1994-04-11 Motorola Inc
DE69332555D1 (de) 1992-09-04 2003-01-23 Canon Kk Verfahren und Vorrichtung zur Anzeige von Zeichen
US6697524B1 (en) 1992-09-04 2004-02-24 Canon Kabushiki Kaisha Information processing method and apparatus
JP2522154B2 (ja) * 1993-06-03 1996-08-07 日本電気株式会社 音声認識システム
JP2673871B2 (ja) * 1993-08-26 1997-11-05 日本アイ・ビー・エム株式会社 ニューラル・ネットワークによるパターン認識方法及び装置
US6052481A (en) * 1994-09-02 2000-04-18 Apple Computers, Inc. Automatic method for scoring and clustering prototypes of handwritten stroke-based data
IL113204A (en) * 1995-03-30 1999-03-12 Advanced Recognition Tech Pattern recognition system
US6453284B1 (en) * 1999-07-26 2002-09-17 Texas Tech University Health Sciences Center Multiple voice tracking system and method
US7593842B2 (en) * 2002-12-10 2009-09-22 Leslie Rousseau Device and method for translating language
US20050071226A1 (en) * 2003-09-30 2005-03-31 Visa U.S.A. Inc. Method and system for managing dynamic terms and conditions and user interaction

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63308685A (ja) * 1987-06-10 1988-12-16 Nec Corp パタンの相違度検出方式
JPH01241667A (ja) * 1988-03-23 1989-09-26 Nec Corp 学習機構を有するダイナミック・ニユーラル・ネットワーク

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58129684A (ja) * 1982-01-29 1983-08-02 Toshiba Corp パタ−ン認識装置
JPH0690666B2 (ja) * 1985-09-06 1994-11-14 株式会社日立製作所 弁別ネツトワ−クの動的変形方法
US5073955A (en) * 1989-06-16 1991-12-17 Siemens Aktiengesellschaft Method for recognizing previously localized characters present in digital gray tone images, particularly for recognizing characters struck into metal surfaces
US5067164A (en) * 1989-11-30 1991-11-19 At&T Bell Laboratories Hierarchical constrained automatic learning neural network for character recognition
US5052043A (en) * 1990-05-07 1991-09-24 Eastman Kodak Company Neural network with back propagation controlled through an output confidence measure

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63308685A (ja) * 1987-06-10 1988-12-16 Nec Corp パタンの相違度検出方式
JPH01241667A (ja) * 1988-03-23 1989-09-26 Nec Corp 学習機構を有するダイナミック・ニユーラル・ネットワーク

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006171714A (ja) * 2004-11-22 2006-06-29 Institute Of Physical & Chemical Research 自己発展型音声言語パターン認識システム、そのシステムで用いられる自己組織化ニューラルネットワーク構造の構築方法及びその構築プログラム
JP2007279742A (ja) * 2006-04-06 2007-10-25 Toshiba Corp 話者認証確認方法及び装置

Also Published As

Publication number Publication date
US5181256A (en) 1993-01-19
JPH07104952B2 (ja) 1995-11-13

Similar Documents

Publication Publication Date Title
JPH03201079A (ja) パターンマッチング装置
EP0342630B1 (en) Speech recognition with speaker adaptation by learning
JP3066920B2 (ja) 音声認識方法及び装置
Cole et al. Speaker-independent recognition of spoken English letters
JP3521429B2 (ja) ニューラルネットワークを用いた音声認識装置およびその学習方法
CN118588087A (zh) 一种基于融合特征降维的Fca-ProRes2Net说话人识别方法
JP3014177B2 (ja) 話者適応音声認識装置
JPH0486899A (ja) 標準パターン適応化方式
CA2203649A1 (en) Decision tree classifier designed using hidden markov models
Sunny et al. Feature extraction methods based on linear predictive coding and wavelet packet decomposition for recognizing spoken words in malayalam
US5581650A (en) Learning dynamic programming
JPH03201027A (ja) 学習を用いた動的計画法
Chelliah et al. Robust Hearing-Impaired Speaker Recognition from Speech using Deep Learning Networks in Native
JPH01241667A (ja) 学習機構を有するダイナミック・ニユーラル・ネットワーク
JP2655902B2 (ja) 音声の特徴抽出装置
JPH05204399A (ja) 不特定話者音素認識方法
JP2991752B2 (ja) 音声認識装置
JP3090204B2 (ja) 音声モデル学習装置及び音声認識装置
JPH02259698A (ja) 話者適応化装置
JP2877450B2 (ja) 神経回路網を用いたパターン認識装置
JP2000122693A (ja) 話者認識方法および話者認識装置
KR100211113B1 (ko) 카오스 순환신경회로망을 이용한 학습방법 및 음성인식방법
Amornkul et al. Addable stress speech recognition with multiplexing hmm: Training and non-training decision
Kocsor et al. A segment-based statistical speech recognition system for isolated/continuous number recognition
JPH0247758B2 (ja)

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees