JPH02293799A - 音声認識システム - Google Patents

音声認識システム

Info

Publication number
JPH02293799A
JPH02293799A JP1112818A JP11281889A JPH02293799A JP H02293799 A JPH02293799 A JP H02293799A JP 1112818 A JP1112818 A JP 1112818A JP 11281889 A JP11281889 A JP 11281889A JP H02293799 A JPH02293799 A JP H02293799A
Authority
JP
Japan
Prior art keywords
data
neuron
output
layer
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1112818A
Other languages
English (en)
Inventor
Makoto Yamamoto
誠 山本
Koji Matsumoto
幸治 松本
Ryohei Kumagai
熊谷 良平
Sunao Takatori
直 高取
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
TAKAYAMA KK
Original Assignee
TAKAYAMA KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by TAKAYAMA KK filed Critical TAKAYAMA KK
Priority to JP1112818A priority Critical patent/JPH02293799A/ja
Priority to AT90906368T priority patent/ATE159601T1/de
Priority to DE69031621T priority patent/DE69031621T2/de
Priority to EP90906368A priority patent/EP0457909B1/en
Priority to PCT/JP1990/000535 priority patent/WO1990013874A1/ja
Publication of JPH02293799A publication Critical patent/JPH02293799A/ja
Priority to US08/461,538 priority patent/US5553196A/en
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は音声認識システムに関する。
〔従来の技術〕
従来の音声認識システムの手法としてはDPマッチング
が最も実用段階に近く、母音、子音を含めた音韻におい
て平均85%の確率で認識を得たという報告がある。
〔発明が解決しようとする課題〕
DPマッチングでは入力音声の周波数およびパワーの特
徴を抽出し、音韻標準パターンとのパターンマッチング
により認識を行っており、パターンマッチングのルール
は予め人為的に設定しておく必要がある。一般にこのル
ール設定はサンプリングデータに基づいて行わねばなら
ず、ルールの適用範囲には限界がある。
本発明はこのような従来の問題点を解消すべく創案され
たもので、多様な入力音声の認識が可能であり、かつ認
識率を高め得る音声認識システムを提供することを目的
とする。
〔課題を解決するための手段〕
本発明に係る音声認識システムは、入力音韻に対応した
デジタルデータパターンを生成する入力部と、この入力
部で生成されたデジタルデータパターンの特徴を抽出す
る特徴処理部と、入力されたデータに所定の重みを乗じ
たものの総和と闇値との比較結果に応じたデータを出力
するニューロンが並列的に設けられるとともに、上記特
徴処理部から得られた抽出データの抽象度に応じた層構
造のニューラルレイヤを有し、その抽出データに基づい
て音声認識を行う認識部とを備え、いわゆるニューラル
ネットワークにより主要な認識を行うものである。
〔作用〕
特徴抽出部により得られた入力音韻の特徴を示す抽出デ
ータは、認識部のニューラルレイヤのニューロンに入力
され、これにより音声認識が行われる。すなわち音声認
識は、音声の特徴データをニューラルネットワークによ
り処理することにより行われるので、このニューラルネ
ットワークの学習機能および連想機能により音声認識率
が高められる。
〔実施例〕
以下図示実施例に基づいて本発明を説明する。
第1図において、音声認識システムは、入力音韻に対応
したデジタルデータパターンを生成する人力部200と
、特徴処理部300と、認識部l00と、システムメモ
リ400とを備え、これらはシステムバスBを通じて相
互に接続されるとともに、CPU500に接続されてい
る。入力部200にはマイクロフォン等の入力機器とI
/Oとを含み、I/Oには適宜、データ圧縮手段、デー
タ保持のためのメモリ等が含まれる。特徴処理部300
は特徴抽出を行う処理部310と、入力部200で生成
されたデジタルデータパターンを保持するメモリ330
とを備え、所望により内部に人力部34’Oが設けられ
る。認識部100は、後に詳述するように、特徴処理部
300で得られた抽出データに基づいて音声認識を行う
ものであり、ニューロンからなる複数層のニューラルレ
イヤが構築され、このニューラルレイヤの出力データを
記憶するメモリを備える。
第2図は特徴処理部300における処理部3lOを示す
ものである。処理部310は、メモリ330からマルチ
プレクサ311を介して選択的に取り込んだデータをロ
ーカルバスLBを通じてシリアル/パラレル変換部31
2に転送している。
変換部312は所定バイト単位(例えば数lOバイト)
でデータを保持し、これらのデータを並列に演算部32
0に入力する。演算部320は数値演算部321および
状態演算部325を有し、シリアル/パラレル変換部3
12の出力は数値演算部321に入力される。数値演算
部321は乗算部322、セレクタ323、統合部32
4を順次接続してなり、微分その他のオペレータ処理は
数値演算部321において行われる。数値演算は例えば
入力音韻の各パワーレヘルに乗数を乗じた後にこれを数
値的に統合する処理を行うが、同一のデータには異なる
絶対値の乗数が掛けられることはないという発明者の知
見に基づき最前段に乗算部322が配置されている。こ
れによって乗算部のカーネル数は同時処理バイト数に等
しい最小値とすることができ、これにともなって後段の
セレクタ323、統合部324のゲート数も減少する。
したがって数値演算部321は小規模回路で最大限の機
能をもつことができ、処理速度も高速化される。
数値演算部321内のデータは状態演算部325に導か
れ、状態演算部325は所定時間内のデータに対し次の
ような判断または演算を行う。
a)パワーの急激な変化等セグメントに有効な特徴。
b)周波数、パワーの極大値等音韻の中心フレーム検出
に有効な特徴。
C)その他。
このように数値演算とともに状態演算を並列的にしかも
別回路で行うことにより、各回路の効率化と高速化を図
ることができる。また状態演算部325の出力はそれ自
体が有効な特@1であり、あるいは特徴量抽出のための
有効なデータである。
状態演算部325の出力は変換部313に入力され、さ
らに特徴抽出や、積算、比較などの処理により特徴量が
求められる。
変換部313はスタティックRAMなどの高速メモリの
出力の分岐にフルアダーなとの軽演算部を接続し、この
軽演算部の出力を高速メモリのデータ入力にフィードバ
ックしてなるものである。
このような構成により、同一データに同一演算を繰り返
し施したり、データの積算、データの逐次比較等の複雑
な演算を小規模の回路において高速で行うことができる
演算部320、変換部313の出力は出力側のローカル
バスLBを通じてメモリ330のいずれかに戻されてい
る。
出力側のローカルバスLBにはさらに逐次処理部314
が接続され、フィードバック的な逐次処理はこの逐次処
理部で行われる。逐次処理部314はラインメモリとラ
ッチと論理部を備え、処理対象データ以前の一定時間内
の処理後データを参照しつつ、逐次処理を行う。
このような処理部においては、極めて多様な特徴量を高
速で求めることができ、認識部100に貴重な特徴量を
供給し得る。なおメモリ330としてデュアルポートメ
モリを採用すれば、データの読出し、書込みを極めて高
速で行い得る。
次に認識部100の構成を第3図に基づいて説明する。
認識部100は、システムバスBを介して、または認識
部100に直接接続された入力系、すなわち特徴処理部
300から入力されたデータを処理し、処理結果を最終
出力データとして、データメモリ110に出力する。
認識部100にはニューラルネットワークが構築される
。ここでニューラルネットワークについて簡単に説明す
ると、ニューラルネットワークは、第4図に示すニュー
ロン1を、第5図に示すように並列に設けて層状に構成
するとともに、他の層あるいは同じ層のニューロンに接
続して構築される。ニューロン1は相互に接続されてデ
ータの授受を行い、最終段の層のニューロンから最終出
力データが得られる。ニューロン1におけるデータ処理
において、外部または他のニューロンから入力されるデ
ータIII.、DIg、Dh、・・・DIfiにはそれ
ぞれ重みW,SW.、W3、・・・Wllが掛けられ、
これらの総和と閾値θとが比較される。
一8ー この比較方法としては種々のものが可能であるが、例え
ば、この総和が閾値θ以上の時出力データDOが「1」
となり、またこの総和が閾値θより小さい時出力データ
DOがrQJとなるように定められる。すなわち、 DO=f{(Σ(Wi XDIi )一θ}  (l)
であり、ここでfは正規化関数である。
認識部100は、ニューラルネットワークにおける連想
の作用を為す出力データ生成部120を有し、出力デー
タ生成部120においては、各ニューロンについての線
型1値関数(ΣW,A,θ)の演算が行われる。出力デ
ータ生成部120の各部はCPU5 0 0によって制
御される。
W.A,の乗算は出力データ生成部120における乗算
回路121において実行される。1回毎のW,A,の演
算結果は順次積算回路122に入力され、ΣW,A.の
演算が行われる。積算回路122は、加算回路104に
フリップフロップ105を帰還的に接続してなり、加算
結果を一旦フリップフロップ105に保持したのち、次
のW,A.の入力と保持された加算結果とを加算してい
くことにより積算を行う。ΣW,Aえの演算結果は闇値
処理部123に入力され、(ΣWよA,一〇)の演算が
行われる。さらに闇値処理部123においては、(ΣW
,A.−θ)の演算結果を正規化する等の処理を行い、
出力データとする。(ΣW.A+−θ)の演算結果はバ
ッファ106を介してデータメモリ110に入力される
乗算回路121には重みのデータと、入力あるいは出力
データとが並列的に入力されるため、2系統の入力ライ
ンを有するが、バッファ106はそのうちの一方の入力
ラインに接続され、この入力ラインは入出力双方向のラ
インとして使用される。バッファ106は、データメモ
リ110から乗算回路121にデータが転送される際に
はハイインピーダンスとなる。
各二二一ラルレイヤのデータは、第1層については0次
入カデータおよび第1ニューラルレイヤの重みが入力さ
れ、第2層については1次出力データおよび第2ニュニ
ラルレイヤの重みが入力さ9一 れる。すなわち第nニューラルレイヤの出力(n次出力
データ)は第(n+1)ニューラルレイヤの入力となる
。データメモリ110において、重みのデータはシナプ
ス重みエリア111に格納され、入出力データは入出力
データエリア112に格納される。また闇値処理部12
3に設定すべき各ニューロンの闇値は、データメモリ1
10またはシステムメモリ101に格納され、各ニュー
ロンについての演算を開始する前に闇値処理部l23に
転送される。
実際にニューラルネットワークによって実行される処理
内容は極めて複雑であるが、極めて単純な論理演算が実
行されると仮定して、本発明のニューラルネットワーク
の第1実施例を説明するとともに、本発明の第1の基本
理念を解説する。
第6図(a)、(b)、(c)は学習の結果、A・(B
十C)          (2)の論理演算が実行さ
れるに到ったニューラルネットワークを示すものである
。第6図(a)、(b)は比較例を示し、第6図(C)
はニューラルネットワークの第1実施例を示す。
第6図(a)は、初段のニューラルレイヤ20にデータ
群10におけるA..B,Cの3データの全ての組合せ
の数23=8個のニューロン21〜28が設けられ、第
2段のニューラルレイヤ30に初段ニューロン21〜2
8の出力のOR(論理和)を演算する1個のニューロン
31が設けられた構成を示している。図中、ニューロン
21〜28の上に付したrooOJなどの数値はデータ
A、B,Cよりなるビットパターンを示し、これらのニ
ューロンはこのビットパターンが人力されるときに出力
「1」を出力する。このニューラルネットワークにおい
ては、ニューロン数が9、シナプス数が32であり、ニ
ューロンおよびシナブスの効率が極めて低く、所要メモ
リ容量が大であるとともに、処理時間も大である。
第6図(b)は(2)式を以下のように展開し、A−B
  +  A−C         (3)演算の単純
化を図った例であり、初段ニューラルレイヤ20は、A
−Bの演算を処理するためのニ−1 2一 ューロン21、A−Cの演算を処理するためのニューロ
ン22を備える。第2段のニューラルレイヤ30はニュ
ーロン21、22の出力のORを求めるニューロン31
を有する。
ニューロン21においては、データASB,Cに対する
重みW1〜W3は、例えばW+=1、W2=1、W3一
〇に設定され、 AW l+BWt +CW 3≧2    (4)のと
きに出力「1」を出力する。したがってこの場合、閾値
θ=2とされる。同様に、ニューロン22では、W4=
1、W,=0、Wb =1 , θ;2となる。一方ニ
ューロン31では、w7=1、Wll冨1、θ=1とな
る。
第6図(b)のニューラルネットワークにおいて、ニュ
ーロン数は3、シナプス数は8であり、第6図(a)の
ニューラルネットワークに比較すれば、大幅にニューロ
ン効率、シナプス効率が向上している。しかし、次に述
べるように本発明によれば、さらにこれらの効率が向上
する。
第6図(C)は本発明のニューラルネットワ−クの第1
実施例を示すもので、この構成は、初段ニューラルレイ
ヤ20および第2段ニューラルレイヤ30を有し、初段
ニューラルレイヤ20にはデータB,Cのみが入力され
、そして第2段ニューラルレイヤ30には、データAが
直接入力される。初段ニューラルレイヤ20には、(B
+C)の演算を行うための1個のニューロン2lが設ケ
られ、第2段ニューラルレイヤ30には、A・ (B+
C)の演算を行うための1個のニューロン31が設けら
れる。ニューロン21は、例えば重みW1=1、W2=
1、θ−1に設定され、BWI +CW,≧1    
    (5)のとき出力「l」を出力する。一方ニュ
ーロン31は、例えば、W3=1、W4=1、θ=2に
設定され、ニューロン2lの出力をY1とすると、YI
W3 +AW4≧2       (6)のとき、出力
「l」を出力する。この実施例においては、ニューロン
数2、シナプス数4であり、第6図(b)の比較例より
も大幅にニューロン効率、シナプス効率が向上している
ここで本発明の第1の基本理念を解説する。
再び(2)式に注目すると、データB,C、は1つの作
用素r−1− (OR)Jにより結合されており、デー
タAは、その演算結果に対して作用素「×(AND),
で結合されている。したがって本来データB,Cとデー
タAとは同一次元で評価すべきものではなく、それを敢
えて同一次元で評価しようとすると、第6図(a)、(
b)の比較例のように効率の低下を招来する。
ここで、ニューロンの処理内容が下記(7)式の評価の
みであると仮定する。
ΣWえA,−θ          (7)(ただし、
Wi :重み、Ai :入力、θ:閾値)そして、各デ
ータについてその抽象度を定義できると仮定し、その抽
象度を「次数」と呼ぶ。
この次数は、1個のニューロンにおける入力データに対
し、出力データが1次だけ次数が増加すると定義する。
また、1つの作用素により結合されたデータ相互は同一
次数であると定義する。
このような定義によると、(2)式の場合、データB,
Cは同一次数であり、データAはそれよりも次数が1次
だけ高い。ここでデータB,Cの次数として「0」を与
えるとすると、データAの次数は「1」である。
このデータの次数とニューラルレイヤの階層との関係を
考えると、第6図(C)において、ニューラルレイヤ2
0にはθ次のデータのみが入力され、ニューラルレイヤ
30には1次のデータのみが入力されている。したがっ
て、ニューラルレイヤ20、30を入力データの次数に
対応づけ得ることが明らかであり、以後ニューラルレイ
ヤにも入力データと同一の次数を定義するものとする。
そして、ニューラルネットワークに入力すべきデータ群
をその次数に応じて分類し、各次数のデータをそれに対
応した次数のニューラルレイヤに入力することによって
、ニューロン効率、シナプス効率が最適化する。
また、第6図(a)、(b)に関連して説明したように
、高次のデータを低次数化して処理することも可能であ
り、この場合にはニューロン効率、一1 5ー −1 6一 シナプス効率が低下する。したがって各データの次数は
、そのデータがとり得る最も高い次数を基準とすべきで
ある。
なお、(A+B) ・Bのように1つのデータが複数の
次数にわたって使用されることもあり、この場合、1つ
のデータを複数のニューラルレイヤに入力するよう多こ
してもよい。
第7図(a)はニューラルネットワークの第2実施例を
示し、この構成は、データ群lOとニューラルレイヤ2
0、90とを有し、レイヤ90は出力データを外部に出
力する出力レイヤとなっている。
データ群10は、第1グループのデータ11、12、1
3・・・と、第2グループのデータ14、15、16・
・・とからなる。すなわちデータ群10のデータは、そ
の次数に応じて第1および第2グループの2種類に分類
されている。
ニューラルレイヤ20はニューロン21、22、23・
・・を有し、また出力レイヤ90はニューロン91、9
2、93・・・を有する。ニューラルレイヤ20の各ニ
ューロンは出力レイヤ90の各ニューロンに接続される
。第1グループのデータ11、12、l3・・・はニュ
ーラルレイヤ20の各ニューロンにそれぞれ入力され、
第2グループのデータ14、l5、16・・・は出力レ
イヤ90の各ニューロンにそれぞれ入力される。
ニューラルレイヤ20の各ニューロンは、例えば上記(
1)式に示されるように、入力された各データに重みを
乗じたものの総和と闇値とを比較し、この比較結果に応
じて、出力データ「1」または「0」を出力する。出力
レイヤ90の各ニューロンは、ニューラルレイヤ20の
各ニューロンおよび第2グループのデータ14、15、
16・・・にそれぞれ重みを乗じたものの総和を求め、
この総和と闇値との比較結果に応じて、ニューラルレイ
ヤ20のニューロンと同様に「1」または「0」のデー
タを出力する。
しかして第2実施例において、第1グループのデータす
なわち低次のデータは、ニュ」ラルレイヤ20のニュー
ロンに入力され、第2グループの一18 データすなわち高次のデータは、出力レイヤ90のニュ
ーロンに入力される。したがって、ニューラルレイヤ2
0のニューロンは、より低次の処理すなわち例えば入力
音韻のパワーレベルのデータに対する処理を行い、出力
レイヤ90のニューロンは、より高次の処理すなわち例
えば入力音韻のパワーの持つ様々な性質等に対する処理
を行う。
このように、第2実施例においては、高次のデータが直
接出力レイヤ90に入力され、ニューラルレイヤ20に
は入力されないので、シナプス数すなわち入力要素とニ
ューロンあるいはニューロン同士の接続部の数は減少し
、またニューロン数も減少する。シナプス数が少なくな
ると、ニューロンにとって演算回数が減少するために、
演算速度が上昇し、また重みデータ数も減少するので、
メモリ容量も小さくてすむ。また、ニューロン数が少な
くなると、闇値の数も少なくてすみ、これによりメモリ
容量が小さくなるとともに、演算回数も少なくなり演算
速度が上昇する。しかして本実施例によれば、小さいメ
モリ容量でかつ高速の演算処理が可能になり、単純な回
路で効率の高いニューラルネットワークが得られる。
第7図(b)はニューラルネットワークの第3実施例を
示し、この実施例は、3つのグループの入力データ群1
0と、ニューラルレイヤ20、30および出力レイヤ9
0を有する。
入力データ群10は、第1グループのデータ11、12
、13・・・と、第2グループのデータ14、15、1
6・・・と、第3グループのデータ17、18、19・
・・とを備える。すなわち入力データ群は、第2実施例
と異なり、3種類に分類されている。第1のニューラル
レイヤ20はニューロン2l、22、23・・・を有し
、また第2のニューラルレイヤ30はニューロン31、
32、33・・・を有する。出力レイヤ90は、ニュー
ロン91、92、93・・・を有する。第1のニューラ
ルレイヤ20の各ニューロンは、第2のニューラルレイ
ヤ30の各ニューロンに、また第2のニューラルレイヤ
30の各ニューロンは、出力レイヤ90の各ニューロン
にそれぞれ接続される。
第1グループのデータ11、12、13・・・は第1の
ニューラルレイヤ20の各ニューロンに、第2グループ
のデータ14、15、16・・・は第2のニューラルレ
イヤ30の各ニューロンに、第3グループのデータ17
、18、19・・・は出力レイヤ90の各ニューロンに
それぞれ接続される。
各ニューロンは、第2実施例と同様に、例えば上記(1
)式に従い、入力された各データに応じて、出力データ
「1」または「0」を出力する。第1グループのデータ
11、12、13・・・は0次データ、第2グループの
データl4、15、16・・・は1次データ,、第3グ
ループのデータl7、18、19・・・は2次データで
ある。すなわち第2のニューラルレイヤ30には高次の
データが人力され、出力レイヤ90にはさらに高次のデ
ータが入力される。
この第3実施例においても、第2実施例と同様に、シナ
プス数は減少し、またニューロン数も滅?する。したが
って、第2実施例と同様な効果が得られる。
第8図(a)、(b)はニューラルネットワークの第4
実施例を比較例とともに表したものであり、この例は入
力データを論理演算 (A69B) fllEl (CeD)に従って処理す
る場合を示す。なおここで、eは「排他的論理和」を示
し、またA,B,C,Dは「1」または「0」のデジタ
ル値であり、この論理演算の結果も「1」またはr■j
のデジタル値として出力されるとして説明する。
第8図(a)は比較例を示し、この装置は入力デ.一夕
を通過させるための入・カデータ群10と第1および第
2のニューラルレイヤ20、30と出力レイヤ90とを
有する。入力データ群10は入力データA,B,C,D
からなる。第1のニューラルレイヤ20は4個のニュー
ロン21、22、23、24を有し、第2のニューラル
レイヤ30は4個のニューロン31、32、33、34
を有する。各データ、へ〜Dは、それぞれ第1のニュー
ラルレイヤ20の各ニューロンに入力され、第1のニュ
ーラルレイヤ20の各ニューロンはそれぞれ第2のニュ
ーラルレイヤ30の各ニューロンに接続される。一方、
出力レイヤ90は1個のニューロ・ン91を有し、この
ニューロン91には、第2のニューラルレイヤ20の各
ニューロンがそれぞれ接続される。
第1のニューラルレイヤ20において、各ニューロン2
1は各入力データに対して乗じられる重みと闇値とを有
し、上記(1)式に従い、各入力データと重みの積の総
和が闇値以上の時出力データ「1」を出力し、この総和
が閾値θよりも小さい時出力データrQJを出力する。
同様にニューロン22、23、24も各入力データに応
じて、「1」または「0」を出力する。第2のニューラ
ルレイヤ30においても同様に、各ニューロンは、入力
データに応じて「l」または「0」を出力する。
出力レイヤ90のニューロン91も同様に、第2のニュ
ーラルレイヤ30のニューロンからの出力データに応じ
て、「1」または「0」のデータを出力する。
さて論理演算(AfBB)e (CeD)0)演算結果
は、データA,Bが不一致で、かっC,Dが一致すると
き、またA,Bが一致し、かっCSDが不一致のとき、
「1」となる。それ以外の場合は「0」となる。このた
め、第8図(a)においては、各ニューロンは次のよう
に構成される。
第1のニューラルレイヤ20において、ニューロン21
、22、23、24は、A, B, C,Dを4ビット
パターンで表した場合、それぞれ「OIXXJ、rlO
xx,1、「χX01」、「χχ10」の時「1」を出
力し、それ以外の場合「0」を出力する。ここで、rx
XJはそのデータを無視することを意味する。一方、第
2のニューラルレイヤ30において、ニューロン31は
、第1のニューラルレイヤ20のニューロン2lのみが
「1」を出力する時r1,を出力し、それ以外の時「0
」を出力する。またニューロン32は、第1のニューラ
ルレイヤ20のニューロン22のみが「1」を出力する
時「1」を出力し、それ以外の時「0」を出力する。同
様にして、ニューロン33は、第1のニューラルレイヤ
20のニューロン23のみが「1」を出力する時「1」
を出力し、またニューロン34は、第1のニューラルレ
イヤ20のニューロン24のみが「1」を出力する時r
1,を出力する。一方、出力レイヤ9oのニューロン9
1は、第2のニューラルレイヤ30のニューロンの少な
くともひとつが「1」を出力する時「1」を出力する。
したがって、A,B,CXDの入カデータがビットパタ
ーンで「OOO1」の場合、第1のニューラルレイヤ2
0においてニューロン23のみが「1」を出力し、他の
ニューロン21、22、24が「0」を出力する。この
結果、第2のニューラルレイヤ30においてニューロン
33がrlJを出力することとなり、出力レイヤ9oの
ニューロン91が「1」を出力する。同様にしてA,B
、C,Dが、r0010J、r0 1 0 0J、rl
o00」、「l110」、rlloIJ、「1o11」
、ro 1 1 1,の場合、第2のニューラルレイヤ
30において、いずれかのニューロンが「l」を出力し
、出力レイヤ90のニューロン91が「1」を出力する
第8図(b)はニューラルネットワークの第4の実施例
を示し、この装置は入力データ群10と第1、第2およ
び第3のニューラルレイヤ20、30、40と出力レイ
ヤ90とを有する。入力データ群10は、入力データA
,B,C,Dからなる。第1のニューラルレイヤ20は
4個のニューロン21、22、23、24、第2のニュ
ーラルレイヤ30は2個のニューロン31、32、第3
のニューラルレイヤ40は2個のニューロン41、42
、出力レイヤ90は1個のニューロン9lを有する。入
力データ群のデータA−Dは、それぞれ第1のニューラ
ルレイヤ20の各ニューロンに入力され、第1のニュー
ラルレイヤ20の各ニューロンはそれぞれ第2のニュー
ラルレイヤ30の各ニューロンに接続される。第2のニ
ューラルレイヤ30の各ニューロンは第3のニューラル
レイヤ40の各ニューロンに接続され、第3のニュ−2
 5一 ラルレイヤ40の各ニューロンは出力レイヤ90のニュ
ーロンに接続される。
各ニューラルレイヤ20、30、40および出力レイヤ
90における各ニューロンは、第8図(a)の場合と同
様に、入力されるデータに応じて「1」または「0」を
出力する。
第1のニューラルレイヤ20において、ニューロン21
、22、23、24は、A,B,C,Dを4ビットパタ
ーンで表した場合、それぞれ「OIXXJ、’IOXX
J、rxx01,1、rxx10」の時「l」を出力し
、それ以外の場合「0」を出力する。一方、第2のニュ
ーラルレイヤ30において、ニューロン31は、第1の
ニューラルレイヤ20のニューロン21または22が「
1」を出力する時「1」を出力し、それ以外の時「0」
を出力する。またニューロン32は、第1のニューラル
レイヤ20のニューロン23または24が「1」を出力
する時「1」を出力し、それ以外の時「0』を出力する
。第3のニューラルレイヤ40において、ニューロン4
1は、第2のニュ一ラルレイヤ30のニューロン32の
みが「1」を出力する時「1」を出力し、それ以外の時
「0」を出力する。またニューロン42は、第2のニュ
ーラルレイヤ30のニューロン31のみが「1」を出力
する時「l」を出力し、それ以外の時「O」を出力する
。一方、出力レイヤ90のニューロン91は、第3のニ
ューラルレイヤ40のニューロンの少なくともひとつが
「1』を出力する時「1」を出力する。
したがって、A,B,C,Dの入力データがビットパタ
ーンでro001Jの場合、第1のニューラルレイヤ2
0においてニューロン23のみが[IJを出力し、他の
ニューロン21、22、24が「0」を出力する。この
結果、第2のニューラルレイヤ30においてニューロン
32のみが「1」を出力し、第3のニューラルレイヤ4
0においてニューロン42がrlJを出力することとな
る。したがって出力レイヤ90のニューロン9lが「1
」を出力する。同様にしてA,B,C,Dが、r001
0J、r0 1 0 0,、rl000J、rlllo
  ノ 、  rl  1  0  1J  、  r
l011J  、  「0111Jの場合、第2のニュ
ーラルレイヤ30において、いずれかのニューロンが「
1」を出力し、これにより第3のニューラルレイヤ40
のいずれか一方のニューロンがrlJを出力することと
なり、第4のニューラルレイヤ40のいずれか一方のニ
ューロンが「1」を出力する。したがって、出力レイヤ
90のニューロン91が「1」を出力する。
第8図(a)から容易に理解されるように、比較例にお
いて、シナプス数は36であり、ニューロン数は10で
ある。これに対し本実施例においては、第8図(b)か
ら理解されるようにシナプス数は30であり、ニューロ
ン数は10である。
しかして、論理演算(AeB) e(CeD) によっ
て入力データを処理する場合、比較例において36個の
シナブスが必要であったのに対し、本実施例によれば3
0個のシナプスですむことが理解される。
すなわち、本実施例によればシナプス数は約2割減少し
、上記各実施例において述べたのと同様な効果が得られ
る。つまり、ニューラルレイヤの数を増加させるととも
に、出力レイヤ90側に構築されるニューラルレイヤの
ニューロン数をそれより前段のニューラルレイヤのニュ
ーロン数以下に定めることにより、シナプス数を減少さ
せることができ、ニューラルネットワークのメモリ容量
を削減するとともに演算速度を向上させることができる
第9図(a)、(b)はニューラルネットワークの第5
実施例を比較例とともに表したものであり、この例は入
力データを論理演算 { (AeB) e(CΦD)) eE  (8)に従
って処理する場合を示す。
第9図(a)は比較例を示し、入力データ群10は5個
のデータA−E,初段のレイヤ20は15個のニューロ
ン、出力レイヤ90は1個のニューロンをそれぞれ有す
る。比較例において、上記(8)式を展開して得られる
各項をニューラルレイヤ20の各ニューロンへ入力して
いる。したがって、全てのデータはO次データとして処
理されている。
これに対し、第9図(b)はニューラルネットワークの
第5実施例を示し、この装置は入力データ群10と、第
1、第2、第3および第4のニヱーラルレイヤ20、3
0、40、50と、出力レイヤ90とを有する。第1の
ニューラルレイヤ20と第2のニューラルレイヤ30は
(AeB)と(CeD)に従った処理をそれぞれ行い、
第3の−−ユーラ/L/I/イヤ40は< (A63B
) e(C63D)}に従った処理を行う。そして第4
のニューラルレイヤ50および出力レイヤ90により、
{(AeB)e (CΦD))ΦEによる最終結果が求
められる。
第9図(a)および第9図(b)の対比から理解される
ように、比較例において、シナプス数は80,ニューロ
ン数は16であり、これに対し本実施例においては、シ
ナブス数は32であり、ニューロン数は10である。し
かして、本実施例によればシナプス数は約4割に減少し
、またニューロン数は約6割に減少する。したがって本
実施例においても、上記各実施例において述べたのと同
様な効果が得られる。
以上の説明から理解されるように、本発明において、入
力データ群、ニューラルレイヤ、および出力レイヤから
なる層構造は、そのデータ処理において必要とする次数
、および入力データの次数に応じて最適に構成される必
要があり、また入力データはその層構造に応じて適当な
レイヤに入力される。なお、ここで次数とは、前述した
ように、データあるいは処理内容の抽象度を意味する。
さて、ニューロンが上述のような処理を行うには、重み
が学習により適当な値に定められなければならない。こ
のため本実施例においては、後述するように、重みが時
間的に指数関数的に変化せしめられる。なお、重みの修
正方法として、特願昭63−297541号に開示され
ているように大別して3つの方法があり、これらをここ
ではそれぞれモードI、モード■、モード■と呼ぶこと
とする。
モードIは第10図に示すように、ニューロン−3 1
一 の重みがそのニューロンの出力に基づいて修正されるも
のである。この修正方法は、各レイヤの出力の目標値が
明らかになっている場合に有効である。さて、ある入力
に対してそのニューロンが出力を生じた場合その出力が
目標値に一致し、あるいは目標値に十分近かった時、そ
の時の入出力の関係は強化されるべきである。これは、
有意な入力が与えられたシナブスの重みを高めることに
相当する。モードIにおいては、各ニューロンの出力の
目標値が予め分かっているので、各ニューロンの出力を
目標値と比較し、両者が一致あるいは十分近かった時、
例えば2値入力の場合rlJが入力されたシナブスの重
みが増加せしめられる。
モード■は第11図に示すように、ニューロンの重みが
最終的な出力の評価結果に基づいて修正されるものであ
る。この修正方法は、データ処理装置の処理内容を大局
的に判断する場合に有効である。このモードにおける評
価方法としては、出力レイヤの最終出力と目標値とのハ
ミング距離、あるいはピタゴラス距離の評価、あるいは
感応的評価等が可能である。この評価の結果、出力が目
標値と一致あるいは十分近ければ、その時の入出力関係
は強化されるべきであり、その時、例えば「1」が入力
された各シナブスの重みが増加せしめられる。
モード■は、入力をそのまま記憶するタイプの学習の場
合の重みの修正方法であり、入力とその入力に対して最
初に生じた出力との関係を強化する。すなわち、第10
図の構成において、その入力に対して「1」を出力した
ニューロンにおける、rlJが入力されたシナブスの重
みが増加せしめられる。
このような重みの修正において、発明者等は、まずニュ
ーロンの重みの変化を生体の神経細胞における膜電位の
変化と仮定した。つまり、重みが生体の神経細胞におけ
る膜電位と同様に設定されるならば、データ処理装置に
おける学習の効率は生体の脳細胞と同様に極めて高くな
ると、考えられる。そしてまた、重みが膜電位と同様な
変化を示すのであれば、その変化は、一般的なRLC回
3 4一 路と同様に指数関数で表現されると考えられる。
しかして重みWは、第12図に示すように、W一±ex
p(t)            ( 9 )で表され
る。ただし、Lは個々のニューロンにおける学習時間、
すなわち学習回数を表す。
(9)式において、シナプスが興奮型の場合には符号は
十になり、重みWは、実線■で示すようにOから始まっ
て最初は急速に大きくなり、学習開始から時間がたつほ
どその変化量は小さくなり最大値Wκに近づく。これに
対し、シナプスが抑制型の場合には符号はーになり、重
みWは、実線Jで示すように0から始まって最初は急速
に小さくなり、学習開始から時間がたつほどその変化量
は小さくなり最小値W.に近づく。
学習の開始直後、そのシナブスについてあまりデータ相
関がないので、この時の重みWは小さく定められるが、
その後、データ相関が大きくなっていくので、重みWは
急速に大きくなり、これにより学習による収束が早めら
れる。これに対し、学習が進んで重みWが既に大きくな
っている場合、そのシナプスはそれまでの学習において
十分データ相関がある。したがって、その重みWをいた
ずらに変動させると、単に振動を起こすだけであり学習
における収束性を阻害することとなるが、重みWはほと
んど変化しないように定められているので、十分な収束
性が得られる。
なお、従来、ニューロンの出力特性として抑制型および
興奮型ニューロンが考えられており、これをニューラル
ネットワークとして最適配置するには処理内容を考慮し
た詳細な検討が必要であり、抑制型ニューロンと興奮型
ニューロンの結合は複雑である。しかし本実施例によれ
ば、ひとつのシナブスの特性として重みWの符号を+ま
たは−に選択するだけで、抑制型、興奮型を任意に実現
でき、したがって回路構成が単純化され、回路の自由度
が高まる。なお、抑制型ニューロンの存在によって、デ
ータの分離性が向上することは、ローゼンプラット以来
よく知られたところである(1958年 F.Rose
nblatt  ’ The  perceptron
:  a probabilistic  model
  for  informationstorage
  and  organization  in  
the  brain″,Psychological
  Review 65:  386−408)。
しかして本実施例によれば、ニューラルネットワークに
おける学習の効率が向上し、最終出力データを早期に収
束かつ安定化させることができる。
また、上述のように、重みWの正負の符号を変えるだけ
で抑制型および興奮型の特性が得られるので、データ処
理装置の回路の自由度が高まる。
なお、重みWの時間的変化は、必ずしも正確に指数関数
に定める必要はなく、例えば折れ線等で近似してもよい
次に、ニューラルネットワークの第6〜8実施例を説明
するとともに、本発明の第2の基本理念を解説する。
第13図(a)は本発明のニューラルネットワークの第
6実施例を示し,、この実施例は、学習の結果CA十B
)の論理演算を実行するに到ったニューラルネットワー
クを示すものである。
この構成は、1層のニューラルレイヤ20を有し、この
ニューラルレイヤ20には、データ数と同数、すなわち
2個のニューロン21、22が設けられる。各ニューロ
ン21、22にはデータAおよびBがそれぞれ入力され
る。各ニューロン21、22は、各データの入力経路と
の接続部分すなわちシナブスにおける重みW,と、閾値
θとを有する。学習により重みWiは変化し、ニューロ
ンは、所定の処理を行うようになる。本実施例では、学
習の結果、一方のニューロン21のみが論理演算(A+
B)の処理を行い、他方のニューロン22は実質的に作
用しない。すなわちニューロン21は例えばW,=1、
W2=1、θ;lに設定され、 AW+ +BW2≧1 の時、出力データ「1」を出力する。一方ニューロン2
2は、例えば、W,I=O、W4−0、θ一1に設定さ
れ、したがって常に、 A W 3 +B W a < 1 であり、閾値θを越えることはなく、出力データ「0」
を出力する。
しかしてニューロン21は、データA,Bの少なくとも
一方が「1」の時、出力データ「1」を出力し、本実施
例のニューラルネットワークは、論理演算(A十B)を
実行する。
第13図(b)は第7実施例を示し、この実施例は、学
習の結果(AeB)の論理演算を実行するに到ったニュ
ーラルネットワークを示すものである。この構成は2層
のニューラルレイヤ20、30を有し、初段のニューラ
ルレイヤ20にはニューロン21、22が設けられ、ま
た後段のニューロン30にはニューロン31、32が設
けられる。初段のニューラルレイヤ20のニューロン2
l、22には、データAおよびBが入力される。
論理演算(AeB)は、(AB+AB)と展開され、ニ
ューラルレイヤ20において、ニューロン21が(AB
)の処理を行い、ニューロン22が(AEOの処理を行
う。すなわちニューロン21は、例えばL 一−L W
2 =i、θ=1に設定され、 AW+ +BW2≧1 の時、出力データ「1」を出力する。一方、ニューロン
22は、例えばW3−1、W4=−1、θ一1に設定さ
れ、 AW3 +BW4≧1 の時、出力データ「1」を出力する。
ニューラルレイヤ30のニューロン31は、(XB+A
]lT)の処理を行い、例えばW5=1、W6=1、θ
=1に設定され、ニューロン21の出力をY1、ニュー
ロン22の出力をY2とするとY,W,+y2 w,≧
1 の時、出力「1」を出力する。一方ニューロン32は実
質的に作用しない。
しかしてニューロン31は、データA,Bの一方のみが
rIJの時出力データ「1」を出力し、両者が共に「1
」またはrQJの時出力データ「0」を出力し、本実施
例のニューラルネットワークは、論理演算(AeB)を
実行する。
第13図(C)は第8実施例を示し、この実施例は、学
習の結果(A+B)Cの論理演算を実行するに到ったニ
ューラルネットワークを示すものである。この構成は2
層のニューラルレイヤ20、ー40一 30を有し、初段のニューラルレイヤ20にはニューロ
ン21、22、23が設けられ、また後段のニューロン
30にはニューロン31、32、33が設けられる。初
段のニューラルレイヤ20のニューロン21、22、2
3には、データA, BおよびCが入力される。
ニューラルレイヤ20において、ニューロン21は(A
+B)の処理を行い、ニューロン22は実質的に作用せ
ず、ニューロン23は入力データCをそのまま出力する
。すなわちニューロン21は、例えばW+−1、W2=
1、W3−0、θ=1に設定され、 AWI +BW2 +CWs≧1 の時、出力データr1」を出力する。一方、ニューロン
22は、例えば各重みW4、W,、W6が0に設定され
るとともに、閾値θが1に設定され、実質的に作用しな
い。またニューロン23は、例えば重みW7=0、W.
=O、W,=1、θ−1に設定され、 AW? +BW8+CW,≧1 ?時、出力データ「1」を出力し、その他の時、出力デ
ータrQJを出力する。
ニューラルレイヤ30のニューロン31は、ニューラル
レイヤ20のニューロン21、23の出力データに基づ
いて(A+B)Cの処理を行い、例えばW++=1、W
1■=0、W..=1、θ=2に設定され、ニューロン
2lの出力をYI、ニューロン22の出力をY2、ニュ
ーロン23の出力をY3とすると、 Y + W Il+ Y 2 W + z +Y 3 
W + 3≧2の時、出力データ「1」を出力する。一
方ニューロン32、33は実質的に作用しない。
しかしてニューロン31は、データA,Bの少なくとも
一方が「1」でありかつデータCが「1」のとき出力デ
ータ「1」を出力し、本実施例のニューラルネットワー
クは、論理演算(A+B)Cを実行する。
ここで本発明の第2の基本理念を解説する。
第6実施例において、データA,Bは1つの作用素r十
(OR)Jにより結合されており、この一42 論理演算(A十B)は、1層のニューラルレイヤ20に
よって実行される。
第7実施例においては、データA,Bは「Φ(EX−O
R)Jにより結合されており、この論理演算(AeB)
は(λB+/l)と展開される。
そして初段のニューラルレイヤ20においてXBと/l
が実行され、すなわち作用素rX (AND)Jについ
ての論理演算が実行される。次いで、2段目のニューラ
ルレイヤ30において(AB+AB)すなわち作用素r
+(OR)Jについての論理演算が実行される。しかし
て、第7実施例の論理演算は2層のニューラルレイヤに
よって実行される。
第8実施例において、データA,Bは1つの作用素r+
(OR)Jにより結合されており、この論理演算は初段
のニューラルレイヤ20によって実行される。その論理
演算結果に対してデータCが作用素「X (AND)J
により結合されており、この論理演算(A+B)Cは2
段目のニューラルレイヤ30によって゛実行される。し
かして第8実施例の論理演算は2層のニューラルレイヤ
によって実行される。
このように、ニューラルネットワークの処理内容を論理
演算子rANDJ、rORJで表現した場合、論理演算
子の数、あるいは論理演算の構成に応じてニューラルレ
イヤの層数が増加している。
なお各データの次数は前述した通りであり、その定義に
よると、例えば、論理演算(AeB)を行う第7実施例
において、データA,Bを0次とすると、初段のニュー
ラルレイヤ20の各ニューロン21、22においてそれ
ぞれXBと/lの処理が実行され、1次の出力データが
2段目のニューラルレイヤ30のニューロンに入力され
る。そして2段目のニューラルレイヤ30において、(
XB+AE)の処理が実行され、2次の出力データが出
力される。すなわち、最終出力データは2次であり、論
理演算(A63B)は、最終出力データの次数から入力
データの次数を引いた数すなわち2層のニューラルレイ
ヤによって処理されると考えられる。
発明者らは、入力データに対して最終出力データの次数
が何次高いかを判断することにより、ニューラルレイヤ
の層数を決定することができる、つまり、ニューラルレ
イヤの層数は、最終出力データの次数から入力データの
次数をひいた数であると推測した。これが本発明の第2
の基本的な思想である。次数は、前述のようにデータの
抽象度であり、そのデータの有する性質によって定まり
、例えば音声認識において、入力音韻のパワーレベルは
O次であり、パワーの有する様々な性質のデータはさら
に高次である。
第14図はニューラルネットワークの第9実施例を示し
たものであり、この例は、学習の結果、入力データA,
B,C,Dを論理演算 (AeB)69 (CeD) に従って処理するように到った場合を示す。なおA,B
,CおよびDは「1」または「0」のデジタル値であり
、この論理演算の結果も「1」または「0」のデジタル
値として出力されるとして説明する。
この実施例は、4つのニューラルレイヤ20、30、4
0、90とを有し、最終段のニューラルレイヤ90は最
終出力データを出力する出力レイヤである。第1のニュ
ーラルレイヤ20は4個のニューロン21、22、23
、24を゛有し、同様に、第2のニューラルレイヤ30
は4個のニューロン31、32、33、34を、第3の
ニューラルレイヤ40は4個のニューロン41、42、
43、44を、出力レイヤ90は4個のニューロン91
、92、93、94を有する。各データA〜Dは、それ
ぞれ第1のニューラルレイヤ20の各ニューロンに入力
される。なお、各ニューロンは隣のニューラルレイヤの
各ニューロンに接続されるが、簡単のため、実質的に作
用に関係しない部分の線は、図中省略されている。
各ニューロンは、入力されるデータに対して乗じられる
重みW五と閾値θとを有し、上記(1)式に従い、各入
力データと重みの積の総和が閾値以上の時出力データ「
1」を出力し、この総和が閾値θよりも小さい時出力デ
ータ「0』を出力す46一 ?。
論理演算(A611B)は、(AB十AB) と展開さ
れ、ニューラルレイヤ20において、ニューロン21が
(XB)の処理を行い、ニューロン22が(/l)の処
理を行う。また論理演算(CeD)は、(Cp+cD)
と展開され、ニューロン23が(CD)の処理を行い、
ニューロン24が(cr5)の処理を行う。
すなわちニューロン21は、例えばWzl=  1、W
2■= l ,W2s = O、W.4=O、θ=1に
設定され、 A WzI十B Wzz + C Wtz +D Wz
a≧1のとき出力データ「1」を出力する。ニューロン
22は例えばWzs”1、W..=−1、W,=O、W
ze=O、θ=1に設定され、 AWzs+B”Nzb+CVLt+DWzs≧1のとき
出力データ「1」を出力する。同様にしてニューロン2
3、24の重みWiと閾値θが定められる。
ニューラルレイヤ30のニューロン31は、(?B+A
E)の処理を行い、例えばW!l1=1、W3■=1、
W3,l=0、Ws4=O、θ=1に設定され、ニュー
ロン21、22、23、24の出力をそれぞれKSL,
M,Nとすると、 K W31 +L W3■+MW3z+NWi4≧1の
時、出力データ「1」を出力する。同様に、ニューロン
33は、(CD+CI5)の処理を行い、ニューロン2
3、24の出力の少なくとも一方が「1」の時、出力デ
ータ「1」を出力する。なおニューロン32、34の各
重みWiはOに定められ、これらのニューロンは実質的
に作用しない。
したがってニューロン31は(AflEIB)の結果を
出力し、ニューロン33は(CeD)の結果を出力する
ニューロン31、32、33、34の出力をそれぞれE
,FSG,Hとすると、ニューラルレイヤ40のニュー
ロン4lは(EG)の処理ヲ行い、またニューロン43
は(EC)の処理を行う。すなわち、ニューロン41に
おいて、例えばW4,一一1、W4■==0、W43=
1、W.4=O、θ=1に?定され、 E W 4 1 + F W a■+G W 4 3 
+ H W a a≧1のとき出力データ「1」を出力
する。同様に、ニューロン43は、例えばW4s=1 
,Wab=O、W4,=−1、W41=0、θ=1に設
定され、EWAS+FW46+GW47 +HW48≧
1のとき出力データ「1」を出力する。ニューロン42
、44の各重みWiはOに定められ、これらのニューロ
ンは実質的に作用しない。
出力レイヤ90のニューロン91は、(XC+EC)の
処理を行い、例えばWq+=1、W9Z=0、Wq+=
1、W q a = O、θI==1に設定され、ニュ
ーロン41−、42、43、44の出力をそれぞれP、
Q,R,Sとすると、 P W q l十Q W 9 z +R W 9 s 
+ S W q a≧1の時、出力データ「1」を出力
する。ニューロン92、93、94は実質的に作用しな
い。このように使用目的が限定され、出力データ数が明
確であるならば実質的に作用しないニューロンは省略可
能である。
したがってニューロン9lは、(E63G)の結果、す
なわち(A63B)69 (CeD)(7)結果11力
する。
論理演算(AeB)および(C63D)における出力デ
ータの次数は、上述したように作用素「e(EX−OR
)Jが2つの作用素rANDJと「ORJによって置き
換えられるので、それぞれ2である。したがって、論理
演算(AθB) fllEl (Ce9D)における出
力データの次数は、4であり、この論理演算は、入力デ
ータと同数(4個)のニューロンを有する4層のニュー
ラルレイヤにより確実に処理される。
上記第6〜第9実施例において、データの次数はそのデ
ータに施された処理内容の数であり、各処理はそれぞれ
のニューラルレイヤによって行われていた。ここで処理
内容の例としては、論理演算子のrANDJ、rOR,
、rNANDJ、「NORJ であり、rF,X−OR
JおよびrEX−NORj等の場合にはrANDJある
いはrOR」に変換されなければならない。これは、r
EXORJ等はひとつのニューラルレイヤによっては処
理され得ないからである。
なお、処理内容は論理演算子によって表現されるものに
限定されず、出力データの性質によって定められる。
〔発明の効果〕
以上のように本発明は、特徴抽出部において抽出された
音声の特徴データをニューラルネットワークによって処
理し、音声認識を行うように構成されたものである。し
たがって、ニューラルネットワークの自己学習機能によ
り音声認識の性能が向上せしめられ、また連想機能によ
り音声認識の適用範囲が拡大する。しかして本発明によ
れば、多様な音声認識が可能であり、かつ認識率を高め
得る音声認識システムが得られるという効果が得られる
【図面の簡単な説明】
第1図は本発明の実施例を適用した音声認識システムを
示すブロック図、 第2図は特徴処理部を示すブロック図、第3図は認識部
を示すブロック図、 第4図は一般的なニューロンを示す概念図、第5図は一
般的なニューラルレイヤを示す概念図、 第6図(a)は比較例を示す概念図、 第6図(b)は他の比較例を示す概念図、第6図(C)
はニューラルネットワークの第1実施例を示す概念図、 第7図(a)はニューラルネットワークの第2実施例を
示す概念図、 第7図(b)はニューラルネットワークの第3実施例を
示す概念図、 第8図(a)は比較例を示す概念図、 第8図(b)はニューラルネットワークの第4実施例を
示す概念図、 第9図(a)は比較例を示す概念図、 第9図(b)はニューラルネットワークの第5実施例を
示す概念図、 第10図はモードIの学習を行うデータ処理装置の概念
図、 5 1 一 第11図はモード■の学習を行うデータ処理装置の概念
図、 第12図は重みの時間的変化を示すグラフ、第13図(
a)はニューラルネットワークの第6実施例を示す概念
図、 第13図(b)はニューラルネットワークの第7実施例
を示す概念図、 第13図(C)はニューラルネットワークの第8実施例
を示す概念図、 第14図はニューラルネットワークの第9実施例を示す
概念図である。 20,30、40、50、90 ・・ニューラルレイヤ 21〜24、31〜34、41、42 91〜93・・・ニューロン 100・・・認識部 200・・・人力部 300・・・特徴処理部 第1図 5 3一 第 図 (a) (C) (b)

Claims (1)

    【特許請求の範囲】
  1. (1)入力音韻に対応したデジタルデータパターンを生
    成する入力部と、 この入力部で生成されたデジタルデータパターンの特徴
    を抽出する特徴処理部と、 入力されたデータに所定の重みを乗じたものの総和と閾
    値との比較結果に応じたデータを出力するニューロンが
    並列的に設けられるとともに、上記特徴処理部から得ら
    れた抽出データの抽象度に応じた層構造のニューラルレ
    イヤを有し、上記抽出データに基づいて音声認識を行う
    認識部とを備えた音声認識システム。
JP1112818A 1989-04-05 1989-05-06 音声認識システム Pending JPH02293799A (ja)

Priority Applications (6)

Application Number Priority Date Filing Date Title
JP1112818A JPH02293799A (ja) 1989-05-06 1989-05-06 音声認識システム
AT90906368T ATE159601T1 (de) 1989-05-06 1990-04-25 Datenbehandlungssystem
DE69031621T DE69031621T2 (de) 1989-05-06 1990-04-25 Datenbehandlungssystem
EP90906368A EP0457909B1 (en) 1989-05-06 1990-04-25 Data processing system
PCT/JP1990/000535 WO1990013874A1 (fr) 1989-05-06 1990-04-25 Systeme de traitement de donnees
US08/461,538 US5553196A (en) 1989-04-05 1995-06-05 Method for processing data using a neural network having a number of layers equal to an abstraction degree of the pattern to be processed

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1112818A JPH02293799A (ja) 1989-05-06 1989-05-06 音声認識システム

Publications (1)

Publication Number Publication Date
JPH02293799A true JPH02293799A (ja) 1990-12-04

Family

ID=14596304

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1112818A Pending JPH02293799A (ja) 1989-04-05 1989-05-06 音声認識システム

Country Status (1)

Country Link
JP (1) JPH02293799A (ja)

Similar Documents

Publication Publication Date Title
EP3504703B1 (en) A speech recognition method and apparatus
EP0454037B1 (en) Neural network for processing a plurality of informations and learning method
US6038338A (en) Hybrid neural network for pattern recognition
WO2021096639A1 (en) Multi-task segmented learning models
CN114330541A (zh) 道路交通事故风险预测深度学习算法
JPH05158910A (ja) ニューラルネットのトレイン方法及びニューラルネットの分類装置
Shahin et al. COVID-19 electrocardiograms classification using CNN models
Semmad et al. Scalable serial hardware architecture of multilayer perceptron neural network for automatic wheezing detection
Singh Designing simulators for various VLSI designs using the proposed artificial neural network model TRIVENI
Shih et al. Speech emotion recognition with ensemble learning methods
US5195171A (en) Data processing system
Dang et al. Improved pso algorithm for training of neural network in co-design architecture
JPH02293799A (ja) 音声認識システム
CN116561584B (zh) 基于变分量子电路的语音隐私推断方法、装置及存储介质
Karras et al. A Hybrid Ensemble Deep Learning Approach for Emotion Classification
CN117995221A (zh) 基于渐进式信道查询的语音情感识别方法
CN115374926B (zh) 神经网络的剪枝方法、装置、电子设备及存储介质
Bojanić et al. Influence of emotion distribution and classification on a call processing for an emergency call center
JP7514141B2 (ja) 学習装置、情報分類装置、及びプログラム
van de Laar et al. Input selection with partial retraining
US20230075457A1 (en) Information processing circuit
Na et al. Single-sensor active noise cancellation using recurrent neural network predictors
Helmi et al. Speech recognition with fuzzy neural network for discrete words
EP0391404B1 (en) Data processing system
JPH02301876A (ja) 画像処理装置