JPH0293694A - パターン作成装置 - Google Patents

パターン作成装置

Info

Publication number
JPH0293694A
JPH0293694A JP63248207A JP24820788A JPH0293694A JP H0293694 A JPH0293694 A JP H0293694A JP 63248207 A JP63248207 A JP 63248207A JP 24820788 A JP24820788 A JP 24820788A JP H0293694 A JPH0293694 A JP H0293694A
Authority
JP
Japan
Prior art keywords
pattern
standard pattern
feature
distance
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63248207A
Other languages
English (en)
Inventor
Fumio Maehara
文雄 前原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP63248207A priority Critical patent/JPH0293694A/ja
Publication of JPH0293694A publication Critical patent/JPH0293694A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、不特定多数の利用者を対象とした文字や音声
の認識装置に用いる標準パターン作成装置に関する。
従来の技術 従来、認識装置、例えば音声認識装置(樺沢他;バネ特
定話者単語認識ボード“日本音響学会講演論文集1)L
145−14G昭和59年3月)や文字・図形の認識装
置などでは、入力データを分析することによって得られ
るn次元の特徴ベクトル系列aに対して、予め装置内に
登録しであるp個の標ff4パターンベクトル系列すの
中から、これと距離の最も近いもの、もしくは類似性の
大きいものをもって認識結果としているものが大部分で
ある。
ところで、辞書として、あらかじめ装置内に登録しであ
る標準パターンベクトル列としては、特定の利用者を対
象として使用者が認識装置の使用に先だって、該当パタ
ーンを発声しておき、これを用いるもののほか、複数の
利用者から集められた多数のデータをもとに、これらの
データから得られた多数のデータをグループ化して、グ
ループを代表する特徴パターンを標準パターンとするい
わゆる、不特定話者音声認識装置がある。
音声認識装置に用いる標準パターン作成のためエル ア
ール ラヒ゛ナー           スの従来例と
しては、 rL、R,Rablner、et、al :
 ” Spビーカー インチ゛へ°ンテ′ント レコン
゛ニション   オフ゛ アイソレイテト゛  ワea
ker  Independent  recogni
tion  of  l5olated  v。
晶慣。六1?、畳磐パ孫山、。J1韮’A−TL丑。
Xgg’5”;t、檻e’Ah r7粛1 ?rg’c
”:;’?as、、 ASSP−27+ pp、33G
 −349(+979)Jに示されるものが代表的であ
る。
第2図は、不特定話者を対象とする認識装置における従
来例1の標準パターン作成方式のブロック図を示すもの
であり、12は特徴抽出手段で1カテゴリー毎に入力さ
れるN個の入カバターンについて各入カバターン毎にそ
の特徴量を抽出して入カバターンを表わす特徴パターン
すなわち前述の特徴ベクトル系列aを生成する。13は
記憶手段で、特徴抽出手段12で生成された特徴パター
ンを記憶する。14は計算手段で前記特徴パターン間の
距離を計算し結果を保持する。15はグループ化手段で
、前記計算結果に基すいて、特徴パターンと他の特徴パ
ターンとの距離が小さい上位■(個を一つの特徴パター
ン群とし、各特徴パターン毎に選ばれたN個の特徴パタ
ーン群間で共通する特徴パターンの数が所定数Ks(く
I()以上の特徴パターン群をグループ化する。I6は
判断手段で、グループ化手段15でグループ化されたグ
ループの数が所定数Mであるかどうかを判断してM個で
無いときはグループ化手段15再駆動さぜる。17は平
均手段で前記グループ内のそれぞれの特徴パターンを平
均する。
以上の様に構成された従来の標弘パターン作成装置に付
いて、以下その動作について説明する。
入カバターンは特徴抽出手段12で特徴抽出されて、入
カバターンを表す特徴パターンA1が生成される。一つ
のカテゴリーにたいするN個の入カバターンについて入
カバターン毎に生成された前記特徴パターンA1(1:
O,φ・・、N−1)は記憶手段13にそれぞれ記憶さ
れる。記憶手段13では、記憶されているN個の特徴パ
ターン群Al(+=o、・・・、N−1)に対し、計算
手段14でそれぞれの特徴パターン間の距離計算を行い
、それぞれの計算結果D11:1A1−Aj’ (1+
J=0+  拳・・。Ll)を保持する。
グループ化手段15では前記計算結果に基すいて、一つ
の特徴パターンA1について他の特徴パターンとの距離
の近いもの上位に個の特徴パターンに個 AI+AXI・・−1A、で構成される特徴パターン群
に個 aI”(AI +Ax +自 番 争、 A、)(1=
o・ ・ ・、Ll)を選び、前記特徴パターン群間で
共通する特徴パターンが所定個数Ks(<K)以上存在
する場合に該当する特徴パターンとうしas + a 
L [Ks〈Kum (as  a) ):e+r:o
1拳・Ll、e≠f : Kui(X)は集合Xの要素
の数)をグループ化する。判断手段16では、グループ
化手段I5でグループ化されたグループの数が所定数M
であるかどうかを判断し、所定数Mで無いときには、前
記特徴パターン群を構成する特徴パターン数Kを1つ増
やしてに+1としてグループ化手段16を再駆動させる
が、前記グループの数が所定数Mであれば、平均手段1
7を駆動させる。平均手段17ではグループ化手段!5
でグループされて記憶手段!3で記憶されている特徴パ
ターンのグループB g+・・、B M−1について、
それぞれのグループ内のに個の特徴パターンを平均して
各グループを代表する標準パターンS9+・・・+5N
−1をそれぞれのカテゴリーに対して前記所定のグルー
プ数Mだけ発生する。
以上のように、−群のデータを特徴の似た複数のグルー
プに分割する手法をクラスタリングと呼ぶ。
発明が解決しようとする課題 しかしながら、この様な従来例の構成では、前記グルー
プ化された特徴パターンを平均するので、一つのカテゴ
リーに属する標準パターン間の距離よりも、他のカテゴ
リーに属する標章パターンとの距離の方が近くなる場合
が生じ結果的に、作成された標準パターンはカテゴリー
の特徴を失ってしまう。
従って、この様な装置により作成した標準パターンは、
認識率の劣下の大きな原因の一つとなるという問題を有
する。
本発明はかかる点に鑑み、グループ間距離を、大きくし
た標準パターンを得ることができるパターン作成装置を
提供することを目的としている。
課題を解決するための手段 本発明は、複数の認識対象の各認識対象ごとに異なる発
生条件で得た複数カテゴリーのサンプルの特徴パターン
を抽出する特徴パターン抽出手段と、各カテゴリー毎の
データの分散を計算する、分散計算手段と、その結果分
散の大きいカテゴリーから順にすべてのカテゴリーにた
いして以下の手段を用い、クラスタリングをおこなう、
すなわち、前記特徴パターンの相互間の距離を計算する
計算手段と、異なる認識対象の特徴パターン間の距離が
所定値よりも小さいとき当該パターンのサンプルを標準
パターン作成のためのサンプルから除外するサンプル選
択手段と、各認識対象毎に、当該認識対象の前記除外サ
ンプル以外のサンプルをもとに、当該サンプルより生成
された特徴パターン間の距離の各グループ毎の最大値が
最小となるように前記当該サンプルをグループ化し、グ
ループの中心となるサンプルを標準パターンとする標章
パターン決定手段とを備えた標章パターン作成装置であ
る。
作用 本発明は以上のように構成することにより、複数の認識
対象の各認識対象毎に異なる発生条件で得た複数カテゴ
リーのデータに対し、分散の大きいデータを含むクラス
ターから用頁にクラスター間にまたがるオーバーラツプ
を排除しつつクラスタリングを行うことにより、サンプ
ルデータのオーバーラツプに影響されず最適の標準パタ
ーンを作成するものである。
実施例 以下、本発明の一実施例について図面とともに説明する
。第1図は本発明の第一の実施例における音声認識装置
のブロック図である。
同図において、1は入力信号をn次元のパラメータベク
トル系列aに逐次変換する特徴抽出部で、フィルタバン
ク、フーリエ変換器など公知の技術で実現される。2は
スイッチで、標準パターン作成時にはA側に、パターン
比較時にはB側に切り替わる、3は標章パターン作成部
で認識動作に供する標準パターンb1・・・b、を作成
。4はパタを記憶する。5は前記パラメータベクトル系
列aと標章パターン記憶部4に記憶されている標準パタ
ーンとの距離を計算する距離計算部である。6は距離計
算部5により得られたP個の距離の内、最小なる標章パ
ターンを認識結果として出力信号線7に出力する判定部
である。
つぎに標準パターン作成手段3の内部717.¥成につ
いて説明する。第3図において、19は記憶手段Iで、
特徴抽出部1で生成された特徴パターンを、記憶する。
20は計算手段で、前記特徴パターン間の距離を計算し
結果を保持する。
2Iはグループ化手段Iで、前記計算結果に基ずいて、
特徴パターンと他の特徴パターンとの距離が小さい上位
に個を一つの特徴パターン群とし、各1、Y徴パターン
毎に選ばれたN個の特徴パターン群間で共通する特徴パ
ターンの数が、所定¥lKS(〈K)以上の特徴パター
ン群を、グループ化する。
22は判断手段で、グループ化手段I21でグループ化
されたグループの数が所定数M以上であるかどうかを判
断してM個でない時は前記プループ化手段を再駆動させ
る。23は選択手段■で、M個のグループ内の、それぞ
れの特徴パターン間で当該特徴パターンと他の特徴パタ
ーンとの距離の最大値が最も小さくなる特徴パターンを
選択して、標準パターンとして、出力する。
第4図、第5図に示す、クラスタリング手段II、Il
lについてもクラスタリング手段Iと同一の構成である
次に上記のように111¥成された装置の動作について
、第1図、第3図、第4図、第5図を用いて、標r3μ
パターン作成時、パターン比較時に分けて各々説明する
。まず標喀パターン作成時にはスイフチ2をA側にし標
桑パターン作成に供するデータを順次入力する。
入力データは特徴抽出部1で特徴抽出されて、入力デー
タをあられす特徴パターンAI(l=O2・・、N−1
)は記憶手段■、17にそれぞれ記憶される。記憶手段
I25で記憶されているN個の特徴パターン7tTA1
(1=o、・・、N−1)に対し、計算手段120で、
それぞれの特徴パターン間の距離計算を行い、それぞれ
の計算結果り、、=l A、−A、 lを保持する。グ
ループ化手段I21では前記計算結果に基すいて、一つ
の特徴パターンA1について他の特徴パターンとの距離
の近いもの上位に個の特徴パターンに個 に個 前記特徴パターン群間で共通する特徴パターンが所定個
数に、 ((K)以上存在する場合に該当する特徴パタ
ーン同志あae +al +[Ks〈Nu、1(as凸
a、): e、  f:o。
・・、N−++e=r;Nun (x)は集合Xの要素
の数)をグループ化する。
判断手段I22てはグループ化手段I21でグループ化
されたグループの数が所定数Mであるかどうかを判断し
、所定数Mでない時には、前記特徴ノ々ターン群を構成
する特徴パターン数Kを一つ増してI<+1として、グ
ループ化手段I21を再駆動させるが、前記グループの
数が所定数Mであれば、選択手段■、23を駆動させる
。選択手段I23では、グループ化手段I21でグルー
プ化された特徴、+ターン群について特徴パターン間で
当該特徴/N6ターンAIQ(Bl:l:O,・・・、
M−11cI=oI  ・命・、  K−1)と他の特
徴パターンAI、(13+ :l=r:O,* e 翳
に−1)との距離の最大値D qmax (q=o 、
俸・・、  K−1)が最も小さくなる特徴パターンを
もとに他グループに混入しているものを省いた残りのパ
ターンA 1’ (+ ’0 +φΦ―、N’−1)は
記憶手段II、25にそれぞれ記憶される。記憶手段+
125で記憶されているN′個の特徴パターン群Al・
(i’=:O,・・・、  N−1)に対し、計算手段
1126でそれぞれの特徴パターン間の距gjfU計算
を行い、それぞれの特徴パターン間の距シ111計算を
行い、それぞれの特徴パターン間の距離計算を行い、そ
れぞれの計算結果D1□:lA、=−A、= Bビj 
1=0・・ N’−1)を保持する。グループ化手段+
127ては[]II記計算結果に基すいて、一つの特徴
パターンA’lについて他の特徴パターンとの距ノ)1
Fの近いもの」1位に′個の特徴パターン に′個 r−ゝ〈−一− A’l’lA’X・、・・、 、AI、・で構成される
特徴パターン群 Z=(AI、 、 、A1.、 、 
、 、 、AI、 、 L(11:Q、 @ 、 、N
+1)を選び、前記特徴パターン群間で共通する特徴パ
ターンが所定個数Iく”、(くに’)以上存在する場合
に該当する特徴パターン聞忘a+。、a’j fK’s
<N’u’i(a’aρa′、) :e’、f’:O,
、s、  N’−1,e’≠f’;N’、・、−(×+
)は集合X′の要素の数)をグループ化する。判断手段
11,28ではグループ化手段11.27でグループ化
されたグループの数が所定数ト1′であるかとうかを判
断し、所定数51゛でない時には、前記特徴パターン1
11′を構成する特徴パターン数K”を1つ増やしてに
’+1として、グループ化手段+127を再駆動させる
が、前記グループの数が所定数M′であれば、選択手段
I+、29を駆動させる。選択手段11.29では、グ
ループ化手段It、27でグループ化された特徴パター
ン群について、特徴パターン間で当該特徴パターンA’
+−(B’+・:ビニ0.・・・、M′−1、q la
6 、・・1 、に’−1)と他の特徴パターンA ’
l+、l (B ’ヒ:l’:r゛:0.・・・、に’
−1)との距離の最大値D ’qnmx (q’=0、
・・−、に’−1)が最も小さくなる特徴パターンA。
(m=0 、・・・、トl)を選択して標準パターンと
して出力し標準パターン記憶部4に記憶する。
次にパターン比較の場合について説明する。パターン比
較に際しては、スイッチ2をB側に接続し、特徴抽出部
1は、入力音声に対応する入力パラメータベクトル列(
al +a2 +・・”+a+)を距離計算部5へ送出
する。距離計算部5では特徴抽出部1、パターン記憶部
4から送出された各信号に対し、d=Ia−blで示さ
れる市街距離、あるいはユークリッド距離等を用いて距
離計算を行う。
この動作を標準パターンベクトルの第1グループ1=i
−pなるlと第2グループの同じ<1=1−Pにたいし
て行い、各々の距離を判定部6に出力する。判定部6は
、これらP個の距離のうち最小のものを判定し、最小距
離を与える標準パターンベクトルを判定結果として出力
信号線7に出力する。
本発明を先の従来例との比較によってさらに説明する。
本発明を、方言・声の大小長短・年齢性別をふ(むデー
タを対象とする、音声認識にに適用した場合の標準パタ
ーン作成の動作を第6図のフローチャートに示す。
第6図に示す様に、まず、方言カテゴリー 声の大小長
短のカテゴリー 年齢令性別カテゴリー認識対象単語カ
テゴリーにたいして、第1図8なる分散計算手段により
分散を計算する、実験の結果によると、分散の大きさは
年齢性別カテゴリー声の大小長短カテゴリー 単語カテ
ゴリー 方言カテゴリーの順にで有ることが確かめられ
ている。
そこで単語間並びに地域差カテゴリー 声の大小・長短
カテゴリーの3種類のカテゴリーについて、その相互に
オーバーラツプするサンプルデータを排除しつつ3回の
クラスタリングを行なうものである。
第2図に示す公知例である、従来のRablnerらの
方法では、オーバーラツプ部分に対して最適な個数の標
梨パターンを配置してこれをカバーしているが、オーバ
ーラツプ部分のデータの影響で、他カテゴリーの単語の
認識に悪影響を与えるパターンか生じる場合が考えられ
る。又クラスタリングに際して収束性が悪く処理時間が
長いという欠点を有する。
認識実験による比較では第2図の公知例の方法と比較し
て4.1%の認識率向上が認められた。
本法を用いて認識率の改善が得られた理由について、第
7図を用いて、さらに詳しく考察する。
すなわち、従来のクラスタリング手法では比較的均質の
サンプルデータからなる母集団に対しては有効であった
(例えば同一性別、同年齢の標準発声集団など)。しか
し、違った年齢(特に子供の場合など)、男女差、地域
差などの話者属性によって母集団に多様なバラツキや偏
りが見られる場合には従来のクラスタリング手法が十分
効果を発揮しない場合がある。
例えば同一単語を同一の人が発声する場合でも静かな環
境で発声する場合と、騒音下で発声する場合では発声の
大きさか異なる、また男女別の発声においても、子供の
男子の声は成人の女性の声に近いなどの傾向がありこれ
らを同一のカテゴリーとみなしてクラスタリングすると
単語カテゴリーが接近してしまい、最終的にK N N
判定の法則が適用できない場合が生じ、これが誤a8 
Q2の一因となっていた。
本方式ではデータの分散の結果をもとに最もコンヒユー
ジョンの大きかったカテゴリーを分割し3つのサブカテ
ゴリーをつくり3回のクラスタリングによって相互のカ
テゴリーでオーバーラツプするサンプルを除去しつつク
ラスタリングをおこなうことによってコンヒユージョン
の少ない標準パターンを作ることを可能とした。
この間の様子を第7図によって図式的に説明する。すな
わち、第7図においてS9を「京都」と発声された入カ
バターンベクトルとする。この時予め作成された標準パ
ターンのうち例えば、幼年男子の「東京」という発声の
母集団と、成人女子の「京都」というパターンの、もと
のサンプル母集団に大きなオーバーラツプが有る場合、
これを従来の、 Human Factorに起因する
データのオーバーラツプを考慮しない方式でクラスタリ
ングすると、第7図43に示すように、データの分布状
況によっては、クラスタリング後のTOKYOのサンプ
ルの中心点の1つがS、に近すいてしまい、その結果本
来のクラスターであるKYOTOのクラスターの中心点
の一つよりも距離が近すくということが起こり易い。と
ころが本MSC方式のように、同−単語内においてもH
uman Factorなどの別クラスター要素のオー
バーラツプサンプルを予め取り省いておくと、クラスタ
ーの中心点が極端に別クラスターに接近するIrがなく
なる、この場合のクラスターの選び方としてばらつきの
最も大きいクラスターを選ぶことにより、最適なデータ
の空間分割が可能となる、この結果、第7図42に示す
ように、クラスターの中心点が極端に別クラスターに接
近する事がなくなり本データベースのように多様なll
uman Factorをふくむデータのクラスタリン
グにさいして最もコンフユージヨンの少ないクラスター
中心点を求める事ができ、認識率の向上を図ることがで
きるものと、考えられる。
次に、本発明の第二の実施例について図面とともに説明
する。第8図は本発明の一実施例における文字再認識装
置のブロック図である。
同図において、44は入力信号を読み取る読み取り装置
、45は入力された文字列パターンから各文字を切り出
す切り出し装置であり、第9図に示す様に動作する。す
なわち、読み取り装置44から入力された文字列にたい
して、文字の存在部分に1、そうでない部分にOを割当
、ひとかたまりの1部分を一文字とみなす。イ6は切り
出された各文字をn次元のパラメータベクトル系列aに
逐次変換する特徴抽出部で、第10図49に示すように
入力された文字に対してその、切り出された区形内のド
ツトか1である点から上下左右8方向に対する、隣あう
ドツトの存在似たいして、第10図57なる方向別の数
字を割当、これを特徴パラメータとする、など公知の技
術で実現される。53はパターン記憶部で、第1図3に
しめず構成により同様にして作成された標準パターン系
列b1・・・・bpを記r・芝する。54は前記パラメ
ータベクトル系列aと標準パターン記憶部53に記憶さ
れている標準パターンとの距シ11Fを計算する距βj
tI 、i1算部である。55は距汀E計算部5により
得られたP個の距離の内、最小なる標準パターンを認識
結果として出力信号線5Gに出力する判定部である。
文字認識に際しては、特徴徴抽出部46は、入力文字列
に対応する入力パラメータベクトル列(at、a2.・
・Φ、a1)を距耶計算部54へ送出する。距itら送
出された各信号に対し、d=Ia−blで示される市街
距離、ユークリッド距離等を用いて距離計算を行う。こ
の動作を標準パターンベクトルの第一グループ1=1−
Pなる1と第ニゲループの同じ<1=1−Pにたいして
行い、各々の距血[を判定部55に出力する。
判定部55は、これらP個の距離のうち最小のものを判
定し、最小距離を与える標準パターンベクトルを判定結
果として出力信号線5Gに出力する。
標1/<パターン作成に際しては、スイッチ2をA側さ
し、第8図48なる標準パターン作成部において、第一
の実施例に示す、第1図3なる標賭パターン作成1・π
くと同一の動作により標げIヘパターンを作成する。
なお、本実施例は、これを、コンピュータに置き換え、
プログラム的にこれを行うことも可能である。又、本実
施例では標桑パターン作成と認識動作を同一の認識装置
上に構成したが、これを2つの装置とし、標準パターン
作成のみを行う装置き、認識動作を行う装置に分割する
ことも可能である。また記憶手段Iと計算手段Iとグル
ープ化手段lと判断手段Iと選択手段Iならびに記憶手
段II。
II+と判断手段II、II+と選択手段II、II+
は共用化し、−組の手段を時分割的に使用することも可
能である。
発明の効果 本発明の標べξパターン作成装置は、複数の認識対象の
各認識対象毎に異なる条件で得た複数のすンプルのうち
から、異なる認識対象の特徴パターン間の距離が所定値
よりも小さいものを除いて、標準パターンを作成するよ
うににたので、グループ間n距離の大きい標準パターン
を得ることができ、この標準パターンを認識装置に用い
ることにより、高い認識率を得ることができる。そして
、それによって有効な音声認識装置や文字認識装置を実
現できる。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置のブロ
ック図、第2図は公知技術の説明図、第3図、第4図、
第5図はそれぞれ本発明の一実施例の標準パターン作成
部の動作説明図、第6図は同標準パターン作成部の動作
説明用フローチャート、第7図は本発明の実施例におけ
る改善効果の説明図、第8図は本発明の一実施例の文学
界装置における文字切り出しを説明する図、第9図およ
び第10図は同文学界装置におけるパラメータ抽出の原
理説明図である。 1・・特徴抽出部、3・・標準パターン作成部、8・記
1.へ手段、9・・計算手段、 10・・グループ化手 段、11・・判断手段、12・・選択手段。

Claims (3)

    【特許請求の範囲】
  1. (1)複数の認識対象の各認識対象ごとに異なる条件で
    得た複数カテゴリーに属する複数のサンプルの特徴パタ
    ーンを抽出する特徴パターン抽出手段と、前記複数カテ
    ゴリーのおのおのに属するデータの分散を計算する分散
    計算手段と、前記分散計算手段により計算された分散の
    大きいカテゴリーから順に、分散特徴パターンの相互間
    の距離を計算する計算手段と、異なる認識対象の特徴パ
    ターン間の距離が所定値よりも小さいとき当該特徴パタ
    ーンのサンプルを標準パターン作成のためのサンプルか
    ら除外するサンプル選択手段と、各認識対象毎に、前記
    認識対象の前記除外サンプルより生成された特徴パター
    ン間の距離の各グループ毎の最大値が最小となるように
    前記サンプルを標準パターンとする標準パターン決定手
    段とを備えた標準パターン作成装置。
  2. (2)請求項1に記載の標準パターン作成装置で作成し
    た標準パターンを記憶する記憶手段と、入力音声を分析
    する分析手段と、前記分析手段の出力並びに前記記憶手
    段の内容を比較する比較手段と、前記比較手段による比
    較の結果最も類似する標準パターンを判定し認識結果を
    出力する判定手段を備えた音声認識装置。
  3. (3)入力された文字列パターンから個々の文字を切り
    出す文字切出手段と、切り出された文字パターンをパラ
    メータ分析する分析手段と、このパラメータから標準パ
    ターンを作成する請求項1記載の標準パターン作成装置
    と、前記標準パターン作成装置の出力を記憶する記憶手
    段と、前記パラメータ分析手段の出力と前記記憶手段の
    標準パターンを比較する比較手段と、前記比較手段によ
    る比較の結果最も類似する標準パターンを判定し認識結
    果とする判定手段を備えた文字認識装置。
JP63248207A 1988-09-30 1988-09-30 パターン作成装置 Pending JPH0293694A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63248207A JPH0293694A (ja) 1988-09-30 1988-09-30 パターン作成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63248207A JPH0293694A (ja) 1988-09-30 1988-09-30 パターン作成装置

Publications (1)

Publication Number Publication Date
JPH0293694A true JPH0293694A (ja) 1990-04-04

Family

ID=17174785

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63248207A Pending JPH0293694A (ja) 1988-09-30 1988-09-30 パターン作成装置

Country Status (1)

Country Link
JP (1) JPH0293694A (ja)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61148497A (ja) * 1984-12-21 1986-07-07 松下電器産業株式会社 標準パタン作成装置
JPS63192098A (ja) * 1987-02-05 1988-08-09 富士通株式会社 音声認識における標準パタ−ン作成装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61148497A (ja) * 1984-12-21 1986-07-07 松下電器産業株式会社 標準パタン作成装置
JPS63192098A (ja) * 1987-02-05 1988-08-09 富士通株式会社 音声認識における標準パタ−ン作成装置

Similar Documents

Publication Publication Date Title
Yildirim et al. A modified feature selection method based on metaheuristic algorithms for speech emotion recognition
TW440810B (en) Method of speech recognition
Etman et al. Language and dialect identification: A survey
Zhang et al. Towards multi-speaker unsupervised speech pattern discovery
JP6664072B2 (ja) 探索支援方法、探索支援装置、及び、プログラム
Gaddy Voicing silent speech
Campbell et al. Alzheimer's dementia detection from audio and text modalities
Campbell et al. Alzheimer's Dementia Detection from Audio and Language Modalities in Spontaneous Speech.
Verma et al. Indian language identification using k-means clustering and support vector machine (SVM)
Fu et al. An end-to-end multitask learning model to improve speech emotion recognition
Alashban et al. Speaker gender classification in mono-language and cross-language using BLSTM network
Paukner et al. Classifying music-induced emotion using multi-modal ensembles of eeg and audio feature models
Manos A study on out-of-vocabulary word modelling for a segment-based keyword spotting system
Prakash et al. Analysis of inter-pausal units in indian languages and its application to text-to-speech synthesis
Gallardo-Antolín et al. A saliency-based attention LSTM model for cognitive load classification from speech
WO2021171956A1 (ja) 話者識別装置、話者識別方法、及び、プログラム
Garoufis et al. Pre-training music classification models via music source separation
Silipo et al. Input features' impact on fuzzy decision processes
JPH0293694A (ja) パターン作成装置
Auer Jr Dynamic processing in spoken word recognition: The influence of paradigmatic and syntagmatic states
JP5997813B2 (ja) 話者分類装置、話者分類方法および話者分類プログラム
Al Mojaly et al. Detection and classification of voice pathology using feature selection
Leem et al. Keep, Delete, or Substitute: Frame Selection Strategy for Noise-Robust Speech Emotion Recognition.
JP6711343B2 (ja) 音声処理装置、音声処理方法及びプログラム
CN113744718A (zh) 语音文本的输出方法及装置、存储介质、电子装置