JPS5961897A

JPS5961897A - 認識装置

Info

Publication number: JPS5961897A
Application number: JP57172786A
Authority: JP
Inventors: 外川　文雄
Original assignee: Computer Basic Technology Research Association Corp
Current assignee: Computer Basic Technology Research Association Corp
Priority date: 1982-09-30
Filing date: 1982-09-30
Publication date: 1984-04-09
Anticipated expiration: 2009-07-06
Also published as: JPH0652478B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】く技術分野〉本発明は認識装置の改良に関し、更に詳細には例えば文
節等の一区切りの音声等の一区切りの認識すべき情報を
音韻、かな、音節２文節等のより細分化された単位要素
で認識する認識装置の改良に関するものである。

〈従来技術〉文節等の一区切りの音声等を音韻、かな、音節等のより
細分化された単位で認識する場合、従来一般的には入力
された認識すべき一区切りの音声情報等を例えば音響処
理して音韻、音節等の単位毎の特徴ベクトル入カバター
ンを得ると共に、この入カバターンと予め記憶されてい
る標準パターンとのマツチングを行って、入力された情
報を候補単位列として類似度の高いものから出力し、こ
の出力された候補単位列と文節等の辞書の内容とを照合
して入力された情報に対する文節等の一区切りの情報を
認識している。

しかし、このような従来の方法によれば、全ての音韻、
音節等の標準パターンと入カバターンとのマツチングを
行なって類似度を算出し、類似度との高いものから順に候補音節ｉ（て出力している。

したがって１例えば拗音を含む単音節単位で認識する場
合、各音節単位全てについて１００種以上の単音節の標
準パターンと入カバターンとの間でマツチングを行う必
要があり、その処理時間か多大なものとなっていた。

また、その後に類似度の高いものから出力される候補単
位列の全てについて辞書照合処理を行なう必要があり、
その処理時間か長くなり、正しい文節等を認識する確度
が向上せず、結果的に全体の認識に要する処理量が膨大
なものになっていた。

〈目的〉本発明は、上記従来の欠点を除去した認識装置を提供す
ることを目的とし、正しい文節等の一区切りの認識すべ
き情報を認識する確度を向上させると共に、異なる話題
２分野等の異なる種類の認識すべき情報に応じた処理を
指定することが出来、結果的に全体の認識に要する処理
量を減少させることのできる認識装置を提供するもので
ある。

〈実施例〉以下、本発明の認識装置を文節等の一区切りの音声入力
を音節等のより細分化された単位要素で認識する場合の
例を実施例として説明する。

本発明の実施例によれば、文節等の一区切りの音声等の
認識すべき情報を音韻、かな、音節等のより細分化され
たＮ個の単位要素で認識する認識装置において、認識対
象となる文節あるいは文章等の文字（単位要素）列につ
いて、その話題あるいは分野毎に、（Ｎ＋１）個の文字
（単位要素）間の接続関係である遷移関係を記述した異
なる遷移行列を複数種類記憶した遷移行列記憶手段と、
この遷移行列記憶手段に記憶された複数種類の遷移行列
より、認識すべき文字列の内容（種類１分野等）に応じ
て所望の遷移行列を指定する遷移行列指定手段と、この
遷移行列記憶手段番こより指定された遷移行列にもとす
いて、音節（単位要素〕ラティス生成時に、−音節（単
位要素）前のと゛のイ侯補音節（単位要素）からも遷移
しなし）音節（単位要素）群は認識対照から除外し、ま
た（ま及び候ン甫列作成時に各候補列に対して遷移行列
を参照し、遷移しない音節ｃ単位要素）の組合せを含む
候７ｍ列は除外する等の認識処理を行う処理手段とを備
えて、次の高次の辞書照合の際の処理量の削減を図るよ
うに構成されている。

まず、本発明の詳細な説明に先立ち、本発明の認識装置
に用いられる単位要素間の接続関係である遷移関係を示
した遷移付列番こつし１て説明する。

一般に日本語文章は、全てかな文字で表現した場合、か
な文字列に対応しソこ音節列で表現できる。

例えば文節「地球の」は“ち゛“きゆ”“う゛“°の゛
という４個の単音節といわれる単位要素力）ら成り立っ
ている。２つの音節間の接続関係（“ち力）ら　“きゅ
、″きゆ“から　“う、“′う゛から　゛の゛）を、日
本語全て、あるいは特定の分野２話題番こおける文章等
について調べると接続（遷移；以下遷移ということばを
使う）しない音節対かある。例えばば行の音節の前には
１“ん＋＋　、　Ｉｔつ”５以外はこない。またパにや
′は語頭にはこないし、“へパ（へと発声するもの）は
語尾にこない。

このような文節を構成する音節の１次の遷移関係を以下
に示す式（１）に従って記述して、第１図に示すような
遷移行列Ｍ（Ｘ、Ｙ）を作成する。

第１図において遷移行列Ｍ（Ｍ、Ｙ）は単位要素列であ
る文字列の文字Ｘから次の文字Ｙへの遷移を記述したも
のであり、単位要素（音節）がＮ個の場合、（Ｎ＋］）
ｘ（Ｎ＋１）の行列であり、ノ１−ド的にはＲＯＭ等に
記憶される。また７０列には各単位要素（１〜Ｎ）が節
類に来るか否かを表わし、Ｘ０行には各単位要素（１〜
Ｎ）が節尾に来るか否かを表わすデータが書込まれる。

例えば°“赤い゛という文字列の遷移を遷移行列に書込
んだ例を第２図に示す。遷移行列の要素は０（遷移不可
能）か１（遷移可能）の２値のとちらかで表現され、１
ビツトで記憶される。なお、第２図においては表記＋＋
　＋　＋＋以外の行列要素は全て“０′”であり、その
表示を省略している。

次に遷移行列の作成について、今少し詳細に説明する。

まず遷移行列の作成にあたって遷移行列メモリを０”に
初期セットＣＭＣＸ、Ｙ）−〇］する。

次に文字列バー（ａｌ　、ａ２　＋ａＢ　＋・・・、ａ
ｌ）但し、■＝列の文字数とした場合、次式（１）に従って、文字列Ａ＼の文字遷移関係を遷移行列Ｍ（Ｘ
　、　Ｙ）に書込む。同様に認識対象となる文字列の全
てについて遷移関係を書込む遷移行列（１次〕の作成を
完了する。

このようにして作成された具体的な遷移行列（１次）Ｍ
（Ｘ、Ｙ）の例を第３図に示している。

この第３図より明らかなように例えば（Ｘ、Ｙ）＝（え
、＜）のビット位置が“′ピであるため、゛え″から“
く”への遷移が存在し、また（Ｘ　、　Ｙ）＝（え。

け）のビット位置が０“′であるため、“え”から′け
”への遷移が存在しないことを表わしている。

」１記は１次の遷移であるが、２次遷移、更には一般に
Ｍ次へ拡張したＭ次遷移行列も同様に次式（２）に従っ
て作成することが出来る。

Ｍ次遷移行列：Ｍｃｘｌ、ｘ２．ｘ３．・・・＋ＸＭ＋
、Ｙ）＋ＣＮ刊）Ｍ＋１次元Ｍ（ａ　＋　ｙ　＋　ａ　
＋−ＣＭ−１）　置・＋　ａｉ）　−１＋　（＋　＝Ｉ
　−Ｉ　＋１　）−（２）本発明の実施例は、この遷移
行列を認識対象の種類７話題２公野等毎に複数個備え、
必要に応じて特定の遷移行列を選択して認識処理を実行
し得るようにしたものである。

次に本発明の実施例を図面を参照して説明する。

第４図は本発明の一実施例装置の構成を示すブロック図
である。

第４図において、ｌは遷移行列指定手段であり、該指定
手段１は中央処理装置（ＣＰＵ）に接続されており、操
作面に設けた選択キーあるいは音声による選択人力手段
により構成される。また８は認識すべき音声情報の入力
される入力部、４は増幅部、５は音響処理部、６１，６
２．・・、６にはそれぞれ異なった種類の遷移行列を記
憶する遷移行列記憶手段、７は認識処理部である。

上記の如き構成において遷移行列記憶手段６１゜６２、
・・・、６Ｋにはそれぞれ異なる分野（例えば科学２文
学、経済等）の文章等から作成された異なる種類の遷移
行列が記憶されており、今入力部３に入力される音声情
報か例えば科学関係のものであれば、遷移行列指定手段
ｌを操作して科学関係の文章等から作成された遷移行列
記憶手段（例えはＭ　＋　）を選択指定し、この選択指
定してメモリＭ１に記憶している遷移行列を用いて認識
処理部７で認識処理動作が行なわれる。

次に」１記のようにして認識すべき情報の種類Ｃ分野）
等に応じて選択指定された遷移行列を用いた認識動作に
ついて説明する。

第５図は上記第４図に示した音響処理部５及び認識処理
部７の詳細ブロック図である。

第５図において、文節音声入力部２１に入力された音声
情報は次段の音響処理・比較部２２に入力される。この
音響処理・比較部２２は遷移行列メモリ２６を用いた処
理部分を除いて従来公知のものであり、例えば文節音声
入力部２１に入力された文節音声信号が音響処理部２２
により単音節毎に特徴抽出処理が行なわれ、各単音節毎
の特徴パターンが同処理部２２内のバッファに一時記憶
される。一方記憶装置２３には各単音節毎の標準パター
ンＰＨ（ｉ＝Ｉ〜Ｎ）か記憶されており、この標準パタ
ーンＰ１が順次読出されて処理・比較部２２において該
処理部内のバッファに記憶された入力音声の入力特徴パ
ターンとのマツチング計算が行なわれる。

従来技術によれば、この標準パターンと人力特徴パター
ンとのマツチング計算処理は全ての標準パターンについ
て行なわれていたが、本実施例によれば、後述するよう
に遷移行列メモリ２６に記憶法れた情報にもとずいて前
に候補として認識した音節に接続可能な音節（最初の場
合は先頭に来る可能性のある音節）の標準パターンとの
マツチングが計算され、最も近似したものが第１候補と
して、また順次近似したものか次候補として選出され、
その結果か候補音節メモリ２４に記憶される。即ち、音
節ラティス生成時に、−音節前のどの候補音節からも遷
移しない音節群は認識対照から除外するように処理され
る。

なお、遷移行列メモリ２６は遷移行列指定手段１によっ
て指定された遷移行列記憶手段６］、６２゜・・、６に
の一つのメモ’Ｊ（Ｍｉ）に対応したものである。

上記候補音節ラティスメモリ２４に記憶された複数個の
ｘ＊Ｎ音節の時系列は候補列作成部２５及び遷移行列メ
モリ２６より成る候補列出力部２７に入力され、該候補
列出力部２７において、特定の話題１分野等に対応した
遷移行列メモリ２６の内容を参照して遷移不可能な音節
遷移を含む候補列は除外して、遷移可能な候補列のみ、
信頼度の４．４．＞’組合せ順に作成され、この候補列
と辞書２８に記憶された文節とが辞書照合部２９により
照合され、一致すればその結果が文節出力部３０に出力
されるように構成されている。

次に遷移行列Ｍ（Ｘ、Ｙ）を用いた音節認識処理につい
て第６図に示す遷移行列を用いた候補音節作成処理ブロ
ック図を参照して説明する。

本実施例においては、結果として得る候補音節を時系列
順に候補音節ラティスバッファ２４に一次記憶する。ま
た上記した遷移行列情報はメモリ２６に記憶されており
、音節標準パターンはメモリ２３に記憶されている。

候補音節ラティス２４には認識結果が次表の如く記憶さ
れていくが今、第ｉ音節を認識する場合には、以下の如
く処理が実行される。

但　Ｊ（ｉ）’第ｉ音節候補数Ｓｌ、：第ｊ音節■候補音節番号令、前音節候補をＸ＝（ｓｉ　、、ｊ）ｊ−１〜Ｊ（ｉ−１）組合せ数：
　Ｊ（ｉ−］）　　Ｃ１−０のとき　Ｓｌ、ｊ＝ｏ）と
した場合、次式（３）に従って直前の複数個（Ｊ（ｉ−
１）個）の候補音節について遷移行列の和をとり、得ら
れた行ｍ（Ｙ）がＯである音節は遷移不可能であると指
定する。

ｍ（Ｙ）−ＶＭ（Ｓ−Ｙ）　　　　　　　　−・−−−
−−・−ｔ３１１　　’＋３＋＝　Ｍ　（Ｓ　　　　Ｙ）→−Ｍ（Ｓ　　　　Ｙ）＋・
→ｉ−１、Ｉ、　　　　　ｉ　−１，２。

Ｍ（Ｓｉ　Ｉ、Ｊｃｉ−’）＋　ｙ）この（３）式においてｍ（Ｙ）−ｏとなり、遷移不可能
と指定された音節群は　除外して、次の類似比較の処理
を行い、第ｉ音節の候補音節を出力し、候補音節ラティ
ス７に書込む。但し、１−１（節類の音節）のときは第
０行Ｍ（０，Ｙ）によって遷移不可能と指定された音節
群を除外して類似比較の処理を行なう。

以上を繰返して、−文節音声の候補音節ラティスの作成
を完了する。

今、−文節音声として「国民は」を入力した場合、音響
処理部２２により音節毎に特徴抽出が行なわれ、その音
節毎の特徴パターン肩　が入カバターン時系列バッファ
３１に記憶される。次に遷移行列を用いた候補音節作成
処理に移り、最初に第１音節の特徴パターンが次１が入
カバターンバッファ３２に読み込まれ、次にステップｎ
３に移行して前候補音節群により式（３）にしたがって
遷移行列の行を指定する。最初の場合はステップｎ４に
おいて第０行のＭ（０、Ｙ）が指定されその内容がバッ
ファ３３に一時記憶され、ステップｎ５の生起音節の指
定が成される。

次にステップｎ６に移行して入カバターンバッファ３２
に記憶された第１音節×１の特徴パターンかロードされ
、この特徴パターン次、と音節標塾パターンメモリ２３
に記憶された標準パターンノ内バッファ３３によって生
起音節と指定されて順次標準パターンバッファ３４に読
出される標準パターンとの間で類似比較が行なわれ（ス
テップｎ７）、その結果にもとずいて候補音節が出力さ
れ（ステップｎ８〕、その結果か候補音節ラティス２４
に書かれる。この実施例においては第１音節候補として
“ＫＯ”′、“＋　Ｇ　ＯＩＩ　、　Ｉ“ＢＯ”が記憶
される。

次にステップｎ２に戻り、第２音節特徴パターン×２か
バッファ３２に入力され、ステップｎ３に移行して、候
補音節ラティス２４の第１候補音節にもとずいて＋ＩＫ
Ｏ！１　、　ｌ“ＧＯ°゛、ＢＯ’”に対応した各行の
Ｍ（Ｓ、、１〜Ｂ＋ｙ）が指定され、ステップｎ４にお
いて、その遷移行列の和（ＯＲ）が作成されてその結果
がバッファ３３に一時記憶され、ステ九プｎ５の生起音
節の指定が成される。

次にステップｎ６に移行し、以下同様のステップｎ６〜
ｎ９を実行して第２候補音節“’ＫＵ’”、“Ｇ　Ｕ”
をメモリ２４に記憶する。

以上の動作を繰返して一文節の候補音節ラティスの作成
を完了する。

以上のようにして候補音節ラティス２４に候補例が記憶
されることになるが、遷移行列を用いない場合の従来方
式の場合と木刀式の場合の実例を入力音声「国民は」に
ついて次表に示す。

」−記の例から明らかなように１木刀式による方が正し
い文字列が候補列の上位に上がっている様子がわかる。

以」−の遷移行列は１次遷移であるが、２次遷移、史に
は一般的なＭ次遷移まで同じ手法で拡張することができ
る。

なおＭ次の遷移行列の作成は上述の式（２）に従い、ｎ
ｉＪ候補音節（Ｍ音節前まで）からの音節指定は次に示
す式（４）によって行なうことか出来る。

即ちＭ次遷移行列Ｍ（Ｘ、　、Ｘ２　、＝・、’ＸＭ、
Ｙ　）　ヘの拡張の場合、前音節候補列を＋ｘ、　　、ｘ　２．−　ツＸＭ）＝　（Ｓｉ−Ｍ、ｊ
ｌ　　Ｓｉ　−（Ｍ−１）、ｊ２　°”　Ｓｉ　−１、
ｊＭ）ｊｌ−１〜Ｊ（ｉ　−Ｍ）ｊ２−１−Ｊ（ｉ−（Ｍ−１））ｊＭ−１−Ｊ（＋　　１）組合せの数：Ｊ（ｉ−Ｍ）・Ｊ（ｉ−ＣＭ−１））・・
・Ｊ（ｉ−１）（ｌ！＜０のとき　　Ｓ、、、−０）とした場合、音節指定は＋−Ｍ、Ｊ　１．１（Ｍ−１）、ｊ２．・・・＋　Ｓｌ
−＋、ｊＭ、　Ｙ）−（ｉ）ｍ（Ｙ）＝ＶＭ（Ｓ　　　
−Ｓ。

ｊ、＝ｌ〜Ｊ（ｉ　−Ｍ）ｊ２−１〜Ｊ　（ｉ　−（Ｍ−１））ｊＭ−１〜Ｊ（ｉ−１）によって行なうことになる。

なお、Ｍの次数を大きくとれは、生成音節の限定が強く
なり効果（１より大きくなる。

次に上記候補列出力部２７で実行されている遷移行列を
用いた候補音節列作成動作について、第７図に示す遷移
行列を用いた候補列作成の処理ブロック図を参照して説
明する。

上記第５図に示した音響処理・比較部２２から出力され
た複数個の候補音節の時系列を記憶する候補音節ラティ
スメモリ２４の内容をもとに、候補音節列作成部４１に
おいて信頼度の高い順に候補列が作成され、その結果か
候補音節列バッファ４２に一次記憶される。この候補音
節列バッファ４２に記憶された候補音節列は遷移行列参
照部４３においてメモリ２６に記憶された遷移行列：Ｍ
（Ｘ。

Ｙ〕を参照して、遷移可能か不可能かを次式（５）によ
って判定部４４において判定し、可能な候補列のみ候補
音節列書込み部４５を介して候補音節列出力バッファ４
６に記憶していく。

令弟Ｊ番目の候補音節列をバー（ａｌ＋ａ２＋・・・、ａｌ）但し、ａ、：第１番目の音節番号 ■　１列の音節数とした場合、判定部４４による遷移行列Ｍ（Ｘ　、　Ｙ
）を用いた候補列否定はのいずれか一つが成立した場合に成される。

この（５）式において、いずれか一つが成立した遷移不
可能な音節列を含んだ候補音節列は除外され、次の候補
音節列について同様の判定を行ない、遷移可能な候補音
節列のみが出力バッファ４６に記憶される。

今、−文節音声として「国民は」を入力した場合、音響
処理・比較部２の処理により候補音節ラティスメモリ４
に次表の如き候補音節が時系列に記憶される。

このメモリ２４に記憶された音節ラティスを基に、信頼
度の高い順に候補列が作成され、遷移行列：ＭＣＸ、Ｙ
）　を参照して作成された候補列が遷移可能なもののみ
か出力され、この例の場合には候補音節列か次の如く出
力される。

遷移行列を参照しない従来方式によれば信頼度の最も高
い候補列としてｒＧＯＫＵＩ）　ＩＮＷＡＪが出力され
ることになるが、本方式によれば、この候補列の音節の
遷移例えば’ＫＵ“から“ＰＩ”が遷移不１丁能である
と遷移行列：Ｍ（Ｘ、Ｙ）を用いて判断され、以後の辞
書照合処理から除外される。

以−にの遷移行列は１次遷移であるが、２次遷移、更に
は一般的なＭ次遷移まで同じ手法で拡張することができ
る。

なおＭ次の遷移行列の作成は上述の式（２）に従い、候
補音節列の否定は次に示す式（６）によって行うことが
出来る。

即ち、Ｍ次遷移行列’Ｍ（ＸＩ　＋　Ｘ２　＋”’＋　
ｘＭＩ　Ｙ　）への拡張の場合、第ｊ候補列をＡ　ｊ　
−（ａ　１　＋　ａ　２　＋・・・。

ａｌ）とするとＭ（ａ；１．ａＨ（Ｍｌ）、、、、ａｌ）＝ＯＣ１川〜
Ｉ　＋　１　）−１１３＋（但し　ｌ≦０．ｌ＞１のと
きａ　ｉ　−０）のいずれか一つが成立した場合に否定
が成される。

なお、Ｍの次数を大きくとれば、候補音節列の限定が強
くなり、効果はより大きくなる。

秩フのようにして、候補列作成時に、各候補列に対して
行列Ｍを参照し、遷移しない音節の組合せを含む候補列
は除外されることになる。

上記した認識装置の認識対象は文節に限らず、音節、単
語１文章でもよく、また細分化された単位は音節に限ら
ず、音韻、単語でもよい。

またアルファベット等の文字列あるいはＦＯＲＴＲＡＮ
言語等のプログラム言語の文字列でもよい。

一般に認識対象語を構成する細分化した単位の遷移関係
の存在する文字列であれば、本発明を適用することが出
来る。

く効果〉以上の如く、本発明によれば、確度高く正しい候補列を
抽出することが出来るため、正しい文節等を認識する確
度が高くなり、結果的に高次の辞書照合等の処理量を減
少させることが出来ると共に、認識すべき情報の種類、
内容９話題２公野等に応じて、その都度必要に応じて話
題９分野別等の遷移行列を任意に選択指定して用いるこ
とが出来るため、遷移行列を用いた認識処理の効果をよ
り大きくすることが可能である。

なお、本発明において、話題毎の文章や文節について作
成したような同次数の異なる種類の遷移行列；Ｍ、、Ｍ
、から、それ等の和をとって合成することにより、簡単
に新しい遷移行列；Ｍ（Ｍ＝ＭｉＵＭｊ　　）を作成す
ることが出来る。

【図面の簡単な説明】

第１図は１次遷移行列を示す図、第２図は文字列の遷移
を書込んだ遷移行列例を示す図、第３図は文節文字列の
遷移行列例を示す図、第４図は本発明を実施した認識装
置の一実施例の構成を示すブロック図、第５図は遷移行
列を用いた認識処理部の詳細ブロック図、第６図は遷移
行列を用いた候補音節作成の処理フロー図、第７図は遷
移行列を用いた候補列作成の処理ブロック図である。１・・遷移行列指定手段、２・・・中央処理装置（ＣＰ
Ｕ）、６１　、６２　、・・・、６Ｋ・・・遷移行列記
憶手段、７・・・認識処理部。師（財）第１図話尾　話頭 ■ ０″″″　　　　　　　　　　　　　　　　基、第３図

Claims

【特許請求の範囲】１、一区切りの認識すべき情報をより細分化されたＮ個
の単位要素で認識する認識装置において、認識すべき所
定の単位要素列について（Ｎ＋１）個の単位要素間の接
続関係である遷移関係を記述した異なる遷移行列を複数
種類記憶した遷移行列記憶手段と、上記遷移行列記憶手段に記憶された複数種類の異なる遷
移行列の所定の遷移行列を指定する遷移行列指定手段と
、上記遷移行列指定手段により指定された遷移行列にもと
ずいて認識処理する処理手段と、を備えたことを特徴と
する認識装置。２　一区切りの認識すべき情報は単語あるいは文節単位
の音声情報であり、単位要素列は単語あるいは文節単位
の文字列であるところの特許請求の範囲第１項記載の認
識装置。３、複数種類の異なる遷移行列は、それぞれ異なる分野
の文章から作成された複数個の遷移行列であるところの
特許請求の範囲第１項記載の認識装置。