JPS5961897A - 認識装置 - Google Patents
認識装置Info
- Publication number
- JPS5961897A JPS5961897A JP57172786A JP17278682A JPS5961897A JP S5961897 A JPS5961897 A JP S5961897A JP 57172786 A JP57172786 A JP 57172786A JP 17278682 A JP17278682 A JP 17278682A JP S5961897 A JPS5961897 A JP S5961897A
- Authority
- JP
- Japan
- Prior art keywords
- transition
- syllable
- candidate
- transition matrix
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000007704 transition Effects 0.000 claims description 117
- 239000011159 matrix material Substances 0.000 claims description 73
- 238000000034 method Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 7
- 235000016496 Panda oleosa Nutrition 0.000 description 4
- 240000000220 Panda oleosa Species 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 229910007933 Si-M Inorganic materials 0.000 description 1
- 229910008318 Si—M Inorganic materials 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
く技術分野〉
本発明は認識装置の改良に関し、更に詳細には例えば文
節等の一区切りの音声等の一区切りの認識すべき情報を
音韻、かな、音節2文節等のより細分化された単位要素
で認識する認識装置の改良に関するものである。
節等の一区切りの音声等の一区切りの認識すべき情報を
音韻、かな、音節2文節等のより細分化された単位要素
で認識する認識装置の改良に関するものである。
〈従来技術〉
文節等の一区切りの音声等を音韻、かな、音節等のより
細分化された単位で認識する場合、従来一般的には入力
された認識すべき一区切りの音声情報等を例えば音響処
理して音韻、音節等の単位毎の特徴ベクトル入カバター
ンを得ると共に、この入カバターンと予め記憶されてい
る標準パターンとのマツチングを行って、入力された情
報を候補単位列として類似度の高いものから出力し、こ
の出力された候補単位列と文節等の辞書の内容とを照合
して入力された情報に対する文節等の一区切りの情報を
認識している。
細分化された単位で認識する場合、従来一般的には入力
された認識すべき一区切りの音声情報等を例えば音響処
理して音韻、音節等の単位毎の特徴ベクトル入カバター
ンを得ると共に、この入カバターンと予め記憶されてい
る標準パターンとのマツチングを行って、入力された情
報を候補単位列として類似度の高いものから出力し、こ
の出力された候補単位列と文節等の辞書の内容とを照合
して入力された情報に対する文節等の一区切りの情報を
認識している。
しかし、このような従来の方法によれば、全ての音韻、
音節等の標準パターンと入カバターンとのマツチングを
行なって類似度を算出し、類似度と の高いものから順に候補音節i(て出力している。
音節等の標準パターンと入カバターンとのマツチングを
行なって類似度を算出し、類似度と の高いものから順に候補音節i(て出力している。
したがって1例えば拗音を含む単音節単位で認識する場
合、各音節単位全てについて100種以上の単音節の標
準パターンと入カバターンとの間でマツチングを行う必
要があり、その処理時間か多大なものとなっていた。
合、各音節単位全てについて100種以上の単音節の標
準パターンと入カバターンとの間でマツチングを行う必
要があり、その処理時間か多大なものとなっていた。
また、その後に類似度の高いものから出力される候補単
位列の全てについて辞書照合処理を行なう必要があり、
その処理時間か長くなり、正しい文節等を認識する確度
が向上せず、結果的に全体の認識に要する処理量が膨大
なものになっていた。
位列の全てについて辞書照合処理を行なう必要があり、
その処理時間か長くなり、正しい文節等を認識する確度
が向上せず、結果的に全体の認識に要する処理量が膨大
なものになっていた。
〈目的〉
本発明は、上記従来の欠点を除去した認識装置を提供す
ることを目的とし、正しい文節等の一区切りの認識すべ
き情報を認識する確度を向上させると共に、異なる話題
2分野等の異なる種類の認識すべき情報に応じた処理を
指定することが出来、結果的に全体の認識に要する処理
量を減少させることのできる認識装置を提供するもので
ある。
ることを目的とし、正しい文節等の一区切りの認識すべ
き情報を認識する確度を向上させると共に、異なる話題
2分野等の異なる種類の認識すべき情報に応じた処理を
指定することが出来、結果的に全体の認識に要する処理
量を減少させることのできる認識装置を提供するもので
ある。
〈実施例〉
以下、本発明の認識装置を文節等の一区切りの音声入力
を音節等のより細分化された単位要素で認識する場合の
例を実施例として説明する。
を音節等のより細分化された単位要素で認識する場合の
例を実施例として説明する。
本発明の実施例によれば、文節等の一区切りの音声等の
認識すべき情報を音韻、かな、音節等のより細分化され
たN個の単位要素で認識する認識装置において、認識対
象となる文節あるいは文章等の文字(単位要素)列につ
いて、その話題あるいは分野毎に、(N+1)個の文字
(単位要素)間の接続関係である遷移関係を記述した異
なる遷移行列を複数種類記憶した遷移行列記憶手段と、
この遷移行列記憶手段に記憶された複数種類の遷移行列
より、認識すべき文字列の内容(種類1分野等)に応じ
て所望の遷移行列を指定する遷移行列指定手段と、この
遷移行列記憶手段番こより指定された遷移行列にもとす
いて、音節(単位要素〕ラティス生成時に、−音節(単
位要素)前のと゛のイ侯補音節(単位要素)からも遷移
しなし)音節(単位要素)群は認識対照から除外し、ま
た(ま及び候ン甫列作成時に各候補列に対して遷移行列
を参照し、遷移しない音節c単位要素)の組合せを含む
候7m列は除外する等の認識処理を行う処理手段とを備
えて、次の高次の辞書照合の際の処理量の削減を図るよ
うに構成されている。
認識すべき情報を音韻、かな、音節等のより細分化され
たN個の単位要素で認識する認識装置において、認識対
象となる文節あるいは文章等の文字(単位要素)列につ
いて、その話題あるいは分野毎に、(N+1)個の文字
(単位要素)間の接続関係である遷移関係を記述した異
なる遷移行列を複数種類記憶した遷移行列記憶手段と、
この遷移行列記憶手段に記憶された複数種類の遷移行列
より、認識すべき文字列の内容(種類1分野等)に応じ
て所望の遷移行列を指定する遷移行列指定手段と、この
遷移行列記憶手段番こより指定された遷移行列にもとす
いて、音節(単位要素〕ラティス生成時に、−音節(単
位要素)前のと゛のイ侯補音節(単位要素)からも遷移
しなし)音節(単位要素)群は認識対照から除外し、ま
た(ま及び候ン甫列作成時に各候補列に対して遷移行列
を参照し、遷移しない音節c単位要素)の組合せを含む
候7m列は除外する等の認識処理を行う処理手段とを備
えて、次の高次の辞書照合の際の処理量の削減を図るよ
うに構成されている。
まず、本発明の詳細な説明に先立ち、本発明の認識装置
に用いられる単位要素間の接続関係である遷移関係を示
した遷移付列番こつし1て説明する。
に用いられる単位要素間の接続関係である遷移関係を示
した遷移付列番こつし1て説明する。
一般に日本語文章は、全てかな文字で表現した場合、か
な文字列に対応しソこ音節列で表現できる。
な文字列に対応しソこ音節列で表現できる。
例えば文節「地球の」は“ち゛“きゆ”“う゛“°の゛
という4個の単音節といわれる単位要素力)ら成り立っ
ている。2つの音節間の接続関係(“ち力)ら “きゅ
、″きゆ“から “う、“′う゛から ゛の゛)を、日
本語全て、あるいは特定の分野2話題番こおける文章等
について調べると接続(遷移;以下遷移ということばを
使う)しない音節対かある。例えばば行の音節の前には
1“ん++ 、 Itつ”5以外はこない。またパにや
′は語頭にはこないし、“へパ(へと発声するもの)は
語尾にこない。
という4個の単音節といわれる単位要素力)ら成り立っ
ている。2つの音節間の接続関係(“ち力)ら “きゅ
、″きゆ“から “う、“′う゛から ゛の゛)を、日
本語全て、あるいは特定の分野2話題番こおける文章等
について調べると接続(遷移;以下遷移ということばを
使う)しない音節対かある。例えばば行の音節の前には
1“ん++ 、 Itつ”5以外はこない。またパにや
′は語頭にはこないし、“へパ(へと発声するもの)は
語尾にこない。
このような文節を構成する音節の1次の遷移関係を以下
に示す式(1)に従って記述して、第1図に示すような
遷移行列M(X、Y)を作成する。
に示す式(1)に従って記述して、第1図に示すような
遷移行列M(X、Y)を作成する。
第1図において遷移行列M(M、Y)は単位要素列であ
る文字列の文字Xから次の文字Yへの遷移を記述したも
のであり、単位要素(音節)がN個の場合、(N+])
x(N+1)の行列であり、ノ1−ド的にはROM等に
記憶される。また70列には各単位要素(1〜N)が節
類に来るか否かを表わし、X0行には各単位要素(1〜
N)が節尾に来るか否かを表わすデータが書込まれる。
る文字列の文字Xから次の文字Yへの遷移を記述したも
のであり、単位要素(音節)がN個の場合、(N+])
x(N+1)の行列であり、ノ1−ド的にはROM等に
記憶される。また70列には各単位要素(1〜N)が節
類に来るか否かを表わし、X0行には各単位要素(1〜
N)が節尾に来るか否かを表わすデータが書込まれる。
例えば°“赤い゛という文字列の遷移を遷移行列に書込
んだ例を第2図に示す。遷移行列の要素は0(遷移不可
能)か1(遷移可能)の2値のとちらかで表現され、1
ビツトで記憶される。なお、第2図においては表記++
+ ++以外の行列要素は全て“0′”であり、その
表示を省略している。
んだ例を第2図に示す。遷移行列の要素は0(遷移不可
能)か1(遷移可能)の2値のとちらかで表現され、1
ビツトで記憶される。なお、第2図においては表記++
+ ++以外の行列要素は全て“0′”であり、その
表示を省略している。
次に遷移行列の作成について、今少し詳細に説明する。
まず遷移行列の作成にあたって遷移行列メモリを0”に
初期セットCMCX、Y)−〇]する。
初期セットCMCX、Y)−〇]する。
次に文字列バー(al 、a2 +aB +・・・、a
l)但し、■=列の文字数 とした場合、次式(1) に従って、文字列A\の文字遷移関係を遷移行列M(X
、 Y)に書込む。同様に認識対象となる文字列の全
てについて遷移関係を書込む遷移行列(1次〕の作成を
完了する。
l)但し、■=列の文字数 とした場合、次式(1) に従って、文字列A\の文字遷移関係を遷移行列M(X
、 Y)に書込む。同様に認識対象となる文字列の全
てについて遷移関係を書込む遷移行列(1次〕の作成を
完了する。
このようにして作成された具体的な遷移行列(1次)M
(X、Y)の例を第3図に示している。
(X、Y)の例を第3図に示している。
この第3図より明らかなように例えば(X、Y)=(え
、<)のビット位置が“′ピであるため、゛え″から“
く”への遷移が存在し、また(X 、 Y)=(え。
、<)のビット位置が“′ピであるため、゛え″から“
く”への遷移が存在し、また(X 、 Y)=(え。
け)のビット位置が0“′であるため、“え”から′け
”への遷移が存在しないことを表わしている。
”への遷移が存在しないことを表わしている。
」1記は1次の遷移であるが、2次遷移、更には一般に
M次へ拡張したM次遷移行列も同様に次式(2)に従っ
て作成することが出来る。
M次へ拡張したM次遷移行列も同様に次式(2)に従っ
て作成することが出来る。
M次遷移行列:Mcxl、x2.x3.・・・+XM+
、Y)+CN刊)M+1次元M(a + y + a
+−CM−1) 置・+ ai) −1+ (+ =I
−I +1 )−(2)本発明の実施例は、この遷移
行列を認識対象の種類7話題2公野等毎に複数個備え、
必要に応じて特定の遷移行列を選択して認識処理を実行
し得るようにしたものである。
、Y)+CN刊)M+1次元M(a + y + a
+−CM−1) 置・+ ai) −1+ (+ =I
−I +1 )−(2)本発明の実施例は、この遷移
行列を認識対象の種類7話題2公野等毎に複数個備え、
必要に応じて特定の遷移行列を選択して認識処理を実行
し得るようにしたものである。
次に本発明の実施例を図面を参照して説明する。
第4図は本発明の一実施例装置の構成を示すブロック図
である。
である。
第4図において、lは遷移行列指定手段であり、該指定
手段1は中央処理装置(CPU)に接続されており、操
作面に設けた選択キーあるいは音声による選択人力手段
により構成される。また8は認識すべき音声情報の入力
される入力部、4は増幅部、5は音響処理部、61,6
2.・・、6にはそれぞれ異なった種類の遷移行列を記
憶する遷移行列記憶手段、7は認識処理部である。
手段1は中央処理装置(CPU)に接続されており、操
作面に設けた選択キーあるいは音声による選択人力手段
により構成される。また8は認識すべき音声情報の入力
される入力部、4は増幅部、5は音響処理部、61,6
2.・・、6にはそれぞれ異なった種類の遷移行列を記
憶する遷移行列記憶手段、7は認識処理部である。
上記の如き構成において遷移行列記憶手段61゜62、
・・・、6Kにはそれぞれ異なる分野(例えば科学2文
学、経済等)の文章等から作成された異なる種類の遷移
行列が記憶されており、今入力部3に入力される音声情
報か例えば科学関係のものであれば、遷移行列指定手段
lを操作して科学関係の文章等から作成された遷移行列
記憶手段(例えはM + )を選択指定し、この選択指
定してメモリM1に記憶している遷移行列を用いて認識
処理部7で認識処理動作が行なわれる。
・・・、6Kにはそれぞれ異なる分野(例えば科学2文
学、経済等)の文章等から作成された異なる種類の遷移
行列が記憶されており、今入力部3に入力される音声情
報か例えば科学関係のものであれば、遷移行列指定手段
lを操作して科学関係の文章等から作成された遷移行列
記憶手段(例えはM + )を選択指定し、この選択指
定してメモリM1に記憶している遷移行列を用いて認識
処理部7で認識処理動作が行なわれる。
次に」1記のようにして認識すべき情報の種類C分野)
等に応じて選択指定された遷移行列を用いた認識動作に
ついて説明する。
等に応じて選択指定された遷移行列を用いた認識動作に
ついて説明する。
第5図は上記第4図に示した音響処理部5及び認識処理
部7の詳細ブロック図である。
部7の詳細ブロック図である。
第5図において、文節音声入力部21に入力された音声
情報は次段の音響処理・比較部22に入力される。この
音響処理・比較部22は遷移行列メモリ26を用いた処
理部分を除いて従来公知のものであり、例えば文節音声
入力部21に入力された文節音声信号が音響処理部22
により単音節毎に特徴抽出処理が行なわれ、各単音節毎
の特徴パターンが同処理部22内のバッファに一時記憶
される。一方記憶装置23には各単音節毎の標準パター
ンPH(i=I〜N)か記憶されており、この標準パタ
ーンP1が順次読出されて処理・比較部22において該
処理部内のバッファに記憶された入力音声の入力特徴パ
ターンとのマツチング計算が行なわれる。
情報は次段の音響処理・比較部22に入力される。この
音響処理・比較部22は遷移行列メモリ26を用いた処
理部分を除いて従来公知のものであり、例えば文節音声
入力部21に入力された文節音声信号が音響処理部22
により単音節毎に特徴抽出処理が行なわれ、各単音節毎
の特徴パターンが同処理部22内のバッファに一時記憶
される。一方記憶装置23には各単音節毎の標準パター
ンPH(i=I〜N)か記憶されており、この標準パタ
ーンP1が順次読出されて処理・比較部22において該
処理部内のバッファに記憶された入力音声の入力特徴パ
ターンとのマツチング計算が行なわれる。
従来技術によれば、この標準パターンと人力特徴パター
ンとのマツチング計算処理は全ての標準パターンについ
て行なわれていたが、本実施例によれば、後述するよう
に遷移行列メモリ26に記憶法れた情報にもとずいて前
に候補として認識した音節に接続可能な音節(最初の場
合は先頭に来る可能性のある音節)の標準パターンとの
マツチングが計算され、最も近似したものが第1候補と
して、また順次近似したものか次候補として選出され、
その結果か候補音節メモリ24に記憶される。即ち、音
節ラティス生成時に、−音節前のどの候補音節からも遷
移しない音節群は認識対照から除外するように処理され
る。
ンとのマツチング計算処理は全ての標準パターンについ
て行なわれていたが、本実施例によれば、後述するよう
に遷移行列メモリ26に記憶法れた情報にもとずいて前
に候補として認識した音節に接続可能な音節(最初の場
合は先頭に来る可能性のある音節)の標準パターンとの
マツチングが計算され、最も近似したものが第1候補と
して、また順次近似したものか次候補として選出され、
その結果か候補音節メモリ24に記憶される。即ち、音
節ラティス生成時に、−音節前のどの候補音節からも遷
移しない音節群は認識対照から除外するように処理され
る。
なお、遷移行列メモリ26は遷移行列指定手段1によっ
て指定された遷移行列記憶手段6]、62゜・・、6に
の一つのメモ’J(Mi)に対応したものである。
て指定された遷移行列記憶手段6]、62゜・・、6に
の一つのメモ’J(Mi)に対応したものである。
上記候補音節ラティスメモリ24に記憶された複数個の
x*N音節の時系列は候補列作成部25及び遷移行列メ
モリ26より成る候補列出力部27に入力され、該候補
列出力部27において、特定の話題1分野等に対応した
遷移行列メモリ26の内容を参照して遷移不可能な音節
遷移を含む候補列は除外して、遷移可能な候補列のみ、
信頼度の4.4.>’組合せ順に作成され、この候補列
と辞書28に記憶された文節とが辞書照合部29により
照合され、一致すればその結果が文節出力部30に出力
されるように構成されている。
x*N音節の時系列は候補列作成部25及び遷移行列メ
モリ26より成る候補列出力部27に入力され、該候補
列出力部27において、特定の話題1分野等に対応した
遷移行列メモリ26の内容を参照して遷移不可能な音節
遷移を含む候補列は除外して、遷移可能な候補列のみ、
信頼度の4.4.>’組合せ順に作成され、この候補列
と辞書28に記憶された文節とが辞書照合部29により
照合され、一致すればその結果が文節出力部30に出力
されるように構成されている。
次に遷移行列M(X、Y)を用いた音節認識処理につい
て第6図に示す遷移行列を用いた候補音節作成処理ブロ
ック図を参照して説明する。
て第6図に示す遷移行列を用いた候補音節作成処理ブロ
ック図を参照して説明する。
本実施例においては、結果として得る候補音節を時系列
順に候補音節ラティスバッファ24に一次記憶する。ま
た上記した遷移行列情報はメモリ26に記憶されており
、音節標準パターンはメモリ23に記憶されている。
順に候補音節ラティスバッファ24に一次記憶する。ま
た上記した遷移行列情報はメモリ26に記憶されており
、音節標準パターンはメモリ23に記憶されている。
候補音節ラティス24には認識結果が次表の如く記憶さ
れていくが今、第i音節を認識する場合には、以下の如
く処理が実行される。
れていくが今、第i音節を認識する場合には、以下の如
く処理が実行される。
但 J(i)’第i音節候補数
Sl、:第j音節■候補音節番号
令、前音節候補を
X=(si 、、j)j−1〜J(i−1)組合せ数:
J(i−]) C1−0のとき Sl、j=o)と
した場合、次式(3)に従って直前の複数個(J(i−
1)個)の候補音節について遷移行列の和をとり、得ら
れた行m(Y)がOである音節は遷移不可能であると指
定する。
J(i−]) C1−0のとき Sl、j=o)と
した場合、次式(3)に従って直前の複数個(J(i−
1)個)の候補音節について遷移行列の和をとり、得ら
れた行m(Y)がOである音節は遷移不可能であると指
定する。
m(Y)−VM(S−Y) −・−−−
−−・−t311 ’+3+ = M (S Y)→−M(S Y)+・
→i−1、I、 i −1,2。
−−・−t311 ’+3+ = M (S Y)→−M(S Y)+・
→i−1、I、 i −1,2。
M(Si I、Jci−’)+ y)
この(3)式においてm(Y)−oとなり、遷移不可能
と指定された音節群は 除外して、次の類似比較の処理
を行い、第i音節の候補音節を出力し、候補音節ラティ
ス7に書込む。但し、1−1(節類の音節)のときは第
0行M(0,Y)によって遷移不可能と指定された音節
群を除外して類似比較の処理を行なう。
と指定された音節群は 除外して、次の類似比較の処理
を行い、第i音節の候補音節を出力し、候補音節ラティ
ス7に書込む。但し、1−1(節類の音節)のときは第
0行M(0,Y)によって遷移不可能と指定された音節
群を除外して類似比較の処理を行なう。
以上を繰返して、−文節音声の候補音節ラティスの作成
を完了する。
を完了する。
今、−文節音声として「国民は」を入力した場合、音響
処理部22により音節毎に特徴抽出が行なわれ、その音
節毎の特徴パターン肩 が入カバターン時系列バッファ
31に記憶される。次に遷移行列を用いた候補音節作成
処理に移り、最初に第1音節の特徴パターンが次1が入
カバターンバッファ32に読み込まれ、次にステップn
3に移行して前候補音節群により式(3)にしたがって
遷移行列の行を指定する。最初の場合はステップn4に
おいて第0行のM(0、Y)が指定されその内容がバッ
ファ33に一時記憶され、ステップn5の生起音節の指
定が成される。
処理部22により音節毎に特徴抽出が行なわれ、その音
節毎の特徴パターン肩 が入カバターン時系列バッファ
31に記憶される。次に遷移行列を用いた候補音節作成
処理に移り、最初に第1音節の特徴パターンが次1が入
カバターンバッファ32に読み込まれ、次にステップn
3に移行して前候補音節群により式(3)にしたがって
遷移行列の行を指定する。最初の場合はステップn4に
おいて第0行のM(0、Y)が指定されその内容がバッ
ファ33に一時記憶され、ステップn5の生起音節の指
定が成される。
次にステップn6に移行して入カバターンバッファ32
に記憶された第1音節×1の特徴パターンかロードされ
、この特徴パターン次、と音節標塾パターンメモリ23
に記憶された標準パターンノ内バッファ33によって生
起音節と指定されて順次標準パターンバッファ34に読
出される標準パターンとの間で類似比較が行なわれ(ス
テップn7)、その結果にもとずいて候補音節が出力さ
れ(ステップn8〕、その結果か候補音節ラティス24
に書かれる。この実施例においては第1音節候補として
“KO”′、“+ G OII 、 I“BO”が記憶
される。
に記憶された第1音節×1の特徴パターンかロードされ
、この特徴パターン次、と音節標塾パターンメモリ23
に記憶された標準パターンノ内バッファ33によって生
起音節と指定されて順次標準パターンバッファ34に読
出される標準パターンとの間で類似比較が行なわれ(ス
テップn7)、その結果にもとずいて候補音節が出力さ
れ(ステップn8〕、その結果か候補音節ラティス24
に書かれる。この実施例においては第1音節候補として
“KO”′、“+ G OII 、 I“BO”が記憶
される。
次にステップn2に戻り、第2音節特徴パターン×2か
バッファ32に入力され、ステップn3に移行して、候
補音節ラティス24の第1候補音節にもとずいて+IK
O!1 、 l“GO°゛、BO’”に対応した各行の
M(S、、1〜B+y)が指定され、ステップn4にお
いて、その遷移行列の和(OR)が作成されてその結果
がバッファ33に一時記憶され、ステ九プn5の生起音
節の指定が成される。
バッファ32に入力され、ステップn3に移行して、候
補音節ラティス24の第1候補音節にもとずいて+IK
O!1 、 l“GO°゛、BO’”に対応した各行の
M(S、、1〜B+y)が指定され、ステップn4にお
いて、その遷移行列の和(OR)が作成されてその結果
がバッファ33に一時記憶され、ステ九プn5の生起音
節の指定が成される。
次にステップn6に移行し、以下同様のステップn6〜
n9を実行して第2候補音節“’KU’”、“G U”
をメモリ24に記憶する。
n9を実行して第2候補音節“’KU’”、“G U”
をメモリ24に記憶する。
以上の動作を繰返して一文節の候補音節ラティスの作成
を完了する。
を完了する。
以上のようにして候補音節ラティス24に候補例が記憶
されることになるが、遷移行列を用いない場合の従来方
式の場合と木刀式の場合の実例を入力音声「国民は」に
ついて次表に示す。
されることになるが、遷移行列を用いない場合の従来方
式の場合と木刀式の場合の実例を入力音声「国民は」に
ついて次表に示す。
」−記の例から明らかなように1木刀式による方が正し
い文字列が候補列の上位に上がっている様子がわかる。
い文字列が候補列の上位に上がっている様子がわかる。
以」−の遷移行列は1次遷移であるが、2次遷移、史に
は一般的なM次遷移まで同じ手法で拡張することができ
る。
は一般的なM次遷移まで同じ手法で拡張することができ
る。
なおM次の遷移行列の作成は上述の式(2)に従い、n
iJ候補音節(M音節前まで)からの音節指定は次に示
す式(4)によって行なうことか出来る。
iJ候補音節(M音節前まで)からの音節指定は次に示
す式(4)によって行なうことか出来る。
即ちM次遷移行列M(X、 、X2 、=・、’XM、
Y ) ヘの拡張の場合、前音節候補列を +x、 、x 2.− ツXM)= (Si−M、j
l Si −(M−1)、j2 °” Si −1、
jM)jl−1〜J(i −M) j2−1−J(i−(M−1)) jM−1−J(+ 1) 組合せの数:J(i−M)・J(i−CM−1))・・
・J(i−1)(l!<0のとき S、、、−0) とした場合、 音節指定は +−M、J 1.1(M−1)、j2.・・・+ Sl
−+、jM、 Y)−(i)m(Y)=VM(S
−S。
Y ) ヘの拡張の場合、前音節候補列を +x、 、x 2.− ツXM)= (Si−M、j
l Si −(M−1)、j2 °” Si −1、
jM)jl−1〜J(i −M) j2−1−J(i−(M−1)) jM−1−J(+ 1) 組合せの数:J(i−M)・J(i−CM−1))・・
・J(i−1)(l!<0のとき S、、、−0) とした場合、 音節指定は +−M、J 1.1(M−1)、j2.・・・+ Sl
−+、jM、 Y)−(i)m(Y)=VM(S
−S。
j、=l〜J(i −M)
j2−1〜J (i −(M−1))
jM−1〜J(i−1)
によって行なうことになる。
なお、Mの次数を大きくとれは、生成音節の限定が強く
なり効果(1より大きくなる。
なり効果(1より大きくなる。
次に上記候補列出力部27で実行されている遷移行列を
用いた候補音節列作成動作について、第7図に示す遷移
行列を用いた候補列作成の処理ブロック図を参照して説
明する。
用いた候補音節列作成動作について、第7図に示す遷移
行列を用いた候補列作成の処理ブロック図を参照して説
明する。
上記第5図に示した音響処理・比較部22から出力され
た複数個の候補音節の時系列を記憶する候補音節ラティ
スメモリ24の内容をもとに、候補音節列作成部41に
おいて信頼度の高い順に候補列が作成され、その結果か
候補音節列バッファ42に一次記憶される。この候補音
節列バッファ42に記憶された候補音節列は遷移行列参
照部43においてメモリ26に記憶された遷移行列:M
(X。
た複数個の候補音節の時系列を記憶する候補音節ラティ
スメモリ24の内容をもとに、候補音節列作成部41に
おいて信頼度の高い順に候補列が作成され、その結果か
候補音節列バッファ42に一次記憶される。この候補音
節列バッファ42に記憶された候補音節列は遷移行列参
照部43においてメモリ26に記憶された遷移行列:M
(X。
Y〕を参照して、遷移可能か不可能かを次式(5)によ
って判定部44において判定し、可能な候補列のみ候補
音節列書込み部45を介して候補音節列出力バッファ4
6に記憶していく。
って判定部44において判定し、可能な候補列のみ候補
音節列書込み部45を介して候補音節列出力バッファ4
6に記憶していく。
令弟J番目の候補音節列を
バー(al+a2+・・・、al)
但し、a、:第1番目の音節番号
■ 1列の音節数
とした場合、判定部44による遷移行列M(X 、 Y
)を用いた候補列否定は のいずれか一つが成立した場合に成される。
)を用いた候補列否定は のいずれか一つが成立した場合に成される。
この(5)式において、いずれか一つが成立した遷移不
可能な音節列を含んだ候補音節列は除外され、次の候補
音節列について同様の判定を行ない、遷移可能な候補音
節列のみが出力バッファ46に記憶される。
可能な音節列を含んだ候補音節列は除外され、次の候補
音節列について同様の判定を行ない、遷移可能な候補音
節列のみが出力バッファ46に記憶される。
今、−文節音声として「国民は」を入力した場合、音響
処理・比較部2の処理により候補音節ラティスメモリ4
に次表の如き候補音節が時系列に記憶される。
処理・比較部2の処理により候補音節ラティスメモリ4
に次表の如き候補音節が時系列に記憶される。
このメモリ24に記憶された音節ラティスを基に、信頼
度の高い順に候補列が作成され、遷移行列:MCX、Y
) を参照して作成された候補列が遷移可能なもののみ
か出力され、この例の場合には候補音節列か次の如く出
力される。
度の高い順に候補列が作成され、遷移行列:MCX、Y
) を参照して作成された候補列が遷移可能なもののみ
か出力され、この例の場合には候補音節列か次の如く出
力される。
遷移行列を参照しない従来方式によれば信頼度の最も高
い候補列としてrGOKUI) INWAJが出力され
ることになるが、本方式によれば、この候補列の音節の
遷移例えば’KU“から“PI”が遷移不1丁能である
と遷移行列:M(X、Y)を用いて判断され、以後の辞
書照合処理から除外される。
い候補列としてrGOKUI) INWAJが出力され
ることになるが、本方式によれば、この候補列の音節の
遷移例えば’KU“から“PI”が遷移不1丁能である
と遷移行列:M(X、Y)を用いて判断され、以後の辞
書照合処理から除外される。
以−にの遷移行列は1次遷移であるが、2次遷移、更に
は一般的なM次遷移まで同じ手法で拡張することができ
る。
は一般的なM次遷移まで同じ手法で拡張することができ
る。
なおM次の遷移行列の作成は上述の式(2)に従い、候
補音節列の否定は次に示す式(6)によって行うことが
出来る。
補音節列の否定は次に示す式(6)によって行うことが
出来る。
即ち、M次遷移行列’M(XI + X2 +”’+
xMI Y )への拡張の場合、第j候補列をA j
−(a 1 + a 2 +・・・。
xMI Y )への拡張の場合、第j候補列をA j
−(a 1 + a 2 +・・・。
al)とすると
M(a;1.aH(Ml)、、、、al)=OC1川〜
I + 1 )−113+(但し l≦0.l>1のと
きa i −0)のいずれか一つが成立した場合に否定
が成される。
I + 1 )−113+(但し l≦0.l>1のと
きa i −0)のいずれか一つが成立した場合に否定
が成される。
なお、Mの次数を大きくとれば、候補音節列の限定が強
くなり、効果はより大きくなる。
くなり、効果はより大きくなる。
秩フのようにして、候補列作成時に、各候補列に対して
行列Mを参照し、遷移しない音節の組合せを含む候補列
は除外されることになる。
行列Mを参照し、遷移しない音節の組合せを含む候補列
は除外されることになる。
上記した認識装置の認識対象は文節に限らず、音節、単
語1文章でもよく、また細分化された単位は音節に限ら
ず、音韻、単語でもよい。
語1文章でもよく、また細分化された単位は音節に限ら
ず、音韻、単語でもよい。
またアルファベット等の文字列あるいはFORTRAN
言語等のプログラム言語の文字列でもよい。
言語等のプログラム言語の文字列でもよい。
一般に認識対象語を構成する細分化した単位の遷移関係
の存在する文字列であれば、本発明を適用することが出
来る。
の存在する文字列であれば、本発明を適用することが出
来る。
く効果〉
以上の如く、本発明によれば、確度高く正しい候補列を
抽出することが出来るため、正しい文節等を認識する確
度が高くなり、結果的に高次の辞書照合等の処理量を減
少させることが出来ると共に、認識すべき情報の種類、
内容9話題2公野等に応じて、その都度必要に応じて話
題9分野別等の遷移行列を任意に選択指定して用いるこ
とが出来るため、遷移行列を用いた認識処理の効果をよ
り大きくすることが可能である。
抽出することが出来るため、正しい文節等を認識する確
度が高くなり、結果的に高次の辞書照合等の処理量を減
少させることが出来ると共に、認識すべき情報の種類、
内容9話題2公野等に応じて、その都度必要に応じて話
題9分野別等の遷移行列を任意に選択指定して用いるこ
とが出来るため、遷移行列を用いた認識処理の効果をよ
り大きくすることが可能である。
なお、本発明において、話題毎の文章や文節について作
成したような同次数の異なる種類の遷移行列;M、、M
、から、それ等の和をとって合成することにより、簡単
に新しい遷移行列;M(M=MiUMj )を作成す
ることが出来る。
成したような同次数の異なる種類の遷移行列;M、、M
、から、それ等の和をとって合成することにより、簡単
に新しい遷移行列;M(M=MiUMj )を作成す
ることが出来る。
第1図は1次遷移行列を示す図、第2図は文字列の遷移
を書込んだ遷移行列例を示す図、第3図は文節文字列の
遷移行列例を示す図、第4図は本発明を実施した認識装
置の一実施例の構成を示すブロック図、第5図は遷移行
列を用いた認識処理部の詳細ブロック図、第6図は遷移
行列を用いた候補音節作成の処理フロー図、第7図は遷
移行列を用いた候補列作成の処理ブロック図である。 1・・遷移行列指定手段、2・・・中央処理装置(CP
U)、61 、62 、・・・、6K・・・遷移行列記
憶手段、7・・・認識処理部。 師(財) 第1図 話尾 話頭 ■ 0″″″ 基、第3図
を書込んだ遷移行列例を示す図、第3図は文節文字列の
遷移行列例を示す図、第4図は本発明を実施した認識装
置の一実施例の構成を示すブロック図、第5図は遷移行
列を用いた認識処理部の詳細ブロック図、第6図は遷移
行列を用いた候補音節作成の処理フロー図、第7図は遷
移行列を用いた候補列作成の処理ブロック図である。 1・・遷移行列指定手段、2・・・中央処理装置(CP
U)、61 、62 、・・・、6K・・・遷移行列記
憶手段、7・・・認識処理部。 師(財) 第1図 話尾 話頭 ■ 0″″″ 基、第3図
Claims (1)
- 【特許請求の範囲】 1、一区切りの認識すべき情報をより細分化されたN個
の単位要素で認識する認識装置において、認識すべき所
定の単位要素列について(N+1)個の単位要素間の接
続関係である遷移関係を記述した異なる遷移行列を複数
種類記憶した遷移行列記憶手段と、 上記遷移行列記憶手段に記憶された複数種類の異なる遷
移行列の所定の遷移行列を指定する遷移行列指定手段と
、 上記遷移行列指定手段により指定された遷移行列にもと
ずいて認識処理する処理手段と、を備えたことを特徴と
する認識装置。 2 一区切りの認識すべき情報は単語あるいは文節単位
の音声情報であり、単位要素列は単語あるいは文節単位
の文字列であるところの特許請求の範囲第1項記載の認
識装置。 3、複数種類の異なる遷移行列は、それぞれ異なる分野
の文章から作成された複数個の遷移行列であるところの
特許請求の範囲第1項記載の認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57172786A JPH0652478B2 (ja) | 1982-09-30 | 1982-09-30 | 認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57172786A JPH0652478B2 (ja) | 1982-09-30 | 1982-09-30 | 認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5961897A true JPS5961897A (ja) | 1984-04-09 |
| JPH0652478B2 JPH0652478B2 (ja) | 1994-07-06 |
Family
ID=15948322
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57172786A Expired - Lifetime JPH0652478B2 (ja) | 1982-09-30 | 1982-09-30 | 認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0652478B2 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5991499A (ja) * | 1982-11-18 | 1984-05-26 | 伊福部 達 | 音声認識システム |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5629299A (en) * | 1979-07-16 | 1981-03-24 | Western Electric Co | Voice identifier |
-
1982
- 1982-09-30 JP JP57172786A patent/JPH0652478B2/ja not_active Expired - Lifetime
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5629299A (en) * | 1979-07-16 | 1981-03-24 | Western Electric Co | Voice identifier |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5991499A (ja) * | 1982-11-18 | 1984-05-26 | 伊福部 達 | 音声認識システム |
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0652478B2 (ja) | 1994-07-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Lee | Voice dictation of mandarin chinese | |
| JPH0855122A (ja) | 文脈タガー | |
| Lee et al. | Golden Mandarin (I)-A real-time Mandarin speech dictation machine for Chinese language with very large vocabulary | |
| US20080270115A1 (en) | System and method for diacritization of text | |
| Laporte | Rational transductions for phonetic conversion and phonology | |
| JPS5961897A (ja) | 認識装置 | |
| JP2002278579A (ja) | 音声データ検索装置 | |
| JP2974621B2 (ja) | 音声認識用単語辞書作成装置及び連続音声認識装置 | |
| Dolatian et al. | Reduplication with finite-state technology | |
| Chowdhury et al. | Bangla grapheme to phoneme conversion using conditional random fields | |
| JPH0552506B2 (ja) | ||
| Hoste et al. | Meta-learning for phonemic annotation of corpora | |
| JPH0552507B2 (ja) | ||
| JPS5855995A (ja) | 音声認識システム | |
| Sarikaya et al. | Maximum entropy modeling for diacritization of Arabic text. | |
| JPS6342279B2 (ja) | ||
| JPS61122781A (ja) | 音声ワ−ドプロセツサ | |
| Rabiner | Speech recognition based on pattern recognition approaches | |
| JPS58123126A (ja) | 辞書検索装置 | |
| Gorman et al. | Rewrite rules | |
| JPH02308194A (ja) | 外国語学習装置 | |
| JPS60164800A (ja) | 音声認識装置 | |
| Quan et al. | A robust method for the Vietnamese handwritten and speech recognition | |
| Hoste et al. | A rule induction approach to modeling regional pronunciation variation | |
| JPS63265299A (ja) | 音声認識装置 |