JPH01224799A

JPH01224799A - 音声認識における文節候補削減方式

Info

Publication number: JPH01224799A
Application number: JP63051252A
Authority: JP
Inventors: Hitoshi Iwamida; 均岩見田
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1988-03-04
Filing date: 1988-03-04
Publication date: 1989-09-07
Anticipated expiration: 2014-09-20
Also published as: JP2951332B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［ｌ’５コ大語党の文節音声認識を行う場合に認識の対象となる有
効な候補を予め！ｉ沢して削減する文節音声認識におけ
る文節候補削減方式に関し、単語辞書の単語から特徴を
抽出して、慎語を組み合わせて作成した文節における処
理量を少なくする音声認識における文節候補削減方式を
提供することを目的とし、文節を認識単位とする音声認識装置における文節候補削
減方式において、認識の対象となる全ての単語を含む単
語辞書中の各単語について、その単語を含む文節を発声
した時に現れること力＜６１実に予想される特徴を単語
特徴抽出部において抽出し、単語特徴抽出部で抽出した
単語特徴を文節特徴合成部において組み合わせて文節と
しての特徴を合成し、入力音声を分析部で分析してその
出力から入力音声の特徴を入力特徴抽出部により抽出し
、文節特徴合成部で合成した文節特徴と、入力特徴抽出
部で抽出した入力音声の特徴に基づいて文節候補選択部
により音声認識の照合処理に有効な文節候補を選択する
よう構成する。

［産業上の利用分野］本発明は、大語党の文節音声認識を行う場合に認識の対
象となる有効な候補を予め選択して削減する文節音声認
識における文節候補削減方式に関する。

近年、音声認識装置は各種の用途に用いられ、文書を音
声入力により作成したり、装置への指示を音声で行う場
合等に有用である。そのような場合、単に音声を単語単
位で認識せずにより長い単位である文節により認識する
ことが望まれ、それも大語党の文節音声を認識すること
が要望されている。ところが、そのためには認識対象と
なる文節が膨大な量になって、認識処理に要する時間が
長くなりその改善が望まれている。

［従来の技術］第３図に従来例の構成図を示す。

第３図に示す構成は本出願と同一の出願人が開発した音
声認識における単語候補削減装置（特願昭６２−５３０
６６号）を文節音声認識に適用した構成を示す。

図において、単語辞書３０には認識の対象となる文節を
構成するすべての単語がその音ｍ１ラヘルネソトワーク
とともに格納されている。音韻ラベルネットワークは、
各子音や母音を示す音韻ラベルを単語の音声を表現する
ように関係づけるものであり、第４図にその例を示す。

第４図には、日本語の単語（文節でもある）の“しかし
”の音韻ラベルネットワークを例示するものであり、図
において“＃”は単語境界、３１１″は０シ”の子音部
、“Ｉ”は無声化しない母音の“イ”、“ｉ″は無声化
した母音の“イ２、“Ｋ”は１カ”の子音部、“Ａ”は
母音の“ア”を示すそれぞれの音韻ラベルである。この
ようにネットワーク表現を用いて無声化という音声変形
現象を表現したものである。

文節合成部３１は、単語辞書３０から可能なすべての文
節を合成する。

文節特徴音曲抽出部３２では、各合成された文節につい
て、特徴音韻を抽出する。すなわち、各文節ごとにそれ
より確実にあられれると事前に予想される特徴的な音韻
を抽出する。

一方、入力音声は分析部３５で短時間周波数分析され短
時間スペクトル時系列データ（スペクトルパターンとい
う）を発生し、次の入力特徴音韻抽出部３４では、分析
部３５の出力データから特徴音韻を検出する。その特徴
音■は、大きいパワーで発音される音韻が容易かつ確実
に検出されるので、これを特徴的な音韻として抽出し、
文節候補選択部３３に供給する。

文節候補選択部３３において、入力特徴音韻抽出部３４
で抽出された各特徴的な音韻と文節特徴音韻抽出部３２
から得られた各文節の特徴音韻との間で相関をとって、
音声認識の照合処理に有効な文節を選択する。この文節
候補選択部３３における処理は各文節の特徴音韻と入力
音声から抽出された特徴音韻とが類催しているものを文
節音声認識の照合を行う時の候補となる文節として選択
する。なお、照合動作は入力音声のスペクトルパターン
と候補である音韻ラベルネットワークから合成したスペ
クトルパターンとの類似度（または距離）を求めて最も
近似する文節を検出して出力するものであり、その際に
入カバターンと照合候補となる文節の時間軸のずれの補
正にＤＰ法（ダイナミック・プログラミング・マツチン
グ）を利用する照合法が高性能な処理方式として使用さ
れる。

［発明が解決しようとする課題］上記した従来例の構成によれば、単語辞書から可能なす
べての文節を合成するので、文節数が莫大であるために
、処理量に伴う処理時間が膨大になるという問題があっ
た。

本発明は単語辞書の単語から特徴を抽出して、単語を組
み合わせて作成した文節における処理量を少なくする音
声認識における文節候補削減方式を提供することを目的
とする。

［課題を解決するための手段］本発明の原理的構成図を第１図に示す。

第１図において、１０は単語辞書、１１は各４を語の特
徴音韻を抽出する単語特徴音韻抽出部、１２は単語を組
み合わせてそれぞれの特徴音韻を組み合わせた文節特徴
音韻合成部、１３は照合に用いる文節の候補を選択する
文節候補選択部、１４は入力音声を分析した出力から音
韻を抽出する入力音韻抽出部、１５は分析部を表す。

本発明は、単語辞書の単語の特徴的な音韻を抽出し、単
語を組み合わせた文節の特徴となる音韻を単語の特徴音
韻の組み合わせにより合成して文節候補ｉ！択部に入力
し、入力音声の特徴となる音韻と比較してそれにすべて
が含まれる特徴音韻を有する文節を照合の候補として３
ｙｉ訳する。

〔作用〕

第１図の単語辞書１０の各単語にはそれぞれの品詞と活
用形が格納されており、単語特徴音韻抽出部１１におい
て予めその単語を含む文節を発声した時に確実に現れる
と予想される特徴的な音韻を抽出する。

各単語について特徴音韻が抽出されると、文節特徴音■
合成部１２は各単語を決められた規則により単語を組み
合わせて文節を合成した時の特徴音韻を抽出する。この
抽出は単語の特徴音韻を組み合わせることにより行われ
る。

一方、入力音声について分析部１５において従来と同様
の方法で音声を分析し、その分析出力から更に入力音声
の音韻の候補を抽出する。

入力音韻抽出部１４で抽出した音韻（候補を含む）と文
節特徴音韻合成部１２で合成した多数の文節の特徴音韻
とが文節候補選択部１３に供給され、入力音韻の候補に
すべての特徴音韻が含まれる文節が照合用に使用される
文節候補として選択され、含まれない特徴音曲を含む文
節は照合用の候補として採用しない。

［実施例〕本発明の実施例の構成図を第２図に示す。

第２図において、２０は単語辞書、２１は特徴音韻ルー
ル格納部、２２は単語特徴音韻抽出部、２３はｉＰＬ語
特徴音龍パターン保持部、２４は文節モデル格納部、２
５は文節特徴音韻合成部、２６は文節特徴音韻パターン
保持部、２７は選択部、２８は文節候補生成部、２９は
入力音韻抽出部、４０は分析部を表す。

第２図おいて、単語辞書２０には認識の対象となるすべ
ての単語を含んでいる。各単語には品詞と活用形が記述
され、単語の音頗うベルネントワークも記述されている
。

単語特徴音韻抽出部２２では特徴音韻ルールにしたがっ
て単語辞書の各単語について、その単語を含む文節を発
声した場合に確実に現れると予想される特徴的な音韻を
抽出する。したがって、例えば活用語尾は確実に現れる
とは限らないのでそこから特徴的な音曲は抽出されにく
い。例えば、ｒ／ＩＲＵＫＵ　（ある＜）」の場合、ｒ
ＫＵ、Ｊは活用により変化（「あるかない」のように）
するので、ｒＡＲＵＪから特徴音韻が抽出される。

また、例えば、単語ｒｓＨＩＫＡｓＨＩ　　（Ｌかし）
」の場合、■は無声化し発声されない場合があるのでこ
れは特徴的な音韻ではなく、この単語の特徴音韻パター
ンはｒｓＨ，Ａ、５ｌ（Ｊである。

特徴音韻ルール格納部２１には特徴的音韻を抽出するた
めのルールが格納されている。（無声化して発声されな
い音韻は特徴音韻とはならない等の規則）。

こうして各単語の特徴音韻パターンが抽出されて華語特
徴音面パターン保持部２３に格納される。

次に、文節特徴音韻合成部２５では文節モデル格納部２
４に記述された文節モデルにしたがって、各単語の品詞
情報に基づいてその単語の特徴音韻パターンと組み合わ
せることができる他の単語の特徴音韻パターンとを組み
合わせて、文節特徴音■を合成する。文節モデル格納部
２４の内容としては、例えば、「名詞＋助詞」、「動詞
＋助動詞＋助詞」等である。また、文節特徴音韻合成部
２５の合成は、組み合わせの対象となる単語特徴音韻パ
ターン保持部２３を直列に接続して行う。

文節特徴音韻合成部２５で合成した出力は文節特徴音韻
パターン保持部２６に格納される。

入力音声は分析部４０において短時間周波数分析が行わ
れ、その結果は入力音韻抽出部２９に供給されて、入力
音韻候補を抽出する。ここでは、分析データに基づいて
強い音韻を検出して、音韻のパターンを作成する。例え
ば、「しかし」と発声した場合は、ｒ　（ＳＨ，Ｓ）、
Ｌ　　（Ｋ、Ｔ。

Ｐ）、Ａ、　　（ＳＨ，Ｓ）Ｊとなる。ここで、括弧内
はそのどちらかをとることを意味する。

選択部２７は、文節特徴音韻パターン保持部２６の中の
各パターンについて、それが入力音韻抽出部２９から供
給された入力音声の音韻候補の中にすべて含まれている
か調べて、すべて含まれている文節特徴音韻パターンだ
けを選択する。例えば、入力音声が上記の例のようにｒ
　（ＳＨ，Ｓ）　。

１、　　（Ｋ、Ｔ、Ｐ）、Ａ、　　（ＳＨ，Ｓ）Ｊの場
合、文節特徴音韻パターンのうち、ｒＳＨ，Ａ、ＳＩＮ
やｒｓ、Ａ、ＳＨＪなどが選択される。

文節候補生成部２８は選択部２７で選択された文節特徴
音韻パターンを合成している元の単語特徴音ｍ１パター
ンを、文節特徴音韻パターン保持部２６を参照すること
により検出し、さらにその単語特徴音韻パターンが得ら
れた元の単語を、単語特徴音曲パターン保持部２３を参
照することにより検出する。検出された単語を合成する
ことにより、文節候補を生成する。

例えば、選択された文節特徴音韻パターンがｒｓＨ，八
、ＳＨＪであった場合、それを合成している単語特徴パ
ターンはｒＳＨ，Ａ、５ＩＩＪだけであり、その単語特
徴音韻パターンが得られる単語は「５ＦＩＩＫＡＳＨ■
　（しかし）」や、「５ＨＩＴ八５ＨＩＩ（したしい）
」である。さらに、そこから文節を合成し、ｒｓＨＩ　
ＫＡＳＨ＋」、ｒｓＨＴＡｓＨＩ　＋　　（親しい）」
、ｒｓＨＩＴＡＳｌ−１１ＫＵ（親しく）」などが文節
候補となる。

文節候補となる各文節の情報は、認識装置の照合部にお
いて入力音声の分析データと従来技術により照合されて
認識が行われることはいうまでもない。

［発明の効果］本発明によれば、従来のように可能な文節をすべて合成
してから文節候補を選択することなく単語のレベルで特
徴を抽出しておき、その種類を少なくしてから文節を合
成するので、選択の対象となる文節数を少なくすること
ができ、候補選択の処理を高速化できる。

【図面の簡単な説明】

第１図は本発明の原理的構成図、第２図は本発明の実施
例の構成図、第３図は従来例の構成図、第４図は音韻ラ
ベルネットワークの説明図である。第１図中、１０：単語辞書ｌｌ：単語特徴音韻抽出部１２：文節特徴音韻合成部１３：文節候補生成部１４：入力音韻抽出部１５：分析部

Claims

【特許請求の範囲】文節を認識単位とする音声認識装置における文節候補削
減方式において、認識の対象となる全ての単語を含む単語辞書（１０）中
の各単語について、その単語を含む文節を発声した時に
現れることが確実に予想される特徴音韻を単語特徴音韻
抽出部（１１）において抽出し、単語特徴音韻抽出部（
１１）で抽出した単語特徴音韻を文節特徴音韻合成部（
１２）において組み合わせて文節としての特徴を合成し
、入力音声を分析部（１５）で分析してその出力から入力
音声の特徴音韻を入力音韻抽出部（１４）により抽出し
、文節特徴音韻合成部（１２）で合成した文節特徴と、入
力音韻抽出部（１４）で抽出した入力音声の音韻に基づ
いて文節候補選択部（１３）により音声認識の照合処理
に有効な文節候補を選択することを特徴とする音声認識
における文節候補削減方式。