JPS6410080B2

JPS6410080B2 -

Info

Publication number: JPS6410080B2
Application number: JP56213731A
Authority: JP
Inventors: Junichi Ichikawa; Takayuki Ooyama; Yasuo Sato; Osamu Terao; Hidekazu Shiratori
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1981-12-29
Filing date: 1981-12-29
Publication date: 1989-02-21
Also published as: JPS58116600A

Description

【発明の詳細な説明】 (1) 発明の技術分野本発明は入力音声パターンの最後尾音節の無声
化又は非無声化に拘らずその入力音声パターンを
認識させ得る標準パターンを登録しうる標準パタ
ーン登録方式に関する。

(2) 技術の背景音声認識システムにおける認識手段の１つとし
て予め標準パターンを登録しておき、このパター
ンと入力音声パターンとを照合してその一致から
入力音声を認識する技法が用いられている。この
技法において、入力音声パターンの最後尾音節が
言葉によつては無声化してしまい、音声認識上の
１つの障害となつている。

(3) 従来技術と問題点このような不都合を解決すべく、最後尾音節が
無声化し易い言葉については何回かその言葉を発
声し、その平均化したパターンを標準パターンと
して登録しておき、認識すべき入力音声パターン
との照合を行うか、上記発声して得られたパター
ンを複数個登録してこれと音声認識のための照合
を行う如き技法が用いられている。

しかしながら、これらは標準パターンの登録に
際して使用者に負担をかける割に認識率の向上が
望めないばかりでなく、上記後者の技法にあつて
は標準パターンを登録しておくための記憶容量の
増大も避けられない。

(4) 発明の目的本発明は上述の如き従来技法の有する欠点に鑑
みて創案されたもので、その目的は使用者に負担
をかけず認識率の向上を促し、しかも記憶容量の
増大もない標準パターン登録方式を提供すること
にある。

(5) 発明の構成そして、この目的は最後尾音節が無声化し易い
単語の標準パターンの登録に際し、その単語の発
声された音声パターンの最後尾音節を、平均音声
パターンから得られる無声化した最後尾音節及び
無声化していない最後尾音節と入れ替えて第１及
び第２の合成音声パターンを発生し、これら合成
音声パターンと上記発声された音声パターンとを
照合して照合距離の大きい合成音声パターン及び
上記発声された音声パターンを標準パターンとし
て登録することによつて達成される。

(6) 発明の実施例以下、添付図面を参照しながら、本発明の実施
例を説明する。

第１図は本発明方式を実施した音声認識システ
ムを示す。１はマイクロホン、２は周波数分析
部、３はパラメータ抽出部、４はセグメンテーシ
ヨン部、５はパターンバツフア、６は切換え手
段、７はパターン照合部、８は標準パターン記憶
部で、これらは従来の音声認識システムを構成し
ている。

そのパターンバツフア５と標準パターン記憶部
８との間に標準パターン作成部９が介設されて本
発明が上記従来の音声認識システム内で実施され
ている。そして、パターンバツフア５も本発明構
成の一部をなし、本発明の具体的構成は第２図に
示されている。

第２図において、１０はパターンバツフア（第
１図の参照番号５と同じ）で、これには入力音声
パターンの内の最後尾音節以外のパターン部をＡ
で、また最後尾音節を０で示してある。１１，１
２は夫々、パターンバツフア１０から入力音声パ
ターンを受ける合成部にある。合成部１１は非無
声化音節パターン供給部１３へ接続されている。

この供給部には、複数人の発声から得られる平
均音声パターンから求められた無声化していない
最後尾音節のパターンが記憶されており、合成部
１１へ供給される。

また、合成部１２は無声化音声パターン供給部
１４へ接続されている。この供給部１４には、複
数人の発声から得られる平均音声パターンから求
められた無声化した最後尾音節のパターンが記憶
されており、合成部１２へ供給される。

１５，１６は夫々、合成音声パターン記憶部で
ある。

１７，１８は夫々、照合部で、照合部１７は合
成音声パターン記憶部１５とパターンバツフア１
０に接続され、記憶部１５からの第１の合成音声
パターンとパターンバツフア１０からの入力音声
パターンとを照合し、これら間の照合距離を出力
する。照合部１８もまた、同様に、合成音声パタ
ーン記憶部１６とパターンバツフア１０とに接続
され、記憶部１６からの第２の合成音声パターン
とパターンバツフア１０からの入力音声パターン
とを照合し、これら間の照合距離を出力する。

１９はパターン選択部であり、これは照合距離
の大きい合成音声パターンと入力音声パターンと
を選出して標準パターン記憶部２０（第１図の参
照番号８と同じ）へ供給するように構成されてい
る。

次に、第２図装置を用いて入力音声パターンと
照合される標準パターンが登録されるまでの過程
を説明する。

音節がa₁，a₂，………a_Nから成り最後尾音節a_N
が無声化し易い単語Ａがマイクロホン１に向けて
発生され、その出力信号が従来と同様に、周波数
分析部２、パラメータ抽出部３、セグメンテーシ
ヨン部４で処理され、その入力音声パターンA_P
がパターンバツフア１０に置かれる。

これに先立つて、非無声化パターン供給部１３
には、上述した無声化していない最後尾音節a_Nの
パターンa^T _Nが記憶され、また無声化パターン供給
部１４には、上述した無声化した最後尾音節a_Nの
パターンa^U _Nが記憶され、夫々のパターンは上記入
力音声パターンA^Pのパターンバツフア１０から
の出力時に夫々の供給部から合成部１１，１２へ
供給される。

これらの供給を受ける合成部１１，１２におい
て次のような処理がなされる。即ち、合成部１１
においては、入力音声パターンA^Pの最後尾音節
a_Nのパターンと無声化していないパターンa^T _Nとが
入れ替えられて第１の合成音声パターンA^T〔その
最後尾音節を“１”で示してある〕が発生され、
合成音声パターン記憶部１５へ供給されてそこに
記憶される。また、合成部１２においては、入力
音声パターンA^Pの最後尾音節a_Nのパターンが無
声化したパターンa^U _Nと入れ替えられて第２の合成
音声パターンA^U〔その最後尾音節を“２”で示し
てある〕が発生され、合成音声パターン記憶部１
６へ供給されてそこに記憶される。

合成音声パターン記憶部１５の第１の合成音声
パターンA^T及びパターンバツフア１０の入力音
声パターンA^Pが照合部１７へ供給され、これら
両パターンが照合されてその両者間の照合距離が
出力される。これと並行して、合成音声パターン
記憶部１６の第２の合成音声パターンA^U及びパ
ターンバツフア１０の入力音声パターンA^Pが照
合部１８へ供給され、これら両パターンが照合さ
れてそれら両者間の照合距離が出力される。

これら両照合距離がパターン選択部１９へ供給
され、そこにおいて照合距離の大きい合成音声パ
ターンA^U又はA^Tが選択されて出力されると共に
入力音声パターンA^Pが出力される。

これら両パターンが標準パターンとして標準パ
ターン記憶部２０に記憶される。

このような登録は唯一回の操作で完了する。ま
た、その標準パターンには、上述の如き登録のた
めに発声された単語に無声化が生じているか否か
に拘わらず、その単語について発声された音声パ
ターンと、その単語のための最後尾音節が無声化
していない音声パターン又は最後尾音節が無声化
した音声パターンとが標準パターンとして含まれ
ているから、上述のような登録後に上記登録され
た標準パターンに対応する単語が無声化されて発
声されようが、また無声化せずに発声されよう
が、その音声を認識しうるから、その認識率を向
上させうる。これに加えて、一つの単語毎に数多
くの標準パターンを登録する場合に比し記憶容量
が少なくて済むばかりでなく処理も簡略化する。

(7) 発明の効果以上の説明から明らかなように、本発明によれ
ば、次の効果が得られる。

(1) １回の操作で標準パターンを登録しうる。

(2) 従つて、登録処理の簡略化を達成しうる。

(3) このような標準パターンの登録において、音
声の認識率を向上させ得る等である。

【図面の簡単な説明】

第１図は本発明を実施する音声認識システムの
構成を示す図、第２図は本発明の実施例を示す図
である。図中、１０はパターンバツフア、１１，１２は
合成部、１３は非無声化音節パターン供給部、１
４は無声化音節パターン供給部、１５，１６は合
成音声パターン記憶部、１７，１８は照合部、１
９はパターン選択部である。

Claims

【特許請求の範囲】

１最後尾音節が無声化し易い単語の標準パター
ンの登録に際し、その単語の発声された音声パタ
ーンの最後尾音節を、平均音声パターンから得ら
れる無声化した最後尾音節及び無声化していない
最後尾音節と入れ替えて第１及び第２の合成音声
パターンを発生し、これら合成音声パターンと上
記発声された音声パターンとを照合して照合距離
の大きい合成音声パターン及び上記発声された音
声パターンを標準パターンとして登録することを
特徴とする標準パターン登録方式。