JPS6073697A

JPS6073697A - 音韻辞書の作成方法

Info

Publication number: JPS6073697A
Application number: JP58181912A
Authority: JP
Inventors: 晋太木村; 奈良　泰弘; 裕二木島; 小林　敦仁
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1983-09-30
Filing date: 1983-09-30
Publication date: 1985-04-25

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（１）発明の技術分野本発明は、音声認識装置で用いられる音韻辞書の作成方
法に関する。

（２）技術の背景一般に、音声認識装置で音声データをｉ　ｈする場合に
は、該音声データと比較する比較データが必要である。

このような比較データを数多く備えたものとして一般に
音韻辞書と称されるものが知られている。

（３）従来技術とその問題点従来この種の音韻辞書は、例えば１００単語の辞書作成
用の音声データ群を用意し、夫々の音声データの特徴を
抽出すると共に、夫々の音声データに対して細分化され
た音韻記号とその特徴データを順次書込んで作成されて
いる。

然しなから、このような従来の音韻辞書にあっては、該
音韻辞書は実際の音声認識とは無関係に作成されること
から、辞書作成用の音声データ数が比較的少ない場合に
おいて上記音韻辞書を用いて音声認識を行なうと、その
認識結果に誤りを生じ易く、音声認識が不正確になり易
いという問題がある。

このような問題を解決するために、辞書作成用の音声デ
ータ数をある程度増加して音声認識の信頼性を高めると
いうことが考えられるが、このタイプにあっては、音韻
辞書そのものの容量が増大するほか、音声８識のための
処理に時間がかかり、音声認識処理の高速化という要請
にそぐわないという問題が生ずる。

（４）発明の目的本発明は以上の観点に立って為されたものであって、そ
の目的とするところは、辞書作成用の音声データ数を不
必要に多くすることなく、音声認識を正確に行なえるよ
うにした音韻辞書の作成方法を提供することにある。

（５）発明の構成そして、本発明の基本的構成は、音韻辞書を作成するに
際し、辞書作成用の音声データ群に基づく第一次音韻辞
書を予め作成した後、この第一次音韻辞書を作成した各
音声データを、認識対象となる音声データに基づく辞書
を除いた第一次音韻辞書を用いて認識すると共に、この
認識結果から認識の誤り規則を抽出し、上記第一次音韻
辞書に上記誤り規則を付加して第二次音韻辞書とするこ
とにある。

（６）発明の実施例以下、添付図面に示す実施例に基づいて本発明の詳細な
説明する。

第１図は本発明に係る音韻辞書の作成方法を実施するた
めの装置の一実施例を示すブロック図である。

図において、１は音声データを検出するためのマイクロ
ホーン、２はマイクロホーン１で検出された音声データ
をＮ巾変換すると共に、数ｍ　ｓ　ｅ　ｃ　幅にスライ
スしてフレームデータと称される時系列に変換する入力
部、３は入力部２のフレームデータに基づいて音声パワ
ースペクトル等を計算することにより音声データの特徴
を抽出し、上記フレームデータの時系列を特徴データの
時系列に変換する特徴抽出部、４はディスプレイ、５は
、例えば第２図に示すように、所定数（例えば１００）
の登録すべき単語を音韻列（５ＡＰＯＲＯ等）として予
め格納する登録単語音韻列ファイル、６は、例えば第３
図に示すように、特徴抽出部３からの特徴データの時系
列を登録単語音韻列ファイル５からの単語の音韻列と共
に格納する単語音声特徴ファイルであり、これらは全体
として音声登録部Ａを構成している。

また、符号７は単語音声特徴ファイル６の単語の音韻列
によって特徴データ時系列の音韻を分割する音韻分割部
であり、例えば、第４図に示すように、特徴データ時系
列のパワーＰの時り点の間に単語（例えば０８ＡＫＡ　
＞の音韻列の一文字分を対応させるという処理を行うも
のである。８は、第４図に示すように、音韻分割部７で
得られた分割音韻に音韻記号を付け、音韻記号、この音
韻記号に対応する特徴データ、単語の音韻列及び音韻分
割情報（分割音韻が特徴データめどの範囲を占めるかを
示す情報）を出力する音韻ラベル付部である。そして、
９は、第５図に示すように、特徴データを音韻記号と単
語の音韻列と共に格納する第一次音韻辞書であり、音韻
分割部１、音韻ラベル付部８及び第一次音韻辞書９で第
−次音韻辞書作成部Ｂを構成している。尚、上記音韻分
割情報は第３図に示すように単語音声特徴ファイル６に
格納される。

更に、符号Ｃは第二次音韻辞書作成部であり、音韻認識
部１０、誤り規則抽出部１１、音韻ラベル追加部１２及
び第二次音韻辞書１３から成る。上記音韻認識部１０は
、単語音声特徴ファイル６内の単語音韻列の特徴データ
時系列を第一次音韻辞書９を用いて認識するもので、そ
の認識方法は、音声認識装置で用いる方法、例えば相違
度計算法や類似度計算法等と同一である。ただし、ある
単語の音韻認識を行う場合は当該単語の特徴データより
作成した第一次音韻辞書は使用しないものとする。また
、誤り規則抽出部１１は、第６図に示すように、単語音
声特徴ファイル６からの音韻分割情報と音韻認識部１０
から得られる音韻認識結果Ｉｔ較し、認識の誤り個所に
つい。

ての規則を抽出するものである。そして、上記音韻ラベ
ル追加部１２は、第６図及び第７図に示すように、上記
誤り規則抽出部１１から得られる誤り規則を第一次音韻
辞書９に追加し、第二次音韻辞書１３を作成するもので
ある。

従って、上記装置を用いて音韻辞書を作成する場合には
、登録単語音韻列ファイル５内の内容を順次ディスプレ
イ４上に表示し、表示された単語をマイクロホーン１に
向かって発声するようにすればよい。

このとき、先ず、発声された単語は、辞書作成用の音声
データとして登録単語と共に単語音声特徴ファイル６に
格納され、この段階において音声の登録が完了する。こ
の後、上記単語音声特徴ファイル６の内容は音韻分割部
１及び音韻ラベル付部８を介して第一次音韻辞書９に格
納され、第一次音韻辞書９が作成される。更にこの後、
音韻認識部１０では第一次音韻辞書９を用いて音声デー
タの音韻認識が行なわれるが、認識しようとする音声デ
ータの辞書を用いていないので、音韻認識時に第一次音
韻辞書９内には音声データと完全に一致するものはなく
、音声データの音韻認識に若干の誤りの傾向が与えられ
ることになる。このため、誤りの傾向が高い音韻を含む
音声データ、例えば第６図に示すりの認識に誤りが生ず
ることになり、この誤り部分の規則例えば〔Ａ〕が［ｉ
：）　、　［：Ｉ：］が〔Ｅ〕に誤り易いという規則が
誤り規則抽出部１１で抽出され、音韻ラベル追加部１２
で第一次音韻辞書９と共に第二次音韻辞書１３に格納さ
れ、この段階で第二次音韻辞書１３が作成される。

このようにして作成された一Ｆ記第二次音韻辞書１３は
音韻の誤り規則を自動的に学習したものになっているの
で、上記第二次音韻辞書を音声認識装置用の音韻辞書と
して使用した場合には、音声認識に当って音韻の誤り傾
向を加味した認識が可能となり、その分、音声の認識が
より正確なものになる。

尚、本発明に係る音韻辞書の作成方法を実施するための
具体的装置としては上記実施例で示したものに限定され
るものではなく適宜設計変更して差支えない。

（７）発明の詳細な説明してきたように、本発明に係る音韻辞書の作成方
法によれば、音韻の誤り規則を学習した音韻辞書を作成
することができるので、音声認識に当って音韻の誤り傾
向を知ることが可能となり、その分、音声の認識をより
正確にすることができる。また、本発明によれば、音韻
辞書を作成するに当って辞書作成用の音声データ数を増
加させる必要がないので、音韻辞書の容量が不必要に嵩
むという事態を有効に回避できると共に、音声認識処理
の高速化という要請を損うおそれも全くない。

【図面の簡単な説明】

第１図は本発明に係る音韻辞書の作成方法を実施するた
めの装置の一実施例を示すブロック図、第２図は登録単
語音韻列ファイルの内容を示す説明図、第３図は単語音
声特徴ファイルの内容を示す説明図、第４図は音韻分割
部と音韻ラベル付部との作用を示す説明図、第５図は第
一次音韻辞書の内容を示す説明図、第６図は誤り規則抽
出部の作用を示す説明図、第７図は第二次音韻辞書の内
容を示す説明図である。１・・・マイクロホーン　２・・・入力部３・・・特徴
抽出部　４・・・ディスプレイ５・・・登録単語音韻列
ファイル６・・・単語音声特徴ファイルト・・音韻分割部　８・・・音韻ラベル付部９・・・第
一次音韻辞書　１０・・・音韻認識部１１・・・誤り規
則抽出部　１２・・・音韻ラベル追加部１３・・・第二
次音韻辞書

Claims

【特許請求の範囲】

音声認識装置で用いられる音韻辞書を作成するに際し、
辞書作成用の音声データ群に基づく第一次音韻辞書を予
め作成した後、該第−次音韻辞書を作成した各音声デー
タを、認識対象となる音声データに基づく辞書を除いた
第一次音韻辞書を用いて認識すると共に、この認識結果
から認識の誤り規則を抽出し、上記第一次音韻辞書に上
記誤り規則を付加して第二次音韻辞書とすることを特徴
とする音韻辞書の作成方法。