JPS617890A

JPS617890A - 音声認識対象単語検査方式

Info

Publication number: JPS617890A
Application number: JP59128628A
Authority: JP
Inventors: 石垣　由里子; 佐藤　泰雄
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1984-06-22
Filing date: 1984-06-22
Publication date: 1986-01-14
Also published as: JPH0462595B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は音声認識装置に識別せしめるべき単語の種類の
決定に際して、該音声認識装置に入力されることが予定
される単語相互間での誤認識を生ずることを避けるため
、事前に当該する単語を認識対象単語とすることの適否
を判定するシステムに関するものである。

〔従来の技術〕

音声認識装置における音声認識の手法は、入力された音
声信号から線形予測係数やツー７　リエスペクトル係数
などの特徴パラメータを抽出して、これを予め用意して
おいた辞書中に収納しである単語等の既知の特徴パラメ
ータと比較してその距離が近いものを選び出すことによ
り特定すると云う方式が採られるのが普通である。

前記、辞書に収納される特徴パラメータは特定話者を対
象とするものと不特定話者を対象とするものとでは若干
具なり、前者の場合、音声認識装置を使用する特定の者
が認識対象となる全単語等について予め音声入力したも
のを処理して得られたそれぞれの単語等の特徴パラメー
タを辞書中に収納しておくことにより比較的容易に目的
を達せられるが、後者では、音声の個人差による変動を
考慮しなければならないなどの条件もあって前もって多
数の音声サンプルを用いて調べることにより、標準と々
るべき特徴パラメータを定めて辞書中に格納する必要が
あるなど特定話者を対象とする場合に比して困難な条件
が多い。

この様な音声認識装置において、認識対象となる単語の
中に例えば「イチカワ」と「イシカワ」の様に発音の似
たものがあると、これらはその特徴パラメータも似てい
るので、これらを辞書中に予め登録しておいた特徴パラ
メータと比較すると＠誤認識を生じ易いと云う問題点が
あった。特に不特定話者を対象とする音声認識である場
合には、音声入力の個人差による変動を考慮して判定の
際の近似の度合を決める必要があるからその幅を広くせ
ざるを得す、従って、紛られしい単語間の識別は非常に
困難なものとなる。

従来、音声認識装置における上述の様ガ誤認識の問題に
ついては、現実のシステムにおいて実際に音声を入力し
て誤認識を生じ易い単語が発見されたとき、これを他の
単語に変えるか他の呼び方に変えるなどの方法によって
解決していた。

〔発明が解決しようとする問題点〕

しかし、不特定話者を対象とする音声’ｄＲの場合や、
特定話者を対象とする場合であっても対象となる単語の
数が多く設定される場合には、単語間の誤認識を完全に
防止するのは容易ではなく、認識精度の高い装置を実現
するためにはデバッグに長時間を有すると云う問題点が
あった。

本発明はかかる従来の問題点に鑑み、音声認識装置によ
って識別せしめるべき単語を定めるとき、単語間での誤
認識の発生の可能性を事前に迅速に検査することの出来
る手段を提供することを目的としている。

〔問題点を解決するための手段〕

そしてこの目的は本発明によれば特許請求の範囲に記載
のとおシ、音声認識の対象となる単語を音節文字で入力
する手段を設けると共に、メ羊す内にすべての母音につ
いて他の母音との間の距離となる数値を対応せしめたチ
ーフルと、すべての子音について他の子音との間の距離
となる数値を対応せしめたテーブルとを設け、音声認識
の対象となる単語の内の任意の２個の単語ごとに、単語
を構成す゛る各音節文字を母音と子音との音素に分解し
て、２個の単語間の対応する位置の文字ごとに母音間の
距離と子音間の距離とを前記テーブルにより求めて、そ
の各々の値の和を文字間の距離とすることにより単語間
の類似性を検査することを特徴とする音声認識対象単語
検査方式により達成される。

〔作用〕

上記音声認識対象単語検査方式は音声認識装置によって
認識せしめようとする単語について、その音節を母音と
子音とに分解し、予め用意しておいたメモリ上のテーブ
ルを検索することにより異なる単語間の対応する音節の
母音間および子音間の距離を求めてこれらの和を蟲該音
節間の距離と成し、この様にして求めた各音節間の距離
によって、当該単語間の距離を検査している。そして、
検査の結果、単語間の距離が極端に小さいものについて
は、誤認識を発生する可能性があるので、一方の単語を
変更するなどの調整を行ガうことにより、音声認識の際
の誤動作の発生を未然に防止している。

〔実施例〕

第１図は本発明の１実施例を示す機能プロツク図であっ
て、１はキーボード、２は入力制御部、３．４はレジス
タ、５は距離測定部６はメモリ、７は文字と音素の対応
テーブル、８は母音間距離テーブル、９は子音間距離テ
ーブル、１０は出力＠　ｉｉはプリンタを表わしている
。

第１図において、検査対象の音声認識用予定単語をキー
ボード１からかな文字で入力すると、これらは一応メモ
リ６内に格納され・る。

このとき使用されるかなによる表記はかな文字４６音と
濁音、鼻濁音、半濁音、促音、撥音、拗音、外来語の″
スイ”、゛ティ″などおよ−びこれらの長音２７４株の
中から選択された文字によって行なわれる。

次に入力制御部２はメモリ６に格納された単誤の中から
２個を選び出してそれぞれレジスタ３およびレジスタ４
に格納するが、このとき、入力制御部２は文字と音素の
対応テーブル７を参照してかな表記されている各文字を
音素に分解してそれぞれ母音と子音の組み合わせからな
る音節として格納する。

距離測定部５はこれらの単語間の対応する音節の母音同
士、子音同士について、母音間距離テーブル８、子音間
距離テーブル９を参照してそれぞれの距離を求め、１つ
の音節ごとにその母音間の距離と子音間の距離の和を計
算してその値を当該音節の距離とすることにより該当す
る単語間の距離を求める。

この様にしてメモリ６に格納されている各単語のすべて
の組み合わせについて単語間の距離が算出されると出力
部１０は予め指定されている数値以内の値の距離である
２単語をその距離の値と共に出力する。利用者は出力さ
れた単語についてその一方を変更したシ呼び方を変える
などして、メモリ６内に格納されている単語の内の該当
するものを修正して再び検査をすれば良い。

第２図は音素間の距離を求めるテーブルの例を示す図で
（ａ）は母音間距離テーブルを表わしていて第１図の８
に相当し、（ｂ）は子音間距離テーブルを表わしていて
第１図の９に相当する。

第２図において、同じ音素間（例えばａとａ、ｉと１等
）は距離が０であることを示してお！’　、”、ｎｂ等
はそれぞれ音素間の距離である数値を示している。音素
間の距離は音声学的に求めたものを使用するかまたは音
声学的に求めた値に更に使用する音声認識装置の特性値
（音声分析の手法や使用するフィルタの特性等により異
なる）を加味して設定した値を使用する。

〔発明の効果〕

以上詳細に説明したように本発明の方式（（よれば、音
声認識を行なうべき単語の設定に際し、予め、単語間の
距離を測定して１呉認識の可能性のある単語間の調整を
行なうこと〃；出来るから、認識精度の高い音声認識シ
スブ゛ムを容易に得ることが出来る利点７５玉あり、ま
た音節を母音と子音とに分解して距離を求める方式を採
っているので小さなテーブルで良い（例えば「かな」同
士での距離を求めるテーブルを作ろうとすると「かな」
の表１己〃よ前述のように２７４種あるのでその組み合
わせ〃Ｉ膨大な数となるが本発明の方式では母音１２種
と子音３６種のそれぞれについて距離テーフ゛ルを作成
している）からテーブルとして必要なメモリ量は僅少で
あシ経済的な実現カニ可能であって効果は大きい。

【図面の簡単な説明】

第１図は本発明の１実施例を示す機能ブロック図、第２
図は音素間の距離を求めるテーブルの例を示す図である
。１・・・キーボード、２・・・入力制御部、３．４・・
・レジスタ、５・・・距離測定部、６・・・メモ１ノ、
７・・・文字と音素の対応テーブル、８・・・母音間距
離テーブル、９・・・子音間距離テーフ゛ル、１０・・
・出力部、１１・・・プリンタ

Claims

【特許請求の範囲】

（１）音声認識の対象となる単語を音節文字で入力する
手段を設けると共に、メモリ内にすべての母音について
他の母音との間の距離となる数値を対応せしめたテーブ
ルと、すべての子音について他の子音との間の距離とな
る数値を対応せしめたテーブルとを設け、音声認識の対
象となる単語の内の任意の２個の単語ごとに、単語を構
成する各音節文字を母音と子音との音素に分解して、２
個の単語間の対応する位置の文字ごとに母音間の距離と
子音間の距離とを前記テーブルにより求めて、その各々
の値の和を文字間の距離とすることにより単語間の類似
性を検査することを特徴とする音声認識対象単語検査方
式。
（２）母音間の距離および子音間の距離であるテーブル
上の数値は、音声学的分析によつて求められた値に音声
認識を行なう特定の装置の特性値を加味して設定したも
のである特許請求の範囲第１項記載の音声認識対象単語
検査方式。