JPS6073697A - 音韻辞書の作成方法 - Google Patents

音韻辞書の作成方法

Info

Publication number
JPS6073697A
JPS6073697A JP58181912A JP18191283A JPS6073697A JP S6073697 A JPS6073697 A JP S6073697A JP 58181912 A JP58181912 A JP 58181912A JP 18191283 A JP18191283 A JP 18191283A JP S6073697 A JPS6073697 A JP S6073697A
Authority
JP
Japan
Prior art keywords
dictionary
phoneme
recognition
phonetic
primary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58181912A
Other languages
English (en)
Inventor
晋太 木村
奈良 泰弘
裕二 木島
小林 敦仁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP58181912A priority Critical patent/JPS6073697A/ja
Publication of JPS6073697A publication Critical patent/JPS6073697A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (1)発明の技術分野 本発明は、音声認識装置で用いられる音韻辞書の作成方
法に関する。
(2)技術の背景 一般に、音声認識装置で音声データをi hする場合に
は、該音声データと比較する比較データが必要である。
このような比較データを数多く備えたものとして一般に
音韻辞書と称されるものが知られている。
(3)従来技術とその問題点 従来この種の音韻辞書は、例えば100単語の辞書作成
用の音声データ群を用意し、夫々の音声データの特徴を
抽出すると共に、夫々の音声データに対して細分化され
た音韻記号とその特徴データを順次書込んで作成されて
いる。
然しなから、このような従来の音韻辞書にあっては、該
音韻辞書は実際の音声認識とは無関係に作成されること
から、辞書作成用の音声データ数が比較的少ない場合に
おいて上記音韻辞書を用いて音声認識を行なうと、その
認識結果に誤りを生じ易く、音声認識が不正確になり易
いという問題がある。
このような問題を解決するために、辞書作成用の音声デ
ータ数をある程度増加して音声認識の信頼性を高めると
いうことが考えられるが、このタイプにあっては、音韻
辞書そのものの容量が増大するほか、音声8識のための
処理に時間がかかり、音声認識処理の高速化という要請
にそぐわないという問題が生ずる。
(4)発明の目的 本発明は以上の観点に立って為されたものであって、そ
の目的とするところは、辞書作成用の音声データ数を不
必要に多くすることなく、音声認識を正確に行なえるよ
うにした音韻辞書の作成方法を提供することにある。
(5)発明の構成 そして、本発明の基本的構成は、音韻辞書を作成するに
際し、辞書作成用の音声データ群に基づく第一次音韻辞
書を予め作成した後、この第一次音韻辞書を作成した各
音声データを、認識対象となる音声データに基づく辞書
を除いた第一次音韻辞書を用いて認識すると共に、この
認識結果から認識の誤り規則を抽出し、上記第一次音韻
辞書に上記誤り規則を付加して第二次音韻辞書とするこ
とにある。
(6)発明の実施例 以下、添付図面に示す実施例に基づいて本発明の詳細な
説明する。
第1図は本発明に係る音韻辞書の作成方法を実施するた
めの装置の一実施例を示すブロック図である。
図において、1は音声データを検出するためのマイクロ
ホーン、2はマイクロホーン1で検出された音声データ
をN巾変換すると共に、数m s e c 幅にスライ
スしてフレームデータと称される時系列に変換する入力
部、3は入力部2のフレームデータに基づいて音声パワ
ースペクトル等を計算することにより音声データの特徴
を抽出し、上記フレームデータの時系列を特徴データの
時系列に変換する特徴抽出部、4はディスプレイ、5は
、例えば第2図に示すように、所定数(例えば100)
の登録すべき単語を音韻列(5APORO等)として予
め格納する登録単語音韻列ファイル、6は、例えば第3
図に示すように、特徴抽出部3からの特徴データの時系
列を登録単語音韻列ファイル5からの単語の音韻列と共
に格納する単語音声特徴ファイルであり、これらは全体
として音声登録部Aを構成している。
また、符号7は単語音声特徴ファイル6の単語の音韻列
によって特徴データ時系列の音韻を分割する音韻分割部
であり、例えば、第4図に示すように、特徴データ時系
列のパワーPの時り点の間に単語(例えば08AKA 
>の音韻列の一文字分を対応させるという処理を行うも
のである。8は、第4図に示すように、音韻分割部7で
得られた分割音韻に音韻記号を付け、音韻記号、この音
韻記号に対応する特徴データ、単語の音韻列及び音韻分
割情報(分割音韻が特徴データめどの範囲を占めるかを
示す情報)を出力する音韻ラベル付部である。そして、
9は、第5図に示すように、特徴データを音韻記号と単
語の音韻列と共に格納する第一次音韻辞書であり、音韻
分割部1、音韻ラベル付部8及び第一次音韻辞書9で第
−次音韻辞書作成部Bを構成している。尚、上記音韻分
割情報は第3図に示すように単語音声特徴ファイル6に
格納される。
更に、符号Cは第二次音韻辞書作成部であり、音韻認識
部10、誤り規則抽出部11、音韻ラベル追加部12及
び第二次音韻辞書13から成る。上記音韻認識部10は
、単語音声特徴ファイル6内の単語音韻列の特徴データ
時系列を第一次音韻辞書9を用いて認識するもので、そ
の認識方法は、音声認識装置で用いる方法、例えば相違
度計算法や類似度計算法等と同一である。ただし、ある
単語の音韻認識を行う場合は当該単語の特徴データより
作成した第一次音韻辞書は使用しないものとする。また
、誤り規則抽出部11は、第6図に示すように、単語音
声特徴ファイル6からの音韻分割情報と音韻認識部10
から得られる音韻認識結果It較し、認識の誤り個所に
つい。
ての規則を抽出するものである。そして、上記音韻ラベ
ル追加部12は、第6図及び第7図に示すように、上記
誤り規則抽出部11から得られる誤り規則を第一次音韻
辞書9に追加し、第二次音韻辞書13を作成するもので
ある。
従って、上記装置を用いて音韻辞書を作成する場合には
、登録単語音韻列ファイル5内の内容を順次ディスプレ
イ4上に表示し、表示された単語をマイクロホーン1に
向かって発声するようにすればよい。
このとき、先ず、発声された単語は、辞書作成用の音声
データとして登録単語と共に単語音声特徴ファイル6に
格納され、この段階において音声の登録が完了する。こ
の後、上記単語音声特徴ファイル6の内容は音韻分割部
1及び音韻ラベル付部8を介して第一次音韻辞書9に格
納され、第一次音韻辞書9が作成される。更にこの後、
音韻認識部10では第一次音韻辞書9を用いて音声デー
タの音韻認識が行なわれるが、認識しようとする音声デ
ータの辞書を用いていないので、音韻認識時に第一次音
韻辞書9内には音声データと完全に一致するものはなく
、音声データの音韻認識に若干の誤りの傾向が与えられ
ることになる。このため、誤りの傾向が高い音韻を含む
音声データ、例えば第6図に示すりの認識に誤りが生ず
ることになり、この誤り部分の規則例えば〔A〕が[i
:) 、 [:I:]が〔E〕に誤り易いという規則が
誤り規則抽出部11で抽出され、音韻ラベル追加部12
で第一次音韻辞書9と共に第二次音韻辞書13に格納さ
れ、この段階で第二次音韻辞書13が作成される。
このようにして作成された一F記第二次音韻辞書13は
音韻の誤り規則を自動的に学習したものになっているの
で、上記第二次音韻辞書を音声認識装置用の音韻辞書と
して使用した場合には、音声認識に当って音韻の誤り傾
向を加味した認識が可能となり、その分、音声の認識が
より正確なものになる。
尚、本発明に係る音韻辞書の作成方法を実施するための
具体的装置としては上記実施例で示したものに限定され
るものではなく適宜設計変更して差支えない。
(7)発明の詳細 な説明してきたように、本発明に係る音韻辞書の作成方
法によれば、音韻の誤り規則を学習した音韻辞書を作成
することができるので、音声認識に当って音韻の誤り傾
向を知ることが可能となり、その分、音声の認識をより
正確にすることができる。また、本発明によれば、音韻
辞書を作成するに当って辞書作成用の音声データ数を増
加させる必要がないので、音韻辞書の容量が不必要に嵩
むという事態を有効に回避できると共に、音声認識処理
の高速化という要請を損うおそれも全くない。
【図面の簡単な説明】
第1図は本発明に係る音韻辞書の作成方法を実施するた
めの装置の一実施例を示すブロック図、第2図は登録単
語音韻列ファイルの内容を示す説明図、第3図は単語音
声特徴ファイルの内容を示す説明図、第4図は音韻分割
部と音韻ラベル付部との作用を示す説明図、第5図は第
一次音韻辞書の内容を示す説明図、第6図は誤り規則抽
出部の作用を示す説明図、第7図は第二次音韻辞書の内
容を示す説明図である。 1・・・マイクロホーン 2・・・入力部3・・・特徴
抽出部 4・・・ディスプレイ5・・・登録単語音韻列
ファイル 6・・・単語音声特徴ファイル ト・・音韻分割部 8・・・音韻ラベル付部9・・・第
一次音韻辞書 10・・・音韻認識部11・・・誤り規
則抽出部 12・・・音韻ラベル追加部13・・・第二
次音韻辞書

Claims (1)

    【特許請求の範囲】
  1. 音声認識装置で用いられる音韻辞書を作成するに際し、
    辞書作成用の音声データ群に基づく第一次音韻辞書を予
    め作成した後、該第−次音韻辞書を作成した各音声デー
    タを、認識対象となる音声データに基づく辞書を除いた
    第一次音韻辞書を用いて認識すると共に、この認識結果
    から認識の誤り規則を抽出し、上記第一次音韻辞書に上
    記誤り規則を付加して第二次音韻辞書とすることを特徴
    とする音韻辞書の作成方法。
JP58181912A 1983-09-30 1983-09-30 音韻辞書の作成方法 Pending JPS6073697A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58181912A JPS6073697A (ja) 1983-09-30 1983-09-30 音韻辞書の作成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58181912A JPS6073697A (ja) 1983-09-30 1983-09-30 音韻辞書の作成方法

Publications (1)

Publication Number Publication Date
JPS6073697A true JPS6073697A (ja) 1985-04-25

Family

ID=16109068

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58181912A Pending JPS6073697A (ja) 1983-09-30 1983-09-30 音韻辞書の作成方法

Country Status (1)

Country Link
JP (1) JPS6073697A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08171396A (ja) * 1994-12-20 1996-07-02 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 音声認識装置
JP2022516811A (ja) * 2019-02-05 2022-03-02 コーニンクレッカ フィリップス エヌ ヴェ キャリアフィルムを有する相互接続を有するセンサ

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08171396A (ja) * 1994-12-20 1996-07-02 Atr Onsei Honyaku Tsushin Kenkyusho:Kk 音声認識装置
JP2022516811A (ja) * 2019-02-05 2022-03-02 コーニンクレッカ フィリップス エヌ ヴェ キャリアフィルムを有する相互接続を有するセンサ

Similar Documents

Publication Publication Date Title
US8065142B2 (en) Synchronization of an input text of a speech with a recording of the speech
CN1029170C (zh) 语言翻译系统
US7668718B2 (en) Synchronized pattern recognition source data processed by manual or automatic means for creation of shared speaker-dependent speech user profile
JP2836159B2 (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JP5130892B2 (ja) 文字符号化処理方法及びシステム
CN112259083B (zh) 音频处理方法及装置
JP3992348B2 (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
CN117634471A (zh) 一种nlp质检方法及计算机可读存储介质
WO2014033855A1 (ja) 音声検索装置、計算機読み取り可能な記憶媒体、及び音声検索方法
JP2960936B2 (ja) 係り受け解析装置
CN119864019A (zh) 一种数据的生成方法及装置
JPS6073697A (ja) 音韻辞書の作成方法
JP2002278579A (ja) 音声データ検索装置
JP2003162524A (ja) 言語処理装置
JP2003228394A (ja) 音声入力を利用する名詞特定装置およびその方法
CN114676244B (zh) 信息处理方法、信息处理装置以及计算机可读存储介质
US20240355326A1 (en) Speech input support device and storage medium
JPS6326699A (ja) 連続語認識記録方法
US20250365360A1 (en) Method and apparatus for providing voice dial
JP3033132B2 (ja) 言語処理装置
CN121188484A (zh) 模型训练方法、文本处理方法、装置及相关设备
JPH0916575A (ja) 発音辞書装置
JPS6344696A (ja) 単語検出方式
JPS58195895A (ja) 単語音声認識装置
JPS6344700A (ja) 単語検出方式