JPS6344700A - 単語検出方式 - Google Patents

単語検出方式

Info

Publication number
JPS6344700A
JPS6344700A JP61190258A JP19025886A JPS6344700A JP S6344700 A JPS6344700 A JP S6344700A JP 61190258 A JP61190258 A JP 61190258A JP 19025886 A JP19025886 A JP 19025886A JP S6344700 A JPS6344700 A JP S6344700A
Authority
JP
Japan
Prior art keywords
category
syllable
candidate
word
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP61190258A
Other languages
English (en)
Other versions
JPH0656556B2 (ja
Inventor
畑崎 香一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP61190258A priority Critical patent/JPH0656556B2/ja
Publication of JPS6344700A publication Critical patent/JPS6344700A/ja
Publication of JPH0656556B2 publication Critical patent/JPH0656556B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は音声認識装置、音声入力装置等において用いら
れ、入力音声中に含まれる単語とその惧語の音声中での
位置とを検出する単語検出方式に関する。
(従来の技術) 音声認識装置、音声入力装置等において入力音声中の単
シ5とその位置を検出する方法に1.音節、音素、音素
クラス等のカテゴリの列である入力音声から各カテゴリ
とそれらの入力音声中での位置情報とを抽出し、抽出さ
れたカテゴリから作成したカテゴリ列がある単語のカテ
コ゛りン1]に対応すれば、その単語と入力音声中1ご
のカテゴリ列の位置とを検出結果として田力rる方法が
ある。
一般1、:上述のカテゴリは、その時間長が短かく、ま
た類似するカテゴリが存在することなどから、入力音声
中のカテゴリを完全に誤りなく抽出することは困難であ
る。このため、従来は、入力音声中の各カテゴリの区間
に対して複数個のカテゴリ候補を抽出しておき、入力音
声の端から頚に、カテゴリ候補を用いて部分的なカテゴ
リ候補列を生成しては単語のカテゴリタqとの照合を行
なうという処理を繰り返すことによって、その単語に対
応するカテゴリ候補列を見つけていた。この方法の詳細
は、例えば、文献11特願昭58=214544号、バ
タン認識装置、に述べられているので、ここでは省略す
る。
また、入力音声中のカテゴリ抽出の段階において、発声
のなまけや隣接するカテゴリ(例えば音節)どうしの調
音結合などの原因によって、あるカテゴリが消失してい
たり、あるいはその存在が検出できなかった結果、その
前後のカテゴリが隣接するものとして抽出きれてしまう
ことがある。
この現象を以後、カテゴリの脱落と呼ぶ。
このことに対処するため、従来は、どのようなカテゴリ
の並びのときにカテゴリ脱落が起こるかということをあ
らかじめ調査し、その結果から比較的頻度の高いカテゴ
リ脱落について、そのカテゴリ脱落の起こっているカテ
ゴリ列を脱落したカテゴリが復元されたカテゴリ列に変
換するカテゴリタ9訂正規則を用意する。この規則を、
単語検出時に、カテゴリ候補列に適用することによって
、比較的頻度の高いカテゴリ脱落に対しては、脱落した
カテゴリを復元することができる。この方法の詳細は、
例えば文献2r並木、浜田、中津、“音声認識を用いた
日本語入力方式”、信学論Vo1. J 67  D 
 No、 4 、1984.4 Jに述べられているの
で、ここでは省略する。
(発明が解決しようとしている問題点)上記従来の方法
では、入力音声から抽出されたカテゴリ候補を用いてカ
テゴリ候補列を生成したのちに、単語のカテゴリ列との
照合を行なっていたために、最終的に無駄になるカテゴ
リ候補列が多数生成きれてしまい、そのために多大な計
算量を必要としていた。
また、検出すべき単語の区間が入力音声の一部分しか占
めない場合でも、従来は、その単語の存在しない区間を
含め、入力音声の端からすべてのカテゴリ候補について
等しく単語中のカテゴリとの照合を行なわねばならず、
無駄な計算時間を必要とし、I−iの検出まで長い時間
を必要としていた。
さらに、前記のカテゴリ列訂正規則は、カテゴリ脱’1
gの起こっているカテゴリ候補列だけではなくて、起こ
っていないカテゴリ候補列にも等しく適用される。また
、−つのカテゴリ候補列に対しては多くの場合、複数個
の訂正規則が個別に適用きれる。このため、一つのカテ
ゴリ候補列から多くのカテゴリ候補タリが生成されてし
まい、検出すべき!X語に対応するカテゴリ候補列が見
つかるまで、多くのカテゴリ候補列を検査しなければな
らない。しかもそのカテゴリ候補列のほとんどは、検出
すべき単語のカテゴリ列とは一致せずに最終的に無駄に
なるものである。
また、訂正規則で復元できるカテゴリは、比較的頻繁に
起こるカテゴリ脱落によるものに限られ、比較的まれに
起こる脱落に対しては復元は不可能である。復元できる
脱落を増やすためには訂正規則の数を増加させなければ
ならず、この結果、生成きれるカテゴリ候補列はますま
す増加する。
例えば、「オンセイニンシキトワ(音声認識とは)、と
発声移れた音声から、その中の音節候補を抽出しようと
したところ、音節“シ”の!!統待時間長短く、音節“
シ”とその前後の音節“ン”と“キ”のそれぞれとの音
節境界が接近していたために、音節“シ”の存在が検出
できずに、その前後の音節“ン”と“キ”の音節候補が
隣接する位置に抽出されたとする。この結果、音節“シ
”以外のすべての音節に対しては正しい音節候補が得ら
れた場合でも、生成される音節候補列は“オンセイニン
キトワ゛となり、脱落した音節“シ”を訂正規則で復元
しなければならない。しかしながら、このような音節の
脱落は比較的まれな種類のものであり、この脱落を訂正
する規則が用意されていることが少ないと思われる。ま
た、たとえ、この訂正規則が用意きれていても、その他
に、例えば、“ニン”→“ニイン”、“イ”→“イイ”
という訂正規則が用意されていることは多く、これらが
適用きれることによって、“オンセイイニンキトワ″、
“オンセイニイントワ”、“オンセイイニイントワ”な
どの無駄な音節候補列も生成きれてしまう。
本発明の目的は、無駄なカテゴリ候補列を生成せず、ま
た、検出すべき単語の区間が入力音声全体のごく一部で
ある場合や、きらに入力音声中の検出すべき単語中のい
くつかのカテゴリが脱落した場合でも、効率よく入力音
声から単語と−1の位置とを検出することを可能にする
!X語検出方式を提供することにある。
(問題点を解決するための手段) 前述の問題点を解決し上記目的を達成するために本発明
が提供する手段は、音節、音素、音素クラス等のカテゴ
リの列である入力音声から抽出した複数個のカテゴリ候
補とそれらの位置情報とを用いて、単語のカテゴリタ[
1に対応するカテゴリ候補列を生成することによって、
入力音声中の単語とその出現位置を検出する単語検出方
式であって、入力音声から得た複数個のカテゴリ候補の
それぞれをそのカテゴリ名で分類して記tαし、単語中
のカテゴリの並びの顕に従って各カテゴリに対応するカ
テゴリ候補をそのカテゴリと同じ名前に分類されて記憶
されているカテゴリ候補の中から選ぶとともに、単語中
の連続する3個のカテゴリの並びの最初と最後のカテゴ
リが、入力音声中の連続する2個のカテゴリ候補の並び
のそれぞれのカテゴリ候補に対応するときは、その3個
のカテゴリの並びと2個のカテゴリ候補の並びとを対応
させて、カテゴリ候補列の生成を行なうことを特徴とす
る。
(作用) 本発明の方式では、入力音声から抽出きれたカテゴリ候
補のうち、検出すべき単語に含まれるカテゴリと同じ名
前のカテゴリ候補だけを用いて、かつ単語中のカテゴリ
の並びを辿りながら対応するカテゴリ候補タロを生成す
る。このことによって、単語のカテゴリ列あるいはその
部分列に対応するカテゴリ候補列だけが生成されること
になり、無駄なカテゴリ列を生成することを避けること
が可能となる。
また、入力音声中のカテゴリ候補のうち、単語中のカテ
ゴリに対応するカテゴリ候補からカテゴリ候補列を生成
してゆくために、検出すべき単語の区間が入力音声の全
体のごく一部の場合であっても、また、その区間が入力
音声中のどの位置にあっても、素早くその単語を検出す
ることが可能となる。
入力音声中の単語の中のあるカテゴリが脱落した場合、
そのカテゴリの前後にそれぞれ隣接する2個のカテゴリ
に対するカテゴリ候補は入力音声中で互いに隣り合う。
すなわち、単語中のカテゴリ列をC+−I CI CI
olとし、カテゴリC1が脱落すると、C++IはCI
−1に後続するものとして、それぞれのカテゴリ候補が
抽出される。
そこで、検出すべき単語中のカテゴリの並びを辿りなが
ら、その単語に対応するカテゴリ候補列を生成するとき
に、上記のCI+ Hに対応するカテゴリ候補がCl−
1に対応するカテゴリ候補に入力音声中で後続するなら
ば、その2個のカテゴリ候補の並びを単語中のカテゴリ
列C+−+ C、C、、、に対応させる。このことによ
って、カテゴリC5が脱落していても、カテゴリ候補列
とカテゴリ列との正しい対応をとることが可能になる。
また、単語のカテゴリ列に対応するカテゴリ候補列だけ
が生成きれることになるため、無駄なカテゴリ候補列の
生成を避けることができる。
(実施例) 以下、図面を参照しつつ、実施例に従って本発明を一層
詳細に説明する。
第1図は本発明の一実施例を示すブロック図である。
本実施例では日本語の音声の入力がされるものとして、
カテゴリとして音節を用いる。
音節抽出部1は入力音声中の音節候補を検出し、その候
補を音節候補記憶部2に記憶する。例として、“オンセ
イニンシキトハ”(音声T2mとは)という音声が入力
されたとする。この場合、音節認識の結果として例えば
第2区に示されるような音節候補が抽出される。第2図
において、矢印の線が各音節候補の区間であり、各区間
に複数個の音節候補が抽出されている。これらの音節候
補は、音節者で分類されて、音節候補記憶部2に記憶さ
れる。この結果、音節候補記憶部2の内容は第3図に示
されるようになる。この図では、各音節候補を“音節基
/始端時刻:終端時刻”の形式で表現している。
単語記憶部3には検出すべき単語の音節列が記憶されて
いる。その中の1個の単語を単語バッファ4に取り出し
た後、入力音声にこのai語が含まれるかどうかが調べ
られる。今、単語バッファ4には!!L語r認識」の音
節列“ニンシキ”が記憶されているとする。
音節候補列生成部5は単語バッファ4に記憶されている
一屯語中の音節の並びの順に、音節候補記憶部2中の音
節候補から音節候補列を作成し、その結果の音節候補列
と対応する音節列とを音節候補列記憶部6に記憶する。
本実流側では、単J1の先頭の音節から順に音ffi列
を作成(7てゆく。
まず、単語バッファ4の先頭の音節は“二“であるから
、音節候補列生成部5は音節俣?+!i記憶部2中で“
二”に分類されて記憶きれている音節候補を取り出し、
それぞれを長さ1の音節候補列として音節“二”ととも
に音節俣補列記士α部6に記憶する。この結果、音節候
補列記憶部6には、■二/2:4(ニ) ■二/10:13(ニ) の2個の音節候補列が記憶される。ここで、括弧の中が
対応する音節列である。
次に、音節候補列生成部5はM6Dバッファ4中の次の
音節ン゛′とその次の音節“シ″に注目し、音節候補記
憶部2中で“ン”あるいは“シ”に分類きれて記憶され
ている音節候補のそれぞれについて、音節候補記憶部G
中のいずれかの音節候補夕Uの最後尾の音節候補に入力
音声中で後読しているかどうかを調べる。後続している
音節候補があれば、その音節候補を音節候補列の最後尾
に連結して新たな音節候補列を生成し音節候補列記憶部
6に記憶する。“ン”あるいは“シ”に分類されて記憶
されている音節候補列は、ン/2:4、ン/13:16
、シ/4ニアの3個である。
音節候補Aが他の音節候補Bに後読しているかどうかは
音節候補Aの終端時刻と音節候補Bの始端時刻とを比較
することによって判定することができる。ここでは、そ
れらの時刻の差がプラスマイナス1以下のときに後読す
ると判定する。そこで今の場合は、音節候補ン/13:
16を音節候補列■に連結して音節列“ニン”に対応さ
せ、音節候補シ/4ニアを音節候補■に連結し工、音節
列4ニンシ”に対応させろ。また、それまで音節候補列
記憶部6に記憶きれていた音節候補列は削除する。この
結果、音節候補列記憶部6の中には、■二/10:i3
−ン/′13:16にン′)■二/2:4−シ/4ニア
にンン) の2個の音節候補列が残る。
読いて、音節“シ”についての処理に進む6音節候補記
憶部2中で、“シ”あるいはその次の音節“キ“′に分
類されて記憶されている音節候補は、シ/4ニアとキ/
16:19の2個である。このそれぞれについて音節候
補列■あるいは■の最後尾の音節候補に入力音声中で後
読するかを調べると、キ/16:19が音45侯補列■
の最後尾の音節候補ン/13 : i6に後続すると判
定される。この結果、音節候補列■に音節候補キ/16
 : 19を連結してできた新たな音節候補列■を、音
節不11″ニンシキ”と対応させて、音罪列記憶部6に
記憶する。
従って、音節候補列記憶部6の内容は ■二/10:1B−ン/13:16−キ/16:19に
ンシキ) となる。
ここで、単語バッファ4の中の最後の音節に達している
ため、音節候補列生成部5は、屯Bn1認識、が入力音
>’43中の時刻10から時刻19に至る区間に存在す
るということを出力ず乙。
j〕(上、本発明の一実施併jを説明した。なお、音節
の脱落は、連続しないかぎり、1個の爪語中に複数細土
じていてもよい。
(発明の効果) 以上説明したように、本発明によれば、入力音声からの
音節候補抽出の段階で、検出すべき単語中の連続しない
いくつかの音節が脱落した場合でも、その単語の存在と
入力音声中での位置を検出することが可能となり、しか
も検出処理の途中で生成される音節候補列の数が極めて
少なくて、効率の良い単語検出を行なうことが可能とな
る、単語検出方式を提供することができる。
【図面の簡単な説明】
第1図は本発明の一実施例を示すブロック図、第2図は
第1図実施例における入力音声と抽出された音節候補の
一例を示す図、第3図は第1図実施例における音節候補
記憶部の内容の一例を示す図である。 1・・・音節検出部、2・・・音節候補記憶部、3・・
・単語記憶部、4・・・単語バッファ、5・・・音節列
生成部、6・・・音節列記憶部。 入力音声 第1図 第2図 第3図

Claims (1)

    【特許請求の範囲】
  1. 音節、音素、音素クラス等のカテゴリの列である入力音
    声から抽出した複数個のカテゴリ候補とそれらの位置情
    報とを用いて、単語のカテゴリ列に対応するカテゴリ候
    補列を生成することによって、入力音声中の単語とその
    出現位置を検出する単語検出方式において、入力音声か
    ら得た複数個のカテゴリ候補のそれぞれをそのカテゴリ
    名で分類して記憶し、単語中のカテゴリの並びの順に従
    って各カテゴリに対応するカテゴリ候補をそのカテゴリ
    と同じ名前に分類されて記憶されているカテゴリ候補の
    中から選ぶとともに、単語中の連続する3個のカテゴリ
    の並びの最初と最後のカテゴリが、入力音声中の連続す
    る2個のカテゴリ候補の並びのそれぞれのカテゴリ候補
    に対応するときには、その3個のカテゴリの並びと2個
    のカテゴリ候補の並びとを対応させて、カテゴリ候補列
    の生成を行なうことを特徴とする単語検出方式。
JP61190258A 1986-08-12 1986-08-12 単語検出方式 Expired - Lifetime JPH0656556B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61190258A JPH0656556B2 (ja) 1986-08-12 1986-08-12 単語検出方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61190258A JPH0656556B2 (ja) 1986-08-12 1986-08-12 単語検出方式

Publications (2)

Publication Number Publication Date
JPS6344700A true JPS6344700A (ja) 1988-02-25
JPH0656556B2 JPH0656556B2 (ja) 1994-07-27

Family

ID=16255146

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61190258A Expired - Lifetime JPH0656556B2 (ja) 1986-08-12 1986-08-12 単語検出方式

Country Status (1)

Country Link
JP (1) JPH0656556B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009237387A (ja) * 2008-03-28 2009-10-15 Mitsubishi Electric Information Systems Corp 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009237387A (ja) * 2008-03-28 2009-10-15 Mitsubishi Electric Information Systems Corp 音声文字変換装置、音声文字変換方法及び音声文字変換プログラム

Also Published As

Publication number Publication date
JPH0656556B2 (ja) 1994-07-27

Similar Documents

Publication Publication Date Title
US6094633A (en) Grapheme to phoneme module for synthesizing speech alternately using pairs of four related data bases
US7676373B2 (en) Displaying text of speech in synchronization with the speech
JP6599219B2 (ja) 読み付与装置、読み付与方法、およびプログラム
EP1632932B1 (en) Voice response system, voice response method, voice server, voice file processing method, program and recording medium
JPS6344700A (ja) 単語検出方式
CN119864019A (zh) 一种数据的生成方法及装置
JPS6344698A (ja) 単語検出方式
JP3039453B2 (ja) 音声認識装置
JPS6344696A (ja) 単語検出方式
JPS6344697A (ja) 単語検出方式
JPS58123126A (ja) 辞書検索装置
JPS5958493A (ja) 認識装置
JPS6073697A (ja) 音韻辞書の作成方法
JPH0535441A (ja) 文書自動作成装置
JPH0552506B2 (ja)
JPS6312000A (ja) 音声認識装置
JPS62208125A (ja) 文章読上げ装置
JP2003208194A (ja) 音声認識方法
JPS63158599A (ja) 単語検出方式
JPH1011427A (ja) 自動議事録作成装置
JPS60217490A (ja) 文字認識装置
JPS62131295A (ja) 単語綴りの発音記号への変換装置
JPS63106698A (ja) 音声入力かな漢字変換装置
JPS63158597A (ja) 単語検出方式
JPS63158600A (ja) 単語検出装置