JPH01224799A - 音声認識における文節候補削減方式 - Google Patents

音声認識における文節候補削減方式

Info

Publication number
JPH01224799A
JPH01224799A JP63051252A JP5125288A JPH01224799A JP H01224799 A JPH01224799 A JP H01224799A JP 63051252 A JP63051252 A JP 63051252A JP 5125288 A JP5125288 A JP 5125288A JP H01224799 A JPH01224799 A JP H01224799A
Authority
JP
Japan
Prior art keywords
word
phoneme
feature
clause
phonemes
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63051252A
Other languages
English (en)
Other versions
JP2951332B2 (ja
Inventor
Hitoshi Iwamida
均 岩見田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP63051252A priority Critical patent/JP2951332B2/ja
Publication of JPH01224799A publication Critical patent/JPH01224799A/ja
Application granted granted Critical
Publication of JP2951332B2 publication Critical patent/JP2951332B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [l’5コ 大語党の文節音声認識を行う場合に認識の対象となる有
効な候補を予め!i沢して削減する文節音声認識におけ
る文節候補削減方式に関し、単語辞書の単語から特徴を
抽出して、慎語を組み合わせて作成した文節における処
理量を少なくする音声認識における文節候補削減方式を
提供することを目的とし、 文節を認識単位とする音声認識装置における文節候補削
減方式において、認識の対象となる全ての単語を含む単
語辞書中の各単語について、その単語を含む文節を発声
した時に現れること力<61実に予想される特徴を単語
特徴抽出部において抽出し、単語特徴抽出部で抽出した
単語特徴を文節特徴合成部において組み合わせて文節と
しての特徴を合成し、入力音声を分析部で分析してその
出力から入力音声の特徴を入力特徴抽出部により抽出し
、文節特徴合成部で合成した文節特徴と、入力特徴抽出
部で抽出した入力音声の特徴に基づいて文節候補選択部
により音声認識の照合処理に有効な文節候補を選択する
よう構成する。
[産業上の利用分野] 本発明は、大語党の文節音声認識を行う場合に認識の対
象となる有効な候補を予め選択して削減する文節音声認
識における文節候補削減方式に関する。
近年、音声認識装置は各種の用途に用いられ、文書を音
声入力により作成したり、装置への指示を音声で行う場
合等に有用である。そのような場合、単に音声を単語単
位で認識せずにより長い単位である文節により認識する
ことが望まれ、それも大語党の文節音声を認識すること
が要望されている。ところが、そのためには認識対象と
なる文節が膨大な量になって、認識処理に要する時間が
長くなりその改善が望まれている。
[従来の技術] 第3図に従来例の構成図を示す。
第3図に示す構成は本出願と同一の出願人が開発した音
声認識における単語候補削減装置(特願昭62−530
66号)を文節音声認識に適用した構成を示す。
図において、単語辞書30には認識の対象となる文節を
構成するすべての単語がその音m1ラヘルネソトワーク
とともに格納されている。音韻ラベルネットワークは、
各子音や母音を示す音韻ラベルを単語の音声を表現する
ように関係づけるものであり、第4図にその例を示す。
第4図には、日本語の単語(文節でもある)の“しかし
”の音韻ラベルネットワークを例示するものであり、図
において“#”は単語境界、311″は0シ”の子音部
、“I”は無声化しない母音の“イ”、“i″は無声化
した母音の“イ2、“K”は1カ”の子音部、“A”は
母音の“ア”を示すそれぞれの音韻ラベルである。この
ようにネットワーク表現を用いて無声化という音声変形
現象を表現したものである。
文節合成部31は、単語辞書30から可能なすべての文
節を合成する。
文節特徴音曲抽出部32では、各合成された文節につい
て、特徴音韻を抽出する。すなわち、各文節ごとにそれ
より確実にあられれると事前に予想される特徴的な音韻
を抽出する。
一方、入力音声は分析部35で短時間周波数分析され短
時間スペクトル時系列データ(スペクトルパターンとい
う)を発生し、次の入力特徴音韻抽出部34では、分析
部35の出力データから特徴音韻を検出する。その特徴
音■は、大きいパワーで発音される音韻が容易かつ確実
に検出されるので、これを特徴的な音韻として抽出し、
文節候補選択部33に供給する。
文節候補選択部33において、入力特徴音韻抽出部34
で抽出された各特徴的な音韻と文節特徴音韻抽出部32
から得られた各文節の特徴音韻との間で相関をとって、
音声認識の照合処理に有効な文節を選択する。この文節
候補選択部33における処理は各文節の特徴音韻と入力
音声から抽出された特徴音韻とが類催しているものを文
節音声認識の照合を行う時の候補となる文節として選択
する。なお、照合動作は入力音声のスペクトルパターン
と候補である音韻ラベルネットワークから合成したスペ
クトルパターンとの類似度(または距離)を求めて最も
近似する文節を検出して出力するものであり、その際に
入カバターンと照合候補となる文節の時間軸のずれの補
正にDP法(ダイナミック・プログラミング・マツチン
グ)を利用する照合法が高性能な処理方式として使用さ
れる。
[発明が解決しようとする課題] 上記した従来例の構成によれば、単語辞書から可能なす
べての文節を合成するので、文節数が莫大であるために
、処理量に伴う処理時間が膨大になるという問題があっ
た。
本発明は単語辞書の単語から特徴を抽出して、単語を組
み合わせて作成した文節における処理量を少なくする音
声認識における文節候補削減方式を提供することを目的
とする。
[課題を解決するための手段] 本発明の原理的構成図を第1図に示す。
第1図において、10は単語辞書、11は各4を語の特
徴音韻を抽出する単語特徴音韻抽出部、12は単語を組
み合わせてそれぞれの特徴音韻を組み合わせた文節特徴
音韻合成部、13は照合に用いる文節の候補を選択する
文節候補選択部、14は入力音声を分析した出力から音
韻を抽出する入力音韻抽出部、15は分析部を表す。
本発明は、単語辞書の単語の特徴的な音韻を抽出し、単
語を組み合わせた文節の特徴となる音韻を単語の特徴音
韻の組み合わせにより合成して文節候補i!択部に入力
し、入力音声の特徴となる音韻と比較してそれにすべて
が含まれる特徴音韻を有する文節を照合の候補として3
yi訳する。
〔作用〕
第1図の単語辞書10の各単語にはそれぞれの品詞と活
用形が格納されており、単語特徴音韻抽出部11におい
て予めその単語を含む文節を発声した時に確実に現れる
と予想される特徴的な音韻を抽出する。
各単語について特徴音韻が抽出されると、文節特徴音■
合成部12は各単語を決められた規則により単語を組み
合わせて文節を合成した時の特徴音韻を抽出する。この
抽出は単語の特徴音韻を組み合わせることにより行われ
る。
一方、入力音声について分析部15において従来と同様
の方法で音声を分析し、その分析出力から更に入力音声
の音韻の候補を抽出する。
入力音韻抽出部14で抽出した音韻(候補を含む)と文
節特徴音韻合成部12で合成した多数の文節の特徴音韻
とが文節候補選択部13に供給され、入力音韻の候補に
すべての特徴音韻が含まれる文節が照合用に使用される
文節候補として選択され、含まれない特徴音曲を含む文
節は照合用の候補として採用しない。
[実施例〕 本発明の実施例の構成図を第2図に示す。
第2図において、20は単語辞書、21は特徴音韻ルー
ル格納部、22は単語特徴音韻抽出部、23はiPL語
特徴音龍パターン保持部、24は文節モデル格納部、2
5は文節特徴音韻合成部、26は文節特徴音韻パターン
保持部、27は選択部、28は文節候補生成部、29は
入力音韻抽出部、40は分析部を表す。
第2図おいて、単語辞書20には認識の対象となるすべ
ての単語を含んでいる。各単語には品詞と活用形が記述
され、単語の音頗うベルネントワークも記述されている
単語特徴音韻抽出部22では特徴音韻ルールにしたがっ
て単語辞書の各単語について、その単語を含む文節を発
声した場合に確実に現れると予想される特徴的な音韻を
抽出する。したがって、例えば活用語尾は確実に現れる
とは限らないのでそこから特徴的な音曲は抽出されにく
い。例えば、r/IRUKU (ある<)」の場合、r
KU、Jは活用により変化(「あるかない」のように)
するので、rARUJから特徴音韻が抽出される。
また、例えば、単語rsHIKAsHI  (Lかし)
」の場合、■は無声化し発声されない場合があるのでこ
れは特徴的な音韻ではなく、この単語の特徴音韻パター
ンはrsH,A、5l(Jである。
特徴音韻ルール格納部21には特徴的音韻を抽出するた
めのルールが格納されている。(無声化して発声されな
い音韻は特徴音韻とはならない等の規則)。
こうして各単語の特徴音韻パターンが抽出されて華語特
徴音面パターン保持部23に格納される。
次に、文節特徴音韻合成部25では文節モデル格納部2
4に記述された文節モデルにしたがって、各単語の品詞
情報に基づいてその単語の特徴音韻パターンと組み合わ
せることができる他の単語の特徴音韻パターンとを組み
合わせて、文節特徴音■を合成する。文節モデル格納部
24の内容としては、例えば、「名詞+助詞」、「動詞
+助動詞+助詞」等である。また、文節特徴音韻合成部
25の合成は、組み合わせの対象となる単語特徴音韻パ
ターン保持部23を直列に接続して行う。
文節特徴音韻合成部25で合成した出力は文節特徴音韻
パターン保持部26に格納される。
入力音声は分析部40において短時間周波数分析が行わ
れ、その結果は入力音韻抽出部29に供給されて、入力
音韻候補を抽出する。ここでは、分析データに基づいて
強い音韻を検出して、音韻のパターンを作成する。例え
ば、「しかし」と発声した場合は、r (SH,S)、
L  (K、T。
P)、A、  (SH,S)Jとなる。ここで、括弧内
はそのどちらかをとることを意味する。
選択部27は、文節特徴音韻パターン保持部26の中の
各パターンについて、それが入力音韻抽出部29から供
給された入力音声の音韻候補の中にすべて含まれている
か調べて、すべて含まれている文節特徴音韻パターンだ
けを選択する。例えば、入力音声が上記の例のようにr
 (SH,S) 。
1、  (K、T、P)、A、  (SH,S)Jの場
合、文節特徴音韻パターンのうち、rSH,A、SIN
やrs、A、SHJなどが選択される。
文節候補生成部28は選択部27で選択された文節特徴
音韻パターンを合成している元の単語特徴音m1パター
ンを、文節特徴音韻パターン保持部26を参照すること
により検出し、さらにその単語特徴音韻パターンが得ら
れた元の単語を、単語特徴音曲パターン保持部23を参
照することにより検出する。検出された単語を合成する
ことにより、文節候補を生成する。
例えば、選択された文節特徴音韻パターンがrsH,八
、SHJであった場合、それを合成している単語特徴パ
ターンはrSH,A、5IIJだけであり、その単語特
徴音韻パターンが得られる単語は「5FIIKASH■
 (しかし)」や、「5HIT八5HII(したしい)
」である。さらに、そこから文節を合成し、rsHI 
KASH+」、rsHTAsHI +  (親しい)」
、rsHITASl−11KU(親しく)」などが文節
候補となる。
文節候補となる各文節の情報は、認識装置の照合部にお
いて入力音声の分析データと従来技術により照合されて
認識が行われることはいうまでもない。
[発明の効果] 本発明によれば、従来のように可能な文節をすべて合成
してから文節候補を選択することなく単語のレベルで特
徴を抽出しておき、その種類を少なくしてから文節を合
成するので、選択の対象となる文節数を少なくすること
ができ、候補選択の処理を高速化できる。
【図面の簡単な説明】
第1図は本発明の原理的構成図、第2図は本発明の実施
例の構成図、第3図は従来例の構成図、第4図は音韻ラ
ベルネットワークの説明図である。 第1図中、 10:単語辞書 ll:単語特徴音韻抽出部 12:文節特徴音韻合成部 13:文節候補生成部 14:入力音韻抽出部 15:分析部

Claims (1)

  1. 【特許請求の範囲】 文節を認識単位とする音声認識装置における文節候補削
    減方式において、 認識の対象となる全ての単語を含む単語辞書(10)中
    の各単語について、その単語を含む文節を発声した時に
    現れることが確実に予想される特徴音韻を単語特徴音韻
    抽出部(11)において抽出し、単語特徴音韻抽出部(
    11)で抽出した単語特徴音韻を文節特徴音韻合成部(
    12)において組み合わせて文節としての特徴を合成し
    、 入力音声を分析部(15)で分析してその出力から入力
    音声の特徴音韻を入力音韻抽出部(14)により抽出し
    、 文節特徴音韻合成部(12)で合成した文節特徴と、入
    力音韻抽出部(14)で抽出した入力音声の音韻に基づ
    いて文節候補選択部(13)により音声認識の照合処理
    に有効な文節候補を選択することを特徴とする音声認識
    における文節候補削減方式。
JP63051252A 1988-03-04 1988-03-04 音声認識における文節候補削減方式 Expired - Fee Related JP2951332B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63051252A JP2951332B2 (ja) 1988-03-04 1988-03-04 音声認識における文節候補削減方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63051252A JP2951332B2 (ja) 1988-03-04 1988-03-04 音声認識における文節候補削減方式

Publications (2)

Publication Number Publication Date
JPH01224799A true JPH01224799A (ja) 1989-09-07
JP2951332B2 JP2951332B2 (ja) 1999-09-20

Family

ID=12881761

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63051252A Expired - Fee Related JP2951332B2 (ja) 1988-03-04 1988-03-04 音声認識における文節候補削減方式

Country Status (1)

Country Link
JP (1) JP2951332B2 (ja)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5887599A (ja) * 1981-11-20 1983-05-25 株式会社ピーエフーユー 音声単語認識装置
JPS6162167A (ja) * 1984-09-03 1986-03-31 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPS61238099A (ja) * 1985-04-15 1986-10-23 日本電信電話株式会社 単語音声認識装置
JPS61256396A (ja) * 1985-05-10 1986-11-13 株式会社日立製作所 音声認識装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5887599A (ja) * 1981-11-20 1983-05-25 株式会社ピーエフーユー 音声単語認識装置
JPS6162167A (ja) * 1984-09-03 1986-03-31 Matsushita Electric Ind Co Ltd 日本語文章作成装置
JPS61238099A (ja) * 1985-04-15 1986-10-23 日本電信電話株式会社 単語音声認識装置
JPS61256396A (ja) * 1985-05-10 1986-11-13 株式会社日立製作所 音声認識装置

Also Published As

Publication number Publication date
JP2951332B2 (ja) 1999-09-20

Similar Documents

Publication Publication Date Title
JP4302788B2 (ja) 音声合成用の基本周波数テンプレートを収容する韻律データベース
Kat et al. Fast accent identification and accented speech recognition
US7496498B2 (en) Front-end architecture for a multi-lingual text-to-speech system
US6751592B1 (en) Speech synthesizing apparatus, and recording medium that stores text-to-speech conversion program and can be read mechanically
US6510410B1 (en) Method and apparatus for recognizing tone languages using pitch information
Schultz et al. Language independent and language adaptive large vocabulary speech recognition.
Lu et al. Implementing prosodic phrasing in chinese end-to-end speech synthesis
Wutiwiwatchai et al. Thai speech processing technology: A review
JPH11249677A (ja) 音声合成装置の韻律制御方法
Agrawal et al. Analysis and modeling of acoustic information for automatic dialect classification
KR100669241B1 (ko) 화행 정보를 이용한 대화체 음성합성 시스템 및 방법
Abdullaeva et al. Uzbek speech synthesis using deep learning algorithms
Kayte et al. A Marathi Hidden-Markov Model Based Speech Synthesis System
Kiecza et al. Data-driven determination of appropriate dictionary units for Korean LVCSR
JPH0887297A (ja) 音声合成システム
Greibus et al. The phoneme set influence for Lithuanian speech commands recognition accuracy
JP3378547B2 (ja) 音声認識方法及び装置
Gujarathi et al. Gaussian filter-based speech segmentation algorithm for Gujarati language
JPH01224799A (ja) 音声認識における文節候補削減方式
Arafat et al. Speech synthesis for bangla text to speech conversion
Wisetpaitoon et al. End-to-end Thai text-to-speech with linguistic unit
JPH037995A (ja) 歌音声合成データの作成装置
Dessai et al. Development of Konkani TTS system using concatenative synthesis
JPH096378A (ja) テキスト音声変換装置
Panda et al. Modified Rule-based concatenative technique for intelligible speech synthesis in Indian languages

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees