JPH0242238B2 - - Google Patents

Info

Publication number
JPH0242238B2
JPH0242238B2 JP58025069A JP2506983A JPH0242238B2 JP H0242238 B2 JPH0242238 B2 JP H0242238B2 JP 58025069 A JP58025069 A JP 58025069A JP 2506983 A JP2506983 A JP 2506983A JP H0242238 B2 JPH0242238 B2 JP H0242238B2
Authority
JP
Japan
Prior art keywords
syllable
length
boundary
speech
average
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58025069A
Other languages
English (en)
Other versions
JPS59149400A (ja
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed filed Critical
Priority to JP58025069A priority Critical patent/JPS59149400A/ja
Publication of JPS59149400A publication Critical patent/JPS59149400A/ja
Publication of JPH0242238B2 publication Critical patent/JPH0242238B2/ja
Granted legal-status Critical Current

Links

Description

【発明の詳細な説明】 <技術分野> 本発明は音声入力装置における音節境界選択方
式の改良に関し、更に詳細には音声入力装置にお
いて、発声速度に応じて音節境界を決定し得るよ
うにしたものである。
<従来技術> 一般に連続的に発声された音声から音節部を抽
出して識別を行なう方法では、音節部のセグメン
テーシヨンの正確さが認識性能を大きく左右す
る。
従来のセグメンテーシヨン方法においては発声
速度が変化するとセグメンテーシヨン誤り数も変
化する問題点があつた。これはセグメンテーシヨ
ンのアルゴリズムが発声速度に関係なく固定され
ていることに帰因している。
<目 的> 本発明は上記の点に鑑みてなされたものであ
り、連続音声の発声速度を推定し、音節境界検出
部から出力される音節境界候補の中から推定され
た発声速度にもとずいて音節境界を決定するよう
にした音声入力装置を提供することを目的として
いる。
<実施例> 以下、図面を参照して本発明を詳細に説明す
る。
第1図は本発明を実施した音声入力装置の全体
構成を示すブロツク図である。
第1図において、入力された音声は、音声分析
部1において、入力時刻tにおける音声信号から
パワーp(t)、スペクトルy(t)等の特徴パラ
メータが抽出される。この音声分析部1において
抽出された特徴パラメータが発声速度検出部2に
入力され、該発声速度検出部2内の無音区間検出
部21及び有音区間検出部22によつて入力され
たパラメータのパワーp(t)の強弱等にもとず
いて有音区間及び無音区間が区別される。
また発声速度検出部2内の発声速度推定部23
によつて音節数が既知である訓練用文章の音声入
力の有音区間の継続時間にもとずいて平均音節長
Lが推定され出力される。
即ち、音声入力装置を使用する時に、最初に音
節数が既知である訓練用文章をユーザが発話して
発声速度推定部23において平均音節長(1/
平均発声速度)を推定することになる。
今、音節数がn個含まれる文章を発話した際の
有音区間検出部22において検出されたi番目の
有音区間の継続時間をL(i)とすると(ただし
i=1、2、…、m)、発声速度推定部23にお
いて 平均音節長 =1/2ni=1 L(i) が算出され出力される。
文節境界検出部3では無音区間検出部21にお
いて検出された無音区間の継続時間にもとずい
て、無音区間の継続時間長が所定の長さを越えて
いる場合を検出して、その無音区間を文節境界と
みなしてその旨を出力する。
音節境界検出部4では上記文節境界検出部3に
よつて文節毎に区切られた音声を単位として、音
声分析部1で抽出された特徴パラメータを用いて
音節境界の候補を出力する(音節境界間の間隔が
音節長となる)。この音節境界検出部4において、
第2図に示すように時刻t1と時刻t3において、音
節境界が明確に検出されたが、時刻t2において音
節境界が存在するか否かを決定し難い場合がある
が、このような場合には、音節境界の最終決定は
音節境界選択部5が行なう。
音節境界選択部5は音節境界検出部4において
検出された音節境界の候補の音節長と発声速度推
定部23により推定された平均音節長とを比較
して音節境界を決定する。
今、第2図に示す例において、もし時刻t2が音
節境界でないならば、時間領域t1<t<t3におい
て長さt3−t1(図中A1の長さ)の音節が存在す
ることになり、もし音節境界ならば、長さt2−t1
(図中B1の長さ)と長さt3−t2(図中B2の長
さ)の音節が存在することになるが、音節境界選
択部5はこれらの音節長の候補A1,B1,B2
と平均音節長とを比較して音節境界を決定す
る。第2図に示した例では、A1の長さの方がB
1及びB2の長さより、平均音節長に近いた
め、長さA1の音節を選択して、時刻t2は音節境
界でないと判断される。
上記音節境界選択部5において行なわれる音節
境界の選択アルゴリズムをより一般化して以下に
説明する。
今、第3図に示すように、ある時間領域T1
t<T2において、音節境界の決定が困難なため、
音節境界検出部3がいくつかの音節候補列A,
B,C,…を作成して出力したとする(ただし、
音節候補列Aはa個の長さA1,A2,…,Aa
の音節候補から成り、音節候補列B,C,…も同
様とする)。
この音節候補列A,B,C,…が音節境界選択
部5に入力されて、音節候補A,B,C,…の平
均音節長からのずれDA,DB,DC,…がそれぞ
れ DA=1/aai=1 d(A(i),) DB=1/bbi=1 d(B(i),) DC=1/cci=1 d(C(i),) ただし、d(x,y)= |x−k1y|if長さx
の音節 の前に無音区間有 |x−k2y|if長さxの音節 の後に文節境界有 |x−y|if上記以外 として算出される。
ここで、文節の最初に来る音節や破裂音は平均
音節長より短くなることが多いため、0<k1
1と設定され、文節の終りの音節は長くなること
が多いため、k2>1と設定される。
音節境界選択部5は、上記のようにして算出さ
れた平均音節長からのずれDA,DB,DC,…の
中で最も小さな平均音節長からのずれを有する
音節候補列を選択して音節列として出力する。
音節認識部6では、上記のようにして求められ
た音節区間に対して音節標準パターンメモリ7に
記憶された音節の標準パターンとマツチングを行
なつて認識結果を出力する。
なお、上記実施例においては、音声入力装置を
使用する時に最初に既知の訓練用文章を発声して
平均音節長を算出するようにしたが、本発明
は、これに限定されることなく、例えば複数の話
者について予め平均音節長を算出して記憶してお
くように成してもよい。また同一話者における発
声速度の速い、普通、遅い状態における複数の平
均音節長を算出して記憶しておき、認識時の発
声状態により平均音節長を選択するようにしても
よい。
<効 果> 以上説明したように、本発明によれば、まず発
声速度を推定し、この推定した発声速度にもとず
いて音節境界が決定されるため、話者の特性等に
起因した入力音声の発声速度の相違に拘わらず、
正確に音節境界を検出決定することが出来る。
【図面の簡単な説明】
第1図は本発明を実施した音声入力装置の構成
を示すブロツク図、第2図は検出された音節境界
の一例を示す図、第3図は検出された音節境界候
補の他の例を示す図である。 1…音声分析部、21…無音区間検出部、22
…有音区間検出部、23…発声速度推定部、3…
文節境界検出部、4…音節境界検出部、5…音節
境界選択部。

Claims (1)

  1. 【特許請求の範囲】 1 発声内容が既知である音声の有声区間におけ
    る継続時間の総和をその音声に含まれる音節数で
    割つた平均音節長を算出する発声速度推定部と、 認識すべき音声の音節境界を検出する音節境界
    検出部と、 該音節境界検出部で検出された複数の音節境界
    候補に対して前記発声速度推定部で算出された前
    記平均音節長との類似度を求め、該類似度の最も
    大きい候補を音節境界とする音節境界選択部と、 を有することを特徴とする音声入力装置。
JP58025069A 1983-02-16 1983-02-16 音声入力装置 Granted JPS59149400A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58025069A JPS59149400A (ja) 1983-02-16 1983-02-16 音声入力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58025069A JPS59149400A (ja) 1983-02-16 1983-02-16 音声入力装置

Publications (2)

Publication Number Publication Date
JPS59149400A JPS59149400A (ja) 1984-08-27
JPH0242238B2 true JPH0242238B2 (ja) 1990-09-21

Family

ID=12155633

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58025069A Granted JPS59149400A (ja) 1983-02-16 1983-02-16 音声入力装置

Country Status (1)

Country Link
JP (1) JPS59149400A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04115336U (ja) * 1991-03-29 1992-10-13 ミツミ電機株式会社 磁気記録再生装置のカセツト保持フレーム

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS59180597A (ja) * 1983-03-31 1984-10-13 富士通株式会社 音声分割方式
JP2578771B2 (ja) * 1986-08-26 1997-02-05 松下電器産業株式会社 音声認識装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5324205A (en) * 1976-08-18 1978-03-06 Nec Corp Voice reco gnition device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04115336U (ja) * 1991-03-29 1992-10-13 ミツミ電機株式会社 磁気記録再生装置のカセツト保持フレーム

Also Published As

Publication number Publication date
JPS59149400A (ja) 1984-08-27

Similar Documents

Publication Publication Date Title
US8140330B2 (en) System and method for detecting repeated patterns in dialog systems
US6535850B1 (en) Smart training and smart scoring in SD speech recognition system with user defined vocabulary
US6317711B1 (en) Speech segment detection and word recognition
US20120239401A1 (en) Voice recognition system and voice recognition method
JP3069531B2 (ja) 音声認識方法
Zolnay et al. Extraction methods of voicing feature for robust speech recognition.
CN106920558B (zh) 关键词识别方法及装置
JPH0242238B2 (ja)
JPH0222399B2 (ja)
JP2001312293A (ja) 音声認識方法およびその装置、並びにコンピュータ読み取り可能な記憶媒体
KR100350003B1 (ko) 음성신호로부터워드를결정하는시스템
JPH0217118B2 (ja)
JP2006010739A (ja) 音声認識装置
KR100597434B1 (ko) 수정된 비터비 알고리즘과 빔폭 및 지속시간을 이용한핵심어 검출기
KR20090068856A (ko) 음소레벨 로그우도 비율 분포와 음소 지속시간 분포에 의한단어음색 모델 기반 발화검증 시스템 및 방법
JPH0772899A (ja) 音声認識装置
KR100275446B1 (ko) 음소 인식률을 이용한 기본 음소 설정 방법
JPH08314490A (ja) ワードスポッティング型音声認識方法と装置
JPH0997095A (ja) 音声認識装置
Takahashi et al. Isolated word recognition using pitch pattern information
JPS6147999A (ja) 音声認識装置
JPS63217399A (ja) 音声区間検出装置
JPH05303391A (ja) 音声認識装置
Ahmad et al. An isolated speech endpoint detector using multiple speech features
JP2891259B2 (ja) 音声区間検出装置