JPH087594B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH087594B2
JPH087594B2 JP2088011A JP8801190A JPH087594B2 JP H087594 B2 JPH087594 B2 JP H087594B2 JP 2088011 A JP2088011 A JP 2088011A JP 8801190 A JP8801190 A JP 8801190A JP H087594 B2 JPH087594 B2 JP H087594B2
Authority
JP
Japan
Prior art keywords
hypothesis
symbol sequence
symbol
speech
generating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2088011A
Other languages
English (en)
Other versions
JPH03287200A (ja
Inventor
芳春 阿部
邦男 中島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP2088011A priority Critical patent/JPH087594B2/ja
Publication of JPH03287200A publication Critical patent/JPH03287200A/ja
Publication of JPH087594B2 publication Critical patent/JPH087594B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は入力音声を認識する音声認識装置に関する
ものである。
〔従来の技術〕
第6図は例えば特許願(昭和63年9月30日出願、発明
の名称;音声認識装置及び学習方法、出願人;三菱電機
(株)、出願番号63−246367)あるいは電子情報通信学
会論文誌(「線形音素文脈モデルを用いた音声認識方
法」平成元年8月25日発行)に示された音声認識技術に
基づいて構成された大語彙を対象単語とする音声認識装
置を示す構成ブロック図である。第6図において、1は
入力音声を分析する音声分析手段、2は認識対象単語を
記述した記号系列(音素系列)が記載されている単語辞
書、3は単語辞書2に記述された記号系列から該記号系
列の表す音声のモデルを該記号系列並びに入力音声の特
徴から得られる音素のコンテキストに依存して生成する
モデル生成手段、4はモデル生成手段3で生成された音
声モデル中で入力音声に対する尤度を計算する尤度計算
手段、5は上記尤度の高い音声モデルの記号系列を選択
する候補選択手段である。
次にこの従来例の動作について説明する。入力された
音声は、音声分析手段1で特徴ベクトル系列に変換され
る。モデル生成手段3は単語辞書2に記述された認識対
象単語の各記号系列について、この特徴ベクトル系列及
び記号系列から音素のコンテキスト情報を抽出すると共
に、この音素のコンテキスト情報に基づいて音素のコン
テキストを考慮した単語のモデルを生成する。尤度計算
手段4はこのように生成された各単語モデルについて、
特徴ベクトル系列に対する尤度を計算する。候補選択手
段5はその中で尤度の高い単語モデルの記号系列をN個
選択し、認識結果として出力する。
〔発明が解決しようとする課題〕
まず、以上のように構成された従来の音声認識装置
は、音素のコンテキストによる音声の変動を吸収できる
ため単語辞書中の記号系列の表す単語は高精度で認識で
きるが、一般の文章でよく現れる単語辞書に記載されて
いない専門用語や新語、活用形、複合語などは認識でき
ない。
そこで、単語辞書を用いず、音声の分析フレーム毎に
記号間の任意の遷移を許すグラフ構造を参照して、任意
の記号系列を生成し、単語辞書にない音声を認識する方
法を採用する必要がある。
ところが、この認識方法は、音素のコンテキストによ
る音声の変動を考慮していない音声モデルの生成部を用
いる音声認識装置に適用されているが、記号列の候補
(仮説)の中に正しい仮説が含まれるように多くの仮説
を各フレームで残す必要があるため、分析フレームが増
えるにしたがって急速に生成される仮説の数が増え、認
識処理に必要なメモリや計算処理量が制限を越えて事実
上認識処理ができなくなり、実用にならないという問題
がある。
一方、本発明に係る音素のコンテキストに依存した音
声モデルの生成部を用いる場合には、各フレームで残す
仮説の数を比較的少なくできるが、それでも、フレーム
毎に仮説の生成を行うため、生成される仮説の数が依然
かなり多いという問題点が残る。
次に、ところで、認識対象を、単語辞書中の単語から
任意の記号系列に広げると当然類似の音声が増大するた
め、音声認識処理で得られる尤度だけに頼ると認識率が
低下してくるので、言語知識を利用した言語処理によっ
て、認識率の改善を図る必要がある。
本発明の目的である任意の記号系列を対象とする音声
認識装置のための言語処理として、記号系列の確率を訓
練文章中から得られる統計量から計算してこれを利用し
て、記号系列を選択する方法があり、中でも、2重マル
コフモデルを用いる方法(トライグラムモデルとも呼ば
れる)に関して、参考文献(中川著「確率モデルによる
音声認識」、113〜120頁)で述べられているごとく技術
の蓄積がある。
この技術は、基本的に、記号系列の確率を記号の3つ
組み、2つ組みの出現頻度を利用して計算する方法であ
るが、記号系列中の3つ以上離れた所の記号間の相関が
考慮されないため訓練文章から得られる言語知識を十分
に活かしていないという問題がある。逆に、この点を改
善するために、この方法を4つ組み以上の出現頻度を利
用するように拡張するには、例えば4つ組みの数は記号
数を24として24×24×24×24=331776であるから、4つ
組みを訓練するには膨大な訓練データが必要になり、も
しある4つ組みが一つも訓練データ中に現れないとする
とその4つ組みを含む音声は、その記号系列の確率計算
結果が0となってしまい、認識できないという問題があ
る。
この発明は上記のような問題点を解決するためになさ
れたもので、生成される仮説の数を少なくし、任意の記
号系列に対応する音声を効率的に認識することができる
音声認識装置を得ることを目的とする。
〔課題を解決するための手段〕
この発明の請求項1に係る音声認識装置は、入力音声
の記号系列と音声区間の終端時刻とからなる仮説を保持
する仮説テーブル21と、この仮説テーブル21から終端時
刻の仮説を選択する仮説選択手段22と、この仮説選択手
段22の選択した仮説の記号系列に所定の記号を結合して
新たな仮説の記号系列を生成する仮説生成手段23と、こ
の仮説生成手段23の生成した記号系列に対応する音声モ
デルを該生成された記号系列の音素のコンテキストに依
存して生成するモデル生成手段3と、このモデル生成手
段3の生成する音声モデルと、入力音声の特徴とを比較
し尤度が極大となる音声区間の終端時刻を検出しこの終
端時刻に基づき新しい仮説を生成して上記仮説テーブル
21に登録する仮説登録手段41と、上記仮説テーブル21か
ら候補の記号系列を選択し音声認識結果として出力する
候補選択手段5とを備えたものである。また、請求項2
にかかる装置は、請求項1の構成に加え、前記候補選択
手段5が選択した仮説の記号系列をもとに、記号系列に
関する確率を求め、求めた確率から尤度を計算して、最
も尤度の高いものを識別結果として出力する言語処理装
置6を設けたものである。
〔作用〕 請求項1の装置においては、仮説テーブル21は入力音
声の記号系列と音声区間の終端時刻とからなる仮説を保
持する。仮説選択手段22は仮説テーブル21から終端時刻
の仮説を選択する。仮説生成手段23は仮説選択手段22の
選択した仮説の記号系列に所定の記号を結合して新たな
仮説の記号系列を生成する。モデル生成手段3は仮説成
長手段23の生成した記号系列に対応する音声モデルを該
生成された記号系列の音素のコンテキストに依存して生
成する。仮説登録手段41はモデル生成手段3の生成する
音声モデルと入力音声の特徴とを比較し尤度が極大とな
る音声区間の終端時刻を検出しこの終端時刻に基づき新
しい仮説を生成して上記仮説テーブル21に登録する。候
補選択手段5は仮説テーブル21から候補の記号系列を選
択し音声認識結果として出力する。請求項2の装置にお
いては、言語処理装置は、候補選択手段で選択された仮
説の記号系列に関する確率を求めて、求めた確率から尤
度を計算し、最も尤度の高いものを結果として出力す
る。
〔実施例〕
第1図は請求項1の発明の一実施例に係る音声認識装
置の構成ブロック図である。第1図において、第6図に
示す構成要素に対応するものには同一の符号を付し、そ
の説明を省略する。
第1図において、21は、記号系列と音声区間の終端時
刻からなる仮説を保持する仮説テーブルであり、仮説の
記号系列Wとこの記号系列に対する音声モデルが極大の
尤度を持って整合する音声区間の終端時刻Eとその時の
尤度Sとからなる3項組<W、E、S>を仮説として保
持する。また、22は仮説テーブル21から終端時刻tの仮
説を選択する仮説選択手段、23は仮説選択手段22の選択
した仮説の記号系列に所定の記号を結合して新たな記号
系列を生成する仮説生成手段、3は仮説生成手段23の生
成する記号系列に対して音素のコンテキストに依存する
音声モデルを生成するモデル生成手段、41はモデル生成
手段3で生成された音声モデル中で入力音声に対する尤
度を計算し尤度が極大となる音声区間の終端時刻Eを検
出する仮説登録手段である。
また、第2図は、この実施例の音声認識装置の動作を
説明するためのフローチャートである。
次にこの実施例の動作について第2図を用いて説明す
る。
入力された音声は、音声分析手段1で特徴ベクトル時
系列X(t)(時刻t=1,2,・・・,T)に変換される。
まず、音声が入力されると、初期状態において、 (1)仮説テーブル21はクリアされ(ステップS1)、空
の記号系列W=ε、 終端時刻E=1、尤度S=∝からなる仮説<ε,1,∝>
が登録される。
次に、時刻t=1,2,・・・,Tについて、以下の動作を
行う。
(2)仮説選択手段22は仮説テーブル21から終端時刻E
がtに等しく尤度Sの大きいB個の仮説Hb(b=1,2,・
・・,B)を選択する(ステップS2)。
(3)仮説生成手段23は、これらの仮説Hb(b=1,2,・
・・,B)について、その記号系列Wの末尾に記号q(q
=1,2,・・・,Q、Qは記号の種類、本実施例ではこのよ
うに記号は自然数で表される)を結合し新しい記号系列
W′=W‖q(X‖q(X‖Yは記号系列XとYの連結
を表す)を生成する(ステップS3)。
(4)モデル生成手段3はこの記号系列W′に対応する
音声モデルを音素のコンテキストに依存して生成し、仮
説登録手段41に送る。仮説登録手段41はモデル生成手段
3の生成した音声モデルの尤度を始端時刻を1、終端時
刻をtからt+32(32は最大音素継続時間)の範囲で変
えて、尤度が最大となる終端時刻E′とその尤度S′を
計算し(ステップS3)、新しい仮説<W′,E′,S′>を
生成して、仮説テーブル21に追加登録する(ステップS
4)。
最後に、候補選択手段5は、仮説テーブル21から、終
端時刻EがTである仮説を選択し、尤度の大きい方から
N個の仮説の記号系列を認識結果として出力する。
第3図は、請求項2の発明の一実施例の構成ブロック
図である。第3図において、第1図に示す構成要素に対
応するものには同一の符号を付し、その説明を省略す
る。第3図において、6は候補選択部5で選択されたN
個の仮説の記号系列を入力とし、記号系列の確率を計算
し、尤度に記号系列の確率から求められる尤度を計算し
て、認識結果を出力する言語処理装置である。
第4図は、この言語処理装置6における入力の記号系
列を計算する部分の構成ブロック図である。第4図にお
いて、601は部分記号系列の出現頻度を記憶する記憶手
段、602は長さLの記号系列の総出現頻度を記憶する記
憶手段、603は記憶手段601と記憶手段602の記憶内容を
参照し、入力記号系列の確率を計算する計算手段であ
る。
即ち、計算手段603は、入力の記号系列を部分記号系
列に分割し、入力の記号系列の確率を、該部分記号系列
の確率と、該部分記号系列の間の遷移の確率との積の該
分割に関する最大値を出力する。
第5図は、記憶手段601のデータ構造を説明するため
の図である。第5図において、601T1,601T21,601T211等
は左欄に部分記号系列の出現頻度、右欄に後続の表への
ポインターが記憶された記号種類Q個の行からなる表で
あり、これらの表がポインターによって結ばれたリスト
構造によって部分記号系列と出現頻度が記憶される。な
お、表601T1はリスト構造の先頭の表である。この表に
よって、例えば部分記号系列/2121/の出現頻度は表601T
2121の第1行の左欄C2121に記憶された値として、ま
た、例えば記号系列/12/の出現頻度は表601T11の第2行
左欄C12に記憶された値として得られる。
次に、計算手段603において記号系列Wの確率の計算
方法について第4図及び第5図を用いて説明する。
まず記号系列の部分記号系列への分割について説明す
る。例えば、記号系列としての音素系列/arajuru/の可
能な分割として、1分割では、arajuruの1通り、2分
割では、a‖rajuru、ar‖ajuru、ara‖juru、araj‖ur
u、araju‖ru、arajur‖uの6通り、3分割では、a‖
r‖ajuru、a‖ra‖juru、a‖raj‖uru、a‖raju‖r
u、a‖rajur‖u、ar‖a‖juru、ar‖aj‖uru、ar‖a
ju‖ru、ar‖ajur‖u、ara‖j‖uru、ara‖ju‖ru、a
ra‖jur‖u、araj‖u‖ru、araj‖ur‖u、araju‖r
‖uの15通り、4分割では、a‖r‖a‖juru、a‖r
‖aj‖uru、a‖r‖aju‖ru、a‖r‖ajur‖u、a‖
ra‖j‖uru、a‖ra‖ju‖ru、a‖ra‖jur‖u、a‖
raj‖u‖ru、a‖raj‖ur‖u、a‖raju‖r‖u、ar
‖a‖j‖uru、ar‖a‖ju‖ru、ar‖a‖jur‖u、ar
‖aj‖u‖ru、ar‖aj‖ur‖u、ar‖aju‖r‖u、ara
‖j‖u‖ru、ara‖j‖ur‖u、ara‖ju‖r‖u、ar
aj‖u‖r‖uの20通り、5分割では、a‖r‖a‖j
‖uru、a‖r‖a‖ju‖ru、a‖r‖a‖jur‖u、a
‖r‖aj‖u‖ru、a‖r‖aj‖ur‖u、a‖r‖aju
‖r‖u、a‖ra‖j‖u‖ru、a‖ra‖j‖ur‖u、
a‖ra‖ju‖r‖u、a‖raj‖u‖r‖u、ar‖a‖
j‖u‖ru、ar‖a‖j‖ur‖u、ar‖a‖ju‖r‖
u、ar‖aj‖u‖r‖u、ara‖j‖u‖r‖uの15通
り、6分割では、a‖r‖a‖j‖u‖ru、a‖r‖a
‖j‖ur‖u、a‖r‖a‖ju‖r‖u、a‖r‖aj‖
u‖r‖u、a‖ra‖j‖u‖r‖u、ar‖a‖j‖u
‖r‖uの6通り、7分割では、a‖r‖a‖j‖u‖
r‖uの1通りの合計64通りの分割方法がある。
一般に、長さLの記号系列Wのn個の部分系列への分
割の仕方は、 通りあるため、長さLの記号系列Wの任意個の部分系列
への分割の仕方は、全部で、 通りある。
次に計算手段603について説明する。
まず、入力の記号系列Wをn個部分記号系列Wi(i=
1,2,・・・,n)に分割するときの入力の記号系列の確率
Pn(W)を、 で定義する。ここで、P(Wi)は部分記号系列Wiの確
率、また、P(Wi→Wi+1)は部分記号系列Wiから部分
記号系列Wi+1への遷移確率であり、P(Wi)は、記憶
手段601に記憶されたWiの出現頻度C(Wi)と記憶手段6
02に記憶されたWiの長さ(|Wi|で表す)と同じ記号系列
の総出現頻度Ct(|Wi|)との比 P(Wi)=C(Wi)/Ct(|Wi|) として計算され、 また、P(Wi→Wi+1)は、Wiの末尾のM個の記号か
らなる記号列(W1とする)とWi+1の先頭1個の記号か
らなる記号列(W2とする)との間の遷移確率によって近
似して、 として計算される。
例えば、音素系列/arajuru/の2分割araj‖uruに対す
る確率は Pn(ara‖juru)=P(ara)・P(juru)・P(ara→j
uru)となる。
ここで、 P(ara)=C(ara)/Ct(|ara|) =C(ara)/Ct(3) P(juru)=C(juru)/Ct(|juru|) =C(juru)/Ct(4) また、M=2として、 P(ara→juru)=C(ra‖j)/C(ra) =C(raj)/C(ra) よって、 Pn(ara‖juru) =(C(ara)/Ct(3))・(C(juru)/ Ct(4))・(C(raj)/C(ra)) として計算される。
計算手段603は、前記のような入力の記号系列のすべ
ての分割の中で、上述のように定義された確率Pn(W)
の最大値Pmax(W)を入力の記号系列の確率P(W)と
して計算する。即ち、計算手段603は、この最大確率Pma
x(W)を、動的計画法に基づき、 漸化式: G(1)=1 G(j+1)=max G(k+1)*P(W[k:j−1]) k=j−N,j−1 *C(W[k-M:k-1]‖W[k:k])/C(W[k-M:k-1]) (j=1,2,・・・・,L) を解き、 Pmax(W)=G(L+1) とすることによって効率的に計算する。ここで、W[s:
e]は記号系列W中のs番目からe番目までの記号から
なる部分記号系列を示す。但し、sが0以下のときはs
=1とみなす。またNは部分記号系列の最大の長さで記
憶手段601の記憶容量の制限によって本実施例ではN=
7としている。
これによって、計算手段603は、例えば上述の音素系
列/arajuru/の分割でいえば、仮に、訓練文章中の音素
系列/ara/および/juru/の出現頻度がかなり高く、音素
系列/arajuru/の出現頻度が0ならば、/arajuru/はara
‖juruと分割するときの確率を出力すると予想される。
このように上記一実施例の音声認識装置においては、
仮説選択手段は仮説テーブルから終端時刻tの仮説だけ
を選択することによって生成される仮説の数を少なく
し、仮説生成手段はこれらの仮説に記号を結合して新た
な記号系列を生成することによって任意の記号系列に対
する音声の認識を可能とし、モデル生成手段は仮説生成
手段によって生成された新たな記号系列に対応する音素
のコンテキストに依存した音声モデルを生成することに
よって高精度の照合により正しい仮説がビーム内に残る
度合を高め、仮説登録手段は音声モデルの尤度が極大と
なる終端時刻を検出することによって生成される仮説の
数を少なくするようにしている。
また、上記他の実施例の音声認識装置における言語処
理装置においては、記憶手段は訓練文章中の記号系列の
出現頻度を記憶し、計算手段は入力の記号系列を前記記
憶手段中に出現頻度を持つ部分記号系列に分割し、その
出現頻度によって入力の記号系列の確率を計算し、訓練
データ中にない記号系列の確率を計算するようにしてい
る。
なお、以上の説明では、単語を認識対象とする場合に
ついて説明したが、単語に限らず、文節や、文章を認識
対象としても構わない。また、音声を記述するための記
号体系としては、音素を自然数で表したものとして説明
したが、音素に限らず他の記号例えば異音を表すための
記号を含む記号体系によっても構わない。もちろん、記
号は文字であってもよい。また、言語処理装置はその処
理の過程で最大確率を与える入力記号系列の分割に関す
る情報を同時に出力するようにできるのでこれを記号系
列の自動分割に応用することもできる。
〔発明の効果〕
以上のように請求項1の発明によれば、入力音声の記
号系列と音声区間の終端時刻とからなる仮説を保持する
仮説テーブルと、この仮説テーブルから終端時刻の仮説
を選択する仮説選択手段と、この仮説選択手段の選択し
た仮説の記号系列に所定の記号を結合して新たな仮説の
記号系列を生成する仮説生成手段と、この仮説生成手段
の生成した記号系列に対応する音声モデルを該生成され
た記号系列の音素のコンテキストに依存して生成するモ
デル生成手段と、このモデル生成手段の生成する音声モ
デルと入力音声の特徴と比較し尤度が極大となる音声区
間の終端時刻を検出しこの終端時刻に基づき新しい仮説
を生成して上記仮説テーブルに登録する仮説登録手段
と、上記仮説テーブルから候補の記号系列を選択し音声
認識結果として出力する候補選択手段とを備えて構成し
たので、仮説テーブルから終端時刻の仮説だけを選択す
ることによって生成される仮説の数が少なくなり、ま
た、これらの仮説に記号を結合して新たな記号系列を生
成することによって任意の記号系列に対する音声の認識
を可能とし、更に仮説生成手段によって生成された新た
な記号系列に対応する音素のコンテキストに依存した音
声モデルを生成することによって高精度の照合により正
しい仮説がビーム内に残る度合が高められ、音声モデル
の尤度が極大となる終端時刻を仮説登録手段で検出する
ことによって生成される仮説の数が少なくなる。したが
って、本発明によれば、任意の記号系列に対応する音声
を効率的に認識できるという効果が得られる。また、請
求項2による言語処理装置を備えたものでは、記号系列
の自動分割が行える。
【図面の簡単な説明】
第1図は請求項1の発明の一実施例に係る音声認識装置
の構成ブロック図、第2図はこの実施例の動作を説明す
るためのフローチャート、第3図は請求項2の発明の一
実施例に係る音声認識装置の構成ブロック図、第4図は
第3図中の言語処理装置の入力記号系列の確率を計算す
る部分の構成ブロック図、第5図はこの実施例における
記憶手段のデータ構造の説明図、第6図は従来の音声認
識装置の構成ブロック図である。 3……モデル生成手段、5……候補選択手段、21……仮
説テーブル、22……仮説選択手段、23……仮説生成手
段、41……仮説登録手段。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】入力音声の記号系列と音声区間の終端時刻
    とからなる仮説を保持する仮説テーブルと、この仮説テ
    ーブルから終端時刻の仮説を選択する仮説選択手段と、
    この仮説選択手段の選択した仮説の記号系列に所定の記
    号を結合して新たな仮説の記号系列を生成する仮説生成
    手段と、この仮説生成手段の生成した記号系列に対応す
    る音声モデルを該生成された記号系列の音素のコンテキ
    ストに依存して生成するモデル生成手段と、このモデル
    生成手段の生成する音声モデルと前記入力音声の特徴と
    を比較し尤度が極大となる音声区間の終端時刻を検出し
    この終端時刻に基づき新しい仮説を生成して上記仮説テ
    ーブルに登録する仮説登録手段と、上記仮説テーブルか
    ら候補の記号系列を選択し音声認識結果として出力する
    候補選択手段とを備えたことを特徴とする音声認識装
    置。
  2. 【請求項2】前記候補選択手段が選択した仮説の記号系
    列をもとに、記号系列に関する確率を求め、求めた確率
    から尤度を計算して、最も尤度の高いものを識別結果と
    して出力する言語処理装置を設けたことを特徴とする請
    求項第1項に記載の音声認識装置。
JP2088011A 1990-04-02 1990-04-02 音声認識装置 Expired - Fee Related JPH087594B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2088011A JPH087594B2 (ja) 1990-04-02 1990-04-02 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2088011A JPH087594B2 (ja) 1990-04-02 1990-04-02 音声認識装置

Publications (2)

Publication Number Publication Date
JPH03287200A JPH03287200A (ja) 1991-12-17
JPH087594B2 true JPH087594B2 (ja) 1996-01-29

Family

ID=13930902

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2088011A Expired - Fee Related JPH087594B2 (ja) 1990-04-02 1990-04-02 音声認識装置

Country Status (1)

Country Link
JP (1) JPH087594B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010048908A (ja) * 2008-08-19 2010-03-04 Canon Inc 情報処理装置及びその制御方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
電子通信学会誌昭和57年5月Vol.65,No.5,P.521

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010048908A (ja) * 2008-08-19 2010-03-04 Canon Inc 情報処理装置及びその制御方法

Also Published As

Publication number Publication date
JPH03287200A (ja) 1991-12-17

Similar Documents

Publication Publication Date Title
JP5327054B2 (ja) 発音変動規則抽出装置、発音変動規則抽出方法、および発音変動規則抽出用プログラム
JP5207642B2 (ja) 語句として新たに認識するべき文字列を取得するためのシステム、方法及びコンピュータプログラム
CN111916058B (zh) 一种基于增量词图重打分的语音识别方法及系统
US6801892B2 (en) Method and system for the reduction of processing time in a speech recognition system using the hidden markov model
JP3998668B2 (ja) 形態素解析装置、方法及びプログラム
JPH05127692A (ja) 音声認識装置
CN101432801A (zh) 语音识别词典制作支持系统、语音识别词典制作支持方法以及语音识别词典制作支持用程序
JPWO2009084554A1 (ja) テキスト分割装置とテキスト分割方法およびプログラム
US20110238420A1 (en) Method and apparatus for editing speech, and method for synthesizing speech
KR20240069763A (ko) 캐스케이드 인코더를 위한 트랜스듀서 기반 스트리밍 심의
CN111105787A (zh) 一种文本匹配方法、设备及计算机可读存储介质
JP2013050605A (ja) 言語モデル切替装置およびそのプログラム
US20150073796A1 (en) Apparatus and method of generating language model for speech recognition
WO2021181451A1 (ja) 音声認識装置、制御方法、及びプログラム
JP2000259645A (ja) 音声処理装置及び音声データ検索装置
US12579995B2 (en) Automatic speech recognition accuracy with multimodal embeddings search
JPH087594B2 (ja) 音声認識装置
JP2938865B1 (ja) 音声認識装置
JP2000267693A (ja) 音声処理装置及び索引作成装置
CN114038462B (zh) 一种语音业务处理方法、电子设备和计算机可读存储介质
JPH08221091A (ja) 音声認識装置
JP2001142877A (ja) アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体
JPH11328316A (ja) 文字認識装置、方法及び記憶媒体
JP2009086911A (ja) 固有表現抽出装置、その方法、プログラム及び記録媒体
CN117436445B (zh) 一种粤语词组分词处理方法及系统

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees