JPH067355B2 - 文章認識方法 - Google Patents
文章認識方法Info
- Publication number
- JPH067355B2 JPH067355B2 JP62180305A JP18030587A JPH067355B2 JP H067355 B2 JPH067355 B2 JP H067355B2 JP 62180305 A JP62180305 A JP 62180305A JP 18030587 A JP18030587 A JP 18030587A JP H067355 B2 JPH067355 B2 JP H067355B2
- Authority
- JP
- Japan
- Prior art keywords
- input
- sentence
- pattern
- standard pattern
- node
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 26
- 239000000470 constituent Substances 0.000 claims description 3
- 238000009825 accumulation Methods 0.000 claims description 2
- 208000024891 symptom Diseases 0.000 claims 1
- 230000007704 transition Effects 0.000 description 67
- 230000001186 cumulative effect Effects 0.000 description 14
- 238000012545 processing Methods 0.000 description 9
- 230000008859 change Effects 0.000 description 7
- 238000000605 extraction Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 241000277269 Oncorhynchus masou Species 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000007796 conventional method Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 240000003473 Grevillea banksii Species 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000010845 search algorithm Methods 0.000 description 1
Description
【発明の詳細な説明】 [産業上の利用分野] 本発明は連続して入力される単語列の中に標準パターン
に最も近い文章パターンが有ったときに、該当する標準
パターンを文章認識結果として抽出する文章認識方式に
関する。
に最も近い文章パターンが有ったときに、該当する標準
パターンを文章認識結果として抽出する文章認識方式に
関する。
[従来の技術] 音声認識において、音素・音節・単語の記号をノードと
した遷移ネットワークで1つの単語や文章を表現するこ
とは通常よく行なわれる。
した遷移ネットワークで1つの単語や文章を表現するこ
とは通常よく行なわれる。
例えば、「私は東京駅へいく」という文章を遷移ネット
ワークで表現すると、「私」→「は」→「東京駅」→
「へ」→「行く」というようになり、「」で囲まれた各
単語を表すノードと、ノード間の関係を示す→記号(以
下、アークと称する)とにより文章を表現することが可
能である。
ワークで表現すると、「私」→「は」→「東京駅」→
「へ」→「行く」というようになり、「」で囲まれた各
単語を表すノードと、ノード間の関係を示す→記号(以
下、アークと称する)とにより文章を表現することが可
能である。
これまで、音声の特徴パターンや、記号のネットワーク
で表現された単語と特徴系列との整合を行なうアルゴリ
ズムとしては、次の文献が知られている。
で表現された単語と特徴系列との整合を行なうアルゴリ
ズムとしては、次の文献が知られている。
(1)岡,速水:“文章連続音声認識のためのベクトル連
続DP(VCDP)アルゴリズムについて”,日本音響学会,
S82-71(1982-12) (2)迫江 博昭:“ある拡張されたDPマッチング
法”,日本音響学会,音声研究会資料,S83-23(1983-0
6) (3)同 :“クロックワスズなスタックP
法”,日本音響学会,講論集,2-1-8,(1983-10) (4)小林,幡野,新美:“安定な音素照合に基づく連続
音声認識”日本音響学会,音声研究会資料,S83-51(198
3-12) また、単語グラフとセグメントラティスのマッチングに
ついても、 (5)新美 康永:“音声認識”,共立出版,PP.148〜15
3,1979 に開示されているようにいくつかのアルゴリズムが確立
されている。
続DP(VCDP)アルゴリズムについて”,日本音響学会,
S82-71(1982-12) (2)迫江 博昭:“ある拡張されたDPマッチング
法”,日本音響学会,音声研究会資料,S83-23(1983-0
6) (3)同 :“クロックワスズなスタックP
法”,日本音響学会,講論集,2-1-8,(1983-10) (4)小林,幡野,新美:“安定な音素照合に基づく連続
音声認識”日本音響学会,音声研究会資料,S83-51(198
3-12) また、単語グラフとセグメントラティスのマッチングに
ついても、 (5)新美 康永:“音声認識”,共立出版,PP.148〜15
3,1979 に開示されているようにいくつかのアルゴリズムが確立
されている。
近年、連続音声を対象として認識を行なう場合、連続音
声中から単語を所定時間毎に、すなわちスポット的に識
別する方式で音声認識システムを構築することが考えら
れてきている。さらに、そのためのアルゴリズムとし
て、 (6)岡 隆一:“連続DPを用いた連続単語認識”,日
本音響学会,音声研究会資料,S78-20(1978-06) (7)速水,岡:“DPによる連続単語認識実験とその考
察”,信学論(D),J67-D.No.6,pp.677 684(昭59-06) に開示されている連続DP(ダイナミックプログラム)
方式が用いられることがある。連続DPはそれ自体の適
用と簡単な後処理によって連続単語を認識できるが単語
連結の最適性を考慮した拡張連続DPとよぶものも (8)中川 聖一:“Word Spotting法による連続単語認
識”,日本音響学会,講論集,3-2-8,(1983-03) によって提案されている。そして、文章認識を目的とし
て、構文で連続DPを駆動するとする構文駆動型連続D
Pが (9)岡田,松尾,牧野,城戸,:“構文駆動型連続DP
法による連続音声中からの文節的単位の検出”,日本音
響学会,講論集,2-3-2,(1986-10) によって提案されている。
声中から単語を所定時間毎に、すなわちスポット的に識
別する方式で音声認識システムを構築することが考えら
れてきている。さらに、そのためのアルゴリズムとし
て、 (6)岡 隆一:“連続DPを用いた連続単語認識”,日
本音響学会,音声研究会資料,S78-20(1978-06) (7)速水,岡:“DPによる連続単語認識実験とその考
察”,信学論(D),J67-D.No.6,pp.677 684(昭59-06) に開示されている連続DP(ダイナミックプログラム)
方式が用いられることがある。連続DPはそれ自体の適
用と簡単な後処理によって連続単語を認識できるが単語
連結の最適性を考慮した拡張連続DPとよぶものも (8)中川 聖一:“Word Spotting法による連続単語認
識”,日本音響学会,講論集,3-2-8,(1983-03) によって提案されている。そして、文章認識を目的とし
て、構文で連続DPを駆動するとする構文駆動型連続D
Pが (9)岡田,松尾,牧野,城戸,:“構文駆動型連続DP
法による連続音声中からの文節的単位の検出”,日本音
響学会,講論集,2-3-2,(1986-10) によって提案されている。
[発明が解決しようとする問題点] このように、従来の音声または文章認識方式としては種
々の方式が知られている。けれども、従来の音声または
文章認識方式では連続で入力される音声または単語系列
を文章単位で認識するときは、一般に予め記号からなる
標準パターン(以下単に標準パターンと記す)として、
複数の文章情報を記憶しておき、音声により入力された
文章情報を複数の標準パターンと比較し、入力された文
章情報と一致する標準パターンを認識結果として出力し
ている。
々の方式が知られている。けれども、従来の音声または
文章認識方式では連続で入力される音声または単語系列
を文章単位で認識するときは、一般に予め記号からなる
標準パターン(以下単に標準パターンと記す)として、
複数の文章情報を記憶しておき、音声により入力された
文章情報を複数の標準パターンと比較し、入力された文
章情報と一致する標準パターンを認識結果として出力し
ている。
ところが、例えば「私は東京駅へ行く」という文章と
「私も東京駅へ行く」という文章は異なるので従来の方
式では、上述の二つの文章を標準パターンとして記憶せ
ねばならず、音声の文章認識を行うために、標準パター
ンを記憶するメモリの容量が、膨大となってしまう。加
えて、連続音声の場合は、文章の開始位置および終了位
置を自動または手動により指示しないと、標準パターン
と比較する入力パターンを連続音声の中から取り出せ
ず、その結果文章認識処理に多大の時間を要していた。
このため、連続的に発生される音声の表す文章を認識の
対象とすると、早口で話される音声には文章認識処理の
時間が追従できないという解決すべき問題点があった。
「私も東京駅へ行く」という文章は異なるので従来の方
式では、上述の二つの文章を標準パターンとして記憶せ
ねばならず、音声の文章認識を行うために、標準パター
ンを記憶するメモリの容量が、膨大となってしまう。加
えて、連続音声の場合は、文章の開始位置および終了位
置を自動または手動により指示しないと、標準パターン
と比較する入力パターンを連続音声の中から取り出せ
ず、その結果文章認識処理に多大の時間を要していた。
このため、連続的に発生される音声の表す文章を認識の
対象とすると、早口で話される音声には文章認識処理の
時間が追従できないという解決すべき問題点があった。
そこで、本発明の目的は、上述の点に鑑みて、文章の開
始位置および終了位置を定めることを必要としない文章
認識方法を提供することにある。
始位置および終了位置を定めることを必要としない文章
認識方法を提供することにある。
[課題を解決するための手段] このような目的を達成するために、本発明は、文章内容
を示す標準パターンを文章構成単位を表わす複数の第1
特徴要素の列で構成し、文章内容の異なる複数の前記標
準パターンを記憶しておき、文章構成単位を表わす複数
の第2特徴要素の列で構成される文章を認識する際に、
該文章を構成する前記第2特徴要素を順次に入力し、当
該入力された単一の第2特徴要素と、前記標準パターン
との間の局部距離を算出し、前記第2特徴要素が入力さ
れた時点を前記標準パターンの終端の時点と強制的にみ
なした入力パターンを前記第2特徴要素が入力される毎
に想定し、該入力パターンと前記標準パターンとの間の
整合の結果を、前記局所距離の更新的な累積により取得
し、当該取得した整合の結果が予め定めた距離以下とな
った時点を検出し、該時点において、前記第2特徴要素
の入力時点毎に整合の対象となった前記標準パターンを
文章の認識結果としてスポット的に定めることを特徴と
する。
を示す標準パターンを文章構成単位を表わす複数の第1
特徴要素の列で構成し、文章内容の異なる複数の前記標
準パターンを記憶しておき、文章構成単位を表わす複数
の第2特徴要素の列で構成される文章を認識する際に、
該文章を構成する前記第2特徴要素を順次に入力し、当
該入力された単一の第2特徴要素と、前記標準パターン
との間の局部距離を算出し、前記第2特徴要素が入力さ
れた時点を前記標準パターンの終端の時点と強制的にみ
なした入力パターンを前記第2特徴要素が入力される毎
に想定し、該入力パターンと前記標準パターンとの間の
整合の結果を、前記局所距離の更新的な累積により取得
し、当該取得した整合の結果が予め定めた距離以下とな
った時点を検出し、該時点において、前記第2特徴要素
の入力時点毎に整合の対象となった前記標準パターンを
文章の認識結果としてスポット的に定めることを特徴と
する。
また、本発明は、前記標準パターンを、一部に前記第1
特徴要素を共有した複数の文章パターンにより構成し、
当該文章パターンを構成する前記第1特徴要素の接続順
序を、1つの文をなすネットワーク上の任意のパスのも
つノード数を同じとするネットワークの形態で記憶して
おき、前記認識結果の特定のために、該接続順序の示す
文章パターンと、前記入力パターンとの距離を算出する
ことを特徴とする。
特徴要素を共有した複数の文章パターンにより構成し、
当該文章パターンを構成する前記第1特徴要素の接続順
序を、1つの文をなすネットワーク上の任意のパスのも
つノード数を同じとするネットワークの形態で記憶して
おき、前記認識結果の特定のために、該接続順序の示す
文章パターンと、前記入力パターンとの距離を算出する
ことを特徴とする。
[作用] 本発明では、実施例の式(15)で定められるような入力区
間、例えば、第1図に示すような時刻t〜t+6までに
入力パターンとして入力された第2特徴要素列(実施例
の場合は単語列)と標準パターンとの間の最適距離(局
所)計算が時刻t+6で行われる。すなわち、時刻t+
6では入力「ます」があるが、これは標準パターンの時
刻τ=1の間の第1特徴要素列(わたくし,は,とうき
ょうえき,へ,いき,ます,(次の単語))の各第1の
特徴要素その距離(整合の結果)が計算され、かつ累積
される。このようにして入力パターンを特徴要素が入力
される毎に更新していくので、連続音声などから入力パ
ターンを切り出す際に入力パターンの始端/終端位置を
指示する必要がなくなる。加えて、入力の第2特徴要素
は標準パターンよりも短い。本発明で入力パターンとし
て第2特徴要素が入力される毎に第2特徴要素と標準パ
ターンとの間の局所距離計算を行い、その累積結果をこ
れまでに入力された入力パターン系列と標準パターンと
の整合結果とするので、その都度、上記入力パターン系
列そのもの自体と標準パターンとの距離計算を行う必要
はない。また、入力の第2特徴要素と標準パターンの中
に含まれる、第1特徴要素との比較が可能となるので、
複数の単語を共有する文章については、共有部分と相違
部分の単語で複数の文章パターンをネットワーク手法を
用いて記憶できる。このため、従来のように共有部分の
重複して文章を記憶した場合に比べて標準パターンの容
量が減少する。
間、例えば、第1図に示すような時刻t〜t+6までに
入力パターンとして入力された第2特徴要素列(実施例
の場合は単語列)と標準パターンとの間の最適距離(局
所)計算が時刻t+6で行われる。すなわち、時刻t+
6では入力「ます」があるが、これは標準パターンの時
刻τ=1の間の第1特徴要素列(わたくし,は,とうき
ょうえき,へ,いき,ます,(次の単語))の各第1の
特徴要素その距離(整合の結果)が計算され、かつ累積
される。このようにして入力パターンを特徴要素が入力
される毎に更新していくので、連続音声などから入力パ
ターンを切り出す際に入力パターンの始端/終端位置を
指示する必要がなくなる。加えて、入力の第2特徴要素
は標準パターンよりも短い。本発明で入力パターンとし
て第2特徴要素が入力される毎に第2特徴要素と標準パ
ターンとの間の局所距離計算を行い、その累積結果をこ
れまでに入力された入力パターン系列と標準パターンと
の整合結果とするので、その都度、上記入力パターン系
列そのもの自体と標準パターンとの距離計算を行う必要
はない。また、入力の第2特徴要素と標準パターンの中
に含まれる、第1特徴要素との比較が可能となるので、
複数の単語を共有する文章については、共有部分と相違
部分の単語で複数の文章パターンをネットワーク手法を
用いて記憶できる。このため、従来のように共有部分の
重複して文章を記憶した場合に比べて標準パターンの容
量が減少する。
[実施例] 以下に、図面を参照して本発明の一実施例を詳細に説明
する。
する。
本発明は、文章情報中の語尾変化,同一構文中である単
語が他の単語へ置き換わる等の現象に注目し、1つの標
準パターンにその標準パターンが取り得る語尾または単
語変化を含ませた文章を標準パターン側として構成する
と共に記憶しておき、連続音声等により入力された文章
情報に最も近い文章情報を記憶された標準パターンの中
からスポット的に抽出しようとするものである。
語が他の単語へ置き換わる等の現象に注目し、1つの標
準パターンにその標準パターンが取り得る語尾または単
語変化を含ませた文章を標準パターン側として構成する
と共に記憶しておき、連続音声等により入力された文章
情報に最も近い文章情報を記憶された標準パターンの中
からスポット的に抽出しようとするものである。
さて、発明者は先にベクトル連続DP(Continuaus Dyna
mic Programming)という手法を文献(1)において発見
し、本発明においてもベクトル連続DPの概念を特異的
に適用しているが、文献(1)のベクトル連続DPの概念
とは、連続DPを適用する際の累積距離をスカラー量で
はなくベクトル量とすることを意味しており、本発明も
この概念を使用する。
mic Programming)という手法を文献(1)において発見
し、本発明においてもベクトル連続DPの概念を特異的
に適用しているが、文献(1)のベクトル連続DPの概念
とは、連続DPを適用する際の累積距離をスカラー量で
はなくベクトル量とすることを意味しており、本発明も
この概念を使用する。
本発明でのベクトル連続DPの使用は入力された音声に
基づく入力記号列パターンと、整合の対象となる標準パ
ターン側である遷移ネットワークとを考えている。遷移
ネットワークは記号をノードとし、1つのノードから他
のノードへの遷移は方向付のアークで表わされていると
する。そのとき、この遷移ネットワークはT個のノード
集合{Rτ:τ=1,…,T}に、以下の意味で分割さ
れるものとする。すなわち、Rτに属するノードはRτ
にあるノードへ遷移するか、又はRτ+1に属するノード
へのみ遷移するものとする。
基づく入力記号列パターンと、整合の対象となる標準パ
ターン側である遷移ネットワークとを考えている。遷移
ネットワークは記号をノードとし、1つのノードから他
のノードへの遷移は方向付のアークで表わされていると
する。そのとき、この遷移ネットワークはT個のノード
集合{Rτ:τ=1,…,T}に、以下の意味で分割さ
れるものとする。すなわち、Rτに属するノードはRτ
にあるノードへ遷移するか、又はRτ+1に属するノード
へのみ遷移するものとする。
このとき、Rτのパラメータτは順序を表わすパラメー
タとなる。以上のように分割できる遷移ネットワークの
例を第5図(A)に示す。第5図(A)においてノードを形成
する記号、すなわち単語を意味する記号としてa,b,
c,d,e,f,g,h,i,jの10種類のものが存在
する。これらの記号は文章のつながりによって順序付け
された記号集合列、R1={a},R2={b,c},R3={d},R4=
{e,f,g},R5={h,i},R6={j}に分割できる。
タとなる。以上のように分割できる遷移ネットワークの
例を第5図(A)に示す。第5図(A)においてノードを形成
する記号、すなわち単語を意味する記号としてa,b,
c,d,e,f,g,h,i,jの10種類のものが存在
する。これらの記号は文章のつながりによって順序付け
された記号集合列、R1={a},R2={b,c},R3={d},R4=
{e,f,g},R5={h,i},R6={j}に分割できる。
ここで、{Rτ:τ=1,.6}は明らかに上述の条件を満
たす集合群になっている。例えばR2={b,c}では、c→
c,b→bというR2内の遷移を行うものが存在し、R2と
R3との関係ではb→d,c→dというR2の要素からR3の
要素への遷移が存在する。R4の要素についてはその内部
の要素間遷移として、e→e,f→fのみが存在し、R4
とR5との関係ではe→h,f→h,f→i,g→hとい
うR4の要素からR5の要素への遷移が存在する。第5図
(A)の例では、任意のRτ1とRτ2(τ1≠τ2)の
間には共通の記号がないが、一般には共通する記号が許
される。
たす集合群になっている。例えばR2={b,c}では、c→
c,b→bというR2内の遷移を行うものが存在し、R2と
R3との関係ではb→d,c→dというR2の要素からR3の
要素への遷移が存在する。R4の要素についてはその内部
の要素間遷移として、e→e,f→fのみが存在し、R4
とR5との関係ではe→h,f→h,f→i,g→hとい
うR4の要素からR5の要素への遷移が存在する。第5図
(A)の例では、任意のRτ1とRτ2(τ1≠τ2)の
間には共通の記号がないが、一般には共通する記号が許
される。
次に、本発明で用いるベクトル連続DPの漸化式で用い
る遷移ネットワークの説明を行う。
る遷移ネットワークの説明を行う。
いま、遷移ネットワーク内のノードを分割して得られる
ノードの集合Rτの要素の番号をjτでもって表わすと
する。ここで、パラメータτは順序を表わす。ノードの
集合Rτの全要素の数をJτとすると、1≦jτ≦jτ
となる。また、1≦τ≦Tとする。そのとき、Rτの要
素を2つの取り出す(これを取り出しAとする)か、ま
たはRτから要素を1つ取り出し、Rτ+1(1≦τ+
1≦T)から要素を1つ取り出す(これを取り出しBと
する)ことを考える。取り出された2つの要素番号をそ
れぞれjτ1,jτ2とする。番号jτ1,jτ2に対
応するノードをそれぞれノード(jτ1),ノードj
τ2と記すとき、ノード(jτ1)からノード
(jτ2)への変遷の有無に基づく変数、 を定義する。ここで、取り出しAにおいて、1≦
jτ1,jτ2≦jτについてjτ1=jτ2が許され
るとする。そのとき、遷移ネットワークをMと記すと
き、これを、 M={C(jτ1,jτ2):1≦jτ1≦Jτ,1≦jτ2≦Jτ 1≦τ1≦T,1≦τ2≦T} と表現するものとする。
ノードの集合Rτの要素の番号をjτでもって表わすと
する。ここで、パラメータτは順序を表わす。ノードの
集合Rτの全要素の数をJτとすると、1≦jτ≦jτ
となる。また、1≦τ≦Tとする。そのとき、Rτの要
素を2つの取り出す(これを取り出しAとする)か、ま
たはRτから要素を1つ取り出し、Rτ+1(1≦τ+
1≦T)から要素を1つ取り出す(これを取り出しBと
する)ことを考える。取り出された2つの要素番号をそ
れぞれjτ1,jτ2とする。番号jτ1,jτ2に対
応するノードをそれぞれノード(jτ1),ノードj
τ2と記すとき、ノード(jτ1)からノード
(jτ2)への変遷の有無に基づく変数、 を定義する。ここで、取り出しAにおいて、1≦
jτ1,jτ2≦jτについてjτ1=jτ2が許され
るとする。そのとき、遷移ネットワークをMと記すと
き、これを、 M={C(jτ1,jτ2):1≦jτ1≦Jτ,1≦jτ2≦Jτ 1≦τ1≦T,1≦τ2≦T} と表現するものとする。
いま、Mで表現された遷移ネットワークにおいて、記号
が付加されているノードの全体を、 {Z(τ,jτ):1≦jτ≦Jτ,1≦τ≦T}
(1) と表わす。ここで、Z(τ,jτ)は(τ,jτ)で指
定されるノードのもつ記号である。Rτは時刻τが付加
されているノードの集合として、JτはRτの全要素数
である。Tはτの最大値で通常のDPでの標準パターン
長に相当する。次に入力されてくる文章のなかのノード
に対応する記号列を、 {f(t):1≦t<∞} (2) と表わす。ここで、f(t)は時刻tの記号列を表わす。そ
のとき、遷移ネットワークMのτ=1からτ=Tに至る
すべての可能な記号列のパスの中で最も整合する記号列
を、入力の記号列中に終端時刻tで(スポット的に)に
与えるアルゴリズムを以下に述べる。これを本発明にお
けるベクトル連続DPのアルゴリズムとよぶ。
が付加されているノードの全体を、 {Z(τ,jτ):1≦jτ≦Jτ,1≦τ≦T}
(1) と表わす。ここで、Z(τ,jτ)は(τ,jτ)で指
定されるノードのもつ記号である。Rτは時刻τが付加
されているノードの集合として、JτはRτの全要素数
である。Tはτの最大値で通常のDPでの標準パターン
長に相当する。次に入力されてくる文章のなかのノード
に対応する記号列を、 {f(t):1≦t<∞} (2) と表わす。ここで、f(t)は時刻tの記号列を表わす。そ
のとき、遷移ネットワークMのτ=1からτ=Tに至る
すべての可能な記号列のパスの中で最も整合する記号列
を、入力の記号列中に終端時刻tで(スポット的に)に
与えるアルゴリズムを以下に述べる。これを本発明にお
けるベクトル連続DPのアルゴリズムとよぶ。
次に、時刻tに入力されてくる記号列f(t)と標準パター
ンの中の記号列z(τ,jτ)との距離を局所距離と
し、これを距離関数ρを用いて、 d(t,τ,jτ)=ρ(f(t),z(τ,jτ))
(3) で与える。f(t)がいくつかの候補をもつとき、すなわち
fi(t),(i=1,2,…I(t)であるとき、 d(t,τ,jτ)=minρ(fi(t),z(τ,jτ)) (4) i=1,2,…I(t) とすればよい。
ンの中の記号列z(τ,jτ)との距離を局所距離と
し、これを距離関数ρを用いて、 d(t,τ,jτ)=ρ(f(t),z(τ,jτ))
(3) で与える。f(t)がいくつかの候補をもつとき、すなわち
fi(t),(i=1,2,…I(t)であるとき、 d(t,τ,jτ)=minρ(fi(t),z(τ,jτ)) (4) i=1,2,…I(t) とすればよい。
なお、距離関数ρは例えば記号列f(t)と記号列z(τ,
jτ)とが一致するとき1、一致しないとき∞とすれば
よい。
jτ)とが一致するとき1、一致しないとき∞とすれば
よい。
次に、座標点(t,τ)におけるベクトルの累積距離
を、 {p(t,τ,jτ):1≦jτ≦Jτ} (5) と表わす。ここで、1≦t<∞,1≦τ≦Tである。
を、 {p(t,τ,jτ):1≦jτ≦Jτ} (5) と表わす。ここで、1≦t<∞,1≦τ≦Tである。
累積距離については初期条件が定められるが、それは通
常の連続DPの場合と同様に、 P(−1,τ,jτ)=p(0,τ,jτ)=∞
(6) となる。ここで、1≦jτ≦Jτ,1≦τ≦Tである。
常の連続DPの場合と同様に、 P(−1,τ,jτ)=p(0,τ,jτ)=∞
(6) となる。ここで、1≦jτ≦Jτ,1≦τ≦Tである。
なお、連続DPにおけるパスの経路に対する傾斜制限を
第6図のように定義する。この傾斜制限は形は対象であ
るが重みは非対象である。また、 [Jτ1,Jτ]={(1,1),(1,2),…,(1,Jτ), (2,1),……,(Jτ−1,Jτ)} (7) と定義するとき、p(t,τ,jτ)(t≧1)に関す
る漸化式は以下の(8)式(ケース(a)〜ケース(g)のよう
になる。
第6図のように定義する。この傾斜制限は形は対象であ
るが重みは非対象である。また、 [Jτ1,Jτ]={(1,1),(1,2),…,(1,Jτ), (2,1),……,(Jτ−1,Jτ)} (7) と定義するとき、p(t,τ,jτ)(t≧1)に関す
る漸化式は以下の(8)式(ケース(a)〜ケース(g)のよう
になる。
p(t,1,j1)=3×d(t,1,j1) ケース(a) (1≦j1≦J1) p(t,2,j2)=min (1≦j2≦J2) p(t,τ,jτ)=min (1≦jτ≦Jτ) (3≦τ≦T) ここで、サフィクスτをもつ組み合わせ(jτ,
j′τ)は上述の「取り出しA」によるノードの取り出
しを意味し、それ以外の組み合わせはすべて「取り出し
B」による取り出しを意味する。
j′τ)は上述の「取り出しA」によるノードの取り出
しを意味し、それ以外の組み合わせはすべて「取り出し
B」による取り出しを意味する。
ベクトル連続DPの時刻tにおける出力値をA(t)と記す
と、それは通常の連続DPの場合と類似して考えられ、 となる。
と、それは通常の連続DPの場合と類似して考えられ、 となる。
次に、ベクトル連続DPの動作の説明を第7図に基づい
て行なう。第7図において、遷移ネットワークを標準パ
ターン側としている。そして、横軸が入力記号列をもつ
時間パラメータtを表わす。遷移ネットワークにおいて
はパラメータτを、標準パターンの時間パラメータτと
考える。
て行なう。第7図において、遷移ネットワークを標準パ
ターン側としている。そして、横軸が入力記号列をもつ
時間パラメータtを表わす。遷移ネットワークにおいて
はパラメータτを、標準パターンの時間パラメータτと
考える。
このパラメータτの標準パターン側の縦軸をとる。座標
点(t,τ)は大きな円で示してあり、この点でのベク
トル累積距離の要素は小さな丸で示してある。大きな円
内の小さな丸はそれぞれRτ,(1≦τ≦6)の要素に
対応している。
点(t,τ)は大きな円で示してあり、この点でのベク
トル累積距離の要素は小さな丸で示してある。大きな円
内の小さな丸はそれぞれRτ,(1≦τ≦6)の要素に
対応している。
いま、傾斜制限の型は第6図に示すものとする。傾斜制
限を構成するパスは大きな円間をつなぐものと考える。
このパスの存在に基づいて、C(jτ1,jτ2)=1
であるノード間の遷移を小さな丸の間の方向付結線で表
わす。この結線をチャネル結線とよぶ。一例として、点
(t,τ)=(t,3)をとりあげる。遷移ネットワー
クでτ=3であるノードをみると、それは1つしかな
く、またそのノードは自分自身への遷移をもっている。
この事実により、(t,τ)平面で点(t−1)平面で
点(t−1,3)から点(t,3)に至るチャネル結線
は1本のみである。
限を構成するパスは大きな円間をつなぐものと考える。
このパスの存在に基づいて、C(jτ1,jτ2)=1
であるノード間の遷移を小さな丸の間の方向付結線で表
わす。この結線をチャネル結線とよぶ。一例として、点
(t,τ)=(t,3)をとりあげる。遷移ネットワー
クでτ=3であるノードをみると、それは1つしかな
く、またそのノードは自分自身への遷移をもっている。
この事実により、(t,τ)平面で点(t−1)平面で
点(t−1,3)から点(t,3)に至るチャネル結線
は1本のみである。
遷移ネットワークでτ=2であるノードをみるとそれぞ
れはτ=3の1つのノードへ遷移している。この事実に
より、(t,τ)平面では、点(t−2,2)から点
(t−1,3)へ、点(t−1,2)から点(t,3)
へ、点(t,2)から点(t,3)へ、それぞれ2本の
結線が存在する。このとき、遷移ネットワークでτ=2
にある2つのノードはそれぞれ自己への遷移があるの
で、点(t−2,2)から点(t−1,2)へ、点(t
−1,2)から点(t,2)へ等々のチャンネル結線が
存在するがそれらは点(t,3)へ直接関与しないため
図中省略してある。
れはτ=3の1つのノードへ遷移している。この事実に
より、(t,τ)平面では、点(t−2,2)から点
(t−1,3)へ、点(t−1,2)から点(t,3)
へ、点(t,2)から点(t,3)へ、それぞれ2本の
結線が存在する。このとき、遷移ネットワークでτ=2
にある2つのノードはそれぞれ自己への遷移があるの
で、点(t−2,2)から点(t−1,2)へ、点(t
−1,2)から点(t,2)へ等々のチャンネル結線が
存在するがそれらは点(t,3)へ直接関与しないため
図中省略してある。
点(t,3)へ直接関与するものとして他には点(t−
1,1)から点(t,2)へのパスがある。この場合、
遷移ネットワークのτ=1のノードからの遷移を調べる
ことで、点(t−1,1)から点(t,2)へ至る2本
のチャネル結線の存在が了解できる。
1,1)から点(t,2)へのパスがある。この場合、
遷移ネットワークのτ=1のノードからの遷移を調べる
ことで、点(t−1,1)から点(t,2)へ至る2本
のチャネル結線の存在が了解できる。
この場合も、点(t−1,1)から点(t−1,2)へ
点(t,1)から点(t,2)へ等々のチャネル結線が
存在するが、それらも点(t,3)へ直接関与しないた
め図中省略してある。このとき、ベクトル連続DPの漸
化式は、点(t,3)にある1つのノードに対応した累
積関距離値P(t,3,1)として、このノードに至る
すべてのチャネル結線を通じて累積されうる値の中で最
小となるものを与える。
点(t,1)から点(t,2)へ等々のチャネル結線が
存在するが、それらも点(t,3)へ直接関与しないた
め図中省略してある。このとき、ベクトル連続DPの漸
化式は、点(t,3)にある1つのノードに対応した累
積関距離値P(t,3,1)として、このノードに至る
すべてのチャネル結線を通じて累積されうる値の中で最
小となるものを与える。
ベクトル連続DPでは傾斜制限に基づき、(t,τ)平
面近接の座標点間に多チャネル結線が仮定される。ベク
トル連続DPの漸化式とは、これらの多チャネルを伝搬
してゆく値をノード毎に、かつ、連続DP的に点(t,
τ)で最適に累積するアルゴリズムとなっている。
面近接の座標点間に多チャネル結線が仮定される。ベク
トル連続DPの漸化式とは、これらの多チャネルを伝搬
してゆく値をノード毎に、かつ、連続DP的に点(t,
τ)で最適に累積するアルゴリズムとなっている。
点(t,τ)でのベクトルの累積距離の各要素P(t,
τ,jτ)はR1に属するノードからRτのj番目のノ
ードへ至る最適パスが累積した距離を表わす。ベクトル
連続DPの出力値A(t)は遷移ネットワークのτ=1から
τ=Tへ至り、かつ時刻t終端時刻とする場合の最適パ
スによる正規化累積距離を表わす。時刻tは入力記号系
列の時間パラメータであることしから、例えばA(t)の局
所的最小値を定めることで遷移ネットワーク内の最適パ
スを入力記号系列中にスポットできることとなる。
τ,jτ)はR1に属するノードからRτのj番目のノ
ードへ至る最適パスが累積した距離を表わす。ベクトル
連続DPの出力値A(t)は遷移ネットワークのτ=1から
τ=Tへ至り、かつ時刻t終端時刻とする場合の最適パ
スによる正規化累積距離を表わす。時刻tは入力記号系
列の時間パラメータであることしから、例えばA(t)の局
所的最小値を定めることで遷移ネットワーク内の最適パ
スを入力記号系列中にスポットできることとなる。
次に、傾斜制限のパスと遷移ネットワークのノード間遷
移の関係について説明する。
移の関係について説明する。
ベクトル連続DPは音声の特徴系列をも対象にしうる
が、音素・音節・単語等の記号系列にする場合、このア
ルゴリズムを入力についての脱落,挿入の処理としての
観点から評価するに留まらず、それを遷移ネットワーク
内の記号系列サーチアルゴリズムとしての観点からも評
価する必要がでてくる。後者の評価問題では、ベクトル
連続DPにおける傾斜制限のパスと遷移ネットワークの
ノード間遷移の関係を調べることが重要となる。
が、音素・音節・単語等の記号系列にする場合、このア
ルゴリズムを入力についての脱落,挿入の処理としての
観点から評価するに留まらず、それを遷移ネットワーク
内の記号系列サーチアルゴリズムとしての観点からも評
価する必要がでてくる。後者の評価問題では、ベクトル
連続DPにおける傾斜制限のパスと遷移ネットワークの
ノード間遷移の関係を調べることが重要となる。
ここでは、その制約を満足している例として第6図に示
した傾斜制限について、そのパスと遷移ネットワークの
ノード間遷移の関係について説明する。第8図(A)〜(D)
は4つの型のノード間遷移とそれに対応して形成される
チャネル結線を示している。第8図(A)のノード記号a
は自己遷移を意味するが、それはベクトル連続DPの演
算系ではt軸に平行な傾斜のパスの中にチャネルを作
る。このチャネルは入力記号列に記号aが2個連続して
出現してくる場合局所的にマッチングする。
した傾斜制限について、そのパスと遷移ネットワークの
ノード間遷移の関係について説明する。第8図(A)〜(D)
は4つの型のノード間遷移とそれに対応して形成される
チャネル結線を示している。第8図(A)のノード記号a
は自己遷移を意味するが、それはベクトル連続DPの演
算系ではt軸に平行な傾斜のパスの中にチャネルを作
る。このチャネルは入力記号列に記号aが2個連続して
出現してくる場合局所的にマッチングする。
第8図(B)はRτの中でのa→bという遷移の場合であ
るが、この場合も第8図(A)と同じようにt軸に平行の
傾斜のパスの中にチャネルを作る。このチャネルは入力
記号列にa,bと出現してくる場合局所的にマッチング
する。
るが、この場合も第8図(A)と同じようにt軸に平行の
傾斜のパスの中にチャネルを作る。このチャネルは入力
記号列にa,bと出現してくる場合局所的にマッチング
する。
第8図(C),(D)についても同様な論議ができる。ベクト
ル連続DPで許される傾斜制限の例としては他に第9図
で示されるものがある。なお第9図(B)の傾斜制限を用
いる場合、第8図(A),(B),(C)のノード間遷移に局所
的にマッチングすることはありえない。一方、第9図
(B)の傾斜制限を用いる場合は遷移ネットワークにおい
て、RτからRτを介せずに直接Rτへ遷移するものを
扱うことができる。このように、傾斜制限の型は遷移ネ
ットワークを構成する基本的な遷移の型の組を決定する
といえる。そのため、構成したい遷移ネットワークに合
致した傾斜制限の型を選択すればよい。
ル連続DPで許される傾斜制限の例としては他に第9図
で示されるものがある。なお第9図(B)の傾斜制限を用
いる場合、第8図(A),(B),(C)のノード間遷移に局所
的にマッチングすることはありえない。一方、第9図
(B)の傾斜制限を用いる場合は遷移ネットワークにおい
て、RτからRτを介せずに直接Rτへ遷移するものを
扱うことができる。このように、傾斜制限の型は遷移ネ
ットワークを構成する基本的な遷移の型の組を決定する
といえる。そのため、構成したい遷移ネットワークに合
致した傾斜制限の型を選択すればよい。
次に、遷移ネットワーク構成とパラメータτによる順序
付けについて説明する。
付けについて説明する。
先に述べたように、遷移ネットワークのすべてのノード
はパラメータτで順序付けられたノード集合の列に分割
されなければならない。しかし遷移ネットワークの構成
においてノード個数(時間長に対応)の異なるものが幾
つも分岐している場合、ノードのパラメータτによる順
序付けが可能であるかを考察しなければならない。
はパラメータτで順序付けられたノード集合の列に分割
されなければならない。しかし遷移ネットワークの構成
においてノード個数(時間長に対応)の異なるものが幾
つも分岐している場合、ノードのパラメータτによる順
序付けが可能であるかを考察しなければならない。
ノード個数の異なるものが幾つも分岐する場合の例とし
ては、文章中にある単語の幾つもの単語に置く変わる場
合や、語尾変化をもつ用言を表現する場合等がある。第
6図の傾斜制限を用いるベクトル連続DPにおいて、分
岐できるもののノード個数変動範囲の拡大を考える。い
ま、空記号φを導入し、空記号φと入力記号との距離を
定数ε(≧0)を用いて、 d(t,τ,jτ)=ρ(f(t),z(τ,jτ)=
ε もしもz(τ,jτ)=φのとき(10) と定義する。ここで、定数εはφでないノードについて
の局所距離d(t,τ,jτ)の値に比べて十分小さいとす
る。そのとき、分岐できるもののノード個数変動範囲の
最大は6となる。第(10)図に分岐できもののノードの個
数の差異が6である例を示す。
ては、文章中にある単語の幾つもの単語に置く変わる場
合や、語尾変化をもつ用言を表現する場合等がある。第
6図の傾斜制限を用いるベクトル連続DPにおいて、分
岐できるもののノード個数変動範囲の拡大を考える。い
ま、空記号φを導入し、空記号φと入力記号との距離を
定数ε(≧0)を用いて、 d(t,τ,jτ)=ρ(f(t),z(τ,jτ)=
ε もしもz(τ,jτ)=φのとき(10) と定義する。ここで、定数εはφでないノードについて
の局所距離d(t,τ,jτ)の値に比べて十分小さいとす
る。そのとき、分岐できるもののノード個数変動範囲の
最大は6となる。第(10)図に分岐できもののノードの個
数の差異が6である例を示す。
いま、…a…と…ABCDEFG…という2つの記号系列を考
え、これらはaとAの前の記号列が同じであり、かつa
とGの後の記号列が同じであるとする。すなわち、遷移
ネットワークはaとAの前のノードで分岐し、aとGの
後でこの分岐が終了しているとして表現されるものであ
る。
え、これらはaとAの前の記号列が同じであり、かつa
とGの後の記号列が同じであるとする。すなわち、遷移
ネットワークはaとAの前のノードで分岐し、aとGの
後でこの分岐が終了しているとして表現されるものであ
る。
このとき、前者の記号列のaのあとに空記号φ2つを連
続して付加した記号列…aφφ…を考え、これを前者の
記号列とする。そのとき、後者の記号列を第(10)図(A)
に示したように自己遷移を許さないノード記号を段階状
に並べて遷移ネットワークを構成する(第(10)図(A)で
は前者の記号列も示されている)。このように表現した
後で縦軸にパラメータτをとると、分岐に対応する記号
列の長さに6つの差が存在してもベクトル連続DPは整
合を正しくとることができる。
続して付加した記号列…aφφ…を考え、これを前者の
記号列とする。そのとき、後者の記号列を第(10)図(A)
に示したように自己遷移を許さないノード記号を段階状
に並べて遷移ネットワークを構成する(第(10)図(A)で
は前者の記号列も示されている)。このように表現した
後で縦軸にパラメータτをとると、分岐に対応する記号
列の長さに6つの差が存在してもベクトル連続DPは整
合を正しくとることができる。
第(10)図(B)は第(10)図(A)に対応した2種類の記号列が
入力してくる場合のチャネル結線の経路を示している。
入力してくる場合のチャネル結線の経路を示している。
第(10)図(B)での上の経路が第(10)図(A)の右側のパスに
対応し、第(10)図(B)の下の経路が(10)図(A)の左側のパ
スに対応する。第(A)の左側のパスに対応して第(10)図
(B)の下の経路をとることについてはεが十分小さいこ
とから明らかである。
対応し、第(10)図(B)の下の経路が(10)図(A)の左側のパ
スに対応する。第(A)の左側のパスに対応して第(10)図
(B)の下の経路をとることについてはεが十分小さいこ
とから明らかである。
第(10)図の場合が分岐できるもののノード個数の差が差
異大6である時の場合であり、5以下の差を示す分岐に
ついてももちろん遷移ネットワークが構成できる。さら
に、第(10)図では2つの分岐をしめしたが、任意の個数
の分岐も許される。
異大6である時の場合であり、5以下の差を示す分岐に
ついてももちろん遷移ネットワークが構成できる。さら
に、第(10)図では2つの分岐をしめしたが、任意の個数
の分岐も許される。
以上はあくまで第6図示の傾斜制限を用いたときのもの
であり、例えば第9図(C)の傾斜制限を用いれば許容さ
れるノード個数の変動範囲は6より大きくなる。第6図
の傾斜制限を用いて変動範囲が7以上となる場合は別の
遷移ネットワークとしなければならないが、そのときは
幾つものベクトル連続DP値Ax(t),(x=1,2,…,)を比
較して最終判定をすればよい。
であり、例えば第9図(C)の傾斜制限を用いれば許容さ
れるノード個数の変動範囲は6より大きくなる。第6図
の傾斜制限を用いて変動範囲が7以上となる場合は別の
遷移ネットワークとしなければならないが、そのときは
幾つものベクトル連続DP値Ax(t),(x=1,2,…,)を比
較して最終判定をすればよい。
次に、ベクトル連続DPに付随するパラメータの抽出に
ついて説明する。
ついて説明する。
ベクトル連続DPでは標準パターン側が遷移ネットワー
クである。式(8),(9)は最適整合値を与えるが、その値
が遷移ネットワーク内のいかなるパスを通って算出され
るか、またそのパスに対応した入力記号列の区間につい
ての情報を与えるものでない。スポットされている遷移
ネットワーク内のパスは時刻tで認識している文章を示
すものであり、またこの認識された文章に対応した入力
信号列区間の内容も、音声理解系の構成には必要なもの
である。これら2つの情報を取り出すために、式(8)に
付随した2つのパラメータ変数を導入している。
クである。式(8),(9)は最適整合値を与えるが、その値
が遷移ネットワーク内のいかなるパスを通って算出され
るか、またそのパスに対応した入力記号列の区間につい
ての情報を与えるものでない。スポットされている遷移
ネットワーク内のパスは時刻tで認識している文章を示
すものであり、またこの認識された文章に対応した入力
信号列区間の内容も、音声理解系の構成には必要なもの
である。これら2つの情報を取り出すために、式(8)に
付随した2つのパラメータ変数を導入している。
ベクトル連続DPがスポット的に遷移ネットワークから
抽出する最適パスについて述べる。いま、 式(8)−(a)
〜(g)において、最小値(min)によって選択される局所最
適パスを、それぞれ通過するノードの番号の組,(j※
1a),(j※ 1b,j※ 2b,j※ 2b),(j※ 1c,j※ 2c),(j※ 1d,
j※ 2d),(j※ τ−1e,j※ τe,j※ τe),(j※
τ−1f,j※ τf),(j※ τ−2g,
j※ τ−1g,j※ τg)によって表わすとする。
抽出する最適パスについて述べる。いま、 式(8)−(a)
〜(g)において、最小値(min)によって選択される局所最
適パスを、それぞれ通過するノードの番号の組,(j※
1a),(j※ 1b,j※ 2b,j※ 2b),(j※ 1c,j※ 2c),(j※ 1d,
j※ 2d),(j※ τ−1e,j※ τe,j※ τe),(j※
τ−1f,j※ τf),(j※ τ−2g,
j※ τ−1g,j※ τg)によって表わすとする。
パラメータ変数{w(t,τ,jτ,α):1≦α≦N},(1≦
t<∞,1≦τ≦T,1≦jτ≦Jτ)によって、点(t,
τ)におけるjτ番目のノードのもつ累積距離P(t,
τ,jτ)に対応した遷移ネットワーク上の記号列パス
を表わす。ここで、αは記号列の記号の順序を表わすパ
ラメータでα=1が記号列の最後尾、α=Nが記号列の
先頭に対応するとする。また、N=2・maxjτ(1≦τ≦
T)とする。そのとき、w(t,τ,jτ,α)について、初
期条件を、 w(-t,τ,jτ,α)=w(0,τ,jτ,α)=φ (1≦τ≦T,1≦jτ≦Jτ,1≦α≦N) (10) として考える。ここで、φは空記号である。遷移ネット
ワーク内の最適パスは、局所的最適パスをつなげて得ら
れることから、式(8)−(a)〜(g)に対応して次の漸化式
によって与えられる。
t<∞,1≦τ≦T,1≦jτ≦Jτ)によって、点(t,
τ)におけるjτ番目のノードのもつ累積距離P(t,
τ,jτ)に対応した遷移ネットワーク上の記号列パス
を表わす。ここで、αは記号列の記号の順序を表わすパ
ラメータでα=1が記号列の最後尾、α=Nが記号列の
先頭に対応するとする。また、N=2・maxjτ(1≦τ≦
T)とする。そのとき、w(t,τ,jτ,α)について、初
期条件を、 w(-t,τ,jτ,α)=w(0,τ,jτ,α)=φ (1≦τ≦T,1≦jτ≦Jτ,1≦α≦N) (10) として考える。ここで、φは空記号である。遷移ネット
ワーク内の最適パスは、局所的最適パスをつなげて得ら
れることから、式(8)−(a)〜(g)に対応して次の漸化式
によって与えられる。
w(t,1,j1 1)=z(1,j※ 1a) ケース(a)のとき w(t,2,j2,1)=z(2,j※ 2b) w(t,2,j2,2)=z(2,j※ 2b) w(t,2,j2,α)=w(t-2,1,j※ 1b,α-2) (3≦α≦N) ケース(b)のとき w(t,2,j2,1)=z(2,j※ 2c) w(t,2,j2,α)=w(t-1,1,j※ 1c,α-1) (2≦α≦N) ケース(c)のとき w(t,2,j2,1)=z(2,j※ 2d) w(t,2,j2α)=w(t-1,1,j※ 1d,α-1) (2≦α≦N) ケース(d)のとき w(t,τ,jτ,1)=z(τ,j※ τe) w(t,τ,jτ,2)=z(τ,j※ τe) w(t,τ,jτ,α)=w(t-2,τ−1,j※ τ−1e,α
-2) (3≦α≦N) ケース(e)のとき w(t,τ,jτ,1)=z(τ,j※ τf) w(t,τ,jτ,α)=w(t-2,τ−1,j※ τ−1f,α
-1) (2≦α≦N) ケース(f)のとき w(t,τ,jτ,1)=z(τ,j※ τg) w(t,τ,jτ,2)=z(τ,j※ τ−1g) w(t,τ,jτ,α)=w(t-2,τ−2,j※ τ−2g,α
-2) (3≦α≦N) ケース(g)のとき (11) ここで、式(11)の(e),(f),(g)では3≦τ≦T,1≦
jτ≦Jτである。式(9)のA(t)を定めている最適累積
距離をp(t,T,j※ T)とすると、これに対応する遷移ネッ
トワーク内のパスの記号列は、 w(t,T,j※ T,N),w(t,T,j※ T,N-1)…,w(t,T,j※ T,1) (12) において空記号φを取り除いた部分である。
-2) (3≦α≦N) ケース(e)のとき w(t,τ,jτ,1)=z(τ,j※ τf) w(t,τ,jτ,α)=w(t-2,τ−1,j※ τ−1f,α
-1) (2≦α≦N) ケース(f)のとき w(t,τ,jτ,1)=z(τ,j※ τg) w(t,τ,jτ,2)=z(τ,j※ τ−1g) w(t,τ,jτ,α)=w(t-2,τ−2,j※ τ−2g,α
-2) (3≦α≦N) ケース(g)のとき (11) ここで、式(11)の(e),(f),(g)では3≦τ≦T,1≦
jτ≦Jτである。式(9)のA(t)を定めている最適累積
距離をp(t,T,j※ T)とすると、これに対応する遷移ネッ
トワーク内のパスの記号列は、 w(t,T,j※ T,N),w(t,T,j※ T,N-1)…,w(t,T,j※ T,1) (12) において空記号φを取り除いた部分である。
いま、パラメータ変数(t,τ,jτ),(1≦t<∞,1
≦τ≦T,1≦jτ≦Jτ)を点(t,τ)におけるノ
ード(jτ)で累積距離p(t,τ,jτ)の算出に要する
入力フレーム区間長とする。そのとき、(t,τ,
jτ)は初期条件を (t,τ,jτ)=(0,τ,jτ)=0 (1≦τ≦T,1≦jτ≦Jτ) (13) として、式(8)-(a)〜(g)に対応した漸化式、 (t,1,j1)=0 ケース(a)のとき (t,2,j2)=(t-2,1,j※ 2b)+2 ケース(b)のとき (t,2,j2)=(t-1,1,j※ 1c)+1 ケース(c)のとき (t,2,j2)=(t-1,1,j※ 1d) ケース(d)のとき (t,τ,jτ)=(t-2,τ-1,j※ τ−1e)+2 ケース(e)のとき (t,τ,jτ)=(t-2,τ-1,j※ τ−1f)+1 ケース(f)のとき (t,τ,jτ)=(t-2,τ-2,j※ τ−2g)+1 ケース(g)のとき (14) によって定まる。なお、式(14)のケース(e),(f),(g)
では、3≦τ≦T,1≦jτ≦Jτである。式(9)の出
力値A(t)を定めているp(t,T,jτ)を算出している入力の
区間は、 [t−(t,T,j※ T,t] (15) によって定められる。
≦τ≦T,1≦jτ≦Jτ)を点(t,τ)におけるノ
ード(jτ)で累積距離p(t,τ,jτ)の算出に要する
入力フレーム区間長とする。そのとき、(t,τ,
jτ)は初期条件を (t,τ,jτ)=(0,τ,jτ)=0 (1≦τ≦T,1≦jτ≦Jτ) (13) として、式(8)-(a)〜(g)に対応した漸化式、 (t,1,j1)=0 ケース(a)のとき (t,2,j2)=(t-2,1,j※ 2b)+2 ケース(b)のとき (t,2,j2)=(t-1,1,j※ 1c)+1 ケース(c)のとき (t,2,j2)=(t-1,1,j※ 1d) ケース(d)のとき (t,τ,jτ)=(t-2,τ-1,j※ τ−1e)+2 ケース(e)のとき (t,τ,jτ)=(t-2,τ-1,j※ τ−1f)+1 ケース(f)のとき (t,τ,jτ)=(t-2,τ-2,j※ τ−2g)+1 ケース(g)のとき (14) によって定まる。なお、式(14)のケース(e),(f),(g)
では、3≦τ≦T,1≦jτ≦Jτである。式(9)の出
力値A(t)を定めているp(t,T,jτ)を算出している入力の
区間は、 [t−(t,T,j※ T,t] (15) によって定められる。
以上で、ベクトル連続DPの原理を説明したので、次に
ベクトル連続DPを適用した本実施例の構成の一例を第
2図に示す。
ベクトル連続DPを適用した本実施例の構成の一例を第
2図に示す。
第2図において、10は音声を入力するマイクロフォンで
ある。20はアナログ−デジタル変換器(A/D変換器)で
あり、入力された音声をA/D変換する。30は中央演算処
理装置(CPU)であり、音声認識に関する演算処理を行
う。
ある。20はアナログ−デジタル変換器(A/D変換器)で
あり、入力された音声をA/D変換する。30は中央演算処
理装置(CPU)であり、音声認識に関する演算処理を行
う。
40はリードオンリメモリ(ROM)であり、第4図に示す制
御手順の他に、入力音声をノード毎に認識する制御手順
が格納されている。50はランダムアクセスメモリ(RAM)
であり、RAM50はCPU30の演算処理に用いる各種変数や、
入力された音声に関する情報を記憶する。
御手順の他に、入力音声をノード毎に認識する制御手順
が格納されている。50はランダムアクセスメモリ(RAM)
であり、RAM50はCPU30の演算処理に用いる各種変数や、
入力された音声に関する情報を記憶する。
RAM50にはネットワークテーブル51が設けられており、
ネットワークテーブル51に文章についての複数の標準パ
ターンが遷移ネットワークの形態で格納されている。な
お、標準パターンを固定しておく場合はネットワークテ
ーブル51をRAM40に記憶するようにしてもよい。60は認
識された文章パターンを印刷するプリンタである。
ネットワークテーブル51に文章についての複数の標準パ
ターンが遷移ネットワークの形態で格納されている。な
お、標準パターンを固定しておく場合はネットワークテ
ーブル51をRAM40に記憶するようにしてもよい。60は認
識された文章パターンを印刷するプリンタである。
第3図は本実施例のネットワークテーブル51のメモリ構
成の一例を示す。
成の一例を示す。
第3図により、標準パターンの1つとして第5図(B)に
示した文章について説明する。
示した文章について説明する。
図において、縦軸および横軸に文章を構成するノードを
配置している。例えば、横軸の「わたくし」というノー
ドN-1と、縦軸の「は」というノードNN-2とが結ぶマト
リクス位置にはアークを示す“1”が記憶されている。
さらに、繰り返しを意味する自己遷移を示す位置、例え
ば、ノードN-2とNN-2から定まる位置に“1”が記憶さ
れている。あるノードとそのノードと接続しない他のノ
ードとの関係は対応するマトリクス位置に、記号∞で示
されている。∞記号は予め定められた“1”に比べて非
常に大きい数値、例えば“010"が用いられる。さらに、
上述の値“1”,“∞”がノードからノードへの遷移の
有無を示す変数c(jτ1,jτ2)の値として取り扱われ
る。
配置している。例えば、横軸の「わたくし」というノー
ドN-1と、縦軸の「は」というノードNN-2とが結ぶマト
リクス位置にはアークを示す“1”が記憶されている。
さらに、繰り返しを意味する自己遷移を示す位置、例え
ば、ノードN-2とNN-2から定まる位置に“1”が記憶さ
れている。あるノードとそのノードと接続しない他のノ
ードとの関係は対応するマトリクス位置に、記号∞で示
されている。∞記号は予め定められた“1”に比べて非
常に大きい数値、例えば“010"が用いられる。さらに、
上述の値“1”,“∞”がノードからノードへの遷移の
有無を示す変数c(jτ1,jτ2)の値として取り扱われ
る。
次に、本実施例の動作を第1図,第2図,第4図を参照
して説明する。なお、入力される音声として「わたくし
は−とうきょうえきへいきます」を例に取り説明する。
なお、音声の入力に先立って、ベクトル連続DPの値お
よび付属パラメータには初期値が設定される(ステップ
S10)。
して説明する。なお、入力される音声として「わたくし
は−とうきょうえきへいきます」を例に取り説明する。
なお、音声の入力に先立って、ベクトル連続DPの値お
よび付属パラメータには初期値が設定される(ステップ
S10)。
時刻tにおいて「わたくしは」の音声がマイクロフォン
10から入力されると、マイクロフォン10から入力された
音声がA/D変換器20によりサンプリングされて、デジタ
ル信号として、CPU30に送られる。CPU30は従来公知のノ
ード認識に関する制御手順を行い、入力され音声に対応
するノードをRAM50へ記憶する。
10から入力されると、マイクロフォン10から入力された
音声がA/D変換器20によりサンプリングされて、デジタ
ル信号として、CPU30に送られる。CPU30は従来公知のノ
ード認識に関する制御手順を行い、入力され音声に対応
するノードをRAM50へ記憶する。
このため、時刻tにおいて入力された音声は「わたくし
は」のノードが記号として表わされてRAM50のワーク領
域に記憶される(ステップS20)。
は」のノードが記号として表わされてRAM50のワーク領
域に記憶される(ステップS20)。
次に、CPU30は、標準パターンと全てのノード入力フレ
ームとの距離計算を行う。本例においては、標準パター
ンのτ=1,j1=1のノードすなわちz(1,1)=「わたく
しは」と、入力フレームf(t)=「わたくしは」との局所
距離は上述の(3)式によりd(t,1,1)=1と求める。な
お、距離関数ρは入力パターンと標準パターンが一致し
ているとき“1”、一致しないときは“∞”とする。す
ると、d(t,2,1)〜d(t,6,1)の値は“∞”となる。次に、
ベクトル連続DPの累積距離および付属パラメータの更
新をCPU30を行う(ステップS40)。本例において、標準
パターンのノードとして、w(t,1,1,1)=「わたくし」が
記憶される。次に、この累積距離の中の最小距離をCPU3
0が決定する(ステップS50)。本例において、(5)式に
より定義される累積距離は、 p(t,1,1)=3d(t,1,1)=3 p(t,2,1)=1+3・d(t,2,1)=∞ p(t,6,1)=∞ のように求める。したがって、最小累積距離としてp(t,
1,1)=3が決定される。
ームとの距離計算を行う。本例においては、標準パター
ンのτ=1,j1=1のノードすなわちz(1,1)=「わたく
しは」と、入力フレームf(t)=「わたくしは」との局所
距離は上述の(3)式によりd(t,1,1)=1と求める。な
お、距離関数ρは入力パターンと標準パターンが一致し
ているとき“1”、一致しないときは“∞”とする。す
ると、d(t,2,1)〜d(t,6,1)の値は“∞”となる。次に、
ベクトル連続DPの累積距離および付属パラメータの更
新をCPU30を行う(ステップS40)。本例において、標準
パターンのノードとして、w(t,1,1,1)=「わたくし」が
記憶される。次に、この累積距離の中の最小距離をCPU3
0が決定する(ステップS50)。本例において、(5)式に
より定義される累積距離は、 p(t,1,1)=3d(t,1,1)=3 p(t,2,1)=1+3・d(t,2,1)=∞ p(t,6,1)=∞ のように求める。したがって、最小累積距離としてp(t,
1,1)=3が決定される。
次に、CPU30はしきい値と出力値の比較を行う(ステッ
プS60)。ベクトル連続DPの時刻tにおける出力値A
(t)は(9)式により が得られる。
プS60)。ベクトル連続DPの時刻tにおける出力値A
(t)は(9)式により が得られる。
CPU30は出力値A(t)と予め定められたしきい値例えば“1
0”とを比較して、しきい値<A(t)なので時刻tにおい
て、標準パターン「わたくしは…いきます」と入力パタ
ーンとは一致していないと判断し、別の標準パターンと
の比較を行う。上述の手順により、全ての標準パターン
と入力フレームとの整合が行なわれ、これまでに入力さ
れた文字情報と一致する標準パターンがないときは、空
印刷を行い、時刻t+1を待って次のフレームの入力を
待つ(ステップS80→S90→S20)。
0”とを比較して、しきい値<A(t)なので時刻tにおい
て、標準パターン「わたくしは…いきます」と入力パタ
ーンとは一致していないと判断し、別の標準パターンと
の比較を行う。上述の手順により、全ての標準パターン
と入力フレームとの整合が行なわれ、これまでに入力さ
れた文字情報と一致する標準パターンがないときは、空
印刷を行い、時刻t+1を待って次のフレームの入力を
待つ(ステップS80→S90→S20)。
次に時刻t+1に「は」が入力されると、上述したよう
にCPU30により入力音声「は」が記号化されて、上述の
距離計算が行われる(ステップS20〜S30)。ステップS4
0〜S50の処理において、(8)式の漸化式によりp(t+1,T,
1)=6が得られるが、p(t+1,T,1)=∞となる。したがっ
てA(t+1)=∞となり、やはり標準パターンと入力パター
ンは一致しないと判断される。なお、τ=2のとき、局
所的最適パスを持つので、(11)式によりw(t+1,2,1)=
「わたくし」、w(t+1,2,1)=「は」が記憶される。
にCPU30により入力音声「は」が記号化されて、上述の
距離計算が行われる(ステップS20〜S30)。ステップS4
0〜S50の処理において、(8)式の漸化式によりp(t+1,T,
1)=6が得られるが、p(t+1,T,1)=∞となる。したがっ
てA(t+1)=∞となり、やはり標準パターンと入力パター
ンは一致しないと判断される。なお、τ=2のとき、局
所的最適パスを持つので、(11)式によりw(t+1,2,1)=
「わたくし」、w(t+1,2,1)=「は」が記憶される。
このように、順次、第4図の制御手順が繰り返されて、
時刻t+6になり「ます」が入力されると、(8)式のケ
ース(f)が最適パスとして適用され、 すると、ステップS60のしきい値判定処理において、A(t
+6)<しきい値(=10)なのでのとき、ベクトル連続D
Pに関連して遷移ネットワーク上で選択されたノードの
例((12)式参照)がプリンタ60により印刷される。すな
わち、CPU30は、認識した文章パターンとして「わたく
しはとうきょうえきへいきます」の印刷を行う(のステ
ップS70)。
時刻t+6になり「ます」が入力されると、(8)式のケ
ース(f)が最適パスとして適用され、 すると、ステップS60のしきい値判定処理において、A(t
+6)<しきい値(=10)なのでのとき、ベクトル連続D
Pに関連して遷移ネットワーク上で選択されたノードの
例((12)式参照)がプリンタ60により印刷される。すな
わち、CPU30は、認識した文章パターンとして「わたく
しはとうきょうえきへいきます」の印刷を行う(のステ
ップS70)。
この際、重要な点は、本発明では文頭の「私」,文末の
「ます」の単語が、それぞれ文頭/文末であるというこ
とを予めシステムには一切与えていないということであ
る。すなわち、この文章の前後に他の文章が連続してい
るときにおいても、この文章がスポット的に認識される
ことになっている。
「ます」の単語が、それぞれ文頭/文末であるというこ
とを予めシステムには一切与えていないということであ
る。すなわち、この文章の前後に他の文章が連続してい
るときにおいても、この文章がスポット的に認識される
ことになっている。
以上説明したように、本発明は、標準パターンとして用
いる文章情報をネットワーク構成として、ベクトル連続
DPの手法を用いて入力パターンと一致しているノード
をネットワークの経路に沿って選択していく。
いる文章情報をネットワーク構成として、ベクトル連続
DPの手法を用いて入力パターンと一致しているノード
をネットワークの経路に沿って選択していく。
したがって、1つ標準パターンに語尾変化,助詞の変
化,単語変化をも含めることが可能となる。従来では1
標準パターンにはネットワークにおいて分岐を許さない
1つの文章を用いなければならない。本発明のように文
章の語尾変化をも認識しようとする場合には、本例に用
いた文章パターンを例にとると、従来においては、「私
は東京駅へ行きます」,「私が東京駅へ行きます」…と
文章パターンを2×3×2=12種類作成することにな
る。
化,単語変化をも含めることが可能となる。従来では1
標準パターンにはネットワークにおいて分岐を許さない
1つの文章を用いなければならない。本発明のように文
章の語尾変化をも認識しようとする場合には、本例に用
いた文章パターンを例にとると、従来においては、「私
は東京駅へ行きます」,「私が東京駅へ行きます」…と
文章パターンを2×3×2=12種類作成することにな
る。
これに対して、本発明は「私(は,が)東京駅(に,
へ,も)行く」という一つの標準パターンで上記12種類
の文章パターンを表現できる。したがって、標準パター
ンを記憶しておくメモリの容量を大幅に節約できること
は明らかである。
へ,も)行く」という一つの標準パターンで上記12種類
の文章パターンを表現できる。したがって、標準パター
ンを記憶しておくメモリの容量を大幅に節約できること
は明らかである。
次に本実施例では連続DPの距離計算を単語(ノード)
単位に行っているが、単語のみならず文章の認識確率を
高めたいときは音節単位で行えばよい。
単位に行っているが、単語のみならず文章の認識確率を
高めたいときは音節単位で行えばよい。
さらに、この距離計算において、入力パターンと標準パ
ターンが一致しているとき“1”,一致していないとき
“∞”としているが、標準パターンに近い入力パターン
には、例えば“2”,“3”というように重み付けを言
うことにより、許容範囲内での標準パターンに似た入力
パターンをも認識することができる。
ターンが一致しているとき“1”,一致していないとき
“∞”としているが、標準パターンに近い入力パターン
には、例えば“2”,“3”というように重み付けを言
うことにより、許容範囲内での標準パターンに似た入力
パターンをも認識することができる。
さらに、本実施例は入力する文章情報を音声パターンに
より入力する例について説明したが、キーボードや通信
ケーブルから記号化されて送られてくる文章情報につい
てスポット的にも文章認識が可能である。その他、通信
ケーブルにより転送されてきた文章情報の一部が特に雑
音などの影響により変化しても本発明は正しい文章認識
を行うことができる。さらには、キーボードからの文章
入力に際し、誤入力、例えば1文字に対する2度打ちの
誤入力があっても正しい文章認識を行うことができる。
より入力する例について説明したが、キーボードや通信
ケーブルから記号化されて送られてくる文章情報につい
てスポット的にも文章認識が可能である。その他、通信
ケーブルにより転送されてきた文章情報の一部が特に雑
音などの影響により変化しても本発明は正しい文章認識
を行うことができる。さらには、キーボードからの文章
入力に際し、誤入力、例えば1文字に対する2度打ちの
誤入力があっても正しい文章認識を行うことができる。
なお、参考までに本発明と従来の方式との相違点を簡単
に紹介しておく。文献(1)は、本発明に関連した文献(1)
〜(4)の中では最も早い時期のものであるが、ここで
は、単語系列を標準パターンとして、入力を単語テラィ
ス系列をするとき、入力の単語ラティス系列中に、標準
パターンをなす単語系列をスポットする方式であり、以
下で述べるように、本発明と最も関連するが、本発明で
は標準パターン側を単語のネットワークにより、入力を
単語系列としてスポットする点が異なる。
に紹介しておく。文献(1)は、本発明に関連した文献(1)
〜(4)の中では最も早い時期のものであるが、ここで
は、単語系列を標準パターンとして、入力を単語テラィ
ス系列をするとき、入力の単語ラティス系列中に、標準
パターンをなす単語系列をスポットする方式であり、以
下で述べるように、本発明と最も関連するが、本発明で
は標準パターン側を単語のネットワークにより、入力を
単語系列としてスポットする点が異なる。
文献(2)は、標準パターン側をネットワークにしている
が、入力の系列について、スポット的に整合するという
方式ではない点が本方式と異なっている。文献(3),(4)
は文献(2)の拡張であるが、それらは依然として、入力
系列をスポット的に整合する方式ではない。
が、入力の系列について、スポット的に整合するという
方式ではない点が本方式と異なっている。文献(3),(4)
は文献(2)の拡張であるが、それらは依然として、入力
系列をスポット的に整合する方式ではない。
文献(5)にはその他のネットワークのマッチングについ
て述べられているが、これに記述されている内容から
も、本発明の特徴である入力系列をスポット的に整合す
る方式が既知とするものではないことを示している。
て述べられているが、これに記述されている内容から
も、本発明の特徴である入力系列をスポット的に整合す
る方式が既知とするものではないことを示している。
文献(6),(7),(8),(9)はいずれも連続DPを用いる点
は本発明と共通するが、標準パターン側を遷移ネットワ
ークとするものではなく、連続DPの適用における制御
構造が、特に文献(8),(9)は本発明と異なる。
は本発明と共通するが、標準パターン側を遷移ネットワ
ークとするものではなく、連続DPの適用における制御
構造が、特に文献(8),(9)は本発明と異なる。
「発明の効果」 以上、説明したように、本発明によれば、1つの標準パ
ターンを共通単語を有する複数の文章パターンにより構
成するので従来に比べて標準パターン数を同一とすれ
ば、より少ないメモリ容量となすことができ、同一メモ
リ容量内には多数の標準パターンを格納することができ
る。さらには、1つの標準パターンの中から入力パター
ンに該当する文章パターンを入力パターンについて文章
の始めの相当する単語と終りに相当する単語を予め指定
する必要がないというスポット的に各時刻時刻で実時間
の文章認識ができる。この結果、複数の標準パターンと
入力パターンの比較に際し、入力パターンを標準パター
ンより短くでき、従来行っていた共通単語部分の重複比
較処理が不要になると共に、入力パターンの始端/終端
位置の指示も不要となるので、文章認識処理時間が大幅
に短縮される。加えて、本発明を英文章の認識に適用し
た場合単語の語尾変化を加味した標準パターンを作成す
ることができるという新たな効果を奏する。
ターンを共通単語を有する複数の文章パターンにより構
成するので従来に比べて標準パターン数を同一とすれ
ば、より少ないメモリ容量となすことができ、同一メモ
リ容量内には多数の標準パターンを格納することができ
る。さらには、1つの標準パターンの中から入力パター
ンに該当する文章パターンを入力パターンについて文章
の始めの相当する単語と終りに相当する単語を予め指定
する必要がないというスポット的に各時刻時刻で実時間
の文章認識ができる。この結果、複数の標準パターンと
入力パターンの比較に際し、入力パターンを標準パター
ンより短くでき、従来行っていた共通単語部分の重複比
較処理が不要になると共に、入力パターンの始端/終端
位置の指示も不要となるので、文章認識処理時間が大幅
に短縮される。加えて、本発明を英文章の認識に適用し
た場合単語の語尾変化を加味した標準パターンを作成す
ることができるという新たな効果を奏する。
第1図は本発明実施例のベクトル連続DPの動作を示す
説明図、 第2図は本発明実施例の構成の一例を示すブロック図、 第3図は本発明実施例のネットワークテーブルの構成の
一例を示す説明図、 第4図は本発明実施例の制御手順の一例を示すフローチ
ャート、 第5図(A),(B)は本発明実施例の遷移ネットワークの一
例を示す説明図、 第6図は本発明実施例のベクトル連続DPの非対象な重
みを持った傾斜制限を示す説明図、 第7図は本発明実施例のベクトル連続DPのアルゴリズ
ムを示す説明図、 第8図(A)〜(D)は本発明実施例のノード間遷移における
4つの型を、それらに対応する(t,τ)平面上近傍点
間のチャネル結線を示す説明図、 第9図(A)〜(F)は本発明実施例のベクトル連続DPで許
される傾斜制限の例を示す説明図、 第10図は本発明実施例における個数が最大6ノード分
異なる系列を生む分岐の遷移ネットワーク表現(A)とこ
の遷移ネットワークを入力系列と整合するときのベクト
ル連続DP表現とを示す説明図である。 10…マイクロフォン、 20…A/D変換器、 30…CPU、 40…RAM、 51…ネットワークテーブル、 60…プリンタ。
説明図、 第2図は本発明実施例の構成の一例を示すブロック図、 第3図は本発明実施例のネットワークテーブルの構成の
一例を示す説明図、 第4図は本発明実施例の制御手順の一例を示すフローチ
ャート、 第5図(A),(B)は本発明実施例の遷移ネットワークの一
例を示す説明図、 第6図は本発明実施例のベクトル連続DPの非対象な重
みを持った傾斜制限を示す説明図、 第7図は本発明実施例のベクトル連続DPのアルゴリズ
ムを示す説明図、 第8図(A)〜(D)は本発明実施例のノード間遷移における
4つの型を、それらに対応する(t,τ)平面上近傍点
間のチャネル結線を示す説明図、 第9図(A)〜(F)は本発明実施例のベクトル連続DPで許
される傾斜制限の例を示す説明図、 第10図は本発明実施例における個数が最大6ノード分
異なる系列を生む分岐の遷移ネットワーク表現(A)とこ
の遷移ネットワークを入力系列と整合するときのベクト
ル連続DP表現とを示す説明図である。 10…マイクロフォン、 20…A/D変換器、 30…CPU、 40…RAM、 51…ネットワークテーブル、 60…プリンタ。
Claims (2)
- 【請求項1】文章内容を示す標準パターンを文章構成単
位を表わす複数の第1特徴要素の列で構成し、 文章内容の異なる複数の前記標準パターンを記憶してお
き、 文章構成単位を表わす複数の第2特徴要素の列で構成さ
れる文章を認識する際に、該文章を構成する前記第2特
徴要素を順次に入力し、 当該入力された単一の第2特徴要素と、前記標準パター
ンとの間の局所距離を算出し、 前記第2特徴要素が入力された時点を前記標準パターン
の終端の時点と強制的にみなした入力パターンを前記第
2特徴要素が入力される毎に想定し、該入力パターンと
前記標準パターンとの間の整合の結果を、前記局所距離
の更新的な累積により取得し、 当該取得した整合の結果が予め定めた距離以下となった
時点を検出し、 該時点において、前記第2特徴要素の入力時点毎に整合
の対象となった前記標準パターンを文章の認識結果とし
てスポット的に定めることを特徴とする文章認識方法。 - 【請求項2】前記標準パターンを、一部に前記第1特徴
要素を共有した複数の文章パターンにより構成し、当該
文章パターンを構成する前記第1特徴要素の接続順序
を、1つの文をなすネットワーク上の任意のパスのもつ
ノード数を同じとするネットワークの形態で記憶してお
き、前記認識結果の特定のために、該接続順序の示す文
章パターンと、前記入力パターンとの距離を算出するこ
とを特徴とする特許請求の範囲第1項に記載の文章認識
方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62180305A JPH067355B2 (ja) | 1987-07-20 | 1987-07-20 | 文章認識方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP62180305A JPH067355B2 (ja) | 1987-07-20 | 1987-07-20 | 文章認識方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6423297A JPS6423297A (en) | 1989-01-25 |
| JPH067355B2 true JPH067355B2 (ja) | 1994-01-26 |
Family
ID=16080885
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62180305A Expired - Lifetime JPH067355B2 (ja) | 1987-07-20 | 1987-07-20 | 文章認識方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH067355B2 (ja) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2867695B2 (ja) * | 1990-11-28 | 1999-03-08 | 日本電気株式会社 | 連続音声認識装置 |
| JP3741156B2 (ja) * | 1995-04-07 | 2006-02-01 | ソニー株式会社 | 音声認識装置および音声認識方法並びに音声翻訳装置 |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5945500A (ja) * | 1982-09-08 | 1984-03-14 | 日本電気株式会社 | パタンマツチング装置 |
-
1987
- 1987-07-20 JP JP62180305A patent/JPH067355B2/ja not_active Expired - Lifetime
Non-Patent Citations (2)
| Title |
|---|
| 日本音響学会講演論文集昭和58年3月3−2−8P147−148 |
| 日本音響学会講演論文集昭和61年10月2−3−2P55−56 |
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6423297A (en) | 1989-01-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US6668243B1 (en) | Network and language models for use in a speech recognition system | |
| US5033087A (en) | Method and apparatus for the automatic determination of phonological rules as for a continuous speech recognition system | |
| US8751230B2 (en) | Method and device for generating vocabulary entry from acoustic data | |
| US7881935B2 (en) | Speech recognition device and speech recognition method and recording medium utilizing preliminary word selection | |
| JPH0554959B2 (ja) | ||
| EP0763815A2 (en) | Method of preparing speech model and speech recognition apparatus using this method | |
| JP4570509B2 (ja) | 読み生成装置、読み生成方法及びコンピュータプログラム | |
| JP2841404B2 (ja) | 連続音声認識装置 | |
| JP3948260B2 (ja) | テキスト入力方法及びその装置 | |
| JPH067355B2 (ja) | 文章認識方法 | |
| JP3914709B2 (ja) | 音声認識方法およびシステム | |
| KR100736496B1 (ko) | 연속 음성인식기의 성능 개선 방법 | |
| JP4430964B2 (ja) | 記号列変換方法及びその記号列変換方法を用いた音声認識方法、並びに記号列変換装置及びその記号列変換装置を用いた音声認識装置 | |
| JP3369121B2 (ja) | 音声認識方法および音声認識装置 | |
| US7818172B2 (en) | Voice recognition method and system based on the contexual modeling of voice units | |
| JP3583299B2 (ja) | 連続音声認識用の探索装置および連続音声認識用の探索方法 | |
| JP3353334B2 (ja) | 音声認識装置 | |
| JPH10232693A (ja) | 音声認識装置 | |
| JPH08202384A (ja) | 音声認識方法及び装置 | |
| JP6918030B2 (ja) | 学習装置、学習方法、プログラムおよび情報処理システム | |
| JPH01302295A (ja) | 単語位置検出方法及びその音素標準パターン作成方法 | |
| JPH0962290A (ja) | 音声認識装置 | |
| JPH0464077B2 (ja) | ||
| JPH1078793A (ja) | 音声認識装置 | |
| JPS60179799A (ja) | 音声認識装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| EXPY | Cancellation because of completion of term |