JPH0588479B2 - - Google Patents

Info

Publication number
JPH0588479B2
JPH0588479B2 JP60030935A JP3093585A JPH0588479B2 JP H0588479 B2 JPH0588479 B2 JP H0588479B2 JP 60030935 A JP60030935 A JP 60030935A JP 3093585 A JP3093585 A JP 3093585A JP H0588479 B2 JPH0588479 B2 JP H0588479B2
Authority
JP
Japan
Prior art keywords
symbol
storage
storage section
comparison
section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP60030935A
Other languages
English (en)
Other versions
JPS61189599A (ja
Inventor
Kiichi Hasegawa
Kyo Hara
Yutaka Kamikawa
Tomoaki Irimichi
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP60030935A priority Critical patent/JPS61189599A/ja
Publication of JPS61189599A publication Critical patent/JPS61189599A/ja
Publication of JPH0588479B2 publication Critical patent/JPH0588479B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 産業上の利用分野 本発明は、音声処理分野や言語処理分野におい
て、特に発音と文字の関連や文字と文字との関連
性に重点を置く必要のある場合に利用される、音
素ビツト記憶セルを適用する記号比較装置に関す
る。
従来の技術 近年、記号比較装置は、日本語ワードプロセツ
サのかな漢字変換の前処理部や音声入力ワードプ
ロセツサの認識結果補正部で用いられている。前
者においてはキー入力に適合する単語や文節など
が存在するかどうかを予め記憶した言語情報(以
下単に辞書と称する)を検索する為に用いられ
る。後者においては音節単位で認識する場合、た
とえば「東京」を「とろきよう」とする誤認識が
生ずるので、これを補正する為に同様の辞書を検
索する為に用いられる。これらの検索時には、日
本語を対象とする場合は音節毎にそれを表記する
記号体系上で記号の一致不一致を入力信号(前者
の場合はキー入力信号,後者の場合は補正前の誤
認識含みの中間記号)と辞書中の全ての記号との
間で比較することになる。特に後者の場合、前記
中間記号を複数用意することが多い。従つて、単
に2つの記号を比較すると言えども、辞書中の記
号が数万語にも及ぶと、高速でかつ記憶容量の少
ない記号比較装置が必要となる。また、その記号
比較装置の性能は、記号記憶セル自体の構成にも
依存する。
以下図面を参照しながら、上述した従来の記号
比較装置と記号記憶セルの一例について説明す
る。
第4図は従来の記号記憶セル群の構成要素の最
小単位である音節記憶セルを示すものである。第
4図中の41が音節記憶セルであり、これはJIS
コードなどのコード体系の平仮名もしくは片仮名
に準拠した8ビツト符号で1記号を表現する機能
を有する。また、第6図は従来の記号比較装置の
ブロツク図である。このブロツク図自体は本発明
も同一であるが、各部の構成要素や動作は異な
る。第6図中、61は1音節記憶部で、検索すべ
き入力記号列(以下、第1記号列と称する)を第
4図41の音節記憶セル上に記憶する。62は音
節比較部で第1音節記憶部61の出力である第1
記号列と第2音節記憶部63の出力である第2記
号列を比較する機能を有する。63は第2音節記
憶部、64は音節比較部62の比較の結果適合性
を満たすものを記憶する機能を有する比較結果記
憶部である。同様に63は前記辞書を記憶してい
る。
以上のように構成された記号比較装置につい
て、以下その動作について説明する。
音声入力装置上での動作例を第5図により説明
する。
第5図中、51は上記61の第1音節記憶部に記
憶された4音節からなる第1記号列を示すもの
で、各音節は第4図の音節記憶セルで構成され
る。61は「東京」という音声入力に対する「と
うきよお」という中間記号を記憶している様を模
式表現したものである。52〜55は第6図中6
3の第2音節記憶部に記憶部に記憶された4種類
の第2記号列であり、「東京」という単語を発音
する時に許容すべき記号列である。52〜55は
第2音節記憶部に記憶された記号列の一部にすぎ
ない。いま第2音節記憶部にN個の記号列が存在
するとすれば、第6図62の音節比較部は基本的
にこのN個の第2記号列と第1記号列を比較する
ことが必要となる。しかし、62は前処理として
音節数のチエツクを施す機能を有すれば必ずしも
N個の第2記号列と第1記号列を比較する必要性
はないので、第1記号列と音節数の等しい第2記
号列M個(MN)について記号比較する方法に
ついて述べることにする。第5図の51〜55の
各記号列の音節記憶セルを左から順に第1音節記
憶セル56,第2音節記憶セル57,第3音節記
憶セル58,第4音節記憶セル59と命名し説明
する。記号比較は第1記号列の第i音節記憶セル
と第2記号列の第i音節記憶セルが等しいか否か
の判定をi=1〜4について行い、全て等しい場
合その第1記号列を記憶部64へ出力する。第5
図の例の場合、第1記号列51は第2記号列53
と完全に一致するので、51が記憶部64へ出力
されることになる。第1記号列と第2記号列の対
応する各音節記憶セルが一致する場合を以下2つ
の記号列はマツチングすると称する。これまで第
1記号列は1個として論じたが、音声認識装置の
認識率を高める観点からn個の第1記号列を第1
音節記憶部は記憶する場合が考えられる。n1よ
り大きい整数である。この際にはn個の第1記号
列とM個の第2記号列の比較を行い、マツチング
するl個(ln)の第1記号列を記憶部64へ
出力することになる。
発明が解決しようとする問題点 しかしながら上記のような構成と動作では、2
つの問題点が生ずる。
まず第1点の問題は、第2音節記憶部では、第
5図の52〜54に記載するように、本来同一の
単語あるいは文節を異なる記号列として記憶して
おかなければならないという点である。日本語に
おいては、特に長音を含む単語や文節で上述の問
題点を生じることが多く、また長音を含む単語や
文節はその頻度が多いので第2音節記憶部の記憶
容量を増大たらしめる。同時に音節比較部の比較
回数が比例して増加することになる。
次に、第2点の問題は、第1音節記憶部に複数
個の単語や文節を記憶させる時、異なる複数個の
第1記号列を第1音節記憶部に記憶しなければな
らないという点である。各音節においてs個の候
補を考慮してt個の音節を考慮する場合、その記
憶容量はs×tバイト必要で、これで対象となる
第1記号列はst個になり、記号比較回数も増加し
てしまうことになる。
本発明は上記問題点に鑑み、第1記号記憶部の
記憶容量と第2記号記憶部の記憶容量を削減する
ことと、記号比較の処理回数を低減することとを
目的とした、音素ビツト記憶セルを適用した記号
比較装置を提供するものである。
問題点を解決するための手段 上記問題点を解決する為に本発明の記号比較装
置の第1記号記憶部と第2記号記憶部とは、まず
音素ビツト記憶セル群で構成される。ここに音素
ビツト記憶セル群とは、複数種の記憶セルを各々
複数個もつものであり、第i種記憶セルは任意の
ai種の音素または音素に準ずる単位をai個のビツ
トへ割りあてて、音素または音素に準ずる単位の
存在・非存在を該当するビツトのオン・オフで表
現する機能を有するものである。幾種の記憶セル
を使用すべきかは、対象とする言語に依存すると
考えられるが、特に日本語を対象とする場合に
は、子音表記を主とする第1種記憶セルと母音表
記を主とする第2種記憶セルとの2種類を設定す
ると好都合である。また、英語などの場合には、
子音と母音という音素の区別をせずに1種類の記
憶セルを設定する方が好都合である。上記第1の
音素ビツト記憶セル群で構成される第1記号記憶
部と、上記第2の音素ビツト記憶セル群で構成さ
れる第2記号記憶部と、上記第1記号記憶部の出
力である第1記号列と上記第2記号記憶部の出力
である第2記号列とを比較する記号比較部と、上
記記号比較部の比較結果を記憶する結果記憶部と
いう構成を備えたものである。
作 用 本発明は上記した構成において、第i種記憶セ
ルはai種の複数ビツトをオンにすることで音素お
よび音素に準する単位を同時に複数個記憶できる
機能を有しているので、特許請求の範囲記載の音
素ビツト記憶セル群は複数の記号列の一括記憶を
可能とする為、記憶容量または記憶記号列種を削
減できることとなる。
また、上記作用をもつ第1の音素ビツト記憶セ
ル群で構成された第1記号記憶部の出力である第
1記号列と上記第2の音素ビツト記憶セル群で構
成された第2記号記憶部の出力である第2記号列
の比較の際に、対応する第i種記憶セル相互の論
理積を求める処理を行つた結果の零・非零の判定
を行うことで、同一記憶セル中の複数個の音素ま
たは音素に準ずる単位に対して同時にマツチング
判定が可能となるので、比較演算処理量を低減で
きることとなる。
実施例 以下本発明の一実施例の音素ビツト記憶セル群
を用いた記号比較装置について、図面を参照しな
がら説明する。
第1図は本発明の第1の実施例における記号列
比較装置のブロツク図を示すものである。図にお
いて、11は第1記号記憶部、12は記号比較
部、13は第2記号記憶部、14は結果記憶部で
ある。また第2図中、21は第1種記憶セル、2
2は第2種記憶セルのビツト配置の一例を示すも
ので、これらを複数個組み合わせて音素ビツト記
憶セル群により、第1記号記憶部11と第2記号
記憶部13は構成される。
以上のように構成された音素ビツト記憶装置と
記号比較装置について、第1図・第2図・第3図
を用いて以下その動作について説明する。
まず第2図について説明する。
いま第1種記憶セルの音素または音素に準ずる
単位として日本語の子音を想起して第2図の第1
種記憶セル21に記載する26個のビツト設定を行
う。この図の各ビツトに対する名称を以下で用い
る。同様に第2種記憶セルの音素または音素に準
ずる単位として日本語の母音を想起して第2図の
第2種記憶セル22に記載する7個のビツト設定
を行う。この図の各ビツトに対する名称を以下で
用いる。
次に第3図について説明する。第3図Aの31
第1図の第1記号記憶部11に記憶される第1種
記憶セルの一例を示すもので、各ビツトの「0」
はそのビツトの音素がないことを、各ビツトの
「1」はそのビツトの音素があることを示すもの
である。以下ビツトの「0」と「1」上述の意味
で用いる。従つて31は|k|・|ky|・|t
|・|ty|・|d|・|p|・|py|の7個の
子音が存在することを意味するものである。32
は第1図13の第2記号記憶部に記憶される第1
種記憶セルの1例を示すものである。
また、第3図Bの33は、第1図11の第1記号
記憶部に記憶される第2種記憶セルの1例を示す
ものである。34は第1図13の第2記号記憶部
に記憶される第2種記憶セルの1例を示すもので
ある。以上から第1種記憶セル31と第2種記憶
セル33との組み合わせにより同時に7音節を計
33ビツトで記憶できたことになり、本発明の音素
ビツト記憶装置は従来法では7×8ビツト=56ビ
ツト必要だつたものの記憶容量を減らす効果を生
ずる。
第1図12の記号比較部は、第1種記憶セル3
1と第2種記憶セル33とを第1図記憶部11の
出力である第1記号列として、また第1種記憶セ
ル32と第2種記憶セル34とを第1図記憶部1
3の出力である第2記号列として受けとると、3
1と32,33と34の2組について論理積を求
め、その結果の零・非零を判定してマツチングす
るかしないかを判定する。この場合、tビツトと
oビツトが一致するのでマツチングされたことに
なり、第2記号列そのものあるいは第2記号列に
対する記号列番号を結果記憶部へ出力する。この
動作において、2回の論理積と2回の判定でマツ
チングが完了しているが、従来法ではこの場合第
1記号列が7種,第2記号列が2種あるので7×
2=14回の判定が必要なので、本発明の記号比較
装置は、比較に関する演算量を低減する効果を生
ずる。
以下本発明の第2の実施例について図面を参照
しながら説明する。
英語の音声を入力する音声認識装置における記
号比較装置の例について説明する。基本的な構成
は第1図と同じであるが、記号記憶部11と12
に用いられる音素ビツト記憶セル群は第4図に示
すように母音も子音も区別しない1種の記憶セル
を構成要素としてもつ点が異なる。日本語の場合
子音と母音が交互に出現することを想定して、第
1の実施例に示すような記号比較手順をとれば良
いのだが、英語の場合は、子音の連鎖があり、日
本語のように規則性が壊れているので、比較演算
処理回数の観点から、第7図に示す第1種記憶セ
ルのみを用いる方が好都合であるからである。
以下、上記のように構成された記号比較装置の
動作について説明する。
第1図記憶部11と出力である第1記号列と記
憶部13の出力である第2記号列とは上述の第1
種記憶セルの形式を有することになり、記号比較
部12では、第1記号列と第2記号列の2つの第
1種記憶セルの論理積を求め、その結果の零・非
零判定をすることで、マツチングの判定をする機
能を有する。
以上のように上述の第1種記憶セルを設けるこ
とで記号比較の際に母音か子音かという余分な判
定をすることなくマツチングの判定をすすめるこ
とができるという効果を生ずる。
なお、第1の実施例において、第2図第1種記
憶セル21と第2種記憶セル22は日本語の子
音・母音という分類に従つてビツト数をそれぞれ
26個,7個としているが、これらの分類において
第1種記憶セルと第2種記憶セルの音素または音
素に準ずる単位の細分化方法によるビツト数の増
減は任意であり、それらのビツト配置位置も任意
である。日本語に限定するものでもない。
また、第2の実施例において、第7図の第1種
記号記憶セルは音素分類方法の相異によつて、そ
のビツト数やビツト配置位置は任意であり、特に
英語に限定するものではない。
発明の効果 以上のように本発明は、第1の音素ビツト記憶
セル群で構成される第1記号記憶部と、第2の音
素ビツト記憶セル群で構成される第2記号記憶部
と、上記第1記号記憶部の出力である第1記号列
および上記第2記号記憶部の出力である第2記号
列とを比較する記号比較部と、上記の記号比較部
の比較結果を記憶する結果記憶部とを設けること
により、第1記号記憶部と第2記号記憶部の複数
記号列を一括記憶することで、記憶容量の削減す
る効果を得ることができ、また記号比較部での比
較演算処理回数を低減することができる。
【図面の簡単な説明】
第1図は本発明の第1の実施例における記号比
較装置のブロツク図、第2図は第1図の第1記号
記憶部と第2記号記憶部の構成要素である第1種
記憶セルと第2種記憶セルのビツト配置図、第3
図は第1図の記号比較部の動作説明図、第6図は
従来例の実施例における記号比較装置のブロツク
図、第4図は従来例の記号記憶部の構成要素であ
る音節記憶セルの構成図、第5図は従来例の記号
比較部の動作説明図、第7図は本発明の第2の実
施例における第1記憶セルのビツト配置図であ
る。 11……第1記号記憶部、13……第2記号記
憶部、12……記号比較部、14……結果記憶
部、21……第1種記憶セル、22……第2種記
憶セル。

Claims (1)

    【特許請求の範囲】
  1. 1 第1の音素ビツト記憶セル群で構成される第
    1記号記憶部と、第2の音素ビツト記憶セル群で
    構成される第2記号記憶部と、上記第1記号記憶
    部の出力である第1記号列および上記第2記号記
    憶部の出力である第2記号列とを比較する記号比
    較部と、上記の記号比較部の比較結果を記憶する
    結果記憶部とを有することを特徴とする記号比較
    装置。
JP60030935A 1985-02-19 1985-02-19 記号比較装置 Granted JPS61189599A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60030935A JPS61189599A (ja) 1985-02-19 1985-02-19 記号比較装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60030935A JPS61189599A (ja) 1985-02-19 1985-02-19 記号比較装置

Publications (2)

Publication Number Publication Date
JPS61189599A JPS61189599A (ja) 1986-08-23
JPH0588479B2 true JPH0588479B2 (ja) 1993-12-22

Family

ID=12317531

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60030935A Granted JPS61189599A (ja) 1985-02-19 1985-02-19 記号比較装置

Country Status (1)

Country Link
JP (1) JPS61189599A (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09114490A (ja) * 1995-10-16 1997-05-02 Sony Corp 音声認識装置,音声認識方法,ナビゲーション装置,ナビゲート方法及び自動車

Also Published As

Publication number Publication date
JPS61189599A (ja) 1986-08-23

Similar Documents

Publication Publication Date Title
Zue et al. The MIT SUMMIT speech recognition system: A progress report
US5787230A (en) System and method of intelligent Mandarin speech input for Chinese computers
US6738741B2 (en) Segmentation technique increasing the active vocabulary of speech recognizers
US20110106792A1 (en) System and method for word matching and indexing
JP5231698B2 (ja) 日本語の表意文字の読み方を予測する方法
EP0562138A1 (en) Method and apparatus for the automatic generation of Markov models of new words to be added to a speech recognition vocabulary
Chotimongkol et al. Statistically trained orthographic to sound models for Thai.
Schmid et al. Automatically generated word pronunciations from phoneme classifier output
JPH10269204A (ja) 中国語文書自動校正方法及びその装置
El Méliani et al. Accurate keyword spotting using strictly lexical fillers
JP2002278579A (ja) 音声データ検索装置
Tian Data-driven approaches for automatic detection of syllable boundaries.
JPH0588479B2 (ja)
Wang et al. Exploring lexicon-free modeling units for end-to-end korean and korean-english code-switching speech recognition
Hengsanankun et al. Linguistic Rules-Based Approach for Translating Nyaw Language to the Phonetic Alphabet
Norkevičius et al. Knowledge-based grapheme-to-phoneme conversion of Lithuanian words
JPS6229796B2 (ja)
Bahrani et al. A new word clustering method for building n-gram language models in continuous speech recognition systems
JPH049320B2 (ja)
JPS62134698A (ja) 多数単語の音声入力方式
JPH01114976A (ja) 文書処理装置の辞書構造
JPS61177575A (ja) 日本語文章作成装置
JPH07113925B2 (ja) 文字表記結果の対応関係判定システム
JPS61188684A (ja) 認識装置
Wang et al. A hybrid language model based on statistics and linguistic rules