JPH0337766A - 単語辞書検索装置 - Google Patents
単語辞書検索装置Info
- Publication number
- JPH0337766A JPH0337766A JP1173443A JP17344389A JPH0337766A JP H0337766 A JPH0337766 A JP H0337766A JP 1173443 A JP1173443 A JP 1173443A JP 17344389 A JP17344389 A JP 17344389A JP H0337766 A JPH0337766 A JP H0337766A
- Authority
- JP
- Japan
- Prior art keywords
- character
- word
- word dictionary
- clock
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000015654 memory Effects 0.000 claims abstract description 40
- 238000001514 detection method Methods 0.000 claims description 14
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000001360 synchronised effect Effects 0.000 abstract description 4
- 238000010586 diagram Methods 0.000 description 15
- 238000007796 conventional method Methods 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 8
- 238000000034 method Methods 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 240000000220 Panda oleosa Species 0.000 description 4
- 235000016496 Panda oleosa Nutrition 0.000 description 4
- 238000013519 translation Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012795 verification Methods 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Character Discrimination (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、入力文字列と単語辞書とを照合して、入力文
字列において、単語辞書内に存在する単語が出現した部
分を検索する単語辞書検索装置に関するものである。特
に、入力文字列の各文字が複数の候補をもつような場合
にも適用できる単語辞書検索装置に関するものである。
字列において、単語辞書内に存在する単語が出現した部
分を検索する単語辞書検索装置に関するものである。特
に、入力文字列の各文字が複数の候補をもつような場合
にも適用できる単語辞書検索装置に関するものである。
入力文字列の各文字に複数の候補がなく一意な場合の単
語辞書検索装置は、かな漢字変換装置においてキーボー
ドから入力されたかな文字列に対する単語辞書検索を行
なう部分、機械翻訳装置・文音声変換装置・文章校正装
置などにおいてワードプロセッサなどで作成された漢字
かな混じり文字列に対する単語辞1u検索を行なう部分
などに用いられている。
語辞書検索装置は、かな漢字変換装置においてキーボー
ドから入力されたかな文字列に対する単語辞書検索を行
なう部分、機械翻訳装置・文音声変換装置・文章校正装
置などにおいてワードプロセッサなどで作成された漢字
かな混じり文字列に対する単語辞1u検索を行なう部分
などに用いられている。
入力文字列の各文字に複数の候補がある場合の単語辞書
検索装置は、音声認識装置や文字認識装置などにおいて
、認識結果の複数の候補文字から最も確からしい文字を
選択するための単語辞書検索部などに用いられている。
検索装置は、音声認識装置や文字認識装置などにおいて
、認識結果の複数の候補文字から最も確からしい文字を
選択するための単語辞書検索部などに用いられている。
(従来の技術)
従来、かな漢字変換装置・文音声変換装置などにおいて
用いられている単語辞書検索方式は、基本的に、文献二
F計算機によるカナ漢字変換J(和訳・庄原、NEEK
j:日イ:j研究、第25巻第5号、23頁〜60頁、
1973年)に示されている方式を引き継いでいる。す
なわち、入力された文字列から部分文字列を切り出して
、その部分文字列に表記(かな漢字変換では「かな表記
]ずなわち「読みがな])の一致する単語を単;J)辞
■内から検索するという処理を行なう(これを、以下で
は、第1の従来技術と呼ぶことにする。) 例えば、「文章を解析するjという漢字かな混じり文字
列に対する’ili M!i辞書検索を行なう場合は、
1文字1コ・2文字目など各文字位置から始まる単語を
検索するために、「文章を解析するJ 「章を解析する
J 「を解析するj 「解析するJ 「析する] 「す
るJ 「る」といった部分文字列を別々に切り出す。そ
して、各部分文字列について、さらに、末尾を削った部
分文字列も生成して、その各々をJij、語辞書から検
索する。すなわち、1文字目から始まる単語を検索する
際には、「文章を解析する」 「文章を解析ず」 「文
章を解析」 「文章を解J r文φをJ 「又仝J
r又Jといった部分文字列に関して、検索を次々に繰り
返し、2文字目から始まる単語を検索する際には、「章
を解析する]「章を解析ず」 「章を解析] 「草を解
」 「章を」「皇]といった部分文字列に関して、検索
を次々に繰り返すわけである。その結果、下線を引いた
文章、文、章などの部分文字列について、表記の一致す
る単語が見つかることになる。
用いられている単語辞書検索方式は、基本的に、文献二
F計算機によるカナ漢字変換J(和訳・庄原、NEEK
j:日イ:j研究、第25巻第5号、23頁〜60頁、
1973年)に示されている方式を引き継いでいる。す
なわち、入力された文字列から部分文字列を切り出して
、その部分文字列に表記(かな漢字変換では「かな表記
]ずなわち「読みがな])の一致する単語を単;J)辞
■内から検索するという処理を行なう(これを、以下で
は、第1の従来技術と呼ぶことにする。) 例えば、「文章を解析するjという漢字かな混じり文字
列に対する’ili M!i辞書検索を行なう場合は、
1文字1コ・2文字目など各文字位置から始まる単語を
検索するために、「文章を解析するJ 「章を解析する
J 「を解析するj 「解析するJ 「析する] 「す
るJ 「る」といった部分文字列を別々に切り出す。そ
して、各部分文字列について、さらに、末尾を削った部
分文字列も生成して、その各々をJij、語辞書から検
索する。すなわち、1文字目から始まる単語を検索する
際には、「文章を解析する」 「文章を解析ず」 「文
章を解析」 「文章を解J r文φをJ 「又仝J
r又Jといった部分文字列に関して、検索を次々に繰り
返し、2文字目から始まる単語を検索する際には、「章
を解析する]「章を解析ず」 「章を解析] 「草を解
」 「章を」「皇]といった部分文字列に関して、検索
を次々に繰り返すわけである。その結果、下線を引いた
文章、文、章などの部分文字列について、表記の一致す
る単語が見つかることになる。
この第1の従来技術では、複数の部分文字列に対して単
語辞書の検索を繰り返すわけであるが、単語辞書の構成
を工夫してJ:H<ことによって、1つの部分文字列に
対する検索の所要時間の短縮を図っている。1例えば、
単語辞許内の単語をあらかじめソートしておいて二分検
索を行なったり、1文字目・2文字LJなど文字ごとに
分割して共通な部分をまとめて木描造として1文字ずつ
の照合を行なうなどである。このような辞書の横這と検
索方式の工夫については、文献: ”The Art
of ComputerProgramming 3:
5ort、ing and Searching”
(D、E。
語辞書の検索を繰り返すわけであるが、単語辞書の構成
を工夫してJ:H<ことによって、1つの部分文字列に
対する検索の所要時間の短縮を図っている。1例えば、
単語辞許内の単語をあらかじめソートしておいて二分検
索を行なったり、1文字目・2文字LJなど文字ごとに
分割して共通な部分をまとめて木描造として1文字ずつ
の照合を行なうなどである。このような辞書の横這と検
索方式の工夫については、文献: ”The Art
of ComputerProgramming 3:
5ort、ing and Searching”
(D、E。
Knuth、 Addison−Wesley、 19
73)に多く示されている。
73)に多く示されている。
ただし、この第1の従来技術は、コンピュータ上の逐次
型プログラムとしての実現を想定しており、所要時間短
縮の工夫は逐次処理の枠内で工夫である。したがって、
入力文字列のある部分文字列と単語辞芽内のある単51
)の表記の文字列とを比較する処理などは、1文字ずつ
逐次行なわれる。例えば「文章を」という部分文字列と
単語辞書内の「文章]という単語の比1咬は、「文」と
r文]とを照合し、一致したところで「牽]と「章]と
を照合し、次に、「を」に対して不一致となり失敗する
というように、1文字ずつ照合処理の繰り返しである。
型プログラムとしての実現を想定しており、所要時間短
縮の工夫は逐次処理の枠内で工夫である。したがって、
入力文字列のある部分文字列と単語辞芽内のある単51
)の表記の文字列とを比較する処理などは、1文字ずつ
逐次行なわれる。例えば「文章を」という部分文字列と
単語辞書内の「文章]という単語の比1咬は、「文」と
r文]とを照合し、一致したところで「牽]と「章]と
を照合し、次に、「を」に対して不一致となり失敗する
というように、1文字ずつ照合処理の繰り返しである。
また、第1の従来技td:rでは、入力文字列の各文字
にm個ずつ候補があるような場合は、あらかじめ、長さ
Lの部分文字列に月して、候補を組み合せたmL通りの
文字列を生成する必要がある。そして、それらの各々に
ついて、さらに、上記のように末尾を削った部分文字列
を生成[、゛C1単語辞書内を検索することになる。
にm個ずつ候補があるような場合は、あらかじめ、長さ
Lの部分文字列に月して、候補を組み合せたmL通りの
文字列を生成する必要がある。そして、それらの各々に
ついて、さらに、上記のように末尾を削った部分文字列
を生成[、゛C1単語辞書内を検索することになる。
−力、ある長さLの文字列と入力文字列との比較の際に
、1文字ずつの照合を繰り返すのではなく、対応する文
字位置の1組の照合を同時に行なうことが考えられてい
る。その際、入力文字列をシフトレジスタに格納してお
けば、照合の位置をずらすことが、入力文字列から再度
部分文字列を切り出すのではなく、シフトレジスタ内の
全文字を一度に1文字ずらすことで実現できるようにも
なる。この第2の従来技術は、特開昭63−26142
1号公報F文字列処理装置]および特開昭63−261
422号公報r文字列照合装置」に述べられている。な
お、この第2の従来技術では、入力文字列に複数の候補
は存在せず、検索される文字列も1通りに限られる(単
語辞書のように多数ではない)。
、1文字ずつの照合を繰り返すのではなく、対応する文
字位置の1組の照合を同時に行なうことが考えられてい
る。その際、入力文字列をシフトレジスタに格納してお
けば、照合の位置をずらすことが、入力文字列から再度
部分文字列を切り出すのではなく、シフトレジスタ内の
全文字を一度に1文字ずらすことで実現できるようにも
なる。この第2の従来技術は、特開昭63−26142
1号公報F文字列処理装置]および特開昭63−261
422号公報r文字列照合装置」に述べられている。な
お、この第2の従来技術では、入力文字列に複数の候補
は存在せず、検索される文字列も1通りに限られる(単
語辞書のように多数ではない)。
特開昭62−67636号公報「照合方式]および文献
:「音声1]本語入カシステムにおける高速な言語処理
のための辞書照合アルゴリズムJ(浜口・鈴木、電子情
報通信学会論文誌、第J70−D巻第8号、1589頁
〜1596エ′↓1987年)には、第3の従来技術が
示されている。
:「音声1]本語入カシステムにおける高速な言語処理
のための辞書照合アルゴリズムJ(浜口・鈴木、電子情
報通信学会論文誌、第J70−D巻第8号、1589頁
〜1596エ′↓1987年)には、第3の従来技術が
示されている。
第3の従来技術では、入力文字列に複数の文字候補があ
ることを想定し−Cいる。まず、文字の種類をM(例え
ば、JISの文字コード表では、ひらがなについてM=
83)とすると、1文字目・2文字目など各文字位置に
、Mビットのメモリを1個ずつ用意し、複数の候補文字
に対応する各ビットを1にしておく。
ることを想定し−Cいる。まず、文字の種類をM(例え
ば、JISの文字コード表では、ひらがなについてM=
83)とすると、1文字目・2文字目など各文字位置に
、Mビットのメモリを1個ずつ用意し、複数の候補文字
に対応する各ビットを1にしておく。
そして、照合時は、単語辞書検索の各単語について、単
語の表記の1文字目・2文字目など文字位置ごとに、列
応するMビソI・メモリから、対応する文字のビット内
容(1または0)を同時に読み山ず。ずべてのMビソト
メモリからlが読みだされたら、入力文字列中に(1i
語辞18内にある単語が出現したことになる。
語の表記の1文字目・2文字目など文字位置ごとに、列
応するMビソI・メモリから、対応する文字のビット内
容(1または0)を同時に読み山ず。ずべてのMビソト
メモリからlが読みだされたら、入力文字列中に(1i
語辞18内にある単語が出現したことになる。
(発明が解決しようとする課題)
第1の従来技術には、まず第1に、前述のように、多数
の部分文字列に対する単語辞書検索を繰り返さねばなら
ないという欠点がある。この欠点は、入力文字列の各文
字に複数の候補がある場合に、特に顕著になる。長さK
の入力文字列の各文字にm個ずつ候補がある場合、最長
の部分文字列の長さをLとするとぐ通常、単51)辞書
内の最長の単語の長さをLとする)、最大(+11 X
LXK)個の部分文字列に対する検索を繰り返す必要が
生ずる。通常、あらかじめ条件を定めて、不要な部分文
字列の検索を避けるようにするので、(mXLXK)個
というのは最悪の場合であるが、それでも検索の回数は
かなり多くなる。
の部分文字列に対する単語辞書検索を繰り返さねばなら
ないという欠点がある。この欠点は、入力文字列の各文
字に複数の候補がある場合に、特に顕著になる。長さK
の入力文字列の各文字にm個ずつ候補がある場合、最長
の部分文字列の長さをLとするとぐ通常、単51)辞書
内の最長の単語の長さをLとする)、最大(+11 X
LXK)個の部分文字列に対する検索を繰り返す必要が
生ずる。通常、あらかじめ条件を定めて、不要な部分文
字列の検索を避けるようにするので、(mXLXK)個
というのは最悪の場合であるが、それでも検索の回数は
かなり多くなる。
第1の従来技術の第2の欠点は、ある部分文字列と単語
辞書内のある単語の表記の文字列との比較を、1文字ず
つ順に行なうため、比較に時間がかかるということであ
る。
辞書内のある単語の表記の文字列との比較を、1文字ず
つ順に行なうため、比較に時間がかかるということであ
る。
第2の従来技術では、第1の従来技術の第2の欠点に対
処している。しかし、第2の従来技術は、入力文字列に
複数の候補がある場合に適用できない。
処している。しかし、第2の従来技術は、入力文字列に
複数の候補がある場合に適用できない。
また、検索される文字列も1通りに限られ、単語辞書の
ように多数の文字列と比較を行なうことを考えると、単
語辞書検索の各単記の表記の長さの異なりが問題となっ
て適用できない。
ように多数の文字列と比較を行なうことを考えると、単
語辞書検索の各単記の表記の長さの異なりが問題となっ
て適用できない。
第3の従来技術は、第1の従来技術の2つの欠点に対処
している。しかし、入力文字列を記憶するために、文字
の種類だけのビット数をもったメモリを、文字列長だけ
用意する必要があるため、文字の種類が多数の場合はメ
モリサイズがかなり大きくなっ°Cしまう問題がある。
している。しかし、入力文字列を記憶するために、文字
の種類だけのビット数をもったメモリを、文字列長だけ
用意する必要があるため、文字の種類が多数の場合はメ
モリサイズがかなり大きくなっ°Cしまう問題がある。
かな漢字変換や音声認識の場合は、入力文字列がひらが
な(あるいは音素文字)で100種類程度に限定される
ので、あまり問題にならないが、漢字かな混じり文字列
を対象とした文身声変換や磯波翻訳など場合は、漢字を
含み文字の種類が3000〜4000種類にもおよぶた
め、メモリが大きくなって問題になる。
な(あるいは音素文字)で100種類程度に限定される
ので、あまり問題にならないが、漢字かな混じり文字列
を対象とした文身声変換や磯波翻訳など場合は、漢字を
含み文字の種類が3000〜4000種類にもおよぶた
め、メモリが大きくなって問題になる。
また、第3の従来技術では、入力された文字列の先頭か
ら始まる単1治の検索しか行なわないため、2文字目か
ら始まる単語や、3文字目から始まる単語などを検索す
る場合には、入力文字列のメモリへの登録を、やり直す
必要が生じるという問題もある。
ら始まる単1治の検索しか行なわないため、2文字目か
ら始まる単語や、3文字目から始まる単語などを検索す
る場合には、入力文字列のメモリへの登録を、やり直す
必要が生じるという問題もある。
さらに、第3の従来技術では、入力文字列の先頭からあ
る長さまで一致した単記が出現したことはわかるが、そ
の長さがいくつであるかは、その単語の単語辞許内アド
レスを記憶しておき、もう−度改め°C1単語辞瞥内の
その単語の表記を調べて求める必要があった。
る長さまで一致した単記が出現したことはわかるが、そ
の長さがいくつであるかは、その単語の単語辞許内アド
レスを記憶しておき、もう−度改め°C1単語辞瞥内の
その単語の表記を調べて求める必要があった。
本発明の目的は、上記のような従来技術の欠点を除去し
、入力文字列の各文字に複数の候補があっても、高速に
単語辞書との照合が可能な単語辞書検索装置を提供する
ことである。加えて、検出された(11語の長さも容易
に算出できる機構も備えた単語辞書検索装置を提(JH
する。
、入力文字列の各文字に複数の候補があっても、高速に
単語辞書との照合が可能な単語辞書検索装置を提供する
ことである。加えて、検出された(11語の長さも容易
に算出できる機構も備えた単語辞書検索装置を提(JH
する。
(課題を解決するための手段)
本発明は各文字に対して第1から第m候補(mはm≧1
なる整数)までのm種類の候補が存在する文字列の入力
装置と、n文字分(nはn≧1なる整数)のデータ中を
もつ各アドレスに単語の表記を1個ずつ格納して11文
字に満たない部分にはあらかじめ定めた残余記号を詰め
た単語i’iH1’メモリと、前記入力装置により−C
1文字に対するm種類の候補が入力されるたびにシフト
クロック1回と前記単語辞書メモリ内の全単語数に応じ
た回数の判定クロックとカウンタクロックとを発生する
コントローラと、前記シフトクロックに同期したリセッ
トと前記カウンタクロックに同期したカウントアツプと
を行なう前記単語辞書メモリのアドレスカウンタと、前
記入力装置によって入力された文字列の第1・第2・・
・・・・・第m候補に対応し前記シフトクロックに同期
した1文字ずつの順送りを行なう各々n文字分の第1・
第2・・・・・・、第m候補シフトレジスタと、前記単
語辞書メモリから読み出されるn文字分のデータの1文
字目・2文字目・・・・・・・n文字目に対応し該当位
置の文字が前記第1・第2・・・・・・・第m候補シフ
トレジスタのいずれかの同位置の文字に一致したとき一
致信号を出力し前記残余記号に一致したとき一致信号と
残余記号とを出力する1文字目・2文字目・・・・・・
・n文字目比較回路と、前記判定クロックに同期して前
記1文字目・2文字目・、・・・・・n文字目比較回路
のすべてから一致信号が検出された場合に前記入力装置
によって入力された文字列中に前記単語辞書メモリ内に
存在する単語が出現したと判定する判定回路と、前記残
余検出信号をもとに単語長を算出する単語長算出回路と
を備えたことを特徴とする単語辞書検索装置である。
なる整数)までのm種類の候補が存在する文字列の入力
装置と、n文字分(nはn≧1なる整数)のデータ中を
もつ各アドレスに単語の表記を1個ずつ格納して11文
字に満たない部分にはあらかじめ定めた残余記号を詰め
た単語i’iH1’メモリと、前記入力装置により−C
1文字に対するm種類の候補が入力されるたびにシフト
クロック1回と前記単語辞書メモリ内の全単語数に応じ
た回数の判定クロックとカウンタクロックとを発生する
コントローラと、前記シフトクロックに同期したリセッ
トと前記カウンタクロックに同期したカウントアツプと
を行なう前記単語辞書メモリのアドレスカウンタと、前
記入力装置によって入力された文字列の第1・第2・・
・・・・・第m候補に対応し前記シフトクロックに同期
した1文字ずつの順送りを行なう各々n文字分の第1・
第2・・・・・・、第m候補シフトレジスタと、前記単
語辞書メモリから読み出されるn文字分のデータの1文
字目・2文字目・・・・・・・n文字目に対応し該当位
置の文字が前記第1・第2・・・・・・・第m候補シフ
トレジスタのいずれかの同位置の文字に一致したとき一
致信号を出力し前記残余記号に一致したとき一致信号と
残余記号とを出力する1文字目・2文字目・・・・・・
・n文字目比較回路と、前記判定クロックに同期して前
記1文字目・2文字目・、・・・・・n文字目比較回路
のすべてから一致信号が検出された場合に前記入力装置
によって入力された文字列中に前記単語辞書メモリ内に
存在する単語が出現したと判定する判定回路と、前記残
余検出信号をもとに単語長を算出する単語長算出回路と
を備えたことを特徴とする単語辞書検索装置である。
(実施例)
図面を用いて、本発明の構成・作用を説明する。
第1図は本発明の単語辞書検索装置の第1の実施例の構
成を示すブロック図である。以下、まず、各構成要素を
説明する。
成を示すブロック図である。以下、まず、各構成要素を
説明する。
入力装置5は、各文字に対して第1候補から第m候補(
mはm≧1なる整数)までのm種類の候補が存在する文
字列を入力する装置であり、例えば、音声認識装置や文
字認識装置などである。入力装置5は、各文字に対する
m個の候補を、同時に出力し、その出力のタイミングを
入力クロック50によってコントローラ7へ伝える。
mはm≧1なる整数)までのm種類の候補が存在する文
字列を入力する装置であり、例えば、音声認識装置や文
字認識装置などである。入力装置5は、各文字に対する
m個の候補を、同時に出力し、その出力のタイミングを
入力クロック50によってコントローラ7へ伝える。
単語辞書メモリ1は、n文字分(nはn≧1なる整数)
のデータ中をもつ各アドレスに、単語の表記を1個ずつ
格納して、n文字に満たない部分には、あらかじめ定め
た残余記号を詰めたものである。第2図は、単語辞書メ
モリ1の内容の例を示す図である(第2図ではn=4と
している)。第2図において、△が残余記号を表わして
いる。第2図の単語辞書メモリ1のアドレスをaとする
と、「日本△△」というn(=4)文字が同時に読み出
される。単語辞書メモリ1は、ICメモリなどを用いて
実現できる。通常、漢字コードは16ビツトで表現され
るので、第2図の単語辞書メモリ1のデータ中は、16
X4=64ビツトである。現在のICメモリでは、同時
に読み出せるデータ中が8ビット程度であるから、その
ようなICメモリを8個並列に並べて実現できる。
のデータ中をもつ各アドレスに、単語の表記を1個ずつ
格納して、n文字に満たない部分には、あらかじめ定め
た残余記号を詰めたものである。第2図は、単語辞書メ
モリ1の内容の例を示す図である(第2図ではn=4と
している)。第2図において、△が残余記号を表わして
いる。第2図の単語辞書メモリ1のアドレスをaとする
と、「日本△△」というn(=4)文字が同時に読み出
される。単語辞書メモリ1は、ICメモリなどを用いて
実現できる。通常、漢字コードは16ビツトで表現され
るので、第2図の単語辞書メモリ1のデータ中は、16
X4=64ビツトである。現在のICメモリでは、同時
に読み出せるデータ中が8ビット程度であるから、その
ようなICメモリを8個並列に並べて実現できる。
コントローラ7は、入力装置5によって1文字に対する
m種類の候補が入力されるたびに、シフトクロック1回
と、単語辞書メモリl内の全単語数に応じた回数の判定
タロツクとカウンタクロックとを発生する。第3図はコ
ントローラ7の人出力信号のタイムチャートの例である
。第3図のタイムチャートでは、入力装置5から入力ク
ロック5oが入力されるたびに、まず、シフトクロック
70を1回出力(入力クロック50をそのままシフトク
ロック70として出力)シ、続いて、判定クロック72
とカウンタクロック71とを、交互にN回出力している
。ただし、カウンタクロック71は(N−1)回でもよ
い。ここで、Nは単語辞書メモリ1内の全単語数である
。このようなタイムチャート通りに動作するコントロー
ラ7は、当業者において容易に実現可能である。
m種類の候補が入力されるたびに、シフトクロック1回
と、単語辞書メモリl内の全単語数に応じた回数の判定
タロツクとカウンタクロックとを発生する。第3図はコ
ントローラ7の人出力信号のタイムチャートの例である
。第3図のタイムチャートでは、入力装置5から入力ク
ロック5oが入力されるたびに、まず、シフトクロック
70を1回出力(入力クロック50をそのままシフトク
ロック70として出力)シ、続いて、判定クロック72
とカウンタクロック71とを、交互にN回出力している
。ただし、カウンタクロック71は(N−1)回でもよ
い。ここで、Nは単語辞書メモリ1内の全単語数である
。このようなタイムチャート通りに動作するコントロー
ラ7は、当業者において容易に実現可能である。
アドレスカウンタ4は、シフトクロック70に同期した
リセットと、カウンタクロック71に同期したカウント
アツプとを行なうカウンタで、カウンタ値を単語辞書メ
モリ1のアドレス値として出力する。従来のカウンタI
Cで実現できる。
リセットと、カウンタクロック71に同期したカウント
アツプとを行なうカウンタで、カウンタ値を単語辞書メ
モリ1のアドレス値として出力する。従来のカウンタI
Cで実現できる。
第1候補シフトレジスタ2は、入力装置5によって入力
された文字列の第i候輔(iは1≦i≦mなる整数)を
、シフトクロック70に同期して1文字ずつ順送りしな
がら、n文字分格納するシフトレジスタである。このシ
フトレジスタ2は、入力文字列の各文字に列するm個の
候補の各々に対して設けられており、第1候補シフトレ
ジスタ、第2候補シフトレジスタ、・・・・・、第1候
補シフトレジスタのm個がある。
された文字列の第i候輔(iは1≦i≦mなる整数)を
、シフトクロック70に同期して1文字ずつ順送りしな
がら、n文字分格納するシフトレジスタである。このシ
フトレジスタ2は、入力文字列の各文字に列するm個の
候補の各々に対して設けられており、第1候補シフトレ
ジスタ、第2候補シフトレジスタ、・・・・・、第1候
補シフトレジスタのm個がある。
第4図は各シフトレジスタ2の構成例を示した図である
。1文字をdビットで表現している場合、第1候補シフ
トレジスタ2は、第4図のように、シフトクロック70
に同期した(dXn)個のDフリップフロップで実現で
きる(d個並列に並べたものを、n個直列に接続する)
。並列に接1↑、゛εしたd個が1文字に対応し、その
出力はまとめて比1咬回路3へ送られる。
。1文字をdビットで表現している場合、第1候補シフ
トレジスタ2は、第4図のように、シフトクロック70
に同期した(dXn)個のDフリップフロップで実現で
きる(d個並列に並べたものを、n個直列に接続する)
。並列に接1↑、゛εしたd個が1文字に対応し、その
出力はまとめて比1咬回路3へ送られる。
j文字目比較回路3は、アドレスカウンタ4の示す1つ
のアドレスに対して単語辞書メモリ1から読み出される
11文字分のデータのj@目qは1≦j≦nなる整数)
の文字が、m個のシフトレジスタ2のいずれかのj番目
の文に一致したときに一致信号30を出力し、残余信号
に一致したときに一致信号30と残余検出信号31とを
出力する回路である。この比較回路3は、単語辞書メモ
リ1のデータ巾n文字の各々に対して設けられており、
1文字目比較回路、2文字目比較回路、・・・・・、n
文字目比較回路のn個がある。第5図は、j文字目比較
回路3の構成例を示した図である。1文字をdビットで
表現して、シフトレジスタ2がm個設けられている場合
、j文字目比較回路3は、第5図のように、(m+1)
個のdビット比較器と、1個のORゲートで構成できる
。m個のdビット比較器は、単語諦潜メモリ1から読み
出されているn文字データのうちj文字目と、各シフト
レジスタ2のj文字目とを比較し、残りの1個のdビッ
ト比較器は、単語辞書メモリ1から読み出されているn
文字データのうちのj文字目が残余記号であるか否かを
調べる。最終的なORデートの出力では、この(m+1
)個の比較器のいずれかで、一致が検出されたときに、
一致信号30が出力される。また、単語辞書メモリ1か
ら読み出されているn文字データのうちのj文字目もが
残余記号であるか否かを調べるdビット比較器の出力は
、そのまま残余検出信号31とする。
のアドレスに対して単語辞書メモリ1から読み出される
11文字分のデータのj@目qは1≦j≦nなる整数)
の文字が、m個のシフトレジスタ2のいずれかのj番目
の文に一致したときに一致信号30を出力し、残余信号
に一致したときに一致信号30と残余検出信号31とを
出力する回路である。この比較回路3は、単語辞書メモ
リ1のデータ巾n文字の各々に対して設けられており、
1文字目比較回路、2文字目比較回路、・・・・・、n
文字目比較回路のn個がある。第5図は、j文字目比較
回路3の構成例を示した図である。1文字をdビットで
表現して、シフトレジスタ2がm個設けられている場合
、j文字目比較回路3は、第5図のように、(m+1)
個のdビット比較器と、1個のORゲートで構成できる
。m個のdビット比較器は、単語諦潜メモリ1から読み
出されているn文字データのうちj文字目と、各シフト
レジスタ2のj文字目とを比較し、残りの1個のdビッ
ト比較器は、単語辞書メモリ1から読み出されているn
文字データのうちのj文字目が残余記号であるか否かを
調べる。最終的なORデートの出力では、この(m+1
)個の比較器のいずれかで、一致が検出されたときに、
一致信号30が出力される。また、単語辞書メモリ1か
ら読み出されているn文字データのうちのj文字目もが
残余記号であるか否かを調べるdビット比較器の出力は
、そのまま残余検出信号31とする。
判定回路6は、判定クロック72に同期して、n個の比
較回路のすべてから一致信号が検出された場合に、入力
装置5によって入力された文字列中に単語辞書メモリ1
内に存在する単語が出現したと判定する回路である。第
6図は、判定回路6の構成例を示す図である。判定回路
6は、第6図のように、1個のANDゲートと1個のD
フリップフロップで実現できる。
較回路のすべてから一致信号が検出された場合に、入力
装置5によって入力された文字列中に単語辞書メモリ1
内に存在する単語が出現したと判定する回路である。第
6図は、判定回路6の構成例を示す図である。判定回路
6は、第6図のように、1個のANDゲートと1個のD
フリップフロップで実現できる。
単語長算出回路8は、n個の比較回路3から出力される
残余検出信号31をもとに単語長80を算出する回路で
ある。第9図は、単語長算出回路8の構成例を示す国で
ある。第9図の回路では、j文字目比較回路(ここでは
2≦j≦n)から残金検出信号31が届いて、(j−1
)文字目比較回路から残余検出信号31が届いていない
ときに、(j−1)を単語長80として出力する。また
、1文字目比較回路からn文字目比較回路のいずれから
も残余検出信号31が届かないときには、nの僅を単語
長80として出力する。1文字目比較回路からn文字目
比較回路のすべてから残余検出信号31が届く場合は、
Oを単語長80として出力する(ただし、これは、単語
辞書メモリ1内に単語長Oの単語が含まれていることに
なり、通常は考えられないケースである)。
残余検出信号31をもとに単語長80を算出する回路で
ある。第9図は、単語長算出回路8の構成例を示す国で
ある。第9図の回路では、j文字目比較回路(ここでは
2≦j≦n)から残金検出信号31が届いて、(j−1
)文字目比較回路から残余検出信号31が届いていない
ときに、(j−1)を単語長80として出力する。また
、1文字目比較回路からn文字目比較回路のいずれから
も残余検出信号31が届かないときには、nの僅を単語
長80として出力する。1文字目比較回路からn文字目
比較回路のすべてから残余検出信号31が届く場合は、
Oを単語長80として出力する(ただし、これは、単語
辞書メモリ1内に単語長Oの単語が含まれていることに
なり、通常は考えられないケースである)。
次にこの実施例の動作を例を用いて説明する。
第7図は、n=4、m=3で入力文字列の長さが4のと
きの、第1候補シフトレジスタ・第2候補シフトレジス
タ・第3候補シフトレジスタの内容の変化の例を示した
図である。第7図の3×4のマトリックスは、1行が各
シフトレジスタ2の内容に対応しており、行方向が文字
装置(1〜4)、列方向が候補レベル(1〜3)を表わ
している。これらのシフトレジスタ2に入力されている
文字列は、1文字目の候補は第1候補から順に「日」
「白」 「目J、2文字目の候補は順に「木」 「本」
「犬1.3文字l」は順に「電1 「雷」「霧」、4
文字目は順に「気] 「島」 「戒]である。斜線部分
は文字が格納され−Cいないことを表わす。
きの、第1候補シフトレジスタ・第2候補シフトレジス
タ・第3候補シフトレジスタの内容の変化の例を示した
図である。第7図の3×4のマトリックスは、1行が各
シフトレジスタ2の内容に対応しており、行方向が文字
装置(1〜4)、列方向が候補レベル(1〜3)を表わ
している。これらのシフトレジスタ2に入力されている
文字列は、1文字目の候補は第1候補から順に「日」
「白」 「目J、2文字目の候補は順に「木」 「本」
「犬1.3文字l」は順に「電1 「雷」「霧」、4
文字目は順に「気] 「島」 「戒]である。斜線部分
は文字が格納され−Cいないことを表わす。
第7図(a)〜(h)において、(a)−+(b)−+
(c)−+(d)−+(e)−+(f)→(g)→(h
)という変化は、シフトクロック7oが1回発生される
たびに起こる変化を示している。そして、(a)〜(g
)の各々の状態で、カウンタクロック71と判定クロッ
ク72がN回発生される。アドレスカウンタ4は、シフ
トクロック70によってリセットされ、カウンタクロッ
ク71によってN回カウントアツプされるため、各状態
で、単語辞書メモリ1がらは、先頭の単語から末尾の単
語まで順に、全単語(N個)の表記が読み出され、n個
(この例では4個)の比較回路3において、それらと第
7図のシフトレジスタの内容との照合が行なわれること
になる。
(c)−+(d)−+(e)−+(f)→(g)→(h
)という変化は、シフトクロック7oが1回発生される
たびに起こる変化を示している。そして、(a)〜(g
)の各々の状態で、カウンタクロック71と判定クロッ
ク72がN回発生される。アドレスカウンタ4は、シフ
トクロック70によってリセットされ、カウンタクロッ
ク71によってN回カウントアツプされるため、各状態
で、単語辞書メモリ1がらは、先頭の単語から末尾の単
語まで順に、全単語(N個)の表記が読み出され、n個
(この例では4個)の比較回路3において、それらと第
7図のシフトレジスタの内容との照合が行なわれること
になる。
その結果、各状態で、単語辞書メモリ1内の例えば次の
ような単語に対して、判定回路6が出現を検出する。そ
して、それらに対して、単語長算出回路の出力する単語
長はく〉内の値となる。
ような単語に対して、判定回路6が出現を検出する。そ
して、それらに対して、単語長算出回路の出力する単語
長はく〉内の値となる。
(a)該尚なし
くb)該当なし
くC)該当なし
くd)「日J <1> r日本J<2>rEJ本電気J
く4〉「日入J <2> r白J<1>r白木]く2〉
F目」く1〉 (e)「本J <1> r本J <1> r大]くl〉
(OF電J <i> r電気J <2> r霧]く1〉
F霧、li′lJ<2>r雷1くI〉 (g)「気J <1> r島1く1〉 このうち、状態(d)における第7図のシフトレジスタ
内容と、単語辞駐内の単語「E1本](=「日本△△]
)とを照合する際の、各比較回路3の動作を説明する。
く4〉「日入J <2> r白J<1>r白木]く2〉
F目」く1〉 (e)「本J <1> r本J <1> r大]くl〉
(OF電J <i> r電気J <2> r霧]く1〉
F霧、li′lJ<2>r雷1くI〉 (g)「気J <1> r島1く1〉 このうち、状態(d)における第7図のシフトレジスタ
内容と、単語辞駐内の単語「E1本](=「日本△△]
)とを照合する際の、各比較回路3の動作を説明する。
1文字目比較回路は、1日本△△1の「日]と第1候補
シフトレジスタの1文字目のF日]との一致により一致
信号30を発生ずる。2文字目比較回路は、「[1本△
△JのF本Jと第2候補シフトレジスタの2文字目の1
本1との一致により一致信号30を発生ずる。3文字目
比較回路と4文字目比較回路はともに、「日本△△」の
「△」(残余記号)を検出して一致信号30と残糸検出
信号31とを発生する。
シフトレジスタの1文字目のF日]との一致により一致
信号30を発生ずる。2文字目比較回路は、「[1本△
△JのF本Jと第2候補シフトレジスタの2文字目の1
本1との一致により一致信号30を発生ずる。3文字目
比較回路と4文字目比較回路はともに、「日本△△」の
「△」(残余記号)を検出して一致信号30と残糸検出
信号31とを発生する。
その結果、判定回路6は、すべての比較回路3の一致信
号30を受けて、単語の出現を検出することになる。ま
た、そのとき、単語長検出回路8は、3文字目比較回路
と4文字目比較回路とから残余検出信号31を受けて、
2を単語長80の値として出力する。
号30を受けて、単語の出現を検出することになる。ま
た、そのとき、単語長検出回路8は、3文字目比較回路
と4文字目比較回路とから残余検出信号31を受けて、
2を単語長80の値として出力する。
なお、入力文字列長がKの場合、シフトレジスタ2内で
の順送りは、少なくとも(K+n−1)回行なわれる必
要がある。したがって、入力装置5は、長さKの入力文
字列を入力した後、さらに、(n−1)回のダミーの文
字列入力を行なう必要がある。あるいは、コントローラ
7が、入力文字列の末尾を検出して、さらに、シフトク
ロック70の1回とカウンタクロック71と判定クロッ
ク72をN回ずつというサイクルを、(n−’、L)回
繰り返ずようにしてもよい。
の順送りは、少なくとも(K+n−1)回行なわれる必
要がある。したがって、入力装置5は、長さKの入力文
字列を入力した後、さらに、(n−1)回のダミーの文
字列入力を行なう必要がある。あるいは、コントローラ
7が、入力文字列の末尾を検出して、さらに、シフトク
ロック70の1回とカウンタクロック71と判定クロッ
ク72をN回ずつというサイクルを、(n−’、L)回
繰り返ずようにしてもよい。
また、最初の(n−1)回の朋送りの間(第7図では(
a)から(C)まで)は、入力文字列がシフトレジスタ
2の先頭まで到達していないので、単語辞書メモリ1と
の照合を行なっても意味がない。そこで、その間は、コ
ントローラ7は、カウンタクロック71や判定クロック
72を発生せず、シフトクロック70のみを連続しCQ
!JEするようにしてもよい。
a)から(C)まで)は、入力文字列がシフトレジスタ
2の先頭まで到達していないので、単語辞書メモリ1と
の照合を行なっても意味がない。そこで、その間は、コ
ントローラ7は、カウンタクロック71や判定クロック
72を発生せず、シフトクロック70のみを連続しCQ
!JEするようにしてもよい。
以上では、入力文字列の各文字にm個の候補が存在する
一般的な場合の実hm例を示したが、かな漢字変換にお
ける卑語辞書検索や、ワードプロセッサで作成した文章
の解析を行なう際の単語辞書検索などでは、入力文字列
の各文字は1通りである(m=1)。第8図は、そのよ
うな場合を対象とした第2の実施例を示すブロック図で
ある。この場合は、シフトレジスタ2が1個でよい。溝
底要素・動作は第1図の実施例についてm=1とすれば
よいので、説明を省略する。
一般的な場合の実hm例を示したが、かな漢字変換にお
ける卑語辞書検索や、ワードプロセッサで作成した文章
の解析を行なう際の単語辞書検索などでは、入力文字列
の各文字は1通りである(m=1)。第8図は、そのよ
うな場合を対象とした第2の実施例を示すブロック図で
ある。この場合は、シフトレジスタ2が1個でよい。溝
底要素・動作は第1図の実施例についてm=1とすれば
よいので、説明を省略する。
(発明の効果)
以上説明したように、本発明によれば、漢字のように種
類の多い文字から成る文字列に対して、各文字が複数の
候補をもってい−Cも、高速に単語辞書との照合が可能
な単語辞1)検索装置が得られる。特に、入力文字列の
各文字の候補数にも、単語辞書内の単語の表記長にもか
かわらず、入力文字列と単語辞書内の1つの単語との照
合が2クロック程度の間に行えることの効果が大きい。
類の多い文字から成る文字列に対して、各文字が複数の
候補をもってい−Cも、高速に単語辞書との照合が可能
な単語辞1)検索装置が得られる。特に、入力文字列の
各文字の候補数にも、単語辞書内の単語の表記長にもか
かわらず、入力文字列と単語辞書内の1つの単語との照
合が2クロック程度の間に行えることの効果が大きい。
さらに、実施例に示したように、本発明の各構成要素は
、少数のロジックICを組み合わせで実現できる。した
がって、LSI技術を利用すれば、非常に小型の装置と
して実現できる点も長所である。
、少数のロジックICを組み合わせで実現できる。した
がって、LSI技術を利用すれば、非常に小型の装置と
して実現できる点も長所である。
それに加えて、第■の従来技術のように、汎用計算機上
のソフトウェアとして実現されるのではなく、専用ハー
ドウェア・特殊LSIとして実現できるため、クロック
の周波数自体を、汎用計算機に比べてかなり高く設定す
ることが可能であり、この点でも高速性が優れている。
のソフトウェアとして実現されるのではなく、専用ハー
ドウェア・特殊LSIとして実現できるため、クロック
の周波数自体を、汎用計算機に比べてかなり高く設定す
ることが可能であり、この点でも高速性が優れている。
以上のような高速性から、本発明では、前述の第1の従
来技術のように単語辞a゛内で照合する単語数を制限せ
ず、単語辞書内の全単語との照合を行なっても、従来よ
り十分高速な単語辞書検索装置が得られると考えられる
が、その結果、単語辞書内が表、記のコード順にソート
されている必要がないという長所も生じる。したがって
、単語の追加・削除が行なわれても、単語辞書を編成し
直す必要がなく、i、it 3@辞狽のメンテナンスが
きわめて容易である。
来技術のように単語辞a゛内で照合する単語数を制限せ
ず、単語辞書内の全単語との照合を行なっても、従来よ
り十分高速な単語辞書検索装置が得られると考えられる
が、その結果、単語辞書内が表、記のコード順にソート
されている必要がないという長所も生じる。したがって
、単語の追加・削除が行なわれても、単語辞書を編成し
直す必要がなく、i、it 3@辞狽のメンテナンスが
きわめて容易である。
また、本発明の単語辞書検索装置では、入力文字列中に
単語辞雀゛内にある単語が出現したことがわかるだけで
なく、その単語の長さも同時に得られるので、改めて単
語辞書から単語長を読み出す必要がなく、処理の効率が
高い。
単語辞雀゛内にある単語が出現したことがわかるだけで
なく、その単語の長さも同時に得られるので、改めて単
語辞書から単語長を読み出す必要がなく、処理の効率が
高い。
第1図は本発明の第1の実施例の(IB戒を示すブロッ
ク図、第2図は単語辞芽メモリlの内容の例を示す図、
第3図はコントローラ7の人出力信号のタイムチャート
の例、第4図はシフトレジスタ2の構成例を示す図、第
5図は比較回路3の構成例を示す図、第6図は判定回路
6の構+を例を示す図、第7図(a)〜(h)はシフト
レジスタ2の内容の変化の例を示す図、第8図は本発明
の第2の実施例を示すブロック図、第9図は単語長算出
回路8の構成例を示す図である。 図において、1・・・単語辞訃メモリ、2・・・シフト
レジスタ(第i候補シフトレジスタ)、3・・・比較回
路匂文字目比較回路)、4・・・アドレスカウンタ、5
・・・入力装置、6・・・判定回路、7・・・コントロ
ーラ、8・・・単語長検出回路、30・・・一致信号、
31・・・残余検出信号、50・・・入力クロック、7
0・・シフトクロック、71・・・カウンタクロック、
72・・・判定クロックである。
ク図、第2図は単語辞芽メモリlの内容の例を示す図、
第3図はコントローラ7の人出力信号のタイムチャート
の例、第4図はシフトレジスタ2の構成例を示す図、第
5図は比較回路3の構成例を示す図、第6図は判定回路
6の構+を例を示す図、第7図(a)〜(h)はシフト
レジスタ2の内容の変化の例を示す図、第8図は本発明
の第2の実施例を示すブロック図、第9図は単語長算出
回路8の構成例を示す図である。 図において、1・・・単語辞訃メモリ、2・・・シフト
レジスタ(第i候補シフトレジスタ)、3・・・比較回
路匂文字目比較回路)、4・・・アドレスカウンタ、5
・・・入力装置、6・・・判定回路、7・・・コントロ
ーラ、8・・・単語長検出回路、30・・・一致信号、
31・・・残余検出信号、50・・・入力クロック、7
0・・シフトクロック、71・・・カウンタクロック、
72・・・判定クロックである。
Claims (1)
- 各文字に対して第1から第m候補(mはm≧1なる整数
)までのm種類の候補が存在する文字列の入力装置と、
n文字分(nはn≧1なる整数)のデータ巾をもつ各ア
ドレスに単語の表記を1個ずつ格納してn文字に満たな
い部分にはあらかじめ定めた残余記号を詰めた単語辞書
メモリと、前記入力装置によって1文字に対するm種類
の候補が入力されるたびにシフトクロック1回と前記単
語辞書メモリ内の全単語数に応じた回数の判定クロック
とカウンタクロックとを発生するコントローラと、前記
シフトクロックに同期したリセットと前記カウンタクロ
ックに同期したカウントアップとを行なう前記単語辞書
メモリのアドレスカウンタと、前記入力装置によって入
力された文字列の第1・第2・・・・・・・第m候補に
対応し前記シフトクロックに同期した1文字ずつの順送
りを行なう各々n文字分の第1・第2・・・・・・・第
m候補シフトレジスタと、前記単語辞書メモリから読み
出されるn文字分のデータの1文字目・2文字目・・・
・・・・n文字目に対応し該当位置の文字が前記第1・
第2・・・・・・・第m候補シフトレジスタのいずれか
の同位置の文字に一致したとき一致信号を出力し前記残
余記号に一致したとき一致信号と残余記号とを出力する
1文字目・2文字目・・・・・・・n文字目比較回路と
、前記判定クロックに同期して前記1文字目・2文字目
・・・・・・・n文字目比較回路のすべてから一致信号
が検出された場合に前記入力装置によって入力された文
字列中に前記単語辞書メモリ内に存在する単語が出現し
たと判定する判定回路と、前記残余検出信号をもとに単
語長を算出する単語長算出回路とを備えたことを特徴と
する単語辞書検索装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1173443A JP2526670B2 (ja) | 1989-07-04 | 1989-07-04 | 単語辞書検索装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1173443A JP2526670B2 (ja) | 1989-07-04 | 1989-07-04 | 単語辞書検索装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH0337766A true JPH0337766A (ja) | 1991-02-19 |
| JP2526670B2 JP2526670B2 (ja) | 1996-08-21 |
Family
ID=15960569
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1173443A Expired - Lifetime JP2526670B2 (ja) | 1989-07-04 | 1989-07-04 | 単語辞書検索装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2526670B2 (ja) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60147888A (ja) * | 1984-01-12 | 1985-08-03 | Comput Basic Mach Technol Res Assoc | 文字認識後処理方法及びその装置 |
| JPS63261422A (ja) * | 1987-04-17 | 1988-10-28 | Matsushita Electric Ind Co Ltd | 文字列照合装置 |
| JPS63261421A (ja) * | 1987-04-17 | 1988-10-28 | Mitsubishi Electric Corp | 文字列処理装置 |
-
1989
- 1989-07-04 JP JP1173443A patent/JP2526670B2/ja not_active Expired - Lifetime
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS60147888A (ja) * | 1984-01-12 | 1985-08-03 | Comput Basic Mach Technol Res Assoc | 文字認識後処理方法及びその装置 |
| JPS63261422A (ja) * | 1987-04-17 | 1988-10-28 | Matsushita Electric Ind Co Ltd | 文字列照合装置 |
| JPS63261421A (ja) * | 1987-04-17 | 1988-10-28 | Mitsubishi Electric Corp | 文字列処理装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2526670B2 (ja) | 1996-08-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0366115B1 (en) | String collating system for searching for character string of arbitrary length within a given distance from reference string | |
| US5560037A (en) | Compact hyphenation point data | |
| Phyu et al. | Burmese word segmentation with Character Clustering and CRFs | |
| JPH0337766A (ja) | 単語辞書検索装置 | |
| JP2595934B2 (ja) | 仮名漢字変換処理装置 | |
| JPH0337764A (ja) | 巣語辞書検索装置 | |
| JPH0337754A (ja) | 単語辞書検索装置 | |
| JPH04340166A (ja) | 単語辞書検索装置 | |
| JP2792147B2 (ja) | 文字処理方法およびその装置 | |
| JP2526678B2 (ja) | 単語辞書検索装置 | |
| JPH0337765A (ja) | 単語辞書検索装置 | |
| JPH03110676A (ja) | 単語辞書検索装置 | |
| CN1323004A (zh) | 汉语盲文到汉字的自动转换方法 | |
| JPH0869474A (ja) | 類似文字列検索装置 | |
| Praneetha et al. | Handwritten Text Recognition Using Word Beam Search | |
| JPH0347547B2 (ja) | ||
| JPH0810452B2 (ja) | 日本語対象文固有用語抽出処理装置 | |
| Mustafa et al. | A backward algorithm for lexical analysis of textual Arabic words | |
| EP0649106A1 (en) | Compactly stored word groups | |
| JP2835065B2 (ja) | 文字列検索方法 | |
| JPH02148174A (ja) | Ocrによる住所データベース検索装置 | |
| JPH01205267A (ja) | 単語辞書検索装置 | |
| JP2744241B2 (ja) | 文字処理装置 | |
| JPS63103393A (ja) | 単語認識装置 | |
| JPH0582627B2 (ja) |