JPH04250589A - 単語照合装置及び単語照合方法 - Google Patents
単語照合装置及び単語照合方法Info
- Publication number
- JPH04250589A JPH04250589A JP3001093A JP109391A JPH04250589A JP H04250589 A JPH04250589 A JP H04250589A JP 3001093 A JP3001093 A JP 3001093A JP 109391 A JP109391 A JP 109391A JP H04250589 A JPH04250589 A JP H04250589A
- Authority
- JP
- Japan
- Prior art keywords
- word
- words
- matching
- character string
- dictionary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Discrimination (AREA)
Abstract
め要約のデータは記録されません。
Description
いて用いられる単語照合方法にかかり、特に文字認識の
後処理として単語照合を行なうとき、単語照合を高速化
・高精度化するに好適な単語照合方法に関する。
方式としては、例えば特開昭63−131288公報に
開示されているように、読取精度の高い数字等で記入さ
れたコードデータを読取り、そのコードデータにより照
合すべき単語を限定する方式がある。具体的には、記入
された住所を単語照合するとき、記入された郵便番号を
読取り、読取られた郵便番号に対応した住所の単語だけ
を用いて単語照合する場合である。
すべき単語を限定するために、帳票上に数字等のコード
データを記入し、記入されたコードデータを読取る必要
がある。ところがコードデータが帳票上に記入されない
ときは、照合すべき単語を限定できなくなり、単語照合
を高速化・高精度化できなくなるという問題点がある。 具体的には、上記従来の技術の項で述べた住所の例にお
いて、郵便番号が記入されないときである。また、帳票
サイズや記入項目数の関係により、帳票上に郵便番号を
記入するエリアそのものが設けられない場合がある。ま
た、特定地域に居住している人に居住地の住所を記入し
てもらうようなアプリケーションの場合には、郵便番号
の記入はまったく不必要であり、記入対象とはならない
。
みなされたもので、照合すべき単語を限定するコードデ
ータを帳票に記入することなく、照合すべき単語データ
を限定し、高速・高精度の単語照合を行なうことを可能
にする単語照合方法を提供することにある。
方法は、認識結果文字列あるいは認識結果に対応する候
補文字列と単語辞書内の単語とを照合し、上記認識結果
文字列あるいは候補文字列と相違度の小さい複数の単語
を出力する単語照合方法に適用されるものであり、上記
単語辞書内の各単語に単語を分類するための符号を付加
し、上記単語辞書内の各単語に付加された符号を用いて
、単語辞書内の単語について照合対象とする単語を予め
ある範囲に限定し、限定された単語の範囲内で照合を行
なうことを特徴としている。
記単語辞書内の単語について照合対象とする単語を予め
ある範囲に限定する場合、単語辞書内の単語を階層的に
指定して限定することを特徴としている。
識結果文字列あるいは認識結果に対応する候補文字列と
単語辞書内の単語とを照合し、上記認識結果文字列ある
いは候補文字列と相違度の小さい複数の単語を出力する
単語照合方法において、単語の種類に応じて複数の単語
辞書を準備し、照合対象とする単語を上記単語辞書単位
で予め所望の範囲に限定し、限定された単語の範囲内で
照合を行なうことを特徴としている。
語を限定するコードデータを帳票上に記入することなく
、照合すべき単語データを限定することが可能になり、
その結果高速・高精度に単語照合を行なうことができる
。
する。図1は、本発明の一実施例の構成を示すブロック
図である。図1において、101は文字認識部、102
は照合制御部、103は単語照合部、104は単語辞書
部、105は出力部である。文字認識部101は1文字
毎の文字パターンを認識し、認識結果を単語照合部10
3へ送る。照合制御部102は、オペレータ等によって
予め指示された単語照合の対象となる単語の範囲を限定
する処理を行なう。単語照合部103は、文字認識部1
01より送られてきた文字認識結果列(または候補文字
列)と単語辞書部104内の単語とを照合し、相違度の
小さい複数の単語を照合結果として出力部105へ送る
。単語辞書部104は、照合に使用する複数の単語を格
納している。出力部105は、認識結果及び照合結果を
出力する。
2を用いて説明する。図2において、201は表示画面
を示し、オペレータがキーボードより入力した文字を示
している。本例は、照合の対象となる単語を「東京都」
と「神奈川県」の住所に限定した場合を示している。2
03は都道府県名と都道府県に対応するコードを格納し
ているコード記憶部である。変換部202は表示画面2
01により指定された都道府県名についてコード記憶部
203を参照し、コード204に変換して図示しないフ
ァイルあるいはメモリに保持する。本処理は、読取り/
照合開始に先立って行われる。
3を用いて説明する。本例は、単語辞書104が住所の
単語辞書の場合を示しており、各単語は都道府県コード
301が付加された状態で登録されている。
4に示すフローチャートを用いて説明する。図示するよ
うに、ステップ401において、単語辞書104から単
語を取出す。次に、ステップ402において、全ての単
語が取り出されたか否かが判定し、全ての単語が取り出
されて取出す単語がなくなったときは、ステップ405
において処理が終了する。ステップ401において単語
を取出したときは、ステップ403において、当該単語
が照合対象単語か否かを判定し、照合対象単語であると
判定された場合に限って照合を行なう。照合対象単語か
否かの判定は、前記したコード204(図2参照)と取
出した単語のコード301(図3参照)が一致するか否
かにより行われる。一致した場合には、当該単語を照合
対象単語とする。尚、ステップ401における単語取出
し処理及びステップ404における単語照合処理は、例
えば特開昭61−161588号公報に開示された技術
を用いて行なうことができる。
単語を必要最小限に限定できるので、高速かつ高精度の
単語照合ができる効果がある。
、照合の対象となる地域を限定する方法について説明す
る。図5はオペレータ等が照合の対象となる地域を限定
する場合、図1に示す照合制御部102に対して限定す
る地域名を指定するときの表示画面501を示している
。図5においては、都道府県名520と市郡区名530
が分けられ、両者が階層的に指定されている。図5に示
す例は、東京都及び神奈川県の川崎市及び神奈川県の横
浜市の3つの地域に照合の対象となる地域を限定した場
合である。
都道府県名を入力し、さらに対応する市郡区名のフィー
ルドに何も入力されず空白のまま残っている場合には、
該都道府県の全域を指定したことを意味する。この例と
しては、図5に示すフィールド521とフィールド53
1があり、これは東京都の全域が指定されたことを意味
している。
たときは、1行上の都道府県名を指定したことを意味す
る。この例としては、図5に示すフィールド523があ
り、これはフィールド522の神奈川県が指定されたこ
とを意味している。
御部102内のメモリ内に保持され、またはフロッピー
ディスク装置等の外部記憶装置に記憶される。外部記憶
装置に記憶した場合には、読取時に、照合制御部102
内のメモリにロードする。ここで、指定内容を保持する
状態は、図6に示すように都道府県名のみコードに変換
した形でもよいし、図7に示すように市郡区名に基づい
て単語辞書サーチし、単語辞書内のアドレスに変換した
形でもよい。
地域を限定するときには地名を指定することにより、容
易かつきめ細かい限定をすることが可能になる。
名を指定したが、辞書単語に住所コードを付加すること
により、地域限定に住所コードを指定することも可能で
ある。読取りの業務内容によっては、住所コードで地域
を限定するのが最良の場合もある。
説明にしたが、単語照合の対照が氏名(特に名)の場合
には、辞書単語に性別を示す情報を付加し、照合制御部
で照合対象を限定するときに性別を指定する方法も考え
られる。
語を分類するためのコードを付加して単語辞書を作成し
、さらに照合対照とする複数の分類コードを指定するこ
とにより、高速・高精度の単語照合が可能になる。
をあらかじめ地域別、たとえば都道府県別に作成し、照
合に使用する辞書を照合制御部102において指定する
ようにしても良い。
ち予め指定した内容に該当する単語のみにより単語照合
を行なうので、高速・高精度の単語照合を行なうことが
できる。
を限定するために、帳票上に郵便番号等のコードを記入
する必要がなくなる。
。
フローチャート。
が照合の対象となる地域を限定する場合、限定する地域
名を指定するときの表示画面を示す図。
説明図。
説明図。
Claims (3)
- 【請求項1】認識結果文字列あるいは認識結果に対応す
る候補文字列と単語辞書内の単語とを照合し、上記認識
結果文字列あるいは候補文字列と相違度の小さい複数の
単語を出力する単語照合方法において、上記単語辞書内
の各単語に単語を分類するための符号を付加し、上記単
語辞書内の各単語に付加された符号を用いて、単語辞書
内の照合対象とする単語を予めある範囲に限定し、限定
された単語の範囲内で照合を行なうことを特徴とする単
語照合方法。 - 【請求項2】単語辞書内の照合対象とする単語を予めあ
る範囲に限定する場合、単語辞書内の単語を階層的に指
定して限定することを特徴とする請求項1記載の単語照
合方法。 - 【請求項3】認識結果文字列あるいは認識結果に対応す
る候補文字列と単語辞書内の単語とを照合し、上記認識
結果文字列あるいは候補文字列と相違度の小さい複数の
単語を出力する単語照合方法において、単語の種類に応
じて複数の単語辞書を準備し、照合対象とする単語を上
記単語辞書単位で予め所望の範囲に限定し、限定された
単語の範囲内で照合を行なうことを特徴とする単語照合
方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3001093A JP3007697B2 (ja) | 1991-01-09 | 1991-01-09 | 単語照合装置及び単語照合方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3001093A JP3007697B2 (ja) | 1991-01-09 | 1991-01-09 | 単語照合装置及び単語照合方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH04250589A true JPH04250589A (ja) | 1992-09-07 |
| JP3007697B2 JP3007697B2 (ja) | 2000-02-07 |
Family
ID=11491886
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3001093A Expired - Lifetime JP3007697B2 (ja) | 1991-01-09 | 1991-01-09 | 単語照合装置及び単語照合方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP3007697B2 (ja) |
-
1991
- 1991-01-09 JP JP3001093A patent/JP3007697B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JP3007697B2 (ja) | 2000-02-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH11282955A (ja) | 文字認識装置、文字認識方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JP3812818B2 (ja) | データベース生成装置、データベース生成方法及びデータベース生成処理プログラム | |
| KR20000039018A (ko) | 한글로 표기된 외래어 코드화 방법 및 그를 이용한 검색 방법 | |
| JPH08263587A (ja) | 文書入力方法および文書入力装置 | |
| JPH04250589A (ja) | 単語照合装置及び単語照合方法 | |
| JP2588261B2 (ja) | Ocrによる住所データベース検索装置 | |
| JPH0441388B2 (ja) | ||
| JP2932667B2 (ja) | 情報の検索方法および情報蓄積装置 | |
| JP2839515B2 (ja) | 文字読取システム | |
| JPH06103402A (ja) | 名刺認識装置 | |
| JPH10198688A (ja) | 定型文書読み取り装置 | |
| JP2922365B2 (ja) | Ocr処理システムにおける漢字住所データ処理方法 | |
| JP2560959B2 (ja) | 文字認識後処理方式 | |
| JP3245415B2 (ja) | 文字認識方法 | |
| JPH0256086A (ja) | 文字認識の後処理方法 | |
| JPH07296005A (ja) | 日本語テキスト登録・検索装置 | |
| JP2874199B2 (ja) | 単語辞書照合装置 | |
| JPH0546815A (ja) | 光学式文字読取装置における住所単語照合方法 | |
| KR101663521B1 (ko) | 띄어쓰기 교정 방법 및 프로그램 | |
| KR101629726B1 (ko) | 띄어쓰기 교정 방법 및 프로그램 | |
| JPS63138479A (ja) | 文字認識装置 | |
| JPH0340434B2 (ja) | ||
| JPS61151738A (ja) | キ−ワ−ド抽出装置 | |
| JPH0438026B2 (ja) | ||
| JPH05298489A (ja) | 文字認識方式 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071126 Year of fee payment: 8 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081126 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081126 Year of fee payment: 9 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091126 Year of fee payment: 10 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101126 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101126 Year of fee payment: 11 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111126 Year of fee payment: 12 |