JPH02181269A - 住所認識方式 - Google Patents

住所認識方式

Info

Publication number
JPH02181269A
JPH02181269A JP64000114A JP11489A JPH02181269A JP H02181269 A JPH02181269 A JP H02181269A JP 64000114 A JP64000114 A JP 64000114A JP 11489 A JP11489 A JP 11489A JP H02181269 A JPH02181269 A JP H02181269A
Authority
JP
Japan
Prior art keywords
recognizing
recognition
words
word
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP64000114A
Other languages
English (en)
Inventor
Kaoru Katagiri
片桐 薫
Hiroyuki Sugai
菅井 弘幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Toshiba System Development Co Ltd
Original Assignee
Toshiba Corp
Toshiba System Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp, Toshiba System Development Co Ltd filed Critical Toshiba Corp
Priority to JP64000114A priority Critical patent/JPH02181269A/ja
Publication of JPH02181269A publication Critical patent/JPH02181269A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、住所認識方式に関する。
(従来の技術) 認識方法には種々雑多のものがあるが、住所認識の場合
には以下のような方式が採用されている。
まず、住所認識を実行するために、文字を認識し、これ
に引続き単語を認識する。この認識結果に基づいて、単
語を組合せて住所を検索する。この単語認識に際し、同
義語があった場合、略称を候補として挙げていた。例え
ば、rHiGHWAYJ  rHiWAYJ  rHW
YJとの記載を読取り認識した場合、辞書からその略称
であるrHWYJを認識候補として得ていた。これは、
rHi GHWAYJ  rHiWAYJ  rHWY
Jが共に同一の意味、即ち高速道路という意味しかない
場合には非常に有効であった。
しかしながら、本願発明者が、試験、検討を重ねたとこ
ろ、略称の意味が重複する場合があり、正しい住所検索
が出来なかった。
(発明が解決しようとする課題) このように従来の技術では、単語の候補を単一の略称で
表現していたため、略称の意味が重複する場合、正しい
住所検索が出来なかった。
そこで、この発明は、略称の意味が重複する場合でもよ
り正確な認識の出来る住所検索方式を提供することを目
的とする。
[発明の構成〕 (課題を解決するための手段) 本発明は上記課題を解決するために、検索対象を入力す
る入力手段と、この入力手段から入力された単語に対し
辞書の内容との比較を行って認識を実行する手段とを具
備する識方式において、略称が用いられる単語に対して
その標準形を前記辞書に登録しておき、前記単語の検索
に際し前記標準形を出力すると共に、前記入力手段から
入力された単語を、認識候補として出力することを特徴
とする。
(作用) 本発明によれば、略称に対し可能な全ての意味を持たせ
、複数の候補を認識候補とするため住所認識がより正確
に実行される。
(実施例) 次にこの発明の一実施例について、図面を用いて詳細に
説明する。
この実施例は米国での郵便物の住所認識装置に関する。
この住所認識装置は、第1図に示されるよう入力部11
を含む。この入力部11は、CCD等の光電変換装置か
ら構成され、郵便物上の画像をrOJ  rlJの画像
情報に変換するものである。この入力部11で得られた
画像情報は、文字検出認識部13に供給される。この文
字検出認識部13では、画像情報から文字を構成する情
報を抽出し、個々の文字について認識処理を実行する。
この結果に対して単語認識部15において、第1のデー
タベースを用いて単語認識が実行される。
単語認識の後、第2のデータベース19を用いて住所認
識部21にて住所認識がなされる。この認識結果が出力
装置23に供給し、表示等をする。
次に上記構成における動作処理の詳細について説明する
文字検出認識部13での文字検出は、周知の技術で達成
される。まず、画像情報に対して2軸方向(水平、垂直
)に分布の統計をとる。即ち、2軸方向の各々に射影を
とり、「1」の数を計数する。すると、文字のある場所
では他の領域に比し、「1」の数、即ち画素数が多いの
で、文字の検出は容易に実現される。ただし、この時に
は、通常の認識処理に用いるより粗い密度の画素により
分布をとる。例えば、CCDでの読取り能力が8本/ 
m mであり、通常の認識処理でも8本/ m mで行
っていたとすると、上記の検出処理には1本/mmの精
度で行う。粗い画素での処理の方が文字検出に誤りが生
じないので好ましい。
この文字検出では、2軸方向に射影をとるが、−の方向
の射影には切れ目(画素のない領域)があり、しかもそ
の間隔がある一定値以上になっている。この方向を第1
の方向と呼ぶ。他の方向の射影は、切れ目がないか、あ
ったとしてもその間隔が狭い。
ここでは、切れ目のある方向に沿って「行」が構成され
ていると考えられる。よって、上記の切れ目に沿って、
「行」を切出していく。
行を切出したなら、この行を構成する領域の画像に対し
て、第1の方向とは垂直な第2の方向に沿って射影を取
る。これにより、文字のある領域では画素がカウントさ
れ、文字のない領域では画素がカウントされない。この
処理においては、扱う画素密度を行切出し時より精密な
ものにしても良い。上記と同様に、文字の存在の有無が
第2の方向への射影となって表れる。よって、行に対し
て文字の切出しが出来、文字検切が達成される。
文字の検切に引続き、文字認識が行われる。この実施例
では、例えば複合類似度法を用いて文字認識を行なう。
ここまでが、文字検出認識部13での処理であり、文字
検出認識部13からは、rHJ  riJ  rWJ 
 rYJ等の文字についての情報が得られる。
この文字認識の後、単語認識部15にて、文字の組合わ
せである単語の認識が実行される。尚、認識については
、単純に認識結果が得られるのではなく、複数の認識候
補が尤度の高い順に得られ、通常の場合、郵便物上の読
取りにより、複数の単語が認識候補として出力される。
今、説明の都合上、対象の郵便物上の住所中にrxxx
x  HiWAYJとあり、文字認識の結果、rHiW
AYJが単語として抽出されたとする。この単語rHi
WAYJと第1のデータベース17の内容とを比較照合
する。
第1のデータベース17の該当する部分が以下の第1表
のように構成されている。
(以下余白) 第1表 ここで、第1表の左欄の「書状タイプ」とあるのは、略
称であるものを含んでいる。
よって、郵便物から読取った単語がrHiWAY」であ
るから、この単語と第1表に示される第1のデータベー
ス17の「書状タイプ」との比較照合が取られる。この
例では、第1表の第2行目のものが一致するので、まず
、その標準形を認識候補として抽出する。更に、郵便物
に書かれているrHiWAYJを同義語として認識候補
の一つとする。これは、「HiWAYJが「高速道路(
Hi GHWAY)Jである場合の他に、地名である場
合もあるからである。
こうして、2つの認識候補rHiWAYJrHiGHW
AYJが出力され、住所認識部21に送られる。住所認
識部21では第2のデータベース19を利用して認識候
補を一つに絞っていく。具体的には、読取った単語の前
後の単語まで含め、認識候補を一つに決定する。ここで
は、地名であるとして、rxxxx  HiGHWAY
Jが選び出される。
この結果は、出力部23により表示等がなされる。
また、郵便物上に「ロロロロ HWY  XXXX」と
の記載があり、その通りに読取ったとする。
この場合には、rHWYJという単語の認識において、
「HWYJとその標準形であるrHi GHWAYJと
いう単語が認識候補として抽出される。
そして、この両候補が住所認識部21にて最終的に一つ
に絞られる。
[発明の効果] 以上説明したように本発明によれば、単語の標準形と入
力された単語を認識候補とするのでより正確に住所検索
が実行される。
【図面の簡単な説明】
第1図は本発明の一実施例に係る住所認識装置の構成を
示す概略図である。 11・・・入力部 13・・・文字検出認識部 15・・・単語認識部 17・・・第1のデータベース 19・・・第2のデータベース 21・・・住所認識部 23・・・出力部 代コ!人 弁Σ〒士 則

Claims (1)

    【特許請求の範囲】
  1. (1)検索対象を入力する入力手段と、 この入力手段から入力された単語に対し辞書の内容との
    比較を行って認識を実行する手段とを具備する認識方式
    において、 略称が用いられる単語に対してその標準形を前記辞書に
    登録しておき、前記単語の検索に際し前記標準形を出力
    すると共に、前記入力手段から入力された単語を、認識
    候補として出力することを特徴とする住所認識方式。
JP64000114A 1989-01-05 1989-01-05 住所認識方式 Pending JPH02181269A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP64000114A JPH02181269A (ja) 1989-01-05 1989-01-05 住所認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP64000114A JPH02181269A (ja) 1989-01-05 1989-01-05 住所認識方式

Publications (1)

Publication Number Publication Date
JPH02181269A true JPH02181269A (ja) 1990-07-16

Family

ID=11465031

Family Applications (1)

Application Number Title Priority Date Filing Date
JP64000114A Pending JPH02181269A (ja) 1989-01-05 1989-01-05 住所認識方式

Country Status (1)

Country Link
JP (1) JPH02181269A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03150668A (ja) * 1989-11-08 1991-06-27 Fujitsu Ltd 検索システムの入力文字列正規化方式
JPH06231142A (ja) * 1993-01-29 1994-08-19 Toraberu Data:Kk 旅行業用コンピュ−タシステム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03150668A (ja) * 1989-11-08 1991-06-27 Fujitsu Ltd 検索システムの入力文字列正規化方式
JPH06231142A (ja) * 1993-01-29 1994-08-19 Toraberu Data:Kk 旅行業用コンピュ−タシステム

Similar Documents

Publication Publication Date Title
JPS59161786A (ja) 手書き文字の認識方法
JPS60217477A (ja) 手書き文字認識装置
JPH11232291A (ja) 蛋白質立体構造データベース検索方法
JPH02181269A (ja) 住所認識方式
JP3375819B2 (ja) 認識方式複合化方法及びその方法を行う装置
JPH02173886A (ja) 単語認識方式
JP4418726B2 (ja) 文字列探索装置、探索方法およびこの方法のプログラム
JP2685257B2 (ja) 認識方法
JPH0247788B2 (ja)
JPH0728935A (ja) 文書画像処理装置
CN110674367B (zh) 一种基于旅游行业产品的单汉字检索方法及装置
JPH02166586A (ja) 住所検索方式
JP3419425B2 (ja) 認識文字補正装置
JPH02173882A (ja) 住所認識方法
JPH053631B2 (ja)
JPH09171539A (ja) 文字認識装置
JP2878772B2 (ja) 光学的文字読取装置
JP2865443B2 (ja) カナ氏名もしくはカナ法人名表記の漢字変換装置
JPS61133487A (ja) 文字認識装置
JPH04191992A (ja) 情報処理装置
JPS63136286A (ja) オンライン文字認識方式
JPS63138479A (ja) 文字認識装置
JP2977244B2 (ja) 文字認識方法及び文字認識装置
JPS62282385A (ja) 文字識別装置
JPH02181286A (ja) 単語検索方式