JPH06103404A - 名刺認識装置 - Google Patents
名刺認識装置Info
- Publication number
- JPH06103404A JPH06103404A JP4275243A JP27524392A JPH06103404A JP H06103404 A JPH06103404 A JP H06103404A JP 4275243 A JP4275243 A JP 4275243A JP 27524392 A JP27524392 A JP 27524392A JP H06103404 A JPH06103404 A JP H06103404A
- Authority
- JP
- Japan
- Prior art keywords
- address
- character
- telephone number
- business card
- recognition device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Sheet Holders (AREA)
- Character Discrimination (AREA)
- Credit Cards Or The Like (AREA)
Abstract
(57)【要約】 (修正有)
【目的】 名刺から読み取られた住所の誤りを、より正
確に訂正する。 【構成】 住所及び、その住所における電話番号とを関
連付けて記憶している記憶手段、名刺のイメージを読み
取る読取手段としてのイメージスキャナ5、並びにイメ
ージスキャナ5により読み取られた名刺のイメージか
ら、住所及び電話番号を検出する検出手段としての文字
認識装置6を有し、文字認識装置6により検出された電
話番号と一致する電話番号を検索し、その電話番号の関
連付けられた住所に基づいて、文字認識装置6により検
出された住所を訂正する。更に、郵便番号によってより
正確化を図る。
確に訂正する。 【構成】 住所及び、その住所における電話番号とを関
連付けて記憶している記憶手段、名刺のイメージを読み
取る読取手段としてのイメージスキャナ5、並びにイメ
ージスキャナ5により読み取られた名刺のイメージか
ら、住所及び電話番号を検出する検出手段としての文字
認識装置6を有し、文字認識装置6により検出された電
話番号と一致する電話番号を検索し、その電話番号の関
連付けられた住所に基づいて、文字認識装置6により検
出された住所を訂正する。更に、郵便番号によってより
正確化を図る。
Description
【0001】
【産業上の利用分野】本発明は、名刺から読み取られた
住所の誤りを訂正する場合に用いて好適な名刺認識装置
に関する。
住所の誤りを訂正する場合に用いて好適な名刺認識装置
に関する。
【0002】
【従来の技術】従来の名刺認識装置においては、名刺の
イメージを読み取り、そのイメージを文字認識し、名刺
から、例えば名前、住所、電話番号、または郵便番号な
どに対応する文字列を切り出すようになっている。
イメージを読み取り、そのイメージを文字認識し、名刺
から、例えば名前、住所、電話番号、または郵便番号な
どに対応する文字列を切り出すようになっている。
【0003】そして、文字列としての名前、住所、電話
番号、または郵便番号などが、例えばディスクなどの記
録媒体に記録され、データベース化されることにより、
必要に応じて、例えば電話番号の検索などができるよう
になっている。
番号、または郵便番号などが、例えばディスクなどの記
録媒体に記録され、データベース化されることにより、
必要に応じて、例えば電話番号の検索などができるよう
になっている。
【0004】
【発明が解決しようとする課題】ところで、名刺のイメ
ージから、文字数が多く、漢字、ひらがな、カタカナ、
または数字が混在する住所を正確に認識することは、ほ
ぼ数字だけから構成される電話番号や郵便番号を認識す
る場合に比較して、困難であった。
ージから、文字数が多く、漢字、ひらがな、カタカナ、
または数字が混在する住所を正確に認識することは、ほ
ぼ数字だけから構成される電話番号や郵便番号を認識す
る場合に比較して、困難であった。
【0005】そこで、住所と関連のある郵便番号により
住所を訂正する方法がある。即ち、郵便番号により、あ
る程度限定される住所と、文字認識された住所とを比較
し、郵便番号により限定された住所のいずれかに一致す
るように、文字認識された住所を訂正する方法がある。
住所を訂正する方法がある。即ち、郵便番号により、あ
る程度限定される住所と、文字認識された住所とを比較
し、郵便番号により限定された住所のいずれかに一致す
るように、文字認識された住所を訂正する方法がある。
【0006】しかしながら、この方法では、ある程度ま
では住所の誤りを訂正することができるが、それ以上に
正確に誤りを訂正することは困難であった。
では住所の誤りを訂正することができるが、それ以上に
正確に誤りを訂正することは困難であった。
【0007】本発明は、このような状況に鑑みてなされ
たものであり、名刺から読み取られた住所の誤りを、よ
り正確に訂正することができるようにするものである。
たものであり、名刺から読み取られた住所の誤りを、よ
り正確に訂正することができるようにするものである。
【0008】
【課題を解決するための手段】請求項1に記載の名刺認
識装置は、住所と、その住所における電話番号とを関連
付けて記憶している記憶手段としてのRAM13と、名
刺のイメージを読み取る読取手段としてのイメージスキ
ャナ5と、イメージスキャナ5により読み取られた名刺
のイメージから、住所および電話番号を検出する検出手
段としての文字認識装置6と、RAM13から、文字認
識装置6により検出された電話番号と一致する電話番号
を検索し、その電話番号に関連付けられた住所に基づい
て、文字認識装置6により検出された住所を訂正する訂
正手段としてのプログラムの処理ステップS2乃至S9
とを備えることを特徴とする。
識装置は、住所と、その住所における電話番号とを関連
付けて記憶している記憶手段としてのRAM13と、名
刺のイメージを読み取る読取手段としてのイメージスキ
ャナ5と、イメージスキャナ5により読み取られた名刺
のイメージから、住所および電話番号を検出する検出手
段としての文字認識装置6と、RAM13から、文字認
識装置6により検出された電話番号と一致する電話番号
を検索し、その電話番号に関連付けられた住所に基づい
て、文字認識装置6により検出された住所を訂正する訂
正手段としてのプログラムの処理ステップS2乃至S9
とを備えることを特徴とする。
【0009】請求項2に記載の名刺認識装置は、RAM
13に、住所と、その住所における郵便番号とを関連付
けてさらに記憶させておき、文字認識装置6に、名刺の
イメージから、郵便番号をさらに検出させ、プログラム
の処理ステップS2乃至S9に、RAM13から、文字
認識装置6により検出された郵便番号と一致する郵便番
号を検索させ、その郵便番号に関連付けられた住所に基
づいて、文字認識装置6により検出された住所をさらに
訂正させることを特徴とする。
13に、住所と、その住所における郵便番号とを関連付
けてさらに記憶させておき、文字認識装置6に、名刺の
イメージから、郵便番号をさらに検出させ、プログラム
の処理ステップS2乃至S9に、RAM13から、文字
認識装置6により検出された郵便番号と一致する郵便番
号を検索させ、その郵便番号に関連付けられた住所に基
づいて、文字認識装置6により検出された住所をさらに
訂正させることを特徴とする。
【0010】請求項3に記載の名刺認識装置は、RAM
13に、住所、その住所における電話番号、またはその
住所における郵便番号を階層的に記憶させることを特徴
とする。
13に、住所、その住所における電話番号、またはその
住所における郵便番号を階層的に記憶させることを特徴
とする。
【0011】
【作用】上記構成の名刺認識装置においては、RAM1
3に、住所と、その住所における電話番号、または郵便
番号とを関連付けて記憶させておく。そして、名刺のイ
メージを読み取り、そのイメージから、住所、電話番
号、または郵便番号を検出する。さらに、RAM13か
ら、文字認識装置6により検出された電話番号または郵
便番号と一致する電話番号または郵便番号をそれぞれ検
索し、その電話番号または郵便に関連付けられた住所に
基づいて、文字認識装置6により検出された住所を訂正
する。従って、名刺から読み取られた住所の誤りを、よ
り正確に訂正することができる。
3に、住所と、その住所における電話番号、または郵便
番号とを関連付けて記憶させておく。そして、名刺のイ
メージを読み取り、そのイメージから、住所、電話番
号、または郵便番号を検出する。さらに、RAM13か
ら、文字認識装置6により検出された電話番号または郵
便番号と一致する電話番号または郵便番号をそれぞれ検
索し、その電話番号または郵便に関連付けられた住所に
基づいて、文字認識装置6により検出された住所を訂正
する。従って、名刺から読み取られた住所の誤りを、よ
り正確に訂正することができる。
【0012】
【実施例】図1は、本発明の名刺認識装置の一実施例の
構成を示すブロック図であり、図2は、その全体図であ
る。WS(ワークステーション)1は、CPU11、R
OM12、およびRAM13から構成され、インターフ
ェイス14およびイメージボード15が、その拡張スロ
ット(図示せず)に挿入されている。CPU11は、装
置全体を制御するとともに、ROM12に記憶されてい
るシステムプログラム、またはRAM13に記憶された
ユーザプログラムを読み出して実行する。
構成を示すブロック図であり、図2は、その全体図であ
る。WS(ワークステーション)1は、CPU11、R
OM12、およびRAM13から構成され、インターフ
ェイス14およびイメージボード15が、その拡張スロ
ット(図示せず)に挿入されている。CPU11は、装
置全体を制御するとともに、ROM12に記憶されてい
るシステムプログラム、またはRAM13に記憶された
ユーザプログラムを読み出して実行する。
【0013】ROM12には、システムプログラムが記
憶されている。RAM13は、ユーザプログラムを記憶
する他、装置の動作上必要なデータを記憶する。さら
に、RAM13には、図3に示すような住所と、その住
所における郵便番号、および電話番号のうちの、例えば
市外局番とが関連付けられた辞書が記憶されている。
憶されている。RAM13は、ユーザプログラムを記憶
する他、装置の動作上必要なデータを記憶する。さら
に、RAM13には、図3に示すような住所と、その住
所における郵便番号、および電話番号のうちの、例えば
市外局番とが関連付けられた辞書が記憶されている。
【0014】なお、図中、郵便番号の最後に付加された
シンボル「*」は、郵便番号のキーワードを示し、市外
局番の最後に付加されたシンボル「+」は、市外局番の
キーワードを示す。
シンボル「*」は、郵便番号のキーワードを示し、市外
局番の最後に付加されたシンボル「+」は、市外局番の
キーワードを示す。
【0015】また、RAM13には、住所のキーワード
としての、例えば「都」、「道」、「府」、「県」、
「区」、「郡」、「市」、「村」、または「町」、郵便
番号のキーワード「*」、並びに電話番号のキーワード
「+」などからなるキーワードテーブルが記憶されてい
る(図5)。
としての、例えば「都」、「道」、「府」、「県」、
「区」、「郡」、「市」、「村」、または「町」、郵便
番号のキーワード「*」、並びに電話番号のキーワード
「+」などからなるキーワードテーブルが記憶されてい
る(図5)。
【0016】インターフェイス14は、CPU11に代
わって文字認識装置6(インターフェイス22)との入
出力を管理する。イメージボード15は、CPU11に
代わってイメージスキャナ5またはプリンタ7との入出
力を管理する。
わって文字認識装置6(インターフェイス22)との入
出力を管理する。イメージボード15は、CPU11に
代わってイメージスキャナ5またはプリンタ7との入出
力を管理する。
【0017】ディスプレイ2は、WS1より供給される
文字データやグラフィックデータを表示する。キーボー
ド3またはマウス4は、例えばコマンドや装置の動作上
必要なデータを入力する場合に操作される。
文字データやグラフィックデータを表示する。キーボー
ド3またはマウス4は、例えばコマンドや装置の動作上
必要なデータを入力する場合に操作される。
【0018】イメージスキャナ5は、そこにセットされ
た名刺のイメージを読み取り、イメージデータをWS1
(インターフェイス14)に出力する。
た名刺のイメージを読み取り、イメージデータをWS1
(インターフェイス14)に出力する。
【0019】文字認識装置6は、OCR(Optical Char
acter Reader)ボード21およびインターフェイス22
から構成される。OCRボード21は、WS1(RAM
13)より供給される、イメージスキャナ5で読み取ら
れた名刺のイメージデータ(文字データ)を認識する。
インターフェイス22は、文字認識装置6へのデータの
入力、またはそこからのデータの出力を管理する。
acter Reader)ボード21およびインターフェイス22
から構成される。OCRボード21は、WS1(RAM
13)より供給される、イメージスキャナ5で読み取ら
れた名刺のイメージデータ(文字データ)を認識する。
インターフェイス22は、文字認識装置6へのデータの
入力、またはそこからのデータの出力を管理する。
【0020】プリンタ7は、WS1より供給されるプリ
ントデータにしたがって、文字またはグラフィックをプ
リントアウトする。
ントデータにしたがって、文字またはグラフィックをプ
リントアウトする。
【0021】次に、図4のフローチャートを参照して、
その動作について説明する。まず、イメージスキャナ5
に名刺がセットされ、そのイメージが読み取られてイメ
ージデータが生成される。この名刺のイメージデータ
は、イメージボード15を介してWS1のRAM13に
記憶された後、インターフェイス14を介して文字認識
装置6に供給される。
その動作について説明する。まず、イメージスキャナ5
に名刺がセットされ、そのイメージが読み取られてイメ
ージデータが生成される。この名刺のイメージデータ
は、イメージボード15を介してWS1のRAM13に
記憶された後、インターフェイス14を介して文字認識
装置6に供給される。
【0022】文字認識装置6(OCRボード21)にお
いて、その内蔵するメモリ(図示せず)に記憶されてい
る文字パターンが参照され、WS1(RAM13)より
供給された名刺のイメージデータが文字認識される。さ
らに、文字認識装置6において、文字認識されたイメー
ジデータから、郵便番号、電話番号、または住所に対応
する文字列が、それぞれ抽出される。
いて、その内蔵するメモリ(図示せず)に記憶されてい
る文字パターンが参照され、WS1(RAM13)より
供給された名刺のイメージデータが文字認識される。さ
らに、文字認識装置6において、文字認識されたイメー
ジデータから、郵便番号、電話番号、または住所に対応
する文字列が、それぞれ抽出される。
【0023】そして、図4のステップS1において、R
AM13に記憶されている辞書(図3)が、図5に示す
ように展開される。即ち、辞書は、まず住所のキーワー
ド「都」、「道」、「府」、または「県」が最上位の階
層に属する特殊キーワードとされ、それに付く都道府県
名とともに4つのカテゴリに分類される。そして、各特
殊キーワード「都」、「道」、「府」、または「県」の
下位階層には、その都道府県名の下に付く地名(例え
ば、市町村名や区名、郡名など)が、その地名に付くキ
ーワード(例えば「市」、「町」、「村」、「区」、ま
たは「郡」など)とともに階層的に(ツリー構造上に)
展開される。
AM13に記憶されている辞書(図3)が、図5に示す
ように展開される。即ち、辞書は、まず住所のキーワー
ド「都」、「道」、「府」、または「県」が最上位の階
層に属する特殊キーワードとされ、それに付く都道府県
名とともに4つのカテゴリに分類される。そして、各特
殊キーワード「都」、「道」、「府」、または「県」の
下位階層には、その都道府県名の下に付く地名(例え
ば、市町村名や区名、郡名など)が、その地名に付くキ
ーワード(例えば「市」、「町」、「村」、「区」、ま
たは「郡」など)とともに階層的に(ツリー構造上に)
展開される。
【0024】さらに、郵便番号または市外局番は、それ
に対応する住所の下の階層に、キーワード「*」または
「+」とともにそれぞれ展開される。
に対応する住所の下の階層に、キーワード「*」または
「+」とともにそれぞれ展開される。
【0025】なお、1つのカテゴリにおいて、同一の階
層に属するキーワード、または地名は、それぞれ1つの
チェインで結ばれる(例えば図中、東京の下位階層に属
するキーワード「区」、「村」、および「市」は、1つ
のチェインで結ばれている)。また、カテゴリを越えて
キーワードまたは地名の検索ができるように、異なるカ
テゴリにおける同一のキーワード(例えば東京都の下位
階層に属するキーワード「市」と埼玉県の下位階層に属
するキーワード「市」など)も、1つのチェインで結ば
れる。
層に属するキーワード、または地名は、それぞれ1つの
チェインで結ばれる(例えば図中、東京の下位階層に属
するキーワード「区」、「村」、および「市」は、1つ
のチェインで結ばれている)。また、カテゴリを越えて
キーワードまたは地名の検索ができるように、異なるカ
テゴリにおける同一のキーワード(例えば東京都の下位
階層に属するキーワード「市」と埼玉県の下位階層に属
するキーワード「市」など)も、1つのチェインで結ば
れる。
【0026】以上のように展開された辞書におけるキー
ワードのアドレス(ポインタ)は、RAM13における
キーワードテーブルに、キーワードとともに記憶される
(図5)。
ワードのアドレス(ポインタ)は、RAM13における
キーワードテーブルに、キーワードとともに記憶される
(図5)。
【0027】ステップS1における辞書の展開後、ステ
ップS2乃至S4それぞれにおける市外局番の抽出処
理、住所におけるキーワードの切り出し処理、または郵
便番号の抽出処理が並列に行われる。
ップS2乃至S4それぞれにおける市外局番の抽出処
理、住所におけるキーワードの切り出し処理、または郵
便番号の抽出処理が並列に行われる。
【0028】即ち、ステップS2においては、まず文字
認識装置6より出力された名刺の電話番号に対応する文
字列から、電話番号に特有のキーワード(例えば文字列
「TEL」や「Tel」、「電話」、「電話番号」、電
話のマークなど)が除去され、それに漢数字が含まれて
いる場合には、数字(英数字)に変換される。
認識装置6より出力された名刺の電話番号に対応する文
字列から、電話番号に特有のキーワード(例えば文字列
「TEL」や「Tel」、「電話」、「電話番号」、電
話のマークなど)が除去され、それに漢数字が含まれて
いる場合には、数字(英数字)に変換される。
【0029】そして、上述した処理が施された文字列の
最初の文字が数字の「0」である場合、文字列の最初の
文字から、区切り文字「−」もしくは「(」の1つ前の
文字までか、または区切り文字「−」もしくは「(」が
ないときには、文字列の最初の文字から6文字目までが
抽出される。
最初の文字が数字の「0」である場合、文字列の最初の
文字から、区切り文字「−」もしくは「(」の1つ前の
文字までか、または区切り文字「−」もしくは「(」が
ないときには、文字列の最初の文字から6文字目までが
抽出される。
【0030】また、上述した処理が施された文字列の最
初の文字が「(」であり、その次の文字が数字の「0」
である場合、文字列の2番目の文字(数字の「0」)か
ら、区切り文字「)」の1つ前の文字までか、またはま
たは区切り文字「(」がないときには、文字列の最初の
文字から6文字目までが抽出される。
初の文字が「(」であり、その次の文字が数字の「0」
である場合、文字列の2番目の文字(数字の「0」)か
ら、区切り文字「)」の1つ前の文字までか、またはま
たは区切り文字「(」がないときには、文字列の最初の
文字から6文字目までが抽出される。
【0031】以上のようにして、電話番号から市外局番
が抽出され、その最後にキーワード「+」が付加されて
ステップS5に進む。
が抽出され、その最後にキーワード「+」が付加されて
ステップS5に進む。
【0032】なお、上述した処理が施された文字列の最
初の文字が数字の「0」でなく、また「(」でもない場
合、電話番号からの市外局番の抽出は行われない。
初の文字が数字の「0」でなく、また「(」でもない場
合、電話番号からの市外局番の抽出は行われない。
【0033】一方、ステップS3においては、まず文字
認識装置6より出力された名刺の住所に対応する文字列
を構成する各文字と、キーワードテーブルに記憶されて
いるキーワードとがそれぞれ照合され、住所に対応する
文字列から、住所のキーワードおよびその位置(何文字
目か)が検出される。
認識装置6より出力された名刺の住所に対応する文字列
を構成する各文字と、キーワードテーブルに記憶されて
いるキーワードとがそれぞれ照合され、住所に対応する
文字列から、住所のキーワードおよびその位置(何文字
目か)が検出される。
【0034】ここで、住所に対応する文字列から、住所
のキーワードを検出することができなかった場合、例え
ば10個だけあらかじめ用意された、その文字列を構成
する各文字に対する候補文字(各文字に類似した文字)
と、キーワードテーブルに記憶されているキーワードと
がそれぞれ照合される。なお、候補文字からもキーワー
ドが検出されなかった場合には、処理を中止する。
のキーワードを検出することができなかった場合、例え
ば10個だけあらかじめ用意された、その文字列を構成
する各文字に対する候補文字(各文字に類似した文字)
と、キーワードテーブルに記憶されているキーワードと
がそれぞれ照合される。なお、候補文字からもキーワー
ドが検出されなかった場合には、処理を中止する。
【0035】住所に対応する文字列から、住所のキーワ
ードおよびその位置が検出された後、その文字列から住
所検索用の文字列が切り出される。
ードおよびその位置が検出された後、その文字列から住
所検索用の文字列が切り出される。
【0036】即ち、住所に対応する文字列の先頭から、
その文字列の一番前に位置する住所のキーワードまでが
切り出され、さらにその切り出された文字列から、その
先頭の文字を除いた文字列が、住所のキーワードの文字
が1つになるまで順次切り出される。
その文字列の一番前に位置する住所のキーワードまでが
切り出され、さらにその切り出された文字列から、その
先頭の文字を除いた文字列が、住所のキーワードの文字
が1つになるまで順次切り出される。
【0037】以上の処理が、住所に対応する文字列の2
番目以降に位置する住所のキーワードに関しても順次行
われ、住所検索用の文字列が切り出されてステップS6
に進む。
番目以降に位置する住所のキーワードに関しても順次行
われ、住所検索用の文字列が切り出されてステップS6
に進む。
【0038】即ち、文字認識装置6より出力された住所
に対応する文字列が、例えば「束京都葛飾区柴又3−1
9−3」である場合(正確な住所は、「東京都葛飾区柴
又3−19−3」であるが、文字認識装置6において、
先頭の文字「東」が、文字「束」に誤認識されたものと
する)、ステップS3においては、まずこの文字列から
住所のキーワード「都」および「区」が検出され、住所
に対応する文字列から、このキーワードを基に、住所検
索用の文字列(検索文字列) 「束京都」 「京都」 「束京都葛飾区」 「京都葛飾区」 「都葛飾区」 「葛飾区」 「飾区」 が切り出されることになる。
に対応する文字列が、例えば「束京都葛飾区柴又3−1
9−3」である場合(正確な住所は、「東京都葛飾区柴
又3−19−3」であるが、文字認識装置6において、
先頭の文字「東」が、文字「束」に誤認識されたものと
する)、ステップS3においては、まずこの文字列から
住所のキーワード「都」および「区」が検出され、住所
に対応する文字列から、このキーワードを基に、住所検
索用の文字列(検索文字列) 「束京都」 「京都」 「束京都葛飾区」 「京都葛飾区」 「都葛飾区」 「葛飾区」 「飾区」 が切り出されることになる。
【0039】同時に、ステップS4においては、文字認
識装置6より出力された名刺の郵便番号に対応する文字
列の最後に、郵便番号のキーワード「*」が付加され、
ステップS7に進む。
識装置6より出力された名刺の郵便番号に対応する文字
列の最後に、郵便番号のキーワード「*」が付加され、
ステップS7に進む。
【0040】以上のようにして、ステップS2乃至S4
における処理が並列に行われた後、ステップS5乃至S
7に進み、市外局番、検索文字列、または郵便番号を基
に、ステップS1で展開された辞書から住所が、それぞ
れ選出される。
における処理が並列に行われた後、ステップS5乃至S
7に進み、市外局番、検索文字列、または郵便番号を基
に、ステップS1で展開された辞書から住所が、それぞ
れ選出される。
【0041】即ち、ステップS5においては、まずステ
ップS2で抽出された市外局番の最後に付加されたキー
ワード「+」が、キーワードテーブルから検出され、さ
らにそこから、そのキーワード「+」の、辞書(図5)
に記憶されているアドレスが読み出される。そして、辞
書から、そのアドレスに基づいて、キーワード「+」と
ともに記憶されている市外局番が読み出され、ステップ
S2で抽出された市外局番と照合される。
ップS2で抽出された市外局番の最後に付加されたキー
ワード「+」が、キーワードテーブルから検出され、さ
らにそこから、そのキーワード「+」の、辞書(図5)
に記憶されているアドレスが読み出される。そして、辞
書から、そのアドレスに基づいて、キーワード「+」と
ともに記憶されている市外局番が読み出され、ステップ
S2で抽出された市外局番と照合される。
【0042】照合の結果、ステップS2で抽出された市
外局番と一致する(マッチングする)市外局番が、辞書
に記憶されていた場合、その市外局番の階層と結ばれた
上位の階層に属する住所(地名)が読み出され、候補住
所(正確な住所の候補)として、RAM13に確保され
た所定の領域に記憶されてステップS8に進む。
外局番と一致する(マッチングする)市外局番が、辞書
に記憶されていた場合、その市外局番の階層と結ばれた
上位の階層に属する住所(地名)が読み出され、候補住
所(正確な住所の候補)として、RAM13に確保され
た所定の領域に記憶されてステップS8に進む。
【0043】なお、ステップS2で抽出された市外局番
と一致する(マッチングする)市外局番が辞書に記憶さ
れていなかった場合、例えば10個だけあらかじめ用意
された、ステップS2で抽出された市外局番としての各
文字(各数字)に対する候補文字(各文字に類似した文
字)と、辞書に記憶されている市外局番を構成する各文
字とをそれぞれ照合することにより、ステップS2で抽
出された市外局番と、辞書に記憶されている市外局番と
のマッチングが行われる。
と一致する(マッチングする)市外局番が辞書に記憶さ
れていなかった場合、例えば10個だけあらかじめ用意
された、ステップS2で抽出された市外局番としての各
文字(各数字)に対する候補文字(各文字に類似した文
字)と、辞書に記憶されている市外局番を構成する各文
字とをそれぞれ照合することにより、ステップS2で抽
出された市外局番と、辞書に記憶されている市外局番と
のマッチングが行われる。
【0044】一方、ステップS6では、まずステップS
3で切り出された検索文字列の最後の文字、即ち住所の
キーワードが、キーワードテーブルから検出され、さら
にそこから、そのキーワードの、辞書(図5)に記憶さ
れているアドレスが読み出される。そして、辞書から、
そのアドレスに基づいて、住所のキーワードとともに記
憶されている地名(都道府県名も含む)が読み出され、
ステップS3で切り出された検索文字列の最後の文字
(住所のキーワード)を除いた文字列と照合される。
3で切り出された検索文字列の最後の文字、即ち住所の
キーワードが、キーワードテーブルから検出され、さら
にそこから、そのキーワードの、辞書(図5)に記憶さ
れているアドレスが読み出される。そして、辞書から、
そのアドレスに基づいて、住所のキーワードとともに記
憶されている地名(都道府県名も含む)が読み出され、
ステップS3で切り出された検索文字列の最後の文字
(住所のキーワード)を除いた文字列と照合される。
【0045】照合の結果、ステップS3で切り出された
検索文字列の最後の文字(住所のキーワード)を除いた
文字列と一致する(マッチングする)地名が、辞書に記
憶されていた場合、その地名の階層と結ばれた上位およ
び下位の階層に属する地名がすべて読み出され、これら
の地名を組み合わせた住所が、候補住所(正確な住所の
候補)として、RAM13に確保された所定の領域に記
憶されてステップS8に進む。
検索文字列の最後の文字(住所のキーワード)を除いた
文字列と一致する(マッチングする)地名が、辞書に記
憶されていた場合、その地名の階層と結ばれた上位およ
び下位の階層に属する地名がすべて読み出され、これら
の地名を組み合わせた住所が、候補住所(正確な住所の
候補)として、RAM13に確保された所定の領域に記
憶されてステップS8に進む。
【0046】即ち、例えば検索文字列が、「葛飾区」で
ある場合、この文字列の最後の文字(住所のキーワー
ド)「区」を除いた文字列「葛飾」と一致する(マッチ
ングする)地名「葛飾」の階層と結ばれた上位および下
位の階層に属する地名(住所)(図6において、影を付
してある部分)がすべて読み出され、これらの地名を組
み合わせた住所が、候補住所(正確な住所の候補)とし
て、RAM13に確保された所定の領域に記憶される。
ある場合、この文字列の最後の文字(住所のキーワー
ド)「区」を除いた文字列「葛飾」と一致する(マッチ
ングする)地名「葛飾」の階層と結ばれた上位および下
位の階層に属する地名(住所)(図6において、影を付
してある部分)がすべて読み出され、これらの地名を組
み合わせた住所が、候補住所(正確な住所の候補)とし
て、RAM13に確保された所定の領域に記憶される。
【0047】なお、ステップS5における場合と同様
に、このステップS6においても、ステップS3で切り
出された検索文字列の最後の文字(住所のキーワード)
を除いた文字列と一致する(マッチングする)地名が辞
書に記憶されていなかった場合、例えば10個だけあら
かじめ用意された、ステップS3で切り出された検索文
字列の最後の文字(住所のキーワード)を除いた文字列
を構成する各文字に対する候補文字(各文字に類似した
文字)と、辞書に記憶されている地名を構成する各文字
とをそれぞれ照合することにより、ステップS3で切り
出された検索文字列の最後の文字(住所のキーワード)
を除いた文字列と、辞書に記憶されている地名とのマッ
チングが行われる。
に、このステップS6においても、ステップS3で切り
出された検索文字列の最後の文字(住所のキーワード)
を除いた文字列と一致する(マッチングする)地名が辞
書に記憶されていなかった場合、例えば10個だけあら
かじめ用意された、ステップS3で切り出された検索文
字列の最後の文字(住所のキーワード)を除いた文字列
を構成する各文字に対する候補文字(各文字に類似した
文字)と、辞書に記憶されている地名を構成する各文字
とをそれぞれ照合することにより、ステップS3で切り
出された検索文字列の最後の文字(住所のキーワード)
を除いた文字列と、辞書に記憶されている地名とのマッ
チングが行われる。
【0048】同時に、ステップS7においては、まずス
テップS4で抽出された郵便番号の最後に付加されたキ
ーワード「*」が、キーワードテーブルから検出され、
さらにそこから、そのキーワード「*」の辞書(図5)
に記憶されているアドレスが読み出される。そして、辞
書から、そのアドレスに基づいて、キーワード「*」と
ともに記憶されている郵便番号が読み出され、ステップ
S4で抽出された郵便番号と照合される。
テップS4で抽出された郵便番号の最後に付加されたキ
ーワード「*」が、キーワードテーブルから検出され、
さらにそこから、そのキーワード「*」の辞書(図5)
に記憶されているアドレスが読み出される。そして、辞
書から、そのアドレスに基づいて、キーワード「*」と
ともに記憶されている郵便番号が読み出され、ステップ
S4で抽出された郵便番号と照合される。
【0049】照合の結果、ステップS4で抽出された郵
便番号と一致する(マッチングする)郵便番号が、辞書
に記憶されていた場合、その郵便番号の階層と結ばれた
上位の階層に属する住所(地名)が読み出され、候補住
所(正確な住所の候補)として、RAM13に確保され
た所定の領域に記憶されてステップS8に進む。
便番号と一致する(マッチングする)郵便番号が、辞書
に記憶されていた場合、その郵便番号の階層と結ばれた
上位の階層に属する住所(地名)が読み出され、候補住
所(正確な住所の候補)として、RAM13に確保され
た所定の領域に記憶されてステップS8に進む。
【0050】なお、ステップS5における場合と同様
に、このステップS7においても、ステップS4で抽出
された郵便番号と一致する(マッチングする)郵便番号
が辞書に記憶されていなかった場合、例えば10個だけ
あらかじめ用意された、ステップS4で抽出された郵便
番号としての各文字(各数字)に対する候補文字(各文
字に類似した文字)と、辞書に記憶されている郵便番号
を構成する各文字とをそれぞれ照合することにより、ス
テップS4で抽出された郵便番号と、辞書に記憶されて
いる郵便番号とのマッチングが行われる。
に、このステップS7においても、ステップS4で抽出
された郵便番号と一致する(マッチングする)郵便番号
が辞書に記憶されていなかった場合、例えば10個だけ
あらかじめ用意された、ステップS4で抽出された郵便
番号としての各文字(各数字)に対する候補文字(各文
字に類似した文字)と、辞書に記憶されている郵便番号
を構成する各文字とをそれぞれ照合することにより、ス
テップS4で抽出された郵便番号と、辞書に記憶されて
いる郵便番号とのマッチングが行われる。
【0051】以上のようにして、ステップS5乃至S7
では、候補住所の選出が行われる。なお、ステップS5
乃至S7で候補住所が重複して選出された場合には、そ
の候補住所は、例えば最初に選出されたものを除き、削
除(無視)される。
では、候補住所の選出が行われる。なお、ステップS5
乃至S7で候補住所が重複して選出された場合には、そ
の候補住所は、例えば最初に選出されたものを除き、削
除(無視)される。
【0052】そして、ステップS8に進み、RAM13
に記憶された候補住所すべてと、文字認識装置6より出
力された住所に対応する文字列とがそれぞれ照合され、
その中から、文字認識装置6より出力された住所に対応
するものが決定される。
に記憶された候補住所すべてと、文字認識装置6より出
力された住所に対応する文字列とがそれぞれ照合され、
その中から、文字認識装置6より出力された住所に対応
するものが決定される。
【0053】即ち、ステップS8においては、RAM1
3に記憶された候補住所を構成する各文字と、文字認識
装置6より出力された住所に対応する文字列を構成する
各文字とが、先頭から順次照合され、一致する(マッチ
ングする)か否かが判定される。そして、RAM13に
記憶された各候補住所に対して、次式で定義される正解
率p p=(一致したと判定された文字数)/(照合された文
字数) が算出される。
3に記憶された候補住所を構成する各文字と、文字認識
装置6より出力された住所に対応する文字列を構成する
各文字とが、先頭から順次照合され、一致する(マッチ
ングする)か否かが判定される。そして、RAM13に
記憶された各候補住所に対して、次式で定義される正解
率p p=(一致したと判定された文字数)/(照合された文
字数) が算出される。
【0054】ここで、文字認識装置6より出力された住
所に対応する文字列には、そこにおける処理過程におい
て、その先頭部分に、真の(正確な)住所に無関係な文
字または文字列が誤って付加されている場合や、またそ
の先頭部分で、真の(正確な)住所に対応する文字また
は文字列が誤って削除されている場合が考えられる。
所に対応する文字列には、そこにおける処理過程におい
て、その先頭部分に、真の(正確な)住所に無関係な文
字または文字列が誤って付加されている場合や、またそ
の先頭部分で、真の(正確な)住所に対応する文字また
は文字列が誤って削除されている場合が考えられる。
【0055】従って、文字認識装置6より出力された住
所に対応する文字列と、候補住所とを、各先頭の文字か
ら順次照合した場合、正確な正解率pが得られないとき
がある。
所に対応する文字列と、候補住所とを、各先頭の文字か
ら順次照合した場合、正確な正解率pが得られないとき
がある。
【0056】そこで、RAM13に記憶された候補住所
の文字列を、その先頭の文字から1文字ずつ削除しなが
ら、文字認識装置6より出力された住所に対応する文字
列との照合が行われるとともに、文字認識装置6より出
力された住所に対応する文字列を、その先頭の文字から
1文字ずつ削除しながら、RAM13に記憶された候補
住所の文字列との照合が行われ、正解率pが算出され
る。
の文字列を、その先頭の文字から1文字ずつ削除しなが
ら、文字認識装置6より出力された住所に対応する文字
列との照合が行われるとともに、文字認識装置6より出
力された住所に対応する文字列を、その先頭の文字から
1文字ずつ削除しながら、RAM13に記憶された候補
住所の文字列との照合が行われ、正解率pが算出され
る。
【0057】そして、正解率pの最大値をpmaxとした
場合、(pmax−C)以上の正解率pが算出された候補
住所のうち、文字数の一番大きいものが検出され、ステ
ップS9に進む。
場合、(pmax−C)以上の正解率pが算出された候補
住所のうち、文字数の一番大きいものが検出され、ステ
ップS9に進む。
【0058】なお、Cは、統計的手法によりあらかじめ
求められた、例えば0.135などの所定の係数であ
る。
求められた、例えば0.135などの所定の係数であ
る。
【0059】ステップS9において、文字認識装置6よ
り出力された住所が、ステップS8で検出された候補住
所により訂正され、処理を終了する。
り出力された住所が、ステップS8で検出された候補住
所により訂正され、処理を終了する。
【0060】以上の処理により、文字認識装置6より出
力された住所に対応する文字列が、例えば「束京都葛飾
区柴又3−19−3」である場合、その先頭の文字
「束」が、文字「東」に訂正され、正確な住所「東京都
葛飾区柴又3−19−3」が出力される。
力された住所に対応する文字列が、例えば「束京都葛飾
区柴又3−19−3」である場合、その先頭の文字
「束」が、文字「東」に訂正され、正確な住所「東京都
葛飾区柴又3−19−3」が出力される。
【0061】そして、訂正された住所は、例えば磁気デ
ィスク(図示せず)などに記録され、データベースとし
て利用される。
ィスク(図示せず)などに記録され、データベースとし
て利用される。
【0062】なお、本実施例においては、電話番号のう
ちの市外局番と住所を関連付けておくようにしたが、市
外局番だけでなく、市内局番も住所と関連付けておくよ
うにすることができる。
ちの市外局番と住所を関連付けておくようにしたが、市
外局番だけでなく、市内局番も住所と関連付けておくよ
うにすることができる。
【0063】
【発明の効果】以上のように、本発明の名刺認識装置に
よれば、記憶手段に、住所と、その住所における電話番
号、または郵便番号とを関連付けて記憶させておく。そ
して、名刺のイメージを読み取り、そのイメージから、
住所、電話番号、または郵便番号を検出する。さらに、
記憶手段から、検出手段により検出された電話番号また
は郵便番号と一致する電話番号または郵便番号それぞれ
を検索し、その電話番号または郵便に関連付けられた住
所に基づいて、検出手段により検出された住所を訂正す
る。従って、名刺から読み取られた住所の誤りを、より
正確に訂正することができる。
よれば、記憶手段に、住所と、その住所における電話番
号、または郵便番号とを関連付けて記憶させておく。そ
して、名刺のイメージを読み取り、そのイメージから、
住所、電話番号、または郵便番号を検出する。さらに、
記憶手段から、検出手段により検出された電話番号また
は郵便番号と一致する電話番号または郵便番号それぞれ
を検索し、その電話番号または郵便に関連付けられた住
所に基づいて、検出手段により検出された住所を訂正す
る。従って、名刺から読み取られた住所の誤りを、より
正確に訂正することができる。
【図1】本発明の名刺認識装置の一実施例の構成を示す
ブロック図である。
ブロック図である。
【図2】図1の実施例の全体図である。
【図3】住所と、その住所における郵便番号、および市
外局番とが関連付けられた辞書を示す図である。
外局番とが関連付けられた辞書を示す図である。
【図4】図1の実施例の動作を説明するためのフローチ
ャートである。
ャートである。
【図5】図3の辞書が階層構造に展開された様子を示す
図である。
図である。
【図6】図4のフローチャートのステップS6における
住所の選出を説明するための図である。
住所の選出を説明するための図である。
1 WS(ワークステーション) 2 ディスプレイ 3 キーボード 4 マウス 5 イメージスキャナ 6 文字認識装置 7 プリンタ 11 CPU 12 ROM 13 RAM 14 インターフェイス 15 イメージボード 21 OCR(Optical Character Reader)ボード 22 インターフェイス
Claims (3)
- 【請求項1】 住所と、前記住所における電話番号とを
関連付けて記憶している記憶手段と、名刺のイメージを
読み取る読取手段と、 前記読取手段により読み取られた名刺のイメージから、
住所および電話番号を検出する検出手段と、 前記記憶手段から、前記検出手段により検出された電話
番号と一致する電話番号を検索し、前記電話番号に関連
付けられた前記住所に基づいて、前記検出手段により検
出された住所を訂正する訂正手段とを備えることを特徴
とする名刺認識装置。 - 【請求項2】 前記記憶手段は、前記住所と、前記住所
における郵便番号とを関連付けてさらに記憶しており、 前記検出手段は、前記名刺のイメージから、郵便番号を
さらに検出し、 前記訂正手段は、前記記憶手段から、前記検出手段によ
り検出された郵便番号と一致する郵便番号を検索し、前
記郵便番号に関連付けられた前記住所に基づいて、前記
検出手段により検出された住所をさらに訂正することを
特徴とする請求項1に記載の名刺認識装置。 - 【請求項3】 前記記憶手段は、前記住所、前記住所に
おける電話番号、または前記住所における郵便番号を階
層的に記憶することを特徴とする請求項2に記載の名刺
認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4275243A JPH06103404A (ja) | 1992-09-18 | 1992-09-18 | 名刺認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4275243A JPH06103404A (ja) | 1992-09-18 | 1992-09-18 | 名刺認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH06103404A true JPH06103404A (ja) | 1994-04-15 |
Family
ID=17552695
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4275243A Pending JPH06103404A (ja) | 1992-09-18 | 1992-09-18 | 名刺認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH06103404A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0997312A (ja) * | 1995-09-29 | 1997-04-08 | Fujitsu Ltd | 認識文字補正装置およびデータベース検索装置 |
-
1992
- 1992-09-18 JP JP4275243A patent/JPH06103404A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0997312A (ja) * | 1995-09-29 | 1997-04-08 | Fujitsu Ltd | 認識文字補正装置およびデータベース検索装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2968145B2 (ja) | 高度なデータ収集方法及びデータ処理システム | |
| JP2726568B2 (ja) | 文字認識方法及び装置 | |
| US7693853B2 (en) | Method and apparatus for retrieving data representing a postal address from a plurality of postal addresses | |
| US7769778B2 (en) | Systems and methods for validating an address | |
| JP3425408B2 (ja) | 文書読取装置 | |
| JPH10207988A (ja) | 文字認識方法および文字認識装置 | |
| JPH0684006A (ja) | オンライン手書き文字認識方法 | |
| WO2009005492A1 (en) | Systems and methods for validating an address | |
| JPH07152774A (ja) | 文書検索方法および装置 | |
| JPH06103404A (ja) | 名刺認識装置 | |
| JPH06124366A (ja) | 住所読取装置 | |
| JP4054453B2 (ja) | 文字認識装置およびプログラム記録媒体 | |
| JP4584507B2 (ja) | 住所認識装置、記録媒体及びプログラム | |
| JP3361258B2 (ja) | 文字読取装置 | |
| JP2655087B2 (ja) | 文字認識後処理方式 | |
| JP2003296354A (ja) | 辞書作成装置 | |
| Jiang et al. | A suffix tree based handwritten Chinese address recognition system | |
| JPH07271920A (ja) | 文字認識装置 | |
| JPH06223121A (ja) | 情報検索装置 | |
| JPH06103402A (ja) | 名刺認識装置 | |
| JP2922365B2 (ja) | Ocr処理システムにおける漢字住所データ処理方法 | |
| JPH07319890A (ja) | 文書登録検索システム | |
| JPH08241314A (ja) | 文書ファイリングシステム | |
| JPH0256086A (ja) | 文字認識の後処理方法 | |
| JP2795003B2 (ja) | 文字認識処理装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20010907 |