JPH04320573A - 文字データ分類装置 - Google Patents

文字データ分類装置

Info

Publication number
JPH04320573A
JPH04320573A JP3088622A JP8862291A JPH04320573A JP H04320573 A JPH04320573 A JP H04320573A JP 3088622 A JP3088622 A JP 3088622A JP 8862291 A JP8862291 A JP 8862291A JP H04320573 A JPH04320573 A JP H04320573A
Authority
JP
Japan
Prior art keywords
character data
card
keyword
data
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3088622A
Other languages
English (en)
Inventor
Michihiko Kawazoe
川添 三千彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP3088622A priority Critical patent/JPH04320573A/ja
Publication of JPH04320573A publication Critical patent/JPH04320573A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、名刺等のカードに記載
された文字データを読取り、その読取りデータを自動的
に分類する文字データ分類装置に関する。
【0002】
【従来の技術】従来、名刺等のカードに記載された文字
データを読取り、自動的に分類する装置には、そのカー
ドにバーコード等の分類情報を文字データと共に印刷し
ておき、その分類情報を文字データと共に読取り、その
分類情報を基に読取りデータを分類するものがある。
【0003】
【発明が解決しようとする課題】しかし、このような従
来の分類装置では、カードにバーコード等の分類情報を
印刷しなければならず、その分だけコストがかかるだけ
でなく、見栄えが悪くなるという問題がある。
【0004】特に、名刺の場合には、各会社毎に予め上
記のようなバーコード等の分類情報を名刺に印字するこ
とは現実的にも不可能でもある。
【0005】そこで、本発明は上記問題に鑑みなされた
もので、カードにバーコード等の分類情報を印字するこ
となく、カード上に記載された文字データを自動的に分
類し、コストの低減およびカードの見栄えの悪化を防止
した文字データ分類装置を提供することを目的とする。
【0006】
【課題を解決するための手段】上記目的を達成するため
本発明は、名刺等のカード上に記載された文字データを
読取り、その読取りデータを分類する文字データ分類装
置において、上記カード上における文字データの記載様
式をその文字データ中の所定のキーワードと対応させた
データベースを予め設け、文字データの読取り後は、そ
の読取りデータのキーワードを認識してそのキーワード
に対応した上記記載様式を上記データベースから取り出
し、この記載様式に基づき上記読取りデータを分類する
ことを特徴とする。
【0007】
【作用】上記構成では、予めカード上における文字デー
タの記載様式をその文字データ中のキーワードと対応さ
せたデータベースが設けられており、文字データの読取
り後は、その読取りデータから所定のキーワードを認識
し、そのキーワードに基づいた文字データの記載様式を
上記データベースから取り出し、この記載様式に基づい
て読取りデータを分類するので、カードにバーコード等
の分類情報を印字する必要がなくなる。
【0008】
【実施例】以下、この発明に係る文字データ分類装置の
一実施例を図面に基づいて説明する。
【0009】図1は文字データ分類装置の実施例と、名
刺搬送装置の一例との構成を示している。
【0010】文字データ分類装置5はパーソナルコンピ
ュータ(以下、パソコンという)により構成され、CP
U11、ROM12、RAM13および入出力インタフ
ェース(I/F)14を備えてこれらを内部バス15に
より接続しているパソコン本体6と、入出力インタフェ
ース14を介して接続されるOCR等の読取り部3、キ
ーボードおよびマウス等の入力装置7、ディスプレイ装
置(CRT)8、プリンタ9、磁気ディスク装置10等
の周辺装置とが設けられている。なお、読取り部3と入
出力インタフェース14とはRS 232C 等のケー
ブル4を介して接続されており、読取り部3で読取られ
た文字データがこのケーブル4を介して文字データ分類
装置5のパソコン本体6に読取りデータとして入力する
【0011】そして、ROM12にはCPU11で実行
される例えば文字読取りや、パターンマッチング等の文
字認識処理のための各種システムプログラムの他に、本
発明に係る文字データ分類処理のためのシステムプログ
ラム、つまりCPU11が読取りデータから所定のキー
ワードを認識し、そのキーワードに基づいた文字データ
の記載様式をデータベースから取り出し、この記載様式
に基づいて上記読取りデータを分類するように動作する
ためのプログラムが格納されている。
【0012】また、RAM13あるいは磁気ディスク装
置10には、パターンマッチングのための各文字につい
ての標準パターン、および少なくともキーワード全体の
文字列のパターンが格納されたデータベースと、会社毎
つまり名刺1毎のキーワードとその名刺1毎の文字デー
タの記載様式、つまり名刺1毎に予め定められている「
部課名」や、「名前」、「住所」、「電話番号」等の文
字データの名刺1上における配置とを対応させたデータ
ベースとが予め格納されており、磁気ディスク装置10
にそれらのデータベースが格納されている場合には、キ
ーワードを識別する前にそのデータベースをいったんR
AM13に格納する。なお、名刺1毎のキーワードとし
ては、通常、各会社毎に名刺の記載様式と共に、「会社
名」や、「社章」の形態あるいは形状が決まっているの
で、この「会社名」や「社章」を用いる。
【0013】また、名刺搬送装置2は、名刺1が自動的
に一枚ずつ順次送られ、その送られた名刺1上に印字さ
れた文字データである「社名」や、「氏名」、「電話番
号」等の漢字や数字等の文字が文字データ分類装置5の
読取り部3で読取られるように、モータ21、ローラ2
2、名刺抑えバネ23等が設けられている。
【0014】次に、以上のように構成された文字データ
分類装置および名刺搬送装置による文字データ分類処理
を図2および図3のフロ−チャ−トを参照して説明する
【0015】まずは、図1に示すように、名刺搬送装置
2において名刺1が一枚ずつ送られ(ステップ100)
、この名刺1上から読取り部3が文字データを読み取り
(ステップ110)、その読取りデータをケーブル4を
介して本装置のパソコン本体6に転送し(ステップ12
0)、パソコン本体6では送られてきた読取りデータの
認識・分類処理を行う(ステップ130)。
【0016】このステップ130の詳細な処理は図3に
示されており、まずはCPU11がパターンマッチング
等の手法により文字認識処理を行い(ステップ210)
、各読取りデータを認識できれば、つまり認識率が所定
値以上あれば(ステップ220“Yes”)、キーワー
ドの検出・識別を行う(ステップ230)。キーワード
の検出・識別は、CPU11がその文字認識後に、読取
りデータのパターンとRAM13に格納されたキーワー
ド全体の文字列のパターンとを照合することにより行う
【0017】また、各読取りデータが認識不可、つまり
認識率が所定値以上ない場合には(ステップ220“N
o ”)、名刺の縦書き・横書きの違いにより認識不可
であったと考えられるので、読取りデータを90度回転
させ(ステップ270)、読取りデータの再認識および
認識できるかの判断を行う(ステップ210,220)
。このステップ270,210,220を少なくとも読
取りデータが一回転するまで行えば、パターンとして登
録されてない文字データが多くないかぎりは、必ず文字
データが認識される。なお、読取りデータを90度回転
させる方法は、例えばパターンマッチングの読取りデー
タ、つまり二値化された読取りデータの場合には、各“
行”の要素をそれぞれに対応する各“列”の要素に変換
するなどの方法により行えば良い。
【0018】そして、上記ステップ230にてキーワー
ドの検出・識別を行った際、キーワードが検出・識別で
きた場合(ステップ240“Yes”)、つまりそのキ
ーワードが入力済みである場合には、そのキーワードに
対応して予め登録されている記載様式、つまり名刺毎に
予め定められている「部課名」や「名前」等の文字デー
タの名刺上における配置により、名刺上の各文字データ
が分類されて、分類後の文字データが例えば図4に示す
ようにCRT8上に表示される(ステップ250)。こ
れによれば、例えば、上記ステップ210の文字認識後
、各読取りデータについてその文字列が所定意味をなす
か否かを、例えばデータベースに格納しておいた所定意
味をなす情報(熟語)と照合し分類する必要はなくなる
【0019】一方、上記ステップ240においてキーワ
ードが識別できない場合(ステップ230“No ”)
、つまりそのキーワードが入力済みでなかった場合には
、CPU11の指令によりCRT8の画面上にキーワー
ドが識別できないというメッセージが読取りデータと共
に表示され、オペレータはその画面を観察しながらその
名刺上における文字データの記載様式とそのキーワード
とを入力し、この記載様式とキーワードとを対応させて
RAM13中のデータベースに記憶させる(ステップ2
80)。これにより、次回からは、その名刺と同一記載
様式、すなわち同一会社の名刺のキーワードを検出・識
別した場合(ステップ230)には、RAM13中のデ
ータベースに登録されているそのキーワードと、それに
対応した記載様式とにより、キーワードの識別ができ(
ステップ240“Yes”)、その入力済みの記載様式
にしたがって「名前」や「電話番号」等の文字データが
自動的に分類される(ステップ250)。ここまでが、
ステップ130の処理である。
【0020】次に、図2に戻り、分類された文字データ
が例えば図4に示すようにCRT8画面上に表示されて
いるので、オペレータはそれを観察しながらその画面上
でデータの修正あるいは追加がある場合にはそれを行い
、オペレータの操作によりCPU11が分類・修正後の
文字データをRAM13に一時保存する(ステップ14
0)。なお、このステップ140のデータ修正は必ずし
も必要なものではなく、修正・追加を行わないようにし
ても構わない。
【0021】続いて、CPU11は現在分類処理を行っ
た名刺が最後であるか否かを判断し(ステップ150)
、その名刺が最後であると判断した場合には(ステップ
160“Yes”)、今までRAM13に一時的に記憶
されていた文字データを一括して、外部記憶装置の磁気
ディスク装置10に記憶する(ステップ160)。一方
、分類した名刺が最後のものでないと判断された場合に
は(ステップ150“No ”)、上記ステップ100
〜170までの上記各処理を名刺が最後になるまで繰り
返す。
【0022】従って、本実施例によれば、文字データの
読取り後は、その読取りデータからキーワードが認識さ
れて、そのキーワードに基づいた文字データの記載様式
がデータベースから取り出され、この記載様式に基づい
て読取りデータが分類されるので、名刺にバーコードや
分類情報を印字することなくそのカードに記載された文
字データが自動的に分類されて、コストの低減およびカ
ードの見栄えの悪化を防止できる。
【0023】尚、図4では分類処理後の文字データのC
RT8画面上における表示例を示しているが、画面上部
のA欄には現在実行中の処理、例えば文字データの「読
込み」、「認識」、「保存」等の処理が表示される一方
、図3におけるステップ240においてキーワードが識
別でき、読取りデータを分類できた場合には、画面中央
に例えば「技術本部」、「システム××研究所」、「第
×研究室」、・・・、「住所」、「電話番号(TEL)
」等の分類処理結果が箇条書きに表示されると共に、そ
れらの各右側にそれぞれの認識結果(例えば、「認識O
K」、「認識NO」)と共に数行にわたり表示される。
【0024】また、キーワードが識別できなかった場合
には、画面中央に読取りデータが分類されずにそのまま
表示されると共に、画面下部のB欄に図4に示す通り「
分類できないフォーマットです。一行目の区別を指定し
て下さい。」等のキーワードが識別できない場合のオペ
レータへのメッセージが表示される。このようなメッセ
ージや、上記「認識NO」が画面上に表示された場合に
は、画面中央に表示されたデータの分類作業や、認識で
きなかった文字データの修正を、キーワード7aおよび
マウス7bを用いて行う。
【0025】また、図3にけるステップ220にて文字
認識不可と判断された場合には、ステップ270で読取
りデータを90度回転させて、再度ステップ210で文
字認識を行うようにして説明したが、例えば、文字デー
タ読取り時の読取方向を縦横変えるようにして、縦書き
と横書きの違いに対処できるようにし、この処理の次に
図2におけるステップ110の文字データの読取り処理
に戻るようにしても良い。
【0026】さらに、本実施例では名刺について説明し
たが、本発明では名刺に限らず、図書カードや、診察券
などの一般の文書が記載されたカード等でも勿論よい。
【0027】
【発明の効果】以上説明してきたように、本発明では、
予め名刺等のカード上における文字データの記載様式を
その文字データ中のキーワードと対応させたデータベー
スを設けておき、文字データの読取り後は、その読取り
データからキーワードを認識し、そのキーワードに基づ
いた文字データの記載様式をデータベースから取り出し
、この記載様式に基づいて読取りデータを分類するよう
にしたので、名刺にバーコードや分類情報を印字するこ
となく、そのカードに記載された文字データを自動的に
分類して、コストの低減およびカードの見栄えの悪化を
防止できる。
【図面の簡単な説明】
【図1】本発明に係る文字データ分類装置の一実施例と
、名刺搬送装置の一例との構成を示すブロック図。
【図2】本実施例の文字データ分類装置と名刺搬送装置
による文字データ分類処理を示すフローチャート。
【図3】図2におけるステップ130の詳細処理を示す
フローチャート。
【図4】ディスプレイ装置の画面上における文字データ
の分類処理結果の一例を示す説明図。
【符号の説明】
1    名刺 2    名刺搬送装置 3    読取り部 4    ケーブル 5    文字データ分類装置 6    パソコン本体 10    磁気ディスク装置 11    CPU 12    ROM 13    RAM

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】名刺等のカード上に記載された文字データ
    を読取り、その読取りデータを分類する文字データ分類
    装置において、上記カード上における文字データの記載
    様式をその文字データ中の所定のキーワードと対応させ
    たデータベースを予め設け、文字データの読取り後は、
    その読取りデータのキーワードを認識してそのキーワー
    ドに対応した上記記載様式を上記データベースから取り
    出し、この記載様式に基づき上記読取りデータを分類す
    ることを特徴とする文字データ分類装置。
JP3088622A 1991-04-19 1991-04-19 文字データ分類装置 Withdrawn JPH04320573A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3088622A JPH04320573A (ja) 1991-04-19 1991-04-19 文字データ分類装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3088622A JPH04320573A (ja) 1991-04-19 1991-04-19 文字データ分類装置

Publications (1)

Publication Number Publication Date
JPH04320573A true JPH04320573A (ja) 1992-11-11

Family

ID=13947909

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3088622A Withdrawn JPH04320573A (ja) 1991-04-19 1991-04-19 文字データ分類装置

Country Status (1)

Country Link
JP (1) JPH04320573A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000200280A (ja) * 1999-01-05 2000-07-18 Nec Software Kobe Ltd 組織構成情報自動作成装置および方法
JP2004046325A (ja) * 2002-07-09 2004-02-12 Sharp Corp データ入力装置、データ入力プログラムおよびデータ入力プログラムを記録した記録媒体

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000200280A (ja) * 1999-01-05 2000-07-18 Nec Software Kobe Ltd 組織構成情報自動作成装置および方法
JP2004046325A (ja) * 2002-07-09 2004-02-12 Sharp Corp データ入力装置、データ入力プログラムおよびデータ入力プログラムを記録した記録媒体

Similar Documents

Publication Publication Date Title
JP2575539B2 (ja) 書類上の金額フィールドの位置特定方法および識別方法
US8520889B2 (en) Automated generation of form definitions from hard-copy forms
US5193121A (en) Courtesy amount read and transaction balancing system
TWI238364B (en) Character recognition, including method and system for processing checks with invalidated MICR lines
US5109439A (en) Mass document storage and retrieval system
US5450537A (en) Method and apparatus for completing a partially completed document in accordance with a blank form from data automatically retrieved from a database
US6816630B1 (en) System and method for creating and processing data forms
US20020146170A1 (en) Determining form identification through the spatial relationship of input data
CN101276412A (zh) 信息处理装置、信息处理系统和信息处理方法
JPH07185473A (ja) ビデオコーティング装置
JP2001184453A (ja) 帳票処理システムおよび帳票ファイリングシステム
US6320983B1 (en) Method and apparatus for character recognition, and computer-readable recording medium with a program making a computer execute the method recorded therein
US20260080707A1 (en) Image reading systems, methods and storage medium for performing geometric extraction
CN114783584A (zh) 一种药品随货同行单的录单方法及装置
KR102561878B1 (ko) 머신러닝 기반의 ai 블루 ocr 판독 시스템 및 판독 방법
JP4733577B2 (ja) 帳票認識装置及び帳票認識プログラム
JP2004013813A (ja) 情報管理システムおよび情報管理方法
JPH04320573A (ja) 文字データ分類装置
JPS63282838A (ja) 名寄せ処理方式
JP2001084336A (ja) 文字認識装置及びその方法とプログラム記録媒体
JPH10105654A (ja) 帳票用文字認識装置
JP3000349B2 (ja) キー入力編集方法及び編集装置
JP2932667B2 (ja) 情報の検索方法および情報蓄積装置
JP3256622B2 (ja) ビデオコーディング装置
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19980711