JPH07114619A - 文書認識装置 - Google Patents
文書認識装置Info
- Publication number
- JPH07114619A JPH07114619A JP5262101A JP26210193A JPH07114619A JP H07114619 A JPH07114619 A JP H07114619A JP 5262101 A JP5262101 A JP 5262101A JP 26210193 A JP26210193 A JP 26210193A JP H07114619 A JPH07114619 A JP H07114619A
- Authority
- JP
- Japan
- Prior art keywords
- character
- document
- medical
- statement
- recognition device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 文書中の文字を認識する装置において,文字
の配置に多様性が有り,位置ずれも大きい文書中より,
所望の属性の文字列を抽出する。 【構成】 従来の文字認識装置に備わっている画像管理
(画像入力)部102,文字認識部108に加え,文字
行抽出手段103と,複数通りの文字行抽出結果の候補
を格納すると文字行候補の文書構成要素に対する対応関
係とを記憶する文字行候補テーブル111と,文字行の
候補を予め記憶してある文書の構成要素と照合する局所
照合手段104と,文書の構成要素間の制約条件を照合
する大局照合手段105とを有する。 【効果】 予め記憶させてある文字列の配置関係と矛盾
のないように,各文字行の候補と文書の構成要素の対応
付けが得られ,所望の属性の文字列が求められる。
の配置に多様性が有り,位置ずれも大きい文書中より,
所望の属性の文字列を抽出する。 【構成】 従来の文字認識装置に備わっている画像管理
(画像入力)部102,文字認識部108に加え,文字
行抽出手段103と,複数通りの文字行抽出結果の候補
を格納すると文字行候補の文書構成要素に対する対応関
係とを記憶する文字行候補テーブル111と,文字行の
候補を予め記憶してある文書の構成要素と照合する局所
照合手段104と,文書の構成要素間の制約条件を照合
する大局照合手段105とを有する。 【効果】 予め記憶させてある文字列の配置関係と矛盾
のないように,各文字行の候補と文書の構成要素の対応
付けが得られ,所望の属性の文字列が求められる。
Description
【0001】
【産業上の利用分野】本発明は,帳票上に記入された文
字を読み取り,計算機に入力する文字認識装置に関す
る。
字を読み取り,計算機に入力する文字認識装置に関す
る。
【0002】
【従来の技術】従来より,専用の帳票上のあらかじめ指
定された場所に記入された文字を読み取るOCR(光学
的文字認識装置)が用いられている。これらOCRは,
記入文字の多少のはみ出しには対応することはできる
が,書式が異なり文字の記入位置が大幅に異なる帳票は
読み取ることができない。また,任意の書式の文書中の
文字を読み取るテキストリーダーと呼ばれる装置が用い
られている( " Development of Japanese Document Re
cogintion System", Second Annual Symposium onDocum
net Analysis and Information Retrieval, P. 233 - 2
42[1])。テキストリーダーは文書中より自動的に文
字行の位置を検出し文字を読み取ることができる。しか
し,各々の文字行中の文字列のいずれが文書題目である
かかいった文字列の属性の対応付けを自動的に行なうこ
とはできない。また,特許明細書の先頭のページ中より
自動的に発明の名称などの記入されている位置を検出す
る方式が知られている(「自動ファイリングのための文
書理解の位置方式」電子情報通信学会論文誌D VO
L. J71−D NO. 10 p.2050 −2
058[2])。この方式においては,文書画像中より
抽出した文字行の外形,位置などをあらかじめ記憶して
ある文書の書式に関する知識と照合することにより,各
々の文字行に含まれる文字列の属性を求める。また,名
刺中より自動的に会社名,氏名などを検出する方式が知
られている(「文書画像理解における単語情報と論理構
造の援用」,PRU89ー90[3])。この方式にお
いては,文字行を抽出し,さらに文字行中の文字を読み
取り,単語の種類や単語間の接続条件を用いて会社名,
氏名などの特定の属性の文字列を検出する。
定された場所に記入された文字を読み取るOCR(光学
的文字認識装置)が用いられている。これらOCRは,
記入文字の多少のはみ出しには対応することはできる
が,書式が異なり文字の記入位置が大幅に異なる帳票は
読み取ることができない。また,任意の書式の文書中の
文字を読み取るテキストリーダーと呼ばれる装置が用い
られている( " Development of Japanese Document Re
cogintion System", Second Annual Symposium onDocum
net Analysis and Information Retrieval, P. 233 - 2
42[1])。テキストリーダーは文書中より自動的に文
字行の位置を検出し文字を読み取ることができる。しか
し,各々の文字行中の文字列のいずれが文書題目である
かかいった文字列の属性の対応付けを自動的に行なうこ
とはできない。また,特許明細書の先頭のページ中より
自動的に発明の名称などの記入されている位置を検出す
る方式が知られている(「自動ファイリングのための文
書理解の位置方式」電子情報通信学会論文誌D VO
L. J71−D NO. 10 p.2050 −2
058[2])。この方式においては,文書画像中より
抽出した文字行の外形,位置などをあらかじめ記憶して
ある文書の書式に関する知識と照合することにより,各
々の文字行に含まれる文字列の属性を求める。また,名
刺中より自動的に会社名,氏名などを検出する方式が知
られている(「文書画像理解における単語情報と論理構
造の援用」,PRU89ー90[3])。この方式にお
いては,文字行を抽出し,さらに文字行中の文字を読み
取り,単語の種類や単語間の接続条件を用いて会社名,
氏名などの特定の属性の文字列を検出する。
【0003】
【発明が解決しようとする課題】上記の従来技術によ
り,文書中より特定の属性を持つ文字列を読み取ること
が可能となっている。しかし,通常の事務処理において
用いられる伝票では,読み取り対象である文字列とその
他の予め印刷されてある文字(プレプリント文字)の配
置関係は多様であるために,位置や外形の情報により文
字列の属性を求めることが困難である場合がある。また
記入文字の位置ずれが大きいために,文字列の順序関係
が明確でなく単語間の接続条件で文字列の属性を求める
ことが困難である場合がある。また,帳票で頻繁に読み
取り対象とされる数字は文字列の種類によって属性を判
別することは出来ない。またプレプリント文字や所望の
属性以外の文字列が多いために,全ての文字を読み取っ
て単語の種類より文字列の属性を求めるのが困難である
場合がある。
り,文書中より特定の属性を持つ文字列を読み取ること
が可能となっている。しかし,通常の事務処理において
用いられる伝票では,読み取り対象である文字列とその
他の予め印刷されてある文字(プレプリント文字)の配
置関係は多様であるために,位置や外形の情報により文
字列の属性を求めることが困難である場合がある。また
記入文字の位置ずれが大きいために,文字列の順序関係
が明確でなく単語間の接続条件で文字列の属性を求める
ことが困難である場合がある。また,帳票で頻繁に読み
取り対象とされる数字は文字列の種類によって属性を判
別することは出来ない。またプレプリント文字や所望の
属性以外の文字列が多いために,全ての文字を読み取っ
て単語の種類より文字列の属性を求めるのが困難である
場合がある。
【0004】本発明では,このような通常の事務処理で
用いられる伝票中の特定の属性を持つ文字列を検出する
ために,文字列の配置の多様さや文字列の位置ずれ,不
要の文字列の多さに対応することを課題とする。
用いられる伝票中の特定の属性を持つ文字列を検出する
ために,文字列の配置の多様さや文字列の位置ずれ,不
要の文字列の多さに対応することを課題とする。
【0005】
【課題を解決するための手段】上記課題は,文書画像を
入力する手段と,文字行中の文字を認識する手段とを有
する文字認識装置において,あいまいな箇所に対しては
文書画像中より文字行の複数の候補を抽出する手段と,
文字行の候補を複数格納する手段と,文字行の候補を予
め記憶してある文書の構成要素との対応関係の仮説を生
成する局所照合手段と,仮説間の関係を予め記憶してあ
る制約条件と照合する大局照合手段とを有することによ
り解決される。
入力する手段と,文字行中の文字を認識する手段とを有
する文字認識装置において,あいまいな箇所に対しては
文書画像中より文字行の複数の候補を抽出する手段と,
文字行の候補を複数格納する手段と,文字行の候補を予
め記憶してある文書の構成要素との対応関係の仮説を生
成する局所照合手段と,仮説間の関係を予め記憶してあ
る制約条件と照合する大局照合手段とを有することによ
り解決される。
【0006】
【作用】文書画像入力手段は文書画像を装置へ入力す
る。文字行抽出手段は入力された文書画像中より文字行
を抽出する。この際,文書中の文字行が特定できない場
合には,複数の候補を出力する。局所照合手段は,抽出
された文字行の候補と予め記憶してある文書の構成要素
との対応関係の仮説を生成し,各々の仮説の確からしさ
を求める。大局照合手段は,生成された仮説を文字行抽
出結果に基づいて得られる組み合わせと予め記憶してあ
る制約条件とを照合し,確からしい仮説の組み合わせを
求める。
る。文字行抽出手段は入力された文書画像中より文字行
を抽出する。この際,文書中の文字行が特定できない場
合には,複数の候補を出力する。局所照合手段は,抽出
された文字行の候補と予め記憶してある文書の構成要素
との対応関係の仮説を生成し,各々の仮説の確からしさ
を求める。大局照合手段は,生成された仮説を文字行抽
出結果に基づいて得られる組み合わせと予め記憶してあ
る制約条件とを照合し,確からしい仮説の組み合わせを
求める。
【0007】その他の目的、構成及び作用効果は、以下
の詳細な説明から自ずと明らかになろう。
の詳細な説明から自ずと明らかになろう。
【0008】
【実施例】図1は本発明の一実施例の構成を示す。各部
分はソフトウエアで実現してもハードウエアで実現して
もよい。全体制御部101はキーボード112,CRT
113,マウス114,ペン115などを介してオペレ
ータよりの入力を受け付け,認識処理を起動し,得られ
た認識結果を出力する。画像管理部102は画像の入力
または出力の制御を行うものであって,全体制御部10
1より起動され,全体制御部により指定された画像を入
力し,画像メモリ110に格納する。画像を入力する手
段は109に示すような画像を記憶する装置でも,ある
いはイメージスキャナなどの画像入力装置でもよい。文
字行抽出部103は全体制御部101より起動され,画
像メモリ110に格納された文書画像中から文字行の領
域の候補(文字行領域候補)を抽出し,文字行候補テー
ブル111へ格納する。局所照合104は全体制御部1
01より起動され,文字行候補テーブル111に格納さ
れた文字行領域候補と構成要素辞書118に格納された
文書の構成要素に関する情報を照合する。位置・外形照
合部106は局所照合部104より起動され,文字行候
補テーブル111中の文字行領域候補と構成要素辞書中
の文書の構成要素との対応を文字行の位置と外形より照
合する。単語照合部107は局所照合部104より起動
され,必要に応じて文字認識部108を起動して文字行
内の文字を読み取り,文字行候補テーブル111中の文
字行領域候補と構成要素辞書中の文書の構成要素との対
応付けを単語照合により行なう。局所照合部104によ
って得られた文字行領域候補と構成要素辞書中の文書の
構成要素との対応は文字行領域候補テーブルに格納され
る。大局照合部105は,文字行候補テーブル111に
格納された文字行領域候補と構成要素辞書中の文書の構
成要素との対応が予め制約条件辞書に記憶してある構成
要素同士の制約条件と矛盾がないかを調べ,正しい文字
行領域候補のならびを選び出す。
分はソフトウエアで実現してもハードウエアで実現して
もよい。全体制御部101はキーボード112,CRT
113,マウス114,ペン115などを介してオペレ
ータよりの入力を受け付け,認識処理を起動し,得られ
た認識結果を出力する。画像管理部102は画像の入力
または出力の制御を行うものであって,全体制御部10
1より起動され,全体制御部により指定された画像を入
力し,画像メモリ110に格納する。画像を入力する手
段は109に示すような画像を記憶する装置でも,ある
いはイメージスキャナなどの画像入力装置でもよい。文
字行抽出部103は全体制御部101より起動され,画
像メモリ110に格納された文書画像中から文字行の領
域の候補(文字行領域候補)を抽出し,文字行候補テー
ブル111へ格納する。局所照合104は全体制御部1
01より起動され,文字行候補テーブル111に格納さ
れた文字行領域候補と構成要素辞書118に格納された
文書の構成要素に関する情報を照合する。位置・外形照
合部106は局所照合部104より起動され,文字行候
補テーブル111中の文字行領域候補と構成要素辞書中
の文書の構成要素との対応を文字行の位置と外形より照
合する。単語照合部107は局所照合部104より起動
され,必要に応じて文字認識部108を起動して文字行
内の文字を読み取り,文字行候補テーブル111中の文
字行領域候補と構成要素辞書中の文書の構成要素との対
応付けを単語照合により行なう。局所照合部104によ
って得られた文字行領域候補と構成要素辞書中の文書の
構成要素との対応は文字行領域候補テーブルに格納され
る。大局照合部105は,文字行候補テーブル111に
格納された文字行領域候補と構成要素辞書中の文書の構
成要素との対応が予め制約条件辞書に記憶してある構成
要素同士の制約条件と矛盾がないかを調べ,正しい文字
行領域候補のならびを選び出す。
【0009】図2に従来技術の認識対象を示す。(A)
はOCRの読み取り対象の文字に記入の仕方を示す。読
み取り対象の文字は予め指定された枠内に記入する。枠
内に記入される文字列の属性は予め記憶してある。
(B)はテキストリーダーの認識対象とする文書の例を
模式的に示す。テキストリーダーは文書中の文字行の位
置を自動的に抽出し文字を認識する。さらに,抽出した
文字行の位置関係や外形に基づき,文書題目などの特定
の属性を持つ文字列を抽出する方式が知られている。
(C)は単語の接続関係や単語の種類によって文字列の
属性を検出する方式の認識対象を模式的に示す。この例
では,文字行を認識してえられた文字列中より「大学」
というキーワードを検出し,さらに「大学」に隣接する
文字列を融合して大学名という属性を持った文字列とし
て抽出する。
はOCRの読み取り対象の文字に記入の仕方を示す。読
み取り対象の文字は予め指定された枠内に記入する。枠
内に記入される文字列の属性は予め記憶してある。
(B)はテキストリーダーの認識対象とする文書の例を
模式的に示す。テキストリーダーは文書中の文字行の位
置を自動的に抽出し文字を認識する。さらに,抽出した
文字行の位置関係や外形に基づき,文書題目などの特定
の属性を持つ文字列を抽出する方式が知られている。
(C)は単語の接続関係や単語の種類によって文字列の
属性を検出する方式の認識対象を模式的に示す。この例
では,文字行を認識してえられた文字列中より「大学」
というキーワードを検出し,さらに「大学」に隣接する
文字列を融合して大学名という属性を持った文字列とし
て抽出する。
【0010】図3は本発明の認識対象の例を示す。この
例では「合計」「円」というプレプリント文字と金額を
表す数字が存在する枠内より,金額を表す数字を抽出す
ることを目的とする。プレプリント文字の配置は(A)
(B)(C)に示すように多様である。(B)と(C)
は文字列の配置に関する情報のみでは「円」と金額を区
別することが出来ない。また,(A)と(B)では
「円」と金額の上下関係が入れ替わっており,単語の接
続関係から文字列の属性を求めることが出来ない場合が
ある。
例では「合計」「円」というプレプリント文字と金額を
表す数字が存在する枠内より,金額を表す数字を抽出す
ることを目的とする。プレプリント文字の配置は(A)
(B)(C)に示すように多様である。(B)と(C)
は文字列の配置に関する情報のみでは「円」と金額を区
別することが出来ない。また,(A)と(B)では
「円」と金額の上下関係が入れ替わっており,単語の接
続関係から文字列の属性を求めることが出来ない場合が
ある。
【0011】図4は本発明の認識対象の別の例を示す。
(A)のような画像からは(B)および(C)(D)の
3通りの文字行抽出結果が得られる可能性がある。いづ
れが妥当かは,文字認識の結果を用いなければ決定する
ことが出来ない。もし(C)や(D)という結果のみで
は単語の接続関係を用いる方式では年や月の属性を持つ
文字を検出できない。
(A)のような画像からは(B)および(C)(D)の
3通りの文字行抽出結果が得られる可能性がある。いづ
れが妥当かは,文字認識の結果を用いなければ決定する
ことが出来ない。もし(C)や(D)という結果のみで
は単語の接続関係を用いる方式では年や月の属性を持つ
文字を検出できない。
【0012】図5は本発明の認識対象の別の例を示す。
この例では画像中より年と月を表す文字を抽出すること
を目的とする。この例では目的以外の文字が数多く近傍
に配置されている。これらの全ての文字を認識して単語
の接続関係より目的の文字を抽出することは可能である
が,多くの処理時間が必要である。また文字行の外形や
位置のみからでは「平成」と「5」の区切りを検出する
ことは困難である。
この例では画像中より年と月を表す文字を抽出すること
を目的とする。この例では目的以外の文字が数多く近傍
に配置されている。これらの全ての文字を認識して単語
の接続関係より目的の文字を抽出することは可能である
が,多くの処理時間が必要である。また文字行の外形や
位置のみからでは「平成」と「5」の区切りを検出する
ことは困難である。
【0013】図6に本発明における帳票認識処理の手順
を示す。まずステップ601において文書画像を装置中
に入力する。次にステップ602において文書画像中よ
り文字行を抽出する。抽出した各々の文字行は文字行領
域候補としてその位置,外形を記憶する。また文字行と
して同時に存在しうる文字行領域候補の組み合わせを文
字行候補列として記憶する。文字行領域候補および文字
行候補列は文字行候補テーブルに記憶する。次に,ステ
ップ603において全ての文字行領域候補について局所
照合を行なう。局所照合は2段階にからなる。第一段階
としてステップ604において文字行の位置と外形より
抽出した文字行領域候補と構成要素辞書に記憶されてい
る文書の構成要素の対応付けを行ない,得られた対応関
係を構成要素仮説として文字行候補テーブルに記憶す
る。第二段階として各構成要素仮説毎に必要に応じて当
該文字行中の文字を認識して単語照合を行なう。次にス
テップ606において全ての文字行候補列について含ま
れる文字行領域候補の構成要素仮説が矛盾がないかどう
かを調べ,正しい文字行候補列を選び出す。次にステッ
プ607において正しい文字行候補列に基づいて所望の
属性を有する文字列を選び出し,認識結果として出力す
る。 図7に文字行抽出処理の処理の作用を示す。以下
では「合計」「100」「円」の3つの文字列が含まれ
る文書画像から金額という属性を持つ「100」を抽出
する例について説明する。文字行抽出処理においては
(A)に示すような画像から文字が横方向に連なってい
る領域を文字行として抽出する。このような方式には連
結成分融合法("A New Method of Document Structure
Extraction using GenericLayout Knowledge", Interna
tional Workshop on Industrial Applications ofMachi
e Intelligence and Vision (MIV-89), pp.282 - 287,
1989[4])がある。この方式においては連結成分の位
置関係を利用して連結成分同士を次々と融合して文字行
領域を抽出する。位置関係の判定には結成分の中心のX
座標の差やY座標の差など特徴量が予め指定してあるし
きい値内にあるかどうかを調べる方式などがあるが,こ
の際しきい値の値を変えると(B)に示すように異なる
文字行領域の候補が抽出される。例えば,「円」の部分
は704に示すように一通りの文字行領域の候補が抽出
されるが,「合計」と「100」の部分は701と70
2のように二つの文字行に別れる場合と703に示すよ
うに一つの文字行になる場合の二通りの候補が抽出され
る。本実施例では文字行を抽出する際のしきい値を複数
用い,これらしきい値により文字行の抽出結果が変わる
場合には,このようにして複数の文字行領域の候補を抽
出する。文字行抽出した結果は,(C)に示すように,
文字行領域候補のならびすなわち文字行候補列として文
字行候補テーブル111に格納する。この例では705
および706の2つの文字行候補列が出力されており,
それぞれが可能の文字行の組み合わせを表している。
A,B,C,Dはそれぞれ701,702,704,7
03の文字行領域候補に対応する。
を示す。まずステップ601において文書画像を装置中
に入力する。次にステップ602において文書画像中よ
り文字行を抽出する。抽出した各々の文字行は文字行領
域候補としてその位置,外形を記憶する。また文字行と
して同時に存在しうる文字行領域候補の組み合わせを文
字行候補列として記憶する。文字行領域候補および文字
行候補列は文字行候補テーブルに記憶する。次に,ステ
ップ603において全ての文字行領域候補について局所
照合を行なう。局所照合は2段階にからなる。第一段階
としてステップ604において文字行の位置と外形より
抽出した文字行領域候補と構成要素辞書に記憶されてい
る文書の構成要素の対応付けを行ない,得られた対応関
係を構成要素仮説として文字行候補テーブルに記憶す
る。第二段階として各構成要素仮説毎に必要に応じて当
該文字行中の文字を認識して単語照合を行なう。次にス
テップ606において全ての文字行候補列について含ま
れる文字行領域候補の構成要素仮説が矛盾がないかどう
かを調べ,正しい文字行候補列を選び出す。次にステッ
プ607において正しい文字行候補列に基づいて所望の
属性を有する文字列を選び出し,認識結果として出力す
る。 図7に文字行抽出処理の処理の作用を示す。以下
では「合計」「100」「円」の3つの文字列が含まれ
る文書画像から金額という属性を持つ「100」を抽出
する例について説明する。文字行抽出処理においては
(A)に示すような画像から文字が横方向に連なってい
る領域を文字行として抽出する。このような方式には連
結成分融合法("A New Method of Document Structure
Extraction using GenericLayout Knowledge", Interna
tional Workshop on Industrial Applications ofMachi
e Intelligence and Vision (MIV-89), pp.282 - 287,
1989[4])がある。この方式においては連結成分の位
置関係を利用して連結成分同士を次々と融合して文字行
領域を抽出する。位置関係の判定には結成分の中心のX
座標の差やY座標の差など特徴量が予め指定してあるし
きい値内にあるかどうかを調べる方式などがあるが,こ
の際しきい値の値を変えると(B)に示すように異なる
文字行領域の候補が抽出される。例えば,「円」の部分
は704に示すように一通りの文字行領域の候補が抽出
されるが,「合計」と「100」の部分は701と70
2のように二つの文字行に別れる場合と703に示すよ
うに一つの文字行になる場合の二通りの候補が抽出され
る。本実施例では文字行を抽出する際のしきい値を複数
用い,これらしきい値により文字行の抽出結果が変わる
場合には,このようにして複数の文字行領域の候補を抽
出する。文字行抽出した結果は,(C)に示すように,
文字行領域候補のならびすなわち文字行候補列として文
字行候補テーブル111に格納する。この例では705
および706の2つの文字行候補列が出力されており,
それぞれが可能の文字行の組み合わせを表している。
A,B,C,Dはそれぞれ701,702,704,7
03の文字行領域候補に対応する。
【0014】図8は位置・外形照合処理の作用を示す。
文字行領域候補A,B,C,Dが予め記憶してあるα,
β,γ,δの文書の構成要素(各々「合計」,数字,
「円」,「合計 円」に対応する。)のいづれに対応す
るかを本処理によって判別する。判別結果は構成要素仮
説データとして格納される。一つの文字行領域候補が複
数の構成要素に対応する場合もある。このため,構成要
素仮説データは図中の801,802,803,804
に示すように,ポインタで連結されてリスト状に格納さ
れる。たとえば,文字行領域候補Aが「合計」に対応す
ると判別されると,構成要素仮説データ805がリスト
801に連なる形で格納される。文字行領域候補Bには
数字と「円」と2通りの構成要素仮説が生成され,それ
ぞれが806,807に示すようにリスト802に連な
って格納される。なお,この段階で構成要素との対応が
不明の文字行領域候補に対し,他の文字行と融合して別
の文字行領域候補を生成する,あるいは文字行を分割し
て文字行領域候補を生成する,しきい値をさらに変更し
て文字行抽出を再試行する等のリトライ処理を付け加え
てもよい。(B)は構成要素辞書の形式の例を示す。こ
の例では文字行の幅,長さの最大値/最小値811,8
12と文字行の重心のX座標およびY座標の最大値/最
小値813,814が構成要素辞書内に格納してある。
文字行の上端,下端,左端,右端の最大値/最小値など
を格納し位置・外形照合処理に用いてもよい。さらに後
述する単語照合の要不要に関する情報815および照合
する単語816も構成要素辞書に格納する。図中の81
6内の漢字は照合の対象の単語,nnnは3桁以下の数
字を示す。
文字行領域候補A,B,C,Dが予め記憶してあるα,
β,γ,δの文書の構成要素(各々「合計」,数字,
「円」,「合計 円」に対応する。)のいづれに対応す
るかを本処理によって判別する。判別結果は構成要素仮
説データとして格納される。一つの文字行領域候補が複
数の構成要素に対応する場合もある。このため,構成要
素仮説データは図中の801,802,803,804
に示すように,ポインタで連結されてリスト状に格納さ
れる。たとえば,文字行領域候補Aが「合計」に対応す
ると判別されると,構成要素仮説データ805がリスト
801に連なる形で格納される。文字行領域候補Bには
数字と「円」と2通りの構成要素仮説が生成され,それ
ぞれが806,807に示すようにリスト802に連な
って格納される。なお,この段階で構成要素との対応が
不明の文字行領域候補に対し,他の文字行と融合して別
の文字行領域候補を生成する,あるいは文字行を分割し
て文字行領域候補を生成する,しきい値をさらに変更し
て文字行抽出を再試行する等のリトライ処理を付け加え
てもよい。(B)は構成要素辞書の形式の例を示す。こ
の例では文字行の幅,長さの最大値/最小値811,8
12と文字行の重心のX座標およびY座標の最大値/最
小値813,814が構成要素辞書内に格納してある。
文字行の上端,下端,左端,右端の最大値/最小値など
を格納し位置・外形照合処理に用いてもよい。さらに後
述する単語照合の要不要に関する情報815および照合
する単語816も構成要素辞書に格納する。図中の81
6内の漢字は照合の対象の単語,nnnは3桁以下の数
字を示す。
【0015】図9は単語照合処理の作用を示す。上記の
位置・外形照合処理によって得られた構成要素仮説毎に
必要に応じて単語照合を行なう。単語照合をするか否か
は構成要素辞書に格納してある単語照合の要不要の情報
に基づいて決定する。単語照合をする場合には,まず構
成要素仮説で構成要素に対応する文字行領域候補内の文
字を読み取り,得られた文字列中に構成要素辞書内の当
該構成要素の箇所に格納されている単語が含まれている
かどうかを調べ,含まれていない場合にはその構成要素
仮説を棄却する。図中の807および809は棄却され
た候補である。文字認識結果と単語を照合する方式とし
ては "A high speed word matching algorithm for han
dwritten chinese character recognition[5]" など
ので知られている方式を用いることができる。本方式の
ように文書の構成要素の種類により文字認識を行なうか
否かを切り替えることにより,不要な文字認識を行なう
必要がなくなり,不要な文字が多い帳票の読み取りにも
対応できるようになる。また読み取りの要不要に併せて
手書きか漢字か,あるいは数字かかなか漢字かといった
読み取り対象の字種を構成要素辞書に格納しておきこれ
に基づき認識処理を切り替えることにより,読み取りの
精度を向上することができる。
位置・外形照合処理によって得られた構成要素仮説毎に
必要に応じて単語照合を行なう。単語照合をするか否か
は構成要素辞書に格納してある単語照合の要不要の情報
に基づいて決定する。単語照合をする場合には,まず構
成要素仮説で構成要素に対応する文字行領域候補内の文
字を読み取り,得られた文字列中に構成要素辞書内の当
該構成要素の箇所に格納されている単語が含まれている
かどうかを調べ,含まれていない場合にはその構成要素
仮説を棄却する。図中の807および809は棄却され
た候補である。文字認識結果と単語を照合する方式とし
ては "A high speed word matching algorithm for han
dwritten chinese character recognition[5]" など
ので知られている方式を用いることができる。本方式の
ように文書の構成要素の種類により文字認識を行なうか
否かを切り替えることにより,不要な文字認識を行なう
必要がなくなり,不要な文字が多い帳票の読み取りにも
対応できるようになる。また読み取りの要不要に併せて
手書きか漢字か,あるいは数字かかなか漢字かといった
読み取り対象の字種を構成要素辞書に格納しておきこれ
に基づき認識処理を切り替えることにより,読み取りの
精度を向上することができる。
【0016】図10は大局照合処理の作用を示す。文字
行抽出処理で得られた文字行候補列にそって各文字行領
域候補に対応する構成要素仮説の組み合わせを求め,そ
の組み合わせが予め制約条件辞書に格納してある条件の
いずれかを満たすならばその構成要素仮説の組み合わせ
が認識対象の書式を表しているものとし,その中の出力
が必要な文字行中の文字を認識し,出力する。出力の要
不要に関する情報は構成要素辞書に格納する。(A)の
1001は制約条件を満たした文字行候補列で,図9
(B)の構成要素辞書中の出力要不要の情報817に基
づき,Bの認識結果の「100」が金額として出力され
る。1002は棄却された文字行候補列である。(B)
は制約条件辞書の一例を示す。図中の関数exist
(x)は構成要素xが構成要素仮説のならびに存在する
ことを示す。またleft(x,y)は構成要素xに対
応する文字行の重心ががyに対応する文字行の重心より
左にあることを意味する。本例では文字行候補列100
1は制約条件辞書内の条件1003を満たした。また,
1004の条件を満たす文字行候補列はなかった。位置
関係として重心の上下関係を用いてもよい。また,左右
端のX座標,上下端のY座標等を用いてもよい。
行抽出処理で得られた文字行候補列にそって各文字行領
域候補に対応する構成要素仮説の組み合わせを求め,そ
の組み合わせが予め制約条件辞書に格納してある条件の
いずれかを満たすならばその構成要素仮説の組み合わせ
が認識対象の書式を表しているものとし,その中の出力
が必要な文字行中の文字を認識し,出力する。出力の要
不要に関する情報は構成要素辞書に格納する。(A)の
1001は制約条件を満たした文字行候補列で,図9
(B)の構成要素辞書中の出力要不要の情報817に基
づき,Bの認識結果の「100」が金額として出力され
る。1002は棄却された文字行候補列である。(B)
は制約条件辞書の一例を示す。図中の関数exist
(x)は構成要素xが構成要素仮説のならびに存在する
ことを示す。またleft(x,y)は構成要素xに対
応する文字行の重心ががyに対応する文字行の重心より
左にあることを意味する。本例では文字行候補列100
1は制約条件辞書内の条件1003を満たした。また,
1004の条件を満たす文字行候補列はなかった。位置
関係として重心の上下関係を用いてもよい。また,左右
端のX座標,上下端のY座標等を用いてもよい。
【0017】図11は本発明を用いた文書認識装置の例
を示す。本例では診療報酬明細書中の文字列を読み取
り,記入内容に異常のある診療報酬明細書を選び出すこ
とを目的とする。各部は制御部1111により制御され
る。診療報酬明細書はシートフィーダー1101により
連続的にスキャナ1102に装填され画像データとして
入力される。図中の二重線はレセプトシートの流れを示
す。文書認識部1105は上に説明した方式により診療
年月,医療機関コード,保険者コード,被保険者コー
ド,氏名,性別および生年,傷病名,医療行為,保険点
数,保険点数明細,合計点,診療実日数を読み取る。保
険点数チェック部1109は以下の処理を行なう。
(1)医療行為明細と保険点数明細の間の矛盾の有無を
判別する。判別の際には,医療行為と保険点数の関係を
予め記憶してある保険点数辞書1111を参照する。診
療歴チェック部1108は以下の処理を行なう。(1)
被保険者番号を基に当該被保険者の診療歴を検索し,そ
の結果と診療年月とを比較し,一ヶ月あたりの診療回数
が一定値を越えているか否かを判別する。(2)被保険
者番号より当該被保険者の診療歴を検索し,その結果と
初診欄の保険点数の記入の有無より,同一被保険者に対
し同一医療機関が初診料を重複して請求しているか否か
を判別する。(3)診療実日数が一定値を越えているか
否かを判別する。判別の際には,被保険者の診療歴を記
憶した診療歴辞書1110を参照する。合計点チェック
部1107は以下の処理を行なう。(1)保険点数の合
計が合計点の数字に一致しているか否かを判別する。
(2)保険点数が保険点数明細の合計と一致しているか
否かを判別する。(3)合計点数が一定値を越えている
か否かを判別する。特定IDチェック部1106は,異
常が予想される診療報酬明細書のIDすなわち特定ID
と読み取った結果のIDが同一であるか否かをチェック
する。保険点数チェック部1109,診療歴チェック部
1108,合計点チェック部1107,特定IDチェッ
ク部1106の処理結果に応じ,印刷装置1103は特
定の記号を診療報酬明細書に印刷し,仕分け装置は認識
済の診療報酬明細書の格納場所を変更する。
を示す。本例では診療報酬明細書中の文字列を読み取
り,記入内容に異常のある診療報酬明細書を選び出すこ
とを目的とする。各部は制御部1111により制御され
る。診療報酬明細書はシートフィーダー1101により
連続的にスキャナ1102に装填され画像データとして
入力される。図中の二重線はレセプトシートの流れを示
す。文書認識部1105は上に説明した方式により診療
年月,医療機関コード,保険者コード,被保険者コー
ド,氏名,性別および生年,傷病名,医療行為,保険点
数,保険点数明細,合計点,診療実日数を読み取る。保
険点数チェック部1109は以下の処理を行なう。
(1)医療行為明細と保険点数明細の間の矛盾の有無を
判別する。判別の際には,医療行為と保険点数の関係を
予め記憶してある保険点数辞書1111を参照する。診
療歴チェック部1108は以下の処理を行なう。(1)
被保険者番号を基に当該被保険者の診療歴を検索し,そ
の結果と診療年月とを比較し,一ヶ月あたりの診療回数
が一定値を越えているか否かを判別する。(2)被保険
者番号より当該被保険者の診療歴を検索し,その結果と
初診欄の保険点数の記入の有無より,同一被保険者に対
し同一医療機関が初診料を重複して請求しているか否か
を判別する。(3)診療実日数が一定値を越えているか
否かを判別する。判別の際には,被保険者の診療歴を記
憶した診療歴辞書1110を参照する。合計点チェック
部1107は以下の処理を行なう。(1)保険点数の合
計が合計点の数字に一致しているか否かを判別する。
(2)保険点数が保険点数明細の合計と一致しているか
否かを判別する。(3)合計点数が一定値を越えている
か否かを判別する。特定IDチェック部1106は,異
常が予想される診療報酬明細書のIDすなわち特定ID
と読み取った結果のIDが同一であるか否かをチェック
する。保険点数チェック部1109,診療歴チェック部
1108,合計点チェック部1107,特定IDチェッ
ク部1106の処理結果に応じ,印刷装置1103は特
定の記号を診療報酬明細書に印刷し,仕分け装置は認識
済の診療報酬明細書の格納場所を変更する。
【0018】図12は診療報酬明細書中の文字列の配置
の例を示す。診療報酬明細書の書式は厚生省告示第17
7号健康保険法に定められている。しかし,各項目の寸
法や枠線の形状にはばらつきがある。このため,従来技
術では診療年月等の特定の属性を有する文字列を自動的
に識別し読み取ることは困難であったが,本発明により
診療報酬明細書中の各文字列の属性を識別し読み取るこ
とができるようになる。診療年月1201は,診療報酬
明細書の作成された年月である。医療機関コード120
2は,診療報酬明細書を作成した医療機関を表す番号で
ある。保険者番号1203は,保険を運営する団体を表
す番号である。被保険者番号1204は被保険者を表す
番号である。氏名1205は医療行為を受けた者の氏名
である。性別・生年1206は医療行為を受けた者の性
別および生年である。傷病名1207は医療行為の対象
となった傷病名である。医療行為1208は行なわれた
医療行為であり,初診,投薬,処置などに分類して記入
される。保険点数1209は医療行為に対応する点数で
あり,これを基に保険金額が計算される。医療行為明細
1210および保険点数明細1211は医療行為および
それに対応する保険点数の明細である。医療行為と保険
点数の関係は厚生省告示第177号健康保険法第43条
の別表により定められており,この内容を予め装置内に
記憶しておけば,両者の矛盾を判別するのは容易であ
る。ID1212は診療報酬明細書毎に整理のために印
刷される番号である。
の例を示す。診療報酬明細書の書式は厚生省告示第17
7号健康保険法に定められている。しかし,各項目の寸
法や枠線の形状にはばらつきがある。このため,従来技
術では診療年月等の特定の属性を有する文字列を自動的
に識別し読み取ることは困難であったが,本発明により
診療報酬明細書中の各文字列の属性を識別し読み取るこ
とができるようになる。診療年月1201は,診療報酬
明細書の作成された年月である。医療機関コード120
2は,診療報酬明細書を作成した医療機関を表す番号で
ある。保険者番号1203は,保険を運営する団体を表
す番号である。被保険者番号1204は被保険者を表す
番号である。氏名1205は医療行為を受けた者の氏名
である。性別・生年1206は医療行為を受けた者の性
別および生年である。傷病名1207は医療行為の対象
となった傷病名である。医療行為1208は行なわれた
医療行為であり,初診,投薬,処置などに分類して記入
される。保険点数1209は医療行為に対応する点数で
あり,これを基に保険金額が計算される。医療行為明細
1210および保険点数明細1211は医療行為および
それに対応する保険点数の明細である。医療行為と保険
点数の関係は厚生省告示第177号健康保険法第43条
の別表により定められており,この内容を予め装置内に
記憶しておけば,両者の矛盾を判別するのは容易であ
る。ID1212は診療報酬明細書毎に整理のために印
刷される番号である。
【0019】図13は図11の例における認識結果に応
じた記号の印刷の例を示す。(A)は合計点数欄に異常
があった場合の例である。認識の過程で検出されている
合計点数1301の位置の左隣に異常を示す記号130
2を印刷している。印刷する記号は本例の様に特殊な記
号でも「注意」といった文字でもよい。(B)は診療実
日数に異常があった場合の印刷の別の例である。この例
では紙の上端に合計点および診療実日数の異常の有無を
文字で印刷してある。
じた記号の印刷の例を示す。(A)は合計点数欄に異常
があった場合の例である。認識の過程で検出されている
合計点数1301の位置の左隣に異常を示す記号130
2を印刷している。印刷する記号は本例の様に特殊な記
号でも「注意」といった文字でもよい。(B)は診療実
日数に異常があった場合の印刷の別の例である。この例
では紙の上端に合計点および診療実日数の異常の有無を
文字で印刷してある。
【0020】図14は文字行を抽出する処理の手順の例
である。まずステップ1401において処理対象の画像
中の連結成分を求め,各々の連結成分の外接矩形を抽出
する。次にステップ1402において上記矩形座標の相
関に応じて矩形同士を融合する。さらにステップ140
3から1404までの融合処理において直前の処理にお
いて抽出された矩形の座標の相関に応じて矩形同士を融
合する。矩形融合の段数は処理対象に応じ3段より多く
ても少なくてもよい。また各融合処理の内容は同じであ
っても段毎に異なってもよい。次にステップ1405に
おいてステップ1404までの処理で抽出された矩形の
外形を調べ,文字行として適正な幅及び長さで有るかい
なかを調べ,文字行として適正なものを文字行候補テー
ブル111文字行へ出力する。
である。まずステップ1401において処理対象の画像
中の連結成分を求め,各々の連結成分の外接矩形を抽出
する。次にステップ1402において上記矩形座標の相
関に応じて矩形同士を融合する。さらにステップ140
3から1404までの融合処理において直前の処理にお
いて抽出された矩形の座標の相関に応じて矩形同士を融
合する。矩形融合の段数は処理対象に応じ3段より多く
ても少なくてもよい。また各融合処理の内容は同じであ
っても段毎に異なってもよい。次にステップ1405に
おいてステップ1404までの処理で抽出された矩形の
外形を調べ,文字行として適正な幅及び長さで有るかい
なかを調べ,文字行として適正なものを文字行候補テー
ブル111文字行へ出力する。
【0021】図15は文字行抽出処理における第一段融
合処理の原理を示す。第一段融合は連結成分外接矩形の
集合より,文字の外接矩形を求めることを目的とする。
(A)は入力の画像の例を示す。図中の「昭」「和」
「年」はプレプリント文字である。また,「2」は後か
ら記入された文字であり,プレプリントに対して下方向
にずれている。(B)は連結成分外接矩形抽出結果を模
式的に示す。連結成分外接矩形とは,画像中の連続した
黒画素の塊に外接する,各辺がX軸またはY軸に平行な
矩形である。連結成分外接矩形抽出処理は,入力画像中
の連結成分外接矩形の全てからなる集合を求める処理で
ある。(C)は連結成分外接矩形を融合するか否かを判
定するための条件を示す。1503及び1504は連結
成分外接矩形である。1501は連結成分外接矩形のX
方向の距離,1502はY方向の距離である。第一段融
合においてはX方向の距離及びY方向の距離がそれぞれ
予め定められた値以下の場合に矩形同士を融合する。
(D)は矩形の融合結果の例を示す。矩形の融合とは,
2つの矩形の外接し各辺がX軸またはY軸に平行な矩形
をもとめて矩形集合に追加すると共に,元の2つの矩形
を矩形の集合から削除する処理である。本例では「昭」
「和」中の連結成分外接矩形がそれぞれ一つに融合され
ている。
合処理の原理を示す。第一段融合は連結成分外接矩形の
集合より,文字の外接矩形を求めることを目的とする。
(A)は入力の画像の例を示す。図中の「昭」「和」
「年」はプレプリント文字である。また,「2」は後か
ら記入された文字であり,プレプリントに対して下方向
にずれている。(B)は連結成分外接矩形抽出結果を模
式的に示す。連結成分外接矩形とは,画像中の連続した
黒画素の塊に外接する,各辺がX軸またはY軸に平行な
矩形である。連結成分外接矩形抽出処理は,入力画像中
の連結成分外接矩形の全てからなる集合を求める処理で
ある。(C)は連結成分外接矩形を融合するか否かを判
定するための条件を示す。1503及び1504は連結
成分外接矩形である。1501は連結成分外接矩形のX
方向の距離,1502はY方向の距離である。第一段融
合においてはX方向の距離及びY方向の距離がそれぞれ
予め定められた値以下の場合に矩形同士を融合する。
(D)は矩形の融合結果の例を示す。矩形の融合とは,
2つの矩形の外接し各辺がX軸またはY軸に平行な矩形
をもとめて矩形集合に追加すると共に,元の2つの矩形
を矩形の集合から削除する処理である。本例では「昭」
「和」中の連結成分外接矩形がそれぞれ一つに融合され
ている。
【0022】図16は,文字行抽出処理における第二段
および第三段融合処理の原理を示す。第二段および第三
段融合処理は文字の外接矩形の集合より文字行の外接矩
形を求めることを目的とする。(A)は矩形を融合する
か否かを判定するための条件を示す。1601は矩形上
端座標の差(Td)である。1602は矩形下端座標の
差(Bd)である。1603は矩形のX方向の距離(X
d)である。1604は矩形の高さ(H2)である。第
二段および第三段融合処理においては,Td<CTdか
つBd<CBdかつXd<CXdかつCH21<H2<
CH22である場合に矩形同士を融合する。CTd,C
Bd,CXd,CH21,CH22は各処理によって異
なってもよい。(B)は第二段融合処理の結果の一例を
示す。本例では図15(A)における「昭」と「和」の
外接矩形が融合され,「昭和」「2」「年」の3つの矩
形が出力される。これを第三段融合の入力としても,こ
の結果自身を文字行としても出力してもよい。(C)は
第二段融合処理の結果の別の例を示す。本例はCXdの
値が(B)より大きい例で,図15(A)における
「昭」と「和」と「年」の外接矩形が融合され,「昭和
年」「2」の2つの矩形が出力される。(D)は第三段
融合処理の結果の例を示す。本で例は(C)の結果に対
し,CTdおよびCBdの値を大きくし,CXdの値を
小さくして融合するか否かを判定している。「昭和年」
と「2」の矩形が融合され,文字行外接矩形として出力
される。
および第三段融合処理の原理を示す。第二段および第三
段融合処理は文字の外接矩形の集合より文字行の外接矩
形を求めることを目的とする。(A)は矩形を融合する
か否かを判定するための条件を示す。1601は矩形上
端座標の差(Td)である。1602は矩形下端座標の
差(Bd)である。1603は矩形のX方向の距離(X
d)である。1604は矩形の高さ(H2)である。第
二段および第三段融合処理においては,Td<CTdか
つBd<CBdかつXd<CXdかつCH21<H2<
CH22である場合に矩形同士を融合する。CTd,C
Bd,CXd,CH21,CH22は各処理によって異
なってもよい。(B)は第二段融合処理の結果の一例を
示す。本例では図15(A)における「昭」と「和」の
外接矩形が融合され,「昭和」「2」「年」の3つの矩
形が出力される。これを第三段融合の入力としても,こ
の結果自身を文字行としても出力してもよい。(C)は
第二段融合処理の結果の別の例を示す。本例はCXdの
値が(B)より大きい例で,図15(A)における
「昭」と「和」と「年」の外接矩形が融合され,「昭和
年」「2」の2つの矩形が出力される。(D)は第三段
融合処理の結果の例を示す。本で例は(C)の結果に対
し,CTdおよびCBdの値を大きくし,CXdの値を
小さくして融合するか否かを判定している。「昭和年」
と「2」の矩形が融合され,文字行外接矩形として出力
される。
【0023】図17は文字行抽出結果の修正画面であ
る。マウスカーソル1701,表示ウインドウ1702
がCRT113に表示される。表示ウインドウ1702
中には入力画像1703,文字行外接矩形候補1704
および1705,次候補ボタン1706,前候補ボタン
1707,認識ボタン1708が表示される。もし表示
されている文字行外接矩形候補1704が誤っている場
合には,操作者はマウスカーソル1701で次候補ボタ
ン1706または前候補ボタン1707をクリックする
ことにより,異なるパラメータCTd,CBd,CX
d,CH21,CH22の値で文字行抽出処理を行なっ
た結果1709が再び表示ウインドウ1702に表示で
きる。異なるパラメータで文字行抽出処理を行なった結
果は予め生成して記憶しておいても,ボタンがクリック
されてから生成してもよい。
る。マウスカーソル1701,表示ウインドウ1702
がCRT113に表示される。表示ウインドウ1702
中には入力画像1703,文字行外接矩形候補1704
および1705,次候補ボタン1706,前候補ボタン
1707,認識ボタン1708が表示される。もし表示
されている文字行外接矩形候補1704が誤っている場
合には,操作者はマウスカーソル1701で次候補ボタ
ン1706または前候補ボタン1707をクリックする
ことにより,異なるパラメータCTd,CBd,CX
d,CH21,CH22の値で文字行抽出処理を行なっ
た結果1709が再び表示ウインドウ1702に表示で
きる。異なるパラメータで文字行抽出処理を行なった結
果は予め生成して記憶しておいても,ボタンがクリック
されてから生成してもよい。
【0024】図18は融合を複数段に分けることが効果
的な例を示す。(A)は入力画像である。この例では文
字以外にノイズが画像に含まれている。(B)は1段の
処理で(A)の画像の連結成分外接矩形を統合して文字
行外接矩形を抽出することを試みた例である。この場
合,ノイズを文字行中の連結成分と誤認し,誤って文字
行外接矩形を大きくとってしまうことは避けられない。
(C)は(A)の画像の連結成分外接矩形を統合して文
字の外接矩形を求めた結果である。この場合,ノイズと
文字の間に十分な距離があれば,ノイズと文字は別々の
矩形となる。(D)は(C)の結果より図16で説明し
た第二段,第三段の融合を行なった結果である。この場
合,高さがCH21に満たないノイズは融合されず,図
に示すように正しく文字行外接矩形が抽出される。ノイ
ズの外接矩形は外接矩形判定1405において文字行で
ないと判定することができる。
的な例を示す。(A)は入力画像である。この例では文
字以外にノイズが画像に含まれている。(B)は1段の
処理で(A)の画像の連結成分外接矩形を統合して文字
行外接矩形を抽出することを試みた例である。この場
合,ノイズを文字行中の連結成分と誤認し,誤って文字
行外接矩形を大きくとってしまうことは避けられない。
(C)は(A)の画像の連結成分外接矩形を統合して文
字の外接矩形を求めた結果である。この場合,ノイズと
文字の間に十分な距離があれば,ノイズと文字は別々の
矩形となる。(D)は(C)の結果より図16で説明し
た第二段,第三段の融合を行なった結果である。この場
合,高さがCH21に満たないノイズは融合されず,図
に示すように正しく文字行外接矩形が抽出される。ノイ
ズの外接矩形は外接矩形判定1405において文字行で
ないと判定することができる。
【0025】図19は読み取り対象の文字行を抽出する
別の方式の例である。図中(A)の様に文字行を抽出す
るのが困難な場合,(B)に示すようにまずサイズ,位
置などがおおよそ定められており,比較的抽出が容易な
「年」の領域1901を抽出する。次に年の左側の領域
で文字行1902を探索する。この場合には探索の領域
が限定されていて文字行以外の連結成分に妨害されるこ
とがなく,比較的容易に年を表す数字の文字行を抽出で
きる。
別の方式の例である。図中(A)の様に文字行を抽出す
るのが困難な場合,(B)に示すようにまずサイズ,位
置などがおおよそ定められており,比較的抽出が容易な
「年」の領域1901を抽出する。次に年の左側の領域
で文字行1902を探索する。この場合には探索の領域
が限定されていて文字行以外の連結成分に妨害されるこ
とがなく,比較的容易に年を表す数字の文字行を抽出で
きる。
【0026】
【発明の効果】従来の方式では読み取ることが困難であ
った文字列の配置の多様さで文字列の位置ずれが大きく
不要の文字列の多い帳票中より所望の属性の文字列を認
識し出力することができる。
った文字列の配置の多様さで文字列の位置ずれが大きく
不要の文字列の多い帳票中より所望の属性の文字列を認
識し出力することができる。
【図1】本発明の一実施例のシステム構成を示す。
【図2】従来技術の認識対象を示す。
【図3】本発明の認識対象の例を示す。
【図4】本発明の認識対象の別の例を示す。
【図5】本発明の認識対象の別の例を示す。
【図6】本発明の一実施例における処理の手順を示す。
【図7】本発明の一実施例における文字行抽出処理を示
す。
す。
【図8】本発明の一実施例における位置・外形照合処理
を示す。
を示す。
【図9】本発明の一実施例における単語照合処理を示
す。
す。
【図10】本発明の一実施例における大局照合処理を示
す。
す。
【図11】本発明の第二の実施例を示す。
【図12】第二の実施例の読み取り対象である診療報酬
明細書中の文字列の配置を示す。
明細書中の文字列の配置を示す。
【図13】第二の実施例における認識結果に応じた印刷
の例を示す。
の例を示す。
【図14】文字行を抽出する処理の手順の例を示す。
【図15】文字行抽出処理における第一段融合処理の原
理を示す。
理を示す。
【図16】文字行抽出処理における第二段および第三段
融合処理の原理を示す。
融合処理の原理を示す。
【図17】文字行抽出結果の修正画面を示す。
【図18】融合を複数段に分けることが効果的な例を示
す。
す。
【図19】文字行抽出の別の方式を示す。
103…文字行抽出部,104…局所照合部,105…
大局照合部,106…位置・外形照合部,107…単語
照合部,108…文字認識部。
大局照合部,106…位置・外形照合部,107…単語
照合部,108…文字認識部。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 杉本 建行 神奈川県小田原市国府津2880番地 株式会 社日立製作所ストレージシステム事業部内 (72)発明者 丸川 勝美 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 羽田野 英一 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内 (72)発明者 中島 和樹 東京都国分寺市東恋ケ窪1丁目280番地 株式会社日立製作所中央研究所内
Claims (23)
- 【請求項1】文書画像を入力する手段と,文字行中の文
字を認識する手段とを有する文字認識装置において,文
書画像中より文字行の候補を抽出する手段と,文字行の
候補を複数格納する手段と,文字行の候補を予め記憶し
てある文書の構成要素と照合する局所照合手段と,文書
の構成要素間の制約条件を照合する大局照合手段とを有
することを特徴とする文書認識装置。 - 【請求項2】請求項1記載の文書認識装置において,局
所照合手段として文字認識結果を単語照合する手段を有
することを特徴とする文書認識装置。 - 【請求項3】請求項2記載の文書認識装置において,予
め記憶してある文書構成要素毎の認識の要不要に応じて
文字認識および単語照合を起動するか否かを切り替える
ことを特徴とする文書認識装置。 - 【請求項4】請求項1記載の文書認識装置において,予
め記憶してある文書構成要素毎の文字認識および単語照
合の処理方式または辞書の種類に応じて起動する文字認
識および単語照合を切り替えることを特徴とする文書認
識装置。 - 【請求項5】請求項1記載の文書認識装置において,局
所照合手段に一つの文字行の候補に対し複数の文書の構
成要素の対応の候補を抽出し格納する手段を有すること
を特徴とする文書認識装置。 - 【請求項6】請求項2記載の文書認識装置において,局
所照合として文字行の位置もしくは外形の照合を併用す
ることを特徴とする文書認識装置。 - 【請求項7】請求項2記載の文書認識装置において,大
局照合として文字行の位置関係を用いることを特徴とす
る文書認識装置。 - 【請求項8】請求項2記載の文書認識装置において,大
局照合として文字行の位置関係と単語間の接続関係を併
用することを特徴とする文書認識装置。 - 【請求項9】請求項1記載の文書認識装置において,特
定の属性の文字行が検出した後,当該文字行に対し一定
の位置関係にある文字行を抽出することを特徴とする文
書認識装置。 - 【請求項10】診療報酬明細書中の文字列を読み取る手
段と,文字列の読み取り結果より記載内容に異常の有る
診療報酬明細書を判別する手段とを有する文書認識装
置。 - 【請求項11】請求項10記載の文書認識装置におい
て,診療報酬明細書中の保険点数欄と合計点数欄を読み
取り対象の文字列とし,異常の有る診療報酬明細書を判
別する手段として保険点数欄と合計点数欄の数字の矛盾
の有無を判別する手段を有する文書認識装置。 - 【請求項12】請求項10記載の文書認識装置におい
て,診療報酬明細書中の保険点数欄と保険点数明細欄を
読み取り対象の文字列とし,異常の有る診療報酬明細書
を判別する手段として保険点数欄と保険点数明細欄の数
字の矛盾の有無を判別する手段を有する文書認識装置。 - 【請求項13】請求項10記載の文書認識装置におい
て,診療報酬明細書中の保険点数明細欄中の医療行為名
と回数と保険点数を読み取り対象の文字列とし,異常の
有る診療報酬明細書を判別する手段として保険明細欄に
記載された医療行為と保険点数と回数の間の矛盾の有無
を判別する手段を有する文書認識装置。 - 【請求項14】請求項10記載の文書認識装置におい
て,診療報酬明細書中の保険点数明細欄中の医療行為名
と回数と保険点数を読み取り対象の文字列とし,異常の
有る診療報酬明細書を判別する手段として保険明細欄に
記載された医療行為と保険点数と回数の間の矛盾の有無
を判別する手段を有する文書認識装置。 - 【請求項15】請求項10記載の文書認識装置におい
て,診療報酬明細書中の診療年月と被保険者番号記号を
読み取り対象の文字列とし,異常の有る診療報酬明細書
を判別する手段として被保険者の診療歴を記憶する手段
と,同一被保険者の同一月の診療回数が一定値以上の診
療報酬明細書を判別する手段とを有する文書認識装置。 - 【請求項16】請求項10記載の文書認識装置におい
て,診療報酬明細書中の被保険者番号記号と医療機関番
号と初診の保険点を読み取り対象の文字列とし,異常の
有る診療報酬明細書を判別する手段として被保険者の診
療歴を記憶する手段と,同一被保険者に対し同一医療機
関が複数回初診療を行なっている診療報酬明細書を判別
する手段とを有する文書認識装置。 - 【請求項17】請求項10記載の文書認識装置におい
て,診療報酬明細書中の診療実日数を読み取り対象の文
字列とし,異常の有る診療報酬明細書を判別する手段と
して診療実日数が一定値以上の診療報酬明細書を判別す
る手段を有する文書認識装置。 - 【請求項18】請求項10記載の文書認識装置におい
て,診療報酬明細書中の合計点数を読み取り対象の文字
列とし,異常の有る診療報酬明細書を判別する手段とし
て合計点数が一定値以上の診療報酬明細書を判別する手
段を有する文書認識装置。 - 【請求項19】請求項10記載の文書認識装置におい
て,診療報酬明細書の異常が検出された場合には認識後
直ちに特定のシンボルを診療報酬明細書に印刷する手段
を有する文書認識装置。 - 【請求項20】請求項10記載の文書認識装置におい
て,診療報酬明細書の異常が検出されたか否かに応じ認
識後直ちに診療報酬明細書を異なる箇所に格納する手段
を有する文書認識装置。 - 【請求項21】診療報酬明細書中の通し番号を読み取る
手段と,読み取った通し番号が予め記憶してある番号と
一致する場合には認識後直ちに特定のシンボルを診療報
酬明細書に印刷する手段とを有する文書認識装置。 - 【請求項22】診療報酬明細書中の通し番号を読み取る
手段と,読み取った通し番号が予め記憶してある番号と
一致するか否かに応じ認識後直ちに診療報酬明細書を異
なる箇所に格納する手段を有する文書認識装置。 - 【請求項23】請求項19記載の文書認識装置におい
て,シンボルの印刷位置を認識の際に抽出した文字行の
位置を基に決定することを特徴とする文書認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5262101A JPH07114619A (ja) | 1993-10-20 | 1993-10-20 | 文書認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5262101A JPH07114619A (ja) | 1993-10-20 | 1993-10-20 | 文書認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH07114619A true JPH07114619A (ja) | 1995-05-02 |
Family
ID=17371054
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5262101A Pending JPH07114619A (ja) | 1993-10-20 | 1993-10-20 | 文書認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH07114619A (ja) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0962794A (ja) * | 1995-08-24 | 1997-03-07 | Fujitsu Ltd | 文書認識装置 |
| JP2002183381A (ja) * | 2000-06-30 | 2002-06-28 | Data Horizon:Kk | レセプト監査システム、レセプト監査方法、記録媒体およびコンピュータプログラム |
| JP2008033830A (ja) * | 2006-07-31 | 2008-02-14 | Fujitsu Ltd | 帳票処理プログラム、該プログラムを記録した記録媒体、帳票処理装置、および帳票処理方法 |
| JP2011150463A (ja) * | 2010-01-20 | 2011-08-04 | Fuji Xerox Co Ltd | 帳票識別装置、帳票識別プログラム及び帳票処理システム |
| JP2014235694A (ja) * | 2013-06-05 | 2014-12-15 | 株式会社日立情報通信エンジニアリング | 帳票処理装置、帳票処理方法、帳票処理プログラム |
| CN114743207A (zh) * | 2022-03-29 | 2022-07-12 | 深圳怡化电脑股份有限公司 | 一种票据图像识别方法和装置 |
| WO2022254560A1 (ja) * | 2021-05-31 | 2022-12-08 | 株式会社KPMG Ignition Tokyo | 光学文字認識により生成されるテキストデータを用いたデータマッチング |
-
1993
- 1993-10-20 JP JP5262101A patent/JPH07114619A/ja active Pending
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH0962794A (ja) * | 1995-08-24 | 1997-03-07 | Fujitsu Ltd | 文書認識装置 |
| JP2002183381A (ja) * | 2000-06-30 | 2002-06-28 | Data Horizon:Kk | レセプト監査システム、レセプト監査方法、記録媒体およびコンピュータプログラム |
| JP2008033830A (ja) * | 2006-07-31 | 2008-02-14 | Fujitsu Ltd | 帳票処理プログラム、該プログラムを記録した記録媒体、帳票処理装置、および帳票処理方法 |
| JP2011150463A (ja) * | 2010-01-20 | 2011-08-04 | Fuji Xerox Co Ltd | 帳票識別装置、帳票識別プログラム及び帳票処理システム |
| JP2014235694A (ja) * | 2013-06-05 | 2014-12-15 | 株式会社日立情報通信エンジニアリング | 帳票処理装置、帳票処理方法、帳票処理プログラム |
| WO2022254560A1 (ja) * | 2021-05-31 | 2022-12-08 | 株式会社KPMG Ignition Tokyo | 光学文字認識により生成されるテキストデータを用いたデータマッチング |
| CN114743207A (zh) * | 2022-03-29 | 2022-07-12 | 深圳怡化电脑股份有限公司 | 一种票据图像识别方法和装置 |
| CN114743207B (zh) * | 2022-03-29 | 2025-11-07 | 深圳怡化电脑股份有限公司 | 一种票据图像识别方法和装置 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4996940B2 (ja) | 帳票認識装置およびそのプログラム | |
| US8270721B2 (en) | Method and system for acquiring data from machine-readable documents | |
| JP3375766B2 (ja) | 文字認識装置 | |
| US6950555B2 (en) | Holistic-analytical recognition of handwritten text | |
| JP6528147B2 (ja) | 会計データ入力支援システム、方法およびプログラム | |
| JP3294995B2 (ja) | 帳票読取装置 | |
| WO2017214073A1 (en) | Document field detection and parsing | |
| CN115039144B (zh) | 处理手写中的数学和文本的方法和计算装置 | |
| KR19980018029A (ko) | 문자 인식 장치 | |
| KR102572180B1 (ko) | 텍스트 분류 | |
| EP3955130A1 (en) | Template-based document extraction | |
| CA3234169A1 (en) | System for transportation and shipping related data extraction | |
| Al-Barhamtoshy et al. | An arabic manuscript regions detection, recognition and its applications for OCRing | |
| US5909509A (en) | Statistical-based recognition of similar characters | |
| JPH07114619A (ja) | 文書認識装置 | |
| CN115004262A (zh) | 手写中的结构分解 | |
| JPH09204492A (ja) | 帳票処理装置 | |
| Kumar et al. | Line based robust script identification for indianlanguages | |
| JP5134383B2 (ja) | Ocr装置、証跡管理装置及び証跡管理システム | |
| JPH0689365A (ja) | 文書画像処理装置 | |
| JP2581353B2 (ja) | グラフ画像登録システム | |
| Raj et al. | Handwriting detection using object detection models | |
| Mao et al. | A system for automatically reading iata flight coupons | |
| JPH10134141A (ja) | 文書照合装置および方法 | |
| JP3000349B2 (ja) | キー入力編集方法及び編集装置 |