JPH07114619A

JPH07114619A - 文書認識装置

Info

Publication number: JPH07114619A
Application number: JP5262101A
Authority: JP
Inventors: Masashi Koga; 昌史古賀; Yoshihiro Shima; 好博嶋; Kiyomichi Kurino; 清道栗野; Takeyuki Sugimoto; 建行杉本; Katsumi Marukawa; 勝美丸川; Hidekazu Hatano; 英一羽田野; Kazuki Nakajima; 和樹中島
Original assignee: Hitachi Ltd
Current assignee: Hitachi Ltd
Priority date: 1993-10-20
Filing date: 1993-10-20
Publication date: 1995-05-02

Abstract

(57)【要約】【目的】文書中の文字を認識する装置において，文字
の配置に多様性が有り，位置ずれも大きい文書中より，
所望の属性の文字列を抽出する。【構成】従来の文字認識装置に備わっている画像管理
（画像入力）部１０２，文字認識部１０８に加え，文字
行抽出手段１０３と，複数通りの文字行抽出結果の候補
を格納すると文字行候補の文書構成要素に対する対応関
係とを記憶する文字行候補テーブル１１１と，文字行の
候補を予め記憶してある文書の構成要素と照合する局所
照合手段１０４と，文書の構成要素間の制約条件を照合
する大局照合手段１０５とを有する。【効果】予め記憶させてある文字列の配置関係と矛盾
のないように，各文字行の候補と文書の構成要素の対応
付けが得られ，所望の属性の文字列が求められる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は，帳票上に記入された文
字を読み取り，計算機に入力する文字認識装置に関す
る。

【０００２】

【従来の技術】従来より，専用の帳票上のあらかじめ指
定された場所に記入された文字を読み取るＯＣＲ（光学
的文字認識装置）が用いられている。これらＯＣＲは，
記入文字の多少のはみ出しには対応することはできる
が，書式が異なり文字の記入位置が大幅に異なる帳票は
読み取ることができない。また，任意の書式の文書中の
文字を読み取るテキストリーダーと呼ばれる装置が用い
られている（ " Development of Japanese Document Re
cogintion System", Second Annual Symposium onDocum
net Analysis and Information Retrieval, P. 233 - 2
42［１］）。テキストリーダーは文書中より自動的に文
字行の位置を検出し文字を読み取ることができる。しか
し，各々の文字行中の文字列のいずれが文書題目である
かかいった文字列の属性の対応付けを自動的に行なうこ
とはできない。また，特許明細書の先頭のページ中より
自動的に発明の名称などの記入されている位置を検出す
る方式が知られている（「自動ファイリングのための文
書理解の位置方式」電子情報通信学会論文誌ＤＶＯ
Ｌ．Ｊ７１−ＤＮＯ．１０ｐ．２０５０ −２
０５８［２］）。この方式においては，文書画像中より
抽出した文字行の外形，位置などをあらかじめ記憶して
ある文書の書式に関する知識と照合することにより，各
々の文字行に含まれる文字列の属性を求める。また，名
刺中より自動的に会社名，氏名などを検出する方式が知
られている（「文書画像理解における単語情報と論理構
造の援用」，ＰＲＵ８９ー９０［３］）。この方式にお
いては，文字行を抽出し，さらに文字行中の文字を読み
取り，単語の種類や単語間の接続条件を用いて会社名，
氏名などの特定の属性の文字列を検出する。

【０００３】

【発明が解決しようとする課題】上記の従来技術によ
り，文書中より特定の属性を持つ文字列を読み取ること
が可能となっている。しかし，通常の事務処理において
用いられる伝票では，読み取り対象である文字列とその
他の予め印刷されてある文字（プレプリント文字）の配
置関係は多様であるために，位置や外形の情報により文
字列の属性を求めることが困難である場合がある。また
記入文字の位置ずれが大きいために，文字列の順序関係
が明確でなく単語間の接続条件で文字列の属性を求める
ことが困難である場合がある。また，帳票で頻繁に読み
取り対象とされる数字は文字列の種類によって属性を判
別することは出来ない。またプレプリント文字や所望の
属性以外の文字列が多いために，全ての文字を読み取っ
て単語の種類より文字列の属性を求めるのが困難である
場合がある。

【０００４】本発明では，このような通常の事務処理で
用いられる伝票中の特定の属性を持つ文字列を検出する
ために，文字列の配置の多様さや文字列の位置ずれ，不
要の文字列の多さに対応することを課題とする。

【０００５】

【課題を解決するための手段】上記課題は，文書画像を
入力する手段と，文字行中の文字を認識する手段とを有
する文字認識装置において，あいまいな箇所に対しては
文書画像中より文字行の複数の候補を抽出する手段と，
文字行の候補を複数格納する手段と，文字行の候補を予
め記憶してある文書の構成要素との対応関係の仮説を生
成する局所照合手段と，仮説間の関係を予め記憶してあ
る制約条件と照合する大局照合手段とを有することによ
り解決される。

【０００６】

【作用】文書画像入力手段は文書画像を装置へ入力す
る。文字行抽出手段は入力された文書画像中より文字行
を抽出する。この際，文書中の文字行が特定できない場
合には，複数の候補を出力する。局所照合手段は，抽出
された文字行の候補と予め記憶してある文書の構成要素
との対応関係の仮説を生成し，各々の仮説の確からしさ
を求める。大局照合手段は，生成された仮説を文字行抽
出結果に基づいて得られる組み合わせと予め記憶してあ
る制約条件とを照合し，確からしい仮説の組み合わせを
求める。

【０００７】その他の目的、構成及び作用効果は、以下
の詳細な説明から自ずと明らかになろう。

【０００８】

【実施例】図１は本発明の一実施例の構成を示す。各部
分はソフトウエアで実現してもハードウエアで実現して
もよい。全体制御部１０１はキーボード１１２，ＣＲＴ
１１３，マウス１１４，ペン１１５などを介してオペレ
ータよりの入力を受け付け，認識処理を起動し，得られ
た認識結果を出力する。画像管理部１０２は画像の入力
または出力の制御を行うものであって，全体制御部１０
１より起動され，全体制御部により指定された画像を入
力し，画像メモリ１１０に格納する。画像を入力する手
段は１０９に示すような画像を記憶する装置でも，ある
いはイメージスキャナなどの画像入力装置でもよい。文
字行抽出部１０３は全体制御部１０１より起動され，画
像メモリ１１０に格納された文書画像中から文字行の領
域の候補（文字行領域候補）を抽出し，文字行候補テー
ブル１１１へ格納する。局所照合１０４は全体制御部１
０１より起動され，文字行候補テーブル１１１に格納さ
れた文字行領域候補と構成要素辞書１１８に格納された
文書の構成要素に関する情報を照合する。位置・外形照
合部１０６は局所照合部１０４より起動され，文字行候
補テーブル１１１中の文字行領域候補と構成要素辞書中
の文書の構成要素との対応を文字行の位置と外形より照
合する。単語照合部１０７は局所照合部１０４より起動
され，必要に応じて文字認識部１０８を起動して文字行
内の文字を読み取り，文字行候補テーブル１１１中の文
字行領域候補と構成要素辞書中の文書の構成要素との対
応付けを単語照合により行なう。局所照合部１０４によ
って得られた文字行領域候補と構成要素辞書中の文書の
構成要素との対応は文字行領域候補テーブルに格納され
る。大局照合部１０５は，文字行候補テーブル１１１に
格納された文字行領域候補と構成要素辞書中の文書の構
成要素との対応が予め制約条件辞書に記憶してある構成
要素同士の制約条件と矛盾がないかを調べ，正しい文字
行領域候補のならびを選び出す。

【０００９】図２に従来技術の認識対象を示す。（Ａ）
はＯＣＲの読み取り対象の文字に記入の仕方を示す。読
み取り対象の文字は予め指定された枠内に記入する。枠
内に記入される文字列の属性は予め記憶してある。
（Ｂ）はテキストリーダーの認識対象とする文書の例を
模式的に示す。テキストリーダーは文書中の文字行の位
置を自動的に抽出し文字を認識する。さらに，抽出した
文字行の位置関係や外形に基づき，文書題目などの特定
の属性を持つ文字列を抽出する方式が知られている。
（Ｃ）は単語の接続関係や単語の種類によって文字列の
属性を検出する方式の認識対象を模式的に示す。この例
では，文字行を認識してえられた文字列中より「大学」
というキーワードを検出し，さらに「大学」に隣接する
文字列を融合して大学名という属性を持った文字列とし
て抽出する。

【００１０】図３は本発明の認識対象の例を示す。この
例では「合計」「円」というプレプリント文字と金額を
表す数字が存在する枠内より，金額を表す数字を抽出す
ることを目的とする。プレプリント文字の配置は（A）
（Ｂ）（Ｃ）に示すように多様である。（Ｂ）と（Ｃ）
は文字列の配置に関する情報のみでは「円」と金額を区
別することが出来ない。また，（Ａ）と（Ｂ）では
「円」と金額の上下関係が入れ替わっており，単語の接
続関係から文字列の属性を求めることが出来ない場合が
ある。

【００１１】図４は本発明の認識対象の別の例を示す。
（Ａ）のような画像からは（Ｂ）および（Ｃ）（Ｄ）の
３通りの文字行抽出結果が得られる可能性がある。いづ
れが妥当かは，文字認識の結果を用いなければ決定する
ことが出来ない。もし（Ｃ）や（Ｄ）という結果のみで
は単語の接続関係を用いる方式では年や月の属性を持つ
文字を検出できない。

【００１２】図５は本発明の認識対象の別の例を示す。
この例では画像中より年と月を表す文字を抽出すること
を目的とする。この例では目的以外の文字が数多く近傍
に配置されている。これらの全ての文字を認識して単語
の接続関係より目的の文字を抽出することは可能である
が，多くの処理時間が必要である。また文字行の外形や
位置のみからでは「平成」と「５」の区切りを検出する
ことは困難である。

【００１３】図６に本発明における帳票認識処理の手順
を示す。まずステップ６０１において文書画像を装置中
に入力する。次にステップ６０２において文書画像中よ
り文字行を抽出する。抽出した各々の文字行は文字行領
域候補としてその位置，外形を記憶する。また文字行と
して同時に存在しうる文字行領域候補の組み合わせを文
字行候補列として記憶する。文字行領域候補および文字
行候補列は文字行候補テーブルに記憶する。次に，ステ
ップ６０３において全ての文字行領域候補について局所
照合を行なう。局所照合は２段階にからなる。第一段階
としてステップ６０４において文字行の位置と外形より
抽出した文字行領域候補と構成要素辞書に記憶されてい
る文書の構成要素の対応付けを行ない，得られた対応関
係を構成要素仮説として文字行候補テーブルに記憶す
る。第二段階として各構成要素仮説毎に必要に応じて当
該文字行中の文字を認識して単語照合を行なう。次にス
テップ６０６において全ての文字行候補列について含ま
れる文字行領域候補の構成要素仮説が矛盾がないかどう
かを調べ，正しい文字行候補列を選び出す。次にステッ
プ６０７において正しい文字行候補列に基づいて所望の
属性を有する文字列を選び出し，認識結果として出力す
る。図７に文字行抽出処理の処理の作用を示す。以下
では「合計」「１００」「円」の３つの文字列が含まれ
る文書画像から金額という属性を持つ「１００」を抽出
する例について説明する。文字行抽出処理においては
（Ａ）に示すような画像から文字が横方向に連なってい
る領域を文字行として抽出する。このような方式には連
結成分融合法（"A New Method of Document Structure
Extraction using GenericLayout Knowledge", Interna
tional Workshop on Industrial Applications ofMachi
e Intelligence and Vision (MIV-89), pp.282 - 287,
1989［４］）がある。この方式においては連結成分の位
置関係を利用して連結成分同士を次々と融合して文字行
領域を抽出する。位置関係の判定には結成分の中心のＸ
座標の差やＹ座標の差など特徴量が予め指定してあるし
きい値内にあるかどうかを調べる方式などがあるが，こ
の際しきい値の値を変えると（Ｂ）に示すように異なる
文字行領域の候補が抽出される。例えば，「円」の部分
は７０４に示すように一通りの文字行領域の候補が抽出
されるが，「合計」と「１００」の部分は７０１と７０
２のように二つの文字行に別れる場合と７０３に示すよ
うに一つの文字行になる場合の二通りの候補が抽出され
る。本実施例では文字行を抽出する際のしきい値を複数
用い，これらしきい値により文字行の抽出結果が変わる
場合には，このようにして複数の文字行領域の候補を抽
出する。文字行抽出した結果は，（Ｃ）に示すように，
文字行領域候補のならびすなわち文字行候補列として文
字行候補テーブル１１１に格納する。この例では７０５
および７０６の２つの文字行候補列が出力されており，
それぞれが可能の文字行の組み合わせを表している。
Ａ，Ｂ，Ｃ，Ｄはそれぞれ７０１，７０２，７０４，７
０３の文字行領域候補に対応する。

【００１４】図８は位置・外形照合処理の作用を示す。
文字行領域候補Ａ，Ｂ，Ｃ，Ｄが予め記憶してあるα，
β，γ，δの文書の構成要素（各々「合計」，数字，
「円」，「合計円」に対応する。）のいづれに対応す
るかを本処理によって判別する。判別結果は構成要素仮
説データとして格納される。一つの文字行領域候補が複
数の構成要素に対応する場合もある。このため，構成要
素仮説データは図中の８０１，８０２，８０３，８０４
に示すように，ポインタで連結されてリスト状に格納さ
れる。たとえば，文字行領域候補Ａが「合計」に対応す
ると判別されると，構成要素仮説データ８０５がリスト
８０１に連なる形で格納される。文字行領域候補Ｂには
数字と「円」と２通りの構成要素仮説が生成され，それ
ぞれが８０６，８０７に示すようにリスト８０２に連な
って格納される。なお，この段階で構成要素との対応が
不明の文字行領域候補に対し，他の文字行と融合して別
の文字行領域候補を生成する，あるいは文字行を分割し
て文字行領域候補を生成する，しきい値をさらに変更し
て文字行抽出を再試行する等のリトライ処理を付け加え
てもよい。（Ｂ）は構成要素辞書の形式の例を示す。こ
の例では文字行の幅，長さの最大値／最小値８１１，８
１２と文字行の重心のＸ座標およびＹ座標の最大値／最
小値８１３，８１４が構成要素辞書内に格納してある。
文字行の上端，下端，左端，右端の最大値／最小値など
を格納し位置・外形照合処理に用いてもよい。さらに後
述する単語照合の要不要に関する情報８１５および照合
する単語８１６も構成要素辞書に格納する。図中の８１
６内の漢字は照合の対象の単語，ｎｎｎは３桁以下の数
字を示す。

【００１５】図９は単語照合処理の作用を示す。上記の
位置・外形照合処理によって得られた構成要素仮説毎に
必要に応じて単語照合を行なう。単語照合をするか否か
は構成要素辞書に格納してある単語照合の要不要の情報
に基づいて決定する。単語照合をする場合には，まず構
成要素仮説で構成要素に対応する文字行領域候補内の文
字を読み取り，得られた文字列中に構成要素辞書内の当
該構成要素の箇所に格納されている単語が含まれている
かどうかを調べ，含まれていない場合にはその構成要素
仮説を棄却する。図中の８０７および８０９は棄却され
た候補である。文字認識結果と単語を照合する方式とし
ては "A high speed word matching algorithm for han
dwritten chinese character recognition［５］" など
ので知られている方式を用いることができる。本方式の
ように文書の構成要素の種類により文字認識を行なうか
否かを切り替えることにより，不要な文字認識を行なう
必要がなくなり，不要な文字が多い帳票の読み取りにも
対応できるようになる。また読み取りの要不要に併せて
手書きか漢字か，あるいは数字かかなか漢字かといった
読み取り対象の字種を構成要素辞書に格納しておきこれ
に基づき認識処理を切り替えることにより，読み取りの
精度を向上することができる。

【００１６】図１０は大局照合処理の作用を示す。文字
行抽出処理で得られた文字行候補列にそって各文字行領
域候補に対応する構成要素仮説の組み合わせを求め，そ
の組み合わせが予め制約条件辞書に格納してある条件の
いずれかを満たすならばその構成要素仮説の組み合わせ
が認識対象の書式を表しているものとし，その中の出力
が必要な文字行中の文字を認識し，出力する。出力の要
不要に関する情報は構成要素辞書に格納する。（Ａ）の
１００１は制約条件を満たした文字行候補列で，図９
（Ｂ）の構成要素辞書中の出力要不要の情報８１７に基
づき，Ｂの認識結果の「１００」が金額として出力され
る。１００２は棄却された文字行候補列である。（Ｂ）
は制約条件辞書の一例を示す。図中の関数ｅｘｉｓｔ
（ｘ）は構成要素ｘが構成要素仮説のならびに存在する
ことを示す。またｌｅｆｔ（ｘ，ｙ）は構成要素ｘに対
応する文字行の重心ががｙに対応する文字行の重心より
左にあることを意味する。本例では文字行候補列１００
１は制約条件辞書内の条件１００３を満たした。また，
１００４の条件を満たす文字行候補列はなかった。位置
関係として重心の上下関係を用いてもよい。また，左右
端のＸ座標，上下端のＹ座標等を用いてもよい。

【００１７】図１１は本発明を用いた文書認識装置の例
を示す。本例では診療報酬明細書中の文字列を読み取
り，記入内容に異常のある診療報酬明細書を選び出すこ
とを目的とする。各部は制御部１１１１により制御され
る。診療報酬明細書はシートフィーダー１１０１により
連続的にスキャナ１１０２に装填され画像データとして
入力される。図中の二重線はレセプトシートの流れを示
す。文書認識部１１０５は上に説明した方式により診療
年月，医療機関コード，保険者コード，被保険者コー
ド，氏名，性別および生年，傷病名，医療行為，保険点
数，保険点数明細，合計点，診療実日数を読み取る。保
険点数チェック部１１０９は以下の処理を行なう。
（１）医療行為明細と保険点数明細の間の矛盾の有無を
判別する。判別の際には，医療行為と保険点数の関係を
予め記憶してある保険点数辞書１１１１を参照する。診
療歴チェック部１１０８は以下の処理を行なう。（１）
被保険者番号を基に当該被保険者の診療歴を検索し，そ
の結果と診療年月とを比較し，一ヶ月あたりの診療回数
が一定値を越えているか否かを判別する。（２）被保険
者番号より当該被保険者の診療歴を検索し，その結果と
初診欄の保険点数の記入の有無より，同一被保険者に対
し同一医療機関が初診料を重複して請求しているか否か
を判別する。（３）診療実日数が一定値を越えているか
否かを判別する。判別の際には，被保険者の診療歴を記
憶した診療歴辞書１１１０を参照する。合計点チェック
部１１０７は以下の処理を行なう。（１）保険点数の合
計が合計点の数字に一致しているか否かを判別する。
（２）保険点数が保険点数明細の合計と一致しているか
否かを判別する。（３）合計点数が一定値を越えている
か否かを判別する。特定ＩＤチェック部１１０６は，異
常が予想される診療報酬明細書のＩＤすなわち特定ＩＤ
と読み取った結果のＩＤが同一であるか否かをチェック
する。保険点数チェック部１１０９，診療歴チェック部
１１０８，合計点チェック部１１０７，特定ＩＤチェッ
ク部１１０６の処理結果に応じ，印刷装置１１０３は特
定の記号を診療報酬明細書に印刷し，仕分け装置は認識
済の診療報酬明細書の格納場所を変更する。

【００１８】図１２は診療報酬明細書中の文字列の配置
の例を示す。診療報酬明細書の書式は厚生省告示第１７
７号健康保険法に定められている。しかし，各項目の寸
法や枠線の形状にはばらつきがある。このため，従来技
術では診療年月等の特定の属性を有する文字列を自動的
に識別し読み取ることは困難であったが，本発明により
診療報酬明細書中の各文字列の属性を識別し読み取るこ
とができるようになる。診療年月１２０１は，診療報酬
明細書の作成された年月である。医療機関コード１２０
２は，診療報酬明細書を作成した医療機関を表す番号で
ある。保険者番号１２０３は，保険を運営する団体を表
す番号である。被保険者番号１２０４は被保険者を表す
番号である。氏名１２０５は医療行為を受けた者の氏名
である。性別・生年１２０６は医療行為を受けた者の性
別および生年である。傷病名１２０７は医療行為の対象
となった傷病名である。医療行為１２０８は行なわれた
医療行為であり，初診，投薬，処置などに分類して記入
される。保険点数１２０９は医療行為に対応する点数で
あり，これを基に保険金額が計算される。医療行為明細
１２１０および保険点数明細１２１１は医療行為および
それに対応する保険点数の明細である。医療行為と保険
点数の関係は厚生省告示第１７７号健康保険法第４３条
の別表により定められており，この内容を予め装置内に
記憶しておけば，両者の矛盾を判別するのは容易であ
る。ＩＤ１２１２は診療報酬明細書毎に整理のために印
刷される番号である。

【００１９】図１３は図１１の例における認識結果に応
じた記号の印刷の例を示す。（Ａ）は合計点数欄に異常
があった場合の例である。認識の過程で検出されている
合計点数１３０１の位置の左隣に異常を示す記号１３０
２を印刷している。印刷する記号は本例の様に特殊な記
号でも「注意」といった文字でもよい。（Ｂ）は診療実
日数に異常があった場合の印刷の別の例である。この例
では紙の上端に合計点および診療実日数の異常の有無を
文字で印刷してある。

【００２０】図１４は文字行を抽出する処理の手順の例
である。まずステップ１４０１において処理対象の画像
中の連結成分を求め，各々の連結成分の外接矩形を抽出
する。次にステップ１４０２において上記矩形座標の相
関に応じて矩形同士を融合する。さらにステップ１４０
３から１４０４までの融合処理において直前の処理にお
いて抽出された矩形の座標の相関に応じて矩形同士を融
合する。矩形融合の段数は処理対象に応じ３段より多く
ても少なくてもよい。また各融合処理の内容は同じであ
っても段毎に異なってもよい。次にステップ１４０５に
おいてステップ１４０４までの処理で抽出された矩形の
外形を調べ，文字行として適正な幅及び長さで有るかい
なかを調べ，文字行として適正なものを文字行候補テー
ブル１１１文字行へ出力する。

【００２１】図１５は文字行抽出処理における第一段融
合処理の原理を示す。第一段融合は連結成分外接矩形の
集合より，文字の外接矩形を求めることを目的とする。
（Ａ）は入力の画像の例を示す。図中の「昭」「和」
「年」はプレプリント文字である。また，「２」は後か
ら記入された文字であり，プレプリントに対して下方向
にずれている。（Ｂ）は連結成分外接矩形抽出結果を模
式的に示す。連結成分外接矩形とは，画像中の連続した
黒画素の塊に外接する，各辺がＸ軸またはＹ軸に平行な
矩形である。連結成分外接矩形抽出処理は，入力画像中
の連結成分外接矩形の全てからなる集合を求める処理で
ある。（Ｃ）は連結成分外接矩形を融合するか否かを判
定するための条件を示す。１５０３及び１５０４は連結
成分外接矩形である。１５０１は連結成分外接矩形のＸ
方向の距離，１５０２はＹ方向の距離である。第一段融
合においてはＸ方向の距離及びＹ方向の距離がそれぞれ
予め定められた値以下の場合に矩形同士を融合する。
（Ｄ）は矩形の融合結果の例を示す。矩形の融合とは，
２つの矩形の外接し各辺がＸ軸またはＹ軸に平行な矩形
をもとめて矩形集合に追加すると共に，元の２つの矩形
を矩形の集合から削除する処理である。本例では「昭」
「和」中の連結成分外接矩形がそれぞれ一つに融合され
ている。

【００２２】図１６は，文字行抽出処理における第二段
および第三段融合処理の原理を示す。第二段および第三
段融合処理は文字の外接矩形の集合より文字行の外接矩
形を求めることを目的とする。（Ａ）は矩形を融合する
か否かを判定するための条件を示す。１６０１は矩形上
端座標の差（Ｔｄ）である。１６０２は矩形下端座標の
差（Ｂｄ）である。１６０３は矩形のＸ方向の距離（Ｘ
ｄ）である。１６０４は矩形の高さ（Ｈ２）である。第
二段および第三段融合処理においては，Ｔｄ＜ＣＴｄか
つＢｄ＜ＣＢｄかつＸｄ＜ＣＸｄかつＣＨ２１＜Ｈ２＜
ＣＨ２２である場合に矩形同士を融合する。ＣＴｄ，Ｃ
Ｂｄ，ＣＸｄ，ＣＨ２１，ＣＨ２２は各処理によって異
なってもよい。（Ｂ）は第二段融合処理の結果の一例を
示す。本例では図１５（Ａ）における「昭」と「和」の
外接矩形が融合され，「昭和」「２」「年」の３つの矩
形が出力される。これを第三段融合の入力としても，こ
の結果自身を文字行としても出力してもよい。（Ｃ）は
第二段融合処理の結果の別の例を示す。本例はＣＸｄの
値が（Ｂ）より大きい例で，図１５（Ａ）における
「昭」と「和」と「年」の外接矩形が融合され，「昭和
年」「２」の２つの矩形が出力される。（Ｄ）は第三段
融合処理の結果の例を示す。本で例は（Ｃ）の結果に対
し，ＣＴｄおよびＣＢｄの値を大きくし，ＣＸｄの値を
小さくして融合するか否かを判定している。「昭和年」
と「２」の矩形が融合され，文字行外接矩形として出力
される。

【００２３】図１７は文字行抽出結果の修正画面であ
る。マウスカーソル１７０１，表示ウインドウ１７０２
がＣＲＴ１１３に表示される。表示ウインドウ１７０２
中には入力画像１７０３，文字行外接矩形候補１７０４
および１７０５，次候補ボタン１７０６，前候補ボタン
１７０７，認識ボタン１７０８が表示される。もし表示
されている文字行外接矩形候補１７０４が誤っている場
合には，操作者はマウスカーソル１７０１で次候補ボタ
ン１７０６または前候補ボタン１７０７をクリックする
ことにより，異なるパラメータＣＴｄ，ＣＢｄ，ＣＸ
ｄ，ＣＨ２１，ＣＨ２２の値で文字行抽出処理を行なっ
た結果１７０９が再び表示ウインドウ１７０２に表示で
きる。異なるパラメータで文字行抽出処理を行なった結
果は予め生成して記憶しておいても，ボタンがクリック
されてから生成してもよい。

【００２４】図１８は融合を複数段に分けることが効果
的な例を示す。（Ａ）は入力画像である。この例では文
字以外にノイズが画像に含まれている。（Ｂ）は１段の
処理で（Ａ）の画像の連結成分外接矩形を統合して文字
行外接矩形を抽出することを試みた例である。この場
合，ノイズを文字行中の連結成分と誤認し，誤って文字
行外接矩形を大きくとってしまうことは避けられない。
（Ｃ）は（Ａ）の画像の連結成分外接矩形を統合して文
字の外接矩形を求めた結果である。この場合，ノイズと
文字の間に十分な距離があれば，ノイズと文字は別々の
矩形となる。（Ｄ）は（Ｃ）の結果より図１６で説明し
た第二段，第三段の融合を行なった結果である。この場
合，高さがＣＨ２１に満たないノイズは融合されず，図
に示すように正しく文字行外接矩形が抽出される。ノイ
ズの外接矩形は外接矩形判定１４０５において文字行で
ないと判定することができる。

【００２５】図１９は読み取り対象の文字行を抽出する
別の方式の例である。図中（Ａ）の様に文字行を抽出す
るのが困難な場合，（Ｂ）に示すようにまずサイズ，位
置などがおおよそ定められており，比較的抽出が容易な
「年」の領域１９０１を抽出する。次に年の左側の領域
で文字行１９０２を探索する。この場合には探索の領域
が限定されていて文字行以外の連結成分に妨害されるこ
とがなく，比較的容易に年を表す数字の文字行を抽出で
きる。

【００２６】

【発明の効果】従来の方式では読み取ることが困難であ
った文字列の配置の多様さで文字列の位置ずれが大きく
不要の文字列の多い帳票中より所望の属性の文字列を認
識し出力することができる。

【図面の簡単な説明】

【図１】本発明の一実施例のシステム構成を示す。

【図２】従来技術の認識対象を示す。

【図３】本発明の認識対象の例を示す。

【図４】本発明の認識対象の別の例を示す。

【図５】本発明の認識対象の別の例を示す。

【図６】本発明の一実施例における処理の手順を示す。

【図７】本発明の一実施例における文字行抽出処理を示
す。

【図８】本発明の一実施例における位置・外形照合処理
を示す。

【図９】本発明の一実施例における単語照合処理を示
す。

【図１０】本発明の一実施例における大局照合処理を示
す。

【図１１】本発明の第二の実施例を示す。

【図１２】第二の実施例の読み取り対象である診療報酬
明細書中の文字列の配置を示す。

【図１３】第二の実施例における認識結果に応じた印刷
の例を示す。

【図１４】文字行を抽出する処理の手順の例を示す。

【図１５】文字行抽出処理における第一段融合処理の原
理を示す。

【図１６】文字行抽出処理における第二段および第三段
融合処理の原理を示す。

【図１７】文字行抽出結果の修正画面を示す。

【図１８】融合を複数段に分けることが効果的な例を示
す。

【図１９】文字行抽出の別の方式を示す。

【符号の説明】

１０３…文字行抽出部，１０４…局所照合部，１０５…
大局照合部，１０６…位置・外形照合部，１０７…単語
照合部，１０８…文字認識部。

───────────────────────────────────────────────────── フロントページの続き (72)発明者杉本建行神奈川県小田原市国府津2880番地株式会社日立製作所ストレージシステム事業部内 (72)発明者丸川勝美東京都国分寺市東恋ケ窪１丁目280番地株式会社日立製作所中央研究所内 (72)発明者羽田野英一東京都国分寺市東恋ケ窪１丁目280番地株式会社日立製作所中央研究所内 (72)発明者中島和樹東京都国分寺市東恋ケ窪１丁目280番地株式会社日立製作所中央研究所内

Claims

【特許請求の範囲】

【請求項１】文書画像を入力する手段と，文字行中の文
字を認識する手段とを有する文字認識装置において，文
書画像中より文字行の候補を抽出する手段と，文字行の
候補を複数格納する手段と，文字行の候補を予め記憶し
てある文書の構成要素と照合する局所照合手段と，文書
の構成要素間の制約条件を照合する大局照合手段とを有
することを特徴とする文書認識装置。
【請求項２】請求項１記載の文書認識装置において，局
所照合手段として文字認識結果を単語照合する手段を有
することを特徴とする文書認識装置。
【請求項３】請求項２記載の文書認識装置において，予
め記憶してある文書構成要素毎の認識の要不要に応じて
文字認識および単語照合を起動するか否かを切り替える
ことを特徴とする文書認識装置。
【請求項４】請求項１記載の文書認識装置において，予
め記憶してある文書構成要素毎の文字認識および単語照
合の処理方式または辞書の種類に応じて起動する文字認
識および単語照合を切り替えることを特徴とする文書認
識装置。
【請求項５】請求項１記載の文書認識装置において，局
所照合手段に一つの文字行の候補に対し複数の文書の構
成要素の対応の候補を抽出し格納する手段を有すること
を特徴とする文書認識装置。
【請求項６】請求項２記載の文書認識装置において，局
所照合として文字行の位置もしくは外形の照合を併用す
ることを特徴とする文書認識装置。
【請求項７】請求項２記載の文書認識装置において，大
局照合として文字行の位置関係を用いることを特徴とす
る文書認識装置。
【請求項８】請求項２記載の文書認識装置において，大
局照合として文字行の位置関係と単語間の接続関係を併
用することを特徴とする文書認識装置。
【請求項９】請求項１記載の文書認識装置において，特
定の属性の文字行が検出した後，当該文字行に対し一定
の位置関係にある文字行を抽出することを特徴とする文
書認識装置。
【請求項１０】診療報酬明細書中の文字列を読み取る手
段と，文字列の読み取り結果より記載内容に異常の有る
診療報酬明細書を判別する手段とを有する文書認識装
置。
【請求項１１】請求項１０記載の文書認識装置におい
て，診療報酬明細書中の保険点数欄と合計点数欄を読み
取り対象の文字列とし，異常の有る診療報酬明細書を判
別する手段として保険点数欄と合計点数欄の数字の矛盾
の有無を判別する手段を有する文書認識装置。
【請求項１２】請求項１０記載の文書認識装置におい
て，診療報酬明細書中の保険点数欄と保険点数明細欄を
読み取り対象の文字列とし，異常の有る診療報酬明細書
を判別する手段として保険点数欄と保険点数明細欄の数
字の矛盾の有無を判別する手段を有する文書認識装置。
【請求項１３】請求項１０記載の文書認識装置におい
て，診療報酬明細書中の保険点数明細欄中の医療行為名
と回数と保険点数を読み取り対象の文字列とし，異常の
有る診療報酬明細書を判別する手段として保険明細欄に
記載された医療行為と保険点数と回数の間の矛盾の有無
を判別する手段を有する文書認識装置。
【請求項１４】請求項１０記載の文書認識装置におい
て，診療報酬明細書中の保険点数明細欄中の医療行為名
と回数と保険点数を読み取り対象の文字列とし，異常の
有る診療報酬明細書を判別する手段として保険明細欄に
記載された医療行為と保険点数と回数の間の矛盾の有無
を判別する手段を有する文書認識装置。
【請求項１５】請求項１０記載の文書認識装置におい
て，診療報酬明細書中の診療年月と被保険者番号記号を
読み取り対象の文字列とし，異常の有る診療報酬明細書
を判別する手段として被保険者の診療歴を記憶する手段
と，同一被保険者の同一月の診療回数が一定値以上の診
療報酬明細書を判別する手段とを有する文書認識装置。
【請求項１６】請求項１０記載の文書認識装置におい
て，診療報酬明細書中の被保険者番号記号と医療機関番
号と初診の保険点を読み取り対象の文字列とし，異常の
有る診療報酬明細書を判別する手段として被保険者の診
療歴を記憶する手段と，同一被保険者に対し同一医療機
関が複数回初診療を行なっている診療報酬明細書を判別
する手段とを有する文書認識装置。
【請求項１７】請求項１０記載の文書認識装置におい
て，診療報酬明細書中の診療実日数を読み取り対象の文
字列とし，異常の有る診療報酬明細書を判別する手段と
して診療実日数が一定値以上の診療報酬明細書を判別す
る手段を有する文書認識装置。
【請求項１８】請求項１０記載の文書認識装置におい
て，診療報酬明細書中の合計点数を読み取り対象の文字
列とし，異常の有る診療報酬明細書を判別する手段とし
て合計点数が一定値以上の診療報酬明細書を判別する手
段を有する文書認識装置。
【請求項１９】請求項１０記載の文書認識装置におい
て，診療報酬明細書の異常が検出された場合には認識後
直ちに特定のシンボルを診療報酬明細書に印刷する手段
を有する文書認識装置。
【請求項２０】請求項１０記載の文書認識装置におい
て，診療報酬明細書の異常が検出されたか否かに応じ認
識後直ちに診療報酬明細書を異なる箇所に格納する手段
を有する文書認識装置。
【請求項２１】診療報酬明細書中の通し番号を読み取る
手段と，読み取った通し番号が予め記憶してある番号と
一致する場合には認識後直ちに特定のシンボルを診療報
酬明細書に印刷する手段とを有する文書認識装置。
【請求項２２】診療報酬明細書中の通し番号を読み取る
手段と，読み取った通し番号が予め記憶してある番号と
一致するか否かに応じ認識後直ちに診療報酬明細書を異
なる箇所に格納する手段を有する文書認識装置。
【請求項２３】請求項１９記載の文書認識装置におい
て，シンボルの印刷位置を認識の際に抽出した文字行の
位置を基に決定することを特徴とする文書認識装置。