JPH0863545A - 文字認識処理装置における文字方向および行方向決定方法 - Google Patents

文字認識処理装置における文字方向および行方向決定方法

Info

Publication number
JPH0863545A
JPH0863545A JP6201149A JP20114994A JPH0863545A JP H0863545 A JPH0863545 A JP H0863545A JP 6201149 A JP6201149 A JP 6201149A JP 20114994 A JP20114994 A JP 20114994A JP H0863545 A JPH0863545 A JP H0863545A
Authority
JP
Japan
Prior art keywords
character
line
recognition processing
lattice
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6201149A
Other languages
English (en)
Inventor
Shiori Ooaku
志緒理 大阿久
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP6201149A priority Critical patent/JPH0863545A/ja
Publication of JPH0863545A publication Critical patent/JPH0863545A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【目的】 処理対象として特定された日本語の文字領域
の外接行の文字ラティスを言語処理して得られる言語情
報に基づいて特定領域の文字方向および行方向を高精度
に決定する。 【構成】 処理対象として特定された文字領域の外接行
を抽出し、各外接行に対して文字方向を生成する。各外
接行と各文字方向ごとに文字認識処理を行なって文字ラ
ティスを生成し、各文字ラティスごとに言語処理を行な
って各文字ラティスの構成単語率または自立語含有率を
求める。文字ラティスごとに求められた構成単語率また
は自立語含有率に基づいて特定領域の文字方向および行
方向を決定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文書原稿を画像データ
として入力して、文字認識処理を行なう文字認識処理装
置(OCR)において、認識対象の文字領域を単位とし
て、文字方向および行方向を決定する方法に関するもの
である。
【0002】
【従来の技術】従来より、新聞や雑誌などの縦方向の文
字、横方向の文字が混在している文書に対して文字認識
処理を行なう場合には、文字認識処理装置側で処理対象
の領域ごとに文字方向および行方向を正確に特定するこ
とは困難であった。そのために、文字認識処理の前に、
入力画像を表示装置に表示して、操作者がその対象領域
の文字方向、行方向を予め指定したり、誤認識した結果
を修正したりして文字認識処理を施すのが一般的であっ
た。
【0003】こうした操作者の指定作業、修正作業の負
担を軽減するために、文書中の各領域の大きさや縦横比
等の領域情報から文字方向、行方向を推定する方式が採
られる場合がある。しかしながら、領域情報のみに基づ
く文字方向の決定では、例外が多くなり充分な精度が得
られなかった。
【0004】また、特開平4ー312162号公報に
は、罫線で分離された各領域に対して縦書きと横書きの
文字列を作成して、その文字列に対して形態素解析を行
ない、その分割結果からこの文字行中の未知語数が少な
い文字列を正しい文字列として判定する技術が記載され
ている。このように言語的情報から行方向を推定する方
式は、領域情報のみで判定する方式より精度が高いと推
測される。
【0005】しかしながら、上記公報記載の方式は、画
像の上下方向が正しく入力された罫線で分離された領域
に対する処理を前提としており、罫線で分離されていな
い文書画像の行方向の判定には不具合が発生する場合が
ある。また、文字方向の決定については考慮されていな
い。
【0006】また、誤った文字方向および行方向で文字
列が生成された場合においても、形態素解析の結果とし
て未知語文字列に判定される文字列が少なくなることが
多いために誤判定を起こす場合がある。
【0007】
【発明が解決すべき課題】本発明はかかる事情に鑑み、
文字認識処理装置において、操作者の指定作業、修正作
業の負担を軽減し、処理対象として特定された日本語の
文字領域から得られる言語情報より特定領域の文字方向
および行方向を高精度に決定する文字方向および行方向
決定方法を提供することを目的とする。
【0008】
【課題を解決するための手段】上述した目的を達成する
ために、特許請求の範囲第1項記載の発明は、入力画像
中の文字領域を特定して特定領域内の文字行を切り出し
て前記特定領域の文字画像データに対して文字認識処理
を施す文字認識処理装置において、前記特定領域の全て
の外接行の各文字方向ごとに文字認識処理を施し、生成
された文字ラティスに対して言語処理を施し、前記文字
ラティスの構成単語率に基づいて前記特定領域の文字方
向および行方向を決定するように構成した。
【0009】また、特許請求の範囲第2項記載の発明
は、入力画像中の文字領域を特定して特定領域内の文字
行を切り出して前記特定領域の文字画像データに対して
文字認識処理を施す文字認識処理装置において、前記特
定領域の全ての外接行の各文字方向ごとに文字認識処理
を施し、生成された文字ラティスに対して言語処理を施
し、前記文字ラティスの自立語含有率に基づいて前記特
定領域の文字方向および行方向を決定するように構成し
た。
【0010】
【作用】本発明によれば、処理対象として特定された文
字領域の外接行を抽出し、各外接行に対して文字方向を
生成する。各外接行と各文字方向ごとに認識処理を行な
って認識候補文字の文字ラティスを生成し、各文字ラテ
ィスごとに言語処理を行なって文字列を決定して言語情
報を抽出する。各文字列の構成単語率または自立語含有
率に基づいて、言語的に最も妥当である文字方向・行方
向を処理領域の文字方向・行方向と決定する。
【0011】
【実施例】以下、図面に基づいて本発明の一実施例を詳
細に説明する。図1は本発明を文字認識装置に応用した
ブロック図であり、処理対象の文書はイメージ画像とし
て入力され、領域識別部1において、入力画像を文字領
域と写真領域、表領域等のその他の領域とに矩形状に識
別する。
【0012】この領域識別処理としては、例えば、本出
願人による特開平5−81475号公報に記載された、
入力された文書画像中の黒画素の連続性から黒ラン(黒
画素連結成分)を抽出して、隣接する黒ランを統合する
圧縮処理によって文字行を抽出し、さらに抽出した文字
行を統合することによって文字領域とその他の領域とを
識別する方法によって行なわれる。尚、上記のような処
理手段に換えてマウスなどの領域指定手段によって処理
対象の領域を指定することも可能である。
【0013】外接行抽出部2では、領域識別部1で矩形
状に文字領域と識別された処理対象の領域に対して、こ
の文字領域の最も外側に位置する最上行、最下行、最右
行、最左行、計4行の外接行を図2に示すように抽出す
る。この外接行の抽出処理は、領域識別部1における黒
ランの抽出、統合による文字行の抽出結果を利用するこ
とにより行なわれる。
【0014】文字方向生成部3では、外接行抽出部2に
よって抽出された最上行、最下行、最右行、最左行の4
つの外接行に対して、図3に示すように、各外接行につ
いて上・下・右・左の計4方向の文字方向を生成する。
【0015】文字認識処理部4では、先ず処理対象の領
域の文字方向・行方向に関する初期値を確認するために
情報格納部5を参照して、処理対象領域に関する文字方
向・行方向の情報の有無を確認する。情報格納部5に対
象領域の文字方向・行方向に関する情報が無い場合に
は、外接行抽出部2によって抽出された各外接行に対し
て、文字方向生成部3で生成した上・下・右・左の4方
向について文字認識用の辞書とのマッチングによる文字
認識処理を施す。本発明におけるマッチング処理では、
各外接行に含まれる各文字に対して複数の候補文字が出
力される。
【0016】文字認識処理部4における認識処理の結果
として、外接行を構成する各文字に対して複数の認識候
補文字のマトリクスである文字ラティスが生成される。
文字ラティスとは、ある文字列の認識処理を行なった際
に、各文字ごとに複数保持されているに認識候補文字が
格子状に連なった候補文字のマトリクスであり、単語の
概念で区切られていない状態を意味している。
【0017】文字認識処理部4では、特定領域の外接行
の文字に対して、各外接行ごとに上下左右の全ての方向
に認識処理を行なって、合計16種の文字ラティスを生
成しているために特に文字方向および行方向を決定する
際の判別精度が高められる。
【0018】言語処理部6においては、情報格納部5を
参照して対象領域に関する文字方向・行方向の情報の有
無に応じて処理が切り替えられる。情報格納部5に対象
領域の文字方向・行方向に関する情報が無い場合には、
文字認識処理部で生成した16種類の文字ラティスに対
して、単語情報、品詞情報を含んだ所定の言語辞書との
マッチングによる言語処理が施される。これは認識候補
文字の連なりである文字ラティスから、言語的に正しい
文字列を構成する認識候補文字を選択するための処理で
あり、言語処理の結果として、文字列長、文字列を構成
する単語数、各単語の品詞の内訳、各単語の表記長が文
字ラティスの言語情報として抽出される。
【0019】文字方向・行方向判定部7では、各外接行
の文字列に対して言語処理部6で抽出された言語情報に
基づいて、言語的に最も確からしい文字方向および行方
向の判定処理が施される。図4に文字方向・行方向判定
処理のフローチャートを示す。
【0020】<処理1>まず、すべての外接行の文字列
に対して、言語処理部より得られた言語情報から構成単
語率を算出する。構成単語率は、文字列を構成する単語
数を文字列長によって割った商として求める。この値の
最も小さい文字ラティスの文字方向・行方向を対象領域
における正しい文字方向・行方向であると判定する。即
ち、外接行の文字列に対して最も多くの単語が構成され
る文字方向、行方向を言語的に正当な文字方向、行方向
であると判定する。
【0021】<処理2>構成単語率が最小となる文字列
が複数ある場合には、構成単語率が最小値となった文字
列に対して、表記長が1である自立語含有率を算出す
る。自立語含有率は、表記長が1である自立語数を文字
列長によって割った商として求める。この値の最も小さ
い文字ラティスの文字方向・行方向を対象領域における
正しい文字方向・行方向であると判定する。即ち、言語
的に孤立している表記長が1の自立語数が最も少なくな
る文字方向、行方向を言語的に正当な文字方向、行方向
であると判定する。
【0022】表記長が1の自立語の抽出処理は、文字ラ
ティスに言語処理を施すことによって得られる各単語の
品詞情報によって自立語品詞テーブル8を検索すること
により実行される。自立語品詞テーブル8には漢語名
詞、和語名詞、固有名詞等の単独で意味を成す自立語に
なる確率の高い品詞名が記述されており、各単語につい
ての言語処理の結果である品詞情報と単語長により表記
長が1の自立語が抽出される。
【0023】認識対象の文書が漢字とひらがなの混じっ
た日本語の文字列である場合には、言語処理の結果とし
て得られる文字コードのうち、漢字文字コードの多く
は、表記長が1字の和語名詞や固有名詞に認識され、ひ
らがなの多くは助詞と認定される場合が多い。このとき
文字方向を誤って文字列を構成した場合には、正解文字
列より表記長1字の自立語数が多くなり、さらに、正解
文字列を構成する単語よりも、構成単語数が多くなると
いう傾向が見られる。本願発明ではこの特徴を利用する
ことにより、言語的に最も確からしい文字列を選択して
いる。
【0024】文字方向・行方向判定部7で決定された文
字方向・行方向は、情報格納部5と前領域情報格納部9
に保持されて、行切り出し部10、文字切り出し部11
に入力される。行切り出し部10、文字切り出し部11
では、情報格納部5に格納されている行方向・文字方向
に準じて、処理対象の文字領域全体の文字行の切り出し
処理、文字の切り出し処理を行い、結果を文字認識処理
部4に出力する。文字認識処理部4では、処理対象の文
字領域全体に対して文字認識用の辞書とのマッチングを
とる文字認識処理を施して文字ラティスを生成し、言語
処理部6において、文字ラティスから言語的に最も確か
らしい文字列を選択した後、CRT、プリンタ等の出力
装置より処理対象領域の文字認識結果を出力する。
【0025】情報格納部5に対象領域の文字方向、行方
向に関する情報が格納されている場合には、文字認識処
理部4、言語処理部6では、格納されている文字方向、
行方向に基づいて対象領域全体の文字ラティスに対して
文字認識処理、言語処理を行い認識結果の文字列として
出力する。対象領域の認識結果の出力後に情報格納部5
を初期化して、次の処理対象領域に対して同様の処理を
繰り返す。
【0026】また、処理対象の文字領域に仕様外の大き
さの文字やフォントが含まれている際には、上記の<処
理2>を実行した後も複数候補が存在してしまう場合が
ある。この場合、文字方向・行方向判定部7は、前領域
情報格納部9を参照して、現在処理中の領域は直前に処
理を行なった領域と同様の文字方向・行方向であると判
定して、文字方向・行方向情報格納部5に情報を格納
し、行切り出し部・文字切り出し部への処理に進める。
なお、前領域情報格納部9には利用状況に応じた初期値
を設定しておくことが望ましい。
【0027】また、本実施例では自立語品詞テーブル8
を独立して設けているが、言語処理部6の言語辞書に自
立語品詞に関する情報を含めるように構成することも可
能である。この場合は、言語処理部6の出力に自立語品
詞の判定情報が含まれる。
【0028】
【発明の効果】請求項1記載の発明においては、処理対
象領域の外接行について、正解候補となる全ての文字方
向と行方向の文字ラティスを生成して言語処理を行な
い、構成単語率に基づいて文字方向および行方向と判定
することにより言語的に最も自然な単語列を形成する文
字方向および行方向を高精度に決定することが可能とな
る。
【0029】請求項2記載の発明においては、処理対象
領域の外接行について、正解候補となる全ての文字方向
と行方向の文字ラティスを生成して言語処理を行ない、
自立語含有率に基づいて文字方向および行方向を判定す
ることにより、さらに言語情報を厳密に規定することに
より、高精度に文字方向および行方向の判定処理が可能
となる。
【0030】また、本発明は、処理対象領域の外接行の
みを言語処理の対象として文字方向および行方向判定処
理を実行するため、小さな処理領域から処理対象領域の
文字方向および行方向を高精度に決定することが可能に
なり、処理時間の短縮が図れて文字認識処理の前処理に
は特に適している。
【図面の簡単な説明】
【図1】本発明を文字認識装置に応用したブロック図で
ある。
【図2】本発明における外接行抽出処理を説明する図で
ある。
【図3】本発明における文字方向生成を説明する図であ
る。
【図4】本発明による文字方向・行方向判定処理のフロ
ーチャートである。
【図5】自立語品詞テーブルの例を示す図である。
【符号の説明】
1 領域識別部 2 外接行抽出部 3 文字方向生成部 4 文字認識処理部 5 情報格納部 6 言語処理部 7 文字方向・行方向判定部 8 自立語品詞テーブル 9 前領域情報格納部 10 行切り出し部 11 文字切り出し部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 入力画像中の文字領域を特定して特定領
    域内の文字行を切り出して前記特定領域の文字画像デー
    タに対して文字認識処理を施す文字認識処理装置におい
    て、前記特定領域の全ての外接行の各文字方向ごとに文
    字認識処理を施し、生成された文字ラティスに対して言
    語処理を施し、前記文字ラティスの構成単語率に基づい
    て前記特定領域の文字方向および行方向を決定すること
    を特徴とする文字認識処理装置における文字方向および
    行方向決定方法。
  2. 【請求項2】 入力画像中の文字領域を特定して特定領
    域内の文字行を切り出して前記特定領域の文字画像デー
    タに対して文字認識処理を施す文字認識処理装置におい
    て、前記特定領域の全ての外接行の各文字方向ごとに文
    字認識処理を施し、生成された文字ラティスに対して言
    語処理を施し、前記文字ラティスの自立語含有率に基づ
    いて前記特定領域の文字方向および行方向を決定するこ
    とを特徴とする文字認識処理装置における文字方向およ
    び行方向決定方法。
JP6201149A 1994-08-25 1994-08-25 文字認識処理装置における文字方向および行方向決定方法 Pending JPH0863545A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6201149A JPH0863545A (ja) 1994-08-25 1994-08-25 文字認識処理装置における文字方向および行方向決定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6201149A JPH0863545A (ja) 1994-08-25 1994-08-25 文字認識処理装置における文字方向および行方向決定方法

Publications (1)

Publication Number Publication Date
JPH0863545A true JPH0863545A (ja) 1996-03-08

Family

ID=16436205

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6201149A Pending JPH0863545A (ja) 1994-08-25 1994-08-25 文字認識処理装置における文字方向および行方向決定方法

Country Status (1)

Country Link
JP (1) JPH0863545A (ja)

Similar Documents

Publication Publication Date Title
EP0439951B1 (en) Data processing
EP1016033B1 (en) Automatic language identification system for multilingual optical character recognition
US5745600A (en) Word spotting in bitmap images using text line bounding boxes and hidden Markov models
US5438630A (en) Word spotting in bitmap images using word bounding boxes and hidden Markov models
US8208765B2 (en) Search and retrieval of documents indexed by optical character recognition
EP0844583B1 (en) Method and apparatus for character recognition
US8908961B2 (en) System and methods for arabic text recognition based on effective arabic text feature extraction
JP2973944B2 (ja) 文書処理装置および文書処理方法
JP3232143B2 (ja) 復号していない文書画像の修正版を自動的に作成するための装置
EP0621553A2 (en) Methods and apparatus for inferring orientation of lines of text
US20040006467A1 (en) Method of automatic language identification for multi-lingual text recognition
KR100412317B1 (ko) 문자인식/수정방법및장치
JP2713622B2 (ja) 表形式文書読取装置
EP0549329A2 (en) Method and apparatus for converting bitmap image documents to editable coded data using a standard notation to record document recognition ambiguities
JP2002269499A (ja) 数式認識装置および数式認識方法並びに文字認識装置および文字認識方法
US6920247B1 (en) Method for optical recognition of a multi-language set of letters with diacritics
JP2000315247A (ja) 文字認識装置
JPH08320914A (ja) 表認識方法および装置
EP0602955B1 (en) Text recognition
JPH0863545A (ja) 文字認識処理装置における文字方向および行方向決定方法
JP2917427B2 (ja) 図面読取装置
JPH0991371A (ja) 文字表示装置
JPH07319880A (ja) キーワード抽出・検索装置
JP2697790B2 (ja) 文字タイプ決定方法
JPH07220027A (ja) 文字認識処理装置における文字方向および行方向決定方法