JPH045779A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH045779A
JPH045779A JP2108287A JP10828790A JPH045779A JP H045779 A JPH045779 A JP H045779A JP 2108287 A JP2108287 A JP 2108287A JP 10828790 A JP10828790 A JP 10828790A JP H045779 A JPH045779 A JP H045779A
Authority
JP
Japan
Prior art keywords
processing area
character
unit
recognition processing
boundary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2108287A
Other languages
English (en)
Inventor
Koji Ito
伊東 晃治
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2108287A priority Critical patent/JPH045779A/ja
Publication of JPH045779A publication Critical patent/JPH045779A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) この発明は、文字認識装置にマするもので、特にオペレ
ータか文字認識装置に対し認識処理させたい慶域を指示
する型の文字認識装置に叩するものである。
(従来の技術) 文字認識装置のある種のものでは、オペレータか文字認
識装置に対し認識処理させたい領域(以下、この−ti
¥!認識処理領域と略称することもある。)を指示する
ことによりこの領域の認識処理が実行される。このため
、この種の文字認識装置は、媒体上の文字・図形の画像
データを格納する画像記憶部、画像データを表示する表
示部、画像データのうちの認識処理領11iを指定する
入力部及び前記指定された認識処理領域から文字単位に
画像データを切り出して文字を認識する認識部を具えて
いた。
具体的には、入力部は、ライトベンやマウス等のような
ポインティングデバイスで構成され、表示部はCRTi
て構成されていた。そして、CRT上に表示された画像
テークの所望の何重をオペレータかポインティングデバ
イスを用い指定することにより、認識処理領域か指定さ
れていた。
(発明か解決しようとする課題) しかしなから、認識処理領域を指定するために文字行と
文字行との間或は文字と文字との間の空白部をポインテ
ィングデバイスにより指示しようとすると、一般の印刷
文書は行間隔、文字間隔が狭いため、正確に指示するこ
とか難しい。
従って、しばしば、認識処理領域は文字の一部か欠けた
ものとなったり、この逆に余分な領域まで含むものとな
ることかあつ、このため、文字認識装置の認識精度の低
下や認識処理速度の低下を来すという問題点かあった。
第4図(A)及び(B)は、その異体例を示した図であ
る。
第4図(A)は、認識処理領域を規定する境界線11の
下辺か本来認識させたい文字の上を横切ってしまって文
字の一部か欠けでしまった例を示した図である。このよ
うな認識対象領域に対し認識処理を行った場合、文字認
識装置は誤読または棄却の認識結果を出力することにな
る。このため、文字認識装置の認識精度を低下させてし
まう。
また、藁4図CB)は、認識処理領域を規定する境界線
]1か認識対象でない領11i13にまで及んでいる例
を示した図である。このような認識処理領域に対し認識
処理を行った場合、文字認識装置は不要な結果を含む認
識結果を出力するので、債に認識結果の修正か必要にな
る。このため、文字認識装置の処理速度を低下させてし
まう。
この発明は、このような点に鑑みなされたものであり、
従ってこの発明の目的は、オペレータにより指定された
認識処理領域か適正か否かを判断し不適性な場合に認識
処理領域を適正なものに変更出来る文字認識装置t%提
供することにある。
(課題を解決するための手段) この目的の達成を図るため、この発明によれば、媒体上
の文字・図形の画像データを格納する画像記憶部、前述
の画像テークを表示する表示部、前述の画像データのう
ちの認識処理領域を指定する入力部及び前述の指定され
た認識処理領域から文字単位に画像データを切り出して
文字を認識する認識部を具える文字認識装置において、
入力部により指定された認識処理領域の境界線の特徴を
抽出する境界特徴抽出部と、 前述の入力部により指定された認識処理領域を前述の境
界線特徴抽出部で抽出された境界線の特徴に基づいて変
更する領域変更部とを具えたことを特徴とする。
なお、この発明の実施に当たり、前述の表示部を、前述
の画像テークと、前述の入力部により指定された前述の
認識処理領域と、前述の領域変更部により変更された変
更認識処理領域とを夫々が視覚的に区別出来る形式例え
ば異なる色や輝度で表示して重ねて表示する構成とする
のか好適である。
(作用) このような構成によれば、オペレータが認識処理領域の
指定時に認識すべき文字の一部を欠いてしまうような指
定を誤ってしでしまった場合でもこの文字認識装置は認
識すべき文字を含むように認識処理領域を変更し、また
これとは逆に余分な部分(例えば隣接認識処理領域の文
字の一部)を含むように指定をしてしまった場合でもこ
の文字認識装置は余分な部分を除くように認識処理領域
を変更する。
(実施例) 以下、図面を参照してこの発明の文字認識装置の実施例
につき説明する。
第1図は、実施例の文字認識装置20の構成を概略的に
示したブロック図である。
この実施例の文字認識装置20は、媒体上の文字・図形
の画像データSを格納する画像記憶部30、画像データ
87F!、表示する表示部40、画像データSのうちの
認識処理領域を指定する入力部50及び前記指定された
認識処理領域から文字単位に画像データを切り出して文
字を認識する認識部60を具えると共に、入力部50に
より指定された認識処理領域の境界線のvfy!を抽出
する境界特徴抽出部70と、入力部50により指定され
た認識処理領域を境界線特徴抽出部70て抽出された境
界線の特徴に基づいて変更する領域変更部80と、各構
成成分20〜80を制御する制御部90とを具える。
ここで、画像テークSは、この実施例の場合、図示しな
い光電変換部から画像記憶部30に入力されるものであ
り媒体上の文字線部を黒画素として及び背景部を白画素
としで表現したものである。
また、この実施例の画像記憶部30は、画像テークを媒
体上の文字図形の2次元座標か再現出来る形式で格納出
来るメモリで構成しである。
また、この実施例の表示部40は、例えばCRT等の表
示器を具える構成としである。
また、この実施例の入力部50は、例えばライトベン、
マウス等のようなポインチイングチバイス及びキーボー
ド等を具えた構成となっている。
オペレータは、この入力部50を介し文字認識装置20
に種々の指示を与えることが出来る。
また、この実施例の認識部60は、画像記憶部30に格
納しである画像データから文字行データを切つ出す行何
重検出部62、文字行データから1文字すつの文字バタ
ンテークを切り出す文字切り出し部64及び切り出した
文字バタンシデータを例えば辞書と照合し識別する識別
部66を具えた構成となっている。
また、この実施例の境界特徴抽出部70は、入力部50
により指定された認識処理領域の境界線上の黒画素数に
基づいて当該境界線の特徴を抽出する構成となっている
また、この実施例の領域変更部80は、境界線の特徴か
所定の条件を満足しない場合境界線の近傍に複数の境界
候補線を設定しこれら境界候補線の特徴を柚比しその特
徴が上述の所定の条件を満足する境界候補線のうち境界
線[こ最も近い何重の境界候補線を新たな境界線とする
構成となっている。
また、制御部90は、各構成成分30〜80を制御する
次に、上述の各構成成分30〜90の詳細についで実施
例の文字認識装置の動作と共に説明する。
画像記1w部30が画像データSを格納すると、制御部
90は画像記憶部10内の画像データを読み込みこの画
像テーク及びこれを表示部4oて表示させる際の色デー
タを表示部40に転送する。
表示部40は、制御部90よつ転送された画像データを
制御部90より指定された色により表示器に表示する。
なお、表示の際の色を何色にするかについては、入力部
50により任M1こ指定出来る。
次に、オペレータは、表示部40の表示器に表示された
画像データのうちの認識処理領域を指定するため、入力
部50のポインティジグデバイス等を用い認識処理領域
を指定する。
これに応じ入力部50は、指定された認識処理領域の座
標を制御部90に出力する。
入力部50を介してのオペレータによる認識処理領域の
指定は、この場合、表示部40の表示器上の2点をポイ
ンティングデバイスにより指定することで行う構成とし
である。第2図は、その結果の具体例を示したもので、
画像記憶部30中の画像データ]00と、入力部50に
より指定した認識処理領域]02どの間係を目にみえる
形で模式的に示した図である。第1の点へ及び第2の点
Bて囲まれる長方形状の領域か認識処理領域となってい
る。但し、この例の場合、オペレータの掃作ミスにより
、認識処理領域702を規定する境界線の下辺か本来認
識させたい文字の上を横切ってしまって文字の一部か欠
けでしまっている例である。
次に、制御部90は、入力部50より入力された認識処
理領域の座標と、認識処理領域の境界線を表示部40て
表示させる際の色データとを表示部40に出力する。
表示部40は、表示器に、既1こ表示されている画像デ
ータに重ねて、制御部90から転送されてきた認識処理
領域を示す座標及び色に従い認識処理領域の境界線を表
示する。
また、制御部90は、認識処理領域を規定する境界線の
特徴、KJちこの実施例の場合は認識処理領域を規定す
る4辺について各辺の特徴を境界特徴抽出部70により
抽出させるために、各辺の座標を境界特徴抽出部70に
出力する。
境界特徴抽出部70は、制御部9Qより入力された4辺
各々の黒画素数を計数し、黒画素数か所定数を越えるか
否かを判定し、その判定結果と、4辺の座標とを領域変
更部80に出力する。なあ、ここで、上述の所定数とは
、これに限られるものではないかこの場合、該当する辺
を構成する画素数の1%に相当する数としている。つま
り、第2図の下辺の場合で説明すればA点及びB点各々
のX座標差で求まる画素数の1%の画素数としている。
このような所定数に対し、境界線か文字行と文字行との
間の背景部に設定された場合はその境界線上では白画素
しか検出されないので所定数を越えないと検出出来、境
界線か文字行にかかって設定された場合はその境界線上
では黒画素か検出されることがら所定数を越える場合も
主しる。このようにして認識処理領域の指定が適正が否
かを判定する。
第2図に示した例の場合は、境界線を構成する4辺のう
ちの下辺が文字行にががっているので黒画素数か所定数
を越える。境界特徴抽出部7゜は、その旨を、この実施
例の場合、領域変更番号という形で禦域変更部80に出
力する。この領域変更番号は、4辺のうちのどの辺上に
おいて黒画素数が所定数をこえているかを領域変更部8
0に伝えるためのもので、4辺のうちの上辺の黒画素数
か所定数を越えた場合は「1」とされ、同じく左辺の場
合は「2」とされ、同しく下辺の場合は「4」とされ、
同しく右辺の場合は「8」とされるものとしでいる。従
って、4辺全てにおいて黒画素数か所定数を越えている
場合の領域変更番号は「]5」となり、一方、4辺全て
において黒画素数か所定数を越えない場合の領域変更番
号は「0」となる。
領域変更部80は、境界特徴抽出部70がら入力された
領域変更番号がrQJの場合は、4辺の座標を制m部9
0にそのまま出力する。また、領域変更番号か「0以外
」の場合は、領域変更部80は、領域変更番号に応じた
辺に平行な複数の境界候補線を設定し各境界候補線上の
黒画素数を抽出し黒画素数か上述の所定数を越えない境
界候補線のうちで最初に設定した境界線にボも近い何方
にある境界候補線の座標を制御部90に出力する。蔦2
図に示した例で具体的に説明すれば、下辺のY座標を、
最初に設定されたY座標に対し±1、±2.・・・・・
・、±nまで変化させることによって得られる境界候補
線の中から新たな境界線104(第2図中破線で示すも
の)が決定される。
従って、この例の場合は、認識処理領域は、下辺方向に
おいて拡大されるように、変更される。なあ、各境界候
補線の特徴の抽出は、この実施例では領域変更部80に
おいて行う構成としているか、境界特徴抽出部70にお
いで行う構成としでも勿論良い。
次に、制御部90は、領域変更部80がら入力された認
識処理領域を示す新たな座標及びこの新たな認識処理領
域を表示部40で表示させる際の色データを表示部40
に出力する。
表示部40は、表示器に、新たな認識処理領域を指定さ
れた色で、既に表示されているオペレータか指定した認
識処理領域に重ねて表示する。
第3図は、この表示例を示したもので、第2図に示した
条件に対応する表示例を示した図である。第3図におい
て、]10は表示器の表示画面、112は画像データ、
114はオペレータか指定した認識処理領域の境界線、
116は当該文字認識装置により変更された新たな認識
処理領域の境界線である。これに限られるものではない
か、この実施例の場合は、画像データ112は黒色で表
示し、オペレータか指定した認識処理領域の境界線]1
4は青色で表示し、変更された新たな認識処理領域の境
界線]16は赤色で表示しでいる。
また、制御部90は、頓域変更部80から入力された認
識処理領域を示す新たな座標を、認識部60内の行位置
検出部62に出力する。
行位置検出部62は、画像記憶部30の、制御部90か
ら入力された座標で与えられる領域(認識処理領域)を
予め定めた方向(この実施例の場合は横書き文書を認識
対象物としでいるため水平方向)に走査し、行単位に黒
画素の累積数を計数して周辺分布を抽出し、この周辺分
布に基づいて行位置を検出し、この行位Mを文字切り出
し部64に出力する。
次に、文字切り出し部64は、行位置検出部62から入
力された行位置に基づいて、行傾域内を予め与えられた
方向(この実施例の場合は垂直方向)に走査し列単位に
黒画素の累積数を計数して周辺分布を抽出し、この周辺
分布に基づいて1文字単位に文字バタンデータを切り出
し、この文字バタンデータを識別部66に出力する。
次に、識別部66は、文字切り出し部64から入力され
た文字バタンデータの特徴を従来から用いられている好
適な方法により抽出しこの特徴を予め用意した辞1と照
合して識別結果を制御部90に出力する。
次に、制御部90は、識別部66から入力された識別結
果を表示部40に出力する。表示部40は表示器に識別
結果を表示する。オペレータは、表示器に表示された認
識結果を確認し、誤読又は棄却かあった場合は入力部8
0により修正を行つ。
オペレータの確認の結果、識別か正確に行われていた場
合また修正か済んた場合、制御部90は、その識別結果
を文字名出力として端子92かう外部装置に出力する。
上述においては、この発明の文字認識装置の実施例につ
き説明したか、この発明は上述の実施例のみに限られる
ものではなく以下に説明するような種々の変更を加える
ことが出来る。
例えば、上述の実施例では、境界特徴抽出部は、境界線
上の黒画素数を特徴どして抽出する構成であったか、そ
の構成はこれに限られるものではない。境界特徴抽出部
を、例えば、当該境界線上での黒画素から白画素への(
又は白画素から黒画素への)変化回数を特徴として抽出
する構成とじても良い。また、境界特徴抽出部を、当該
境界線での黒画素密度を抽出する構成、例えば当該境界
線上での単位長当たりの黒画素数を特徴として抽出する
構成若しくは黒画素かN@ (Nは予め設定された個数
)以上連続する部分の個数を特徴としで抽出する構成と
しでも良い。
また、上述の実施例では、表示部を、境界線、画像デー
タ等を色を違えで表示する構成としでいたか、輝度を違
えて表示する構成としでも良い。
(発明の9カ果) 上述した説明からも明らかなように、この発明の文字認
識装置によれば、オペレータか指定した認識処理領域の
境界線の特徴を抽出しこの特徴か所定の条件を満足する
か否かを判定し満足しない場合は認識処理領域を自動的
に変更する。
従って、オペレータか認識処理領域の指定時に認識すべ
き文字の一部を欠いてしまうような指定を誤ってしてし
まった場合でもこの文字認識装置は認識すべき文字を含
むように認識処理領域を自動的に変更し、またこれとは
逆(こ余分な部分(例えば隣接認識処理領域の文字の一
部)を含むように指定をしでしまった場合でもこの文字
認識装置は余分な部分を除くように認識処理領域を自動
的に変更する。この茫め、適正な認識処理領域に対し認
識処理か行われるので、精度良くかつ処理速度の速い文
字認識装置の提供か可能になる。
また、表示部は、オペレータカ)指定した認識処理領域
と、新たな認識処理領域とをオペレータか区別出来るよ
うに色や輝度を変えて重ねて表示出来る構成となってい
るので、新たな認識処理領域かオペレータか意図した領
域であるか否かの確認か容易に出来るのでざらに好適で
ある。
【図面の簡単な説明】
!T図は、実施例の文字認識装置の構成を示すブロック
図、 第2図は、画像記憶部中の画像テークと入力部により指
定した認識処理領域との関係を示した図、 第3図は、第2図に対応する表示例を示した図、 菓4図(A)及び(B)は、従来技術の問題点の説明(
こ供する図である。 S・・・画像テーク、    20・・−文字認識装置
30・・・画像記憶部、  40−・・表示部50・・
−人力部、    60・・・認識部62・・・行位言
検出部、 64・・・文字切り出し部66・・・識別部
、     70・−・境界特徴抽吊部80・・・領域
変更部、  90・・・制御部92・・・出力端子、 
   100・・・画像テーク102・・・入力部によ
り指定した認識処理領域110・・・表示画面、   
112−・・画像データ114・・・オペレータか指定
した認識処理領域の境界線 116・・・変更された新たな認識処理領域の境界線。 特許出願人    沖電気工業株式会社110表示画面 112・画像チ ク 114、オペし 夕か指定した認識処理領域の境界線 116、変更された新たな認識処理領域の境界線第2図
に対応する表示例を示し1.:7第3 図 第4 図

Claims (5)

    【特許請求の範囲】
  1. (1)媒体上の文字・図形の画像データを格納する画像
    記憶部、前記画像データを表示する表示部、前記画像デ
    ータのうちの認識処理領域を指定する入力部及び前記指
    定された認識処理領域から文字単位に画像データを切り
    出して文字を認識する認識部を具える文字認識装置にお
    いて、 入力部により指定された認識処理領域の境界線の特徴を
    抽出する境界特徴抽出部と、 前記入力部により指定された認識処理領域を前記境界線
    特徴抽出部で抽出された境界線の特徴に基づいて変更す
    る領域変更部とを具えたことを特徴とする文字認識装置
  2. (2)前記領域変更部を、境界線の特徴が所定の条件を
    満足しない場合前記境界線の近傍に複数の境界候補線を
    設定しこれら境界候補線の特徴を抽出し該特徴が前記所
    定の条件を満足する境界候補線のうち前記境界線に最も
    近い位置の境界候補線を新たな境界線とする構成とした
    ことを特徴とする請求項1に記載の文字認識装置。
  3. (3)前記境界特徴抽出部を、当該境界線上の黒画素数
    、当該境界線上における黒画素から白画素への変化回数
    及び当該境界線上の黒画素密度のいづれか1つ又は複数
    の要素に基づいて当該境界線の特徴を抽出する構成とし
    たことを特徴とする請求項1に記載の文字認識装置。
  4. (4)前記表示部を、前記画像データと、前記入力部に
    より指定された前記認識処理領域と、前記領域変更部に
    より変更された変更認識処理領域とを夫々が視覚的に区
    別出来る形式で重ねて表示する構成としたことを特徴と
    する請求項1に記載の文字認識装置。
  5. (5)前記表示部を、前記画像データと、前記入力部に
    より指定された前記認識処理領域と、前記領域変更部に
    より変更された変更認識処理領域とを互いに異なる色又
    は輝度で表示する構成としたことを特徴とする請求項1
    又は4に記載の文字認識装置。
JP2108287A 1990-04-24 1990-04-24 文字認識装置 Pending JPH045779A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2108287A JPH045779A (ja) 1990-04-24 1990-04-24 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2108287A JPH045779A (ja) 1990-04-24 1990-04-24 文字認識装置

Publications (1)

Publication Number Publication Date
JPH045779A true JPH045779A (ja) 1992-01-09

Family

ID=14480843

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2108287A Pending JPH045779A (ja) 1990-04-24 1990-04-24 文字認識装置

Country Status (1)

Country Link
JP (1) JPH045779A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022098999A (ja) * 2020-12-22 2022-07-04 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
JP2022100066A (ja) * 2020-12-23 2022-07-05 富士フイルムビジネスイノベーション株式会社 情報処理装置、及び情報処理プログラム
JP2022104411A (ja) * 2020-12-28 2022-07-08 有限責任監査法人トーマツ 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2022098999A (ja) * 2020-12-22 2022-07-04 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム
JP2022100066A (ja) * 2020-12-23 2022-07-05 富士フイルムビジネスイノベーション株式会社 情報処理装置、及び情報処理プログラム
JP2022104411A (ja) * 2020-12-28 2022-07-08 有限責任監査法人トーマツ 多モデル深層学習による文書のデジタル化アーキテクチャ、文書画像処理プログラム

Similar Documents

Publication Publication Date Title
US5262760A (en) Modifying a graphics display image
JP2021047688A (ja) 帳票認識方法およびプログラム
JP2010287079A (ja) データエントリシステムおよびデータエントリ方法
JP7178445B2 (ja) 情報処理装置、情報処理方法、及びプログラム
JP2018018303A (ja) 情報抽出装置及びこれを備えた画像形成装置
JPH0388087A (ja) 文書読取装置
JPH045779A (ja) 文字認識装置
JP5051756B2 (ja) 帳票識別方法及び帳票識別プログラム並びに該帳票識別方法を用いた光学文字読取システム
JPH08329187A (ja) 文書読取装置
JP7318289B2 (ja) 情報処理装置およびプログラム
JPS6245581B2 (ja)
JPH0388086A (ja) 文書読取装置
JP4392450B2 (ja) 情報の表示方法、及び情報表示装置
EP0585610B1 (en) Method and apparatus for inputting handwritten alphanumeric characters and for displaying the input character
JP7317886B2 (ja) 情報処理装置及び情報処理方法
JPS6337487A (ja) 文字認識装置
JP4894195B2 (ja) 教材処理装置、教材処理方法および教材処理プログラム
JPH10134120A (ja) 表処理方法および表処理装置
JPH0962778A (ja) 文字認識装置
JP2001307020A (ja) 文字認識装置
JP2002133367A (ja) 文字認識装置
JP3145265B2 (ja) 文字認識装置
JPH0962786A (ja) 文字認識装置
JPH0459669B2 (ja)
JP2006119942A (ja) 文字列領域切り出し装置