JPH11203410A - 画像処理方法及び装置及びその記憶媒体 - Google Patents

画像処理方法及び装置及びその記憶媒体

Info

Publication number
JPH11203410A
JPH11203410A JP10003990A JP399098A JPH11203410A JP H11203410 A JPH11203410 A JP H11203410A JP 10003990 A JP10003990 A JP 10003990A JP 399098 A JP399098 A JP 399098A JP H11203410 A JPH11203410 A JP H11203410A
Authority
JP
Japan
Prior art keywords
language type
image processing
image
character recognition
identification information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10003990A
Other languages
English (en)
Other versions
JPH11203410A5 (ja
JP4109738B2 (ja
Inventor
Kitahiro Kaneda
北洋 金田
Tomotoshi Kanatsu
知俊 金津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP00399098A priority Critical patent/JP4109738B2/ja
Publication of JPH11203410A publication Critical patent/JPH11203410A/ja
Publication of JPH11203410A5 publication Critical patent/JPH11203410A5/ja
Application granted granted Critical
Publication of JP4109738B2 publication Critical patent/JP4109738B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 複数の言語の文章が混在する文書を高精度で
文字認識させる場合には、原稿の画像に対してユーザが
言語種ごとに認識対象領域を指定し、言語種を限定して
認識させる。という操作を、言語種数だけ繰り返さなけ
ればならなかった。 【解決手段】 入力画像から領域を識別し、各領域の言
語種を自動判定し、各領域毎に適した言語種の文字認識
を行う。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は画像処理方法及び装
置及びその記憶媒体に関し、特に異なる言語が混在する
文書の画像を文字認識する処理に関するものである。
【0002】本発明は画像処理方法及び装置及びその記
憶媒体に関し、特に複数のブロックに分割し得る画像を
解析する処理に関するものである。
【0003】
【従来の技術】従来の文字認識処理は、基本的には単一
言語を対象としており、例えば、日本語なら日本語専門
文字認識装置を、英語なら英語専門文字認識装置を使用
して文字認識を行っていた。ただし、日本語専門文字認
識装置の場合、対象文字としてアルファベットも含んで
いる場合が多いので、アルファベットからなる言語、例
えば英語の認識も可能ではあった。しかしながらこのよ
うな場合、英語専門文字認識装置に比較し英語部分の認
識精度が悪化することは否めない。
【0004】このような欠点をなくすため、ユーザーが
文章ごとに英語か日本語かを視認により判断し、日本語
の文章部分を指定して日本語専門の文字認識を行うよう
指示し、或は、英語の文章部分を指定して英語専門の文
字認識を行うように指示させる文字認識装置もある。
【0005】
【発明が解決しようとする課題】しかしながら前記従来
例で述べた文字認識装置においては、異なる言語が混在
した文書を認識させる場合、日英両文章に対して無理に
日本語で文字認識を行うか、或は文章部分の指定と認識
言語種の指示を、日本語と英語の2回繰り返さなければ
ならないというように、認識率と使い勝手は両立せず、
いずれか一方をとらざるを得なかった。また、これは文
字認識装置の普及のためにも大きな障害となっていた。
【0006】
【課題を解決するための手段】上記課題を解決するため
に、本発明は、入力画像から属性毎に領域を抽出し、前
記領域毎に言語種を判定し、前記各領域の画像を、前記
判定された言語種に応じて文字認識する画像処理方法及
び装置及びその記憶媒体を提供する。
【0007】上記課題を解決するために、本発明は、好
ましくは前記言語種の判定は、前記抽出した領域の画像
特性を解析して言語種を判定する。
【0008】上記課題を解決するために、本発明は、好
ましくは前記言語種の判定は、前記抽出した領域に対し
て設定されている言語種の属性を識別することにより判
定する。
【0009】上記課題を解決するために、本発明は、好
ましくは異なる言語に対応する複数の文字認識方法を備
え、前記判定された言語種に応じて当該言語種に適した
文字認識方法で文字認識を行う。
【0010】上記課題を解決するために、本発明は、好
ましくは言語種自動判定の指示の有無を判定し、前記判
定により、言語種自動判定の指示がなされていると判定
された場合に、前記抽出した領域の画像特性を解析して
言語種を判定する。
【0011】上記課題を解決するために、本発明は、好
ましくは前記言語種の判定を、特定の言語種に所定の重
み付けをして判定する。
【0012】上記課題を解決するために、本発明は、好
ましくは前記言語種の判定を、対象文字の多い言語種を
優先して選択するよう制御する。
【0013】上記課題を解決するために、本発明は、好
ましくは前記言語種の判定は、文章の属性を有する領域
に対して選択的に行う。
【0014】上記課題を解決するために、本発明は、好
ましくはユーザによる言語種の指示を入力し、前記入力
した画像情報を、当該入力された言語種に応じて文字認
識する。
【0015】上記課題を解決するために、本発明は、好
ましくは前記文字認識した結果に文書識別情報を付加し
て記憶する。
【0016】上記課題を解決するために、本発明は、好
ましくは前記文字認識した結果及び前記入力した画像情
報を、文書識別情報を付加して記憶する。
【0017】上記課題を解決するために、本発明は、好
ましくは前記文字認識した結果及び前記入力した画像情
報を圧縮した情報を、文書識別情報を付加して記憶す
る。
【0018】上記課題を解決するために、本発明は、好
ましくは前記文字認識した結果及び前記抽出した領域の
レイアウト情報を、文書識別情報を付加して記憶する。
【0019】上記課題を解決するために、本発明は、好
ましくは文書識別情報の特定に応じて、当該文書識別情
報が付加されて記憶されている文字認識の結果を出力す
る。
【0020】上記課題を解決するために、本発明は、好
ましくは文書識別情報の特定に応じて、当該文書識別情
報が付加されて記憶されている文字認識した結果及び画
像情報を出力する。
【0021】上記課題を解決するために、本発明は、好
ましくは文書識別情報の特定に応じて、当該文書識別情
報が付加されて記憶されている文字認識した結果及び画
像情報を圧縮した情報を出力する。
【0022】上記課題を解決するために、本発明は、好
ましくは文書識別情報の特定に応じて、当該文書識別情
報が付加されて記憶されている文字認識した結果及び領
域のレイアウト情報を出力する。
【0023】
【発明の実施の形態】以下図面を参照して本発明の実施
の形態を説明する。
【0024】図5は本発明に係る装置の構成図である。
【0025】51はCPU(中央処理装置)であって、
MEM53に格納されている制御プログラムに従って本
発明に係る処理の制御を行う。後述するフローチャート
に示す処理もCPU51の制御により実行される。53
はMEM(RAM及びROMからなる)であって、CP
U51が実行する処理の制御プログラムや、その処理に
用いる各種パラメータ、入力画像、文字認識の辞書等、
各種データの格納はこのMEM53に行われる。54は
CRTやLCD等の表示器であって、入力画像、処理結
果のテキスト、操作指示画面、入力手段59により特定
された文書識別情報に応じてファイルから読み出した認
識結果等を表示する。MEM53に格納された文字認識
結果を表示器54に表示し、入力手段59を用いて複数
の候補文字から正しい文字を選択する等の編集が可能で
ある。55はLBPやBJプリンタ等のプリンタであっ
て、画像、テキスト等を印字する。56はスキャナであ
って、原稿の画像を光学的に読み取り、電気的信号とし
て装置に入力する。57は通信I/Fであって、公衆回
線やLAN等を介してデータの送・受信を制御する。本
発明に係る画像の入力及びその画像を処理した結果の出
力を、この通信I/Fを介して他端末と送受信すること
もできる。58は、本装置に着脱可能であり、コンピュ
ータにより読み取り、更には書き込み可能な記憶媒体で
あって、CD−ROM、CR−R、FD等である。本発
明に係る画像をこの記憶媒体58から読み取り、処理結
果を記憶媒体58に書き込んでも良い。また、MEM5
3に格納する制御プログラムを、通信I/Fを介して他
端末からインストールしたり、或は記憶媒体58からイ
ンストールしても良い。59はキーボード、ポインティ
ングデバイス等の入力手段であり、オペレータからの指
示はこの入力手段59を介して行う。50はバスであっ
て、各手段間のデータの授受を行う。
【0026】図1は本発明に係る装置のプロセス概略図
である。本実施の形態では、日本語と英語を認識対象と
している場合を例に挙げ、説明する。
【0027】図1において、2は原稿画像を入力する画像
入力部であり、スキャナ56或は通信I/F57を介し
て他端末から、或は記憶媒体58から入力し、MEM5
3に格納する。4は入力された原稿画像の領域識別部、6
は当該領域が日本語か英語かを判別する日英判別部、8
は前記日英判別部を制御する日英判別制御部であり、入
力手段59による言語種自動判別を行うか否か、自動判
別を行わない場合の認識モードの指示の入力に応じて、
その指示を表わす制御信号を生成する。10は日本語と英
語の文字認識を行う文字認識部であり、これらの各プロ
セスは後述するフローチャートに示すように、MEM5
3に格納された制御プログラムに従ってCPU51によ
り実行される。
【0028】次に動作について説明する。
【0029】画像入力部2より取得された原稿画像は、
領域識別部4において、図2に示すようにその属性ごとに
小領域(以下ブロックとする)に分割され、ブロックナ
ンバー、ブロック属性、ブロックの大きさ、ブロックの
位置を識別する。この、領域識別部4で行う領域識別の
処理は、入力した原稿画像における黒画素の配置を分析
し、テキスト、図、画像、セパレータ等の属性を判別
し、同属性であって一固まりの画像を一つのブロックと
して識別するものである。また、同じテキストであって
も、行方向が異なっていたり、或は行間が規定値以上に
広いものについては、段が異なるテキストであると判断
し、異なるブロックとして識別する。
【0030】ブロックの識別がなされたら、各ブロック
ごとに、例えば上から順にブロックナンバーを自動付与
し、ブロックの大きさを表す幅情報及び高さ情報と、ブ
ロックの位置を規定する、例えばブロックの左上端の座
標データをセットにしてブロックデータとしてMEM5
3に格納する。このブロックデータを参照することによ
り、入力画像の所望の1ブロックの画像を抽出すること
も、また、原稿におけるテキスト、図、画像、セパレー
タ等の配置を再現することもできる。一方、日英判別制
御部8においては、ユーザーによる、日英自動判別を行
うか否かの設定、及び日英自動判別を行うことがユーザ
ーにより設定されなかった場合に設定される認識言語モ
ード(日本語認識か、英語認識か)に応じた制御信号を
生成し、日英判別部6に入力する。日英判別部6において
は、前記日英判別制御部8で生成された制御信号と、前
記領域識別部4において設定された領域属性を基に文字
領域の日本語か英語かの判断を行う。
【0031】日本語、あるいは英語の属性を加えられた
文字領域の画像データは文字認識部10に送られ、それぞ
れの属性が特定する言語に応じた文字認識が施される。
文字認識部10は、後述するS406の日本語文字認識
のルーチン及びS408の英語文字認識ルーチンを行う
が、これは、各々別個の文字認識別部を備えても良い
し、或は文字画像の切り出し、認識用辞書を言語毎に備
え、マッチングのアルゴリズムを共通にしても良い。
【0032】文字認識部10での文字認識処理が終了し
たら、文字認識の結果は文書識別情報を付加して記憶
(ファイリング)する。この文書識別情報は、ユーザに
よるキーボード操作により入力しても良いし、また、文
字認識結果から抽出しても良い。或は、入力日時、時
刻、ユーザID等を自動的に付与しても良い。後にファ
イルから読み出す際のインデックスとして用い得るよ
う、各文書毎に異なっていれば良い。また、ファイリン
グするデータは、文字認識結果のみならず、入力画像や
入力画像を圧縮したデータ領域のレイアウト情報も共に
して良い。
【0033】ここで日英判別部6と、文字認識部10につ
いて詳細に説明する。
【0034】図3に日英判別部6の処理の流れを表すフロ
ーチャートを示す。
【0035】S302は、ユーザーの指示に応じて日英判別
制御部8において生成され、MEM53に格納してある
制御信号を読み込むルーチンである。処理対象の原稿画
像が複数ある場合は、現在処理対象として特定されてい
る画像に対応づけてMEM53に格納されている制御信
号を選択的に読み込む。この制御信号は、日英自動判別
を行うか否か、および行わない場合の認識言語モードを
表わすものである。
【0036】S304において、S302で読込まれた制御信号
に基づいて日英自動判別を行うか否かを決定し、行う場
合はS306へ、行わない場合はS322へ制御を移行させる。
【0037】S306は、領域識別部4により図2のごとく
分割されたブロック毎の属性を読み込むルーチンであっ
て、MEM53に格納されているブロックデータをブロ
ックナンバー順に1つずつ読み込む。
【0038】S308において、S306で読込まれたブロック
データ内のブロック属性を基に当該ブロックが文章領域
であってS310に進むべきか否かを判別し、文章領域
である場合はS310以下の当該ブロックに対する日英判別
処理へ制御を移行する。S308において当該ブロック
が文章領域でなく、S310に進むべきでないと判別さ
れた場合はS306に制御を戻し、次のブロックデータをM
EM53から読込む。図2の例では、ブロック2,3,4に
テキストの属性が与えられていることから、これらのブ
ロックは文章領域であると判別し、S310以下の日英
判別処理の対象ブロックとなる。
【0039】S310は、当該ブロックの画像特性を解析し
て言語種が日本語か英語かを判別するためのルーチンで
あって、S306で読み込んだブロックデータの内のブ
ロック位置及び大きさデータに基づいて特定し得るME
M53の入力画像から対応領域の画像に対して行う処理
である。これは、例えば、特開平8-339424、特開平8-30
5792に記述されている入力画像の特徴から日英等の言語
種を自動判別する技術などを適用すれば可能である。
【0040】S312において、S310で判定された結果を元
に当該ブロックデータに新たな属性、すなわち言語種を
設定してMEM53に格納する。ここで設定するのは、
日本語、英語、未知の三種である。“未知”は、S31
0における日英判別ルーチンでの日本語である確からし
さ及び英語である確からしさが閾値よりも低い場合に設
定する。
【0041】S314において、MEM53に格納されてい
る当該原稿画像の全ブロックについてS306〜S31
2の言語種判定処理がなされたか否かを判定し、処理が
すべて終了している場合はS316へ、そうでない場合は、
S306へ制御を移行する。
【0042】S316、S318、S320は当該原稿の全ブロック
の言語種をチェックし、その中に日本語ブロックが一つ
でも存在している場合は未知ブロックを日本語ブロック
と、そうでない場合、すなわちすべて英語ブロックであ
った場合は、英語ブロックと設定する未知ブロックの言
語種決定のルーチンである。このルーチンでは、S31
6において、MEM53に格納されている全ブロックの
言語種に関する属性を読み込んで、日本語の属性が設定
されているブロックが少なくとも1つあるか判定し、あ
ると判定される場合は、S316で読み込んだブロック
の属性が未知となっているブロックに対して言語種を日
本語であると設定してMEM53に格納し(S31
8)、S316で1つも日本語ブロックがないと判定さ
れた場合は、S316で読み込んだブロックの属性が未
知となっているブロックに対して言語種を英語であると
設定してMEM53に格納する(S320)。尚、S3
16の判定基準は、予め定めておけば良く、特定の言語
種ブロックの所定の個数(1、2、・・・)でも、所定
の割合(5%、10%、・・・)であっても良い。
【0043】これは、未知ブロックが実際は英語ブロッ
クであるにもかかわらずS318において日本語ブロッ
クと設定した場合でも、文字認識部10で行う日本語文
字認識にはアルファベットの認識も入っている(即ち、
日本語のかな、漢字、数字、記号等の他に、アルファベ
ットも認識対象文字としている)ので、認識不能には陥
らないが、逆の場合、すなわち日本語ブロックを英語ブ
ロックと間違って設定した場合は認識不能に陥ってしま
うので、そのように判断する方を厳しく行っているとい
うことである。すなわち認識対象文字数が多い言語種を
より選択しやすくしている。より好ましくは、本実施例
で述べているように一方の言語種の認識対象文字が、も
う一方の言語種の認識対象文字を含んでいる場合、含ん
でいる方の言語種を選択しやすくするとよい。
【0044】S322は、S304で日英自動判別を行わないと
決定した場合、認識言語モードの設定を行うルーチンであ
る。この設定は、入力手段59を介してオペレータによ
り操作、指示された言語種に応じて日英判別制御部8に
おいて生成された制御信号を基にして行う。
【0045】S324は、S322で日本語認識モードと判定さ
れた場合、当該原稿内の全文章領域を日本語と設定し、
MEM53に格納するルーチン。
【0046】S326は、S322で英語認識モードと判定され
た場合、当該原稿内の全文章領域を英語と設定し、ME
M53に格納するルーチン。
【0047】図4に文字認識部10が行う文字認識処理の
流れを表すフローチャートを示す。
【0048】S402は、MEM53に格納されているブロ
ックデータから、属性がテキストとして設定されている
文章ブロックのブロックデータ及びブロック内の画像デ
ータを読込むルーチン。
【0049】S404は、S402で読込んだブロックデータの
属性により、当該ブロックの言語種属性を判定するルー
チン。このルーチンにより判定する属性が、S310、
S318、S320、S324、S326で設定した言
語種の属性である。
【0050】S406は、S404で日本語と判断された場合、
文字認識部10において日本語文字認識を行うルーチ
ン。
【0051】S408は、S404で英語と判断された場合、文
字認識部10において英語文字認識を行うルーチン。
【0052】S410は、MEM53に格納されている当該
原稿の全文章ブロックに対しS402〜S408の文字
認識処理を行ったか否かを判定し、まだ処理ブロックが
残っている場合は制御をS402へ移行し、次の文章ブロッ
クを読み込む。
【0053】以上述べてきたように、本発明によれば、
日英自動判別技術を核として、その制御のためにユーザ
ーフレンドリーなインターフェースを提供し、さらに未
知ブロックの処理に関しても、独自の後処理を施した文
字認識装置を構築できるので、日本語、英語の混在した
文書においても、認識精度と、使い勝手の向上を同時に
実現させることができ、文字認識装置の普及のため大き
く貢献することとなる。
【0054】本実施の形態では日本語と英語の言語種判
別を例に挙げて説明したが、何もこれに限ることはな
く、他言語の判別を行っても良い。この場合、基本的に
は図3のS310日英判別部をそれに適する言語種判別ルー
チンに置き換えるだけで対応することができる。
【0055】
【発明の効果】以上述べてきたように本発明によれば、
言語種自動判別技術を核として、その制御のためにユー
ザーフレンドリーなインターフェースを提供し、さらに
誤判定時の後処理も考慮した文字認識装置を構築できる
ので、異なる言語が混在した文書においても、認識精度
と、使い勝手の向上を同時に実現させることができ、文
字認識機能の普及のため大きく貢献することができる。
【0056】以上述べたように本発明によれば、原稿に
含まれる複数の領域に分かれた文章を、領域ごとに言語
種を判別し、各領域の言語種に合わせた文字認識を行う
ので、複数言語が混在した文書の認識を高精度で高速に
行うことができる。
【図面の簡単な説明】
【図1】本発明に係る文字認識装置のプロセス概略図
【図2】領域識別結果の例示図
【図3】日英判別部6の処理の流れを表すフローチャー
【図4】文字認識部10の処理の流れを表すフローチャ
ート
【図5】本発明に係る装置の構成図

Claims (35)

    【特許請求の範囲】
  1. 【請求項1】 入力画像から属性毎に領域を抽出し、 前記領域毎に言語種を判定し、 前記各領域の画像を、前記判定された言語種に応じて文
    字認識することを特徴とする画像処理方法。
  2. 【請求項2】 前記言語種の判定は、前記抽出した領域
    の画像特性を解析して言語種を判定することを特徴とす
    る請求項1に記載の画像処理方法。
  3. 【請求項3】 前記言語種の判定は、前記抽出した領域
    に対して設定されている言語種の属性を識別することに
    より判定することを特徴とする請求項1に記載の画像処
    理方法。
  4. 【請求項4】 異なる言語に対応する複数の文字認識方
    法を備え、前記判定された言語種に応じて当該言語種に
    適した文字認識方法で文字認識を行うことを特徴とする
    請求項1に記載の画像処理方法。
  5. 【請求項5】 言語種自動判定の指示の有無を判定し、 前記判定により、言語種自動判定の指示がなされている
    と判定された場合に、前記抽出した領域の画像特性を解
    析して言語種を判定することを特徴とする請求項1に記
    載の画像処理方法。
  6. 【請求項6】 前記言語種の判定を、特定の言語種に所
    定の重み付けをして判定することを特徴とする請求項1
    に記載の画像処理方法。
  7. 【請求項7】 前記言語種の判定を、対象文字の多い言
    語種を優先して選択するよう制御することを特徴とする
    請求項1に記載の画像処理方法。
  8. 【請求項8】 前記言語種の判定は、文章の属性を有す
    る領域に対して選択的に行うことを特徴とする請求項1
    に記載の画像処理方法。
  9. 【請求項9】 ユーザによる言語種の指示を入力し、 前記入力した画像情報を、当該入力された言語種に応じ
    て文字認識することを特徴とする請求項1に記載の画像
    処理方法。
  10. 【請求項10】 前記文字認識した結果に文書識別情報
    を付加して記憶することを特徴とする請求項1に記載の
    画像処理方法。
  11. 【請求項11】 前記文字認識した結果及び前記入力し
    た画像情報を、文書識別情報を付加して記憶することを
    特徴とする請求項1に記載の画像処理方法。
  12. 【請求項12】 前記文字認識した結果及び前記入力し
    た画像情報を圧縮した情報を、文書識別情報を付加して
    記憶することを特徴とする請求項1に記載の画像処理方
    法。
  13. 【請求項13】 前記文字認識した結果及び前記抽出し
    た領域のレイアウト情報を、文書識別情報を付加して記
    憶することを特徴とする請求項1に記載の画像処理方
    法。
  14. 【請求項14】 文書識別情報の特定に応じて、当該文
    書識別情報が付加されて記憶されている文字認識の結果
    を出力することを特徴とする請求項10に記載の画像処理
    方法。
  15. 【請求項15】 文書識別情報の特定に応じて、当該文
    書識別情報が付加されて記憶されている文字認識した結
    果及び画像情報を出力することを特徴とする請求項11
    に記載の画像処理方法。
  16. 【請求項16】 文書識別情報の特定に応じて、当該文
    書識別情報が付加されて記憶されている文字認識した結
    果及び画像情報を圧縮した情報を出力することを特徴と
    する請求項12に記載の画像処理方法。
  17. 【請求項17】 文書識別情報の特定に応じて、当該文
    書識別情報が付加されて記憶されている文字認識した結
    果及び領域のレイアウト情報を出力することを特徴とす
    る請求項13に記載の画像処理方法。
  18. 【請求項18】 入力画像から属性毎に領域を抽出する
    領域抽出手段と、 前記領域毎に言語種を判定する言語種判定手段と、 前記各領域の画像を、前記判定された言語種に応じて文
    字認識する文字認識手段とを有することを特徴とする画
    像処理装置。
  19. 【請求項19】 前記言語種判定手段は、前記抽出した
    領域の画像特性を解析して言語種を判定することを特徴
    とする請求項18に記載の画像処理装置。
  20. 【請求項20】 前記言語種判定手段は、前記抽出した
    領域に対して設定されている言語種の属性を識別するこ
    とにより判定することを特徴とする請求項18に記載の画
    像処理装置。
  21. 【請求項21】 前記文字認識手段は、異なる言語に対
    応する複数の文字認識手段を備え、前記言語種判定手段
    により判定された言語種に応じて当該言語種に適した文
    字認識手段で文字認識を行うことを特徴とする請求項18
    に記載の画像処理装置。
  22. 【請求項22】 言語種自動判定の指示の有無に応じ
    て、前記抽出した領域の画像特性を解析して言語種を判
    定するか否かを切り替える言語種自動判定制御手段を有
    することを特徴とする請求項18に記載の画像処理装置。
  23. 【請求項23】 前記言語種判定手段は、特定の言語種
    に所定の重み付けをして言語種を判定することを特徴と
    する請求項18に記載の画像処理装置。
  24. 【請求項24】 前記言語種判定手段は、対象文字の多
    い言語種を優先して選択するよう制御することを特徴と
    する請求項18に記載の画像処理装置。
  25. 【請求項25】 前記言語種判定手段は、文章の属性を
    有する領域に対して選択的に行うことを特徴とする請求
    項18に記載の画像処理装置。
  26. 【請求項26】 ユーザによる言語種の指示を入力する
    言語種指示入力手段を有し、 前記文字認識手段は、前記言語種指示入力手段により入
    力された言語種に応じて画像情報を文字認識することを
    特徴とする請求項18に記載の画像処理装置。
  27. 【請求項27】 前記文字認識した結果に文書識別情報
    を付加して記憶する記憶手段を有することを特徴とする
    請求項18に記載の画像処理装置。
  28. 【請求項28】 前記文字認識した結果及び前記入力し
    た画像情報を、文書識別情報を付加して記憶する記憶手
    段を有することを特徴とする請求項18に記載の画像処理
    装置。
  29. 【請求項29】 前記文字認識した結果及び前記入力し
    た画像情報を圧縮した情報を、文書識別情報を付加して
    記憶する記憶手段を有することを特徴とする請求項18に
    記載の画像処理装置。
  30. 【請求項30】 前記文字認識した結果及び前記抽出し
    た領域のレイアウト情報を、文書識別情報を付加して記
    憶する記憶手段を有することを特徴とする請求項18に記
    載の画像処理装置。
  31. 【請求項31】 文書識別情報の特定に応じて、当該文
    書識別情報が付加されて記憶されている文字認識の結果
    を出力する出力手段を有することを特徴とする請求項27
    に記載の画像処理装置。
  32. 【請求項32】 文書識別情報の特定に応じて、当該文
    書識別情報が付加されて記憶されている文字認識した結
    果及び画像情報を出力する出力手段を有することを特徴
    とする請求項28に記載の画像処理装置。
  33. 【請求項33】 文書識別情報の特定に応じて、当該文
    書識別情報が付加されて記憶されている文字認識した結
    果及び画像情報を圧縮した情報を出力する出力手段を有
    することを特徴とする請求項29に記載の画像処理装置。
  34. 【請求項34】 文書識別情報の特定に応じて、当該文
    書識別情報が付加されて記憶されている文字認識した結
    果及び領域のレイアウト情報を出力する出力手段を有す
    ることを特徴とする請求項30に記載の画像処理装置。
  35. 【請求項35】 入力画像から属性毎に領域を抽出する
    工程の制御プログラムと、 前記領域毎に言語種を判定する工程の制御プログラム
    と、 前記各領域の画像を、前記判定された言語種に応じて文
    字認識する工程の制御プログラムとを記憶した、コンピ
    ュータにより読取り可能な記憶媒体。
JP00399098A 1998-01-12 1998-01-12 画像処理方法及び装置及びその記憶媒体 Expired - Fee Related JP4109738B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00399098A JP4109738B2 (ja) 1998-01-12 1998-01-12 画像処理方法及び装置及びその記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00399098A JP4109738B2 (ja) 1998-01-12 1998-01-12 画像処理方法及び装置及びその記憶媒体

Publications (3)

Publication Number Publication Date
JPH11203410A true JPH11203410A (ja) 1999-07-30
JPH11203410A5 JPH11203410A5 (ja) 2005-07-28
JP4109738B2 JP4109738B2 (ja) 2008-07-02

Family

ID=11572469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00399098A Expired - Fee Related JP4109738B2 (ja) 1998-01-12 1998-01-12 画像処理方法及び装置及びその記憶媒体

Country Status (1)

Country Link
JP (1) JP4109738B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019068134A (ja) * 2017-09-28 2019-04-25 京セラドキュメントソリューションズ株式会社 画像形成装置
JP2020027598A (ja) * 2018-12-27 2020-02-20 株式会社シグマクシス 文字認識装置、文字認識方法及び文字認識プログラム
JP2020104505A (ja) * 2018-12-28 2020-07-09 京セラドキュメントソリューションズ株式会社 画像形成装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2019068134A (ja) * 2017-09-28 2019-04-25 京セラドキュメントソリューションズ株式会社 画像形成装置
JP2020027598A (ja) * 2018-12-27 2020-02-20 株式会社シグマクシス 文字認識装置、文字認識方法及び文字認識プログラム
JP2020104505A (ja) * 2018-12-28 2020-07-09 京セラドキュメントソリューションズ株式会社 画像形成装置
CN111510576A (zh) * 2018-12-28 2020-08-07 京瓷办公信息系统株式会社 图像形成装置
CN111510576B (zh) * 2018-12-28 2022-11-15 京瓷办公信息系统株式会社 图像形成装置

Also Published As

Publication number Publication date
JP4109738B2 (ja) 2008-07-02

Similar Documents

Publication Publication Date Title
US5821929A (en) Image processing method and apparatus
JP4742404B2 (ja) 画像認識装置、画像形成装置、画像認識方法および画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
US6275608B1 (en) Image processing method and apparatus and memory medium
JP2004046315A (ja) 文字認識装置および文字認識方法、プログラムおよび記憶媒体
EP0933719B1 (en) Image processing method and apparatus
JP4311365B2 (ja) 文書処理装置およびプログラム
US6504540B1 (en) Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
CN113378839A (zh) 信息处理装置、信息处理方法及计算机可读介质
CN102685347B (zh) 图像处理装置和图像处理方法
JP3319203B2 (ja) 文書ファイリング方法及び装置
JPH11203410A (ja) 画像処理方法及び装置及びその記憶媒体
JPH11110479A (ja) 文字処理方法及び装置及び記憶媒体
JPH10177623A (ja) 文書認識装置および言語処理装置
US11481544B2 (en) Form processing apparatus and non-transitory computer readable medium
JPH0696288A (ja) 文字認識装置及び機械翻訳装置
JP2000293624A (ja) 画像処理方法、装置及び記憶媒体
JP7497620B2 (ja) 文書データ生成装置、画像形成装置、及び文書データ生成プログラム
JP2002049890A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP4974367B2 (ja) 領域分割方法及び装置、並びにプログラム
JPH0573725A (ja) 手書き文字・図形認識装置
JPH103516A (ja) 情報処理方法及び装置
JP2003256772A (ja) 文字認識装置及び記録媒体
JP2008186256A (ja) 文書処理装置、文書処理方法、コンピュータプログラム
JPH0981672A (ja) 文書読取装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041214

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041214

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071122

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20071204

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080204

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080407

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110411

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130411

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130411

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140411

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees