JP3954246B2 - 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置 - Google Patents

文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置 Download PDF

Info

Publication number
JP3954246B2
JP3954246B2 JP22723199A JP22723199A JP3954246B2 JP 3954246 B2 JP3954246 B2 JP 3954246B2 JP 22723199 A JP22723199 A JP 22723199A JP 22723199 A JP22723199 A JP 22723199A JP 3954246 B2 JP3954246 B2 JP 3954246B2
Authority
JP
Japan
Prior art keywords
correction
document
character
input
symbol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP22723199A
Other languages
English (en)
Other versions
JP2001052110A5 (ja
JP2001052110A (ja
Inventor
正樹 中川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Science and Technology Agency
National Institute of Japan Science and Technology Agency
Original Assignee
Japan Science and Technology Agency
National Institute of Japan Science and Technology Agency
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Science and Technology Agency, National Institute of Japan Science and Technology Agency filed Critical Japan Science and Technology Agency
Priority to JP22723199A priority Critical patent/JP3954246B2/ja
Priority to PCT/JP2000/002483 priority patent/WO2001013324A1/ja
Priority to US10/049,102 priority patent/US7142733B1/en
Publication of JP2001052110A publication Critical patent/JP2001052110A/ja
Publication of JP2001052110A5 publication Critical patent/JP2001052110A5/ja
Application granted granted Critical
Publication of JP3954246B2 publication Critical patent/JP3954246B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/98Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns
    • G06V10/987Detection or correction of errors, e.g. by rescanning the pattern or by human intervention; Evaluation of the quality of the acquired patterns with the intervention of an operator

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置に係る。本発明は、特に、オフィス等で利用される情報機器分野に利用可能で、認識された文字の修正を簡単に行うことのできる文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置に関する。
【0002】
【従来の技術】
一般に、文字処理装置においては、記入された文字の切り出しや、文書上の位置(行及び文字位置)の検出が、技術的に重要である。そして、文書の修正等のために活字文書上に黒色の鉛筆などで修正文字が記入された場合、その文書から記入された文字などを切り出すことが必要であった。
【0003】
そこで、従来は、イメージリーダが感知しないカラーインクを用いて文書をプリントアウトすることにより、活字と記入された修正文字とを分離するようにしていた。
図13は、従来の文書処理装置の構成図を示す。この文書処理装置は、文書ファイル101、プリントアウト手段102、光電変換装置105、電子データ蓄積手段106、活字位置検出手段107、文字切り出し手段108、認識手段109、対応付け手段110、文書処理手段111を備える。
【0004】
図14は、従来の文書処理に関する説明図である。
文書ファイル101の内容をカラーインクを用いてプリントアウト手段102により出力し、プリントアウト103を得る。例えば、修正入力114において、認識された文書114aカラーインクで印字されており、文字位置を示すマーク114b、行位置を示すマーク114cは、ともに黒で印字されている。この修正入力114に、修正記号及び文字114dが記入される。このプリントアウト103に修正記号を記入された修正文書114は、カラーインクを感知しない光電変換手段105によって光電変換の結果115を得て、電子データ蓄積手段106に蓄積される。次に、活字位置検出手段107において、光電変換の結果115に基づき、文字位置を示すマーク115bと、行位置を示すマーク115cより、活字文字が記入されている電子データ上の位置を検出する。一方、文字切り出し手段108では、同じ光電変換の結果115に基づき、記入された修正記号及び文字115dを検出し、電子データ上の位置を求めるとともに、認識手段109によってこれを認識する。
【0005】
対応付け手段110では、活字位置検出手段107の結果と、文字切り出し手段108の結果に基づき、記入された文字が、何行目の何文字目の修正であるかを対応付け、文書修正手段111は、電子ファイル101を修正する。
【0006】
【発明が解決しようとする課題】
しかしながら、従来においては、プリントアウトのためにカラープリンターが必要であり、かつ、使用する色は、光電変換手段で感知しない色を選ぶ必要があった。また、従来では、機種によって必ずしも、感知しない色が一定でないことから、文書上の位置の検出が困難な場合があった。また、従来は、行及び文字位置の検出のため、マークを同時に出力する必要があり、特殊な出力フォーマットを作成する必要があった。
【0007】
本発明は、以上の点に鑑み、プリントアウトをカラーインクでなく、ドット文字又はグレーカラーにして出力し、この文書からグレーカラーを消去して記入文字のみを取り出すようにした文書処理方法、文書処理プログラムを記録した記録媒体及び装置を提供することを目的とする。また、本発明は、修正のための文字が記入されている文書から、記入された文字等を切り出し、その文字等がどの活字の上に記入されているかを判断することにより、誤って認識された文書を修正することを目的とする。本発明は、グレイカラーの文を用いて修正処理を可能とするので、一般のイメージリーダ、FAX、スキャナ等で文書入力することを可能とし、また、白黒のプリンターで出力することを可能とすることを目的とする。さらに、本発明は、行及び文字位置マークの必要をなくして、プリントアウト時に特殊な文書出力処理を不要とすることを目的とする。
【0008】
【課題を解決するための手段】
本発明の第1の解決手段によると、
文書ファイルを、文書ファイルの文字がドットの集合として複数のドットにより印刷されたドット文字によるイメージでプリントアウトする出力ステップと、
前記出力ステップにより出力された文書に修正記号が記入された修正入力文書をイメージ入力する入力ステップと、
前記入力ステップにより入力された修正入力文書中、修正記号が記入された文字の位置を検出する文字位置検出ステップと、
前記入力ステップにより入力された修正入力文書について、各画素の収縮処理を実行して、前記ドット文字を消去することにより修正記号を抽出し、又は、画素の連結成分を求め、求められた連結成分の画素数に基づき修正記号を抽出し、抽出された修正記号を認識する修正認識ステップと、
前記文字位置検出ステップにより検出された文字の位置と、前記修正認識ステップにより認識された修正記号とを対応付ける対応付けステップと、
前記対応付けステップの対応付けに従い、前記修正認識ステップにより認識された修正記号に対応する修正処理により、該当する文字を修正する修正ステップと、
を含む文書入力方法、及び、各ステップをコンピュータに実行させるための文書処理プログラムを記録した記録媒体が提供される。
【0009】
本発明の第2の解決手段によると、
文書読み取り認識結果を記憶する文書ファイル記憶手段と、
前記文書ファイル記憶手段に記憶された文書ファイルを、文書ファイルの文字がドットの集合として複数のドットにより印刷されたドット文字によるイメージでプリントアウトする出力手段と、
前記出力手段により出力された文書に修正記号が記入された修正入力文書をイメージ入力する入力手段と、
前記入力手段により入力された修正入力文書中、修正記号が記入された文字の位置を検出する文字位置検出手段と、
前記入力手段により入力された修正入力文書について、各画素の収縮処理を実行して、前記ドット文字を消去することにより修正記号を抽出し、又は、画素の連結成分を求め、求められた連結成分の画素数に基づき修正記号を抽出し、抽出された修正記号を認識する修正認識手段と、
前記文字位置検出手段により検出された文字の位置と、前記修正認識手段により認識された修正記号とを対応付ける対応付け手段と、
前記対応付け手段の対応付けに従い、前記修正認識手段により認識された修正記号に対応する修正処理により、該当する文字を修正する修正手段と
を備えた文書処理装置が提供される。
【0010】
【発明の実施の形態】
図1に、本発明に係る文書処理装置の構成図を示す。図2に、本発明に係る文書処理方法のフローチャートを示す。また、図3に、文書処理に関する説明図を示す。
【0011】
この文書処理装置は、文書ファイル記憶手段1、出力手段2、光電変換手段5、電子データ蓄積手段6、文字位置検出手段7、修正認識手段8、文字認識手段9、対応付け手段10、修正手段11を備える。
【0012】
まず、光電変換手段5は、認識の対象となる文書を読み取り、電子データ化する。電子データ蓄積手段6は、光電変換手段5により読み取られた電子データを記憶する。文字認識手段9は、蓄積された文書を認識する。文書ファイル記憶手段1は、文書を読み取り、認識結果を記憶する。
【0013】
つぎに、出力手段2は、文書ファイル記憶手段1に記憶された文書ファイルをドット文字イメージでプリントアウト3を出力する(S101)。操作者は、このプリントアウト3上に修正のための記号、また、必要に応じて文字を記入し、修正入力文書14を作成する(S103)。さらに、光電変換手段5により、修正入力文書14がイメージ入力され、電子データ化され電子データ蓄積手段6に蓄積される(S105)。
なお、ドット文字は、従来ドットプリンタで印字された文字の意味で主に用いられた経緯があるが、プリンタの方式に限らず、後述の図4(文書イメージ入力41)、図5(文書イメージ入力51)、図6(入力画像61)、図7及びそれらの説明箇所等に記載されるように、印刷された結果が互いに接しない独立した黒領域(点や線分)の集合として印字された文字を指す。ドット文字を用いることにより、人間にはグレーに見えるため書き込みに違和感はなく、読み取り装置にとっては、ある一定値サイズ以下の黒画素連結領域(周りを白画素で囲まれた接続する黒画素集合)の集まりとして取り込まれるため、それらの収縮・膨張、あるいは、連結黒画素数によるしきい値処理等の画像処理技術などによって、上書きされた手書きを切り出すときは元の文書を除去し、本等の文書の文字位置を求める時には上書きされた手書きを除去するなどが容易に行える。
【0014】
文字位置検出手段7は、出力手段2により出力された文書中で、修正記号が記入された文字の位置を検出する(S107)。文字位置検出手段7は、活字がドットで印字されていることに注目して、電子化された文書画像から行及び文字位置を検出する。詳細は後述する。一方、修正認識手段8は、修正入力文書14に記入された修正記号や文字を、認識する(S111)。なお、修正すべき正しい文字は、例えば、文字認識手段9等により、認識することもできる。
【0015】
対応付け手段10は、文字位置検出手段7により検出された文字の位置と、修正認識手段8により認識された修正記号とを対応付け、修正対象文字を特定する。(S113)。すなわち、記入された修正記号や文字が、出力された文字のどこに対応するのかを対応付ける。このようにして、記号検出・認識結果15が得られる。
【0016】
修正手段11は、対応付け手段10の対応付けに従い、該当する文字を修正記号に対応する修正処理により修正する(S115)。修正手段11は、修正認識手段8により認識された修正記号に従い文書ファイル記憶手段1に記憶された文書ファイルを修正する。ここでは、図3中、斜線による指示は、例えば、対応する活字をその上に記入された文字と置き換える記号を表すので、修正手段11は、このような記入文字に対応して、「埋」を「理」に修正する処理を、文書ファイル記憶手段1に対して行う。ここでは、文字認識手段9又は修正認識手段8等により、修正すべき正しい文字として「理」が認識される。
【0017】
修正手段11は、この他にも、例えば、単語認識処理、結合処理、分割処理を実行し、文書ファイルを修正することができる。この点については、後述する。出力手段2は、修正された文書ファイルを文書ファイル記憶手段1から読み出し、修正結果16を出力する(S117)。この際、プリントアウトに限らずディスプレイ上に出力して確認しても良い。
【0018】
図4に、プリントアウト文字位置検出の説明図を示す。
文字位置検出手段7は、入力文書のエッジ画像について、横方向及び縦方向のそれぞれに画素数を積算することにより、文字の位置を検出するようにする。具体的には、例えば、まず輪郭画像を作成して、これを強調し、この輪郭画像上で、水平方向に黒画素数を数えて行位置を検出し、次に各行毎に垂直方向に黒画素数を計数することにより文字位置を検出する。
【0019】
この例では、文字位置検出手段7による、第1行目「本論文では」及び第2行目「取り装置の」とプリントアウトされた文字の位置検出について説明する。まず、修正記号を記入済みの文字イメージ41が入力される。この文字イメージに基づき、各画素の輪郭を検出を行い、輪郭画像42を求める。さらに、検出された輪郭画素42について、横方向に画素を積算又は加算して横方向周辺分布43を求める。この横方向分布により行の位置を検出することができる。つぎに、求められた各行について、同様に、検出された輪郭画素44を切り出し、これについて縦方向に画素を積算又は加算して縦方向周辺分布45を求める。この縦方向周辺分布45により各行の文字の位置(横方向位置)を求めることができる。以上のように、ある文字について、行と列が特定され文字位置検出画像46が得られる。この様に、修正記号が太く記入された場合でも、輪郭しか残らないため、輪郭を検出しない場合に比べ、記入された修正記号の影響を軽減することができる。
【0020】
図5に、修正記号の認識の説明図を示す。
修正認識手段8は、修正記号の抽出(記入文字の検出)において、修正入力文書14から、画素の連結成分を求め、求められた連結成分の画素数に基づき、あらかじめ決められた大きさ以下の黒連結成分を除くことにより、修正記号のみを残し、残された修正記号の各々を切り出す。修正認識手段8は、修正記号を切り出す際、例えば、白画素に隣接する黒画素をエッジとして、そのエッジを元の画像から除去する収縮処理を備える。
【0021】
この例では、「取り装置の」とプリントアウトされた文字の「装」に記入された修正記号について説明する。まず、修正記号が記入済みの文字イメージ51が入力される。つぎに、文字イメージ51に基づき、各画素を収縮処理した収縮画像52に変換する。
【0022】
図6に、収縮処理の説明図を示す。また、図7に、エッジ画像の説明図を示す。
例えば、入力画像61に対し、各画素のエッジを抽出したものが、図7のエッジ画像71である。すなわち、エッジとは白画素に隣接する黒画素を抽出したものである。なお、2重、3重等のエッジを抽出してもよい。エッジ画像71を除去すると、第1の収縮画像62となる。さらに、第1の収縮画像62について、そのエッジ画像を求めてこれを除去したものが、第2の収縮画像63である。
【0023】
この収縮処理を適宜の回数実行して、ドット文字を消去することにより、修正記号を抽出した修正記号抽出画像53を得る。ドット文字を消去する方法としては、例えば、黒画素が連結した部分である連結成分を求めて、各連結成分の黒画素数を求める。さらに、この黒画素数が予め決められた閾値以上である連結成分を残すことにより修正記号を抽出することもできる。つぎに、修正認識手段8は、修正記号を切り出し、どのような修正指示を行うための修正記号かを認識することで修正記号認識結果54が得られる。
【0024】
以上の説明では、修正記号及び文字について説明したが、本発明は、様々な修正を指示するための修正記号を抽出することもできる。そこで、つぎに、修正認識手段8、対応付け手段10、修正手段11等による修正処理、単語処理、結合処理、分割処理について説明する。
【0025】
図8に、修正のための各種処理に関する説明図を示す。また、図9に、修正のための各種処理のフローチャートを示す。
【0026】
出力手段4は、認識結果を出力する(S207)。ここで、認識出力811が出力されたとする。この出力は、ドット文字で出力されているものとする。
紙出力の場合は、操作者は、十分な認識がなされていない文字・文書に修正内容の指示を行う(S211)。ここでの修正内容の指示は、例えば、記号文字が記入された修正入力12の中の、第1記号812a、第2記号812b、第3記号812cの修正記号で行われる。この修正記号の例において、第1記号812a、第2記号812b、第3記号812cはそれぞれ、単語処理、文字パターンの結合、文字パターンの分離処理を指示する記号である。
【0027】
修正認識手段6は、記入された修正記号を切り出す(S213)。ここで、修正文字が1文字を修正する修正処理と認識された場合は、上述のような修正処理が実行される(S215)。
また、切り出された修正文字が、単語処理と認識された場合は、認識候補文字において、この記号に対応する文字の組で候補文字の組み合わせから単語としてもっとも可能性の高い組み合わせを求める単語処理を行う(S217)。
【0028】
図10に、単語処理の説明図を示す。一般に文字認識は、個々の文字パターンごとに認識して、認識候補文字の一番目を認識結果として出力する。これを単語として例えば2文字の組み合わせで判断した場合、1文字目と2文字目の組み合わせのうち、単語として成り立つものの制限があることから、誤認識が少なくなる。例えば、1文字目を認識した結果、4つの文字が認識候補として判断されたとする。即ち、第1候補「持」、第2候補「特」、第3候補「侍」、第4候補「稼」である。また、2文字目を認識した結果、3つの文字が認識候補として判断されたとする。即ち、第1候補「微」、第2候補「徴」、第3候補「働」である。1文字毎の認識結果では、各々第1候補の「特」及び「微」が選択された。しかし、単語処理では、これら2文字を単語として認識するように指示されたため、各文字の各候補の組合わせを検討する。例えば、第2候補「特」及び第2候補「徴」との組合わせが候補の優先順位の和4(2+2)であり、また、第4候補「稼」及び第3候補「働」との組合わせが候補の優先順位の和7(4+3)であることが、判断される。したがって、単語処理結果として、優先順位が高い順に(即ち、優先順位の和が小さい順に)、第1候補「特徴」及び第2候補「稼働」が認識候補として判断される。ここでは、第1候補の「特徴」が、単語処理の結果として認識される。
【0029】
また、文字パターンの結合処理と認識された場合は、対応する複数の文字パターンをあわせ、ひとつの文字として認識する結合処理を実行する(S219)。図11に、結合処理の説明図を示す。結合処理は、修正記号により指示された2個以上の文字に対応する文字パターンを、ひとつの文字パターンとして再度認識する。ここでは、認識結果の「T」と「由」とを結合する指示がなされたため、再度の認識の結果、「抽」が認識された。
【0030】
文字パターンの分離処理と認識された場合は、対応する文字パターンについて、再度文字切り出しから行う分離処理が実行される(S217)。
図12に、分離処理の説明図を示す。分離処理は、修正記号により指示された文字に対応する文字パターンを、2つの文字パターンとして切り出して再度認識する。ここでは、認識結果の「和」を分離する指示がなされたため、再度の認識の結果、「f」と「e」とが認識された。
【0031】
修正手段8は、各処理に応じて文書ファイル記憶手段3を修正し(S223)、修正結果813を出力する(S225)。ここで、満足する結果が得られない場合(S229)は、さらに、ステップS211に戻って処理を繰り返す。十分に修正が行われたら、処理を終了する。
【0032】
なお、本発明において、グレイカラーは、ドットに限らず、ベタの黒でなければ、輪郭のフォント、あるいは斜線で構成されるフォントであってもよい。また、文字位置検出、記入文字位置検出、認識等は、同様の効果があれば、方法はこれに限らない。また、文書を修正する記号は一例を示したが、修正記号はこれに限らない。また、文字位置検出方法は、連続した活字を検出して行を検出するようにした方法や、行間・文字間の空間を検出して行・列を検出する方法等、適宜の方法で行又は文字位置を検出するようにしても良い。また、文書ファイルの移動等、各処理間の入出力については、インターネット等の通信を用いても良い。
【0033】
【発明の効果】
本発明によると、以上のように、プリントアウトをカラーインクでなく、ドット文字又はグレーカラーにして出力し、この文書からグレーカラーを消去して記入文字のみを取り出すようにした文書処理方法、文書処理プログラムを記録した記録媒体及び装置を提供することができる。また、本発明によると、修正のための文字が記入されている文書から、記入された文字等を切り出し、その文字等がどの活字の上に記入されているかを判断することにより、誤って認識された文書を修正することができる。本発明によると、グレイカラーの文を用いて修正処理を可能とするので、一般のイメージリーダ、FAX、スキャナ等で文書入力することを可能とし、また、白黒のプリンターで出力することを可能とする。さらに、本発明によると、行及び文字位置マークの必要をなくして、プリントアウト時に特殊な文書出力処理を不要とすることができる。
【図面の簡単な説明】
【図1】本発明に係る文書処理装置の構成図。
【図2】本発明に係る文書処理方法のフローチャート。
【図3】文書処理に関する説明図。
【図4】プリントアウト文字位置検出の説明図。
【図5】修正記号の認識の説明図。
【図6】収縮処理の説明図。
【図7】エッジ画像の説明図。
【図8】修正のための各種処理に関する説明図。
【図9】修正のための各種処理のフローチャート。
【図10】単語処理の説明図。
【図11】結合処理の説明図。
【図12】分離処理の説明図。
【図13】従来の文書処理装置の構成図。
【図14】従来の文書処理に関する説明図。
【符号の説明】
1 文書ファイル記憶手段
2 出力手段
5 光電変換手段
6 電子データ蓄積手段
7 文字位置検出手段
8 修正認識手段
9 文字認識手段
10 対応付け手段
11 修正手段

Claims (6)

  1. 文書ファイルを、文書ファイルの文字がドットの集合として複数のドットにより印刷されたドット文字によるイメージでプリントアウトする出力ステップと、
    前記出力ステップにより出力された文書に修正記号が記入された修正入力文書をイメージ入力する入力ステップと、
    前記入力ステップにより入力された修正入力文書中、修正記号が記入された文字の位置を検出する文字位置検出ステップと、
    前記入力ステップにより入力された修正入力文書について、各画素の収縮処理を実行して、前記ドット文字を消去することにより修正記号を抽出し、又は、画素の連結成分を求め、求められた連結成分の画素数に基づき修正記号を抽出し、抽出された修正記号を認識する修正認識ステップと、
    前記文字位置検出ステップにより検出された文字の位置と、前記修正認識ステップにより認識された修正記号とを対応付ける対応付けステップと、
    前記対応付けステップの対応付けに従い、前記修正認識ステップにより認識された修正記号に対応する修正処理により、該当する文字を修正する修正ステップと、
    含む文書処理方法。
  2. 前記修正認識ステップは、
    白画素に隣接する黒画素をエッジとして、そのエッジを元の画像から除去する収縮ステップを備えたことを特徴とする請求項に記載の文書処理方法。
  3. 前記文字位置検出ステップは、
    入力文書のエッジ画像について、横方向及び縦方向のそれぞれに画素数を積算することにより、文字の位置を検出するようにしたことを特徴とする請求項に記載の文書処理方法。
  4. 前記修正ステップは、単語認識処理、結合処理、分割処理のいずれか又は複数をさらに実行することを特徴とする請求項に記載の文書処理方法。
  5. 文書ファイルを、文書ファイルの文字がドットの集合として複数のドットにより印刷されたドット文字によるイメージでプリントアウトする出力ステップと、
    前記出力ステップにより出力された文書に修正記号が記入された修正入力文書をイメージ入力する入力ステップと、
    前記入力ステップにより入力された修正入力文書中、修正記号が記入された文字の位置を検出する文字位置検出ステップと、
    前記入力ステップにより入力された修正入力文書について、各画素の収縮処理を実行して、前記ドット文字を消去することにより修正記号を抽出し、又は、画素の連結成分を求め、求められた連結成分の画素数に基づき修正記号を抽出し、抽出された修正記号を認識する修正認識ステップと、
    前記文字位置検出ステップにより検出された文字の位置と、前記修正認識ステップにより認識された修正記号とを対応付ける対応付けステップと、
    前記対応付けステップの対応付けに従い、前記修正認識ステップにより認識された修正記号に対応する修正処理により、該当する文字を修正する修正ステップと、
    をコンピュータに実行させるための文書処理プログラムを記録した記録媒体。
  6. 文書読み取り認識結果を記憶する文書ファイル記憶手段と、
    前記文書ファイル記憶手段に記憶された文書ファイルを、文書ファイルの文字がドットの集合として複数のドットにより印刷されたドット文字によるイメージでプリントアウトする出力手段と、
    前記出力手段により出力された文書に修正記号が記入された修正入力文書をイメージ入力する入力手段と、
    前記入力手段により入力された修正入力文書中、修正記号が記入された文字の位置を検出する文字位置検出手段と、
    前記入力手段により入力された修正入力文書について、各画素の収縮処理を実行して、前記ドット文字を消去することにより修正記号を抽出し、又は、画素の連結成分を求め、求められた連結成分の画素数に基づき修正記号を抽出し、抽出された修正記号を認識する修正認識手段と、
    前記文字位置検出手段により検出された文字の位置と、前記修正認識手段により認識された修正記号とを対応付ける対応付け手段と、
    前記対応付け手段の対応付けに従い、前記修正認識手段により認識された修正記号に対応する修正処理により、該当する文字を修正する修正手段と、
    を備えた文書処理装置。
JP22723199A 1999-08-11 1999-08-11 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置 Expired - Fee Related JP3954246B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP22723199A JP3954246B2 (ja) 1999-08-11 1999-08-11 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置
PCT/JP2000/002483 WO2001013324A1 (fr) 1999-08-11 2000-04-17 Procede de traitement de documents, support d'enregistrement d'un programme de traitement de documents et dispositif de traitement de documents
US10/049,102 US7142733B1 (en) 1999-08-11 2000-04-17 Document processing method, recording medium recording document processing program and document processing device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP22723199A JP3954246B2 (ja) 1999-08-11 1999-08-11 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置

Publications (3)

Publication Number Publication Date
JP2001052110A JP2001052110A (ja) 2001-02-23
JP2001052110A5 JP2001052110A5 (ja) 2005-04-07
JP3954246B2 true JP3954246B2 (ja) 2007-08-08

Family

ID=16857575

Family Applications (1)

Application Number Title Priority Date Filing Date
JP22723199A Expired - Fee Related JP3954246B2 (ja) 1999-08-11 1999-08-11 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置

Country Status (3)

Country Link
US (1) US7142733B1 (ja)
JP (1) JP3954246B2 (ja)
WO (1) WO2001013324A1 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3954246B2 (ja) 1999-08-11 2007-08-08 独立行政法人科学技術振興機構 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置
JP4123267B2 (ja) * 2005-10-31 2008-07-23 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
JP5303865B2 (ja) * 2007-05-23 2013-10-02 株式会社リコー 情報処理装置、及び、情報処理方法
TW201001303A (en) * 2008-06-27 2010-01-01 Univ Nat Taiwan Science Tech System and method for recognizing document immediately
US8117134B2 (en) * 2008-10-16 2012-02-14 Xerox Corporation Neutral pixel correction for proper marked color printing
US8937749B2 (en) 2012-03-09 2015-01-20 Xerox Corporation Integrated color detection and color pixel counting for billing
JP6131765B2 (ja) * 2013-08-06 2017-05-24 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
US10223590B2 (en) * 2016-08-01 2019-03-05 Qualcomm Incorporated Methods and systems of performing adaptive morphology operations in video analytics

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4204232A (en) * 1977-07-08 1980-05-20 Nippon Electric Co., Ltd. Pattern transmission system comprising an encoder for encoding partial thinned patterns in two scanning lines along only one boundary line
JPS60116464A (ja) * 1983-11-30 1985-06-22 Toshiba Corp プリンタ
DE3577244D1 (de) * 1985-09-13 1990-05-23 Ibm Deutschland Verfahren zur steuerung von zeilendruckern mit einem umlaufenden typenband und einer druckhammerbank.
US4941189A (en) * 1987-02-25 1990-07-10 Lundy Electronics & Systems, Inc. Optical character reader with skew recognition
JPS63220383A (ja) * 1987-03-10 1988-09-13 Mitsubishi Electric Corp 文字入力装置
US5167016A (en) * 1989-12-29 1992-11-24 Xerox Corporation Changing characters in an image
JPH05346970A (ja) * 1991-04-04 1993-12-27 Fuji Xerox Co Ltd 文書認識装置
JPH0676110A (ja) * 1992-08-28 1994-03-18 Kawasaki Steel Corp 文字・文字行切出方法
JPH06325214A (ja) * 1993-05-14 1994-11-25 Sanyo Electric Co Ltd 文字認識後処理装置
JPH0744655A (ja) * 1993-08-03 1995-02-14 Sony Corp 手書き入力表示装置
JPH0981666A (ja) * 1995-09-08 1997-03-28 Toshiba Corp 文字認識装置及び認識結果表示方法
DE19636949A1 (de) * 1996-09-11 1998-03-12 Siemens Ag Verfahren zur Detektion von Kanten in einem Bildsignal
US6219453B1 (en) * 1997-08-11 2001-04-17 At&T Corp. Method and apparatus for performing an automatic correction of misrecognized words produced by an optical character recognition technique by using a Hidden Markov Model based algorithm
JP3954246B2 (ja) 1999-08-11 2007-08-08 独立行政法人科学技術振興機構 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置

Also Published As

Publication number Publication date
WO2001013324A1 (fr) 2001-02-22
US7142733B1 (en) 2006-11-28
JP2001052110A (ja) 2001-02-23

Similar Documents

Publication Publication Date Title
EP2545495B1 (en) Paragraph recognition in an optical character recognition (ocr) process
JP4655335B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US20040034835A1 (en) Method and apparatus for generating a summary from a document image
JP2000278514A (ja) 文書画像結合装置、文書画像結合方法及び文書画像結合プログラムを記録した記録媒体
JP2001358925A (ja) 画像処理のための装置、方法及び記録媒体
US7965293B2 (en) Image processing device, image processing method, and image processing program for reconstructing data
JPH04195692A (ja) 文書読取装置
JP3954246B2 (ja) 文書処理方法、文書処理プログラムを記録した記録媒体及び文書処理装置
US7983485B2 (en) System and method for identifying symbols for processing images
JP3728209B2 (ja) 画像処理方法及び装置及びコンピュータプログラム及び記憶媒体
JP3954247B2 (ja) 文書入力方法、文書入力プログラムを記録した記録媒体及び文書入力装置
US20070041643A1 (en) Character recognition apparatus and character recognition method
US20060023236A1 (en) Method and arrangement for copying documents
US8125691B2 (en) Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information
JP5041775B2 (ja) 文字切出方法及び文字認識装置
JP2006092345A (ja) 文字認識装置、文字認識方法および文字認識プログラム
EP0692768A2 (en) Full text storage and retrieval in image at OCR and code speed
JP2003085477A (ja) 文字認識装置および文字認識結果の訂正方法
JPH07262317A (ja) 文書処理装置
US10659654B2 (en) Information processing apparatus for generating an image surrounded by a marking on a document, and non-transitory computer readable recording medium that records an information processing program for generating an image surrounded by a marking on a document
Jones OCR Of Greek
JP4081074B2 (ja) 帳票処理装置、帳票処理方法、及び帳票処理プログラム
JPH04130979A (ja) 文字画像切出し方法
JPH08272896A (ja) 文字読取り修正方法および文字読取り装置
JP2001265317A (ja) ビットマップフォント、ビットマップフォント作成方法および装置、専用フォント文字を用いた文書データ作成方法および装置並びに文字認識方法および装置

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20031031

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040507

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070123

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070309

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070410

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070426

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees