JPH03260886A - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JPH03260886A
JPH03260886A JP2057995A JP5799590A JPH03260886A JP H03260886 A JPH03260886 A JP H03260886A JP 2057995 A JP2057995 A JP 2057995A JP 5799590 A JP5799590 A JP 5799590A JP H03260886 A JPH03260886 A JP H03260886A
Authority
JP
Japan
Prior art keywords
character
characters
standard
width
recognized
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2057995A
Other languages
English (en)
Inventor
Tetsuo Kiuchi
木内 哲夫
Kazushi Yoshida
收志 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fuji Electric Co Ltd
Fuji Facom Corp
Original Assignee
Fuji Electric Co Ltd
Fuji Facom Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Electric Co Ltd, Fuji Facom Corp filed Critical Fuji Electric Co Ltd
Priority to JP2057995A priority Critical patent/JPH03260886A/ja
Publication of JPH03260886A publication Critical patent/JPH03260886A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は、文字やマークなど(以下、単に文字等とい
う)を認識するための文字認識方法、特に高精度な文字
認識が可能な文字認識方法に関する。
〔従来の技術〕
従来、この種の方法として、例えば文書画像から文字行
または文字列(以下、単に文字行という)を切り出した
後、文字らしきものを仮文字として抽出し、この仮文字
から所定の文字サイズを基準として全角文字(漢字等)
を切り出し、文字サイズから全角文字と確定できないも
のは、半角文字として有効に成立し得る文字か否かを調
べ、取立すれば半角文字として認識する方法がある。し
かし、このような方法では文字によって全角文字が2つ
以上の半角文字として誤E?21にされるおそれがある
。そこで、出願人は次のような方法を提案している(特
願昭63−292445号;提案済み方法1とも云う)
第6図は提案済みの方法1を説明するためのフローチャ
ートである。
これは、図示されない画像処理装置の処理手順を示すも
ので、まず文書画像データを入力しく■参照)、その水
平方向の投影値をとることにより、各文字行を切り出す
(■参照)。これにより、行の幅寸法を求め、全角文字
の大きさに相当する量(文字サイズ)を得る。なお、こ
こでは横書きの場合を想定しているが、縦書きの場合も
同様である。
次に、各行に垂直な方向の投影値を調べ、文字サイズを
考慮することにより、各文字行から文字らしきもの、す
なわち仮文字群を切り出しく■参照)、シかる後この仮
文字群の中から上記文字サイズを利用して全角文字を選
出する(■参照)。
全角文字として選出する条件は次のとおりである。
イ)それ単独で文字サイズが全角文字サイズのもの、即
ち他の仮文字と結合する余地の全くないもの。
口)句読点。
ハ)それ単独では半角サイズであるが、隣り合う他の半
角サイズの仮文字と結合させてみると全角サイズとなる
もの。
二)それ単独ではサイズが全角サイズよりも小さいが、
隣り合う他の半角サイズの仮文字との間に距離があり過
ぎ、これらを無理に結合させると全角文字サイズをこえ
るもの。
以上の如き条件に従って全角文字を全て選出した後、あ
とに残った仮文字について、これを統合または分離して
統合文字1分離文字を作威しく0参照)、シかる後これ
らの統合文字1分離文字をOCR(文字読取装置)によ
り、辞書パターンとの類似度を利用して認識する(■参
照)。
次に、その認識結果に対して次のような矛盾処理を実行
する(■参照)。
a)例えば認識すべき対象が分離文字であるにも関わら
ず、OCRによる認識結果が全角サイズの漢字を示すも
のとすれば互いに矛盾するので、かかる認識結果は採用
しない。
b)上記とは逆に、認識すべき対象か統合文字であるに
もかかわらず、OCRによる認識結果が英字、数字等の
半角サイズ文字を示す場合。
そして、最後に残された文字につき、これを統合文字と
すべきか分離文字とすべきかを、OCRにより相対類似
度を用いて判別する(■参照)。
なお、類似度xlは、類似度Xと類似度の平均値mとの
比に、或る定数(例えば、1024)を掛けたものとし
て定義する。すなわち、xl=x/m一定数(1024
) である。
上述の方法では類似度から認識結果を決定するようにし
ているので、例えば「う」と「ろ」、「テ」と「チjの
如く非常に似ているものは、文字画像の僅かな違い、例
えば文字等の太さや字体の相違、文字等のつぶれやかす
れ等により誤認識するおそれがある。また、同様の理由
から、「は」の相対類似度よりも「(jと「よ」の部分
の相対MifJ度の方が高くなり、f4 認識してしま
うことがある。このことにつき、以下に具体的に説明す
る。
第7図は入力文字「は」について、これを統合文字1と
して処理した場合と、分離文字2.3として処理した場
合の類似度X、相対類似度xiを示すものである。すな
わち、類似度X、類似度の平均値mとが図示の如く得ら
れたものとすると、類似度とその平均値との比に一定数
(1024)を乗じて得られる相対類似度は、統合文字
1の場合はr954.、分離文字2,3の場合はそれぞ
れ「10283.  「898.でその平均値は「96
3」となり、 954<963 であることから、入力文字「は」は「(」(前括弧)と
「はヨからなるものとして誤認識されることになる。な
お、定数はr1024」に限らないことは勿論である。
このような問題を解決するため、出願人はさらに次のよ
うな方法を提案している(特願平1−39308号;提
案済み方法2ともいう)。
第8図は提案済み方法2を説明するためのフローチャー
トで、第6図に示すものに対し形状特徴照合ステップ[
相]〜[相]を付加した点が特徴である。
この方法の要点は、認識すべき文字の縦横比と縦方向お
よび横方向にそれぞれいくつに分離できるかを示す形状
特徴量も辞書として予め記憶しておき、入力文字の形状
特徴量をその認識結果と対応する候補文字の予め記憶さ
れている形状特徴量と比較して、類似度に基づく認識結
果を採用するか否かを決定するようにした点にある。
この例につき、以下に具体的に説明する。
第9図は入力画像(または入力文字)が「う」で、人力
画像から得られる形状特徴は「縦長で、縦方向に2つに
分離する」であり、これに対して認識結果の候補文字の
第1〜第10位のうちの第1位が「ろ」となった例であ
る。この場合、辞書に予め記憶されている「ろ」の形状
特徴は「縦長でも横長でもなく、縦横に分離しない」で
ある。
従って、縦長・横長チエツクのステップ(第8図[相]
参照)でNo”となるため、第2位の候補文字のチエツ
クが行なわれる。第2位の候補文字は「う」であり、形
状特徴量が一致するので、これを認識結果として採用す
る。
第10図は入力文字「は」を統合文字として処理する場
合と、分離文字r(、、rよ」として処理する場合の例
である。すなわち、同図(イ)の如く統合文字として処
理する場合は、認識結果の第1候補「は」が形状特徴量
の点からも適合するので、「はjが採用される。同様に
、分離文字「(」は同図(ロ)の如く第1位候補文字「
(」と適合するが、分離文字「よ」は同図(ハ)の如く
、その形状特徴量から第1位候補文字「は」とは適合せ
ず、結局第2位の候補文字「まJと適合する。
そし=、同図(ニ)に示す如く、「は」として認識した
ときの相対類似度はr954」、「(」と「ま」に分離
されるものとしたときの相対類似度はrc+46」とな
り、 946<954 から1は」が採用されることになる。つまり、入力文字
は「は」と認識され、「(」と「ま」に誤認識されるお
それをなくすことができる。
〔発明が解決しようとする課題〕
上述の形状特徴は限定された条件では有効であるが、−
船釣に扱おうとすると困難である。例えば、文字の縦横
比は字体によって異なるため縦横比が2倍以上必要とさ
れることから、「−」や「1」のように適用可能な字種
が限定されることになる。例えば、片仮名の「口」と漢
字の「口」は文字画像が相似であるが、大きさを比べる
と漢字の「日二の方が大きく、片仮名の「力」と漢字の
1カニ、片仮名の「工jと漢字のr工、も同様である。
また、英字の小文字と大文字ではr(、とrc4. r
K」とrk、、 r□、と70;、 rp。
と7PJ、 ’Sjと’SJ、 ’UJとrtB、rV
ごと’v二、rJ、とrWJ、 7XJと「X−1「Z
:とzBが同様である。さらに、英字の「I」と漢字の
「工」、漢字の「8二とr日二は縦横比を変えると相似
となる。
一方、分離数については「二jは確実に1@1方向に2
つに分離する」が、「は」は常に「横方向に2つに分離
する」とは限らない。つまり、文字種により分離数を確
実に指定することはできない。
このように、文字画像のノイズは勿論のこと、文字の傾
き1文字の大きさ(級数)、変形率等が分離数に影響す
るので、やはり適用可能な字種が限定されることになる
したがって、この発明の目的は形状特徴を広く適用でき
るように改良して以上の如き欠点を除去し、認識率を向
上させることにある。
〔課題を解決するための手段〕
文書を画像処理して個々の文字を切り出し各文字毎に辞
書パターンとの類似度を求めて文字を認識するに当たり
、認識すべき文字の文字幅1文字高さ、外接矩形の面積
、縦横比の少なくとも1つについて、認識すべき文字を
含む文書内の標準的な文字との比率を求め、これを予め
求めておいた基準値と比較することにより、或る文字の
字形が他の文字の字形を縦方向、横方向または縦横両方
向に伸張または圧縮して得られる文字と類似するときの
判別を容易にする。このとき、前記各比率の平均値、標
準偏差またはこれらから導かれる量を求めるとともに、
その各々に対する基準値を予め求めてこれを辞書として
所定のメモリに記憶しておくことができる。
また、文書を画像処理して個々の文字を切り出し各文字
毎に辞書パターンとの類似度を求めて文字を認識するに
当たり、認識すべき文字の縦置離数、横分離数をその文
字サイズから予測し、これを基準値と比較することによ
り、或る文字が分離文字になり易い字形であるときの判
別を容易にする。このとき、前記縦分離数、横分離数の
平均値。
標準偏差またはこれらから導かれる量を求めるとともに
、その各々に対する基準値を予め求めてこれを辞書とし
て所定のメモリに記憶しておくことができる。
〔作用〕
一般に、例えば片仮名の「口」と漢字の1口」を判別す
る場合、明朝体を除いてはその文字単独では困難である
。しかし、片仮名の「口、と漢字の「口」の2つの文字
を比較できれば、小さい方が片仮名の「口jで、大きい
方が漢字の「口」である。一般の文書を読んでいる場合
、そのような直接比較は出来ないが、他の文字と比較し
てその文字が大きめのものに属するか、小さめのものに
属するかで判定することができる。すなわち、その文字
の標準文字サイズ(変形率も含めて)を知り、文字画像
の大きさを量的に比較することにより、類似文字の判定
を正確に行なうことができる。
また、文字サイズが小さくなって0に近づくと、どんな
文字でも文字画像は潰れて塊になるので、分離数は1に
収束し、文字サイズが大きくなると、文字は潰れにくく
なって分離数は増加傾向となり、さらに大きくなると分
離数はその字種の分離し得る最大値に収束する。そこで
、分離文字を文字サイズの連続関数とみなし、分離数の
期待値からどれくらい外れているかを求めることにより
、統合文字2分離文字の判定を正確に行なうことができ
る。
つまり、認識すべき文字の文字幅2文字高さ。
外接矩形の面積、縦横比の少なくとも1つについての認
識すべき文字を含む文書内の標準的な文字の各対応する
量との比率、または縦分離数、横分離数をその文字サイ
ズから予測することにより、より高精度の認識を可能に
するものである。
〔実施例〕
第1図はこの発明の実施例を示すフローチャートである
。なお、ステップ■〜■は従来と同様なので、ステップ
■〜[相]について以下に説明する。
まず、次式で定義される正規化した文字高さの残差Hn
、および正規化した文字幅の残差Wnを求める(■、[
相]参照)。
二二に、H,Wは文字画像から測定した文字高さ5文字
幅である。第2図(イ)に入力画像のサンプルデータを
示す。Hs、Wsは入力文書(文章2段落1行)の標準
文字高さ、標準文字幅で、第2図(ロ)にそのデータを
文書データとして示している。或る字体の標準文字高さ
、標準文字幅シよその字体の最大文字高さ、最大文字幅
であり、その字体の漢字の最大文字高さ、最大文字幅と
考えて差支えない。なお、標準文字サイズは字体や変形
率1級数等の違いによって生しる誤差を吸収するための
もので、安定な値が得られるのであれば最大値に限らず
、平均値または最頻値でも良いことは勿論である。入力
文書の標準文字高さ、標単文字幅は文書を読取る前に外
部から指定されるか、読取り中に周囲の文字から統計的
に求めることができるので、その詳細は省略する。
また、標準文字高さHs、標準文字幅Wsは文字級数を
Q1垂直変形率をαV、水平変形率をαh、レターフェ
ースと正体の標準文字高さ、標準文字幅との比率をそれ
ぞれβV、βhとすれば、次式の関係にある。
Hs=β7.Q、αV       ・・・(3)W 
s =βh−にlαh        =(4jHμj
、Hσjは字種jの字体毎の標準文字高さとの比率の平
均値、標準偏差を示し、W、czj。
Wσjは字種jの字体毎の標準文字高さとの比率の平均
値、標準偏差を示す。これらの求め方につき、以下に説
明する。
例えば、ゴシック体と明朝体とでは、同し級数の同し字
種を比べると、一般に明朝体の方が大きい。片仮名の「
口jと漢字の「口」とを大きさで判別するため、このよ
うな字体間の文字サイズの違いを補正しておくことが望
ましい。そこで、例えばゴシック体13級の「あ」を、
ゴシック体13級の標準文字高さで割った値を求める。
次に、明朝体16級の「あ」を、明朝体16級の標準文
字高さで割った値を求める。このようにして、次々と「
あ」について文字セント(字体)毎の標準文字高さとの
比率を求め、これらから平均値「Hμあ」と標準偏差「
Hσあ:が求められる。これらHuj、Hσj、Huj
、Wσjは、文書を読取るに先立って読取り辞書を作成
するとともに計算しておき、字種jによって簡単に引け
るように表にして第3図の如く記憶しておく。なお、第
3図は字種に1の特徴量を詳細に示しているが、他の字
種についても同様である。また、以上では文字高さ1文
字幅を用いたが、これと等価な外接矩形と縦横比を用い
ても良い。
次に、次式の如く定義される正規化した縦分離数の残差
NVn、および正規化した横分離数の残差NHnを求め
る(■、a2)参照)。
NV σ j 二二に、NV、NHは入力文字画像から測定した縦置離
数、横分離数で、これらは、 縦分離数の平均  二N■μj=F1 (L  H)縦
分離数の標準偏差二NVσj=F2 (j、H)横分離
数の平均  :NHμj=F3 (j、W)横分離数の
標準偏差:NHtjj=F・4 (j、W)のように字
種jと文字幅W1文字高さHとの関数である。
例えシヨ、ゴシック体10級の「は」の横分離数は「2
」、教科書体10級の「は」の横分離数は「1」、明朝
体10級の「は」の横分離数はF2」であったとすると
、その平均値と標準偏差は、NHμは=F3(は、10
級) =、(2+1+2)/3=1.667 NHσは=F4(は、10級) = [(4+1+4)/3− (1,667)”] ”
2=0.47 となる。このようにして、10級のもっと多くの字体に
対してrNHμはJ、rNHσはコを求める。次に、1
2級についても同様にしてrNHμはj+  rNHσ
は」を求め、以後同様の操作を繰り返し、補間法により
Fl(は、  H)、F2 eまH)、F3(は、W)
、F4(は W)を求める。
そして、全ての字種についてかかる操作を実施すれば、
関数Fl (j、H)、F2 (j、H)、F3 (j
、W) 、F4 (j、W)が求められることになる。
第4図に縦分離数の平均関数とその標準偏差F1、F2
および横分離数の平均関数とその標準偏差F3.F4の
例を示す。
縦分離数の平均関数Fl (j、H)は同図(イ)のよ
うに文字種j1文字高さHの関数であり、(a 3  
         (a 2≦H)(7) で表わされる。その標準偏差の関数F2 (j、H)は
同図(ロ)から、 [6 (H≦bl) NVσ=J、 (b5−b3) (H−b2)/ (b
・・・ (8) で表わされる。同様に、 ・・・ (9) ・・・ (10) で表わされる。
次のステップ@では、次式で定義されるノルム(パター
ンの長さに相当する)を求める。
D  j  =  [Hn”+Wnz+NVn”+NH
n2コ l/2・・・(11) 上記ではHn、Wn、NVn、NHnの4つの量でノル
ムを表現するようにしているか、そのうちの1つ以上を
用いて表現することができる。
ステップ[相]では、類似度の判定結果と統合して文字
種jの総合判定結果Tjを得る。すなわち、相関値であ
る類似度Rjを、次式の如く形状特徴の結果Djと結合
する。
Tj=wl ・Rj+w2・ [max (A”Dj”
、O)  コ 1″           ・・・ (
12)ここに、wl、w2は定数で、類似度Rjと形状
特徴の結果Djの重みを示し、Aは形状特徴の効果に限
度を与えるための定数である。なお、上式(12)は、 Tj=W1・Rj+w2・Dj   ・・・(13)の
ように簡略化することができる。
形状特徴を類似度の補助として用いる場合、すなわち類
似字形がなく類似度だけで充分判定が可能で形状特徴を
必要としない字種の場合は、上記多量の標準偏差の値を
実際よりも大きめにしておけぽDjの値は非常に小さく
なり、形状特徴の効果を弱めることができる。
なお、分離文字をより詳細に表現するには、文字を部分
図形と空白の組み合わせと見做して表わすこともできる
。例えば第5図(イ)に示すように漢字「洲」は6つの
部分図形の大きさと5つの空白の大きさのリストとして
同図(ロ)、(ハ)のように表現し、標準文字サイズで
正規化したときに空白の大きさが1画素以下になったら
潰れるとしてリスト間でパターンマツチングをとるよう
にしても良い。ただし、どの空白から潰れるかは確率的
な問題となるので、パターンマツチングをとる手法が複
雑となる。
〔発明の効果〕
この発明によれぽ、標準文字高さHs、標準文字幅Ws
は字体間の文字の大きさの違いを補正する量であり、1
つの文書では路間−の字体を用いていることから、字体
間の文字の大きさの違いを詳細かつ正確に判定すること
ができる。これにより、或る文字の字形が他の文字の字
形を縦方向。
横方向または縦横両方向に伸張または圧縮して得られる
類似文字であるときも、両者の判別が可能となる。さら
に、字種毎の平均値、標準偏差を大きさのバラツキを評
価するための評価基準に組み込むことにより、判定がよ
り正確となる。
その結果、片仮名の「口ごと漢字の「口」は文字画像が
相似であるが、大きさを比べると漢字の「口」の方が大
きく、片仮名の「力」と漢字の「力」、片仮名の「工」
と漢字の「工」も同様である。また、英字の小文字と大
文字では「C」と「Cl、 rK」とrk、、 rO」
とro」、rp」と’PJ、 r3.と「S」、「U」
とru」、rV、と「■」、「W」と「W」、「X」と
「X」「Z」と「z」が同様である。さらに、英字の「
I」と漢字の「工」、漢字の「日」と「日」は縦横比を
変えると相似となるが、以上のような類似の文字の判別
が容易となる。
また、文字の分離の仕方を文字サイズによって予測し、
その予測結果を基準値と比較して判定するようにすれば
、文字の統合2分離をより正確に判定することができる
。さらに、分離の仕方の字種毎の平均値、標準偏差を大
きさのバラツキを評価するための評価基準に組み込み、
これを文字サイズの近似式または関数として利用すれば
、判定がより正確となる。
その結果、「二」のように確実に「縦方向に2つに分離
するj文字は勿論のこと、rは」のように常に「横方向
に2つに分離する」とは限らない文字種についても統合
2分離判定が容易となる。
【図面の簡単な説明】
第1図はこの発明の実施例を示すフローチャート、第2
図はサンプルデータおよび文書データを説明するための
説明図、第3図は辞書データを説明するための説明図、
第4図は縦分離数、横分離数の各平均、標準偏差を説明
するための説明図、第5図は或る文字の一例とその文字
分離リストを説明するための説明図、第6図は提案済み
方法1を説明するためのフローチャート、第7図は提案
済み方法lを具体的に説明するための説明図、第8図1
ま提案済み方法2を説明するためのフローチャート、第
9図および第10図はいずれも提案済み方法2を具体的
に説明するための説明図である。 符号説明 1・−・統合文字、2.3・・・分離文字。

Claims (1)

  1. 【特許請求の範囲】 1)文書を画像処理して個々の文字を切り出し各文字毎
    に辞書パターンとの類似度を求めて文字を認識するに当
    たり、 認識すべき文字の文字幅、文字高さ、外接矩形の面積、
    縦横比の少なくとも1つについて、認識すべき文字を含
    む文書内の標準的な文字の各対応量との比率を求め、こ
    れを予め求めておいた基準値と比較することにより、或
    る文字の字形が他の文字の字形を縦方向、横方向または
    縦横両方向に伸張または圧縮して得られる文字と類似す
    るときの判別を容易にしてなることを特徴とする文字認
    識方法。 2)前記各比率の平均値、標準偏差またはこれらから導
    かれる量を求めるとともに、その各々に対する基準値を
    予め求めてこれを辞書として所定のメモリに記憶してお
    くことを特徴とする請求項1)に記載の文字認識方法。 3)文書を画像処理して個々の文字を切り出し各文字毎
    に辞書パターンとの類似度を求めて文字を認識するに当
    たり、 認識すべき文字の縦分離数、横分離数をその文字サイズ
    から予測し、これを基準値と比較することにより、或る
    文字が分離文字になり易い字形であるときの判別を容易
    にしてなることを特徴とする文字認識方法。 4)前記縦分離数、横分離数の平均値、標準偏差または
    これらから導かれる量を求めるとともに、その各々に対
    する基準値を予め求めてこれを辞書として所定のメモリ
    に記憶しておくことを特徴とする請求項3)に記載の文
    字認識方法。
JP2057995A 1990-03-12 1990-03-12 文字認識方法 Pending JPH03260886A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2057995A JPH03260886A (ja) 1990-03-12 1990-03-12 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2057995A JPH03260886A (ja) 1990-03-12 1990-03-12 文字認識方法

Publications (1)

Publication Number Publication Date
JPH03260886A true JPH03260886A (ja) 1991-11-20

Family

ID=13071591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2057995A Pending JPH03260886A (ja) 1990-03-12 1990-03-12 文字認識方法

Country Status (1)

Country Link
JP (1) JPH03260886A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06342471A (ja) * 1993-06-01 1994-12-13 Hiroshi Kuyama 図形等の形状特性解析方法
US5999647A (en) * 1995-04-21 1999-12-07 Matsushita Electric Industrial Co., Ltd. Character extraction apparatus for extracting character data from a text image

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62190575A (ja) * 1986-02-18 1987-08-20 Mitsubishi Electric Corp 文字パタ−ン切り出し装置
JPS62247485A (ja) * 1986-04-21 1987-10-28 Ricoh Co Ltd 文字認識装置における認識結果出力方法
JPS6316392A (ja) * 1986-07-08 1988-01-23 Matsushita Electric Ind Co Ltd 文字認識装置
JPH01114991A (ja) * 1987-10-29 1989-05-08 Fuji Electric Co Ltd 大文字,小文字の判別方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62190575A (ja) * 1986-02-18 1987-08-20 Mitsubishi Electric Corp 文字パタ−ン切り出し装置
JPS62247485A (ja) * 1986-04-21 1987-10-28 Ricoh Co Ltd 文字認識装置における認識結果出力方法
JPS6316392A (ja) * 1986-07-08 1988-01-23 Matsushita Electric Ind Co Ltd 文字認識装置
JPH01114991A (ja) * 1987-10-29 1989-05-08 Fuji Electric Co Ltd 大文字,小文字の判別方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06342471A (ja) * 1993-06-01 1994-12-13 Hiroshi Kuyama 図形等の形状特性解析方法
US5999647A (en) * 1995-04-21 1999-12-07 Matsushita Electric Industrial Co., Ltd. Character extraction apparatus for extracting character data from a text image
US6064769A (en) * 1995-04-21 2000-05-16 Nakao; Ichiro Character extraction apparatus, dictionary production apparatus and character recognition apparatus, using both apparatuses
US6141443A (en) * 1995-04-21 2000-10-31 Matsushita Electric Industrial Co., Ltd. Character extraction apparatus, dictionary production apparatus, and character recognition apparatus using both apparatuses

Similar Documents

Publication Publication Date Title
US5848191A (en) Automatic method of generating thematic summaries from a document image without performing character recognition
US5892842A (en) Automatic method of identifying sentence boundaries in a document image
JPH08166970A (ja) コード化したワードトークンを使用して文書画像をハイライトで強調する方法
EP0543592A2 (en) Optical word recognition by examination of word shape
EP0543594A2 (en) A method for deriving wordshapes for subsequent comparison
EP0779592B1 (en) Automatic method of identifying drop words in a document image without performing OCR
US8229248B2 (en) Methods and systems for identifying the orientation of a digital image
JPH07200745A (ja) 少なくとも二つのイメージセクションの比較方法
JP2001283152A (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US7099507B2 (en) Method and system for extracting title from document image
JP2000315247A (ja) 文字認識装置
US8340428B2 (en) Unsupervised writer style adaptation for handwritten word spotting
JPH0440749B2 (ja)
JPH03260886A (ja) 文字認識方法
US11361529B2 (en) Information processing apparatus and non-transitory computer readable medium
JP7382544B2 (ja) 文字列認識装置及び文字列認識プログラム
CN100550040C (zh) 光学字符识别方法和设备及字体识别方法和设备
JP3187899B2 (ja) 文字認識装置
Chen et al. Detection and location of multicharacter sequences in lines of imaged text
JP3157530B2 (ja) 文字切り出し方法
JP3384634B2 (ja) 文字種識別方法
KR910007032B1 (ko) 한글 문서 인식장치의 문자열과 개별문자 절출방법
JPH0950488A (ja) 異サイズ混在文字列の読取り方法
JPH08147314A (ja) 認識型文書ファイリング装置及びその制御方法
JP2803892B2 (ja) 文字認識装置