JPS6344269A - 文書認識処理装置 - Google Patents

文書認識処理装置

Info

Publication number
JPS6344269A
JPS6344269A JP61187323A JP18732386A JPS6344269A JP S6344269 A JPS6344269 A JP S6344269A JP 61187323 A JP61187323 A JP 61187323A JP 18732386 A JP18732386 A JP 18732386A JP S6344269 A JPS6344269 A JP S6344269A
Authority
JP
Japan
Prior art keywords
column
characters
maximum
row
minimum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61187323A
Other languages
English (en)
Inventor
Toshiharu Tanaka
田中 利晴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP61187323A priority Critical patent/JPS6344269A/ja
Publication of JPS6344269A publication Critical patent/JPS6344269A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、たとえば画像読取装置にて光学的に読取った
手書きの表を正式なフォーマットに作成する文書認識処
理装置に関する。
〔従来技術〕
OCR(光学文字読取り装置)等の光学的画像読取り装
置にて文書を読取り、これを文字認識してワードプロセ
ッサ等の文書処理装置にて処理可能な文書フォーマント
に変換する文書認識処理装置が開発されている。
〔発明が解決しようとする問題点〕
このような文書認識処理装置では、その行内文字数(−
行当たりの文字数)が表示装置あるいはプリンタ等の能
力に応じて予め所定字数に設定されている。しかし、手
書きの文書では、通常その行内文字数は必ずしも一定で
はない、従って、手書き文書の処理に際しては、文字列
にて構成される通常の文章は認識された後は予め設定さ
れている行内文字数の文書フォーマットに変換されるが
、罫線にて囲繞された表に関しては種々の問題が生じる
たとえば今、第3図に示す表の如く、第1列の各行の欄
の文字数がそれぞれ3.4.5の場合、縦方向罫線を一
字として単純に文書フォーマットを変換すると、第4図
の如く第1列の各行の欄の終端(縦罫線の位置)が不揃
いになる。一方、罫線位置を優先して文書フォーマント
を変換するとたとえば第5図に示す如くなるが、表とし
ての意味をなさな(なる。また第6図に示すように、各
列の最大の欄内文字数をそれぞれの列の欄内文字数とす
る場合には、元の表の1行が2行に互った状態で作表さ
れる場合があり得、不都合である。
本発明は以上のような問題点の解決を目的としてなされ
たものであり、各個の文字数が不同である表を各Iの行
方向福を揃え、しがも元の表の各行が文書フォーマント
変換後に2行に亙るようなことなしに作表可能な文書認
識処理装置の提供を目的とする。
〔問題点を解決するための手段〕
本発明の文書認識処理装置は、各行(列)に複数の欄を
含み、複数行、複数列からなる表の各列(行)について
各欄の欄内文字数を計数する欄内文字数計数手段と、該
欄内文字数計数手段にて求められた各列(行)の欄内文
字数から最大・最小欄内文字数を抽出する最大・最小欄
内文字数抽出手段と、該最大・最小欄内文字数抽出手段
にて抽出された各列(行)の最大欄内文字数の総和、ま
たは最小欄内文字数と最大欄内文字数との順列組合せに
よる総和を求め、これに列方向(行方向)の母数及び1
を加えた合計値を算出する最大・最小組合せ加算手段と
、該最大・最小組合せ加算手段にまず各列(行)の最大
欄内文字数の総和と列方向(行方向)の種数及び1を加
えた合計値を算出させ、これが1行(1列)の許容文字
数以下である場合は各列(行)の最大欄内文字数をそれ
ぞれの列(行)の総ての欄の欄内文字数として決定し、
各列(行)の最大欄内文字数の総和と列方向(行方向)
の欄数及び1を加えた合計値が1行(1列)の許容文字
数を超える場合は前記最大・最小組合せ加算手段に最小
欄内文字数を1ずつ順次増加させた最小・最大欄内文字
数の順列組合せの組を作成しつつ各組の組合せの)欄内
文字数の総和それぞれと列方向(行方向)の母数及び1
を加えた合計値を算出させ、これが1行(1列)の許容
文字数以内でかつ最大である組合せの各列(行)の欄内
文字数をそれぞれの列(行)の欄内文字数として決定す
る行(列)内文字数比較決定手段とを備えたことを特徴
とする。
〔作用〕
本発明の文書認識処理装置では、一つの欄あるいは1行
の文字数が不同である表を、各個の幅を揃え、しかも元
の表の1行が2行に亙ることなしに作表可能である。
〔実施例〕
以下、本発明をその実施例を示す図面に基づいて詳述す
る。
なお、以下の実施例では前掲の第3図の表を処理対象と
する。
第1図fatは本発明の文書認識処理装置の構成を示す
損略のブロック図、第1図(blはその作表部の構成を
示すブロック図である。
図中1は画像読取装置であり、処理対象の画像を光学的
に読取り、画像データに変換する。
この画像読取装置1にて得られた画像データは文書認識
部2に与えられ、各−文字が公知の手法によりそれぞれ
文字認識される。そして、認識された文字は順次文書処
理部3に送られて所定の文書フォーマントに変換され、
たとえばフロッピーディスク装置等の記憶装置に記憶さ
れる。
ところで、本発明の文書認識処理装置の文書処理部3に
は第1図(blに示す如き作表部が含まれている。
作表部は、処理対象の表の各列それぞれについて各間の
欄内文字数を計数する欄内文字数計数手段11、この欄
内文字数計数手段11により計数された各欄内文字数か
ら最大・最小欄内文字数を抽出する最大・最小欄内文字
数抽出手段12、この最大・最小欄内文字数抽出手段1
2により抽出された最大・最小欄内文字数を基に所定の
演算を行う最大・最小組合せ加算手段13、及びこの最
大・最小組合せ加算手段13の演算結果と変換後の文書
フォーマットの1行の許容字数(以下、行内許容文字数
という)とを比較して各列の欄内文字数を決定す行内文
字数比較決定手段14、更には欄内文字数計数手段11
.最大・最小欄内文字数抽出手段12.最大・最小組合
せ加算手段13それぞれに付属する第1〜第3のメモリ
h1〜門3等にて構成されている。
次にこのように構成された本発明装置の動作について、
第3図に示す表を処理対象として説明する。
まず、欄内文字数計数手段11により各列について順次
各掴の欄内文字数を計数し、その結果を第1のメモリh
1に記憶させる。第2図+3+はこの第1のメモリM1
の記憶内容を示している。
そして、最大・最小欄内文字数抽出手段12により第1
のメモリ旧の記憶内容から各列について最大及び最小欄
内文字数を抽出し、第2のメモ’JM2に記憶させる。
最大・最小欄内文字数抽出手段12は以上の処理を表の
全列について反復する。第2図(blは全列について最
大及び最小欄内文字数が抽出された後の第2のメモリ札
の記憶内容を示している。
次に、最大・最小組合せ加算手段13により第2のメモ
リM2に記憶されている最大欄内文字数の総和を算出し
、更に縦方向の罫線数(具体的には、1行内の濶の数+
1)を加算する。この結果は、第3図の表の例では、最
大欄内文字数の総和が25、縦方向罫線数が6であるか
ら、計31になる。この値は行内文字数比較決定手段1
4により行内許容文字数と比較される。今、たとえば行
内許容文字数が31以上であれば、第2のメモリM2に
記憶されている各列それぞれの最大欄内文字数を各列の
1ii内文字数として決定し、処理対象の表の文書フォ
ーマットの変換を行う。第6図はこのようにして文書フ
ォーマ−/ ’rの変換が行われ、作表された結果を示
している。
ところで、行内文字数比較決定手段14による比較の結
果、最大・最小組合せ加算手段13による第2のメモリ
M2の最大欄内文字数の総和に更に縦方向の罫線数(行
内理数+1)を加算した値が行内許容文字数を超えてい
る場合には、最大・最小組合せ加算手段13は第2のメ
モUM2の記憶内容から第1列の最小欄内文字数と他の
列の最大欄内文字数の総和を求め第3のメモリM3に記
憶させる。以下、第2列の最小欄内文字数と他の列の最
大欄内文字数、第3の列の最小欄内文字数と他の列の最
大欄内文字数・・・というように順次演算を行い、その
結果を第3のメモリM3に記憶させる。第2図(C1は
その第3のメモリ旧の記憶内容を示している。
そして、行内文字数比較決定手段14は第3のメモリ旧
の記憶内容から行内許容文字数以下で且つ最大の値の組
合せを選択する。今、たとえば行内許容文字数が22で
あるとすると、第3の組合せ、即ち第3列の最小行内許
容文字数と他の最大行内許容文字数との組合せが選択さ
れ、この組合せの各列の最大または最小欄内文字数を各
列の欄内文字数として決定する。そして文書フォーマン
トの変換が行われる。
この実施例では各列の欄内文字数はそれぞれ第1列が5
.第2列が4.第3列が3.第4列が5.第5列が5に
なる。
第7図はこのようにして文書フォーマントが変換され作
表された結果を示している。
なお、上述の最大・最小組合せ加算手段13による1列
の最小欄内文字数と他の列の最大欄内文字数との組合せ
では行内許容文字数以下の組合せが存在しない場合には
、最大・最小組合せ加算手段13は次に二つの列の最小
欄内文字数と他の残りの列の最大欄内文字数との組合せ
を順次算出し、この結果と行内許容文字数とを行内文字
数比較決定手段14にて比較して前述同様の処理を行う
、それでもなお、行内許容文字数以下の組合せが存在し
ない場合には、三つの列の最小欄内文字数と他の残りの
列の最大欄内文字数との組合せの和を求めて同様の処理
を行い、以下最小欄内文字数が加算対象になる列数を順
次増加させて同様の処理を行う。
なお、前記実施例では横書きの表を処理対象としている
が、行と列の関係を入れ換えることにより縦書きの表も
同様に処理可能である。
〔効果〕
以上のように本発明では、たとえば手書きされた表のよ
うな欄内の文字数も行内の文字数も不同の表を、閣の幅
を1鏑え、また元の表の各行が作表後の2行に亙るとい
うような不都合なしに処理可能になる。
【図面の簡単な説明】
第1図(81は本発明装置の概略の構成を示すブロック
図、開山)はその作表部の構成を示すブロック図、第2
図+al、 (b)、 fc)はそれぞれ第1〜第3の
メモリの記憶内容を示す模式図、第3図は本発明装置の
処理対象の一例として表を示す模式図、第4乃至7図は
その処理結果を示す模式図である。 11・・・欄内文字数計数手段  12・・・最大・最
小欄内文字数抽出手段  13・・・最大・最小組合せ
加算手段  】4・・・行内文字数比較決定手段時 許
 出願人  三洋電機株式会社 代理人 弁理士  河 野  登 失 業1図(a) M1図(b) 最大・最小      行内文字数 量1のメモリ       第2のメモリ      
第3のメモリ(a)          (’b)  
         (c)第2図 第5図 第7図

Claims (1)

  1. 【特許請求の範囲】 1、各行(列)に複数の欄を含み、複数行、複数列から
    なる表の各列(行)について各欄の欄内文字数を計数す
    る欄内文字数計数手段と、該欄内文字数計数手段にて求
    められた各列 (行)の欄内文字数から最大・最小欄内文字数を抽出す
    る最大・最小欄内文字数抽出手段と、 該最大・最小欄内文字数抽出手段にて抽出 された各列(行)の最大欄内文字数の総和、または最小
    欄内文字数と最大欄内文字数との順列組合せによる総和
    を求め、これに行方向(列方向)の欄数及び1を加えた
    合計値を算出する最大・最小組合せ加算手段と、 該最大・最小組合せ加算手段にまず各列 (行)の最大欄内文字数の総和と行方向(列方向)の欄
    数及び1を加えた合計値を算出させ、これが1行(1列
    )の許容文字数以下である場合は各列(行)の最大欄内
    文字数をそれぞれの列(行)の総ての欄の欄内文字数と
    して決定し、各列(行)の最大欄内文字数の総和と行方
    向(列方向)の欄数及び1を加えた合計値が1行(1列
    )の許容文字数を超える場合は前記最大・最小組合せ加
    算手段に最小欄内文字数を1ずつ順次増加させた最小・
    最大欄内文字数の順列組合せの組を作成しつつ各組の組
    合せの欄内文字数の総和それぞれと行方向(列方向)の
    欄数及び1を加えた合計値を算出させ、これが1行(1
    列)の許容文字数以下でかつ最大である組合せの各列(
    行)の欄内文字数をそれぞれの列(行)の欄内文字数と
    して決定する行(列)内文字数比較決定手段と を備えたことを特徴とする文書認識処理装 置。
JP61187323A 1986-08-08 1986-08-08 文書認識処理装置 Pending JPS6344269A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61187323A JPS6344269A (ja) 1986-08-08 1986-08-08 文書認識処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61187323A JPS6344269A (ja) 1986-08-08 1986-08-08 文書認識処理装置

Publications (1)

Publication Number Publication Date
JPS6344269A true JPS6344269A (ja) 1988-02-25

Family

ID=16203997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61187323A Pending JPS6344269A (ja) 1986-08-08 1986-08-08 文書認識処理装置

Country Status (1)

Country Link
JP (1) JPS6344269A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03262075A (ja) * 1990-03-13 1991-11-21 Fujitsu Ltd 表整形方式
JPH04165560A (ja) * 1990-10-30 1992-06-11 Pfu Ltd 表作成装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03262075A (ja) * 1990-03-13 1991-11-21 Fujitsu Ltd 表整形方式
JPH04165560A (ja) * 1990-10-30 1992-06-11 Pfu Ltd 表作成装置

Similar Documents

Publication Publication Date Title
US4610025A (en) Cryptographic analysis system
JP4607633B2 (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
JP5950700B2 (ja) 画像処理装置、画像処理方法及びプログラム
US20230177266A1 (en) Sentence extracting device and sentence extracting method
JPS6344269A (ja) 文書認識処理装置
JPH0423185A (ja) 自動セル属性判定機能を有する表読取装置
US12608961B2 (en) License plate identification system and method thereof
JPS6132187A (ja) 文字認識方式
JPH06131497A (ja) 表認識方式
JP4181327B2 (ja) 数式認識装置および数式認識方法
JP2569103B2 (ja) 文字検出方法
JP2788506B2 (ja) 文字認識装置
JP3071048B2 (ja) 文字認識装置及び方法
JP3195405B2 (ja) 文字認識装置
JPH0514952B2 (ja)
JP2931485B2 (ja) 文字切出し装置及び方法
JPS60169984A (ja) 文章読取装置
JPS61202273A (ja) 電子式辞書
JP2743995B2 (ja) 文字読取装置
JPS59221732A (ja) カナ漢字変換処理装置
JPS63204486A (ja) 文字入力装置
JP2623292B2 (ja) 辞書データの作成方法
JPH08180131A (ja) 画像処理方法
JPH0436885A (ja) 光学式文字読取装置
JPH02136956A (ja) レイアウト情報の抽出方法