JPH04290185A - 縦書横書判別方法 - Google Patents

縦書横書判別方法

Info

Publication number
JPH04290185A
JPH04290185A JP3054866A JP5486691A JPH04290185A JP H04290185 A JPH04290185 A JP H04290185A JP 3054866 A JP3054866 A JP 3054866A JP 5486691 A JP5486691 A JP 5486691A JP H04290185 A JPH04290185 A JP H04290185A
Authority
JP
Japan
Prior art keywords
vertical
character
horizontal
character spacing
writing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP3054866A
Other languages
English (en)
Inventor
Michihiko Kawazoe
川添 三千彦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Corp
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Corp, Omron Tateisi Electronics Co filed Critical Omron Corp
Priority to JP3054866A priority Critical patent/JPH04290185A/ja
Publication of JPH04290185A publication Critical patent/JPH04290185A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、縦書あるいは横書で
数行にわたり一定の情報を表すように記載された文字の
文字認識を行い、認識後の文字列が一定情報を表すよう
に縦書であるか横書であるかを判別する縦書横書判別方
法に関する。
【0002】
【従来の技術】従来の縦書横書判別は、OCR等により
読み取った文字データをパターンマッチング等により文
字認識し、その認識後の文字列を、データベースに格納
してある例えば「東京都」や、「××××会社」、「×
×大学」、「野球」、「コンピュータ」等の一定の意味
をなす情報(熟語)と照合して、文字列と一致する情報
があるか否かで行っている。
【0003】つまり、縦書である文書を例えば横書であ
ると判断した場合には、文字単体自体を認識できたとし
ても、各文字列が一定の情報を形成せず、その情報を分
類してデータベース化等の利用ができなくなるので、縦
書横書判別を行う。
【0004】
【発明が解決しようとする課題】しかし、このような従
来の縦書横書判別では、文字認識後の文字列を、データ
ベースに格納した一定の意味をなす情報、つまり熟語と
照合するため、その照合処理に時間がかかり、全体とし
てのデータ処理速度が遅くなるという問題がある。
【0005】また、その照合処理の一致する割合をより
増大させたい場合や、文書にどのような情報が記載され
ているか分からない場合には、データベースの容量を増
大させる必要があるので、処理速度がより遅くなると共
に、データベースのためのメモリ容量が増大してしまう
という問題がある。
【0006】そこで、本発明は上記問題に鑑みなされた
もので、文字認識後の縦書横書判別の際にはデータベー
スによる照合を行わず、処理速度を迅速化させた縦書横
書判別方法を提供することを目的とする。
【0007】
【課題を解決するための手段】上記目的を達成するため
本発明は、縦書あるいは横書で数行にわたり一定の情報
を表すように記載された文字の文字認識を行い、認識後
の文字列が上記一定情報を表すように縦書であるか横書
であるかを判別する縦書横書判別方法において、横方向
あるいは縦方向の一定方向から上記文字を読取り、その
読取りデータにより文字認識を行うと共に、文字認識不
可の場合には読取データを90度回転させて再度上記文
字認識を行い、文字認識可の場合には、上記読取データ
に基づき縦方向および横方向の文字間隔を算出して、両
方向の文字間隔の一定である割合の大小を比較すると共
に、両方向の文字間隔の大小を比較し、上記比較結果に
基づいて縦書横書の判別を行うことを特徴とする。
【0008】
【作用】上記構成では、まずは横方向あるいは縦方向の
一定方向から文字を読取って文字認識を行い、文字認識
可の場合には読取データに基づき縦方向および横方向の
文字間隔を算出して、両方向の文字間隔の一定である割
合を比較すると共に、両方向の文字間隔の大小を比較し
、上記両比較結果に基づいて縦書横書の判別を行うよう
にしたので、文字認識時の文字間隔から縦書横書を判別
することができ、データベースとの照合処理の必要がな
くなる。
【0009】
【実施例】以下、この発明を図面に基づいて説明する。
【0010】図1は、この発明に係る縦書横書判別方法
を採用した名刺データの読取り・分類装置を簡略化して
示す説明図である。
【0011】この図において、名刺1は名刺搬送装置2
により自動的に一枚ずつ順次送られ、その送られた名刺
1上に印字された「社名」、「氏名」、「部課名」およ
び「電話番号」等の漢字や数字等の文字が読取り部3に
より読取られる。読取り部3で読取られた文字は、RS
 232C 等のケーブル4を介してデータ処理装置で
あるパソコン(パーソナルコンピュータ)本体5に読取
りデータとして入力し、そこで文字認識されると共に本
発明に係る方法により縦書横書の判別が行われる。その
結果はCRT6やプリンタ7から出力される。
【0012】尚、この文字読取り・分類装置および搬送
装置自体の構成は従来から周知のものであり、文字認識
もパターンマッチング等の従来からの手法を用いている
。また、本発明に係る縦書横書判別方法は、パソコン本
体5内に内蔵されるCPU(図示せず)と、ROMある
いはRAM等のメモリ(図示せず)とによるプログラム
処理により行われる。
【0013】次に、上記の如く構成された文字読取り・
分類装置において実施される本発明に係る縦書横書判別
方法の一実施例を、図2に示すフローチャートに基づい
て説明する。
【0014】まず最初に横方向に読取り部3をスキャン
させて名刺1上に印字された文字を読取り(ST10)
、パターンマッチング等の方法により文字認識を行う(
ST20)。
【0015】認識不可の場合には(ST30“No ”
)、読取った文字データ、つまり読取りデータを時計回
りに90度回転させた後に(ST40)、再度認識を行
い(ST10)、認識できるか否かを判断し(ST30
)、また認識付加の場合には(ST30“No ”)、
読取りデータの90度回転、文字認識および認識判断の
処理(ST40,10,30)を少なくとも3回読取り
データが一回転するまで繰り返す。読取りデータを90
度回転させる方法は公知で、例えばパターンマッチング
の読取りデータ、つまり二値化したマトリクス状の読取
りデータの場合には、各“行”の要素をそれぞれ対応す
る各“列”に変換する方法等により行われる。
【0016】認識可能となれば(ST30“Yes”)
、次に縦書横書の判別を行うため、まずは縦方向および
横方向の各文字の文字間隔を算出して、両方向の文字間
隔の一定である割合の大小、つまりその割合がどちらの
方向のほうが大きいか、あるいはほぼ同じかの判別を行
う(ST50)。この文字間隔の算出は、例えば文字読
取り時における文字の切り出し間隔等により行う。
【0017】横方向の文字間隔が一定である割合が縦方
向の文字間隔が一定である割合より大きいと判別された
場合には(ST50“横>縦”)、横書きと判断する一
方(ST60)、縦方向の文字間隔が一定である割合が
横方向の文字間隔が一定である割合より大きいと判別さ
れた場合には(ST50“横<縦”)、縦書きと判断し
(ST70)、さらに横方向の文字間隔が一定である割
合と縦方向の文字間隔が一定である割合が同じであると
判別されれば(ST50“横=縦”)、次の判別ステッ
プに移行する。ここでの判別は、名刺等のように、「社
名」や「氏名」、「部課名」のような熟語を構成する文
字がその熟語毎に大きさを変えていたり、改行されて行
頭の文字の位置がずれ、あるいは段落のずれが大きいも
のの場合に有効な判別である。
【0018】次のステップでは縦方向の文字間隔と横方
向の文字間隔との大小を比較し(ST80)、縦方向の
文字間隔が横方向の文字間隔より大きいと判別された場
合には(ST80“横<縦”)、横書きと判断する一方
(ST90)、横方向の文字間隔が縦方向の文字間隔よ
り大きいと判別された場合には(ST80“横>縦”)
、縦書きと判断する(ST100)。ここでの判別は、
通常の文書では文字間より行間の方が大、つまり縦書き
のものでは横方向の文字間隔のほうが大きいのに対し、
横書きのものでは縦方向の文字間隔が大きいことに着目
したものである。
【0019】以上ここまでが、文字読取り・分類装置お
よびこの装置において実施される本発明に係る縦書横書
判別方法の説明で、次にこの装置に図3(a)〜(c)
に示すような縦書き、あるいは横書きの名刺を使用した
場合の縦書横書判別を図2に基づいて説明する。
【0020】まず、図3(a)に示すような横書の名刺
の場合には、横方向に読取った際に文字認識が可能なた
め、図2において、ST10,ST20,ST30,S
T50と進む。そして、このST50で縦方向の文字間
隔と横方向の文字間隔とのどちらの文字間隔が一定であ
る割合が大きいか否かの判別が行われ、図3(a)から
明らかなように横方向の文字間隔の一定である割合が、
縦方向の文字間隔の一定である割合より大きいので(S
T50“横>縦”)、横書きであると判断される(ST
60)。
【0021】一方、図3(b)に示すような縦書の名刺
の場合には、横方向に読取った際には文字認識不可能な
ため、図2において、ST10、ST20、ST30、
ST40と進み、このST40で上述のように読取りデ
ータを時計回りに90度反転させる。
【0022】そして、再度文字認識すれば(ST20)
、認識可能と判断できるので(ST30“Yes”)、
ST50へ進み、ここで縦方向の文字間隔と横方向の文
字間隔とのどちらの文字間隔が一定である割合が大きい
か否かの判別が行われる。この場合には、図3(b)か
ら明らかなように縦方向の文字間隔の一定である割合が
、横方向の文字間隔の一定である割合より大きいので(
ST50“横<縦”)、縦書きであると判断される(S
T70)。
【0023】さらに、図3(c)に示すような縦書の名
刺の場合には、横方向に読取った際でも認識可能なため
、図2において、ST10,ST20,ST30,ST
50と進む。そしてこのST50で縦方向の文字間隔と
横方向の文字間隔とのどちらの文字間隔が一定である割
合が大きいか否かの判別が行われるが、図3(c)から
も明らかなように縦方向の文字間隔と、横方向の文字間
隔とがほぼ一定であるため(ST50“縦=横”)、つ
ぎの判断ステップであるST80に移行する。このST
80では縦方向の文字間隔と横方向の文字間隔との大小
を比較し、この場合には、図3(c)からも明らかなよ
うに横方向の文字間隔のほうが縦方向の文字間隔より大
きいので(ST80“横>縦”)、縦書きと判断される
(ST100)。
【0024】従って、本実施例の方法では、縦書横書の
判別を縦方向および横方向の文字間隔に着目して判別す
るようにしたので、文字認識後の文字列をデータベース
に格納してある一定情報あるいは熟語と照合する等の照
合処理がなくなり、縦書横書の判別速度が迅速化し、全
体としてデータ処理速度が高速化されると共に、その照
合処理するためのデータベースのメモリ容量が減縮され
る。
【0025】尚、本実施例では、縦方向および横方向の
文字間隔の一定である割合の大小を比較し、その割合が
等しいと判断された場合のみ縦方向および横方向の文字
間隔の大小を比較するようにしたが、本発明では、縦方
向および横方向の文字間隔の一定である割合の大小と、
縦方向および横方向の文字間隔の大小とを同時に行い、
その結果により、上記本実施例のように縦書横書を判別
するようにしてもよい。また、本実施例では名刺につい
て説明したが、本発明では名刺に限らずに一般の文書が
記載された書類等でも勿論よい。
【0026】
【発明の効果】以上説明したように、この発明では、縦
書横書の判別を縦方向および横方向の文字間隔に着目し
て判断するようにしたので、文字認識後の文字列をデー
タベースに格納してある文字列をデータベースに格納し
てある熟語と照合する等の照合処理がなくなり、縦書横
書の判別速度が迅速化し、全体としてデータ処理速度が
高速化されると共に、その照合処理するためのデータベ
ースのためのメモリ容量は減縮される。
【図面の簡単な説明】
【図1】この発明に係る縦書横書判別方法を採用した名
刺データの読取り・分類装置を簡略化して示す説明図。
【図2】この発明に係る縦書横書判別方法の一例を示す
フローチャート。
【図3】(a)〜(c)はそれぞれ名刺における縦書あ
るいは横書の状態を示す説明図。
【符号の説明】
1    名刺 2    名刺搬送装置 3    読取り部 4    ケーブル 5    パソコン本体 6    CRT 7    プリンタ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】縦書あるいは横書で数行にわたり一定の情
    報を表すように記載された文字の文字認識を行い、認識
    後の文字列が上記一定情報を表すように縦書であるか横
    書であるかを判別する縦書横書判別方法において、横方
    向あるいは縦方向の一定方向から上記文字を読取り、そ
    の読取りデータにより文字認識を行うと共に、文字認識
    不可の場合には読取データを90度回転させて再度上記
    文字認識を行い、文字認識可の場合には、上記読取デー
    タに基づき縦方向および横方向の文字間隔を算出して、
    両方向の文字間隔の一定である割合の大小を比較すると
    共に、両方向の文字間隔の大小を比較し、上記比較結果
    に基づいて縦書横書の判別を行うことを特徴とする縦書
    横書判別方法。
JP3054866A 1991-03-19 1991-03-19 縦書横書判別方法 Withdrawn JPH04290185A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3054866A JPH04290185A (ja) 1991-03-19 1991-03-19 縦書横書判別方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3054866A JPH04290185A (ja) 1991-03-19 1991-03-19 縦書横書判別方法

Publications (1)

Publication Number Publication Date
JPH04290185A true JPH04290185A (ja) 1992-10-14

Family

ID=12982511

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3054866A Withdrawn JPH04290185A (ja) 1991-03-19 1991-03-19 縦書横書判別方法

Country Status (1)

Country Link
JP (1) JPH04290185A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04352295A (ja) * 1991-05-30 1992-12-07 Toshiba Corp 文字列方向判別装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61272138A (ja) * 1985-05-28 1986-12-02 鈴木 貞夫 樹脂発泡体複合断熱材

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61272138A (ja) * 1985-05-28 1986-12-02 鈴木 貞夫 樹脂発泡体複合断熱材

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH04352295A (ja) * 1991-05-30 1992-12-07 Toshiba Corp 文字列方向判別装置

Similar Documents

Publication Publication Date Title
Ng et al. Learning to recognize tables in free text
US7298903B2 (en) Method and system for separating text and drawings in digital ink
Pal et al. Automatic separation of machine-printed and hand-written text lines
Bashir et al. Script identification: a review
Sareen et al. Gurmukhi handwritten word conversion using feature extraction using deep learning
JPH04290185A (ja) 縦書横書判別方法
Pal On the developement of an optical character recognition (ocr) system for printed bangla script
JPS592191A (ja) 手書き日本語文の認識処理方式
JPH10302025A (ja) 手書き文字認識装置およびそのプログラム記録媒体
Chen et al. On-line signature verification using direction sequence string matching
Kathiriya et al. Gujarati text recognition: a review
JP2972443B2 (ja) 文字認識装置
JPH09114926A (ja) オンライン文字認識における入力文字大分類方法および装置
JPS59158482A (ja) 文字認識装置
JP3217442B2 (ja) 光学的文字読み取り装置
JP2749425B2 (ja) 記事抽出方式
KR100234028B1 (ko) 문자인식 시스템의 문자영역 구분방법
JPH05210635A (ja) 入力装置
JPS6095689A (ja) 光学的文字読取装置
JPS60225986A (ja) 文字認識装置
JPS6061875A (ja) パターン認識装置における標準パターン作成方法
JPS6139175A (ja) 光学的文字読取装置
JPS63282586A (ja) 文字認識装置
JPS62281082A (ja) 文字認識装置
JPS62177686A (ja) 光学的文字読取装置

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 19980514