JPH03217994A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH03217994A
JPH03217994A JP2011854A JP1185490A JPH03217994A JP H03217994 A JPH03217994 A JP H03217994A JP 2011854 A JP2011854 A JP 2011854A JP 1185490 A JP1185490 A JP 1185490A JP H03217994 A JPH03217994 A JP H03217994A
Authority
JP
Japan
Prior art keywords
character
characters
thickness
image
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011854A
Other languages
English (en)
Inventor
Yoshinori Yamaguchi
芳則 山口
Kenichiro Sugiura
杉浦 賢一郎
Michihira Murayama
道平 村山
Masanao Yasuda
雅直 安田
Tadashi Inoue
直史 井上
Hideyuki Kobayashi
秀行 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2011854A priority Critical patent/JPH03217994A/ja
Publication of JPH03217994A publication Critical patent/JPH03217994A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は原稿に記載された文書情報を光学的に読み込ん
で、コード化し、編集することができる文書処理装置に
関する。
〔従来の技術〕
従来、原稿情報を光電変換手段を介して光学的に読み込
んで、コード化し編集することができる文字識別機能を
有する文書処理装置においては、イメージセンサ等から
読み込んだ文字を内部の判別ルーチンを経て、いわゆる
パターンマッチング手法によりその文字に対応するコー
ドに変換していた。
〔発明が解決しようとする課題1 しかしながら、上記のような従来例では、文字の大きさ
や太さの情報を判別することができなかったために、次
のようなことがあった。
■例えば、倍角で表現された文字を読み込んだ際に、ま
った《違う文字に変換されてしまったり、判別不可能と
判断されたりしていた。
■例えば、ボールド(太字)で表現された文字を読み込
んだ際に、通常の文字と同じように変換されていた。
など、文書処理装置がその字形を処理する能力を持って
いるにもかかわらず、判別ルーチンがその文字の大きさ
や太さの判断情報(基準パターン)を持っていなかった
ので、正常なコード変換がされないという問題があった
本発明の目的は、倍角やボールドのように原稿の文字の
大きさや太さが標準の文字と異なる場合〔課題を解決す
るための手段] 上記目的を達成するため、本発明は、原稿に記載され文
書情報を光学的に読み込んで電気的なイメージデータに
変換する画像読取手段と、該イメージデータの各文字の
大きさおよび太さの少くともいずれかをパターンマッチ
ングにより判別する判別手段と、該判別手段で判別した
文字の大きさおよび太さの少くともいずれかを属性デー
タとして該当文字の文字コードに付加して記憶する記憶
手段とを具備したことを特徴とする。
〔作 用〕
本発明では、イメージセンサで読み取った各文字(イメ
ージデータ)の大きさや太さを判別し、判別した文字の
大きさや太さを属性データとしてその文字コードに付加
して記録するようにしたので、倍角文字やボールド(太
字)文字などの通常の標準文字とは違った字形を持った
文字も正しくコード変換でき、かつ高い変換率を実現で
きる。
[実施例〕 以下、図面を参照して本発明の実施例を詳細に説明する
Φ1」臼l或 第1図は本発明実施例の基本構成を示す。
同図において、 Aは編集機能を有する文書処理装置において、原稿に記
載され文書情報を光学的に読み込んで電気的なイメージ
データに変換する画像読取手段である。Bはそのイメー
ジデータの各文字の大きさおよび太さの少くともいずれ
かをパターンマッチングにより判別する判別手段である
。Cは判別手段Bで判別した文字の大きさおよび太さの
少くともいずれかを属性データとして該当文字の文字コ
ードに付加して記憶する記憶手段である。
[の口 第2図は本発明を文書処理装置に適用したー実施例の回
路構成を示す。本実施例の文書処理装置は装置全体を制
御するcrt+ (中央演算処理部)1と、このCPU
Iの第3図に示すような制御プログラムを格納するRO
M (リードオンリメモリ)2と、各種データやプログ
ラムを格納するRAM (ランダムアクセスメモリ)3
とから構成されている。また、文書を編集する際のディ
スプレイ装置としてCRT (陰極線管式ディスプレイ
装置)4、読み込み変換したデータを記憶する外部記憶
装置5、各種キー人力を行なうキーボード6、および文
書をイメージデータとして読み込むイメージスキャナ(
画像読取装置)7が設けられている。
1夾胤皿Ω1立皇 第3図は第2図の本発明の一実施例装置の制御手順を示
すフローチャートである。
次に第3図を参照して本発明の一実施例の制御動作を説
明する。
まず、文章の書き込まれた原稿情報をイメージスキャナ
7から読み込む(S1)。この読み込んだ原稿情報をR
AM3に書き込むが、外部記憶装置5に記憶することも
できる。
RAM3に原稿情報が書き込まれると、ROM2内にあ
る制御プログラムはキーボード6からの指定により、原
稿中に文字と思われるイメージデータが存在するか否か
の検索を行なう(S2)。もし原稿中に文字と思われる
イメージデータが見付からなかつた場合は、全文字イメ
ージを検索したか否か、すなわち原稿の全領域を検索し
終えたか否かを判断して(S12)、終わっているなら
ばすべての処理を終了し、もし終わっていなければ上述
のステップS2の処理へ戻る。
ステップS2で原稿中に文字と思われるイメージデータ
が見付かったならば、制御プログラムはキャラクタ・デ
ータとのパターンマッチング作業に入る。まず、例えば
“A”という文字と人力文字イメージとを比較し(S3
)、一致したと判断したら“A”という文字コードと通
常文字であるという属性コードの計2バイトを1文字分
のデータとして、RAM3に記録する(S4)。
ステップS3で両者が一致しなかった場合は、入力文字
イメージと“A”の倍角文字(例えば、横倍角文字)と
を比較する(S5)。この比較で一致した場合は゜゛A
”という文字コードと倍角文字であるという属性コード
の計2バイトを1文字分のデータとして記録する(S6
)。
ステップS5で両者が一致しなかった場合は入力文字イ
メージと゛A゜゜の大文字と比較する(S7)。ここで
の比較で両者が一致した場合は、“A”という文字コー
ドに゜゜A゜゜の太文字(ボールド)という属性コード
を付けて1文字のデータとしてRAM3に記録する(S
8)。
ステップS7で両者が一致しなかった場合は制御プログ
ラムの持っている全文字テーブルと比較したか否かを調
べて(S9)、もし全文字テーブルと比較しても一致す
るものがなかった場合には判別不能文字としてRAM3
に記録する(SIO)。
まだ、ステップS9において文字テーブルに文字イメー
ジデータが残っているならば、次の文字候補をセットし
てステップS3へもどる(Sll).本実施例の場合は
“A”と比較していたので、次にステップSllにおい
て“B”をセットすることになる。
なお、ステップS4, S6, S8, SIOの各ス
テップを終了した場合は、ステップSl2へ進み、次候
補の人力文字イメージの検索に入る。
〔発明の効果〕
以上説明したように、本発明によれば、イメージスキャ
ナから読み込んだ原稿情報から検索した文字イメージを
、より多くの種類の文字テーブルと比較するようにした
ので、正確な文字コード・データへのより高い変換率を
実現することができる効果が得られる。
【図面の簡単な説明】
第1図は本発明実施例の基本構成を示すブロツク図、 冬 第2図は本発明の一実施例の文字処理装置の回路構成を
示すブロック図、 第3図は第2図の本発明実施例の制御手順を示すフロー
チャートである。 1・・・CPU、 2・・・ROM , 3・・・RAM、 4・・・ディスプレイ装置、 5・・・外部記憶装置、 6・・・キーボード、 7・・・イメージスキャナ。 第2図

Claims (1)

  1. 【特許請求の範囲】 1)原稿に記載され文書情報を光学的に読み込んで電気
    的なイメージデータに変換する画像読取手段と、 該イメージデータの各文字の大きさおよび太さの少くと
    もいずれかをパターンマッチングにより判別する判別手
    段と、 該判別手段で判別した文字の大きさおよび太さの少くと
    もいずれかを属性データとして該当文字の文字コードに
    付加して記憶する記憶手段と を具備したことを特徴とする文書処理装置。
JP2011854A 1990-01-23 1990-01-23 文書処理装置 Pending JPH03217994A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011854A JPH03217994A (ja) 1990-01-23 1990-01-23 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011854A JPH03217994A (ja) 1990-01-23 1990-01-23 文書処理装置

Publications (1)

Publication Number Publication Date
JPH03217994A true JPH03217994A (ja) 1991-09-25

Family

ID=11789312

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011854A Pending JPH03217994A (ja) 1990-01-23 1990-01-23 文書処理装置

Country Status (1)

Country Link
JP (1) JPH03217994A (ja)

Similar Documents

Publication Publication Date Title
JP3139521B2 (ja) 自動言語決定装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JPH0388062A (ja) 文書作成装置
JPH03217994A (ja) 文書処理装置
JPH1091701A (ja) フォーム文書システム
JP3305343B2 (ja) 辞書編集装置
JPS594358Y2 (ja) 文字修正における文字制御装置
JPH11232381A (ja) 文字読取装置
JPS5668869A (en) Optical character reader
JPH01253079A (ja) 文字認識装置
JP3273778B2 (ja) 仮名漢字変換装置及び仮名漢字変換方法
JPS62134765A (ja) 漢和辞書の電子検索方法
JP3387582B2 (ja) 文字処理装置
JPH11328200A (ja) 画像検索装置および方法ならびに情報記録媒体
JPH0434655A (ja) 図面読取装置
JPS61250772A (ja) かな漢字変換装置
JPH0520300A (ja) 文書処理装置
JPH02195474A (ja) 名刺情報管理システム
JPS62152096A (ja) 光学式文字読取装置
JPS62281089A (ja) 画像処理方法
JPH07210623A (ja) 文書画像処理装置
JPH01277961A (ja) 文字変換方式
JPH05128314A (ja) 文字認識装置
JPH06301731A (ja) 画像ファイル装置
JPH043243A (ja) かな漢字変換装置