JPH03217994A - Document processor - Google Patents

Document processor

Info

Publication number
JPH03217994A
JPH03217994A JP2011854A JP1185490A JPH03217994A JP H03217994 A JPH03217994 A JP H03217994A JP 2011854 A JP2011854 A JP 2011854A JP 1185490 A JP1185490 A JP 1185490A JP H03217994 A JPH03217994 A JP H03217994A
Authority
JP
Japan
Prior art keywords
character
characters
thickness
image
size
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2011854A
Other languages
Japanese (ja)
Inventor
Yoshinori Yamaguchi
芳則 山口
Kenichiro Sugiura
杉浦 賢一郎
Michihira Murayama
道平 村山
Masanao Yasuda
雅直 安田
Tadashi Inoue
直史 井上
Hideyuki Kobayashi
秀行 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2011854A priority Critical patent/JPH03217994A/en
Publication of JPH03217994A publication Critical patent/JPH03217994A/en
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は原稿に記載された文書情報を光学的に読み込ん
で、コード化し、編集することができる文書処理装置に
関する。
DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a document processing device that can optically read document information written in a manuscript, encode it, and edit it.

〔従来の技術〕[Conventional technology]

従来、原稿情報を光電変換手段を介して光学的に読み込
んで、コード化し編集することができる文字識別機能を
有する文書処理装置においては、イメージセンサ等から
読み込んだ文字を内部の判別ルーチンを経て、いわゆる
パターンマッチング手法によりその文字に対応するコー
ドに変換していた。
Conventionally, in document processing devices that have a character recognition function that can optically read document information via photoelectric conversion means, code it, and edit it, characters read from an image sensor or the like are passed through an internal discrimination routine, A so-called pattern matching method was used to convert the characters into the corresponding code.

〔発明が解決しようとする課題1 しかしながら、上記のような従来例では、文字の大きさ
や太さの情報を判別することができなかったために、次
のようなことがあった。
[Problem to be Solved by the Invention 1] However, in the conventional example as described above, information on the size and thickness of the characters could not be determined, and the following problems occurred.

■例えば、倍角で表現された文字を読み込んだ際に、ま
った《違う文字に変換されてしまったり、判別不可能と
判断されたりしていた。
■For example, when reading double-width characters, they were converted to completely different characters or were judged to be unrecognizable.

■例えば、ボールド(太字)で表現された文字を読み込
んだ際に、通常の文字と同じように変換されていた。
■For example, when reading bold characters, they were converted in the same way as normal characters.

など、文書処理装置がその字形を処理する能力を持って
いるにもかかわらず、判別ルーチンがその文字の大きさ
や太さの判断情報(基準パターン)を持っていなかった
ので、正常なコード変換がされないという問題があった
Even though the document processing device has the ability to process the character shape, the recognition routine did not have the information (reference pattern) for determining the size and thickness of the character, so normal code conversion was not possible. There was a problem that it was not done.

本発明の目的は、倍角やボールドのように原稿の文字の
大きさや太さが標準の文字と異なる場合〔課題を解決す
るための手段] 上記目的を達成するため、本発明は、原稿に記載され文
書情報を光学的に読み込んで電気的なイメージデータに
変換する画像読取手段と、該イメージデータの各文字の
大きさおよび太さの少くともいずれかをパターンマッチ
ングにより判別する判別手段と、該判別手段で判別した
文字の大きさおよび太さの少くともいずれかを属性デー
タとして該当文字の文字コードに付加して記憶する記憶
手段とを具備したことを特徴とする。
The purpose of the present invention is to solve the problem when the size and thickness of characters in a manuscript are different from standard characters, such as double-width or bold [Means for Solving the Problem] an image reading means for optically reading document information and converting it into electrical image data; a determining means for determining at least one of the size and thickness of each character of the image data by pattern matching; The present invention is characterized by comprising a storage means for adding and storing at least one of the size and thickness of the character determined by the determination means as attribute data to the character code of the corresponding character.

〔作 用〕[For production]

本発明では、イメージセンサで読み取った各文字(イメ
ージデータ)の大きさや太さを判別し、判別した文字の
大きさや太さを属性データとしてその文字コードに付加
して記録するようにしたので、倍角文字やボールド(太
字)文字などの通常の標準文字とは違った字形を持った
文字も正しくコード変換でき、かつ高い変換率を実現で
きる。
In the present invention, the size and thickness of each character (image data) read by an image sensor is determined, and the determined size and thickness of the character is recorded as attribute data by adding it to the character code. Characters with different shapes from normal standard characters, such as double-width characters and bold characters, can be converted into codes correctly, and a high conversion rate can be achieved.

[実施例〕 以下、図面を参照して本発明の実施例を詳細に説明する
[Embodiments] Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

Φ1」臼l或 第1図は本発明実施例の基本構成を示す。Φ1” mortar FIG. 1 shows the basic configuration of an embodiment of the present invention.

同図において、 Aは編集機能を有する文書処理装置において、原稿に記
載され文書情報を光学的に読み込んで電気的なイメージ
データに変換する画像読取手段である。Bはそのイメー
ジデータの各文字の大きさおよび太さの少くともいずれ
かをパターンマッチングにより判別する判別手段である
。Cは判別手段Bで判別した文字の大きさおよび太さの
少くともいずれかを属性データとして該当文字の文字コ
ードに付加して記憶する記憶手段である。
In the figure, A is an image reading means for optically reading document information written on a manuscript and converting it into electrical image data in a document processing apparatus having an editing function. B is a determining means for determining at least one of the size and thickness of each character of the image data by pattern matching. Reference numeral C denotes a storage means for storing at least one of the size and thickness of the character determined by the determination means B, added to the character code of the corresponding character as attribute data.

[の口 第2図は本発明を文書処理装置に適用したー実施例の回
路構成を示す。本実施例の文書処理装置は装置全体を制
御するcrt+ (中央演算処理部)1と、このCPU
Iの第3図に示すような制御プログラムを格納するRO
M (リードオンリメモリ)2と、各種データやプログ
ラムを格納するRAM (ランダムアクセスメモリ)3
とから構成されている。また、文書を編集する際のディ
スプレイ装置としてCRT (陰極線管式ディスプレイ
装置)4、読み込み変換したデータを記憶する外部記憶
装置5、各種キー人力を行なうキーボード6、および文
書をイメージデータとして読み込むイメージスキャナ(
画像読取装置)7が設けられている。
Figure 2 shows the circuit configuration of an embodiment in which the present invention is applied to a document processing device. The document processing device of this embodiment includes a CRT+ (central processing unit) 1 that controls the entire device, and this CPU.
RO that stores the control program as shown in Figure 3 of I.
M (read only memory) 2 and RAM (random access memory) 3 that stores various data and programs
It is composed of. Additionally, there is a CRT (cathode ray tube display device) 4 as a display device for editing documents, an external storage device 5 for storing read and converted data, a keyboard 6 for manually operating various keys, and an image scanner for reading documents as image data. (
An image reading device) 7 is provided.

1夾胤皿Ω1立皇 第3図は第2図の本発明の一実施例装置の制御手順を示
すフローチャートである。
FIG. 3 is a flowchart showing the control procedure of the apparatus according to the embodiment of the present invention shown in FIG.

次に第3図を参照して本発明の一実施例の制御動作を説
明する。
Next, the control operation of one embodiment of the present invention will be explained with reference to FIG.

まず、文章の書き込まれた原稿情報をイメージスキャナ
7から読み込む(S1)。この読み込んだ原稿情報をR
AM3に書き込むが、外部記憶装置5に記憶することも
できる。
First, manuscript information with written text is read from the image scanner 7 (S1). This read manuscript information is
Although it is written in AM3, it can also be stored in external storage device 5.

RAM3に原稿情報が書き込まれると、ROM2内にあ
る制御プログラムはキーボード6からの指定により、原
稿中に文字と思われるイメージデータが存在するか否か
の検索を行なう(S2)。もし原稿中に文字と思われる
イメージデータが見付からなかつた場合は、全文字イメ
ージを検索したか否か、すなわち原稿の全領域を検索し
終えたか否かを判断して(S12)、終わっているなら
ばすべての処理を終了し、もし終わっていなければ上述
のステップS2の処理へ戻る。
When the document information is written in the RAM 3, the control program in the ROM 2 searches for the presence of image data that appears to be characters in the document according to instructions from the keyboard 6 (S2). If image data that appears to be text is not found in the manuscript, it is determined whether all character images have been searched, that is, whether the entire area of the manuscript has been searched (S12), and the process is complete. If so, all processing is completed, and if not completed, the process returns to step S2 described above.

ステップS2で原稿中に文字と思われるイメージデータ
が見付かったならば、制御プログラムはキャラクタ・デ
ータとのパターンマッチング作業に入る。まず、例えば
“A”という文字と人力文字イメージとを比較し(S3
)、一致したと判断したら“A”という文字コードと通
常文字であるという属性コードの計2バイトを1文字分
のデータとして、RAM3に記録する(S4)。
If image data that appears to be characters is found in the document in step S2, the control program starts pattern matching with character data. First, for example, the character “A” is compared with a human character image (S3
), if it is determined that they match, a total of 2 bytes of the character code "A" and the attribute code indicating that it is a normal character are recorded in the RAM 3 as one character's worth of data (S4).

ステップS3で両者が一致しなかった場合は、入力文字
イメージと“A”の倍角文字(例えば、横倍角文字)と
を比較する(S5)。この比較で一致した場合は゜゛A
”という文字コードと倍角文字であるという属性コード
の計2バイトを1文字分のデータとして記録する(S6
)。
If the two do not match in step S3, the input character image and the double-width character "A" (for example, double-width horizontal character) are compared (S5). If this comparison matches, ゜゛A
A total of 2 bytes, including the character code “” and the attribute code “double-width character,” are recorded as data for one character (S6
).

ステップS5で両者が一致しなかった場合は入力文字イ
メージと゛A゜゜の大文字と比較する(S7)。ここで
の比較で両者が一致した場合は、“A”という文字コー
ドに゜゜A゜゜の太文字(ボールド)という属性コード
を付けて1文字のデータとしてRAM3に記録する(S
8)。
If the two do not match in step S5, the input character image is compared with the uppercase letter ゛A゜゜ (S7). If the two match in this comparison, an attribute code of ゜゜A゜゜ bold is added to the character code "A" and it is recorded in RAM 3 as one character data (S
8).

ステップS7で両者が一致しなかった場合は制御プログ
ラムの持っている全文字テーブルと比較したか否かを調
べて(S9)、もし全文字テーブルと比較しても一致す
るものがなかった場合には判別不能文字としてRAM3
に記録する(SIO)。
If the two do not match in step S7, it is checked whether or not the comparison has been made with all the character tables that the control program has (S9). is stored in RAM3 as an unidentifiable character.
(SIO).

まだ、ステップS9において文字テーブルに文字イメー
ジデータが残っているならば、次の文字候補をセットし
てステップS3へもどる(Sll).本実施例の場合は
“A”と比較していたので、次にステップSllにおい
て“B”をセットすることになる。
If character image data still remains in the character table in step S9, the next character candidate is set and the process returns to step S3 (Sll). In this embodiment, since the comparison was made with "A", "B" is set next in step Sll.

なお、ステップS4, S6, S8, SIOの各ス
テップを終了した場合は、ステップSl2へ進み、次候
補の人力文字イメージの検索に入る。
Note that when steps S4, S6, S8, and SIO are completed, the process advances to step Sl2 to begin searching for the next candidate human-powered character image.

〔発明の効果〕〔Effect of the invention〕

以上説明したように、本発明によれば、イメージスキャ
ナから読み込んだ原稿情報から検索した文字イメージを
、より多くの種類の文字テーブルと比較するようにした
ので、正確な文字コード・データへのより高い変換率を
実現することができる効果が得られる。
As explained above, according to the present invention, character images retrieved from document information read from an image scanner are compared with more types of character tables, so it is easier to obtain accurate character code data. The effect of realizing a high conversion rate can be obtained.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は本発明実施例の基本構成を示すブロツク図、 冬 第2図は本発明の一実施例の文字処理装置の回路構成を
示すブロック図、 第3図は第2図の本発明実施例の制御手順を示すフロー
チャートである。 1・・・CPU、 2・・・ROM , 3・・・RAM、 4・・・ディスプレイ装置、 5・・・外部記憶装置、 6・・・キーボード、 7・・・イメージスキャナ。 第2図
FIG. 1 is a block diagram showing the basic configuration of an embodiment of the present invention, FIG. 2 is a block diagram showing the circuit configuration of a character processing device according to an embodiment of the invention, and FIG. 3 is a block diagram showing the circuit configuration of a character processing device according to an embodiment of the present invention. 3 is a flowchart illustrating an example control procedure. DESCRIPTION OF SYMBOLS 1... CPU, 2... ROM, 3... RAM, 4... Display device, 5... External storage device, 6... Keyboard, 7... Image scanner. Figure 2

Claims (1)

【特許請求の範囲】 1)原稿に記載され文書情報を光学的に読み込んで電気
的なイメージデータに変換する画像読取手段と、 該イメージデータの各文字の大きさおよび太さの少くと
もいずれかをパターンマッチングにより判別する判別手
段と、 該判別手段で判別した文字の大きさおよび太さの少くと
もいずれかを属性データとして該当文字の文字コードに
付加して記憶する記憶手段と を具備したことを特徴とする文書処理装置。
[Scope of Claims] 1) Image reading means for optically reading document information written on a manuscript and converting it into electrical image data; and at least one of the size and thickness of each character in the image data. and a storage means for storing at least one of the size and thickness of the character determined by the determination means as attribute data added to the character code of the corresponding character. A document processing device characterized by:
JP2011854A 1990-01-23 1990-01-23 Document processor Pending JPH03217994A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2011854A JPH03217994A (en) 1990-01-23 1990-01-23 Document processor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2011854A JPH03217994A (en) 1990-01-23 1990-01-23 Document processor

Publications (1)

Publication Number Publication Date
JPH03217994A true JPH03217994A (en) 1991-09-25

Family

ID=11789312

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011854A Pending JPH03217994A (en) 1990-01-23 1990-01-23 Document processor

Country Status (1)

Country Link
JP (1) JPH03217994A (en)

Similar Documents

Publication Publication Date Title
JP3139521B2 (en) Automatic language determination device
JP2000322417A (en) Image filing apparatus and method, and storage medium
JPH0388062A (en) Device for preparing document
JPH03217994A (en) Document processor
JPH1091701A (en) Form document system
JP3305343B2 (en) Dictionary editing device
JPS594358Y2 (en) Character control device in character correction
JPH11232381A (en) Character reader
JPS5668869A (en) Optical character reader
JPH01253079A (en) Character recognizing device
JP3273778B2 (en) Kana-kanji conversion device and kana-kanji conversion method
JPS62134765A (en) Electronic retrieving method for dictionary of chinese character explained in japanese
JP3387582B2 (en) Character processor
JPH11328200A (en) Image retrieval apparatus and method, and information recording medium
JPH0434655A (en) Drawing reader
JPS61250772A (en) Kana/kanji converter
JPH0520300A (en) Document processor
JPH02195474A (en) Name card information control system
JPS62152096A (en) Optical character reader
JPS62281089A (en) Image processing method
JPH07210623A (en) Document image processing device
JPH01277961A (en) Character conversion system
JPH05128314A (en) Character recognition device
JPH06301731A (en) Image file device
JPH043243A (en) Kana to kanji converter