JPH0376513B2 - - Google Patents

Info

Publication number
JPH0376513B2
JPH0376513B2 JP58006072A JP607283A JPH0376513B2 JP H0376513 B2 JPH0376513 B2 JP H0376513B2 JP 58006072 A JP58006072 A JP 58006072A JP 607283 A JP607283 A JP 607283A JP H0376513 B2 JPH0376513 B2 JP H0376513B2
Authority
JP
Japan
Prior art keywords
character
characters
pattern
output
code
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP58006072A
Other languages
Japanese (ja)
Other versions
JPS59132031A (en
Inventor
Kozo Tomono
Masataka Yamamoto
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP58006072A priority Critical patent/JPS59132031A/en
Publication of JPS59132031A publication Critical patent/JPS59132031A/en
Publication of JPH0376513B2 publication Critical patent/JPH0376513B2/ja
Granted legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/02Input arrangements using manually operated switches, e.g. using keyboards or dials
    • G06F3/023Arrangements for converting discrete items of information into a coded form, e.g. arrangements for interpreting keyboard generated codes as alphanumeric codes, operand codes or instruction codes
    • G06F3/0238Programmable keyboards

Landscapes

  • Engineering & Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)
  • Character Input (AREA)

Description

【発明の詳細な説明】 この発明は、帳票などの記録媒体に記載された
文字を、当該文字を表す符号の形に変換して記憶
装置に入力するための文字入力装置に関するもの
であり、更に詳しくは漢字等の非常に多数の文字
種を対象とし、記憶装置から読出して表示又は印
字に使用するための文字入力装置に関するもので
ある。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a character input device for converting characters written on a recording medium such as a form into a code representing the characters and inputting the converted characters into a storage device. Specifically, the present invention relates to a character input device for reading out a large number of character types such as Chinese characters from a storage device and using them for display or printing.

従来のこの種装置の構成を第1図に示す。図に
おいて1は帳票、2は走査部、3はバツフアメモ
リ、4は前処理部、5はパターンメモリ、6は認
識部、7は認識辞書、8は出力部である。
The configuration of a conventional device of this type is shown in FIG. In the figure, 1 is a form, 2 is a scanning section, 3 is a buffer memory, 4 is a preprocessing section, 5 is a pattern memory, 6 is a recognition section, 7 is a recognition dictionary, and 8 is an output section.

帳票1に記入または印刷された文字を走査部2
で走査して、帳票上の濃度(色彩を含んでいう場
合もある)に対応する電気信号に変換し、このよ
うにして電気信号に変換されたビデオ信号をバツ
フアメモリ3に一時記憶する。前処理部4はバツ
フアメモリ3に記憶されたビデオ信号に対し2値
化及びパターン正規化等所定の前処理を行いパタ
ーンメモリ5に送る。したがつて、パターンメモ
リ5には文字を含む帳票上の所定の領域を所定数
の画素に分解した場合、各画素の濃度が白レベル
であるか黒レベルであるかを論理「0」又は
「1」の信号で表す各ピツトが、画素の配列に相
似した配列で配列されることになる。これを文字
パターンという。
The characters written or printed on the form 1 are scanned by the scanning unit 2.
The video signal is scanned and converted into an electrical signal corresponding to the density (including color in some cases) on the document, and the video signal thus converted to the electrical signal is temporarily stored in the buffer memory 3. The preprocessing section 4 performs predetermined preprocessing such as binarization and pattern normalization on the video signal stored in the buffer memory 3 and sends it to the pattern memory 5 . Therefore, when a predetermined area on a form containing characters is divided into a predetermined number of pixels, the pattern memory 5 stores logic "0" or "0" to indicate whether the density of each pixel is at a white level or a black level. The pits represented by the signal "1" are arranged in an arrangement similar to the arrangement of pixels. This is called a character pattern.

認識辞書7の中には、あらかじめ定めた範囲内
のすべての文字に対し、当該文字の標準的な文字
パターンと当該文字を表す文字コードとを対応さ
せて記憶している。認識辞書7に関して言う場合
の文字パターンとは、文字パターンそのものの他
に、その文字パターンから押出される諸種の特徴
をその文字パターンの代りに記憶する場合をも含
むものとする。
In the recognition dictionary 7, for every character within a predetermined range, a standard character pattern of the character and a character code representing the character are stored in association with each other. The character pattern when referring to the recognition dictionary 7 includes not only the character pattern itself but also the case where various features extracted from the character pattern are stored in place of the character pattern.

認識部6は、パターンメモリ5に記憶されてい
る文字パターンが認識辞書7内のどの文字パター
ンに最もよく類似しているかを決定し、その最も
よく類似している文字パターンに対応する文字コ
ードを出力部8を経て出力する。
The recognition unit 6 determines which character pattern in the recognition dictionary 7 the character pattern stored in the pattern memory 5 is most similar to, and determines the character code corresponding to the most similar character pattern. It is outputted via the output section 8.

第2図は帳票1の記載例を示す図であり9は文
字を記入する枠を示し、走査部2による走査の便
宜のため枠9の中にそれぞれの文字を記入又は印
刷するものとする。枠9の中を、たとえば、横方
向に32等分し、縦方向に32等分し、枠9の面積
1/(32×32)の面積を有する微小区画を32×32
個作つたとして、この1つの微小区画を1画素と
し、各画素が白レベルであるか黒レベルであるか
を論理「0」,「1」の2値信号で表し、各画素の
白、黒レベルを32×32ビツトのメモリに記憶する
と、枠9内の文字の文字パターンを記憶すること
ができる。また各文字の文字パターンから抽出し
た特徴は1個の文字パターンについては32×32ビ
ツトよりも少数のビツトで表示することができ
る。さらに、認識辞書7に、たとえば4,000の
互に異なる文字を記憶するとすれば、その文字コ
ードは12ビツトのコード(212>4,000)で作る
ことができる。
FIG. 2 is a diagram showing an example of writing in the form 1. Reference numeral 9 indicates a frame in which characters are written, and each character is written or printed in the frame 9 for convenience of scanning by the scanning unit 2. For example, divide the inside of the frame 9 into 32 equal parts in the horizontal direction and 32 equal parts in the vertical direction, and divide the inside of the frame 9 into 32 equal parts.
Assuming that each pixel is made individually, this one minute section is defined as one pixel, and whether each pixel is at a white level or a black level is represented by a binary signal of logic "0" or "1". If the level is stored in a 32 x 32 bit memory, the character pattern of the characters in the frame 9 can be stored. Furthermore, the features extracted from the character pattern of each character can be displayed using fewer bits than 32×32 bits for one character pattern. Furthermore, if the recognition dictionary 7 stores, for example, 4,000 characters that are different from each other, the character code can be created using a 12-bit code (2 12 >4,000).

認識辞書7が文字パターンの特徴と文字コード
とを対応して記憶している場合は、認識部6では
パターンメモリ5に記憶されている文字パターン
からその特徴を抽出して、この抽出した特徴に最
もよく類似している特徴を認識辞書7中から検索
し、その検索した特徴に対応する文字コードを出
力部8に出力する。
If the recognition dictionary 7 stores character pattern features and character codes in correspondence, the recognition unit 6 extracts the features from the character patterns stored in the pattern memory 5 and uses the extracted features to The most similar feature is searched from the recognition dictionary 7, and the character code corresponding to the searched feature is output to the output section 8.

ところで、認識辞書7に登録されている文字を
仮に内字と呼ぶことにすると、内字の総数を余り
多くすることは実用的でない。記憶した文字コー
ドから文字パターンを読出してその文字パターン
を表示装置上に表示し又は印字するためには文字
コードをアドレスとして文字パターンを記憶して
いるフオントメモリ(font nemory)を必要とす
るが、内字の総数を多くするとフオントメモリと
認識辞書の容量が共に大きくなるからである。
By the way, if the characters registered in the recognition dictionary 7 are temporarily called internal characters, it is not practical to increase the total number of internal characters too much. In order to read a character pattern from a stored character code and display or print that character pattern on a display device, a font memory that stores the character pattern using the character code as an address is required. This is because increasing the total number of internal characters increases both the capacity of the font memory and the recognition dictionary.

内字以外の文字(以下外字という)を帳票1に
記入した場合は、認識部6での認識結果が、その
外字の文字パターンを棄却し、又は内字の中のい
すれかの文字パターンとして誤認識する。したが
つて、従来の装置において外字を入力しようとす
る場合は、第1図に示す系統の装置とは別に設け
た、たとえば鍵盤等を用いる複雑な入力装置を必
要とするという欠点があつた。
When characters other than internal characters (hereinafter referred to as external characters) are entered in the form 1, the recognition result in the recognition unit 6 will either reject the character pattern of the external character or indicate that it is one of the character patterns among the internal characters. misrecognize. Therefore, when attempting to input external characters using the conventional device, there was a drawback in that a complicated input device using, for example, a keyboard was required, which was provided separately from the device of the system shown in FIG.

この発明は従来の装置における上述の欠点を除
去するためになされたもので、この発明では、帳
票上の文字記入枠に対応する位置に制御記号記入
枠を設け、この枠内に制御記号を記入した文字は
外字であることを示し、外字であると判定された
文字の文字パターンに対しては認識辞書の検索を
行うことなく、その文字パターンを記憶装置内の
あらかじめ定められたアドレス位置に格納し、そ
の格納位置を示すアドレスを外字用文字コードと
して出力することにより、外字を容易に入力でき
るようにしたものである。
This invention was made to eliminate the above-mentioned drawbacks of conventional devices.In this invention, a control symbol entry frame is provided at a position corresponding to a character entry frame on a form, and a control symbol is entered in this frame. The character pattern determined to be a custom character is stored at a predetermined address location in the storage device without searching the recognition dictionary. However, by outputting the address indicating the storage location as a character code for a non-standard character, it is possible to easily input a non-standard character.

以下、図面についてこの発明の実施例を説明す
る。第3図はこの発明の一実施例における帳票の
記載例を示す図で、第2図と同一符号は同一部分
を示し、10は制御記号記入枠であり、9a,9
b,9cで示す文字記入枠内に記入した文字は外
字であることを示す。第4図はこの発明の一実施
例を示すブロツク図で、第1図と同一符号は同一
又は相当部分を示し、80は第1図の8に対応す
る出力部であるが、第1図の出力部8の出力に相
当する文字コードの出力線81の外に文字パター
ンの出力線82を備えている。
Embodiments of the invention will be described below with reference to the drawings. FIG. 3 is a diagram showing an example of how to write a form in an embodiment of the present invention, in which the same reference numerals as in FIG. 2 indicate the same parts, 10 is a control symbol entry frame, 9a, 9
The characters written in the character entry frames indicated by b and 9c indicate that they are external characters. FIG. 4 is a block diagram showing an embodiment of the present invention, in which the same reference numerals as in FIG. 1 indicate the same or corresponding parts, and 80 is an output section corresponding to 8 in FIG. In addition to the character code output line 81 corresponding to the output of the output section 8, a character pattern output line 82 is provided.

走査部2の走査では文字記入枠9と同時に制御
記号記入枠10をも走査し、制御記号が記入され
てない文字は内字と判定し、第1図について説明
したと同様の処理を行つて出力線81から文字コ
ードを出力する。但しこの場合は内字コードであ
ることを示すビツト(たとえば論理「0」の1ビ
ツト)を付加する。
When the scanning section 2 scans, the control symbol entry frame 10 is also scanned at the same time as the character entry frame 9, and characters on which no control symbol is written are determined to be internal characters, and the same processing as explained in connection with FIG. 1 is performed. A character code is output from the output line 81. However, in this case, a bit indicating that it is an internal character code (for example, one bit of logic "0") is added.

走査部2において制御記号が検出された文字は
外字であると判定し、外字に対しては認識辞書7
を検索する処理を行わず、文字パターンそのもの
を出力部80の出力線82から出力して記憶装置
内のあらかじめ定めたアドレス位置にその文字パ
ターンを格納する。文字パターンを読出して表示
する場合等の便宜を考えると、記憶装置に格納す
る外字の文字パターンはフオントメモリに記憶さ
れている内字の文字パターンと同様なビツト構成
にしておけばよい。
Characters for which control symbols are detected in the scanning unit 2 are determined to be non-standard characters, and recognition dictionary 7 is used for non-standard characters.
The character pattern itself is outputted from the output line 82 of the output section 80 without performing the process of searching for it, and the character pattern is stored at a predetermined address position in the storage device. For convenience when reading and displaying character patterns, the character patterns of external characters stored in the storage device may have the same bit configuration as the character patterns of internal characters stored in the font memory.

外字の文字パターンを記憶するアドレス領域は
あらかじめ定めておき、帳票上の走査順に従つて
順次番号を増加すればよい。たとえば、第3図に
おいて枠9a,9b,9c,…内の外字の文字パ
ターンは、それぞれ、‘X00’,‘X01’,
‘X02’のアドレス位置に格納し、その格納位
置を示すアドレスを外字用文字コードとして出力
線81から出力し、内字用文字コードと同様に入
力する。但しこの場合は外字コードであることを
示すビツト(たとえば論理「1」の1ビツト)を
付加する。
The address area for storing character patterns of external characters may be determined in advance, and the numbers may be sequentially increased according to the scanning order on the form. For example, in Fig. 3, the character patterns of external characters in frames 9a, 9b, 9c, ... are 'X00', 'X01',
It is stored in the address position 'X02', and the address indicating the storage position is output from the output line 81 as a character code for external characters, and is input in the same way as the character code for internal characters. However, in this case, a bit indicating that it is a private character code (for example, one bit of logic "1") is added.

文字コードを読出して文字パターンを表示又は
印字するような場合は出力線81から出力されて
記憶されている文字コードを読出し、それが内字
コードであればフオントメモリにアドレスし、外
字コードであれば、その外字コードの示すアドレ
ス位置にアドレスすればよい。
When displaying or printing a character pattern by reading a character code, the stored character code is output from the output line 81, and if it is an internal character code, it is addressed to the font memory, and if it is an external character code, it is addressed to the font memory. For example, it is sufficient to address the address position indicated by the external character code.

なお、第4図に示す構成で内字であると判定さ
れたにかかわらず、認識部6において棄却と判定
された文字パターンに対しては、これを外字とし
て取扱い、出力線82からその文字パターンを出
力し、出力線81ら対応する外字用文字コードを
出力することができる。
Incidentally, regardless of whether the character pattern is determined to be an internal character in the configuration shown in FIG. , and the corresponding character code for external characters can be output from the output line 81.

以上のようにこの発明によれば、特殊文字や特
殊記号等の外字を鍵盤等を用いることなく容易に
入力することができる。
As described above, according to the present invention, external characters such as special characters and special symbols can be easily inputted without using a keyboard or the like.

【図面の簡単な説明】[Brief explanation of drawings]

第1図は従来の装置の構成を示すブロツク図、
第2図は第1図の帳票の記載例を示す図、第3図
はこの発明における帳票の記載例を示す図、第4
図はこの発明の一実施例を示すブロツク図であ
る。 1…帳票、2…走査部、5…パターンメモリ、
6…認識部、7…認識辞書、80…出力部、9…
文字記入枠、10…制御記号記入枠。なお、図中
同一符号は同一又は相等部分を示す。
Figure 1 is a block diagram showing the configuration of a conventional device.
FIG. 2 is a diagram showing an example of how the form shown in FIG. 1 is written, FIG. 3 is a diagram showing an example of how the form is written in this invention, and FIG.
The figure is a block diagram showing one embodiment of the present invention. 1... Form, 2... Scanning unit, 5... Pattern memory,
6... Recognition unit, 7... Recognition dictionary, 80... Output unit, 9...
Character entry frame, 10... Control symbol entry frame. Note that the same reference numerals in the figures indicate the same or equivalent parts.

Claims (1)

【特許請求の範囲】 1 帳票などの記録媒体に記載された文字を、当
該文字を表す符号の形に変換して記憶装置に入力
するための文字入力装置において、 上記帳票上の文字のうち所望の文字に対応する
帳票上の位置に当該文字に対する制御記号を記載
する手段と、 あらかじめ定めた範囲内のすべての文字に対し
当該文字の標準的な文字パターンと当該文字を表
す文字コードとを対応させて記憶する認識辞書
と、 上記帳票上の文字及び制御記号を走査して電気
信号に変換する走査部と、 この走査部の出力に対し所定の前処理を施して
2値信号化する前処理部と、 この前処理部の出力を一時記憶するパターンメ
モリと、 このパターンメモリに記憶される文字パターン
のうち対応する制御記号のパターンの存在しない
文字パターンは、これを上記認識辞書中の文字パ
ターンとの類似度比較によつて該当する標準的な
文字パターンを決定し、この決定した標準的な文
字パターンに対応する文字コードを出力し、制御
記号のパターンの存在する文字パターンは、これ
を所定の大きさの文字パターンとして記憶装置内
のあらかじめ定めたアドレス位置へ格納すると共
に、その格納位置を示すアドレス信号を当該文字
に対応する外字用文字コードとして出力する手段
とを備えたことを特徴とする文字入力装置。
[Scope of Claims] 1. In a character input device for converting characters written on a recording medium such as a form into a code representing the characters and inputting the converted characters into a storage device, a desired character from among the characters on the form is provided. A means for writing a control symbol for the character in the position on the form corresponding to the character, and a standard character pattern for the character and a character code representing the character for all characters within a predetermined range. a recognition dictionary that scans and stores the characters and control symbols on the form, a scanning unit that scans the characters and control symbols on the form and converts them into electrical signals, and preprocessing that performs predetermined preprocessing on the output of this scanning unit to convert it into a binary signal. A pattern memory that temporarily stores the output of this preprocessing section; Character patterns that do not have a corresponding control symbol pattern among the character patterns stored in this pattern memory are converted into character patterns in the recognition dictionary. The corresponding standard character pattern is determined by comparing the similarity with the character pattern, and the character code corresponding to the determined standard character pattern is output. The present invention is characterized by comprising means for storing a character pattern of a size in a predetermined address position in a storage device, and outputting an address signal indicating the storage position as a character code for a non-standard character corresponding to the character. character input device.
JP58006072A 1983-01-18 1983-01-18 Character input device Granted JPS59132031A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58006072A JPS59132031A (en) 1983-01-18 1983-01-18 Character input device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58006072A JPS59132031A (en) 1983-01-18 1983-01-18 Character input device

Publications (2)

Publication Number Publication Date
JPS59132031A JPS59132031A (en) 1984-07-30
JPH0376513B2 true JPH0376513B2 (en) 1991-12-05

Family

ID=11628367

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58006072A Granted JPS59132031A (en) 1983-01-18 1983-01-18 Character input device

Country Status (1)

Country Link
JP (1) JPS59132031A (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH02220178A (en) * 1989-02-22 1990-09-03 Nec Corp Map retrieving device

Also Published As

Publication number Publication date
JPS59132031A (en) 1984-07-30

Similar Documents

Publication Publication Date Title
US4933979A (en) Data reading apparatus for reading data from form sheet
US4290063A (en) Video display terminal having means for altering data words
US5031225A (en) Character recognition method for recognizing character in an arbitrary rotation position
US5307422A (en) Method and system for identifying lines of text in a document
US4607385A (en) Character recognition apparatus
JPH04220764A (en) Method and apparatus for compressing character font
US5272768A (en) Blank strip font compression method and device, and resulting stored, decompressible font
US5357582A (en) Character boundary identification method and system
JPH05334471A (en) Digital data recording system and reading method
JPH0376513B2 (en)
JPH06125409A (en) Fax machine
US6259814B1 (en) Image recognition through localized interpretation
JPS6132187A (en) Character recognition system
KR950004219B1 (en) Method and device for improving storage area of combined fonts
JPH05225391A (en) Method and apparatus for detecting dot-matrix printing text for improving optical character recognition
JPH01100590A (en) Display control system
JP2000331117A (en) Document reading system
JPH0486274A (en) Pattern generation system
JPS6077278A (en) Discriminating circuit of character entry area
JPH023099A (en) Display device
JPH06243285A (en) Character recognition method
JPS62146642A (en) Enlarging processor of printing data
JP2000020638A (en) Character string direction discriminating method
JPS6215679A (en) Data reading system
JPH04188291A (en) character recognition device