JPH05342402A - Japanese character reader - Google Patents

Japanese character reader

Info

Publication number
JPH05342402A
JPH05342402A JP4149258A JP14925892A JPH05342402A JP H05342402 A JPH05342402 A JP H05342402A JP 4149258 A JP4149258 A JP 4149258A JP 14925892 A JP14925892 A JP 14925892A JP H05342402 A JPH05342402 A JP H05342402A
Authority
JP
Japan
Prior art keywords
character
candidate
correction
unit
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP4149258A
Other languages
Japanese (ja)
Other versions
JP2874815B2 (en
Inventor
Masaki Matsudaira
正樹 松平
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP4149258A priority Critical patent/JP2874815B2/en
Publication of JPH05342402A publication Critical patent/JPH05342402A/en
Application granted granted Critical
Publication of JP2874815B2 publication Critical patent/JP2874815B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To provide the Japanese character reader which can speedily and easily confirm whether the recognized result of the device is correct or not and can easily indicate correct answer characters without depending on Japanese syllabary (KANA)/Chinese character (KANJI) conversion or the like. CONSTITUTION:A correction part 3 to correct the recognized result of a recognition part 2 to read image data is provided with a function 3a to indicate character candidates having the high possibility of correction, function 3b to prepare correct answer characters or one part of correct answer characters by combining the constitutive elements of characters displayed by the device as the character candidates, function 3c to present relevant characters by retrieving a character pattern dictionary 5 based on the characters prepared by this function 3b, and function 3d to correct the recognized result into the character designated by an operator among the characters presented by this function 3c.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、日本語による文字を光
学的に読み取る日本語文字読取装置に関するものであ
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a Japanese character reader for optically reading Japanese characters.

【0002】[0002]

【従来の技術】近年、日本語を他の言語に翻訳する機械
翻訳システムにおける日本語入力手段として、また、日
本語による文書データをデータベース等に入力する際の
データ入力手段として、日本語による文字を光学的に読
み取る日本語文字読取装置の商品化が盛んに行われてい
る。
2. Description of the Related Art In recent years, Japanese characters have been used as a Japanese input means in a machine translation system for translating Japanese into other languages, and as a data input means when inputting document data in Japanese into a database or the like. Commercialization of a Japanese character reader for optically reading is actively performed.

【0003】このような日本語文字読取装置では、認識
率を高めるために種々の工夫がなされてきたが、読み取
り対象の文字として、手書き文字が含まれたり、あるい
は汚れた書面等が含まれる場合には、認識率を100%
とすることは技術的に非常に困難である。
In such a Japanese character reading device, various measures have been taken to increase the recognition rate. However, when the characters to be read include handwritten characters or dirty writing, etc. Has a recognition rate of 100%
Is technically very difficult to do.

【0004】従って、認識結果が誤っていた場合に、そ
の誤りを簡単な操作で修正することのできる修正機能を
装備することが、日本語文字読取装置としての全体的な
性能を向上させるための重要なポイントとなっている。
Therefore, if the recognition result is erroneous, it is necessary to provide a correction function for correcting the error by a simple operation in order to improve the overall performance of the Japanese character reading device. It is an important point.

【0005】従来の場合、認識結果を修正する方式とし
ては、例えば、認識した文字候補の全てを操作者に提示
し、操作者がマウスなどで選択することによって認識結
果を修正するようにしたものがある。
In the conventional case, as a method of correcting the recognition result, for example, all recognized character candidates are presented to the operator, and the operator corrects the recognition result by selecting with the mouse or the like. There is.

【0006】また、装置の選出した文字候補の中に正解
文字がない場合に備えて、操作者がキーボードから文字
コードを入力すると、その文字コードに対する文字に修
正する機能を装備したもの、あるいは、操作者に文字の
読みがなを入力させてカナ漢字変換によって正解文字を
得るようにしたもの等も開発されている。
In addition, in case the correct character is not found in the character candidates selected by the apparatus, when the operator inputs a character code from the keyboard, a function for correcting the character corresponding to the character code is provided, or There has also been developed a system in which an operator inputs a phonetic reading of a character and the correct character is obtained by kana-kanji conversion.

【0007】[0007]

【発明が解決しようとする課題】ところが、例えば、日
本語に不慣れな外国人等が日本語文字読取装置を使用す
るような場合、従来の装置では、装置の認識結果が正し
いか否かは、操作者自身が原文における文字と装置の認
識した文字とを1文字ずつ照合することによって確認し
なければならず、膨大な時間を費やすとともに、操作者
に多大な負担を強いるという問題があった。
However, for example, when a foreigner who is unfamiliar with Japanese uses a Japanese character reading device, in the conventional device, whether the recognition result of the device is correct or not is The operator himself has to check the characters in the original text and the characters recognized by the device one by one, and it is necessary to check the characters one by one. Therefore, there is a problem that an enormous amount of time is spent and a great burden is imposed on the operator.

【0008】また、装置の選んだ文字候補の中に正解文
字が無かった場合、操作者が漢字表などを調べて正解文
字の文字コードを入力するという従来の方式も、操作者
にかかる負担が大きく、さらに、作業性が悪いという問
題があり、改善が望まれていた。
Further, when there is no correct answer character among the character candidates selected by the apparatus, the conventional method in which the operator checks a kanji table or the like and inputs the character code of the correct answer also imposes a burden on the operator. There is a problem that it is large and the workability is poor, and improvement has been desired.

【0009】また、操作者に読みがなを入力させてカナ
漢字変換によって正解文字を得るという方式は、操作者
が日本語に不慣れな外国人等の場合には、利用価値が乏
しい。
Further, the method of allowing the operator to input a phonetic reading and obtaining the correct character by kana-kanji conversion is of little utility value if the operator is a foreigner who is not familiar with Japanese.

【0010】本発明は前記事情に鑑みてなされたもの
で、操作者が1文字ずつ原文と照合せずとも修正の必要
がある文字を容易に知ることができて、装置の認識結果
が正しいか否かの確認を迅速かつ容易にすることのでき
る日本語文字読取装置を提供すること、および、装置の
選出した文字候補の中に正解文字が無い場合に、カナ漢
字変換等に頼らずに容易に正解文字を指示することので
きる日本語文字読取装置を提供することを目的とする。
The present invention has been made in view of the above circumstances, and an operator can easily know a character that needs to be corrected without collating the character by character with the original, and whether the recognition result of the device is correct. Providing a Japanese character reading device that enables quick and easy confirmation of whether or not there is no correct character in the character candidates selected by the device, and it is easy without relying on Kana-Kanji conversion, etc. It is an object of the present invention to provide a Japanese character reading device capable of instructing the correct answer character to.

【0011】[0011]

【課題を解決するための手段】請求項1に記載の日本語
文字読取装置は、日本語による文字を光学的に読み取る
もので、文字を光学的に読み取ってイメージデータに変
換する読取部と、文字パターンおよび文字パターンの構
成要素の情報を格納した文字パターン辞書と、単語の構
成文字および品詞および活用法の情報を格納した単語辞
書と、前記読取部から送られたイメージデータを前記文
字パターン辞書に格納されている各文字パターンおよび
単語辞書に格納されている単語と比較して、読み取った
イメージデータに対する文字候補とその文字候補に対す
る評価値とを求める認識部と、前記認識部の求めた文字
候補の内の第1候補を認識結果として提示するととも
に、操作者の指示に従って認識部の認識結果に対しての
修正処理を実行する修正部と、前記修正部による修正処
理を済ませた認識結果を読取結果としてファイルあるい
は上位のデータ処理装置などに出力する出力部とを備え
る。
According to a first aspect of the present invention, there is provided a Japanese character reader for optically reading characters in Japanese, and a reading unit for optically reading the characters and converting them into image data. A character pattern dictionary that stores information on character patterns and constituent elements of the character patterns, a word dictionary that stores information on constituent characters and parts of speech of words, and usage information, and image data sent from the reading unit to the character pattern dictionary. A character recognition unit that determines a character candidate for the read image data and an evaluation value for the character candidate by comparing each character pattern stored in The first candidate among the candidates is presented as a recognition result, and the correction process is performed on the recognition result of the recognition unit according to the instruction of the operator. Comprising a Tadashibu, and an output unit for outputting correction processing recognition results such as the reading result as a file or a higher-level data processing apparatus in which finished by the correcting unit.

【0012】そして、さらに、前記修正部には、前記認
識部の求めた第1候補を認識結果として提示する際に、
第1候補の評価値が予め設定された基準以下の文字と第
1候補と第2候補との評価値の差が予め設定された基準
以下の文字とについてはその旨を明示する評価識別表示
機能を備える。
Further, when presenting the first candidate obtained by the recognition unit as a recognition result to the correction unit,
An evaluation identification display function for clearly indicating that the evaluation value of the first candidate is equal to or less than the preset reference value and the character of which the difference between the evaluation values of the first candidate and the second candidate is equal to or less than the reference value is preset. Equipped with.

【0013】請求項2に記載の日本語文字読取装置は、
日本語による文字を光学的に読み取るもので、文字を光
学的に読み取ってイメージデータに変換する読取部と、
文字パターンおよび文字パターンの構成要素の情報を格
納した文字パターン辞書と、単語の構成文字および品詞
および活用法の情報を格納した単語辞書と、前記読取部
から送られたイメージデータを前記文字パターン辞書に
格納されている各文字パターンおよび単語辞書に格納さ
れている単語と比較して、読み取ったイメージデータに
対する文字候補とその文字候補に対する評価値とを求め
る認識部と、前記認識部の求めた文字候補の内の第1候
補を認識結果として提示するとともに、操作者の指示に
従って認識部の認識結果に対しての修正処理を実行する
修正部と、前記修正部による修正処理を済ませた認識結
果を読取結果としてファイルあるいは上位のデータ処理
装置などに出力する出力部とを備える。
The Japanese character reader according to claim 2 is
A reading unit that optically reads Japanese characters, and that reads the characters optically and converts them into image data.
A character pattern dictionary that stores information on character patterns and constituent elements of the character patterns, a word dictionary that stores information on constituent characters and parts of speech of words, and usage information, and image data sent from the reading unit to the character pattern dictionary. A character recognition unit that determines a character candidate for the read image data and an evaluation value for the character candidate by comparing each character pattern stored in A first candidate among the candidates is presented as a recognition result, and a correction unit that executes a correction process on the recognition result of the recognition unit according to the instruction of the operator, and a recognition result after the correction process by the correction unit are performed. An output unit that outputs the read result to a file or a higher-level data processing device is provided.

【0014】そして、さらに、前記修正部には、文字作
成機能と、修正候補表示機能と、候補修正機能とを備え
る。
Further, the correction section further comprises a character creation function, a correction candidate display function, and a candidate correction function.

【0015】ここに、文字作成機能は、文字候補を修正
する場合に、既に文字候補として表示している文字の構
成要素を指定すると指定された構成要素を組み合わせ
て、文字あるいは文字の一部を作成する。
Here, the character creation function, when modifying a character candidate, specifies the constituent elements of the character already displayed as the character candidate, combines the specified constituent elements, and modifies the character or a part of the character. create.

【0016】前記修正候補表示機能は、前記文字作成機
能によって作成された文字あるいは文字の一部に基づい
て前記文字パターン辞書を検索して、該当する全ての文
字を提示する。
The correction candidate display function searches the character pattern dictionary based on the character or part of the character created by the character creating function, and presents all applicable characters.

【0017】前記候補修正機能は、前記修正候補表示機
能で提示された文字の内、操作者が指定した文字に認識
部による認識結果を修正する。
The candidate correction function corrects the recognition result by the recognition unit to the character designated by the operator among the characters presented by the correction candidate display function.

【0018】[0018]

【作用】請求項1に記載した日本語文字読取装置では、
修正部によって修正処理を行う場合、認識部による認識
結果の内で修正を必要とする可能性が高い文字候補は、
評価識別表示機能による識別表示によって明示される。
そのため、操作者が1文字ずつ認識結果と原文とを照合
せずとも修正の必要がある文字を容易に知ることができ
て、装置の認識結果が正しいか否かの確認を迅速かつ容
易にすることのでき、操作者の負担も軽減される。
In the Japanese character reader according to claim 1,
When performing the correction process by the correction unit, character candidates that are likely to require correction in the recognition result by the recognition unit are
It is specified by the identification display by the evaluation identification display function.
Therefore, the operator can easily know the characters that need to be corrected without collating the recognition result with the original text one by one, and can quickly and easily confirm whether or not the recognition result of the device is correct. Therefore, the burden on the operator can be reduced.

【0019】また、請求項2に記載した日本語文字読取
装置では、認識部の選んだ文字候補の中に正解文字が無
かった場合は、修正部に装備している文字作成機能,修
正候補表示機能,候補修正機能等の機能の連携によっ
て、操作者は表示装置の画面上でマウス等を操作するだ
けで、簡単に正解文字を得ることができ、操作者が正解
文字を指定するために漢字コード表を調べる必要がな
く、さらに、操作者に読みがなの入力を強いるカナ漢字
変換に頼る必要もない。
Further, in the Japanese character reader according to the second aspect, when there is no correct answer character among the character candidates selected by the recognition unit, the character creation function and correction candidate display provided in the correction unit are displayed. By linking the functions such as the function and the candidate correction function, the operator can easily obtain the correct answer character only by operating the mouse on the screen of the display device, and the operator can specify the correct answer character by kanji characters. There is no need to look up the code table, and there is no need to rely on kana-kanji conversion, which forces the operator to enter phonetic readings.

【0020】従って、日本語に不慣れな外国人等が日本
語文字読取装置を使用するような場合でも、操作者に負
担がかからず、日本語文書のデータ化や翻訳処理等にお
ける処理効率の大幅な向上を期待することができる。
Therefore, even if a foreigner who is unfamiliar with the Japanese language uses the Japanese character reader, the operator is not burdened, and the processing efficiency in the data conversion and translation processing of the Japanese document is improved. You can expect a significant improvement.

【0021】[0021]

【実施例】図1は、本発明に係る日本語文字読取装置の
一実施例のブロック図である。この一実施例の日本語文
字読取装置は、日本語を他の言語に翻訳する機械翻訳シ
ステムにおける日本語入力手段、あるいは、日本語によ
る文書データをデータベース等に入力する際のデータ入
力手段などとして利用されるもので、図示のように、読
取部1、認識部2、修正部3、出力部4、文字パターン
辞書5、単語辞書6などを構成要素としている。
1 is a block diagram of an embodiment of a Japanese character reading device according to the present invention. The Japanese character reader of this embodiment is used as a Japanese input means in a machine translation system for translating Japanese into another language, or as a data input means for inputting Japanese document data into a database or the like. As shown in the drawing, the reading unit 1, the recognition unit 2, the correction unit 3, the output unit 4, the character pattern dictionary 5, the word dictionary 6 and the like are used as constituent elements.

【0022】前記読取部1は、紙などに印刷あるいは手
書きされている文字を光学的に読み取り、イメージデー
タに変換して認識部2に送る。また、前記文字パターン
辞書5は、文字パターンおよび文字パターンの構成要素
および構成要素の配置位置などの情報を格納している。
そして、単語辞書6は、単語の構成文字および品詞およ
び活用法などの情報を格納している。
The reading unit 1 optically reads characters printed or handwritten on paper, converts them into image data, and sends them to the recognition unit 2. In addition, the character pattern dictionary 5 stores information such as character patterns, constituent elements of the character patterns, and arrangement positions of the constituent elements.
The word dictionary 6 stores information such as constituent characters of words, parts of speech, and usages.

【0023】前記認識部2は、前記読取部1から送られ
たイメージデータを前記文字パターン辞書5に格納され
ている各文字パターンおよび単語辞書6に格納されてい
る単語と比較して、読み取ったイメージデータに対する
文字候補とその文字候補に対する評価値とを求めて、求
めた結果を修正部3に送る。
The recognizing unit 2 compares the image data sent from the reading unit 1 with each character pattern stored in the character pattern dictionary 5 and the word stored in the word dictionary 6 and reads the image data. A character candidate for the image data and an evaluation value for the character candidate are obtained, and the obtained result is sent to the correction unit 3.

【0024】前記修正部3は、後で詳述するが、認識部
2から送られてきた文字候補の内の第1候補を認識結果
として提示するとともに、操作者の指示に従って認識部
2の認識結果に対しての修正処理を実行して、修正結果
を出力部4に送る。
As will be described later in detail, the correction section 3 presents the first candidate among the character candidates sent from the recognition section 2 as a recognition result, and recognizes the recognition section 2 according to the operator's instruction. The correction process is executed on the result and the correction result is sent to the output unit 4.

【0025】前記出力部4は、前記修正部3から送られ
てきた文字列等の情報を、読取結果として、ファイルあ
るいは上位のデータ処理装置などに出力する。
The output unit 4 outputs the information such as the character string sent from the correction unit 3 as a reading result to a file or an upper data processing device.

【0026】一実施例の日本語文字読取装置は、以上の
構成要素によって、紙などに記述されている日本語文字
を光学的に読み取る。図2は、前記一実施例の日本語文
字読取装置における読取処理の概略を示したフローチャ
ートである。
The Japanese character reader of one embodiment optically reads Japanese characters written on paper or the like by the above components. FIG. 2 is a flow chart showing an outline of the reading process in the Japanese character reading device of the above embodiment.

【0027】次に、図3に示す紙片7上の文字を読み取
って、読取結果に対して修正などを行ってファイルに出
力するまでの処理の流れを、図2に基づいて説明する。
Next, the flow of processing from reading the characters on the paper piece 7 shown in FIG. 3, correcting the reading result, and outputting to a file will be described with reference to FIG.

【0028】まず、読取部1が紙片7上に記述されてい
る文字を読み取って、イメージデータとして認識部2に
送る(ステップ10)。すると、認識部2は、まず、イ
メージ分割処理を行う(ステップ20)。このイメージ
分割処理とは、読取部1から送られてきたイメージデー
タを段落,行といった文字のまとまりに分割し、分割し
た文字のまとまりに対してさらに分割処理を行って最終
的に一つ一つの文字に分割するものである。図4は、前
記ステップ20のイメージ分割処理によって得た1文字
毎のイメージデータ(文字データ)を示したものであ
る。
First, the reading unit 1 reads a character written on the paper piece 7 and sends it as image data to the recognition unit 2 (step 10). Then, the recognition unit 2 first performs image division processing (step 20). This image division processing divides the image data sent from the reading unit 1 into a group of characters such as paragraphs and lines, further divides the divided group of characters, and finally, It is divided into letters. FIG. 4 shows image data (character data) for each character obtained by the image division processing in step 20.

【0029】次いで、ステップ20で分割した1文字分
のイメージデータ毎に、文字パターン辞書5に格納され
ている文字パターンとのマッチングを行い、類似度を計
算する(ステップ21)。ここに、類似度は、0〜10
0の整数値で示され、数値が大きい程よく類似している
ことを意味する。
Next, the image data for one character divided in step 20 is matched with the character pattern stored in the character pattern dictionary 5 to calculate the degree of similarity (step 21). Here, the degree of similarity is 0 to 10
It is represented by an integer value of 0, and the larger the value, the better the similarity.

【0030】そして、類似度が70以上となる文字をそ
の読取文字(イメージデータ)の文字候補とし、前記類
似度をその文字候補に対する評価値(文字評価値)とす
る(ステップ22)。次いで、ステップ22の処理を済
ませたイメージデータが、前記ステップ20で分割した
最後の1文字分のイメージデータであるか否かを判断
し、最後のイメージデータでない場合には、処理対象の
イメージデータを次の1文字に更新してステップ21に
戻ることによって(ステップ23,24)、ステップ2
0で1文字毎に分割された全てのイメージデータに対し
てステップ21,22を繰り返す。
Then, a character having a similarity of 70 or more is set as a character candidate of the read character (image data), and the similarity is set as an evaluation value (character evaluation value) for the character candidate (step 22). Next, it is determined whether the image data processed in step 22 is the image data for the last one character divided in step 20, and if it is not the last image data, the image data to be processed Is updated to the next one character and the process returns to step 21 (steps 23 and 24), so that step 2
Steps 21 and 22 are repeated for all the image data divided by 0 for each character.

【0031】図5は、前記ステップ21〜24までの処
理によって得た文字候補および各文字候補毎の評価値を
示したものである。図5においては、最上位の行Gに記
述した番号1,2,……,9,……は前記ステップ20
で分割した1文字毎のイメージデータの順番に対応し、
各イメージデータに対する文字候補が各イメージデータ
毎に評価値の高い順に縦方向に並べられている。文字候
補として示した文字の下に付けた数値が評価値(類似
度)である。
FIG. 5 shows the character candidates obtained by the processing in steps 21 to 24 and the evaluation value for each character candidate. In FIG. 5, the numbers 1, 2, ..., 9, ...
It corresponds to the order of image data for each character divided by
Character candidates for each image data are arranged in the vertical direction in descending order of evaluation value for each image data. The numerical value attached below the character shown as the character candidate is the evaluation value (similarity).

【0032】図5に示した具体例では、先頭のイメージ
データ(図4において、1番目の文字「日」に対するイ
メージデータ)に対しては、文字候補として「白」,
「日」,「月」,「旦」等が挙げられ、各文字候補に対
する評価値は、それぞれ、92,91,78,72とな
っている。
In the specific example shown in FIG. 5, "white" is selected as a character candidate for the first image data (image data for the first character "day" in FIG. 4).
Examples include "day", "month", "day", and the evaluation values for the character candidates are 92, 91, 78, and 72, respectively.

【0033】前記ステップ21〜24によって文字候補
およびその評価値が全てのイメージデータ(文字)に対
して求められると、次には、連続したイメージデータの
文字候補同士の組み合わせによる単語について単語辞書
6を検索し、単語辞書6内に該当する単語が見つかった
場合には、それを単語候補として設定するとともに、そ
の単語候補を構成している各文字候補の評価値の和を単
語評価値として算出する(ステップ25)。例えば、文
字候補あるいは文字候補の組み合わせによる単語である
「白」,「日」,……「白本」,「白木」,「日本」,
……,「日本語」,……等に対して単語辞書6を検索し
た結果、単語辞書6内に格納されている単語として、
「白」,「日」,「月」,「白木」,「日本」,「日本
語」,……が確認された場合、それらの確認された単語
が単語候補として設定される。そして、例えば、単語候
補の「白木」に対しては、文字候補「白」の評価値92
と「木」の評価値80との和であるの172が、単語評
価値として算出される。
When the character candidates and the evaluation values thereof are obtained for all the image data (characters) by the steps 21 to 24, next, the word dictionary 6 for the words formed by combining the character candidates of the continuous image data. When a corresponding word is found in the word dictionary 6, the word is set as a word candidate, and the sum of the evaluation values of the character candidates forming the word candidate is calculated as the word evaluation value. (Step 25). For example, “white”, “day”, ... “Shiramoto”, “Shiraki”, “Japan”, which are word candidates or combinations of character candidates,
As a result of searching the word dictionary 6 for ..., “Japanese”, ...
When “white”, “day”, “month”, “shiraki”, “Japan”, “Japanese”, ... Are confirmed, those confirmed words are set as word candidates. Then, for example, for the word candidate “Shiraki”, the evaluation value 92 of the character candidate “white”
And 172, which is the sum of the evaluation value 80 of “tree”, are calculated as the word evaluation value.

【0034】なお、前記ステップ25において、連続し
たイメージデータの文字候補同士の組み合わせによる単
語について単語辞書6を検索する処理は、前記ステップ
21〜24で得た文字候補に対する全ての組み合わせに
ついて行う。図6は、前記ステップ25の処理で得た単
語候補、および各単語候補に対する単語評価値を示して
いる。なお、この図6において、最上位の行Hに記述し
た番号1,2,……,9,……は前記ステップ20で分
割した1文字毎のイメージデータの順番に対応してい
る。また、各単語候補の文字の下に記述された数値が単
語評価値である。次いで、ステップ25で求めた単語候
補相互の接続可能性のチェックを行い、接続できないも
のは単語候補から削除する(ステップ26)。なお、漢
字1文字から構成される単語は連続しないものとする。
そして、単語評価値が大きい順に、単語評価値がない場
合は文字評価値が大きい順に第1候補,第2候補,……
と文字候補の順位を決定する(ステップ27)。以上の
ステップ20〜27までの処理は、認識部2によるもの
である。
In step 25, the process of searching the word dictionary 6 for words based on combinations of character candidates of continuous image data is performed for all combinations of the character candidates obtained in steps 21 to 24. FIG. 6 shows the word candidates obtained in the process of step 25 and the word evaluation value for each word candidate. In FIG. 6, the numbers 1, 2, ..., 9, ... Described in the uppermost row H correspond to the order of the image data for each character divided in step 20. The numerical value described below the character of each word candidate is the word evaluation value. Next, the possibility of connection between the word candidates obtained in step 25 is checked, and those that cannot be connected are deleted from the word candidates (step 26). It should be noted that words composed of one Kanji character are not consecutive.
Then, the first candidate, the second candidate, ...
And the order of character candidates is determined (step 27). The processing of steps 20 to 27 described above is performed by the recognition unit 2.

【0035】修正部3は、修正処理のためのガイダンス
や前記ステップ10で読み取ったイメージデータを表示
装置の画面上に表示し、また、ステップ27で第1候補
に設定された候補文字による文字列を認識結果として表
示装置の画面上に表示し、さらに、認識結果として表示
した文字列上の指定文字に対しては、該当するイメージ
データ(文字)の第2候補以降の全ての候補文字を表示
装置の画面上に表示して、操作者の指示に基づく修正処
理を行う(ステップ30)。なお、修正部3による修正
処理については、後に詳述する。
The correction unit 3 displays the guidance for correction processing and the image data read in step 10 on the screen of the display device, and the character string of the candidate character set as the first candidate in step 27. Is displayed on the screen of the display device as the recognition result, and further, for the designated character on the character string displayed as the recognition result, all candidate characters after the second candidate of the corresponding image data (character) are displayed. It is displayed on the screen of the device and the correction process is performed based on the instruction of the operator (step 30). The correction processing by the correction unit 3 will be described in detail later.

【0036】次いで、出力部4が、前記修正部3による
修正処理後の第1候補による文字列を認識結果として、
操作者の指示に従ってファイルあるいは上位のデータ処
理装置などに出力する(ステップ40)。
Next, the output unit 4 sets the character string of the first candidate after the correction processing by the correction unit 3 as a recognition result,
The data is output to a file or a higher-level data processing device according to the operator's instruction (step 40).

【0037】以上で、日本語文字読取の一連の処理を終
了する次に、修正部3に装備された諸機能および修正部
3における処理について詳述する。図7は、前記修正部
3が表示装置の画面に表示する画面構成を示したもので
ある。
Above, a series of processes for reading Japanese characters is completed. Next, the functions provided in the correction unit 3 and the processing in the correction unit 3 will be described in detail. FIG. 7 shows a screen configuration displayed on the screen of the display device by the correction unit 3.

【0038】この図7において、符号100〜107は
処理を指示するためのガイダンス、110は読取部1で
読み取ったイメージをそのまま表示するイメージ表示
部、111はイメージ表示部110内の領域を指定する
ための領域指定枠、120は前記領域指定枠111によ
って指定された領域内のイメージデータに対する認識部
2の認識結果(第1候補)を表示するための認識結果表
示部、121は前記認識結果表示部120内の一つの文
字を指定するためのカーソル、130は前記カーソル1
21によって指定された文字の文字候補を全て表示する
ための候補表示部である。また、131は候補表示部1
30内の一つの候補を指定するためのカーソル、140
はカーソル121によって指定された文字の付近の拡大
したイメージデータである。
In FIG. 7, reference numerals 100 to 107 are guidance for instructing processing, 110 is an image display unit for displaying the image read by the reading unit 1 as it is, and 111 is an area in the image display unit 110. Area designation frame for display 120, a recognition result display unit for displaying the recognition result (first candidate) of the recognition unit 2 for the image data in the area specified by the area designation frame 111, and 121 the recognition result display A cursor for designating one character in the section 120, 130 is the cursor 1
It is a candidate display unit for displaying all the character candidates of the character designated by 21. 131 is the candidate display unit 1
Cursor for designating one candidate in 30; 140
Is enlarged image data near the character designated by the cursor 121.

【0039】前記修正部3は、認識部2で求めた候補文
字を図7の修正画面上で修正するための機能として、評
価識別表示機能3a、文字作成機能3b、修正候補表示
機能3c、候補修正機能3dなどの諸機能を装備してい
る。
The correction unit 3 has a function for correcting the candidate characters obtained by the recognition unit 2 on the correction screen of FIG. 7 as an evaluation identification display function 3a, a character creation function 3b, a correction candidate display function 3c, and a candidate. It is equipped with various functions such as the correction function 3d.

【0040】ここに、評価識別表示機能3aは、前記認
識部2の認識結果として第1候補による文字列を前記認
識結果表示部120に表示する場合に、前記認識部2で
求めた文字候補の第1候補の評価値が予め設定された基
準以下の文字と、第1候補と第2候補との評価値の差が
予め設定された基準以下の文字とについてその旨を明示
する機能である。
Here, when the evaluation identification display function 3a displays the character string by the first candidate as the recognition result of the recognition unit 2 on the recognition result display unit 120, the character candidate obtained by the recognition unit 2 is displayed. This is a function for clearly indicating that the evaluation value of the first candidate is equal to or less than a preset reference value and the character of which the difference between the evaluation values of the first candidate and the second candidate is equal to or less than the preset reference value.

【0041】前述の認識部2で求めた文字候補の第1候
補の評価値が予め設定された基準以下であるか否かの判
断基準は、この一実施例の場合、第1候補の候補文字に
ついての単語評価値が存在するか否かであり、単語評価
値が存在しない場合には、濃い網かけを施すことによっ
て単語評価値が存在する候補と識別可能に表示する。な
お、単語評価値が存在しない場合とは、候補となってい
る文字が単語辞書6に存在しない場合で、候補となって
いる文字が正解文字でない確率が極めて高いこと、即
ち、修正すべき可能性が高いことを意味している。
In the case of this embodiment, the criterion for determining whether or not the evaluation value of the first candidate of the character candidates obtained by the recognition unit 2 is less than or equal to a preset criterion is the candidate character of the first candidate. If there is no word evaluation value, and if the word evaluation value does not exist, it is displayed so as to be distinguishable from a candidate having a word evaluation value by applying a dark shading. Note that the word evaluation value does not exist means that the candidate character does not exist in the word dictionary 6, and the probability that the candidate character is not the correct character is extremely high, that is, it should be corrected. It means that there is high quality.

【0042】また、この一実施例の場合、第1候補と第
2候補との評価値の差が予め設定された基準以下である
か否かの判断基準は、第1候補と第2候補との単語評価
値の差が70以下であるか否かであり、差が70以下の
場合には、薄い網かけを施すことによって、差が70以
上の候補および単語評価値が存在しない候補のいずれと
も識別可能に表示する。なお、第1候補と第2候補との
単語評価値の差が70以下の場合とは、正解文字となる
蓋然性が接近した複数の単語候補が存在することを意味
し、この場合も、候補となっている文字が正解文字でな
い確率が高いことを意味している。
Further, in the case of this embodiment, the criterion for judging whether or not the difference between the evaluation values of the first candidate and the second candidate is less than or equal to a preset criterion is the first candidate and the second candidate. The difference between the word evaluation values is 70 or less. If the difference is 70 or less, by applying a light shading, any of the candidates with a difference of 70 or more and the candidates with no word evaluation value exist. Also displayed in a distinguishable manner. In addition, when the difference between the word evaluation values of the first candidate and the second candidate is 70 or less, it means that there are a plurality of word candidates that are close to each other and have a high probability of being the correct character. It means that there is a high probability that the letters in question are not the correct letters.

【0043】また、文字作成機能3bは、文字候補を修
正する場合に、既に文字候補として表示している文字の
構成要素を指定すると指定された構成要素を組み合わせ
て、文字あるいは文字の一部を作成する機能である。
Further, when the character creation function 3b corrects the character candidates, if the constituent elements of the character already displayed as the character candidate are designated, the designated constituent elements are combined and the character or a part of the character is designated. It is a function to create.

【0044】修正候補表示機能3cは、前記文字作成機
能3bによって作成された文字あるいは文字の一部に基
づいて前記文字パターン辞書5を検索して、該当する全
ての文字を提示する機能である。
The correction candidate display function 3c is a function for searching the character pattern dictionary 5 based on the character or a part of the character created by the character creating function 3b and presenting all the applicable characters.

【0045】そして、候補修正機能3dは、前記修正候
補表示機能3cによって画面上に提示された文字の内、
操作者が指定した文字に認識部2による認識結果を修正
する機能である。
Then, the candidate correction function 3d has a function of displaying the characters displayed on the screen by the correction candidate display function 3c.
This is a function of correcting the recognition result by the recognition unit 2 to the character designated by the operator.

【0046】以下、前述の各機能3a〜3dを利用した
修正部3における修正処理の流れを、図8に基づいて説
明する。使用者は、修正が必要な文字が現在の領域指定
枠111内に有るか否かを判断し、修正が必要な文字が
現在の領域指定枠111内にない場合には、領域指定枠
111を移動する(ステップ301,302)。そし
て、マウスなどを用いて修正が必要な文字上にカーソル
121を移動することによって修正文字を選択する(ス
テップ303)。修正部3は、カーソル121によって
選択された文字の文字候補を候補表示部130に表示す
る。
The flow of the correction process in the correction unit 3 utilizing the above-mentioned functions 3a to 3d will be described below with reference to FIG. The user determines whether or not the character that needs correction is in the current area specification frame 111. If the character that needs correction is not in the current area specification frame 111, the user sets the area specification frame 111. It moves (steps 301 and 302). Then, by using the mouse or the like, the cursor 121 is moved onto the character that needs to be corrected to select the corrected character (step 303). The correction unit 3 displays the character candidates of the character selected by the cursor 121 on the candidate display unit 130.

【0047】例えば、操作者がカーソル121によって
「文」を選択した場合、修正部3は、候補表示部130
に文字候補として「文」,「女」,「大」を表示する。
操作者は、前記候補表示部130に表示された文字候補
を見て、正解文字が含まれているか否かを判断し(ステ
ップ304)、候補表示部130に表示された文字候補
に正解文字が含まれている場合には、カーソル131を
正解文字上に移動させることによって、変更する候補を
指定する(ステップ305)。変更文字が指定された場
合、修正部3は、認識結果をカーソル131によって指
定された文字候補に修正する(ステップ306)。
For example, when the operator selects "sentence" with the cursor 121, the correction unit 3 causes the candidate display unit 130 to display.
"Sentence", "Woman", and "Large" are displayed as the character candidates.
The operator looks at the character candidates displayed on the candidate display unit 130 and determines whether or not the correct answer character is included (step 304), and the correct answer character is displayed on the character candidate displayed on the candidate display unit 130. If it is included, the candidate to be changed is designated by moving the cursor 131 to the correct character (step 305). When the changed character is designated, the correction unit 3 corrects the recognition result to the character candidate designated by the cursor 131 (step 306).

【0048】一方、前記ステップ304において候補表
示部130に表示した候補内に正解文字がないと判断し
た場合には、操作者はガイダンスの文字入力処理(inpu
t character)を指定する(ステップ307)。操作者
から文字入力処理が指定されると、修正部3は、図9に
示すように、文字入力のためのウィンドウ350を開
き、該ウィンドウ350内に前記候補表示部130に示
していた各文字候補を構成要素に分割して表示する。
On the other hand, when it is determined in step 304 that there is no correct character in the candidates displayed on the candidate display unit 130, the operator inputs the guidance character input process (inpu).
t character) is designated (step 307). When the character input process is designated by the operator, the correction unit 3 opens a character input window 350 as shown in FIG. 9, and the characters displayed in the candidate display unit 130 are displayed in the window 350. Display the candidates by dividing them into components.

【0049】図9は、カーソル121が文字候補「誌」
にある状態でガイダンス105の文字入力処理(input
character)が指定された場合のものである。ウィンド
ウ350において、文字「誌」は、左半分の「言」,右
上半分の「士」,右下半分の「心」の3つの構成要素に
分割されている。
In FIG. 9, the cursor 121 indicates that the character candidate is "magazine".
Text input processing of guidance 105 (input
character) is specified. In the window 350, the character “magazine” is divided into three constituent elements: “word” in the left half, “shi” in the upper right half, and “heart” in the lower right half.

【0050】ここで、操作者は、マウスなどを用いて前
記ウィンドウ350内に表示している文字の構成要素か
ら必要な構成要素を指定して、ウィンドウ350内に点
線枠で示した文字入力領域351に移動させて、文字入
力領域351内に正解文字あるいは正解文字の一部を作
成する(ステップ308)。このステップ308におけ
る文字作成処理は、前記文字作成機能3bによるもので
ある。
Here, the operator designates necessary constituent elements from the constituent elements of the character displayed in the window 350 by using a mouse or the like, and the character input area indicated by a dotted line frame in the window 350. It moves to 351 and the correct answer character or a part of the correct answer character is created in the character input area 351 (step 308). The character creation processing in step 308 is performed by the character creation function 3b.

【0051】操作者は、ステップ308における操作が
終了したら、文字検索を指定する。文字検索が指定され
ると、修正部3は、前記修正候補表示機能3cを起動さ
せる。この修正候補表示機能3cでは、前記文字入力領
域351内に作成された文字構成要素をキーとして、文
字パターン辞書5を検索し、該当する全ての文字を提示
する(ステップ309)。
After completing the operation in step 308, the operator designates a character search. When the character search is designated, the correction unit 3 activates the correction candidate display function 3c. In the correction candidate display function 3c, the character pattern dictionary 5 is searched by using the character components created in the character input area 351 as keys, and all the corresponding characters are presented (step 309).

【0052】例えば、使用者が、図10に示すように、
正解文字の構成要素として「誌」の左半分の「言」を文
字入力領域351に作成して、文字検索を指定した場
合、前記修正候補表示機能3cでは、「言」をキーとし
て文字パターン辞書5を検索し、「計」,「訂」,
「訃」,……,「認」,……を該当文字として候補表示
部130等に表示する。また、図11に示すように、正
解文字の構成要素として「誌」の左半分の「言」と
「綛」の右半分の「忍」とを組み合わせた文字を文字入
力領域351に作成して、文字検索を指定した場合、前
記修正候補表示機能3cでは、「言」と「忍」とをキー
として文字パターン辞書5を検索し、「認」を該当文字
として表示する。
For example, as shown in FIG.
When “word” in the left half of “magazine” is created in the character input area 351 as a component of the correct answer character and a character search is designated, the correction candidate display function 3c uses the “word” as a key in the character pattern dictionary. 5 is searched, "total", "correction",
"Certificate", ..., "Accept", ... are displayed as the corresponding characters on the candidate display unit 130 and the like. In addition, as shown in FIG. 11, a character in which the left half of “magazine” and the right half of “sword” “nin” are combined as a constituent element of the correct answer character is created in the character input area 351. When the character search is designated, the correction candidate display function 3c searches the character pattern dictionary 5 by using "word" and "nin" as keys, and displays "recognition" as the corresponding character.

【0053】操作者は、修正候補表示機能3cによって
表示された文字のうちの正解文字をマウス等を用いて指
定する。すると、前述の候補修正機能3dが作動して、
認識結果を操作者が指定した文字に修正する(ステップ
310)。
The operator uses the mouse or the like to specify the correct answer character among the characters displayed by the correction candidate display function 3c. Then, the above-mentioned candidate correction function 3d operates,
The recognition result is corrected to the character designated by the operator (step 310).

【0054】操作者は、イメージ表示部110内の領域
指定枠111の移動操作および認識結果表示部120内
のカーソル121の移動操作によって、読取部1で読み
取った文字中の任意の文字を修正部3による修正対象と
することができ、修正したい認識結果が残っている場合
には、領域指定枠111あるいはカーソル121の移動
操作によって修正対象を切り替えて、ステップ301〜
310の処理を繰り返し、認識結果に対しての修正処理
を全て終了した場合には、ガイダンスの終了(quit)を
指定すると、修正部3による一連の修正処理が終了する
(ステップ312)。
The operator corrects any character in the characters read by the reading unit 1 by moving the area designating frame 111 in the image display unit 110 and moving the cursor 121 in the recognition result display unit 120. If the recognition result to be corrected remains, the correction target is switched by the operation of moving the area designating frame 111 or the cursor 121, and steps 301 to 301 are executed.
When the process of 310 is repeated and the correction process for the recognition result is completed, if the end of the guidance (quit) is specified, the series of correction processes by the correction unit 3 ends (step 312).

【0055】以上に詳述した一実施例の日本語文字読取
装置では、修正部3によって修正処理を行う場合、前記
認識部2による認識結果の内で修正を必要とする可能性
が高い文字候補は、評価識別表示機能3aによる識別表
示によって明示される。そのため、操作者が1文字ずつ
認識結果と原文とを照合せずとも修正の必要がある文字
を容易に知ることができて、装置の認識結果が正しいか
否かの確認を迅速かつ容易にすることのでき、また、操
作者の負担も軽減される。
In the Japanese character reading apparatus of the embodiment described in detail above, when the correction processing is performed by the correction unit 3, the character candidates that are highly likely to require correction within the recognition result by the recognition unit 2. Is clearly indicated by the identification display by the evaluation identification display function 3a. Therefore, the operator can easily know the characters that need to be corrected without collating the recognition result with the original text one by one, and can quickly and easily confirm whether or not the recognition result of the device is correct. It is also possible to reduce the burden on the operator.

【0056】また、認識部2の選んだ文字候補の中に正
解文字が無かった場合は、修正部3に装備している文字
作成機能3b,修正候補表示機能3c,候補修正機能3
d等の機能の連携によって、操作者は表示装置の画面上
でマウス等を操作するだけで、簡単に正解文字を得るこ
とができ、操作者が正解文字を指定するために漢字コー
ド表を調べる必要がなく、さらに、操作者に読みがなの
入力を強いるカナ漢字変換に頼る必要もない。
When there is no correct answer character among the character candidates selected by the recognition unit 2, the character creation function 3b, the correction candidate display function 3c, and the candidate correction function 3 provided in the correction unit 3 are included.
By linking functions such as d, the operator can easily obtain the correct character by simply operating the mouse on the screen of the display device, and the operator checks the kanji code table to specify the correct character. There is no need, and there is no need to rely on kana-kanji conversion, which forces the operator to input phonetic readings.

【0057】従って、日本語に不慣れな外国人等が日本
語文字読取装置を使用するような場合でも、操作者に負
担がかからず、日本語文書のデータ化や翻訳処理等にお
ける処理効率の大幅な向上を期待することができる。
Therefore, even when a foreigner who is unfamiliar with the Japanese language uses the Japanese character reader, the operator is not burdened and the processing efficiency in the data conversion and translation processing of the Japanese document is improved. You can expect a significant improvement.

【0058】なお、前記修正部3の評価識別表示機能3
aにおいて、認識部2で求めた文字候補の第1候補の評
価値が予め設定された基準以下であるか否かの判断基準
や、第1候補と第2候補との評価値の差が予め設定され
た基準以下であるか否かの判断基準は、いずれも、一実
施例のものに限定するものではない。例えば、認識部2
で求めた文字候補の第1候補の評価値が予め設定された
基準以下であるか否かの判断基準として、文字候補の評
価値あるいは単語候補における単語評価値の具体的数値
を設定することも考えられる。また、第1候補と第2候
補との評価値の差が予め設定された基準以下であるか否
かの判断基準としては、文字候補の評価値の具体的数値
を採用することも考えられるし、また、判断基準として
の具体的数値として一実施例の値(70)よりも大きい
値を設定したり、あるいは小さい値を設定することも考
えられる。
The evaluation identification display function 3 of the correction section 3
In a, the criterion for determining whether or not the evaluation value of the first candidate of the character candidates obtained by the recognition unit 2 is less than or equal to a preset standard, and the difference between the evaluation values of the first candidate and the second candidate is determined in advance. The criteria for determining whether or not the criteria are less than or equal to the set criteria are not limited to those in the example. For example, the recognition unit 2
It is also possible to set an evaluation value of a character candidate or a specific numerical value of a word evaluation value of a word candidate as a criterion for determining whether or not the evaluation value of the first candidate of the character candidates obtained in step 1 is less than or equal to a preset standard. Conceivable. Further, as a criterion for determining whether or not the difference between the evaluation values of the first candidate and the second candidate is less than or equal to a preset standard, it may be possible to adopt a specific numerical value of the evaluation value of the character candidate. Further, it is also possible to set a value larger than the value (70) of the embodiment or a small value as a specific numerical value as a judgment criterion.

【0059】[0059]

【発明の効果】以上の説明から明らかなように、請求項
1に記載した日本語文字読取装置では、修正部によって
修正処理を行う場合、認識部による認識結果の内で修正
を必要とする可能性が高い文字候補は、評価識別表示機
能による識別表示によって明示される。そのため、操作
者が1文字ずつ認識結果と原文とを照合せずとも修正の
必要がある文字を容易に知ることができて、装置の認識
結果が正しいか否かの確認を迅速かつ容易にすることの
でき、操作者の負担も軽減される。
As is apparent from the above description, in the Japanese character reading device according to the first aspect, when the correction processing is performed by the correction unit, it is necessary to correct the recognition result of the recognition unit. Character candidates with high property are clearly indicated by the identification display by the evaluation identification display function. Therefore, the operator can easily know the characters that need to be corrected without collating the recognition result with the original text one by one, and can quickly and easily confirm whether or not the recognition result of the device is correct. Therefore, the burden on the operator can be reduced.

【0060】また、請求項2に記載した日本語文字読取
装置では、認識部の選んだ文字候補の中に正解文字が無
かった場合は、修正部に装備している文字作成機能,修
正候補表示機能,候補修正機能等の機能の連携によっ
て、操作者は表示装置の画面上でマウス等を操作するだ
けで、簡単に正解文字を得ることができ、操作者が正解
文字を指定するために漢字コード表を調べる必要がな
く、さらに、操作者に読みがなの入力を強いるカナ漢字
変換に頼る必要もない。
Further, in the Japanese character reader according to the second aspect, when there is no correct answer character among the character candidates selected by the recognition unit, the character creation function and correction candidate display provided in the correction unit are displayed. By linking the functions such as the function and the candidate correction function, the operator can easily obtain the correct answer character only by operating the mouse on the screen of the display device, and the operator can specify the correct answer character by kanji characters. There is no need to look up the code table, and there is no need to rely on kana-kanji conversion, which forces the operator to enter phonetic readings.

【0061】従って、日本語に不慣れな外国人等が日本
語文字読取装置を使用するような場合でも、操作者に負
担がかからず、日本語文書のデータ化や翻訳処理等にお
ける処理効率の大幅な向上を期待することができる。
Therefore, even when a foreigner unfamiliar with the Japanese language uses the Japanese character reading device, the operator is not burdened and the processing efficiency in the data conversion and translation processing of the Japanese document is improved. You can expect a significant improvement.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施例のブロック図である。FIG. 1 is a block diagram of an embodiment of the present invention.

【図2】本発明の一実施例の読取処理の概略を示すフロ
ーチャートである。
FIG. 2 is a flowchart showing an outline of a reading process according to an embodiment of the present invention.

【図3】本発明の一実施例で読み取る原文の説明図であ
る。
FIG. 3 is an explanatory diagram of an original text read in an embodiment of the present invention.

【図4】本発明の一実施例においてイメージ分割処理し
たイメージデータの説明図である。
FIG. 4 is an explanatory diagram of image data subjected to image division processing according to an embodiment of the present invention.

【図5】本発明の一実施例における文字候補の選択例の
説明図である。
FIG. 5 is an explanatory diagram of an example of selecting character candidates according to an embodiment of the present invention.

【図6】本発明の一実施例における単語候補および単語
評価値の算出例である。
FIG. 6 is a calculation example of word candidates and word evaluation values according to an embodiment of the present invention.

【図7】本発明の一実施例の修正部による画面表示例の
説明図である。
FIG. 7 is an explanatory diagram of a screen display example by a correction unit according to an embodiment of the present invention.

【図8】本発明の一実施例の修正部における修正処理の
フローチャートである。
FIG. 8 is a flowchart of a correction process in a correction unit according to an embodiment of the present invention.

【図9】本発明の一実施例の修正部による画面表示例の
説明図である。
FIG. 9 is an explanatory diagram of a screen display example by the correction unit according to the embodiment of the present invention.

【図10】本発明の一実施例の修正部による画面表示例
の説明図である。
FIG. 10 is an explanatory diagram of a screen display example by the correction unit according to the embodiment of the present invention.

【図11】本発明の一実施例の修正部による画面表示例
の説明図である。
FIG. 11 is an explanatory diagram of a screen display example by the correction unit according to the embodiment of the present invention.

【符号の説明】[Explanation of symbols]

1 読取部 2 認識部 3 修正部 3a 評価識別表示機能 3b 文字作成機能 3c 修正候補表示機能 3d 候補修正機能 4 出力部 5 文字パターン辞書 6 単語辞書 7 紙片 100〜107 ガイダンス 110 イメージ表示部 111 領域指定枠 120 認識結果表示部 121 カーソル 130 候補表示部 131 カーソル 140 イメージデータ 350 ウィンドウ 351 文字入力領域 1 reading unit 2 recognition unit 3 correction unit 3a evaluation identification display function 3b character creation function 3c correction candidate display function 3d candidate correction function 4 output unit 5 character pattern dictionary 6 word dictionary 7 paper piece 100 to 107 guidance 110 image display unit 111 area designation Frame 120 Recognition result display portion 121 Cursor 130 Candidate display portion 131 Cursor 140 Image data 350 Window 351 Character input area

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 日本語による文字を光学的に読み取る日
本語文字読取装置であって、 文字を光学的に読み取ってイメージデータに変換する読
取部と、 文字パターンおよび文字パターンの構成要素の情報を格
納した文字パターン辞書と、 単語の構成文字および品詞および活用法の情報を格納し
た単語辞書と、 前記読取部から送られたイメージデータを前記文字パタ
ーン辞書に格納されている各文字パターンおよび単語辞
書に格納されている単語と比較して、読み取ったイメー
ジデータに対する文字候補とその文字候補に対する評価
値とを求める認識部と、 前記認識部の求めた文字候補の内の第1候補を認識結果
として提示するとともに、操作者の指示に従って認識部
の認識結果に対しての修正処理を実行する修正部と、 前記修正部による修正処理を済ませた認識結果を読取結
果としてファイルあるいは上位のデータ処理装置などに
出力する出力部とを備え、 前記修正部には、前記認識部の求めた第1候補を認識結
果として提示する際に、第1候補の評価値が予め設定さ
れた基準以下の文字と第1候補と第2候補との評価値の
差が予め設定された基準以下の文字とについてはその旨
を明示する評価識別表示機能を備えたことを特徴とする
日本語文字読取装置。
1. A Japanese character reader for optically reading characters in Japanese, comprising: a reading unit for optically reading characters and converting them into image data; and a character pattern and information on constituent elements of the character pattern. The stored character pattern dictionary, the word dictionary storing the constituent characters of the word, the part of speech, and the usage information, and the character patterns and the word dictionary in which the image data sent from the reading unit is stored in the character pattern dictionary A recognition unit that obtains a character candidate for the read image data and an evaluation value for the character candidate in comparison with the word stored in, and a first candidate among the character candidates obtained by the recognition unit as a recognition result. A correction unit that presents the correction result to the recognition result of the recognition unit according to the instruction of the operator, and a correction by the correction unit An output unit that outputs the processed recognition result as a reading result to a file or a higher-order data processing device, and the correction unit when presenting the first candidate obtained by the recognition unit as a recognition result. , An evaluation identification that clearly indicates that the first candidate has an evaluation value that is equal to or less than a preset reference value and the character that has a difference in evaluation value between the first candidate and the second candidate that is equal to or less than a preset reference value. A Japanese character reader characterized by having functions.
【請求項2】 日本語による文字を光学的に読み取る日
本語文字読取装置であって、 文字を光学的に読み取ってイメージデータに変換する読
取部と、 文字パターンおよび文字パターンの構成要素の情報を格
納した文字パターン辞書と、 単語の構成文字および品詞および活用法の情報を格納し
た単語辞書と、 前記読取部から送られたイメージデータを前記文字パタ
ーン辞書に格納されている各文字パターンおよび単語辞
書に格納されている単語と比較して、読み取ったイメー
ジデータに対する文字候補とその文字候補に対する評価
値とを求める認識部と、 前記認識部の求めた文字候補の内の第1候補を認識結果
として提示するとともに、操作者の指示に従って認識部
の認識結果に対しての修正処理を実行する修正部と、 前記修正部による修正処理を済ませた認識結果を読取結
果としてファイルあるいは上位のデータ処理装置などに
出力する出力部とを備え、 前記修正部には、 文字候補を修正する場合に、既に文字候補として表示し
ている文字の構成要素を指定すると指定された構成要素
を組み合わせて、文字あるいは文字の一部を作成する文
字作成機能と、 この文字作成機能によって作成された文字あるいは文字
の一部に基づいて前記文字パターン辞書を検索して、該
当する全ての文字を提示する修正候補表示機能と、 この修正候補表示機能で提示された文字の内、操作者が
指定した文字に認識部による認識結果を修正する候補修
正機能とを備えたことを特徴とする日本語文字読取装
置。
2. A Japanese character reading device for optically reading characters in Japanese, comprising: a reading unit that optically reads characters and converts them into image data; and a character pattern and information on the constituent elements of the character pattern. The stored character pattern dictionary, the word dictionary storing the constituent characters of the word, the part of speech, and the usage information, and the character patterns and the word dictionary in which the image data sent from the reading unit is stored in the character pattern dictionary A recognition unit that obtains a character candidate for the read image data and an evaluation value for the character candidate in comparison with the word stored in, and a first candidate among the character candidates obtained by the recognition unit as a recognition result. A correction unit that presents the correction result to the recognition result of the recognition unit according to the instruction of the operator, and a correction by the correction unit An output unit that outputs the processed recognition result as a reading result to a file or a higher-level data processing device, and the correction unit includes a character already displayed as a character candidate when correcting the character candidate. When a component of is specified, the specified component is combined to create a character or a part of a character, and the character pattern dictionary based on the character or part of the character created by the character creating function. And a correction candidate display function that presents all applicable characters, and a candidate correction function that corrects the recognition result by the recognition unit to the character specified by the operator among the characters presented by this correction candidate display function. A Japanese character reading device characterized by having and.
JP4149258A 1992-06-09 1992-06-09 Japanese character reader Expired - Fee Related JP2874815B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4149258A JP2874815B2 (en) 1992-06-09 1992-06-09 Japanese character reader

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4149258A JP2874815B2 (en) 1992-06-09 1992-06-09 Japanese character reader

Publications (2)

Publication Number Publication Date
JPH05342402A true JPH05342402A (en) 1993-12-24
JP2874815B2 JP2874815B2 (en) 1999-03-24

Family

ID=15471326

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4149258A Expired - Fee Related JP2874815B2 (en) 1992-06-09 1992-06-09 Japanese character reader

Country Status (1)

Country Link
JP (1) JP2874815B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023004108A (en) * 2021-06-25 2023-01-17 ローレルバンクマシン株式会社 Information processing apparatus and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2023004108A (en) * 2021-06-25 2023-01-17 ローレルバンクマシン株式会社 Information processing apparatus and program

Also Published As

Publication number Publication date
JP2874815B2 (en) 1999-03-24

Similar Documents

Publication Publication Date Title
EP0844583B1 (en) Method and apparatus for character recognition
CN102455845B (en) Character entry method and device
EP0797157A2 (en) Machine interpreter
JPH0630107B2 (en) Document processor
JP2012108893A (en) Hand-written entry method
JP2874815B2 (en) Japanese character reader
JP3782467B2 (en) Character input method and apparatus
JPH0452509B2 (en)
JPH07302306A (en) Character input device
JPH0630052B2 (en) Voice recognition display
JPH0636067A (en) Character reader
JP3814000B2 (en) Character string conversion apparatus and character string conversion method
JPH10232864A (en) Sentence input device and computer readable recording medium recording sentence input program
JPH07271921A (en) Character recognition device and character recognition method
JPH05120472A (en) Character recognition device
JP2829186B2 (en) Optical character reader
JPH11120294A (en) Character recognition device and medium
JPH0574867B2 (en)
JPS62224859A (en) Japanese language processing system
JPH06325017A (en) Kana/kanji converting system
JPH0934890A (en) Handwritten character input device and kana-kanji conversion method
JP3441546B2 (en) Character processing device and conversion control method in character processing device
JPH05135199A (en) Chinese character ocr
JPH04138583A (en) Character recognizing device
JPH09102012A (en) Character recognition method and device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090114

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090114

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100114

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees