JPS61246885A - 複数辞書作成方式 - Google Patents

複数辞書作成方式

Info

Publication number
JPS61246885A
JPS61246885A JP60087529A JP8752985A JPS61246885A JP S61246885 A JPS61246885 A JP S61246885A JP 60087529 A JP60087529 A JP 60087529A JP 8752985 A JP8752985 A JP 8752985A JP S61246885 A JPS61246885 A JP S61246885A
Authority
JP
Japan
Prior art keywords
area
category
dictionary
temporary
dictionary creation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60087529A
Other languages
English (en)
Inventor
▲はい▼ 東善
Touzen Hai
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP60087529A priority Critical patent/JPS61246885A/ja
Publication of JPS61246885A publication Critical patent/JPS61246885A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔概 要〕 本発明は複数辞書作成方式に係り、新たな辞書を作成す
る場合に、その辞書だけならば正分類されていた学習パ
タンか既存の他のカテゴリの新辞書により誤分類される
という悪影響をなくし、すべての学習パタンを正分類で
きるようにしたものである。
〔産業上の利用分野〕
本発明は複数辞書作成方式に関する。一般に、人間が書
く文字はそれぞれ特有のくせを持っている。このことは
、たとえ簡単な数字であっても例外ではない。例えば数
字の「8」を書いた場合でも正確に「8」と書かれれば
問題はないが、「3」に見えたり、全く判別できないこ
ともあり、また「8」と認識できても機械が判別するに
は照合するための辞書が幾つも必要となる。
従って、通常はある1つのカテゴリに関してもいくつか
の入力された学習パタンに関し、複数個の辞書を作成し
ておき、実際の人力パタンを照合する際にはこれら複数
個の辞書がその照合の対象となる。
本発明は、かかる複数辞書の作成方式に関する。
〔従来の技術及び発明が解決しようとする問題点〕従来
の複数辞書作成方式は、第3図に示すように、異なる文
字間の辞書の関係は何ら考慮されていなかった。
第3図において、あるパターン、例えば数字の「8」と
「9」についてそれぞれ複数の辞書を作成する場合には
、先ず「8」について入力されたいくつかの学習パタン
の平均M、をとり1つの辞書を作り、それを適当に、例
えば3つに分割して「8」についての3つの辞書Me’
 、Me” 、M%を作成する。
次に「9」に関しても同様に、1つの辞書M9から3つ
の複数辞書M9’l Me”l Me”lを作成する。
このように作成された複数辞書を以って、入力パタンと
の照合を行う。
しかし、従来は、上記のとおり「8」に関する複数辞書
M s ’ + M s ” + M s 3と「9」
に関する複数辞書Mq’ 、Mq” 、M、”との関係
は考慮されずに、全く独立に作成されていた。
従って、学習パタンPが「8」である場合、本来は辞書
M81により認識されるべき筈であるにもかかわらず、
距離d、よりもd、の方が小さいため、辞書M g ’
によって「9」であると認識されてしまう。
即ち、従来は、学習パタンか正しく分類されないという
問題点があった。
〔問題点を解決するための手段及び作用〕本発明は上記
問題点を解消し誤分類をな(すものであり、その手段は
先ず各カテゴリごとに仮りの複数辞書作成領域を想定し
、次にこれらの重複領域をいずれの辞書も作成できない
領域として決定し、更に直前の仮り領域との関係で誤分
類されないようにすることより成り、各領域間の関係も
十分考慮されているので従来のように学習パタンか誤分
類されることがない。
〔実施例〕
以下、本発明を実施例により添付図面を参照して説明す
る。
第1図は、本発明方式の説明図である。
今、仮りに辞書のカテゴリをα、β、例えば数字のr8
J、r9Jとしそれらの辞書作成のために用いる学習パ
タンをαhα2.α31・・・α7cα、β1.β2.
β1.・・・α、6βとする。
図中、■、■は単数辞書である。
上記各学習パタンのうち、辞書■によって、α1.α2
.α3のみが認識されたとする。
ここで、学習パタンα1に着眼すれば、α1が辞書@に
よって認識されたことは、α1を中心とし1を半径r、
とする円U、の中に他のカテゴリの辞書は他に1つもな
いことを意味する。
同様に、学習パタンα2.α1に関しても、半径rg、
r3の円U+z、  U13の中には他のカテゴリの辞
書は他に存在しないことになる。
従って、正分類された学習パタンαh α2゜α、に関
しては、円Ull、 UI!+  UI3で包囲された
実線で示す領域U、内には■以外の辞書がない。
即ち、上記実線領域U、内に新しい辞書を作成しようと
すればカテゴリαの辞書しか作れない。
もし、他のカテゴリの辞書を作れば、それまで正分類さ
れていたカテゴリαの学習パタンかその他ノカテゴリの
辞書によって誤分類されてしまう(第2図の■)。
同じ考え方を、カテゴリ (βについてあてはめれば、
βについては1点鎖線で包囲された領域U2がカテゴリ
の辞書作成領域となる(第2図の■)。
また、斜線を施した部分U4はカテゴリαの辞書作成領
域賜とβについてのそれU2との重複領域である(第2
図の■)。
この領域U4にカテゴリβの学習パタンか入れば、■と
の距離が■より近いので、αと認識される。逆の場合は
、αがβと認識される。従って上記U、はいかなる辞書
も作成されない領域である。
更に、上記指摘したU+ 、Uz 、U4以外の空白の
領域U、は、どのカテゴリの辞書も作成可能な領域であ
る(第2図の■)。
このように辞書作成領域が決定されるが、上記は必らず
しも十分な条件ではない。
即ち、カテゴリαに関する辞書領域U1が決定されたが
、他のカテゴリβの領域U2との関係は考慮されてはい
ない。
例えば、カテゴリβに属する学習パタンβ1が辞書αに
より誤分類されてしまうことがある。これはβ“を中心
とした半径lfI”−■l=d内に@以外の辞書がなか
ったからである。
従って、この半径dの円U、内にカテゴリβの辞書を作
成しなければならないことになる(第2図の■)。
しかも、このβの辞書は、領域U2内で重複領域U4外
又は空白領域U、に作成しなければならない(第2図の
■)。
上述までの動作の流れのフローを示したのが、第2図の
フローチャートである。
〔発明の効果〕
上述のとおり、本発明によれば、先ず各カテゴリごとに
仮りの複数辞書作成領域を想定し、次にこれらの重複領
域をいずれの辞書も作成できない領域として決定し、更
に直前の仮り領域との関係で誤分類されないようになっ
ているので、各領域間の関係も十分考慮され、従来のよ
うに学習パタンか誤分類されることがなくなった。
【図面の簡単な説明】
第1図は本発明方式の説明図、第2図は本発明の実施例
を示すフローチャート、第3図は従来方式の説明図であ
る。 U+ 、Uz 、Uz 、Us・・・辞書作成領域、U
4・・・辞書作成禁止領域、 r、+  rz l  rコ・・・半径、■、■・・・
カテゴリα、βの辞書、 α!、α2.α3・・・カテゴリαの学習パタン、β1
.β2.β3・・・カテゴリβの学習パタン。

Claims (1)

  1. 【特許請求の範囲】 パタンを正分類するために各カテゴリごとに複数の辞書
    を作成する方式において、 先ず、第1カテゴリから第Nカテゴリまでに属する学習
    パタンの代表値を仮りに各カテゴリの辞書とし、 次いで、上記各カテゴリに属する学習パタンが独立にす
    べて認識される領域を仮りの複数辞書作成領域とし、 次に、上記仮りの第2カテゴリ複数辞書作成領域と直前
    の仮りの第1カテゴリ複数辞書作成領域との重複領域を
    双方共通の辞書作成禁止領域として決定し、 更に、上記仮りの第2カテゴリ辞書により正分類される
    べき学習パタンと上記仮りの第1カテゴリ辞書間の距離
    より小さい距離を動径とする領域と、上記仮りの第2カ
    テゴリ複数辞書作成領域とが重なる領域を真の第2カテ
    ゴリ複数辞書作成領域として決定し、 以下、第3領域から第N領域まで順次同じ動作を繰り返
    すことにより予め各カテゴリの真の複数辞書作成領域を
    決定し、各領域内で辞書を増やしてゆくことを特徴とす
    る複数辞書作成方式。
JP60087529A 1985-04-25 1985-04-25 複数辞書作成方式 Pending JPS61246885A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60087529A JPS61246885A (ja) 1985-04-25 1985-04-25 複数辞書作成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60087529A JPS61246885A (ja) 1985-04-25 1985-04-25 複数辞書作成方式

Publications (1)

Publication Number Publication Date
JPS61246885A true JPS61246885A (ja) 1986-11-04

Family

ID=13917523

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60087529A Pending JPS61246885A (ja) 1985-04-25 1985-04-25 複数辞書作成方式

Country Status (1)

Country Link
JP (1) JPS61246885A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63265376A (ja) * 1985-10-10 1988-11-01 ザ パランチ−ル コ−ポレ−シヨン パタ−ン認識方式に使用するパタ−ン分類手段

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63265376A (ja) * 1985-10-10 1988-11-01 ザ パランチ−ル コ−ポレ−シヨン パタ−ン認識方式に使用するパタ−ン分類手段

Similar Documents

Publication Publication Date Title
EP0307111B1 (en) Character recognition apparatus
US4366551A (en) Associative memory search system
JPH06215199A (ja) 光学的文字認識システムによって出力される誤った文字を識別及び解明する方法
US6249786B1 (en) Data-conversion method
US11468232B1 (en) Detecting machine text
Francois et al. Text detection and post-OCR correction in engineering documents
US7069487B2 (en) Pattern matching to validate and classify computer variables to one or more name ranges
CN118860480B (zh) 一种基于大模型的代码缺陷检测和修复方法及装置
US9946710B2 (en) Language conversion apparatus, language conversion method, and language conversion program
JPH10254996A (ja) ニューラル・ネットに基づく文字認識システムのためのオンライン学習システム
JPS61246885A (ja) 複数辞書作成方式
KR910012982A (ko) 데이터 처리장치를 위한 특정데이터 선택방법
EP0608148A2 (en) Recognition template enhancement
JPS5960640A (ja) コンパイラ処理方法
JP2875678B2 (ja) 文字認識結果の後処理方法
Wolberg et al. CONVERT‐A language for program and data file conversions
Kurohashi et al. Structural disambiguation in Japanese by evaluating case structures based on examples in a case frame dictionary
JPS5851390A (ja) 活字文字認識装置
JP2639314B2 (ja) 文字認識方式
JP3476872B2 (ja) 文字認識装置
JPS61114388A (ja) 文字入力装置
WO2025188207A8 (ru) Способ и система распознавания информации, составляющей коммерческую тайну
AR124569A1 (es) Arquitectura de red neuronal para el procesamiento de datos de transacciones
JPH01283671A (ja) 情報処理装置
Larson MADMAC, A MADCAP VERSION OF DEC CODE MACRO-8 FOR ASSEMBLING PDP-8 CODES ON MANIAC.