JPS6162985A - 認識順位決定方式 - Google Patents

認識順位決定方式

Info

Publication number
JPS6162985A
JPS6162985A JP59185643A JP18564384A JPS6162985A JP S6162985 A JPS6162985 A JP S6162985A JP 59185643 A JP59185643 A JP 59185643A JP 18564384 A JP18564384 A JP 18564384A JP S6162985 A JPS6162985 A JP S6162985A
Authority
JP
Japan
Prior art keywords
character type
recognition
character
resemblance
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59185643A
Other languages
English (en)
Inventor
Hiroshi Matsumura
松村 博
Tatsunosuke Iwahara
岩原 達之助
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tokyo Sanyo Electric Co Ltd
Sanyo Electric Co Ltd
Original Assignee
Tokyo Sanyo Electric Co Ltd
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Sanyo Electric Co Ltd, Sanyo Electric Co Ltd filed Critical Tokyo Sanyo Electric Co Ltd
Priority to JP59185643A priority Critical patent/JPS6162985A/ja
Publication of JPS6162985A publication Critical patent/JPS6162985A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)産業上の利用分野 本発明は、手書き漢字を認識する文字認識システムに係
り、候補字種カテゴリーの認識順位決定方式に関する。
(ロ)従来の技術 一般に、文字認識システムでは、入力文字パターンから
抽出した特徴パターンと、予め辞書部に登録された字種
カテゴリー毎の標準特徴パターンとの類似度を計算し、
類似度の大きいn個の候補字種カテゴリーを選択する。
そして、類似度の最も大きい候補字種カテゴリーを認識
結果として出力すると共に、誤認識の訂正のために、選
択したn個の候補字種カテゴリーには、類似度の大きい
順に第1位から第0位までの認識順位を決定しておく。
ところが、上述の如く、認識順位の決定に類似度のみを
用いていたのでは誤認識が多く、そこで、類似度による
複数の候補字種カテゴリーの選択後に、何らかの後処理
を施して認識順位を決定する方式が考えられるようにな
った。
そして、従来、後処理としては、特開昭59−3208
2号公報に開示されているように、文法的処理を行なう
ものや、特開昭59−27381号公報のように、被認
識文字の前後の文字が、漢字か、カタカナかあるいはひ
らがなかを判定するものが提案されていた。
0→ 発明が解決しようとする問題点 従来の技術においては、文法的処理を後処理として行な
うので、文法的な辞書等の知識部が莫大となり、更には
、その処理内容が非常に複雑になるという問題があり、
又、前後の文字が、漢字かカタカナか等を判定する方式
では、選択した候補字種カテゴリーが漢字やひらがなば
かりである場合には、認識率の向上は期待できなかった
に)問題点を解決するための手段 本発明は、字種カテゴリーの各々に、頻度に応じた優先
度を定めておき、計算により得られた類似度とこの優先
度とに基づいて、候補字種カテゴリーの認識順位を決定
するものである。
(羽 作用 本発明に依れば、類似度が大きく、且つ、頻繁に使用さ
れる字種カテゴリーの認識順位が上位に来るようになり
、又、知識部には、類似度と優先度との関係を記憶して
おけばよいこととなる。
(へ)実施例 第1図は、本発明を適用した文字認識システムのブロッ
ク図であり、(1)は入力用原稿に書かれた文字を読取
り、読取り結果を2値の文字パターンとして出力する文
字観測部、(2)は入力文字パターンから特徴パターン
を抽出する特徴抽出部、(3)は字種カテゴリー毎の標
準特徴パターンを記憶した辞書部、(4)は抽出した特
徴パターンと標準特徴パターンとのマツチングを行ない
、両パターンの類似度を計算するパターンマツチング部
である。
辞書部(3)の字種カテゴリーは、頻度の高いものをカ
テゴリーセット1、頻度の中位のものをカテゴリーセッ
ト2、頻度の低いものをカテゴリーセット3、というよ
うに頻度に応じてカテゴリー分けが為されており、各カ
テゴリーセット1〜3に順に優先度1〜3を定めている
パターンマツチング部(4)は、カテゴリーセット1〜
3に各々対応する3つの演算部(4a)〜(4c)を備
えており、各演算部は各カテゴリーセットの中から類似
度の大きい順にn個の候補字種カテゴリーを選択し、そ
の字種コード及び計算結果としての類似度を、候補メモ
1月5)に格納する。この際、演算部では対応するカテ
ゴリーセットの優先度を字種コード及び類似度に付加し
、これら3つの情報が各々の候補字種カテゴリーの情報
として候補メモ1月5)に記憶される。このようにして
、候補メモ1月5)には、各カテゴリーセットの中から
n個づつ、合計3n個の候補字種カテゴリーが記憶され
る。
知識部(6)には、類似度と優先度との関係が記憶され
ており、クラスタリング制御処理部(7)はこの知識部
(6)の内容を参照して、候補メモ1月51に記憶され
た30個の候補字種カテゴリーのうち上位n個の認識順
位を決定し、その字種コードを認識順位順に結果メモ1
月8)に格納する。例えば、類似度としてシティブロッ
ク距離り、を用い、この距離が小さいほど類似度が太き
いとすれば、知識部(6)には具体的には、第2図に示
すように、距離珈と優先度による認識順位の入れ換えの
可否の関係が記憶されている。
以下、具体例を上げて認識順位の決定の様子を説明する
先ず、字種コードがML、シティブロック距離がDi、
優先度がp (i :=a 、 b、  c・”−、P
 =2’ +2.3)の候補字種カテゴリーを(MLD
L、P)と表わすこととし、例えば、第3図(イ)に示
すように、カテゴリーセット1〜3の各々から、類似度
が上位5個づつの候補字種カテゴリーが選択され、各シ
ティブロック距離り、の関係が、Dv<DP〈D、、 
<DQ <Db <DIl <I)wであったとする。
すると、従来の如くシティブロック距離の大小だけから
では、認識順位は第3図(ロ)に示すようになる。
ところが、今、知識部(6)における閾値り、、D、。
D、と計算したシティブロック距離の関係が、DI<D
VI Da(D2 <DQI Dw <Dsであったと
すると、クラスタリング制御処理部(7)は、字種コー
ドMv。
M、 、M、をBランクに、そして、字種コードM0゜
Mb MR9MwをCランクにランク分けし、これらの
ランク内で優先度による認識順位の入れ換えを行なうた
め、第3図P→に示すように、各ランク内では優先度の
高い字種コードが上位に来ることとなり、結果として、
類似度と優先度に基づく認識順位が決定される。そして
、゛上位5個の字種コードM、 、 M、 、 Mv、
 Mb 、 MQが順に結果メモ1月8)に記憶され、
答出力制御部(9)は、第1位の字種コードM、をワー
プロあるいはパソコン等の文字表示装置に認識結果とし
て送出し、その字種の表示が行なわれる。このとき、も
し誤認識であれば次の認識順位の字種コードを送出し、
以下、正しい認識結果が得られるまで順次、次の順位の
字種コードが送出される。
従って、類似度が大きく;且つ、頻度の高い候補字種カ
テゴリーが優先されることとなり、このような文字の認
識順位が高くなり、認識率が向上する・・ 又、他の例として、シティブロック距離Dvが他の候補
と比べて十分小さく Dv<DIであり、D。
<Dr 、:ob <D2である場合は、字種コードM
vはパランクにランクされ認識順位の入れ換えは行なわ
れず、Bランクの字種コードMP2M12MQ9Mbが
優先度による順位入れ換えが行なわれ、その認識順位は
第3図に)のようになる。この場合も第3図(ロ)に比
較すれば、頻度の高い候補字種カテゴリーの認識順位が
上位に来ることとなる。
ところで、本実施例においては、字種カテゴリーを優先
度に応じたカテゴリーセットに予め分けておき、優先度
情報を得るようにしたが、辞書部(3)に標準特徴パタ
ーンと共に優先度情報を予め記憶しておいてもよい。
(ト)発明の効果 本発明に依れば、頻繁に使用される字種カテゴリーの認
識順位が上位に来るようになるので、認識率が向上し、
又、莫大な知識部を必要とせず、短かい処理時間で認識
順位を決定できる。
【図面の簡単な説明】
第1図は本発明を適用した文字認識システムのブロック
図、第2図は知識部の内容を示す説明図、第3図(イ)
〜に)は認識順位決定の具体例を示す説明図である。 主な図番の説明 (1)・・・文字観測部、 (2)・・・特徴抽出部、
 (3)・・・辞書部、 (4)・・・パターンマツチ
ング部、 (5)・・・候補メモリ、 (6)・・・知
識部、 (7)・・・クラスタリング制御処理部、 (
8)・・・結果メモリ、 (9)・・・答出力制御部。 出願人 三洋電機株式会社 外1名 代理人 弁理士  佐 野 静 夫 @l  r:?1 (口’)Mv、MP 1Ma 、 MQ、 Mb 、 MP 、 MW; (−’)   Mv 、 + Ma 、  M+A−7
シフーラに−1 )、  Mp 、 Ma’ 3う〉ウ −一−一一一

Claims (1)

    【特許請求の範囲】
  1. (1)入力文字パターンから抽出した特徴パターンと、
    予め辞書部に登録された字種カテゴリー毎の標準特徴パ
    ターンとの類似度を計算し、複数の候補字種カテゴリー
    を選択する文字認識システムにおいて、前記字種カテゴ
    リーの各々に頻度に応じた優先度を定め、前記計算によ
    り得られた類似度と該優先度に基づいて前記複数の候補
    字種カテゴリーの認識順位を決定するようにしたことを
    特徴とする認識順位決定方式。
JP59185643A 1984-09-04 1984-09-04 認識順位決定方式 Pending JPS6162985A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59185643A JPS6162985A (ja) 1984-09-04 1984-09-04 認識順位決定方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59185643A JPS6162985A (ja) 1984-09-04 1984-09-04 認識順位決定方式

Publications (1)

Publication Number Publication Date
JPS6162985A true JPS6162985A (ja) 1986-03-31

Family

ID=16174357

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59185643A Pending JPS6162985A (ja) 1984-09-04 1984-09-04 認識順位決定方式

Country Status (1)

Country Link
JP (1) JPS6162985A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6465680A (en) * 1987-09-04 1989-03-10 Fujitsu Ltd Character recognizing system

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57209575A (en) * 1981-06-19 1982-12-22 Fujitsu Ltd Character recognizing device

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57209575A (en) * 1981-06-19 1982-12-22 Fujitsu Ltd Character recognizing device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6465680A (en) * 1987-09-04 1989-03-10 Fujitsu Ltd Character recognizing system

Similar Documents

Publication Publication Date Title
JP3981734B2 (ja) 質問応答システムおよび質問応答処理方法
JP2005228328A (ja) デジタルインク質疑検索装置及びその方法
CN115618019B (zh) 知识图谱构建方法、装置及终端设备
CN112559324A (zh) 一种基于应用内视觉挖掘的软件测试用例生成方法
CN113779268A (zh) 数据处理方法、装置、设备和存储介质
JPS6162985A (ja) 認識順位決定方式
US6320985B1 (en) Apparatus and method for augmenting data in handwriting recognition system
CN117634474A (zh) 一种应用于中日文本的语种识别方法及相关设备
JPH09325962A (ja) 文書校正装置およびプログラム記憶媒体
JPH0247788B2 (ja)
JPS5882373A (ja) オンライン文字認識方法
JPH0896081A (ja) 文字認識装置及び文字認識方法
JPS6162986A (ja) 認識順位決定方式
JPH08512162A (ja) 筆記体の書込み分析方法
JPS5842904B2 (ja) 手書きカナ・漢字の文字認識装置
JPS6168679A (ja) 認識順位決定方式
KR100255640B1 (ko) 문자 인식 방법
JP3763262B2 (ja) 手書文字認識装置
JPS59221732A (ja) カナ漢字変換処理装置
KR930012140B1 (ko) 자소 오토마타를 이용한 온라인 필기체 문자인식 방법
JPH04115383A (ja) オンライン手書き文字認識装置の文字認識方式
JPS60134992A (ja) 文字入力装置
JP2025077540A (ja) 複合語検出装置及び複合語検出方法
JP2024030779A (ja) 文字入力装置、文字入力方法、および文字入力プログラム
JPH0338630B2 (ja)