JPS6162985A - 認識順位決定方式 - Google Patents
認識順位決定方式Info
- Publication number
- JPS6162985A JPS6162985A JP59185643A JP18564384A JPS6162985A JP S6162985 A JPS6162985 A JP S6162985A JP 59185643 A JP59185643 A JP 59185643A JP 18564384 A JP18564384 A JP 18564384A JP S6162985 A JPS6162985 A JP S6162985A
- Authority
- JP
- Japan
- Prior art keywords
- character type
- recognition
- character
- resemblance
- candidate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012545 processing Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 4
- 238000000034 method Methods 0.000 description 4
- 238000012805 post-processing Methods 0.000 description 3
- 238000000605 extraction Methods 0.000 description 2
- 102100030551 Protein MEMO1 Human genes 0.000 description 1
- 101710176845 Protein MEMO1 Proteins 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
Landscapes
- Character Discrimination (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
(イ)産業上の利用分野
本発明は、手書き漢字を認識する文字認識システムに係
り、候補字種カテゴリーの認識順位決定方式に関する。
り、候補字種カテゴリーの認識順位決定方式に関する。
(ロ)従来の技術
一般に、文字認識システムでは、入力文字パターンから
抽出した特徴パターンと、予め辞書部に登録された字種
カテゴリー毎の標準特徴パターンとの類似度を計算し、
類似度の大きいn個の候補字種カテゴリーを選択する。
抽出した特徴パターンと、予め辞書部に登録された字種
カテゴリー毎の標準特徴パターンとの類似度を計算し、
類似度の大きいn個の候補字種カテゴリーを選択する。
そして、類似度の最も大きい候補字種カテゴリーを認識
結果として出力すると共に、誤認識の訂正のために、選
択したn個の候補字種カテゴリーには、類似度の大きい
順に第1位から第0位までの認識順位を決定しておく。
結果として出力すると共に、誤認識の訂正のために、選
択したn個の候補字種カテゴリーには、類似度の大きい
順に第1位から第0位までの認識順位を決定しておく。
ところが、上述の如く、認識順位の決定に類似度のみを
用いていたのでは誤認識が多く、そこで、類似度による
複数の候補字種カテゴリーの選択後に、何らかの後処理
を施して認識順位を決定する方式が考えられるようにな
った。
用いていたのでは誤認識が多く、そこで、類似度による
複数の候補字種カテゴリーの選択後に、何らかの後処理
を施して認識順位を決定する方式が考えられるようにな
った。
そして、従来、後処理としては、特開昭59−3208
2号公報に開示されているように、文法的処理を行なう
ものや、特開昭59−27381号公報のように、被認
識文字の前後の文字が、漢字か、カタカナかあるいはひ
らがなかを判定するものが提案されていた。
2号公報に開示されているように、文法的処理を行なう
ものや、特開昭59−27381号公報のように、被認
識文字の前後の文字が、漢字か、カタカナかあるいはひ
らがなかを判定するものが提案されていた。
0→ 発明が解決しようとする問題点
従来の技術においては、文法的処理を後処理として行な
うので、文法的な辞書等の知識部が莫大となり、更には
、その処理内容が非常に複雑になるという問題があり、
又、前後の文字が、漢字かカタカナか等を判定する方式
では、選択した候補字種カテゴリーが漢字やひらがなば
かりである場合には、認識率の向上は期待できなかった
。
うので、文法的な辞書等の知識部が莫大となり、更には
、その処理内容が非常に複雑になるという問題があり、
又、前後の文字が、漢字かカタカナか等を判定する方式
では、選択した候補字種カテゴリーが漢字やひらがなば
かりである場合には、認識率の向上は期待できなかった
。
に)問題点を解決するための手段
本発明は、字種カテゴリーの各々に、頻度に応じた優先
度を定めておき、計算により得られた類似度とこの優先
度とに基づいて、候補字種カテゴリーの認識順位を決定
するものである。
度を定めておき、計算により得られた類似度とこの優先
度とに基づいて、候補字種カテゴリーの認識順位を決定
するものである。
(羽 作用
本発明に依れば、類似度が大きく、且つ、頻繁に使用さ
れる字種カテゴリーの認識順位が上位に来るようになり
、又、知識部には、類似度と優先度との関係を記憶して
おけばよいこととなる。
れる字種カテゴリーの認識順位が上位に来るようになり
、又、知識部には、類似度と優先度との関係を記憶して
おけばよいこととなる。
(へ)実施例
第1図は、本発明を適用した文字認識システムのブロッ
ク図であり、(1)は入力用原稿に書かれた文字を読取
り、読取り結果を2値の文字パターンとして出力する文
字観測部、(2)は入力文字パターンから特徴パターン
を抽出する特徴抽出部、(3)は字種カテゴリー毎の標
準特徴パターンを記憶した辞書部、(4)は抽出した特
徴パターンと標準特徴パターンとのマツチングを行ない
、両パターンの類似度を計算するパターンマツチング部
である。
ク図であり、(1)は入力用原稿に書かれた文字を読取
り、読取り結果を2値の文字パターンとして出力する文
字観測部、(2)は入力文字パターンから特徴パターン
を抽出する特徴抽出部、(3)は字種カテゴリー毎の標
準特徴パターンを記憶した辞書部、(4)は抽出した特
徴パターンと標準特徴パターンとのマツチングを行ない
、両パターンの類似度を計算するパターンマツチング部
である。
辞書部(3)の字種カテゴリーは、頻度の高いものをカ
テゴリーセット1、頻度の中位のものをカテゴリーセッ
ト2、頻度の低いものをカテゴリーセット3、というよ
うに頻度に応じてカテゴリー分けが為されており、各カ
テゴリーセット1〜3に順に優先度1〜3を定めている
。
テゴリーセット1、頻度の中位のものをカテゴリーセッ
ト2、頻度の低いものをカテゴリーセット3、というよ
うに頻度に応じてカテゴリー分けが為されており、各カ
テゴリーセット1〜3に順に優先度1〜3を定めている
。
パターンマツチング部(4)は、カテゴリーセット1〜
3に各々対応する3つの演算部(4a)〜(4c)を備
えており、各演算部は各カテゴリーセットの中から類似
度の大きい順にn個の候補字種カテゴリーを選択し、そ
の字種コード及び計算結果としての類似度を、候補メモ
1月5)に格納する。この際、演算部では対応するカテ
ゴリーセットの優先度を字種コード及び類似度に付加し
、これら3つの情報が各々の候補字種カテゴリーの情報
として候補メモ1月5)に記憶される。このようにして
、候補メモ1月5)には、各カテゴリーセットの中から
n個づつ、合計3n個の候補字種カテゴリーが記憶され
る。
3に各々対応する3つの演算部(4a)〜(4c)を備
えており、各演算部は各カテゴリーセットの中から類似
度の大きい順にn個の候補字種カテゴリーを選択し、そ
の字種コード及び計算結果としての類似度を、候補メモ
1月5)に格納する。この際、演算部では対応するカテ
ゴリーセットの優先度を字種コード及び類似度に付加し
、これら3つの情報が各々の候補字種カテゴリーの情報
として候補メモ1月5)に記憶される。このようにして
、候補メモ1月5)には、各カテゴリーセットの中から
n個づつ、合計3n個の候補字種カテゴリーが記憶され
る。
知識部(6)には、類似度と優先度との関係が記憶され
ており、クラスタリング制御処理部(7)はこの知識部
(6)の内容を参照して、候補メモ1月51に記憶され
た30個の候補字種カテゴリーのうち上位n個の認識順
位を決定し、その字種コードを認識順位順に結果メモ1
月8)に格納する。例えば、類似度としてシティブロッ
ク距離り、を用い、この距離が小さいほど類似度が太き
いとすれば、知識部(6)には具体的には、第2図に示
すように、距離珈と優先度による認識順位の入れ換えの
可否の関係が記憶されている。
ており、クラスタリング制御処理部(7)はこの知識部
(6)の内容を参照して、候補メモ1月51に記憶され
た30個の候補字種カテゴリーのうち上位n個の認識順
位を決定し、その字種コードを認識順位順に結果メモ1
月8)に格納する。例えば、類似度としてシティブロッ
ク距離り、を用い、この距離が小さいほど類似度が太き
いとすれば、知識部(6)には具体的には、第2図に示
すように、距離珈と優先度による認識順位の入れ換えの
可否の関係が記憶されている。
以下、具体例を上げて認識順位の決定の様子を説明する
。
。
先ず、字種コードがML、シティブロック距離がDi、
優先度がp (i :=a 、 b、 c・”−、P
=2’ +2.3)の候補字種カテゴリーを(MLD
L、P)と表わすこととし、例えば、第3図(イ)に示
すように、カテゴリーセット1〜3の各々から、類似度
が上位5個づつの候補字種カテゴリーが選択され、各シ
ティブロック距離り、の関係が、Dv<DP〈D、、
<DQ <Db <DIl <I)wであったとする。
優先度がp (i :=a 、 b、 c・”−、P
=2’ +2.3)の候補字種カテゴリーを(MLD
L、P)と表わすこととし、例えば、第3図(イ)に示
すように、カテゴリーセット1〜3の各々から、類似度
が上位5個づつの候補字種カテゴリーが選択され、各シ
ティブロック距離り、の関係が、Dv<DP〈D、、
<DQ <Db <DIl <I)wであったとする。
すると、従来の如くシティブロック距離の大小だけから
では、認識順位は第3図(ロ)に示すようになる。
では、認識順位は第3図(ロ)に示すようになる。
ところが、今、知識部(6)における閾値り、、D、。
D、と計算したシティブロック距離の関係が、DI<D
VI Da(D2 <DQI Dw <Dsであったと
すると、クラスタリング制御処理部(7)は、字種コー
ドMv。
VI Da(D2 <DQI Dw <Dsであったと
すると、クラスタリング制御処理部(7)は、字種コー
ドMv。
M、 、M、をBランクに、そして、字種コードM0゜
Mb MR9MwをCランクにランク分けし、これらの
ランク内で優先度による認識順位の入れ換えを行なうた
め、第3図P→に示すように、各ランク内では優先度の
高い字種コードが上位に来ることとなり、結果として、
類似度と優先度に基づく認識順位が決定される。そして
、゛上位5個の字種コードM、 、 M、 、 Mv、
Mb 、 MQが順に結果メモ1月8)に記憶され、
答出力制御部(9)は、第1位の字種コードM、をワー
プロあるいはパソコン等の文字表示装置に認識結果とし
て送出し、その字種の表示が行なわれる。このとき、も
し誤認識であれば次の認識順位の字種コードを送出し、
以下、正しい認識結果が得られるまで順次、次の順位の
字種コードが送出される。
Mb MR9MwをCランクにランク分けし、これらの
ランク内で優先度による認識順位の入れ換えを行なうた
め、第3図P→に示すように、各ランク内では優先度の
高い字種コードが上位に来ることとなり、結果として、
類似度と優先度に基づく認識順位が決定される。そして
、゛上位5個の字種コードM、 、 M、 、 Mv、
Mb 、 MQが順に結果メモ1月8)に記憶され、
答出力制御部(9)は、第1位の字種コードM、をワー
プロあるいはパソコン等の文字表示装置に認識結果とし
て送出し、その字種の表示が行なわれる。このとき、も
し誤認識であれば次の認識順位の字種コードを送出し、
以下、正しい認識結果が得られるまで順次、次の順位の
字種コードが送出される。
従って、類似度が大きく;且つ、頻度の高い候補字種カ
テゴリーが優先されることとなり、このような文字の認
識順位が高くなり、認識率が向上する・・ 又、他の例として、シティブロック距離Dvが他の候補
と比べて十分小さく Dv<DIであり、D。
テゴリーが優先されることとなり、このような文字の認
識順位が高くなり、認識率が向上する・・ 又、他の例として、シティブロック距離Dvが他の候補
と比べて十分小さく Dv<DIであり、D。
<Dr 、:ob <D2である場合は、字種コードM
vはパランクにランクされ認識順位の入れ換えは行なわ
れず、Bランクの字種コードMP2M12MQ9Mbが
優先度による順位入れ換えが行なわれ、その認識順位は
第3図に)のようになる。この場合も第3図(ロ)に比
較すれば、頻度の高い候補字種カテゴリーの認識順位が
上位に来ることとなる。
vはパランクにランクされ認識順位の入れ換えは行なわ
れず、Bランクの字種コードMP2M12MQ9Mbが
優先度による順位入れ換えが行なわれ、その認識順位は
第3図に)のようになる。この場合も第3図(ロ)に比
較すれば、頻度の高い候補字種カテゴリーの認識順位が
上位に来ることとなる。
ところで、本実施例においては、字種カテゴリーを優先
度に応じたカテゴリーセットに予め分けておき、優先度
情報を得るようにしたが、辞書部(3)に標準特徴パタ
ーンと共に優先度情報を予め記憶しておいてもよい。
度に応じたカテゴリーセットに予め分けておき、優先度
情報を得るようにしたが、辞書部(3)に標準特徴パタ
ーンと共に優先度情報を予め記憶しておいてもよい。
(ト)発明の効果
本発明に依れば、頻繁に使用される字種カテゴリーの認
識順位が上位に来るようになるので、認識率が向上し、
又、莫大な知識部を必要とせず、短かい処理時間で認識
順位を決定できる。
識順位が上位に来るようになるので、認識率が向上し、
又、莫大な知識部を必要とせず、短かい処理時間で認識
順位を決定できる。
第1図は本発明を適用した文字認識システムのブロック
図、第2図は知識部の内容を示す説明図、第3図(イ)
〜に)は認識順位決定の具体例を示す説明図である。 主な図番の説明 (1)・・・文字観測部、 (2)・・・特徴抽出部、
(3)・・・辞書部、 (4)・・・パターンマツチ
ング部、 (5)・・・候補メモリ、 (6)・・・知
識部、 (7)・・・クラスタリング制御処理部、 (
8)・・・結果メモリ、 (9)・・・答出力制御部。 出願人 三洋電機株式会社 外1名 代理人 弁理士 佐 野 静 夫 @l r:?1 (口’)Mv、MP 1Ma 、 MQ、 Mb 、 MP 、 MW; (−’) Mv 、 + Ma 、 M+A−7
シフーラに−1 )、 Mp 、 Ma’ 3う〉ウ −一−一一一
図、第2図は知識部の内容を示す説明図、第3図(イ)
〜に)は認識順位決定の具体例を示す説明図である。 主な図番の説明 (1)・・・文字観測部、 (2)・・・特徴抽出部、
(3)・・・辞書部、 (4)・・・パターンマツチ
ング部、 (5)・・・候補メモリ、 (6)・・・知
識部、 (7)・・・クラスタリング制御処理部、 (
8)・・・結果メモリ、 (9)・・・答出力制御部。 出願人 三洋電機株式会社 外1名 代理人 弁理士 佐 野 静 夫 @l r:?1 (口’)Mv、MP 1Ma 、 MQ、 Mb 、 MP 、 MW; (−’) Mv 、 + Ma 、 M+A−7
シフーラに−1 )、 Mp 、 Ma’ 3う〉ウ −一−一一一
Claims (1)
- (1)入力文字パターンから抽出した特徴パターンと、
予め辞書部に登録された字種カテゴリー毎の標準特徴パ
ターンとの類似度を計算し、複数の候補字種カテゴリー
を選択する文字認識システムにおいて、前記字種カテゴ
リーの各々に頻度に応じた優先度を定め、前記計算によ
り得られた類似度と該優先度に基づいて前記複数の候補
字種カテゴリーの認識順位を決定するようにしたことを
特徴とする認識順位決定方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59185643A JPS6162985A (ja) | 1984-09-04 | 1984-09-04 | 認識順位決定方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59185643A JPS6162985A (ja) | 1984-09-04 | 1984-09-04 | 認識順位決定方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS6162985A true JPS6162985A (ja) | 1986-03-31 |
Family
ID=16174357
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59185643A Pending JPS6162985A (ja) | 1984-09-04 | 1984-09-04 | 認識順位決定方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6162985A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6465680A (en) * | 1987-09-04 | 1989-03-10 | Fujitsu Ltd | Character recognizing system |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS57209575A (en) * | 1981-06-19 | 1982-12-22 | Fujitsu Ltd | Character recognizing device |
-
1984
- 1984-09-04 JP JP59185643A patent/JPS6162985A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS57209575A (en) * | 1981-06-19 | 1982-12-22 | Fujitsu Ltd | Character recognizing device |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6465680A (en) * | 1987-09-04 | 1989-03-10 | Fujitsu Ltd | Character recognizing system |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3981734B2 (ja) | 質問応答システムおよび質問応答処理方法 | |
| JP2005228328A (ja) | デジタルインク質疑検索装置及びその方法 | |
| CN115618019B (zh) | 知识图谱构建方法、装置及终端设备 | |
| CN112559324A (zh) | 一种基于应用内视觉挖掘的软件测试用例生成方法 | |
| CN113779268A (zh) | 数据处理方法、装置、设备和存储介质 | |
| JPS6162985A (ja) | 認識順位決定方式 | |
| US6320985B1 (en) | Apparatus and method for augmenting data in handwriting recognition system | |
| CN117634474A (zh) | 一种应用于中日文本的语种识别方法及相关设备 | |
| JPH09325962A (ja) | 文書校正装置およびプログラム記憶媒体 | |
| JPH0247788B2 (ja) | ||
| JPS5882373A (ja) | オンライン文字認識方法 | |
| JPH0896081A (ja) | 文字認識装置及び文字認識方法 | |
| JPS6162986A (ja) | 認識順位決定方式 | |
| JPH08512162A (ja) | 筆記体の書込み分析方法 | |
| JPS5842904B2 (ja) | 手書きカナ・漢字の文字認識装置 | |
| JPS6168679A (ja) | 認識順位決定方式 | |
| KR100255640B1 (ko) | 문자 인식 방법 | |
| JP3763262B2 (ja) | 手書文字認識装置 | |
| JPS59221732A (ja) | カナ漢字変換処理装置 | |
| KR930012140B1 (ko) | 자소 오토마타를 이용한 온라인 필기체 문자인식 방법 | |
| JPH04115383A (ja) | オンライン手書き文字認識装置の文字認識方式 | |
| JPS60134992A (ja) | 文字入力装置 | |
| JP2025077540A (ja) | 複合語検出装置及び複合語検出方法 | |
| JP2024030779A (ja) | 文字入力装置、文字入力方法、および文字入力プログラム | |
| JPH0338630B2 (ja) |