JPH0337231B2 - - Google Patents
Info
- Publication number
- JPH0337231B2 JPH0337231B2 JP59190963A JP19096384A JPH0337231B2 JP H0337231 B2 JPH0337231 B2 JP H0337231B2 JP 59190963 A JP59190963 A JP 59190963A JP 19096384 A JP19096384 A JP 19096384A JP H0337231 B2 JPH0337231 B2 JP H0337231B2
- Authority
- JP
- Japan
- Prior art keywords
- character type
- recognition
- priority
- similarity
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Classifications
-
- H—ELECTRICITY
- H10—SEMICONDUCTOR DEVICES; ELECTRIC SOLID-STATE DEVICES NOT OTHERWISE PROVIDED FOR
- H10W—GENERIC PACKAGES, INTERCONNECTIONS, CONNECTORS OR OTHER CONSTRUCTIONAL DETAILS OF DEVICES COVERED BY CLASS H10
- H10W72/00—Interconnections or connectors in packages
Landscapes
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
(イ) 産業上の利用分野
本発明は、手書き漢字を認識する文字認識シス
テムに係り、候補字種カテゴリーの認識順位決定
方式に関する。
テムに係り、候補字種カテゴリーの認識順位決定
方式に関する。
(ロ) 従来の技術
一般に、文字認識システムでは、入力文字パタ
ーンから抽出した特徴パターンと、予め辞書部に
登録された字種カテゴリー毎の標準特徴パターン
との類似度を計算し、類似度の大きいn個の候補
字種カテゴリーを選択する。そして、類似度の最
も大きい候補字種カテゴリーを認識結果として出
力すると共に、誤認識の訂正のために、選択した
n個の候補字種カテゴリーには、類似度の大きい
順に第1位から第n位までの認識順位を決定して
おく。
ーンから抽出した特徴パターンと、予め辞書部に
登録された字種カテゴリー毎の標準特徴パターン
との類似度を計算し、類似度の大きいn個の候補
字種カテゴリーを選択する。そして、類似度の最
も大きい候補字種カテゴリーを認識結果として出
力すると共に、誤認識の訂正のために、選択した
n個の候補字種カテゴリーには、類似度の大きい
順に第1位から第n位までの認識順位を決定して
おく。
ところが、上述の如く、認識順位の決定に類似
度のみを用いていたのでは誤認識が多く、そこ
で、類似度による複数の候補字種カテゴリーの選
択後に、何らかの後処理を施して認識順位を決定
する方式が考えられるようになつた。
度のみを用いていたのでは誤認識が多く、そこ
で、類似度による複数の候補字種カテゴリーの選
択後に、何らかの後処理を施して認識順位を決定
する方式が考えられるようになつた。
そして、従来、後処理としては、特開昭59−
32082号公報に開示されているように、文法的処
理を行なうものや、特開昭59−27381号公報のよ
うに、被認識文字の前後の文字が、漢字か、カタ
カナかあるいはひらがなかを判定するものが提案
されていた。
32082号公報に開示されているように、文法的処
理を行なうものや、特開昭59−27381号公報のよ
うに、被認識文字の前後の文字が、漢字か、カタ
カナかあるいはひらがなかを判定するものが提案
されていた。
(ハ) 発明が解決しようとする問題点
従来の技術においては、文法的処理を後処理と
して行なうので、文法的な辞書等の知識部が莫大
となり、更には、その処理内容が非常に複雑にな
るという問題があり、又、前後の文字が、漢字か
カタカナか等を判定する方式では、選択した候補
字種カテゴリーが漢字やひらがなばかりである場
合には、認識率の向上は期待できなかつた。
して行なうので、文法的な辞書等の知識部が莫大
となり、更には、その処理内容が非常に複雑にな
るという問題があり、又、前後の文字が、漢字か
カタカナか等を判定する方式では、選択した候補
字種カテゴリーが漢字やひらがなばかりである場
合には、認識率の向上は期待できなかつた。
そこで、本願出願人は、莫大な知識部を必要と
せず、短かい処理時間で認識率を向上させるた
め、学校教育の学習段階あるいは頻度等に応じ
て、字種カテゴリーの各々に優先度を定めてお
き、この優先度を用いて類似度計算により得られ
た複数の候補字種カテゴリーの認識順位を決定し
ようとしたが、類似度と優先度の兼ね合いにより
認識率が変わるので、この兼ね合いをいかにうま
く設定するかということが問題となつてきた。
せず、短かい処理時間で認識率を向上させるた
め、学校教育の学習段階あるいは頻度等に応じ
て、字種カテゴリーの各々に優先度を定めてお
き、この優先度を用いて類似度計算により得られ
た複数の候補字種カテゴリーの認識順位を決定し
ようとしたが、類似度と優先度の兼ね合いにより
認識率が変わるので、この兼ね合いをいかにうま
く設定するかということが問題となつてきた。
(ニ) 問題点を解決するための手段
本発明は、字種カテゴリーの各々に優先度を定
めておき、類似度は所定値より大きい候補字種カ
テゴリーについては、優先度による認識順位の入
れ換えを行なわず、所定値より小さい候補字種カ
テゴリーについてのみ優先度による認識順位の入
れ換えを行なつて、認識順位を決定するものであ
る。
めておき、類似度は所定値より大きい候補字種カ
テゴリーについては、優先度による認識順位の入
れ換えを行なわず、所定値より小さい候補字種カ
テゴリーについてのみ優先度による認識順位の入
れ換えを行なつて、認識順位を決定するものであ
る。
(ホ) 作用
本発明では、類似度が大きいものについては、
優先度が無視されて類似度のみにより認識順位が
決定され、類似度が小さいものについては、優先
度により順位が決定されることとなり、このた
め、抽出した特徴パターンとよく似た特徴パター
ンの候補字種カテゴリーは、従来と全く同様の認
識順位となり、あまり似ていない候補字種カテゴ
リーでは、優先度が考慮され認識率が向上する。
優先度が無視されて類似度のみにより認識順位が
決定され、類似度が小さいものについては、優先
度により順位が決定されることとなり、このた
め、抽出した特徴パターンとよく似た特徴パター
ンの候補字種カテゴリーは、従来と全く同様の認
識順位となり、あまり似ていない候補字種カテゴ
リーでは、優先度が考慮され認識率が向上する。
(ヘ) 実施例
第1図は、本発明を適用した文字認識システム
のブロツク図であり、1は入力用原稿に書かれた
文字を読み取り、読取り結果を2値の文字パター
ンとして出力する文字観測部、2は入力文字パタ
ーンから特徴パターンを抽出する特徴抽出部、3
は字種カテゴリー毎の標準特徴パターンを記憶し
た辞書部、4は抽出した特徴パターンと標準特徴
パターンとのマツチングを行ない、両パターンの
類似度を計算するパターンマツチング部である。
のブロツク図であり、1は入力用原稿に書かれた
文字を読み取り、読取り結果を2値の文字パター
ンとして出力する文字観測部、2は入力文字パタ
ーンから特徴パターンを抽出する特徴抽出部、3
は字種カテゴリー毎の標準特徴パターンを記憶し
た辞書部、4は抽出した特徴パターンと標準特徴
パターンとのマツチングを行ない、両パターンの
類似度を計算するパターンマツチング部である。
辞書部3の字種カテゴリーは、頻度あるいは学
校教育の学習段階に応じたカテゴリー分けが為さ
れており、各カテゴリーセツトが優先度が定めら
れている。例えば、第2図に示すように、小学校
1〜3年で学習する字種カテゴリーをカテゴリー
セツト1(3a)、小学校4〜6年で学習する字種
カテゴリーをカテゴリーセツト2(3b)、中学校
以上で学習する字種カテゴリーをカテゴリーセツ
ト3(3c)、というように全ての字種カテゴリー
を3つのカテゴリーセツトに分け、カテゴリーセ
ツト1〜3に順に優先度0〜2を定めている。
校教育の学習段階に応じたカテゴリー分けが為さ
れており、各カテゴリーセツトが優先度が定めら
れている。例えば、第2図に示すように、小学校
1〜3年で学習する字種カテゴリーをカテゴリー
セツト1(3a)、小学校4〜6年で学習する字種
カテゴリーをカテゴリーセツト2(3b)、中学校
以上で学習する字種カテゴリーをカテゴリーセツ
ト3(3c)、というように全ての字種カテゴリー
を3つのカテゴリーセツトに分け、カテゴリーセ
ツト1〜3に順に優先度0〜2を定めている。
パターンマツチング部4は、カテゴリーセツト
1〜3に各々対応する3つの演算部4a〜4cを
備えており、各演算部は各カテゴリーセツトの中
から類似度の大きい順にn個の候補字種カテゴリ
ーを選択し、その字種コード及び計算結果として
の類似度を、候補メモリ5に格納する。この際、
演算部では対応するカテゴリーセツトの優先度を
字種コード及び類似度に付加し、これら3つの情
報が各々の候補字種カテゴリーの情報として候補
メモリ5に記憶される。このようにして、候補メ
モリ5には、各カテゴリーセツトの中からn個づ
つ、合計3n個の候補字種カテゴリーが記憶され
る。
1〜3に各々対応する3つの演算部4a〜4cを
備えており、各演算部は各カテゴリーセツトの中
から類似度の大きい順にn個の候補字種カテゴリ
ーを選択し、その字種コード及び計算結果として
の類似度を、候補メモリ5に格納する。この際、
演算部では対応するカテゴリーセツトの優先度を
字種コード及び類似度に付加し、これら3つの情
報が各々の候補字種カテゴリーの情報として候補
メモリ5に記憶される。このようにして、候補メ
モリ5には、各カテゴリーセツトの中からn個づ
つ、合計3n個の候補字種カテゴリーが記憶され
る。
更に、第1図において、6は類似度と優先度と
の関係を記憶した知識部、7はこの知識部6の内
容を参照して、候補メモリ5に記憶された3n個
の候補字種カテゴリーのうち上位n個の認識順位
を決定し、その字種コードを認識順位順に結果メ
モリ8に格納するクラスタリング制御処理部であ
つて、答出力制御部9は、認識順位が第1位の字
種コードを認識結果としてワープロあるいはパソ
コン等の文字表示装置に出力し、その字種の表示
を行なわせる。そして、答出力制御部9は、オペ
レータから誤認識の指示があれば、第2位以下の
字種コードを順次出力し、正しい認識結果が表示
されるように出力の制御を行なう。
の関係を記憶した知識部、7はこの知識部6の内
容を参照して、候補メモリ5に記憶された3n個
の候補字種カテゴリーのうち上位n個の認識順位
を決定し、その字種コードを認識順位順に結果メ
モリ8に格納するクラスタリング制御処理部であ
つて、答出力制御部9は、認識順位が第1位の字
種コードを認識結果としてワープロあるいはパソ
コン等の文字表示装置に出力し、その字種の表示
を行なわせる。そして、答出力制御部9は、オペ
レータから誤認識の指示があれば、第2位以下の
字種コードを順次出力し、正しい認識結果が表示
されるように出力の制御を行なう。
次に、クラスタリング制御処理部7の処理及び
知識部6の内容について、更に詳しく説明する。
知識部6の内容について、更に詳しく説明する。
本実施例では、類似度としてシテイブロツク距
離dを用い、この距離が小さいほど類似度が大き
いとしており、知識部6には、各候補字種カテゴ
リーのシテイブロツク距離dを比較するための複
数の閾値D〓,D〓,D〓(D〓<D〓<D〓)が記憶されて
いる。クラスタリング制御処理部7は、第3図の
フロチヤートに示すように、先ず、候補メモリ5
に記憶された3n個の候補字種カテゴリーの中か
ら、距離が小さい順にn個の候補字種カテゴリー
M1,M2,……、Moを選択し、これらを作業メ
モリ7aに記憶する。そして、これらn個の候補
字種カテゴリーの各々の距離d1,d2,……,doを
複数の閾値D〓,D〓,D〓と比較することにより、
候補字種カテゴリーM1〜Moのクラス分けを行な
う。即ち、第4図に示すように、A、B、C、D
の4つのクラスに分ける。知識部6には、第4図
に示すように、各クラスにおける優先度による順
位入れ換えの可否が予め記憶されており、Aクラ
スでは優先度による順位入れ換えを行なわず、B
及びCクラスでは同じクラス内のみで優先度によ
る順位入れ換えを行なうように定めている。そし
て、クラスタリング制御処理部7はこの知識部6
の内容を参照し認識順位の決定を行なう。
離dを用い、この距離が小さいほど類似度が大き
いとしており、知識部6には、各候補字種カテゴ
リーのシテイブロツク距離dを比較するための複
数の閾値D〓,D〓,D〓(D〓<D〓<D〓)が記憶されて
いる。クラスタリング制御処理部7は、第3図の
フロチヤートに示すように、先ず、候補メモリ5
に記憶された3n個の候補字種カテゴリーの中か
ら、距離が小さい順にn個の候補字種カテゴリー
M1,M2,……、Moを選択し、これらを作業メ
モリ7aに記憶する。そして、これらn個の候補
字種カテゴリーの各々の距離d1,d2,……,doを
複数の閾値D〓,D〓,D〓と比較することにより、
候補字種カテゴリーM1〜Moのクラス分けを行な
う。即ち、第4図に示すように、A、B、C、D
の4つのクラスに分ける。知識部6には、第4図
に示すように、各クラスにおける優先度による順
位入れ換えの可否が予め記憶されており、Aクラ
スでは優先度による順位入れ換えを行なわず、B
及びCクラスでは同じクラス内のみで優先度によ
る順位入れ換えを行なうように定めている。そし
て、クラスタリング制御処理部7はこの知識部6
の内容を参照し認識順位の決定を行なう。
ここで、字種コードがM1、シテイブロツク距
離d1、優先度がP(I=A、B、C……、P=0、
1、2)の候補字種カテゴリーを(M1、d1、P)
と表わすこととし、今、仮に、第5図(イ)に示すよ
うに、カテゴリーセツト1〜3の各々から、類似
度が大きい上位5個づつの候補字種カテゴリーが
選択され、各シテイブロツク距離d1の関係が、dV
<dP<dA<dQ<dS<……であつたとすると、クラ
スタリング制御処理部7の作業メモリ7aには、
第5図(ロ)に示すような順に5個の字種コードMV
〜MSが選択記憶される。
離d1、優先度がP(I=A、B、C……、P=0、
1、2)の候補字種カテゴリーを(M1、d1、P)
と表わすこととし、今、仮に、第5図(イ)に示すよ
うに、カテゴリーセツト1〜3の各々から、類似
度が大きい上位5個づつの候補字種カテゴリーが
選択され、各シテイブロツク距離d1の関係が、dV
<dP<dA<dQ<dS<……であつたとすると、クラ
スタリング制御処理部7の作業メモリ7aには、
第5図(ロ)に示すような順に5個の字種コードMV
〜MSが選択記憶される。
そこで、例えば、字種コードMV及びMPのシテ
イブロツク距離dV及びdPが十分小さくdP<D〓であ
り、D〓<dA、dB<D〓であつたとすると、クラス
タリング制御処理部7は、字種コードMV、MPを
Aクラスに、字種コードMA、MQ、MBをBクラ
スにクラス分けし、Aクラスの字種コードMV、
MPについては優先度による認識順位の入れ換え
を行なわず、Bランクの字種コードMA、MQ、
MBについて優先度による認識順位の入れ換えを
行なうので、第5図(ハ)に示すように、優先度が
「2」、「1」と低くても類似度が大きい字種コー
ドMA、MQが第1位、第2位の順位に決定され、
類似度が小さいBクラスでは優先度が「0」と高
い字種コードMA、MBが上位に来て、全体の第3
位及び第4位となる。
イブロツク距離dV及びdPが十分小さくdP<D〓であ
り、D〓<dA、dB<D〓であつたとすると、クラス
タリング制御処理部7は、字種コードMV、MPを
Aクラスに、字種コードMA、MQ、MBをBクラ
スにクラス分けし、Aクラスの字種コードMV、
MPについては優先度による認識順位の入れ換え
を行なわず、Bランクの字種コードMA、MQ、
MBについて優先度による認識順位の入れ換えを
行なうので、第5図(ハ)に示すように、優先度が
「2」、「1」と低くても類似度が大きい字種コー
ドMA、MQが第1位、第2位の順位に決定され、
類似度が小さいBクラスでは優先度が「0」と高
い字種コードMA、MBが上位に来て、全体の第3
位及び第4位となる。
又、距離が極めて小さい候補がなく、D〓<dV、
dA<D〓<dQ、dB<D〓であつたとすると、クラス
タリング制御処理部7は、字種コードMV、MP、
MAをBクラスに、字種コードMQ、MBをCクラ
スにクラス分けし、これら各クラス内で優先度に
よる認識順位の入れ換えを行なうので、第5図ニ
に示すように、距離が多少小さくても優先度の最
も高い字種コードMAが第1位の順位に決定され、
優先度の低い字種コードMVは下位に順位づけさ
れるようになる。
dA<D〓<dQ、dB<D〓であつたとすると、クラス
タリング制御処理部7は、字種コードMV、MP、
MAをBクラスに、字種コードMQ、MBをCクラ
スにクラス分けし、これら各クラス内で優先度に
よる認識順位の入れ換えを行なうので、第5図ニ
に示すように、距離が多少小さくても優先度の最
も高い字種コードMAが第1位の順位に決定され、
優先度の低い字種コードMVは下位に順位づけさ
れるようになる。
このように、類似度が大きい字種カテゴリーに
ついては、従来と同様、優先度が無視された類似
度のみによる認識順位の決定が為され、類似度が
小さい字種カテゴリーについては、優先度を考慮
した順位の決定が為される。
ついては、従来と同様、優先度が無視された類似
度のみによる認識順位の決定が為され、類似度が
小さい字種カテゴリーについては、優先度を考慮
した順位の決定が為される。
(ト) 発明の効果
本発明に依れば、類似度の計算結果による認識
順位が十分信頼できるような類似度が大きな候補
字種カテゴリーについては、従来と全く同様の認
識順位となり、認識結果として曖味な候補字種カ
テゴリーについては、優先度を考慮した順位決定
が行なわれるので、認識率が向上する。
順位が十分信頼できるような類似度が大きな候補
字種カテゴリーについては、従来と全く同様の認
識順位となり、認識結果として曖味な候補字種カ
テゴリーについては、優先度を考慮した順位決定
が行なわれるので、認識率が向上する。
第1図は本発明を適用した文字認識システムの
ブロツク図、第2図はカテゴリーセツトの内容を
示す説明図、第3図はクラスタリング制御処理部
の処理内容の一部を示すフローチヤート、第4図
は知識部の内容を示す説明図、第5図は認識順位
決定の具体例を示す説明図である。 主な図番の説明 3…辞書部、4…パターンマ
ツチング部、5…候補メモリ、6…知識部、7…
クラスタリング制御部、8…結果メモリ、9…答
出力制御部。
ブロツク図、第2図はカテゴリーセツトの内容を
示す説明図、第3図はクラスタリング制御処理部
の処理内容の一部を示すフローチヤート、第4図
は知識部の内容を示す説明図、第5図は認識順位
決定の具体例を示す説明図である。 主な図番の説明 3…辞書部、4…パターンマ
ツチング部、5…候補メモリ、6…知識部、7…
クラスタリング制御部、8…結果メモリ、9…答
出力制御部。
Claims (1)
- 1 入力文字パターンから抽出した特徴パターン
と、予め辞書部に登録された字種カテゴリー毎の
標準特徴パターンとの類似度を計算し、複数の侯
補字種カテゴリーを選択する文字認識システムに
おいて、前記字種カテゴリーの各々に優先度を定
めておき、前記複数の侯補字種カテゴリーのうち
前記類似度が所定値より大きい侯補字種カテゴリ
ーについては前記優先度による認識順位の入れ換
えを行なわず、前記所定値より小さい侯補字種カ
テゴリーについて前記優先度による認識順位の入
れ換えを行なうようにしたことを特徴とする認識
順位決定方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59190963A JPS6168679A (ja) | 1984-09-12 | 1984-09-12 | 認識順位決定方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP59190963A JPS6168679A (ja) | 1984-09-12 | 1984-09-12 | 認識順位決定方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS6168679A JPS6168679A (ja) | 1986-04-09 |
| JPH0337231B2 true JPH0337231B2 (ja) | 1991-06-04 |
Family
ID=16266584
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP59190963A Granted JPS6168679A (ja) | 1984-09-12 | 1984-09-12 | 認識順位決定方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS6168679A (ja) |
-
1984
- 1984-09-12 JP JP59190963A patent/JPS6168679A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS6168679A (ja) | 1986-04-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5005205A (en) | Handwriting recognition employing pairwise discriminant measures | |
| JPH10232866A (ja) | データ処理方法及び装置 | |
| JP2000348141A (ja) | 入力情報の予測方法と装置、ならびにプログラム記憶媒体 | |
| JPH0337231B2 (ja) | ||
| JPH0338630B2 (ja) | ||
| JPH0338631B2 (ja) | ||
| JPS62251986A (ja) | 誤読文字訂正処理装置 | |
| JP3109476B2 (ja) | 候補数制御機能付き文字認識装置及び方法 | |
| JP2639314B2 (ja) | 文字認識方式 | |
| JPS6162986A (ja) | 認識順位決定方式 | |
| JP4047895B2 (ja) | 文書校正装置およびプログラム記憶媒体 | |
| JP4318223B2 (ja) | 文書校正装置およびプログラム記憶媒体 | |
| JPS6162985A (ja) | 認識順位決定方式 | |
| JPH04115383A (ja) | オンライン手書き文字認識装置の文字認識方式 | |
| JP4047894B2 (ja) | 文書校正装置およびプログラム記憶媒体 | |
| JPH03150692A (ja) | 単語照合方式 | |
| JP3245415B2 (ja) | 文字認識方法 | |
| KR100361176B1 (ko) | 필기체 다중 문자 인식방법 | |
| JP3022790B2 (ja) | 手書き文字入力装置 | |
| KR19990010214A (ko) | 문자 인식 방법 | |
| JPH0374426B2 (ja) | ||
| JPH05298489A (ja) | 文字認識方式 | |
| JP2002149641A (ja) | 手書文字認識装置、及び手書文字認識プログラムを記録した記録媒体 | |
| JPS6252912B2 (ja) | ||
| JPH08147406A (ja) | 文字認識装置 |