JPS5842904B2 - 手書きカナ・漢字の文字認識装置 - Google Patents
手書きカナ・漢字の文字認識装置Info
- Publication number
- JPS5842904B2 JPS5842904B2 JP51123113A JP12311376A JPS5842904B2 JP S5842904 B2 JPS5842904 B2 JP S5842904B2 JP 51123113 A JP51123113 A JP 51123113A JP 12311376 A JP12311376 A JP 12311376A JP S5842904 B2 JPS5842904 B2 JP S5842904B2
- Authority
- JP
- Japan
- Prior art keywords
- kanji
- handwritten
- kana
- characters
- character recognition
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired
Links
Landscapes
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Description
【発明の詳細な説明】
本発明は、手書きカナ、漢字のまじり文を認識する認識
装置に関するものである。
装置に関するものである。
一般に文字の認識装置においては、最初にパターンの観
測が行なわれる。
測が行なわれる。
次にその文字の形が大きいか小さいか、又細いか太いか
という特徴を見出す、すなわちパターンの特徴抽出が行
なわれる。
という特徴を見出す、すなわちパターンの特徴抽出が行
なわれる。
ここでパターンの特徴というものは、実は無限にあると
考えられるが、その中から必要なものを取り出し、装置
内に記憶している過去のデータと照し合わせて最も類似
しているパターンを選び出す、すなわち、特徴の処理が
行なわれ、ひきつづいてその結果から与えられたパター
ンを識別するための決定が行なわれる。
考えられるが、その中から必要なものを取り出し、装置
内に記憶している過去のデータと照し合わせて最も類似
しているパターンを選び出す、すなわち、特徴の処理が
行なわれ、ひきつづいてその結果から与えられたパター
ンを識別するための決定が行なわれる。
このようにして文字の認識が行なわれるものであるが、
このような文字の認識の過程は、非常に複雑であり、現
実にはなかなか容易に行なえるものではなかった。
このような文字の認識の過程は、非常に複雑であり、現
実にはなかなか容易に行なえるものではなかった。
これは、上述の如くパターンの特徴が非常に無限にあり
、特徴処理を行なう事がむずかしいためであった。
、特徴処理を行なう事がむずかしいためであった。
この為従来の文字認識装置は、比較的パターンの特徴の
簡単である手書きあるいは印刷カナ文字や、活字で印刷
された印刷漢字に限定されていたものであった。
簡単である手書きあるいは印刷カナ文字や、活字で印刷
された印刷漢字に限定されていたものであった。
しかし最近は、電算機の入力として手書のカナはもちろ
んの事、手書き漢字も入力出来るように、という要求が
出てきている。
んの事、手書き漢字も入力出来るように、という要求が
出てきている。
しかし人が書いた手書き漢字を読取るには、漢字自体の
特徴抽出が困難な上に手書きであるがゆえに個人差も含
め、パターンが非常に多すぎ、そのため照合の段階で記
憶していなければならない特徴パターンが、非常に多い
という問題があった。
特徴抽出が困難な上に手書きであるがゆえに個人差も含
め、パターンが非常に多すぎ、そのため照合の段階で記
憶していなければならない特徴パターンが、非常に多い
という問題があった。
例えば、現在実現されている手書きカナ文字(例えば特
願昭5l−34672(特開昭52−117524号公
報)、特願昭5l−34673(特開昭52−1175
25号公報)により出願中)の認識に際してカナ文字4
8文字に対して約2000の特徴パターンを記憶させて
照合している状態である。
願昭5l−34672(特開昭52−117524号公
報)、特願昭5l−34673(特開昭52−1175
25号公報)により出願中)の認識に際してカナ文字4
8文字に対して約2000の特徴パターンを記憶させて
照合している状態である。
これを手書き漢字に適応させると、当用漢字だけでも1
800文字もあり簡単に手書きカナ文字のパターン数よ
り計算しても7万5千パタ一ン以上を記憶しなければな
らない。
800文字もあり簡単に手書きカナ文字のパターン数よ
り計算しても7万5千パタ一ン以上を記憶しなければな
らない。
しかしこのパターンを記憶し、手書き文字から抽出され
た特徴と照合することは不可能に近い状態にあった。
た特徴と照合することは不可能に近い状態にあった。
そこで本発明は、照合すべきパターン数を非常に少なく
する手書き漢字の認識装置を提供することを目的とする
ものでこの目的は、手書きカナ、漢字混り文を認識する
ため手書き漢字に対応する手書きカナを記入しこの手書
きカナ文字の発音と同一の漢字を導出し、該導出された
漢字とのみ手書き漢字を照合する事により認識を行なう
ようにする事により達成される。
する手書き漢字の認識装置を提供することを目的とする
ものでこの目的は、手書きカナ、漢字混り文を認識する
ため手書き漢字に対応する手書きカナを記入しこの手書
きカナ文字の発音と同一の漢字を導出し、該導出された
漢字とのみ手書き漢字を照合する事により認識を行なう
ようにする事により達成される。
以下本発明を図面により詳細に説明する。
図に釦いて第1図は、手書き漢字の入力方法の一例で、
第2図は、文字認識装置の一実施例である。
第2図は、文字認識装置の一実施例である。
図にかいて2は観測装置、3はカナ部の識別装置、4は
漢字のグループ分は装置、5は漢字記憶装置、6は漢字
の特徴抽出装置、7は照合装置をそれぞれ示す。
漢字のグループ分は装置、5は漢字記憶装置、6は漢字
の特徴抽出装置、7は照合装置をそれぞれ示す。
第1図は手書漢字の入力方法であり、 「今日は良い天
気です」と入力する場合は、このような制限付のワク内
に1ず上部にカナをふり、単語単位の区切りを示すため
に単語の間の1マスを黒くぬりつぶす。
気です」と入力する場合は、このような制限付のワク内
に1ず上部にカナをふり、単語単位の区切りを示すため
に単語の間の1マスを黒くぬりつぶす。
これによって単語単位を識別出来るようにする。
その後に下のワク内に手書き漢字を図のように書き込む
。
。
このように制限付で書かれ、かつカナのふられた文字(
音読みに統一する事も出来る)を第2図の文字認識装置
に入力する。
音読みに統一する事も出来る)を第2図の文字認識装置
に入力する。
次に第2図の文字認識装置の動作を説明すると、1は観
測装置で、ここでは光学的又は、他の手段により単語単
位に分割してカナ文字及び手書き漢字を読取り、この単
語単位のカナ文字及び手書き漢字を区別へ カナ文字は
カナ部の織方1蔑置3へ又、手書き漢字は漢字の特徴抽
出装置6へ送られる。
測装置で、ここでは光学的又は、他の手段により単語単
位に分割してカナ文字及び手書き漢字を読取り、この単
語単位のカナ文字及び手書き漢字を区別へ カナ文字は
カナ部の織方1蔑置3へ又、手書き漢字は漢字の特徴抽
出装置6へ送られる。
カナ部の識別装置では、現在実現されている種種のカナ
文字の認識方法をとり得る。
文字の認識方法をとり得る。
ここで認識されたカナ文字情報は、次の漢字のグループ
分は装置4に入力される。
分は装置4に入力される。
この漢字のグループ分は装置4には、同時に例えば「キ
ョウ」というカネ文字の認識情報が人力されると、同時
に観測装置2からは、手書き漢字の数が点線より入力さ
れる。
ョウ」というカネ文字の認識情報が人力されると、同時
に観測装置2からは、手書き漢字の数が点線より入力さ
れる。
例えばこの場合「今日」という2文字であるから「2」
という数が入力される。
という数が入力される。
「キョウ」という発音と漢字の数「2」が入力されると
、この情報に基づいて、漢字記憶装置5より「キョウ」
と言う発音で「2字」の漢字から成る漢字(すなわち既
知の特徴パターン)を導出する。
、この情報に基づいて、漢字記憶装置5より「キョウ」
と言う発音で「2字」の漢字から成る漢字(すなわち既
知の特徴パターン)を導出する。
ここでこの漢字記憶装置5からは「今日」器用、起用、
」と言う漢字が導出される。
」と言う漢字が導出される。
これは漢字のグループ分は装置4により「キョウ」と言
う発音をコード化すると同時に漢字の字数「2」もコー
ド化して、漢字記憶装置5にアドレスとして入力し、そ
れにより適応する漢字のコードを送出するなどの方法を
取る事により容易に導出できる。
う発音をコード化すると同時に漢字の字数「2」もコー
ド化して、漢字記憶装置5にアドレスとして入力し、そ
れにより適応する漢字のコードを送出するなどの方法を
取る事により容易に導出できる。
このようにコード化された漢字を漢字のグループ分は装
置4により漢字に変換すると同時に、その特徴パターン
に変換して、照合装置7に入力する。
置4により漢字に変換すると同時に、その特徴パターン
に変換して、照合装置7に入力する。
漢字の特徴抽出装置6に送られた単語単位の手書き漢字
は、印刷漢字の特徴抽出と同様に例えば昭和45年3月
30日に「昭晃堂」より発行された「パターン認識と学
習機械」のp17〜33に記載されているような(例え
ばメツシュ法等)種々の方法により特徴を抽出する。
は、印刷漢字の特徴抽出と同様に例えば昭和45年3月
30日に「昭晃堂」より発行された「パターン認識と学
習機械」のp17〜33に記載されているような(例え
ばメツシュ法等)種々の方法により特徴を抽出する。
このようにして特徴を抽出された手書き漢字は、照合装
置7に入力される。
置7に入力される。
照合装置7にかいて、漢字の特徴抽出装置6により特徴
の抽出された漢字、例えば「今日」は、漢字のグループ
分は装置より送られてきた「今日、器用、起用]なる漢
字の特徴パターンと照合を取り、その文字を送出する。
の抽出された漢字、例えば「今日」は、漢字のグループ
分は装置より送られてきた「今日、器用、起用]なる漢
字の特徴パターンと照合を取り、その文字を送出する。
又、手書きカナのみ、父子書きカナ漢字のまじり文の場
合も同様に、手書きカナのみの場合は、カナ部識別装置
3より直接出力し、手書き漢字、カナ1じり文の場合は
、例えば「良い」はその11上述の説明のように行ない
照合装置7では「良い」単語の単位でのパターンの照合
を行なう。
合も同様に、手書きカナのみの場合は、カナ部識別装置
3より直接出力し、手書き漢字、カナ1じり文の場合は
、例えば「良い」はその11上述の説明のように行ない
照合装置7では「良い」単語の単位でのパターンの照合
を行なう。
従って、漢字記憶装置にはこのような形の単語も入力し
ておき、アドレスには「ヨイ」と発音する文字で、漢字
1つ、カナ1つより戒り立っていると言う情報をアドレ
スとして入力しなければならない。
ておき、アドレスには「ヨイ」と発音する文字で、漢字
1つ、カナ1つより戒り立っていると言う情報をアドレ
スとして入力しなければならない。
又、ふりがなを音読みに統一して漢字にカナを付してト
けばもつと簡単にする事が可能となる。
けばもつと簡単にする事が可能となる。
以上のように本発明は、手書き漢字を認識する際に、予
じめ付した手書き漢字に対応するカナを付し、それを基
にして認識するものであり、特徴抽出、特徴処理のため
の特徴パターンを激減させる事が出来る。
じめ付した手書き漢字に対応するカナを付し、それを基
にして認識するものであり、特徴抽出、特徴処理のため
の特徴パターンを激減させる事が出来る。
すなわち本発明によれば「今ヒ1」を認識する際に認識
の対象となる文字は「器用、起用、今日]だけとなり、
認識する際の特徴パターンが非常に少なくなり簡単にな
り、手書き漢字の認識が可能になる。
の対象となる文字は「器用、起用、今日]だけとなり、
認識する際の特徴パターンが非常に少なくなり簡単にな
り、手書き漢字の認識が可能になる。
図にかいて第1図は、手書き漢字の入力方法の一例、第
2図は、本発明の文字認識装置の一実施例であり、図に
おいて1は入力、2は観測装置、3はカナ部の識別装置
、4は漢字グループ分は装置、5は漢字記憶装置、6は
漢字の特徴抽出装置、7は照合装置をそれぞれ示す。
2図は、本発明の文字認識装置の一実施例であり、図に
おいて1は入力、2は観測装置、3はカナ部の識別装置
、4は漢字グループ分は装置、5は漢字記憶装置、6は
漢字の特徴抽出装置、7は照合装置をそれぞれ示す。
Claims (1)
- 1 手書き漢字に対応するカナが記入され、各単語の区
切りを示す記号が記入された手書カナ・漢字混り文を認
識するための文字認識装置であって、核子書きカナ及び
手書き漢字を単語ごとに読取る観測装置と、該観測装置
で読取った手書き漢字の特徴抽出を行なう漢字の特徴抽
出装置と、該観測装置で読取った手書きカナを識別する
識別装置と、該識別されたカナと同一の発音の漢字を導
出する漢字記憶装置と、該漢字記憶装置より導出された
漢字のうち、該観測装置で読取った単語単位の手書漢字
の字数と同一字数の漢字のみを選択する漢字のグループ
分は装置を有し、該漢字のグループ分は装置より送出さ
れた漢字と、前記特徴抽出装置の出力とを照合装置によ
り照合し手書漢字を認識するようにした事を特徴とする
手書きカナ・漢字の文字認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP51123113A JPS5842904B2 (ja) | 1976-10-14 | 1976-10-14 | 手書きカナ・漢字の文字認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP51123113A JPS5842904B2 (ja) | 1976-10-14 | 1976-10-14 | 手書きカナ・漢字の文字認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS5347733A JPS5347733A (en) | 1978-04-28 |
| JPS5842904B2 true JPS5842904B2 (ja) | 1983-09-22 |
Family
ID=14852491
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP51123113A Expired JPS5842904B2 (ja) | 1976-10-14 | 1976-10-14 | 手書きカナ・漢字の文字認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS5842904B2 (ja) |
Families Citing this family (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5699573A (en) * | 1980-01-09 | 1981-08-10 | Hitachi Ltd | Kanji (chinese character) distinction system using katakana (square form of japanese syllabary) |
| JPS5757379A (en) * | 1980-09-25 | 1982-04-06 | Nec Corp | Character information input device |
| JPS58222379A (ja) * | 1982-06-18 | 1983-12-24 | Fujitsu Ltd | 文字認識修正処理方式 |
| US4815735A (en) * | 1982-09-24 | 1989-03-28 | Mcclenny Carl O | Pitching machine |
| JPH04280394A (ja) * | 1991-03-08 | 1992-10-06 | Fujitsu Ltd | 文字認識装置及び認識文字確定方法 |
-
1976
- 1976-10-14 JP JP51123113A patent/JPS5842904B2/ja not_active Expired
Also Published As
| Publication number | Publication date |
|---|---|
| JPS5347733A (en) | 1978-04-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS5842904B2 (ja) | 手書きカナ・漢字の文字認識装置 | |
| JPS6239793B2 (ja) | ||
| JPS592191A (ja) | 手書き日本語文の認識処理方式 | |
| JPH0896081A (ja) | 文字認識装置及び文字認識方法 | |
| JPS59161780A (ja) | オンライン文字認識装置 | |
| JPS6061875A (ja) | パターン認識装置における標準パターン作成方法 | |
| KR102550868B1 (ko) | 교원 업적 검증 시스템 | |
| JP2538543B2 (ja) | 文字情報認識装置 | |
| JPH0338787A (ja) | 文字認識処理装置 | |
| JP3007697B2 (ja) | 単語照合装置及び単語照合方法 | |
| JPH0256086A (ja) | 文字認識の後処理方法 | |
| JPS6037084A (ja) | 文字認識装置 | |
| JP2746345B2 (ja) | 文字認識の後処理方法 | |
| JPH0340434B2 (ja) | ||
| KR930012140B1 (ko) | 자소 오토마타를 이용한 온라인 필기체 문자인식 방법 | |
| JPS63268082A (ja) | パタ−ン認識装置 | |
| JPS63282586A (ja) | 文字認識装置 | |
| JPS6293776A (ja) | 情報認識装置 | |
| JPS6095689A (ja) | 光学的文字読取装置 | |
| JPS6160189A (ja) | 光学的文字読取装置 | |
| JPH01166188A (ja) | 文字認識方法 | |
| JPH0567241A (ja) | オンライン手書き文字認識装置 | |
| KR20150076587A (ko) | 다언어로 찾는 중국어 사전 | |
| JPS59103180A (ja) | 文字認識方式 | |
| JPS59188783A (ja) | 文字判定処理方式 |