JPH0247788B2 - - Google Patents
Info
- Publication number
- JPH0247788B2 JPH0247788B2 JP57111912A JP11191282A JPH0247788B2 JP H0247788 B2 JPH0247788 B2 JP H0247788B2 JP 57111912 A JP57111912 A JP 57111912A JP 11191282 A JP11191282 A JP 11191282A JP H0247788 B2 JPH0247788 B2 JP H0247788B2
- Authority
- JP
- Japan
- Prior art keywords
- kanji
- handwritten
- furigana
- character
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/28—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
- G06V30/287—Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters
Landscapes
- Engineering & Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Character Discrimination (AREA)
Description
【発明の詳細な説明】
(1) 発明の技術分野
本発明は、手書き日本語文を認識する文字認識
装置に係り、特に漢字部分にのみフリガナを付与
して手書き日本語文の認識精度を向上した認識処
理方式に関するものである。
装置に係り、特に漢字部分にのみフリガナを付与
して手書き日本語文の認識精度を向上した認識処
理方式に関するものである。
(2) 技術の背景
一般に文字の認識装置においては、最初にパタ
ーンの観測が行なわれる。次にその文字の形が大
きいか小さいか、又線が多いか少ないかなどの特
徴を見出す、すなわちパターンの特徴抽出が行な
われる。そしてパターンの特徴は、装置内に記憶
している過去のデータから得た特徴と照し合わせ
て最も類似しているパターンを選び出す。すなわ
ち、特徴の処理が行なわれ、ひきつづいてその結
果から与えられたパターンを識別するための決定
が行なわれる。このようにして文字の認識が行な
われるものであるが、最近の文字認識装置は手書
きカナ文字に限らず手書き漢字用のものが開発さ
れている。
ーンの観測が行なわれる。次にその文字の形が大
きいか小さいか、又線が多いか少ないかなどの特
徴を見出す、すなわちパターンの特徴抽出が行な
われる。そしてパターンの特徴は、装置内に記憶
している過去のデータから得た特徴と照し合わせ
て最も類似しているパターンを選び出す。すなわ
ち、特徴の処理が行なわれ、ひきつづいてその結
果から与えられたパターンを識別するための決定
が行なわれる。このようにして文字の認識が行な
われるものであるが、最近の文字認識装置は手書
きカナ文字に限らず手書き漢字用のものが開発さ
れている。
(3) 従来技術と問題点
漢字の認識は従来のカタカナまでの認識に比べ
てその特徴抽出が困難であるために精度が上がら
ないという問題がある。更に、日本語文に於いて
は次のような問題をも有している。
てその特徴抽出が困難であるために精度が上がら
ないという問題がある。更に、日本語文に於いて
は次のような問題をも有している。
即ち、特にカタカナと漢字の間ではほぼ同形の
文字が多く存在し、それらを識別して認識するこ
とは非常に困難である。例えば「エア」と「工
事」に於ける「工」、「力士」と「カサ」に於ける
「力」は識別不可能である。従来、このための方
策として、認識装置内において文章の前後関係を
判断して非漢字と漢字を識別する方法が知られて
いるが、この方法は複雑であると共に必ずしも識
別できないという欠点を有している。
文字が多く存在し、それらを識別して認識するこ
とは非常に困難である。例えば「エア」と「工
事」に於ける「工」、「力士」と「カサ」に於ける
「力」は識別不可能である。従来、このための方
策として、認識装置内において文章の前後関係を
判断して非漢字と漢字を識別する方法が知られて
いるが、この方法は複雑であると共に必ずしも識
別できないという欠点を有している。
又、別の方法としては手書き日本語文自体に非
漢字と漢字の識別標識をそれぞれ付与するという
ことも考えられているが、このような標識を文字
枠内に付与することは面倒であり実用的でないと
いう欠点を有している。
漢字と漢字の識別標識をそれぞれ付与するという
ことも考えられているが、このような標識を文字
枠内に付与することは面倒であり実用的でないと
いう欠点を有している。
(4) 発明の目的
本発明は上記従来の欠点を除去し、漢字の認識
精度を向上させると共に、簡単に非漢字と漢字と
を識別し得る手書き日本語文の認識処理方式を提
供することを目的としている。
精度を向上させると共に、簡単に非漢字と漢字と
を識別し得る手書き日本語文の認識処理方式を提
供することを目的としている。
(5) 発明の構成
そしてこの目的は本発明によれば、手書き日本
語文と該手書き日本語文に対応してその漢字のみ
に付与された手書きフリガナ文字を夫々区別して
読取り該手書き日本語文の認識出力と該手書きフ
リガナ文字の認識出力のカナ漢字対応出力とを照
合することにより漢字を認識すると共に、対応す
るフリガナの存在しない部分は非漢字として認識
するようにしたことを特徴とする手書き日本語の
認識処理方式を提供することをよつて達成され
る。
語文と該手書き日本語文に対応してその漢字のみ
に付与された手書きフリガナ文字を夫々区別して
読取り該手書き日本語文の認識出力と該手書きフ
リガナ文字の認識出力のカナ漢字対応出力とを照
合することにより漢字を認識すると共に、対応す
るフリガナの存在しない部分は非漢字として認識
するようにしたことを特徴とする手書き日本語の
認識処理方式を提供することをよつて達成され
る。
(6) 発明の実施例
以下本発明の一実施例を図面に従つて詳述す
る。第1図は本発明による手書き日本語文の認識
処理方式を実現するための構成図を示す。
る。第1図は本発明による手書き日本語文の認識
処理方式を実現するための構成図を示す。
第1図において、1は手書き日本語文が書かれ
た帳票等の被読取り媒体であり、該媒体上には第
2図に示す如く、本文である手書き文11と該本
文11に対応してその漢字のみに付与された手書
きフリガナ文字12が書かれている。被読取り媒
体1上の文字(フリガナ12及び本文11)は
CCD等の光電変換装置2によつて走査されて読
取られ画像情報として認識前処理回路3に入力す
る。
た帳票等の被読取り媒体であり、該媒体上には第
2図に示す如く、本文である手書き文11と該本
文11に対応してその漢字のみに付与された手書
きフリガナ文字12が書かれている。被読取り媒
体1上の文字(フリガナ12及び本文11)は
CCD等の光電変換装置2によつて走査されて読
取られ画像情報として認識前処理回路3に入力す
る。
認識前処理回路3は各文字の特徴抽出を行ない
各文字の候補を選択して出力する。この場合、フ
リガナについては殆ど正しい答が出るので1位の
候補のみ選択してやればよい。
各文字の候補を選択して出力する。この場合、フ
リガナについては殆ど正しい答が出るので1位の
候補のみ選択してやればよい。
しかし乍ら、漢字を含む本文については各文字
の候補をそのまま出力する。4,5はそれぞれフ
リガナ、本文を格納するバツフアであり、認識前
処理回路3からの候補出力がフリガナか本文かに
よつて振り分けられる。6は読出しコントローラ
であり、フリガナバツフア4からのフリガナ出力
に対応してヨミ辞書メモリ7をアクセスし、読出
されたカナ漢字対応出力と本文バツフア5からの
本文候補群出力とを順次照合することによつて本
文中の漢字候補を取捨選択し、各字20の候補カテ
ゴリーから2〜3の候補に絞る。尚、読出しコン
トローラ6は本文の各文字についてのフリガナの
カナ漢字対応出力との照合の結果、対応するフリ
ガナが存在しないと認識した場合にはその文字は
非漢字であるカタカナ、ひらがな、アルフアベツ
ト、アラビア数字、その他の記号であると判断す
る。
の候補をそのまま出力する。4,5はそれぞれフ
リガナ、本文を格納するバツフアであり、認識前
処理回路3からの候補出力がフリガナか本文かに
よつて振り分けられる。6は読出しコントローラ
であり、フリガナバツフア4からのフリガナ出力
に対応してヨミ辞書メモリ7をアクセスし、読出
されたカナ漢字対応出力と本文バツフア5からの
本文候補群出力とを順次照合することによつて本
文中の漢字候補を取捨選択し、各字20の候補カテ
ゴリーから2〜3の候補に絞る。尚、読出しコン
トローラ6は本文の各文字についてのフリガナの
カナ漢字対応出力との照合の結果、対応するフリ
ガナが存在しないと認識した場合にはその文字は
非漢字であるカタカナ、ひらがな、アルフアベツ
ト、アラビア数字、その他の記号であると判断す
る。
このようにして読出しコントローラ6で取捨選
択された文字候補(各文字について2〜3の候
補)は候補バツフア8に格納される。候補バツフ
ア8からの文字候補出力は選択回路9に入力し、
ここで各文字候補は文章を構成するように横に並
べられ、最終的な正しいカテゴリーを1つ選択す
るための処理が行なわれる。選択回路9からの文
字出力はフロツピー、計算機等の出力回路10に
出力される。
択された文字候補(各文字について2〜3の候
補)は候補バツフア8に格納される。候補バツフ
ア8からの文字候補出力は選択回路9に入力し、
ここで各文字候補は文章を構成するように横に並
べられ、最終的な正しいカテゴリーを1つ選択す
るための処理が行なわれる。選択回路9からの文
字出力はフロツピー、計算機等の出力回路10に
出力される。
第3図は第1図における読出しコントローラ6
の動作を説明するための図である。第3図aは本
文11とそのフリガナ12の一例を示すものであ
り、それぞれ文字枠に対応して連続番号を付して
ある。第3図b〜eは第3図aにおけるフリガナ
11の部分〜に対応する本文11の漢字候補
の認識決定の模様を示すものであり、それぞれフ
リガナ部分〜のスタート時点を変えた時のフ
リガナのヨミに対応するカナ漢字対応出力と本文
バツフア6(第1図)からの候補カテゴリの中で
合致するものがあるか否かを示すものである。同
図の場合はフリガナ部分〜に対応する漢字の
候補は「当社」であると判断される。同様にし
て、フリガナ部分〜に対応する漢字は「工事
業者」であることが判断され、従つて本文の部分
〜の「はエアコン」は非漢字で、この場合カ
タカナであることが認識される。
の動作を説明するための図である。第3図aは本
文11とそのフリガナ12の一例を示すものであ
り、それぞれ文字枠に対応して連続番号を付して
ある。第3図b〜eは第3図aにおけるフリガナ
11の部分〜に対応する本文11の漢字候補
の認識決定の模様を示すものであり、それぞれフ
リガナ部分〜のスタート時点を変えた時のフ
リガナのヨミに対応するカナ漢字対応出力と本文
バツフア6(第1図)からの候補カテゴリの中で
合致するものがあるか否かを示すものである。同
図の場合はフリガナ部分〜に対応する漢字の
候補は「当社」であると判断される。同様にし
て、フリガナ部分〜に対応する漢字は「工事
業者」であることが判断され、従つて本文の部分
〜の「はエアコン」は非漢字で、この場合カ
タカナであることが認識される。
(7) 発明の効果
以上説明したように本発明によれば、漢字に比
べて認識が容易なフリガナを利用して漢字と非漢
字の同形のものの弁別をするものであり漢字の認
識精度を高めることができると共に、簡単に非漢
字と漢字とを識別して認識できるという効果を有
する。
べて認識が容易なフリガナを利用して漢字と非漢
字の同形のものの弁別をするものであり漢字の認
識精度を高めることができると共に、簡単に非漢
字と漢字とを識別して認識できるという効果を有
する。
第1図は本発明の認識処理方式を実現するため
の構成図、第2図は第1図における被読取り媒体
1に書かれた文字の例、第3図は第1図における
読み出しコントローラ6の動作を説明するための
図である。 図において、1は日本語文11とフリガナ12
が書かれた被読取り媒体、2は光電変換装置、3
は認識前処理回路、4はフリガナバツフア、5は
本文バツフア、6は読み出しコントローラ、7は
ヨミ辞書メモリをそれぞれ示す。
の構成図、第2図は第1図における被読取り媒体
1に書かれた文字の例、第3図は第1図における
読み出しコントローラ6の動作を説明するための
図である。 図において、1は日本語文11とフリガナ12
が書かれた被読取り媒体、2は光電変換装置、3
は認識前処理回路、4はフリガナバツフア、5は
本文バツフア、6は読み出しコントローラ、7は
ヨミ辞書メモリをそれぞれ示す。
Claims (1)
- 1 手書き日本語文と該手書き日本語文に対応し
てその漢字のみに単語単位に付与された手書きフ
リガナ文字を夫々区別して読み取り、該手書きフ
リガナ文字から得られるカナの開始位置を1文字
毎にずらして各々のカナ漢字対応出力を得、該
各々のカナ漢字対応出力と上記手書き日本語文の
認識出力を照合することにより漢字を認識すると
共に、対応するフリガナの存在しない部分は非漢
字として認識するようにしたことを特徴とする手
書き日本語文の認識処理方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57111912A JPS592191A (ja) | 1982-06-29 | 1982-06-29 | 手書き日本語文の認識処理方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP57111912A JPS592191A (ja) | 1982-06-29 | 1982-06-29 | 手書き日本語文の認識処理方式 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS592191A JPS592191A (ja) | 1984-01-07 |
| JPH0247788B2 true JPH0247788B2 (ja) | 1990-10-22 |
Family
ID=14573230
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP57111912A Granted JPS592191A (ja) | 1982-06-29 | 1982-06-29 | 手書き日本語文の認識処理方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS592191A (ja) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS6334680A (ja) * | 1986-07-29 | 1988-02-15 | Toshiba Corp | 文字読取装置 |
| JPH01147829A (ja) * | 1987-12-04 | 1989-06-09 | Toshiba Corp | 半導体装置の製造方法 |
| JPH04242491A (ja) * | 1991-01-17 | 1992-08-31 | Nec Corp | 光学文字読取装置 |
| US5326713A (en) * | 1992-09-04 | 1994-07-05 | Taiwan Semiconductor Manufacturies Company | Buried contact process |
| ES2993665T3 (en) | 2021-02-22 | 2025-01-03 | Zeiss Carl Vision Int Gmbh | Devices and methods for processing eyeglass prescriptions |
| EP4101367A1 (en) | 2021-06-09 | 2022-12-14 | Carl Zeiss Vision International GmbH | Method and device for determining a visual performance |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5699573A (en) * | 1980-01-09 | 1981-08-10 | Hitachi Ltd | Kanji (chinese character) distinction system using katakana (square form of japanese syllabary) |
| JPS5699581A (en) * | 1980-01-10 | 1981-08-10 | Toshiba Corp | Kanji (chinese character) read method |
-
1982
- 1982-06-29 JP JP57111912A patent/JPS592191A/ja active Granted
Also Published As
| Publication number | Publication date |
|---|---|
| JPS592191A (ja) | 1984-01-07 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2713622B2 (ja) | 表形式文書読取装置 | |
| JP3452774B2 (ja) | 文字認識方法 | |
| US4531231A (en) | Method for distinguishing between complex character sets | |
| JPH0247788B2 (ja) | ||
| JP2740335B2 (ja) | 自動セル属性判定機能を有する表読取装置 | |
| KR102646607B1 (ko) | 딥러닝 기반의 문자 인식 시스템 | |
| JPH0520794B2 (ja) | ||
| JPS5842904B2 (ja) | 手書きカナ・漢字の文字認識装置 | |
| JP2972443B2 (ja) | 文字認識装置 | |
| JP3015137B2 (ja) | 手書文字認識装置 | |
| JP2939945B2 (ja) | ローマ字住所認識装置 | |
| JPH0586585B2 (ja) | ||
| Uber et al. | Japanese Kana and Brazilian Portuguese Manuscript Database | |
| JPS58125183A (ja) | 光学文字読取装置における認識不能文字表示方法 | |
| JPS5875278A (ja) | 文字・記号認識装置 | |
| KR900005141B1 (ko) | 문자인식장치 | |
| Tierney et al. | Printed Cyrillic character recognition system | |
| JP2740506B2 (ja) | 画像認識方法 | |
| JP2549831B2 (ja) | 文字認識装置の入力パターン・文字列登録方法 | |
| JP2784004B2 (ja) | 文字認識装置 | |
| JPS5757379A (en) | Character information input device | |
| JPS61153787A (ja) | 情報処理装置 | |
| JPH06203201A (ja) | 光学的手書き文字列認識方法および装置 | |
| JPH11282965A (ja) | 文字認識装置及び文字認識プログラムを記録したコンピュータ読み取り可能な記録媒体 | |
| JPH0520503A (ja) | 文字認識装置 |