JPH0676115A - 文字認識方法及び装置 - Google Patents

文字認識方法及び装置

Info

Publication number
JPH0676115A
JPH0676115A JP4228336A JP22833692A JPH0676115A JP H0676115 A JPH0676115 A JP H0676115A JP 4228336 A JP4228336 A JP 4228336A JP 22833692 A JP22833692 A JP 22833692A JP H0676115 A JPH0676115 A JP H0676115A
Authority
JP
Japan
Prior art keywords
character
common
characters
recognition
common pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4228336A
Other languages
English (en)
Inventor
Shigeki Mori
重樹 森
Katsuhiko Sakaguchi
克彦 阪口
Kazuhiro Matsubayashi
一弘 松林
Takashi Harada
隆史 原田
Eiji Takasu
英司 高須
Tsuneichi Arai
常一 新井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP4228336A priority Critical patent/JPH0676115A/ja
Publication of JPH0676115A publication Critical patent/JPH0676115A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 複数の文字に共通な共通部分を指示するだけ
で、所望の文字を入力できる文字認識方法及び装置を提
供することを目的とする。 【構成】 文字形状に関連する文字情報を入力して認識
する文字認識装置であって、その文字情報に含まれる、
複数の文字に共通する共通部分を識別し、その識別され
た共通部分を含む文字を抽出する。こうして抽出された
文字の中から所望の文字を選択する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば手書き等により
入力された文字情報を認識する文字認識方法及び装置に
関するものである。
【0002】
【従来の技術】従来、一般的な手書き文字認識装置にお
ける処理の流れを図2に示す。図2において、201は
ディジタイザ等の座標入力装置で、このディジタイザ2
01上で手書き入力された文字パターンは、文字切り処
理202により1文字単位に分割される。その後、この
分割された文字部分は正規化処理203により正規化さ
れて記号化或いは数値化される。こうして正規化された
文字パターン情報が、認識辞書205を参照して点数付
けされ、その点数により認識候補文字を選択・抽出する
文字認識処理204を行っている。この認識結果は、候
補表示処理206において候補文字として表示され、そ
の候補文字の中から所望の文字を選択する文字確定処理
207が実行される。
【0003】
【発明が解決しようとする課題】このような従来の手書
き文字認識等の技術を用いて文字の入力を行う電子情報
機器において、漢字文字を入力する際には、入力しよう
とする漢字文字の正しい偏や旁等の部首情報を正しく組
み合わせた形で入力を行う必要があり、結果として以下
に述べる様な問題点が存在した。
【0004】例えば操作者が、漢字熟語文字である“認
識”という文字情報を手書きによる漢字認識を用いて入
力しようとする場合について考える。前記の漢字熟語
“認識”の1部分、例えば“識”の漢字文字を入力する
際、その文字の偏が“言(ごんべん)”であることは正
確に記憶しているが、その文字の旁が何であるかを忘れ
ている場合が考えられる。これは、漢字の種類が、我々
が日常頻繁に使用する漢字文字からめったに使用するこ
とのない漢字文字までを含めて、通常電子情報機器が扱
う範囲の漢字文字の数が約7000文字ほど存在し、し
かもその多くは同じ偏や旁のパターンを共通に包含する
ものであることから必然的に多く起こりうることであ
る。
【0005】この様な場合は、操作者は目的の“識”の
漢字文字そのものを入力できなくなる。また或いは操作
者が別に用意された手段、例えば平仮名文字を入力して
漢字に変換する仮名漢字変換手段を併用した場合には、
操作者は“認しき”と手書き入力を行い、しかる後に、
この漢字仮名混じり文に対する仮名漢字変換を行うこと
となる。このような仮名漢字変換処理では、平仮名文字
列“しき”に対応する“識”が容易に候補文字として現
れず、その結果として簡単に“識”の文字を入力できな
いという問題が存在した。
【0006】本発明は上記従来例に鑑みてなされたもの
で、複数の文字に共通な共通部分を指示するだけで、所
望の文字を入力できる文字認識方法及び装置を提供する
ことを目的とする。
【0007】
【課題を解決するための手段】上記目的を達成するため
に本発明の文字認識装置は以下の様な構成を備える。即
ち、文字形状に関連する文字情報を入力して認識する文
字認識装置であって、前記文字情報に含まれる、複数の
文字に共通する共通部分を識別する識別手段と、前記識
別手段により識別された共通部分を含む文字を抽出する
抽出手段と、前記抽出手段により抽出された文字の中か
ら所望の文字を選択する選択手段とを有する。
【0008】上記目的を達成するために本発明の文字認
識方法は以下の様な工程を備える。即ち、文字形状に関
連する文字情報を入力して認識する文字認識方法であっ
て、入力した文字情報に含まれる、複数の文字に共通す
る共通部分を識別する工程と、その識別された共通部分
を含む文字を辞書より抽出する工程と、それら抽出され
た文字の中から所望の文字を選択する工程とを有する。
【0009】
【作用】以上の構成において、文字情報に含まれる、複
数の文字に共通する共通部分を識別し、その識別された
共通部分を含む文字を抽出する。これら抽出された文字
の中から所望の文字を選択するように動作する。
【0010】
【実施例】以下、添付図面を参照して本発明の好適な実
施例を詳細に説明する。
【0011】図1は本実施例の文字認識装置の機能構成
を認識処理ルーチンの形式で示すブロック図である。
【0012】図1において、1は、例えばディジタイザ
等の入力デバイスであって、この入力デバイス1の座標
入力面上で描画された文字等の筆跡情報が文字入力デー
タとして、次の文字切り及び正規化処理2により処理さ
れる。この文字切り及び正規化処理2は、入力デバイス
1より得られた入力データを1文字或いは共通パターン
単位に切りだして正規化している。次に3では、この切
り出した文字パターンを検出し、なお且つその種類を認
識させるべき共通パターンが含まれることを認知させる
ための記号文字であるところの共通パターン識別記号を
検出する。ここでは、共通パターンとは漢字等に共通し
て含まれる部首記号パターンを指し、また共通パターン
識別記号とは、この共通パターンに付加して入力される
記号であって、入力の対象となるグループ、例えば仮名
漢字文字を対象とする入力装置においては通常現れるこ
とのない少数ストロークからなる記号パターンである。
この実施例では、共通パターン識別記号を下から上への
立て棒線”↑”を用いている。
【0013】このように少数ストロークからなる単純な
パターンを共通パターン識別記号として用いることによ
り、検出の対象となる文字パターンに対して高速に検出
作業を行うことができる。
【0014】4は共通パターン認識処理を示し、共通パ
ターン専用辞書5に予め登録された共通パターンを認識
して検出する。この共通パターン専用辞書5は、本実施
例の文字認識装置の認識対象である文字等に多く存在す
る共通パターン、ここでは漢字文字に共通して存在する
偏や旁等の部首記号を認識するための辞書情報を格納し
ている。6は文字認識処理を示し、認識辞書7を参照し
て、1文字単位での文字認識を行っている。8は候補選
択指示処理を示し、共通パターン認識処理4で検出され
た共通パターンに基づいて、その共通パターンを含む文
字候補を表示させている。9は表示候補抽出処理を示
し、共通パターン認識処理4で検出された共通パターン
を含む文字候補を共通パターングループ辞書10から選
択する。11は候補表示処理を示し、共通パターングル
ープ辞書10により得られた共通パターンを含む候補を
表示する。12は候補文字の中から選択された文字を最
終的な認識結果として確定する処理である。
【0015】図3は本実施例の文字認識装置の概略構成
を示すブロック図で、前述の図1と共通する部分は同じ
番号で示し、それらの説明を省略する。
【0016】図3において、101は装置全体を制御す
るCPU、102は、CPU101の制御プログラムや
各種データを記憶しているROMである。103はCP
U101のワークエリアとして使用され、入力デバイス
1より入力された座標データや識別結果等を一時的に記
憶している。104は表示部で、表示用コントローラ1
05の制御の基に、文字認識結果或いは候補文字、更に
は後述する各種表示データ等が表示される。106はキ
ーボードで、キーボードコントローラ107により制御
され、オペレータの操作に従って各種データや指示情報
を入力している。108はハードディスクやフロッピィ
ディスク等の外部メモリ、109はそのディスク用コン
トローラである。尚、図1に示す各種処理は、本実施例
では、CPU101と、ROM102に記憶されたCP
U101の制御プログラムに従って実行される。
【0017】次に、以上のように構成された本実施例の
文字認識装置の動作を詳しく説明する。
【0018】いま、入力デバイス1より、操作者が図4
に示すような文字列データ“認言↑”を手書きで入力し
たとする。この入力データは、前述の文字切り出し及び
正規化処理2によって、その入力座標値及び時間情報に
より、図5に示す1文字分、或いは共通パターン(ここ
では“言”)を含む部首部データとして切りだされたデ
ータとなる。
【0019】このように切り出され正規化されたデータ
は、共通パターンが識別されたかどうかが判別するため
に、共通パターン識別記号“↑”の検出(図1の3)が
行われる。図4に示す入力データの文字列の最初の入力
データでは、前述の下から上への立て棒線からなる共通
パターン識別記号は検出されない。従って、この文字
“認”は、通常の文字認識処理6に移行して文字認識が
行われる。この文字認識処理6において、認識辞書7を
参照した文字認識が行われ、その入力された文字列の最
初の入力データは漢字文字であるところの”認”の文字
として認識される。この文字認識処理において、他の候
補の一覧表示が要求されたなかった場合には、そのまま
文字確定処理12が実行されて、その認識文字“認”が
確定される。
【0020】また、文字認識処理6において、“認”の
文字が正しく認識されなかった場合には、候補選択指示
処理8において、候補表示処理11及び表示候補選択処
理9により認識候補文字の一覧が表示部104に表示さ
れる。これにより、操作者が目的の文字を、その一覧表
示の中からから選択することにより、目的の文字を入力
することができる。
【0021】次に、文字切り及び正規化処理2により得
られた2文字目の入力データ“言↑”について説明す
る。この場合は、共通パターン認識記号検出処理3にお
いて、共通パターン識別記号“↑”が検出され、その結
果、共通パターン認識処理4が実行される。この共通パ
ターン認識処理4では、前述2文字目の入力データ“言
↑”から共通パターン識別記号“↑”を除外し、その除
外したデータと、共通パターン専用辞書5に存在する共
通パターンとのマッチングを行う。これにより、代表的
な偏記号である“言”が検出され、この共通パターンが
“言”であると認識される。次に、候補選択指示処理8
では、表示候補選択処理9において、共通パターン認識
処理4で検出された共通パターン“言”を偏とする候補
文字を共通パターングループ辞書10より抽出して、候
補表示処理11により図6に示すように表示する。
【0022】図6では、偏が“言”である複数の漢字6
01が表示され、カーソル移動キー603を指示して、
カーソル602を所望の漢字位置まで移動し、選択キー
604を押下することにより、その漢字を認識結果の文
字として確定することができる。
【0023】図7は本実施例の文字認識装置における文
字認識処理を示すフローチャートで、この処理を実行す
る制御プログラムはROM102に記憶されている。
【0024】まずステップS1で、入力デバイス1より
手書きによる文字入力が行われるとステップS2に進
み、その入力された座標値及び時間情報を基に、文字単
位での文字の切り出し、及びその切り出された文字デー
タの正規化を行う。次にステップS3に進み、この入力
された文字パターンに、“↑”が含まれるかどうかを判
断する。共通パターンの識別記号“↑”が含まれないと
きはステップS4に進み、通常の文字認識の場合と同様
にして、認識辞書7を参照して文字単位での文字認識を
行う。ステップS5で、この文字認識された結果、候補
文字が存在するときはステップS6に進み、その候補文
字を全て表示部104に表示する。オペレータは、この
表示を見て、該当する文字をカーソル等を用いて選択す
る。こうして文字認識が実行され文字が確定する。
【0025】一方、ステップS3において、識別記号
“↑”が含まれているときはステップS8に進み、この
記号“↑”とともに入力されている文字部分を認識す
る。この文字部分(共通パターン)は、前述のように偏
を表す文字(例えば“言”や“木”等)であっても良
く、或いは、例えば旁やカンムリ、シンニュウ等であっ
ても良い。次にステップS9に進み、その文字部分を共
通パターン専用辞書5を参照して文字認識を行う。こう
して、その偏或いは旁部分等の文字(共通パターン)が
決定されるとステップS10に進み、その共通パターン
を含む漢字を共通パターングループ辞書10より読出
し、例えば図6に示すように表示部104に表示する。
【0026】ステップS11では、この表示された候補
漢字の内から所望の漢字を選択されるまで、ステップS
10とステップS11を繰返し実行する。ここで、例え
ば共通パターングループに含まれる漢字の数が多くて1
画面上に表示できないときは、スクロールや画面切換機
能等を用いて漢字表示を切り換え、所望の漢字が表示さ
れて選択されるまで、漢字表示が繰返される。こうして
所望の漢字が選択されると、その漢字を認識された文字
として確定する。
【0027】以上説明したように本実施例によれば、手
書きにより文字を入力して文字認識を行って文字入力を
行う際、操作者が漢字文字の部首部分の様に、複数の漢
字に共通するパターン部分しか記憶していない場合であ
っても、その共通するパターン(例えば偏)を指示する
ことにより、その共通パターンを持つ文字候補を一覧表
示して選択できる。このように、漢字の詳細を正確に記
憶していない場合であっても、その部首などを指示する
だけで正確な漢字を入力できる。
【0028】尚、前述の実施例においては、初めに共通
パターン識別記号を検出し、その結果により共通パター
ン部の文字認識と、通常の文字認識とをそれぞれ独立し
て実行していたが、図8に示す様に初めに共通パターン
の文字を認識する(4)。そして、13において対象と
する入力データに共通パターンが存在するかどうかを判
断し、存在するときはその種類を検出して文字認識処理
13に進む。この文字認識処理6では、共通パターンの
種類を文字認識処理の前処理である大分類処理のための
データとして使用して文字認識処理6を実行する。これ
により、共通パターンを含む漢字に対して、より早い認
識辞書7の参照を行うことができる、また、前記大分類
化した認識辞書7は、前述の共通パターングループ辞書
10としても使用でき、これらの辞書を共通化すること
で大幅なメモリ容量の節約となる。
【0029】また、前述実施例においては、いずれも場
合も共通パターンにより候補として抽出される共通パタ
ーンを含むグループを、例えば漢字文字における部首記
号の様に共通の記号イメージ情報を持つグループとし
た。しかし、この共通パターンを文字(文字列)や記号
(記号列)とし、共通パターングループ辞書10に単語
等の意味が同じであるか、或いは共通する概念を含む文
字或いは文字列(記号、記号列を含む)などを共通パタ
ーンを登録してもよい。
【0030】この様な構成にすることにより、例えば共
通文字パターン“関東”に対する共通のグループとして
認識される共通パターングループ辞書10に、“東京
都”、“神奈川県”、“埼玉県”、“千葉県”、“茨城
県”、“栃木県”、“群馬県”といった同じ関東地方に
位置している県名を登録しておくことで、操作者が“関
東↑”と入力だけで、関東地方の一都六県を選択候補と
して出力することができる。これにより、入力の手間を
大幅に簡略化することが可能である。
【0031】尚、本発明は複数の機器から構成されるシ
ステムに適用しても、1つの機器からなる装置に適用し
ても良い。また、本発明はシステム或は装置に、本発明
を実施するプログラムを供給することによって達成され
る場合にも適用できることはいうまでもない。
【0032】以上説明したように本実施例によれば、入
力する文字に、他の多くの文字にも共通に含まれる共通
部分が存在する場合には、その共通部分と、他の部分が
不明である旨を示す識別記号を入力するだけで、自動的
に文字候補の一覧を表示して所望の文字を選択できる。
こうして文字の詳細部分が不明である文字に関しても容
易に入力が行えるという効果がある。
【0033】
【発明の効果】以上説明したように本発明によれば、複
数の文字に共通な共通部分を指示するだけで、所望の文
字を入力できる効果がある。
【図面の簡単な説明】
【図1】本実施例の文字認識装置の機能構成を認識処理
ルーチンの形式で示すブロック図である。
【図2】従来の文字認識装置の機能構成を認識処理ルー
チンの形式で示すブロック図である。
【図3】本実施例の文字認識装置の概略構成を示すブロ
ック図である。
【図4】本実施例の文字認識装置の入力デバイスで入力
された文字パターン例を示す図である。
【図5】図4に示す入力データを本実施例の文字認識装
置で認識した結果を示す図である。
【図6】本実施例の文字認識装置における共通パターン
“言”を含む候補文字列の表示例を示す図である。
【図7】本実施例の文字認識装置における文字認識処理
を示すフローチャートである。
【図8】本発明の他の実施例の文字認識装置の機能構成
を認識処理ルーチンの形式で示すブロック図である。
【符号の簡単な説明】
1 入力デバイス 2 文字切り及び正規化処理 4 共通パターン認識処理 5 共通パターン専用辞書 6 文字認識処理 7 認識辞書 8 候補選択指示処理 9 表示候補選択部 10 共通パターングループ辞書 11 候補表示処理 12 文字確定処理 101 CPU 102 ROM 103 RAM 104 表示部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 原田 隆史 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 高須 英司 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 新井 常一 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 文字形状に関連する文字情報を入力して
    認識する文字認識装置であって、 前記文字情報に含まれる、複数の文字に共通する共通部
    分を識別する識別手段と、 前記識別手段により識別された共通部分を含む文字を抽
    出する抽出手段と、 前記抽出手段により抽出された文字の中から所望の文字
    を選択する選択手段と、 を有することを特徴とする文字認識装置。
  2. 【請求項2】 文字形状に関連する文字情報を入力して
    認識する文字認識装置であって、 前記文字情報が、複数の文字に共通する共通部分を含む
    か否かを判別する判別手段と、 前記判別手段により共通部分を含むと判別されると、前
    記共通部分に基づいて前記文字情報を分類する分類手段
    と、 前記分類手段により分類された文字群の中から所望の文
    字を選択する選択手段と、 を有することを特徴とする文字認識装置。
  3. 【請求項3】 文字形状に関連する文字情報を入力して
    認識する文字認識方法であって、 入力した文字情報に含まれる、複数の文字に共通する共
    通部分を識別する工程と、 その識別された共通部分を含む文字を辞書より抽出する
    工程と、 それら抽出された文字の中から所望の文字を選択する工
    程と、 を有することを特徴とする文字認識方法。
JP4228336A 1992-08-27 1992-08-27 文字認識方法及び装置 Pending JPH0676115A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4228336A JPH0676115A (ja) 1992-08-27 1992-08-27 文字認識方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4228336A JPH0676115A (ja) 1992-08-27 1992-08-27 文字認識方法及び装置

Publications (1)

Publication Number Publication Date
JPH0676115A true JPH0676115A (ja) 1994-03-18

Family

ID=16874866

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4228336A Pending JPH0676115A (ja) 1992-08-27 1992-08-27 文字認識方法及び装置

Country Status (1)

Country Link
JP (1) JPH0676115A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960011770A (ko) * 1994-09-14 1996-04-20 가나이 쯔도무 패턴인식방법 및 장치와 패턴데이타 처리장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR960011770A (ko) * 1994-09-14 1996-04-20 가나이 쯔도무 패턴인식방법 및 장치와 패턴데이타 처리장치

Similar Documents

Publication Publication Date Title
US5579408A (en) Character recognition method and apparatus
KR100658119B1 (ko) 문자 인식 장치 및 방법
JP2713622B2 (ja) 表形式文書読取装置
JPH06274680A (ja) 文書認識方法およびシステム
JPH11120293A (ja) 文字認識/修正方式
US6408091B1 (en) Information processing method and apparatus with mixing of processing command input strokes and input strokes for patterns
JPH07146918A (ja) 手書き文字認識装置
JPH09204492A (ja) 帳票処理装置
JPH05225399A (ja) 文書処理装置
JPH0676115A (ja) 文字認識方法及び装置
JPH06266899A (ja) 手書き入力システム
JP3376808B2 (ja) 単語入力装置並びに単語入力方法
JP2731394B2 (ja) 文字入力装置
JP2568168B2 (ja) 情報処理方法
JPH1021327A (ja) オンライン手書き文字入力装置及び認識候補通知方法
JPH05135213A (ja) 文書処理装置
JP2991909B2 (ja) 文書処理装置および文書処理方法
JPH0527916B2 (ja)
JPH0527914B2 (ja)
JPH08293002A (ja) 文字認識装置及び文字認識方法
JPH08106513A (ja) 手書き文字認識装置
JPH05108867A (ja) パターン認識装置
JPH0756666B2 (ja) 情報認識方法
JP2549831B2 (ja) 文字認識装置の入力パターン・文字列登録方法
JPH096894A (ja) 文字認識装置及び方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20010803