JPH07200737A - 文字認識方法およびシステム - Google Patents
文字認識方法およびシステムInfo
- Publication number
- JPH07200737A JPH07200737A JP5335592A JP33559293A JPH07200737A JP H07200737 A JPH07200737 A JP H07200737A JP 5335592 A JP5335592 A JP 5335592A JP 33559293 A JP33559293 A JP 33559293A JP H07200737 A JPH07200737 A JP H07200737A
- Authority
- JP
- Japan
- Prior art keywords
- character
- character recognition
- feature amount
- language
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
Abstract
(57)【要約】
【目的】 上位装置に接続された一つの文字認識装置の
みで複数の言語や文字種の文字認識を可能にする文字認
識技術を提供する。 【構成】 複数の言語向けの特徴量辞書108〜109
と、複数の言語向けの特徴量抽出プログラム106〜1
07を持つホスト計算機100と、書き換え可能で任意
の特徴量辞書がロードされる辞書媒体113,書き換え
可能で任意の特徴量抽出プログラムがロードされる特徴
量抽出部111,言語に依存せず、複数種の言語の文字
認識に共通に用いられるマッチング部112を持つ文字
認識装置110とが、通信路114により接続され、任
意の言語の認識に際して、当該言語に対応した特徴量辞
書および特徴量抽出プログラムを文字認識装置110に
ダウンロードすることにより一つの文字認識装置110
で複数の言語の文字認識処理を可能にした文字認識シス
テムである。
みで複数の言語や文字種の文字認識を可能にする文字認
識技術を提供する。 【構成】 複数の言語向けの特徴量辞書108〜109
と、複数の言語向けの特徴量抽出プログラム106〜1
07を持つホスト計算機100と、書き換え可能で任意
の特徴量辞書がロードされる辞書媒体113,書き換え
可能で任意の特徴量抽出プログラムがロードされる特徴
量抽出部111,言語に依存せず、複数種の言語の文字
認識に共通に用いられるマッチング部112を持つ文字
認識装置110とが、通信路114により接続され、任
意の言語の認識に際して、当該言語に対応した特徴量辞
書および特徴量抽出プログラムを文字認識装置110に
ダウンロードすることにより一つの文字認識装置110
で複数の言語の文字認識処理を可能にした文字認識シス
テムである。
Description
【0001】
【産業上の利用分野】本発明は文字認識技術に関し、特
に、手書き或いは印刷文字等の多様な言語や書体の文字
の認識処理の効率化に適用して有効な技術に関する。
に、手書き或いは印刷文字等の多様な言語や書体の文字
の認識処理の効率化に適用して有効な技術に関する。
【0002】
【従来の技術】たとえば、情報処理の分野では、所定の
帳票に手書きや印刷等によって記載された文字を光学文
字認識等によって自動的に読み取ってコード化すること
により、情報の入力処理の効率化を図ることが知られて
いる。
帳票に手書きや印刷等によって記載された文字を光学文
字認識等によって自動的に読み取ってコード化すること
により、情報の入力処理の効率化を図ることが知られて
いる。
【0003】ところで、文字認識操作では、通常、個々
の文字画像毎の形状等の特徴情報を所定のアルゴリズム
によって抽出し、当該特徴量情報を、個々の文字コード
と特徴情報とが対応付けて格納された辞書データと照合
することが行われる。このため、認識対象の文字種が変
化した場合、認識操作の基準となる辞書データを当該文
字種に対応したものに切り換える必要がある。
の文字画像毎の形状等の特徴情報を所定のアルゴリズム
によって抽出し、当該特徴量情報を、個々の文字コード
と特徴情報とが対応付けて格納された辞書データと照合
することが行われる。このため、認識対象の文字種が変
化した場合、認識操作の基準となる辞書データを当該文
字種に対応したものに切り換える必要がある。
【0004】たとえば、特開昭61−29976号公報
に開示される「文字認識方法」の技術では、一つの言語
での文字の字体や字形の違い、例えば日本語では明朝体
とゴシック体を辞書の切り替えで対処しようとしてい
る。すなわち、当該技術では、印刷された文字の字形を
識別し、それに対応する辞書を複数の辞書の中から選択
して文字認識を行うことにより、字体の異なる文字の認
識を高速かつ高精度で実施しようとするものである。
に開示される「文字認識方法」の技術では、一つの言語
での文字の字体や字形の違い、例えば日本語では明朝体
とゴシック体を辞書の切り替えで対処しようとしてい
る。すなわち、当該技術では、印刷された文字の字形を
識別し、それに対応する辞書を複数の辞書の中から選択
して文字認識を行うことにより、字体の異なる文字の認
識を高速かつ高精度で実施しようとするものである。
【0005】
【発明が解決しようとする課題】従来の技術では、例え
ば英語と日本語の文字のように字体、字形や字種の大き
く異なる文字画像の文字認識を一つの文字認識装置で実
現するのは不可能である。というのも言語に依っては抽
出される特徴量の定義自身も大きく変わり得るので、辞
書の切り替えのみでは複数の言語の文字認識に対処でき
ないからである。マッチングの元になる特徴量を抽出す
る処理と辞書は言語に依存するので、この2つを言語毎
に切り替えることが出来ない限り複数の言語の文字認識
は不可能である。
ば英語と日本語の文字のように字体、字形や字種の大き
く異なる文字画像の文字認識を一つの文字認識装置で実
現するのは不可能である。というのも言語に依っては抽
出される特徴量の定義自身も大きく変わり得るので、辞
書の切り替えのみでは複数の言語の文字認識に対処でき
ないからである。マッチングの元になる特徴量を抽出す
る処理と辞書は言語に依存するので、この2つを言語毎
に切り替えることが出来ない限り複数の言語の文字認識
は不可能である。
【0006】一般に特徴量辞書とのマッチングで文字認
識するマッチング方式では、マッチング処理そのものは
言語には依存しないが、特徴量辞書中に格納される文字
の特徴量の内容あるいは値自身は言語に依存する。加え
てこの特徴量辞書と比較される文字の特徴量抽出処理自
身も言語に依存する。したがって一つの認識装置のみで
特徴量辞書の内容とこれと比較される文字の特徴量抽出
処理の2つを言語毎に切り替えることができれば、この
装置のみで複数の言語の文字認識が可能である。
識するマッチング方式では、マッチング処理そのものは
言語には依存しないが、特徴量辞書中に格納される文字
の特徴量の内容あるいは値自身は言語に依存する。加え
てこの特徴量辞書と比較される文字の特徴量抽出処理自
身も言語に依存する。したがって一つの認識装置のみで
特徴量辞書の内容とこれと比較される文字の特徴量抽出
処理の2つを言語毎に切り替えることができれば、この
装置のみで複数の言語の文字認識が可能である。
【0007】本発明の目的は、個々の言語や文字種に依
存する特徴量抽出プログラムおよび特徴量情報を動的に
切り換えることにより、一つの文字認識装置で複数の言
語や文字種を認識することが可能な文字認識技術を提供
することにある。
存する特徴量抽出プログラムおよび特徴量情報を動的に
切り換えることにより、一つの文字認識装置で複数の言
語や文字種を認識することが可能な文字認識技術を提供
することにある。
【0008】本発明の前記ならびにその他の目的と新規
な特徴は、本明細書の記述および添付図面から明らかに
なるであろう。
な特徴は、本明細書の記述および添付図面から明らかに
なるであろう。
【0009】
【課題を解決するための手段】本願において開示される
発明のうち、代表的なものの概要を簡単に説明すれば、
以下のとおりである。
発明のうち、代表的なものの概要を簡単に説明すれば、
以下のとおりである。
【0010】すなわち、請求項1記載の発明は、複数の
言語または文字種の各々に依存する複数種の特徴量抽出
プログラムおよび特徴量情報を持つ上位装置と、特徴量
抽出プログラムおよび特徴量情報が書き替え可能に格納
される記憶領域を有する文字認識装置を通信路を介して
接続する第1の段階と、特定の言語または文字種の認識
操作に先立って、当該言語または文字種に対応した特定
の特徴量抽出プログラムおよび特徴量情報を上位装置か
ら文字認識装置へと転送する第2の段階と、上位装置か
ら転送された特定の特徴量抽出プログラムおよび特徴量
情報を用いて文字認識装置が任意の言語または文字種の
認識を行う第3の段階とからなる文字認識方法である。
言語または文字種の各々に依存する複数種の特徴量抽出
プログラムおよび特徴量情報を持つ上位装置と、特徴量
抽出プログラムおよび特徴量情報が書き替え可能に格納
される記憶領域を有する文字認識装置を通信路を介して
接続する第1の段階と、特定の言語または文字種の認識
操作に先立って、当該言語または文字種に対応した特定
の特徴量抽出プログラムおよび特徴量情報を上位装置か
ら文字認識装置へと転送する第2の段階と、上位装置か
ら転送された特定の特徴量抽出プログラムおよび特徴量
情報を用いて文字認識装置が任意の言語または文字種の
認識を行う第3の段階とからなる文字認識方法である。
【0011】また、請求項2記載の発明は、複数の言語
または文字種の各々に関する複数種の特徴量抽出プログ
ラムおよび特徴量情報を持つ上位装置と、特徴量抽出プ
ログラムおよび特徴量情報が書き替え可能に格納される
記憶領域を有する文字認識装置と、上位装置と文字認識
装置とを接続する通信路とからなる文字認識システムで
ある。
または文字種の各々に関する複数種の特徴量抽出プログ
ラムおよび特徴量情報を持つ上位装置と、特徴量抽出プ
ログラムおよび特徴量情報が書き替え可能に格納される
記憶領域を有する文字認識装置と、上位装置と文字認識
装置とを接続する通信路とからなる文字認識システムで
ある。
【0012】また、請求項3記載の発明は、請求項2記
載の文字認識システムにおいて、特定の言語または文字
種に関する特徴量抽出プログラムおよび特徴量情報を、
通信路を経由して上位装置から文字認識装置の記憶領域
に転送して格納した後、特徴量抽出プログラムを実行し
て個々の入力文字画像から特徴量を抽出し、特徴量を特
徴量情報と照合して文字認識操作を行うようにしたもの
である。
載の文字認識システムにおいて、特定の言語または文字
種に関する特徴量抽出プログラムおよび特徴量情報を、
通信路を経由して上位装置から文字認識装置の記憶領域
に転送して格納した後、特徴量抽出プログラムを実行し
て個々の入力文字画像から特徴量を抽出し、特徴量を特
徴量情報と照合して文字認識操作を行うようにしたもの
である。
【0013】
【作用】上記した本発明の文字認識技術によれば、 (1)言語に依存する特徴量辞書と特徴量抽出プログラ
ムをホスト計算機上に保存し、認識しようとする言語に
応じてこの特徴量辞書と特徴量抽出プログラムを選択し
て、ホスト計算機に接続された文字認識装置に転送す
る。
ムをホスト計算機上に保存し、認識しようとする言語に
応じてこの特徴量辞書と特徴量抽出プログラムを選択し
て、ホスト計算機に接続された文字認識装置に転送す
る。
【0014】(2)文字認識装置側では(1)で転送さ
れた特徴量辞書と特徴量抽出プログラムを通信制御部を
経由して受け取り、これを読み書き可能な記憶装置内に
格納する。
れた特徴量辞書と特徴量抽出プログラムを通信制御部を
経由して受け取り、これを読み書き可能な記憶装置内に
格納する。
【0015】(3)特徴量辞書とのマッチング等の言語
に依存しない処理はハードウエアで実現したり、或いは
書き込み不可能な記憶域上のプログラムで実現すること
により認識装置内で固定化する。
に依存しない処理はハードウエアで実現したり、或いは
書き込み不可能な記憶域上のプログラムで実現すること
により認識装置内で固定化する。
【0016】という操作を行うことができる。
【0017】これにより、個々の文字画像の特徴量と、
基準となる特徴量情報が格納された辞書等とのマッチン
グ処理等の言語に依存しない処理のみが文字認識装置内
で固定化され、特徴量情報や特徴量抽出プログラムのよ
うな言語に依存する部分は上位装置上に在り、文字認識
装置内ではこれら言語に依存する部分を可変とすること
ができる。したがって認識しようとする言語が変われ
ば、上位装置側から新たにその言語の特徴量情報と特徴
量抽出プログラムを転送し直すことにより、一つの文字
認識装置で複数の言語の文字認識が可能となる。
基準となる特徴量情報が格納された辞書等とのマッチン
グ処理等の言語に依存しない処理のみが文字認識装置内
で固定化され、特徴量情報や特徴量抽出プログラムのよ
うな言語に依存する部分は上位装置上に在り、文字認識
装置内ではこれら言語に依存する部分を可変とすること
ができる。したがって認識しようとする言語が変われ
ば、上位装置側から新たにその言語の特徴量情報と特徴
量抽出プログラムを転送し直すことにより、一つの文字
認識装置で複数の言語の文字認識が可能となる。
【0018】
【実施例】以下、本発明の実施例を図面を参照しながら
詳細に説明する。
詳細に説明する。
【0019】図1は本発明の一実施例である文字認識シ
ステムのブロック図であり、図2は、その作用の一例を
示す概念図、さらに図3は、その一部をさらに詳細に示
すブロック図、図4は、その作用の一例を示す概念図、
図5は、その一部を取り出して示す概念図、図6は、そ
の作用の一例を示すフローチャートである。
ステムのブロック図であり、図2は、その作用の一例を
示す概念図、さらに図3は、その一部をさらに詳細に示
すブロック図、図4は、その作用の一例を示す概念図、
図5は、その一部を取り出して示す概念図、図6は、そ
の作用の一例を示すフローチャートである。
【0020】本実施例の文字認識システムは、ホスト計
算機100、文字認識装置110とこの2つを結合する
通信路114から構成される。ここでは文字認識は以下
の手順で実施される。
算機100、文字認識装置110とこの2つを結合する
通信路114から構成される。ここでは文字認識は以下
の手順で実施される。
【0021】まずホスト計算機100では計算機上に在
る複数の言語の特徴量抽出プログラム202(特徴量抽
出プログラム106〜107)の中から認識しようとす
る言語の特徴量抽出プログラム202を選んで文字認識
装置110に転送して装着する。これが特徴量抽出プロ
グラムの設定101である。
る複数の言語の特徴量抽出プログラム202(特徴量抽
出プログラム106〜107)の中から認識しようとす
る言語の特徴量抽出プログラム202を選んで文字認識
装置110に転送して装着する。これが特徴量抽出プロ
グラムの設定101である。
【0022】次に辞書の設定102では複数の言語の特
徴量辞書201(特徴量辞書108〜109)の中から
認識しようとする言語の特徴量辞書201が選ばれ、同
様に文字認識装置110に転送して装着される。この2
つにより文字認識の準備が完成する。
徴量辞書201(特徴量辞書108〜109)の中から
認識しようとする言語の特徴量辞書201が選ばれ、同
様に文字認識装置110に転送して装着される。この2
つにより文字認識の準備が完成する。
【0023】次に文字認識が開始される。まず、ホスト
計算機100における画像入力103で認識しようとす
る文書はイメージデータとして入力される。この文書画
像の中から文字の領域が文字切り104で抽出される。
次に処理は文字認識装置110に移行する。ここではま
ず特徴量抽出部111で抽出された文字領域の文字の画
像からその特徴を表す値である特徴量が抽出される。こ
のとき実行されるのが特徴量抽出プログラムの設定10
1で文字認識装置110に装着された特徴量抽出プログ
ラム202である。
計算機100における画像入力103で認識しようとす
る文書はイメージデータとして入力される。この文書画
像の中から文字の領域が文字切り104で抽出される。
次に処理は文字認識装置110に移行する。ここではま
ず特徴量抽出部111で抽出された文字領域の文字の画
像からその特徴を表す値である特徴量が抽出される。こ
のとき実行されるのが特徴量抽出プログラムの設定10
1で文字認識装置110に装着された特徴量抽出プログ
ラム202である。
【0024】抽出された特徴量は辞書の設定102で文
字認識装置110の辞書媒体113に転送された特徴量
辞書201の中の各々の特徴量と比較され、この中で最
も類似度の高かった文字が最終的に選ばれる。このよう
な処理を辞書とのマッチングといい、マッチング部11
2が当該マッチングを実行する。最後に選ばれた結果の
文字はホスト計算機100上における結果の校正105
で修正される。このように認識しようとする文字の特徴
量を抽出して、これとすでに在る特徴量辞書201とを
マッチングして文字認識する方法をマッチング方式と呼
び、本実施例ではこの方式で文字認識する。
字認識装置110の辞書媒体113に転送された特徴量
辞書201の中の各々の特徴量と比較され、この中で最
も類似度の高かった文字が最終的に選ばれる。このよう
な処理を辞書とのマッチングといい、マッチング部11
2が当該マッチングを実行する。最後に選ばれた結果の
文字はホスト計算機100上における結果の校正105
で修正される。このように認識しようとする文字の特徴
量を抽出して、これとすでに在る特徴量辞書201とを
マッチングして文字認識する方法をマッチング方式と呼
び、本実施例ではこの方式で文字認識する。
【0025】ホスト計算機100から文字認識装置11
0へは図2に示すように通信路114を経由して特徴量
辞書201、特徴量抽出プログラム202、文字の原画
像203と文字切り情報204が転送される。特徴量辞
書201は図1の辞書の設定102で選択された特定の
言語の特徴量辞書が送られたものであり、特徴量抽出プ
ログラム202は図1の特徴量抽出プログラムの設定1
01で選ばれた特定の言語の特徴量抽出プログラムが送
られたものである。さらに図1の画像入力103で読み
込まれた文字の原画像203やこの画像上の文字の位置
座標を示す文字切り情報204が送られる。文字認識装
置110で認識された文字は同様に通信路114を経由
してホスト計算機100へ文字列205として返され
る。
0へは図2に示すように通信路114を経由して特徴量
辞書201、特徴量抽出プログラム202、文字の原画
像203と文字切り情報204が転送される。特徴量辞
書201は図1の辞書の設定102で選択された特定の
言語の特徴量辞書が送られたものであり、特徴量抽出プ
ログラム202は図1の特徴量抽出プログラムの設定1
01で選ばれた特定の言語の特徴量抽出プログラムが送
られたものである。さらに図1の画像入力103で読み
込まれた文字の原画像203やこの画像上の文字の位置
座標を示す文字切り情報204が送られる。文字認識装
置110で認識された文字は同様に通信路114を経由
してホスト計算機100へ文字列205として返され
る。
【0026】本実施例におけるマッチング方式の文字認
識では通常言語毎に特徴量の定義が異なるので、認識し
ようとする文字の特徴量抽出プログラム202や特徴量
辞書201は言語に依存するがマッチング処理自身は単
に値の比較にすぎないので言語には依存しない。このよ
うなことから本実施例では図1の辞書の設定102と特
徴量抽出プログラムの設定102で、それぞれ言語に依
存する特徴量辞書201と特徴量抽出プログラム202
を言語毎に切り替えることにより一つの文字認識装置1
10で複数の言語の認識を可能とする。これにより複数
の言語の文字を一つの文字認識装置110で認識するこ
とが可能になる。
識では通常言語毎に特徴量の定義が異なるので、認識し
ようとする文字の特徴量抽出プログラム202や特徴量
辞書201は言語に依存するがマッチング処理自身は単
に値の比較にすぎないので言語には依存しない。このよ
うなことから本実施例では図1の辞書の設定102と特
徴量抽出プログラムの設定102で、それぞれ言語に依
存する特徴量辞書201と特徴量抽出プログラム202
を言語毎に切り替えることにより一つの文字認識装置1
10で複数の言語の認識を可能とする。これにより複数
の言語の文字を一つの文字認識装置110で認識するこ
とが可能になる。
【0027】図3では上に述べた特徴量辞書と特徴量抽
出プログラムの切り替えを実現するための文字認識装置
110の内部の構成を示している。特徴量抽出部111
はマイクロプロセッサ303(CPU)上で書き込み可
能なメモリ302(RAM )上にロードされた特徴量抽出
プログラム202が実行されて実現される。またマッチ
ング部112は特徴量抽出部111と異なり全てハード
ウエアのみで実現されている。文字認識装置110内で
は文字認識は以下の手順で行われる。
出プログラムの切り替えを実現するための文字認識装置
110の内部の構成を示している。特徴量抽出部111
はマイクロプロセッサ303(CPU)上で書き込み可
能なメモリ302(RAM )上にロードされた特徴量抽出
プログラム202が実行されて実現される。またマッチ
ング部112は特徴量抽出部111と異なり全てハード
ウエアのみで実現されている。文字認識装置110内で
は文字認識は以下の手順で行われる。
【0028】まず特徴量辞書201と特徴量抽出プログ
ラム202がホスト計算機100より通信路114を経
由して文字認識装置110に送られる。文字認識装置1
10内では通信制御部300を経由して受領した特徴量
辞書201と特徴量抽出プログラム202を、書き込み
可能な辞書媒体113およびメモリ302上にロードす
る。
ラム202がホスト計算機100より通信路114を経
由して文字認識装置110に送られる。文字認識装置1
10内では通信制御部300を経由して受領した特徴量
辞書201と特徴量抽出プログラム202を、書き込み
可能な辞書媒体113およびメモリ302上にロードす
る。
【0029】次にマイクロプロセッサ303は通信制御
部200を経由してホスト計算機100から通信路11
4に送り出された原画像203と文字切り情報204を
受け取り、これをメモリ301(RAM )にロードする。
その後、先にロードされメモリ302上にある特徴量抽
出プログラム202をマイクロプロセッサ303上で実
行する。この実行によって抽出された特徴量がメモリ3
04(RAM )上に書き込まれる。この特徴量が先にロー
ドされた辞書媒体113中の特徴量辞書201の各々の
文字の特徴量とマッチングされる。そして選択された最
も類似度の高い文字が選ばれる。最後に、この文字の文
字コードなどからなる文字列205が通信路114を経
由してホスト計算機に送り返される。
部200を経由してホスト計算機100から通信路11
4に送り出された原画像203と文字切り情報204を
受け取り、これをメモリ301(RAM )にロードする。
その後、先にロードされメモリ302上にある特徴量抽
出プログラム202をマイクロプロセッサ303上で実
行する。この実行によって抽出された特徴量がメモリ3
04(RAM )上に書き込まれる。この特徴量が先にロー
ドされた辞書媒体113中の特徴量辞書201の各々の
文字の特徴量とマッチングされる。そして選択された最
も類似度の高い文字が選ばれる。最後に、この文字の文
字コードなどからなる文字列205が通信路114を経
由してホスト計算機に送り返される。
【0030】図4は文字切り情報を英語と日本語につい
て例示したものである。この文字切り情報は読み込まれ
た画像上の文字の領域を囲む矩形により表現される。こ
の矩形に囲まれた部分が文字と判断される。401は英
語の文字切り情報、402は日本語の文字切り情報を示
す。この文字切り情報はホスト計算機上で図1の文字切
り104にて計算され、文字認識装置110に文字の原
画像とともに転送される。文字認識装置110では文字
切り情報により指定される文字の画像よりその文字の特
徴量を抽出する。
て例示したものである。この文字切り情報は読み込まれ
た画像上の文字の領域を囲む矩形により表現される。こ
の矩形に囲まれた部分が文字と判断される。401は英
語の文字切り情報、402は日本語の文字切り情報を示
す。この文字切り情報はホスト計算機上で図1の文字切
り104にて計算され、文字認識装置110に文字の原
画像とともに転送される。文字認識装置110では文字
切り情報により指定される文字の画像よりその文字の特
徴量を抽出する。
【0031】図5は特徴量辞書201の構成の例であ
る。特徴量辞書201は各々の文字毎にその特徴量50
1と文字(文字コード502)を対にした表である。一
つの文字の特徴量501は通常複数の要素値の集まりで
ある。この要素の一つひとつが、メモリ304に格納さ
れた認識対象の文字の特徴量の要素とマッチングされ
る。この特徴量辞書201中の1文字のマッチングでそ
の文字との類似度が判明する。このマッチングを特徴量
辞書201中の全文字に渡って実行し、その中で最も高
い類似度の文字が最終的に選択される。言語が変われば
当然一つの文字の特徴量の要素値は変わるが、上に述べ
たマッチングの処理自体は変わらない。そこで、本実施
例では図3に見るようにマッチング部112をハードウ
エアにより実現している。これにより高速なマッチング
処理が可能になる。
る。特徴量辞書201は各々の文字毎にその特徴量50
1と文字(文字コード502)を対にした表である。一
つの文字の特徴量501は通常複数の要素値の集まりで
ある。この要素の一つひとつが、メモリ304に格納さ
れた認識対象の文字の特徴量の要素とマッチングされ
る。この特徴量辞書201中の1文字のマッチングでそ
の文字との類似度が判明する。このマッチングを特徴量
辞書201中の全文字に渡って実行し、その中で最も高
い類似度の文字が最終的に選択される。言語が変われば
当然一つの文字の特徴量の要素値は変わるが、上に述べ
たマッチングの処理自体は変わらない。そこで、本実施
例では図3に見るようにマッチング部112をハードウ
エアにより実現している。これにより高速なマッチング
処理が可能になる。
【0032】図6はホスト計算機100での特徴量抽出
の設定101と辞書の設定102の処理の流れを示した
ものである。この2つの処理により文字認識装置110
の認識動作の準備が完成する。
の設定101と辞書の設定102の処理の流れを示した
ものである。この2つの処理により文字認識装置110
の認識動作の準備が完成する。
【0033】まず認識しようとする言語の種類、例えば
日本語や英語の違いを利用者に指定させる(ステップ6
01)。次に指定された言語の特徴量抽出プログラムを
各々の言語のそれの中から探索する(ステップ60
2)。もしなければこの言語の指定は誤りとなる。あれ
ばこれを文字認識装置110に転送する(ステップ60
3)。この転送で誤りが生じた場合には転送エラー処理
が動作する(ステップ604,ステップ605)。転送
誤りがなければ文字認識装置110中への特徴量抽出プ
ログラムの装着は完成する。
日本語や英語の違いを利用者に指定させる(ステップ6
01)。次に指定された言語の特徴量抽出プログラムを
各々の言語のそれの中から探索する(ステップ60
2)。もしなければこの言語の指定は誤りとなる。あれ
ばこれを文字認識装置110に転送する(ステップ60
3)。この転送で誤りが生じた場合には転送エラー処理
が動作する(ステップ604,ステップ605)。転送
誤りがなければ文字認識装置110中への特徴量抽出プ
ログラムの装着は完成する。
【0034】次に辞書の設定102である。ここではま
ず指定された言語の特徴量辞書を探索する(ステップ6
06)。あればこれを文字認識装置110に転送する
(ステップ607)。この時、誤りあればエラー処理と
なる(ステップ608,ステップ609)。以上の2つ
の処理により初めて文字認識装置110が指定された言
語に関して文字認識可能な状態となる。
ず指定された言語の特徴量辞書を探索する(ステップ6
06)。あればこれを文字認識装置110に転送する
(ステップ607)。この時、誤りあればエラー処理と
なる(ステップ608,ステップ609)。以上の2つ
の処理により初めて文字認識装置110が指定された言
語に関して文字認識可能な状態となる。
【0035】以上本発明者によってなされた発明を実施
例に基づき具体的に説明したが、本発明は前記実施例に
限定されるものではなく、その要旨を逸脱しない範囲で
種々変更可能であることはいうまでもない。
例に基づき具体的に説明したが、本発明は前記実施例に
限定されるものではなく、その要旨を逸脱しない範囲で
種々変更可能であることはいうまでもない。
【0036】
【発明の効果】本願において開示される発明のうち、代
表的なものによって得られる効果を簡単に説明すれば、
以下のとおりである。
表的なものによって得られる効果を簡単に説明すれば、
以下のとおりである。
【0037】すなわち、本発明の文字認識方法によれ
ば、個々の言語や文字種に依存する特徴量抽出プログラ
ムおよび特徴量情報を動的に切り換えることにより、一
つの文字認識装置で複数の言語や文字種を認識すること
ができる、という効果が得られる。
ば、個々の言語や文字種に依存する特徴量抽出プログラ
ムおよび特徴量情報を動的に切り換えることにより、一
つの文字認識装置で複数の言語や文字種を認識すること
ができる、という効果が得られる。
【0038】また、本発明の文字認識システムによれ
ば、個々の言語や文字種に依存する特徴量抽出プログラ
ムおよび特徴量情報を動的に切り換えることにより、一
つの文字認識装置で複数の言語や文字種を認識すること
ができる、という効果が得られる。
ば、個々の言語や文字種に依存する特徴量抽出プログラ
ムおよび特徴量情報を動的に切り換えることにより、一
つの文字認識装置で複数の言語や文字種を認識すること
ができる、という効果が得られる。
【図1】本発明の一実施例である文字認識システムのブ
ロック図である。
ロック図である。
【図2】その作用の一例を示す概念図である。
【図3】その一部をさらに詳細に示すブロック図であ
る。
る。
【図4】その作用の一例を示す概念図である。
【図5】その一部を取り出して示す概念図である。
【図6】その作用の一例を示すフローチャートである。
100 ホスト計算機 101 特徴量抽出の設定 102 辞書の設定 103 画像入力 104 文字切り 105 結果の校正 106〜107 特徴量抽出プログラム 108〜109 特徴量辞書 110 文字認識装置 111 特徴量抽出部 112 マッチング部 113 辞書媒体 114 通信路 200 通信制御部 201 特徴量辞書 202 特徴量抽出プログラム 203 原画像 204 文字切り情報 205 文字列 300 通信制御部 301 メモリ 302 メモリ 303 マイクロプロセッサ 304 メモリ 401 文字切り情報 402 文字切り情報 501 特徴量 502 文字コード
Claims (3)
- 【請求項1】 複数の言語または文字種の各々に依存す
る複数種の特徴量抽出プログラムおよび特徴量情報を持
つ上位装置と、前記特徴量抽出プログラムおよび前記特
徴量情報が書き替え可能に格納される記憶領域を有する
文字認識装置を通信路を介して接続する第1の段階と、
特定の前記言語または文字種の認識操作に先立って、当
該言語または文字種に対応した特定の前記特徴量抽出プ
ログラムおよび前記特徴量情報を前記上位装置から前記
文字認識装置へと転送する第2の段階と、前記上位装置
から転送された特定の前記特徴量抽出プログラムおよび
前記特徴量情報を用いて前記文字認識装置が任意の前記
言語または文字種の認識を行う第3の段階とからなるこ
とを特徴とする文字認識方法。 - 【請求項2】 複数の言語または文字種の各々に関する
複数種の特徴量抽出プログラムおよび特徴量情報を持つ
上位装置と、前記特徴量抽出プログラムおよび前記特徴
量情報が書き替え可能に格納される記憶領域を有する文
字認識装置と、前記上位装置と前記文字認識装置とを接
続する通信路とからなることを特徴とする文字認識シス
テム。 - 【請求項3】 特定の言語または文字種に関する前記特
徴量抽出プログラムおよび前記特徴量情報を、前記通信
路を経由して前記上位装置から前記文字認識装置の前記
記憶領域に転送して格納した後、前記特徴量抽出プログ
ラムを実行して個々の入力文字画像から特徴量を抽出
し、前記特徴量を前記特徴量情報と照合して文字認識操
作を行うことを特徴とする請求項2記載の文字認識シス
テム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5335592A JPH07200737A (ja) | 1993-12-28 | 1993-12-28 | 文字認識方法およびシステム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5335592A JPH07200737A (ja) | 1993-12-28 | 1993-12-28 | 文字認識方法およびシステム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH07200737A true JPH07200737A (ja) | 1995-08-04 |
Family
ID=18290316
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5335592A Withdrawn JPH07200737A (ja) | 1993-12-28 | 1993-12-28 | 文字認識方法およびシステム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH07200737A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2007108128A1 (ja) * | 2006-03-23 | 2007-09-27 | Olympus Corporation | 情報呈示装置及び情報呈示端末 |
| JP2009223556A (ja) * | 2008-03-14 | 2009-10-01 | Omron Corp | 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造 |
-
1993
- 1993-12-28 JP JP5335592A patent/JPH07200737A/ja not_active Withdrawn
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2007108128A1 (ja) * | 2006-03-23 | 2007-09-27 | Olympus Corporation | 情報呈示装置及び情報呈示端末 |
| JP2009223556A (ja) * | 2008-03-14 | 2009-10-01 | Omron Corp | 文字認識プログラム、文字認識電子部品、文字認識装置、文字認識方法、およびデータ構造 |
| EP2120185A1 (en) | 2008-03-14 | 2009-11-18 | Omron Corporation | Character recognition program, character recognition electronic component, character recognition device, character recognition method, and data structure |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7630551B2 (en) | Method and system for line extraction in digital ink | |
| JP3919617B2 (ja) | 文字認識装置および文字認識方法、プログラムおよび記憶媒体 | |
| EP0687991A2 (en) | Information processing method and apparatus | |
| JPH08305821A (ja) | データ処理方法とその装置 | |
| JPH07200737A (ja) | 文字認識方法およびシステム | |
| US6885778B2 (en) | Image processing method and apparatus and storage medium | |
| JP3985926B2 (ja) | 文字認識方法、文字認識装置、文書画像処理システム及び記録媒体 | |
| JPH10134141A (ja) | 文書照合装置および方法 | |
| JPS6261990B2 (ja) | ||
| JP2968354B2 (ja) | 文字認識結果の後処理方法 | |
| JPH09179935A (ja) | 文字認識装置およびその制御方法 | |
| JPS6385695A (ja) | 連綿文字作成方式 | |
| JP2549831B2 (ja) | 文字認識装置の入力パターン・文字列登録方法 | |
| JPH077411B2 (ja) | 文書処理装置 | |
| JP2001338263A (ja) | 画像処理装置及び画像処理方法並びに記憶媒体 | |
| AU2004214901B2 (en) | Line extraction in digital ink | |
| JP3595081B2 (ja) | 文字認識方法 | |
| JP2000090200A (ja) | 文字認識方法、装置および記録媒体 | |
| JPH07111728B2 (ja) | 帳票読み取り処理装置 | |
| JPH0679351B2 (ja) | 文字編集装置 | |
| JPH10198763A (ja) | 文字認識装置およびコンピュータを文字認識装置として機能させるプログラムを格納したコンピュータが読取可能な記憶媒体 | |
| JPH01189790A (ja) | 文字認識装置 | |
| JPH0298795A (ja) | 文字認識装置 | |
| HK1012104B (en) | Character recognition method and apparatus thereof | |
| JPH0477886A (ja) | 文書読取装置の誤読文字自動修正方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20010306 |