JPH0668261A - パターン認識装置 - Google Patents
パターン認識装置Info
- Publication number
- JPH0668261A JPH0668261A JP4217946A JP21794692A JPH0668261A JP H0668261 A JPH0668261 A JP H0668261A JP 4217946 A JP4217946 A JP 4217946A JP 21794692 A JP21794692 A JP 21794692A JP H0668261 A JPH0668261 A JP H0668261A
- Authority
- JP
- Japan
- Prior art keywords
- character
- correction
- information
- recognition
- same
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
Abstract
(57)【要約】
【目的】 認識結果を短時間に、容易に、かつ精度良く
確認、修正できる文字認識装置を提供する。 【構成】 同一文字列抽出部39は、検証情報格納部3
2中の認識誤り候補の文字列、あるいはそれらの訂正候
補の文字列が同じ、あるいは類似のカテゴリから成って
いるものを同一カテゴリの文字が誤ったものと見なして
自動的に抽出する。修正処理部36は、同一文字列抽出
部39で得られた複数の同一、あるいは類似のカテゴリ
の文字列群を入力文字イメージとともに表示部35に表
示し、オペレータが文字列を複数個選択し、複数カ所を
一度に正解文字に変換したり、新たな正解文字を入力し
たりできるようにする。
確認、修正できる文字認識装置を提供する。 【構成】 同一文字列抽出部39は、検証情報格納部3
2中の認識誤り候補の文字列、あるいはそれらの訂正候
補の文字列が同じ、あるいは類似のカテゴリから成って
いるものを同一カテゴリの文字が誤ったものと見なして
自動的に抽出する。修正処理部36は、同一文字列抽出
部39で得られた複数の同一、あるいは類似のカテゴリ
の文字列群を入力文字イメージとともに表示部35に表
示し、オペレータが文字列を複数個選択し、複数カ所を
一度に正解文字に変換したり、新たな正解文字を入力し
たりできるようにする。
Description
【0001】
【産業上の利用分野】本発明は、文字、図形、音声等の
パターン情報を自動的に認識し、認識結果を検証および
確認修正するのに必要な認識情報、すなわち認識処理系
から得られる入力文字イメージまたは音声、文字の特徴
または音声の特徴、認識結果、認識結果に含まれる候補
情報である候補文字または候補コードと距離値、あるい
は類似度を保存しておく認識情報格納部と、認識情報に
対して言語処理や候補情報による検証を施し、認識誤り
候補の文字列またはコード列、およびそれらの文字列ま
たはコード列に対する訂正候補の文字列またはコード列
を抽出して検証情報格納部に記憶しておく検証処理部等
を有し、文字パターン情報またはコード列情報を計算機
で処理できるようなコードデータに変換するパターン認
識装置に関する。
パターン情報を自動的に認識し、認識結果を検証および
確認修正するのに必要な認識情報、すなわち認識処理系
から得られる入力文字イメージまたは音声、文字の特徴
または音声の特徴、認識結果、認識結果に含まれる候補
情報である候補文字または候補コードと距離値、あるい
は類似度を保存しておく認識情報格納部と、認識情報に
対して言語処理や候補情報による検証を施し、認識誤り
候補の文字列またはコード列、およびそれらの文字列ま
たはコード列に対する訂正候補の文字列またはコード列
を抽出して検証情報格納部に記憶しておく検証処理部等
を有し、文字パターン情報またはコード列情報を計算機
で処理できるようなコードデータに変換するパターン認
識装置に関する。
【0002】
【従来の技術】図11はこの種のパターン(文字)認識
装置の従来例の構成図である。イメージ入力部1は認識
対象の文字を入力し、電気信号に変換する。認識部2は
電気信号に変換された文字を入力し、個々の文字パター
ンを切り出す前処理、認識に用いるパラメータを少ない
情報で表現するための特徴抽出、入力した文字がどのカ
テゴリに属するかを判定する認識処理を施す。修正部3
Aは認識情報を用いた認識結果の検証処理や言語処理
(単語知識や言語規則)などを用いて曖昧な認識結果を
検証する後処理を施し、その結果がオペレータによって
確認修正される。出力部4は修正された正解文字コード
の情報を外部に出力する。制御部5はこれら各部1〜4
を制御する。
装置の従来例の構成図である。イメージ入力部1は認識
対象の文字を入力し、電気信号に変換する。認識部2は
電気信号に変換された文字を入力し、個々の文字パター
ンを切り出す前処理、認識に用いるパラメータを少ない
情報で表現するための特徴抽出、入力した文字がどのカ
テゴリに属するかを判定する認識処理を施す。修正部3
Aは認識情報を用いた認識結果の検証処理や言語処理
(単語知識や言語規則)などを用いて曖昧な認識結果を
検証する後処理を施し、その結果がオペレータによって
確認修正される。出力部4は修正された正解文字コード
の情報を外部に出力する。制御部5はこれら各部1〜4
を制御する。
【0003】図12は図11中の修正部3Aの構成図で
ある。検証処理部30内の認識情報格納部31には、認
識部2から送られてきた認識情報が一旦保持される。言
語処理部33は認識情報に対して検証のために言語処理
を施し、不自然な文字列の位置を認識情報格納部31
に、不自然な文字列、およびその訂正候補の文字列を検
出して検証情報格納部32に記録する。表示処理部34
は確認修正に必要な情報、言語処理の結果も含めて表示
部35に表示し、オペレータの確認修正を受け付ける。
この時、表示処理部34はオペレータが確認や修正の処
理がし易いように、認識情報格納部31の内容と検証情
報格納部32の内容とを、位置、大きさ、色などを整え
て表示部35に表示する。オペレータは、表示された認
識情報や検証情報を目視によって確認し、その中に認識
誤りが存在すれば修正入力部37を用いて正しい情報を
候補の中から選択したり、新たな情報を入力したりし
て、誤りのないデータに完成させる。修正処理部36A
は修正入力部37からの指示に従って、認識情報格納部
31の内容を正しいコードデータに書き換える。このよ
うにして得られた情報が誤りのないデータとして修正済
み情報格納部38に転送される。
ある。検証処理部30内の認識情報格納部31には、認
識部2から送られてきた認識情報が一旦保持される。言
語処理部33は認識情報に対して検証のために言語処理
を施し、不自然な文字列の位置を認識情報格納部31
に、不自然な文字列、およびその訂正候補の文字列を検
出して検証情報格納部32に記録する。表示処理部34
は確認修正に必要な情報、言語処理の結果も含めて表示
部35に表示し、オペレータの確認修正を受け付ける。
この時、表示処理部34はオペレータが確認や修正の処
理がし易いように、認識情報格納部31の内容と検証情
報格納部32の内容とを、位置、大きさ、色などを整え
て表示部35に表示する。オペレータは、表示された認
識情報や検証情報を目視によって確認し、その中に認識
誤りが存在すれば修正入力部37を用いて正しい情報を
候補の中から選択したり、新たな情報を入力したりし
て、誤りのないデータに完成させる。修正処理部36A
は修正入力部37からの指示に従って、認識情報格納部
31の内容を正しいコードデータに書き換える。このよ
うにして得られた情報が誤りのないデータとして修正済
み情報格納部38に転送される。
【0004】
【発明が解決しようとする課題】上述した従来の文字認
識装置では、認識部2から送られてくる認識情報や検証
情報を表示部35に表示、あるいは音声出力し、それを
オペレータが目視や聞き取りによって検査を行ってい
た。そこで認識誤りを検出した場合、そのつどキーボー
ド、あるいはマウスを用いて正解文字を入力し正しいデ
ータを作っていた。したがって、認識結果の認識修正で
は、目視チェックにより認識誤りの検出、認識誤り
の位置までカーソルを移動、処理モードを認識処理モ
ードから文字入力モードへ移行、正しい文字を入力す
る、正解情報と認識誤りを置換するなどの操作が必要
であった。
識装置では、認識部2から送られてくる認識情報や検証
情報を表示部35に表示、あるいは音声出力し、それを
オペレータが目視や聞き取りによって検査を行ってい
た。そこで認識誤りを検出した場合、そのつどキーボー
ド、あるいはマウスを用いて正解文字を入力し正しいデ
ータを作っていた。したがって、認識結果の認識修正で
は、目視チェックにより認識誤りの検出、認識誤り
の位置までカーソルを移動、処理モードを認識処理モ
ードから文字入力モードへ移行、正しい文字を入力す
る、正解情報と認識誤りを置換するなどの操作が必要
であった。
【0005】そのため、(a)オペレータの操作が煩雑
である。(b)修正のための操作回数が多いためデータ
入力速度が遅くなる、(b)認識誤りを指示するための
カーソル移動に時間がかかる(検証情報を利用して不自
然な文字列の位置までスキップすることもできる)など
の問題が存在していた。音声認識装置でも同様の問題が
あった。
である。(b)修正のための操作回数が多いためデータ
入力速度が遅くなる、(b)認識誤りを指示するための
カーソル移動に時間がかかる(検証情報を利用して不自
然な文字列の位置までスキップすることもできる)など
の問題が存在していた。音声認識装置でも同様の問題が
あった。
【0006】本発明の目的は、認識結果を短時間に、容
易に、かつ精度良く確認、修正できるパターン認識装置
を提供することである。
易に、かつ精度良く確認、修正できるパターン認識装置
を提供することである。
【0007】
【課題を解決するための手段】本発明のパターン認識装
置は、検証情報格納部中の認識誤り候補の文字列または
コード列、あるいはそれらの訂正候補の文字列またはコ
ード列が同じ、あるいは類似のカテゴリから成っている
ものを同一カテゴリの文字またはコードが誤ったものと
見なして自動的に抽出する同一文字列またはコード列抽
出部と、該同一文字列またはコード列抽出部で得られた
複数の同一、あるいは類似のカテゴリの文字列群または
コード列を入力文字イメージまたは入力音声とともに表
示部に表示し、オペレータが文字列またはコード列を複
数個選択し、複数カ所を一度に正解文字または正解コー
ドに変換したり、新たな正解文字または正解コードを入
力したりできるようにする修正処理部とを備えている。
置は、検証情報格納部中の認識誤り候補の文字列または
コード列、あるいはそれらの訂正候補の文字列またはコ
ード列が同じ、あるいは類似のカテゴリから成っている
ものを同一カテゴリの文字またはコードが誤ったものと
見なして自動的に抽出する同一文字列またはコード列抽
出部と、該同一文字列またはコード列抽出部で得られた
複数の同一、あるいは類似のカテゴリの文字列群または
コード列を入力文字イメージまたは入力音声とともに表
示部に表示し、オペレータが文字列またはコード列を複
数個選択し、複数カ所を一度に正解文字または正解コー
ドに変換したり、新たな正解文字または正解コードを入
力したりできるようにする修正処理部とを備えている。
【0008】
【作用】本発明は、未修正の認識結果の中で不自然なも
のを検出し、その中で同一傾向を示す認識情報や検証情
報を自動的に抽出し、これらを同一カテゴリごとにまと
めて一括修正の操作ができるようにしたものである。こ
れにより、オペレータの修正に要する時間を少なくする
ことができ、データ入力の生産性が向上すると共に、修
正操作を容易にすることができる。
のを検出し、その中で同一傾向を示す認識情報や検証情
報を自動的に抽出し、これらを同一カテゴリごとにまと
めて一括修正の操作ができるようにしたものである。こ
れにより、オペレータの修正に要する時間を少なくする
ことができ、データ入力の生産性が向上すると共に、修
正操作を容易にすることができる。
【0009】オペレータが選択、あるいは入力した正解
文字または正解コードと、認識誤り候補の文字列または
コード列と、訂正候補の文字列またはコード列と、認識
情報とを蓄積する履歴情報格納部と、修正情報格納部を
備え、修正部は、該履歴情報格納部の履歴情報の中の重
複する情報を一つにまとめて他の情報を除去し、同一カ
テゴリが答えになると思われる情報を選択・まとめるた
め修正情報を算出して前記修正情報格納部に格納し、検
証情報および認識情報の中から修正情報格納部内の修正
情報と同一の認識誤り候補の文字列またはコード列、あ
るいは同一の訂正候補の文字列またはコード列を検出
し、文字列またはコード列が同じ、あるいは類似のカテ
ゴリからなっているものを同一カテゴリの文字または音
声が誤っているものと見なして自動的に抽出することに
より、履歴情報を用いて効率良く、しかも検出もれの少
ない一括修正ができる。
文字または正解コードと、認識誤り候補の文字列または
コード列と、訂正候補の文字列またはコード列と、認識
情報とを蓄積する履歴情報格納部と、修正情報格納部を
備え、修正部は、該履歴情報格納部の履歴情報の中の重
複する情報を一つにまとめて他の情報を除去し、同一カ
テゴリが答えになると思われる情報を選択・まとめるた
め修正情報を算出して前記修正情報格納部に格納し、検
証情報および認識情報の中から修正情報格納部内の修正
情報と同一の認識誤り候補の文字列またはコード列、あ
るいは同一の訂正候補の文字列またはコード列を検出
し、文字列またはコード列が同じ、あるいは類似のカテ
ゴリからなっているものを同一カテゴリの文字または音
声が誤っているものと見なして自動的に抽出することに
より、履歴情報を用いて効率良く、しかも検出もれの少
ない一括修正ができる。
【0010】修正部が、オペレータが選択あるいは入力
した正解文字または正解コードを利用して、表示部上に
表示された複数の文字列またはコード列の中から同一の
認識誤り候補の文字列またはコード列、あるいは訂正候
補の文字列またはコード列を、オペレータが選択して正
解文字または正解コードに書き換える機能と、この処理
を繰返すことにより認識誤り候補の文字列またはコード
列の種々のカテゴリに対して正解文字または正解コード
に修正する機能を有することにより、オペレータが正解
情報の入力を行う必要がなくなり、オペレータの確認修
正作業の生産性が向上する。
した正解文字または正解コードを利用して、表示部上に
表示された複数の文字列またはコード列の中から同一の
認識誤り候補の文字列またはコード列、あるいは訂正候
補の文字列またはコード列を、オペレータが選択して正
解文字または正解コードに書き換える機能と、この処理
を繰返すことにより認識誤り候補の文字列またはコード
列の種々のカテゴリに対して正解文字または正解コード
に修正する機能を有することにより、オペレータが正解
情報の入力を行う必要がなくなり、オペレータの確認修
正作業の生産性が向上する。
【0011】修正部が、同一の認識誤り候補の文字列ま
たはコード列、あるいは訂正候補の文字列またはコード
列と文字イメージまたは入力音声、およびその前後に格
納されている認識情報を認識情報格納部の中から自動的
に抽出し、これらを同時に表示部に表示することによ
り、オペレータは当該同一文字列の文字カテゴリを前後
の文字から同形文字や類似文字の識別が容易に推測で
き、オペレータの確認作業を支援することができる。
たはコード列、あるいは訂正候補の文字列またはコード
列と文字イメージまたは入力音声、およびその前後に格
納されている認識情報を認識情報格納部の中から自動的
に抽出し、これらを同時に表示部に表示することによ
り、オペレータは当該同一文字列の文字カテゴリを前後
の文字から同形文字や類似文字の識別が容易に推測で
き、オペレータの確認作業を支援することができる。
【0012】修正部が、検証情報および認識情報の中か
ら修正情報格納部内の修正情報と同一の認識誤り候補の
文字列またはコード列、あるいは同一の訂正候補の文字
列またはコード列の確からしさを信頼度として算出する
同一文字列または同一コード列検出の機能と、前記文字
列または前記コード列が同じ、あるいは類似のカテゴリ
から成っているものを同一カテゴリの文字またはコード
が誤ったものと見なし、その確からしさを信頼度として
算出するとともに信頼度の高い順から自動的に抽出する
機能を有することにより、認識結果に含まれる認識誤り
の修正を効率的に行うことができる。
ら修正情報格納部内の修正情報と同一の認識誤り候補の
文字列またはコード列、あるいは同一の訂正候補の文字
列またはコード列の確からしさを信頼度として算出する
同一文字列または同一コード列検出の機能と、前記文字
列または前記コード列が同じ、あるいは類似のカテゴリ
から成っているものを同一カテゴリの文字またはコード
が誤ったものと見なし、その確からしさを信頼度として
算出するとともに信頼度の高い順から自動的に抽出する
機能を有することにより、認識結果に含まれる認識誤り
の修正を効率的に行うことができる。
【0013】
【実施例】次に、本発明の実施例について図面を参照し
て説明する。
て説明する。
【0014】実施例1 図1は本発明の一実施例の文字認識装置の基本構成図で
ある。本実施例は修正部3のみが図11の従来例の文字
認識装置と異なっている。
ある。本実施例は修正部3のみが図11の従来例の文字
認識装置と異なっている。
【0015】図2は修正部3の構成図である。修正部3
は修正処理部36のみが図12の修正部3Aと異なって
いる。修正処理部36は、同一文字列格納部40を含
み、検証処理部30の検証情報格納部32中の認識誤り
候補の文字列、あるいはそれらの訂正候補の文字列が同
じ、あるいは類似のカテゴリから成っているものを同一
カテゴリの文字が誤ったものと見なして自動的に抽出
し、同一文字列格納部40に格納する同一文字列抽出部
39と、同一文字列抽出部39で得られた複数の同一、
あるいは類似のカテゴリの文字列群を入力文字イメージ
とともに表示処理部34を経て表示部35に表示し、オ
ペレータが文字列を複数個選択し、複数カ所、一度に正
解文字に変換したり、新たな正解文字を入力したりでき
るようにした修正処理部36とを備えている。
は修正処理部36のみが図12の修正部3Aと異なって
いる。修正処理部36は、同一文字列格納部40を含
み、検証処理部30の検証情報格納部32中の認識誤り
候補の文字列、あるいはそれらの訂正候補の文字列が同
じ、あるいは類似のカテゴリから成っているものを同一
カテゴリの文字が誤ったものと見なして自動的に抽出
し、同一文字列格納部40に格納する同一文字列抽出部
39と、同一文字列抽出部39で得られた複数の同一、
あるいは類似のカテゴリの文字列群を入力文字イメージ
とともに表示処理部34を経て表示部35に表示し、オ
ペレータが文字列を複数個選択し、複数カ所、一度に正
解文字に変換したり、新たな正解文字を入力したりでき
るようにした修正処理部36とを備えている。
【0016】この修正部3の動作を説明する。まず、認
識部2から送られてきた認識情報を検証処理部30で検
証した後、認識情報格納部31に一旦保持する。この認
識情報格納部31の中の認識情報は、修正入力部37か
ら入力されるオペレータの指示に従って直接、または同
一文字列抽出部39で処理されたものが表示部35に表
示される。オペレータは表示部35に表示された情報を
目視によって確認し、その中で誤認識文字が存在すれば
修正入力部37を用いて正解文字を候補文字の中から選
択したり、または文字入力機能を用いて新たな正解文字
を入力する。一括修正の処理ではこのとき、認識情報に
あらかじめ言語処理(たとえば、誤認識文字の検出に
は、特開平1−41061号:“日本文誤字自動訂正装
置”で行えるような処理、また、信頼度の算出には、特
開昭62−182982号:“日本文誤字自動検出方
式”などの文字連接の強さの度合で訂正候補を検出する
処理)を施して、認識誤り候補の文字列やそれらの訂正
候補の文字列を検出しておき検証情報格納部32に記録
しておく。次に、同一文字列抽出部39において同一カ
テゴリを示す認識誤り候補の文字列と、同一カテゴリを
示す訂正候補の文字とをそれぞれ別々に検出し、それら
を同一文字列格納部40に格納してからオペレータの指
示を待つ。一括修正の処理は、オペレータが修正入力部
37から入力する表示に指示に従って、同一文字列格納
部40の中から同一カテゴリごとにまとめられた認識誤
り候補の文字列や訂正候補の文字列、およびそれらの文
字列に対応する認識情報格納部31の文字イメージとを
表示処理部34の要求に基づいて表示部35に表示す
る。オペレータは表示部35に表示された認識誤り候補
の文字列群を目視によって確認し、キーボードやマウス
を用いて同じカテゴリに属する文字イメージを1つのグ
ループとしてまとめた後、正解文字を選択、あるいは入
力する。この処理を同一文字列格納部40(検証情報格
納部32)の中に認識誤り候補の文字列がなくなるまで
行うことにより、認識情報格納部31の中の認識結果の
認識誤り文字をなくすことができる。また、この時、確
認修正が行われたことを示す情報(選択情報)を確認情
報の中に記録する。この選択情報を付与することによっ
て、認識結果の後処理をさらに信頼度の高いものにする
ことができる。
識部2から送られてきた認識情報を検証処理部30で検
証した後、認識情報格納部31に一旦保持する。この認
識情報格納部31の中の認識情報は、修正入力部37か
ら入力されるオペレータの指示に従って直接、または同
一文字列抽出部39で処理されたものが表示部35に表
示される。オペレータは表示部35に表示された情報を
目視によって確認し、その中で誤認識文字が存在すれば
修正入力部37を用いて正解文字を候補文字の中から選
択したり、または文字入力機能を用いて新たな正解文字
を入力する。一括修正の処理ではこのとき、認識情報に
あらかじめ言語処理(たとえば、誤認識文字の検出に
は、特開平1−41061号:“日本文誤字自動訂正装
置”で行えるような処理、また、信頼度の算出には、特
開昭62−182982号:“日本文誤字自動検出方
式”などの文字連接の強さの度合で訂正候補を検出する
処理)を施して、認識誤り候補の文字列やそれらの訂正
候補の文字列を検出しておき検証情報格納部32に記録
しておく。次に、同一文字列抽出部39において同一カ
テゴリを示す認識誤り候補の文字列と、同一カテゴリを
示す訂正候補の文字とをそれぞれ別々に検出し、それら
を同一文字列格納部40に格納してからオペレータの指
示を待つ。一括修正の処理は、オペレータが修正入力部
37から入力する表示に指示に従って、同一文字列格納
部40の中から同一カテゴリごとにまとめられた認識誤
り候補の文字列や訂正候補の文字列、およびそれらの文
字列に対応する認識情報格納部31の文字イメージとを
表示処理部34の要求に基づいて表示部35に表示す
る。オペレータは表示部35に表示された認識誤り候補
の文字列群を目視によって確認し、キーボードやマウス
を用いて同じカテゴリに属する文字イメージを1つのグ
ループとしてまとめた後、正解文字を選択、あるいは入
力する。この処理を同一文字列格納部40(検証情報格
納部32)の中に認識誤り候補の文字列がなくなるまで
行うことにより、認識情報格納部31の中の認識結果の
認識誤り文字をなくすことができる。また、この時、確
認修正が行われたことを示す情報(選択情報)を確認情
報の中に記録する。この選択情報を付与することによっ
て、認識結果の後処理をさらに信頼度の高いものにする
ことができる。
【0017】図3は、認識情報格納部31中の認識情報
の具体的な内容を示したものである。認識情報は入力文
字パターン311と文字の特徴312と認識結果313
と候補文字314と距離値または類似度315と位置情
報316と選択情報317(選択情報が記録されるまで
は、認識誤り候補の文字であることを示す情報として使
用する)からなる。選択情報317は、表示部35に表
示された認識情報の中からオペレータが目視によって同
じ文字カテゴリと判断し、選択したときに認識情報の中
に書込まれるものであり、例えば同じ文字カテゴリのグ
ループごとに1,2,・・・,iの数字列で表わすこと
ができる。認識情報格納部31は、修正処理部36から
の指示に従って認識結果313の内容を正解文字に書き
換える。書き換えられた認識結果は、書き換え前の認識
結果と置き換えて表示部35に表示する。この時、オペ
レータが修正した修正情報と修正の対象となった認識情
報とを履歴情報として履歴情報格納部41の中に蓄積し
ておき、以後の認識誤り候補の文字列の修正に利用され
る。
の具体的な内容を示したものである。認識情報は入力文
字パターン311と文字の特徴312と認識結果313
と候補文字314と距離値または類似度315と位置情
報316と選択情報317(選択情報が記録されるまで
は、認識誤り候補の文字であることを示す情報として使
用する)からなる。選択情報317は、表示部35に表
示された認識情報の中からオペレータが目視によって同
じ文字カテゴリと判断し、選択したときに認識情報の中
に書込まれるものであり、例えば同じ文字カテゴリのグ
ループごとに1,2,・・・,iの数字列で表わすこと
ができる。認識情報格納部31は、修正処理部36から
の指示に従って認識結果313の内容を正解文字に書き
換える。書き換えられた認識結果は、書き換え前の認識
結果と置き換えて表示部35に表示する。この時、オペ
レータが修正した修正情報と修正の対象となった認識情
報とを履歴情報として履歴情報格納部41の中に蓄積し
ておき、以後の認識誤り候補の文字列の修正に利用され
る。
【0018】図4は、検証情報格納部32中の検証情報
の具体的な内容を示したものである。検証情報は認識誤
り候補の文字列321と、認識誤り候補の文字列321
が存在する認識情報の格納アドレス322と、訂正候補
の文字列323と、信頼度324からなる。ここで、訂
正候補の文字列323と信頼度324とは対になって保
存する。
の具体的な内容を示したものである。検証情報は認識誤
り候補の文字列321と、認識誤り候補の文字列321
が存在する認識情報の格納アドレス322と、訂正候補
の文字列323と、信頼度324からなる。ここで、訂
正候補の文字列323と信頼度324とは対になって保
存する。
【0019】図5は、同一文字列抽出部39とオペレー
タが行なう処理の流れを示すフローチャートである。な
お、実線で囲まれた部分が同一文字列抽出部39の処理
の流れを、点線で囲まれた部分がオペレータの処理を示
している。まず、同一文字列抽出部39は、検証情報格
納部32から転送された認識誤り候補の文字列とそれら
の訂正候補の文字列の中から同一カテゴリを示すものを
自動的に抽出する(ステップ391)。抽出の基準は、
例えば(1)検証処理によって検出された認識誤り文字
が同一カテゴリのものを集めてくる方法、(2)認識誤
り文字を訂正するための訂正文字が同一カテゴリのもの
を集めてくる方法とがある。ここでは前者について説明
する。次に、同一文字列抽出部39は、抽出した認識情
報の中から認識誤り文字が同一カテゴリのものを、オペ
レータの確認修正に必要な入力文字パターン311と認
識誤り候補の文字列321、すなわち認識誤り候補とし
て検出されて認識結果313とともに表示部35に表示
し、オペレータの確認と一括修正を受け付ける(ステッ
プ392)。同一文字列抽出部39は、表示部35に表
示する訂正候補の文字列324の文字カテゴリが重複表
示されないように、文字カテゴリをまとめてから表示部
35に表示する。オペレータは表示部35に表示された
入力文字パターン311を目視によって確認し、同じ文
字カテゴリの入力文字パターン311を修正入力部37
を用いて選択し、1つのグループとして完成させる(ス
テップ393)。この時、修正処理部36は修正入力部
37の指示に従って、オペレータが選択した入力文字パ
ターン311に対して、選択情報317を割り付ける。
オペレータは、1つのグループとしてまとめられた入力
文字パターン311に対応する正解文字を修正入力部3
7を用いて、訂正候補の文字列から選択したり、新たな
文字を入力する(ステップ394)。修正処理部36は
修正入力部37の指示と選択情報317との対応をとっ
て認識結果313の内容を正解文字に書き換える。
タが行なう処理の流れを示すフローチャートである。な
お、実線で囲まれた部分が同一文字列抽出部39の処理
の流れを、点線で囲まれた部分がオペレータの処理を示
している。まず、同一文字列抽出部39は、検証情報格
納部32から転送された認識誤り候補の文字列とそれら
の訂正候補の文字列の中から同一カテゴリを示すものを
自動的に抽出する(ステップ391)。抽出の基準は、
例えば(1)検証処理によって検出された認識誤り文字
が同一カテゴリのものを集めてくる方法、(2)認識誤
り文字を訂正するための訂正文字が同一カテゴリのもの
を集めてくる方法とがある。ここでは前者について説明
する。次に、同一文字列抽出部39は、抽出した認識情
報の中から認識誤り文字が同一カテゴリのものを、オペ
レータの確認修正に必要な入力文字パターン311と認
識誤り候補の文字列321、すなわち認識誤り候補とし
て検出されて認識結果313とともに表示部35に表示
し、オペレータの確認と一括修正を受け付ける(ステッ
プ392)。同一文字列抽出部39は、表示部35に表
示する訂正候補の文字列324の文字カテゴリが重複表
示されないように、文字カテゴリをまとめてから表示部
35に表示する。オペレータは表示部35に表示された
入力文字パターン311を目視によって確認し、同じ文
字カテゴリの入力文字パターン311を修正入力部37
を用いて選択し、1つのグループとして完成させる(ス
テップ393)。この時、修正処理部36は修正入力部
37の指示に従って、オペレータが選択した入力文字パ
ターン311に対して、選択情報317を割り付ける。
オペレータは、1つのグループとしてまとめられた入力
文字パターン311に対応する正解文字を修正入力部3
7を用いて、訂正候補の文字列から選択したり、新たな
文字を入力する(ステップ394)。修正処理部36は
修正入力部37の指示と選択情報317との対応をとっ
て認識結果313の内容を正解文字に書き換える。
【0020】図6は本実施例の内、オペレータが同じ文
字カテゴリをまとめて認識修正する場合の表示部35の
表示例を示しており、351は入力文字パターン表示、
352は認識結果の文字表示、353は訂正候補の文字
列の表示を示している。同一文字列抽出部39によって
認識情報格納部31から抽出された認識情報(入力文字
パターン)のうち、認識修正に必要な情報を表示部35
に表示する。オペレータは、入力文字パターン表示35
1を確認し、同じ文字カテゴリの入力文字パターン群の
表示354を修正入力部37を用いて選択する。表示部
35は、選択された入力文字パターン群の表示354と
選択されていない入力文字パターン群の表示355を区
別するため、色や大きさを変化させて表示部35に表示
する。オペレータは、1つのグループとして選択を終了
すると、このグループの文字カテゴリに対応する正解文
字を認識結果の文字表示352の中、あるいは訂正候補
の文字列表示353の中から選択したり、文字入力機能
を用いて新たな正解文字を修正入力部37を用いて入力
する。修正処理部36は修正入力部37の指示に従って
認識結果313の内容を正解文字に書き換える。このよ
うにして修正入力部37は、オペレータの確認と一括修
正を繰り返し受け付ける。なお、本実施例に示した同じ
文字カテゴリごとにまとめて認識修正する場合、該当す
る同一文字列以外の入力文字パターン表示351は表示
部35に表示されるが、表示された入力文字パターン表
示351の中から、オペレータが修正が必要だと判断し
た入力文字パターン表示351については、同じ文字カ
テゴリをまとめて正解文字の繰り返し入力を可能とす
る。
字カテゴリをまとめて認識修正する場合の表示部35の
表示例を示しており、351は入力文字パターン表示、
352は認識結果の文字表示、353は訂正候補の文字
列の表示を示している。同一文字列抽出部39によって
認識情報格納部31から抽出された認識情報(入力文字
パターン)のうち、認識修正に必要な情報を表示部35
に表示する。オペレータは、入力文字パターン表示35
1を確認し、同じ文字カテゴリの入力文字パターン群の
表示354を修正入力部37を用いて選択する。表示部
35は、選択された入力文字パターン群の表示354と
選択されていない入力文字パターン群の表示355を区
別するため、色や大きさを変化させて表示部35に表示
する。オペレータは、1つのグループとして選択を終了
すると、このグループの文字カテゴリに対応する正解文
字を認識結果の文字表示352の中、あるいは訂正候補
の文字列表示353の中から選択したり、文字入力機能
を用いて新たな正解文字を修正入力部37を用いて入力
する。修正処理部36は修正入力部37の指示に従って
認識結果313の内容を正解文字に書き換える。このよ
うにして修正入力部37は、オペレータの確認と一括修
正を繰り返し受け付ける。なお、本実施例に示した同じ
文字カテゴリごとにまとめて認識修正する場合、該当す
る同一文字列以外の入力文字パターン表示351は表示
部35に表示されるが、表示された入力文字パターン表
示351の中から、オペレータが修正が必要だと判断し
た入力文字パターン表示351については、同じ文字カ
テゴリをまとめて正解文字の繰り返し入力を可能とす
る。
【0021】本実施例は、未修正の認識結果の中で不自
然なものを検出し、その中で同一傾向を示す認識情報や
検証情報を自動的に抽出し、これを同一カテゴリごとに
まとめて一括修正の操作ができるようにしたもので、こ
れにより、オペレータの修正に要する時間を少なくする
ことができ、データ入力の生産性が向上すると共に、修
正操作を容易にすることができる。
然なものを検出し、その中で同一傾向を示す認識情報や
検証情報を自動的に抽出し、これを同一カテゴリごとに
まとめて一括修正の操作ができるようにしたもので、こ
れにより、オペレータの修正に要する時間を少なくする
ことができ、データ入力の生産性が向上すると共に、修
正操作を容易にすることができる。
【0022】実施例2 図7は修正部3における履歴情報410を用いた一括修
正の処理を示す図であって、410は履歴情報、411
はオペレータが入力した正解文字、412は言語処理が
有効に働いた履歴情報(言語履歴情報)、413はオペ
レータの修正が有効だった履歴情報(入力履歴情報)で
あり、図8の420は履歴情報410から重複する情報
を除去した修正情報の内容を示す図である。具体的処理
は、修正部3において、認識情報格納部31の中の認識
結果をオペレータが確認し、修正する際に、正解文字を
選択あるいは入力するのと同時に修正に関係する情報、
すなわち正解文字411、認識誤り候補の文字、訂正候
補の文字列、信頼度、認識情報(入力文字パターン、文
字の特徴や認識結果の候補情報など)を履歴情報410
として履歴情報格納部41に記録する。次に、修正処理
部36は修正処理がある一定量行われた時点、たとえば
一日の仕事、あるいは1,000枚程度の文書の読み取
りが終了した時点で、修正情報420を作成してその結
果を修正情報格納部42に記録しておく。このような修
正情報420の作成は履歴情報410の中から重複する
情報を1つにまとめて情報を圧縮するとともに、同一カ
テゴリが答えになる可能性のある情報を選択し、まとめ
る処理であり、処理時間の短縮や履歴情報の容量の削
減、および履歴情報の信頼性の向上をねらったものであ
る。同一文字列抽出部39は検証情報格納部32の中の
情報および認識情報格納部31の中の認識情報が修正情
報420の中の認識誤り文字と一致し、さらに文字間の
連接関係が一致するもの、あるいは認識誤り文字が異な
っていても訂正候補の文字列が一致するものを自動的に
抽出して、修正情報420の中の正解文字を追加して、
文字イメージとともに表示部35に表示する。この処理
によって、オペレータは表示部35に表示された文字パ
ターン311を目視によって確認し、キーボードやマウ
スなどを用いて同じ文字カテゴリに属する入力文字パタ
ーン311を1つのグループとしてまとめた後、正解文
字の選択、あるいは入力すればよい。
正の処理を示す図であって、410は履歴情報、411
はオペレータが入力した正解文字、412は言語処理が
有効に働いた履歴情報(言語履歴情報)、413はオペ
レータの修正が有効だった履歴情報(入力履歴情報)で
あり、図8の420は履歴情報410から重複する情報
を除去した修正情報の内容を示す図である。具体的処理
は、修正部3において、認識情報格納部31の中の認識
結果をオペレータが確認し、修正する際に、正解文字を
選択あるいは入力するのと同時に修正に関係する情報、
すなわち正解文字411、認識誤り候補の文字、訂正候
補の文字列、信頼度、認識情報(入力文字パターン、文
字の特徴や認識結果の候補情報など)を履歴情報410
として履歴情報格納部41に記録する。次に、修正処理
部36は修正処理がある一定量行われた時点、たとえば
一日の仕事、あるいは1,000枚程度の文書の読み取
りが終了した時点で、修正情報420を作成してその結
果を修正情報格納部42に記録しておく。このような修
正情報420の作成は履歴情報410の中から重複する
情報を1つにまとめて情報を圧縮するとともに、同一カ
テゴリが答えになる可能性のある情報を選択し、まとめ
る処理であり、処理時間の短縮や履歴情報の容量の削
減、および履歴情報の信頼性の向上をねらったものであ
る。同一文字列抽出部39は検証情報格納部32の中の
情報および認識情報格納部31の中の認識情報が修正情
報420の中の認識誤り文字と一致し、さらに文字間の
連接関係が一致するもの、あるいは認識誤り文字が異な
っていても訂正候補の文字列が一致するものを自動的に
抽出して、修正情報420の中の正解文字を追加して、
文字イメージとともに表示部35に表示する。この処理
によって、オペレータは表示部35に表示された文字パ
ターン311を目視によって確認し、キーボードやマウ
スなどを用いて同じ文字カテゴリに属する入力文字パタ
ーン311を1つのグループとしてまとめた後、正解文
字の選択、あるいは入力すればよい。
【0023】本実施例の処理は過去と同じ誤り傾向のも
のが存在すれば、検証情報や認識情報の中に、その文字
に対応する文字パターンを検出して表示部35に表示し
て、確認修正の対象にしたり、それを訂正候補の文字列
の中に入れて表示部35からオペレータに提示するもの
であって、誤認識文字の検出に有効に働くとともに、修
正のためにオペレータが入力する正解文字の入力回数を
低減できる。
のが存在すれば、検証情報や認識情報の中に、その文字
に対応する文字パターンを検出して表示部35に表示し
て、確認修正の対象にしたり、それを訂正候補の文字列
の中に入れて表示部35からオペレータに提示するもの
であって、誤認識文字の検出に有効に働くとともに、修
正のためにオペレータが入力する正解文字の入力回数を
低減できる。
【0024】本実施例は、未修正の認識情報の中からオ
ペレータの修正した履歴処理情報と同じ傾向を示す認識
情報や検証情報を自動的に抽出し、これを同一カテゴリ
ごとにまとめて修正操作ができるようにしたもので、こ
れにより、オペレータが修正した履歴情報を用いて効率
良く、しかも検出もれの少ない一括修正ができる。
ペレータの修正した履歴処理情報と同じ傾向を示す認識
情報や検証情報を自動的に抽出し、これを同一カテゴリ
ごとにまとめて修正操作ができるようにしたもので、こ
れにより、オペレータが修正した履歴情報を用いて効率
良く、しかも検出もれの少ない一括修正ができる。
【0025】実施例3 図9は修正処理部36において、履歴情報410として
履歴情報格納部41に記録されているオペレータが選択
あるいは入力した正解文字の情報を利用して、後続の修
正処理を容易にできるようにした実施例のフローチャー
トである。これは先にオペレータが選択あるいは入力し
た正解文字の情報を履歴情報格納部41に保持してお
き、表示部35上に表示された種々の文字列に対し、そ
の中から同一の認識誤り候補の文字列をオペレータが選
択することによって、認識情報格納部31の中の誤認識
文字を、直前に入力した履歴情報410の正解文字に書
き換えるようにしたものである。また、この処理を繰り
返すことによって認識誤り候補の文字列の種々のカテゴ
リに対して正解文字に書き換えることができるようにし
たものである。まず、正解文字の選択・入力を同一カテ
ゴリを選択前に入力するのか、後に入力するのかを示す
「認識結果の修正モード」は、オペレータが変更可能な
システムのディフォルト値として与える。本実施例では
正解文字を選択前に入力する場合について、以下のステ
ップで処理を進める。この図で実線の部分は自動処理、
破線の部分はオペレータによる処理である。まず、認識
結果の修正モードを入力する(ステップ501)。表示
画面に表示された認識誤り候補の文字列に対して、オペ
レータが正解文字を入力する(ステップ501)。次
に、正解文字と同一カテゴリの認識誤り候補の文字列イ
メージを複数個選択する(ステップ503)。次に、選
択が終了した時点、すなわち同一画面表示で他のカテゴ
リに対する修正作業をするために次の正解文字を入力す
る時点、1つの修正情報での誤認識文字の修正作業を終
了する時点で選択された認識誤り候補の文字列(認識結
果)を正解文字に書き換える(ステップ504,50
5)。次に、同一画面表示で他のカテゴリに対する修正
作業を行うか否かを判定する(ステップ506)。最後
に、1つの検証情報や修正情報を用いて集められた同一
文字列格納部40内の認識誤りの候補文字がなくなった
か否かを判定する(ステップ507)。
履歴情報格納部41に記録されているオペレータが選択
あるいは入力した正解文字の情報を利用して、後続の修
正処理を容易にできるようにした実施例のフローチャー
トである。これは先にオペレータが選択あるいは入力し
た正解文字の情報を履歴情報格納部41に保持してお
き、表示部35上に表示された種々の文字列に対し、そ
の中から同一の認識誤り候補の文字列をオペレータが選
択することによって、認識情報格納部31の中の誤認識
文字を、直前に入力した履歴情報410の正解文字に書
き換えるようにしたものである。また、この処理を繰り
返すことによって認識誤り候補の文字列の種々のカテゴ
リに対して正解文字に書き換えることができるようにし
たものである。まず、正解文字の選択・入力を同一カテ
ゴリを選択前に入力するのか、後に入力するのかを示す
「認識結果の修正モード」は、オペレータが変更可能な
システムのディフォルト値として与える。本実施例では
正解文字を選択前に入力する場合について、以下のステ
ップで処理を進める。この図で実線の部分は自動処理、
破線の部分はオペレータによる処理である。まず、認識
結果の修正モードを入力する(ステップ501)。表示
画面に表示された認識誤り候補の文字列に対して、オペ
レータが正解文字を入力する(ステップ501)。次
に、正解文字と同一カテゴリの認識誤り候補の文字列イ
メージを複数個選択する(ステップ503)。次に、選
択が終了した時点、すなわち同一画面表示で他のカテゴ
リに対する修正作業をするために次の正解文字を入力す
る時点、1つの修正情報での誤認識文字の修正作業を終
了する時点で選択された認識誤り候補の文字列(認識結
果)を正解文字に書き換える(ステップ504,50
5)。次に、同一画面表示で他のカテゴリに対する修正
作業を行うか否かを判定する(ステップ506)。最後
に、1つの検証情報や修正情報を用いて集められた同一
文字列格納部40内の認識誤りの候補文字がなくなった
か否かを判定する(ステップ507)。
【0026】本実施例は、オペレータが入力した正解文
字を利用して同一の認識誤り候補の文字列、あるいは訂
正候補の文字列を正解文字に書き換えるようにしたもの
で、これにより、オペレータが正解情報の入力を行う必
要がなくなり、オペレータの確認修正作業の生産性が向
上する。
字を利用して同一の認識誤り候補の文字列、あるいは訂
正候補の文字列を正解文字に書き換えるようにしたもの
で、これにより、オペレータが正解情報の入力を行う必
要がなくなり、オペレータの確認修正作業の生産性が向
上する。
【0027】実施例4 図10は、実施例4を説明するための表示部35の表示
画面の図であり、この場合修正部3の構成は図2と同じ
構成となっている。同一文字列抽出部39は、修正処理
部36の指示に従って同一文字列格納部40の内容を表
示部35に表示する際、認識誤り文字の前後に格納され
ている認識情報(文字パターン)も認識情報格納部31
の中から自動的に抽出し、これらを同時に表示部35に
表示する。ただし、類似する認識情報の前または後に認
識情報が存在しない場合は、修正対象の認識情報、すな
わち、入力文字パターン表示351の中央の文字に位置
するように認識情報の桁を合わせて表示部35に表示す
る。また、表示部35は同一カテゴリの認識情報が1画
面上に全て表示しきれない場合、画面切り替えモードを
表示部35に表示し、オペレータは、画面切り替えを行
ないながら認識と一括修正の処理を行う。オペレータは
表示部35に表示された修正対象の認識情報の文字種
を、その前後に表示された認識情報を参考に確認し、修
正入力部37を用いて同じ文字カテゴリを1つのグルー
プとしてまとめ修正処理を行う。
画面の図であり、この場合修正部3の構成は図2と同じ
構成となっている。同一文字列抽出部39は、修正処理
部36の指示に従って同一文字列格納部40の内容を表
示部35に表示する際、認識誤り文字の前後に格納され
ている認識情報(文字パターン)も認識情報格納部31
の中から自動的に抽出し、これらを同時に表示部35に
表示する。ただし、類似する認識情報の前または後に認
識情報が存在しない場合は、修正対象の認識情報、すな
わち、入力文字パターン表示351の中央の文字に位置
するように認識情報の桁を合わせて表示部35に表示す
る。また、表示部35は同一カテゴリの認識情報が1画
面上に全て表示しきれない場合、画面切り替えモードを
表示部35に表示し、オペレータは、画面切り替えを行
ないながら認識と一括修正の処理を行う。オペレータは
表示部35に表示された修正対象の認識情報の文字種
を、その前後に表示された認識情報を参考に確認し、修
正入力部37を用いて同じ文字カテゴリを1つのグルー
プとしてまとめ修正処理を行う。
【0028】本実施例は、抽出された同一文字列および
その前後の文字を同時に表示部35に表示することによ
り、オペレータは当該同一文字列の文字カテゴリを前後
の文字から同形文字や類似文字の識別が容易に推測で
き、オペレータの確認作業を支援することができる。
その前後の文字を同時に表示部35に表示することによ
り、オペレータは当該同一文字列の文字カテゴリを前後
の文字から同形文字や類似文字の識別が容易に推測で
き、オペレータの確認作業を支援することができる。
【0029】実施例5 本実施例5は修正部3において、検証処理の際の検証処
理結果の確からしさを信頼度323として算出し、その
結果を検証情報格納部32に記録しておくとともに、修
正情報を用いて同一文字列を抽出する際の同一文字列抽
出結果の確からしさを信頼度323として算出してお
き、後続の同一文字列抽出部39において前記文字列が
同じ、あるいは類似のカテゴリから成っているものを同
一のカテゴリの文字が誤ったものとみなし、その確から
しさを信頼度323として算出し、同一文字列抽出部3
9ではその信頼度の高い順から自動的に抽出するように
し、この情報を用いて同一のカテゴリをまとめて表示で
きるようにしたものである。
理結果の確からしさを信頼度323として算出し、その
結果を検証情報格納部32に記録しておくとともに、修
正情報を用いて同一文字列を抽出する際の同一文字列抽
出結果の確からしさを信頼度323として算出してお
き、後続の同一文字列抽出部39において前記文字列が
同じ、あるいは類似のカテゴリから成っているものを同
一のカテゴリの文字が誤ったものとみなし、その確から
しさを信頼度323として算出し、同一文字列抽出部3
9ではその信頼度の高い順から自動的に抽出するように
し、この情報を用いて同一のカテゴリをまとめて表示で
きるようにしたものである。
【0030】信頼度323は、特開昭62−18298
2号:“日本文誤字自動検出方式”などで示されるよう
に、連接する文字列の結合の強さの度合などとして求め
られるものを用いる場合と修正情報を用いる場合とがあ
る。前者の場合、同一文字列抽出部39は、修正処理部
36の指示に従って同一文字列格納部40の中から同一
カテゴリで、かつ連接の度合の高いものから選択して表
示部35に表示する。信頼度323として修正情報の中
の利用回数421を用いる場合は、修正情報が表記通り
の正解文字を表示して有効だった場合(正利用422)
と、有効に働かず他の文字が選択、あるいは入力された
場合(負利用423)との比較値を用い、比較値の高い
ものから選択して表示部35に表示する。
2号:“日本文誤字自動検出方式”などで示されるよう
に、連接する文字列の結合の強さの度合などとして求め
られるものを用いる場合と修正情報を用いる場合とがあ
る。前者の場合、同一文字列抽出部39は、修正処理部
36の指示に従って同一文字列格納部40の中から同一
カテゴリで、かつ連接の度合の高いものから選択して表
示部35に表示する。信頼度323として修正情報の中
の利用回数421を用いる場合は、修正情報が表記通り
の正解文字を表示して有効だった場合(正利用422)
と、有効に働かず他の文字が選択、あるいは入力された
場合(負利用423)との比較値を用い、比較値の高い
ものから選択して表示部35に表示する。
【0031】本実施例は、認識誤り候補の文字列、ある
いは訂正候補の文字列が同一カテゴリを示すものに対し
て、信頼度の高い順に抽出するもので、これにより、認
識結果に含まれる認識誤りの修正を効率的に行なうこと
ができる。
いは訂正候補の文字列が同一カテゴリを示すものに対し
て、信頼度の高い順に抽出するもので、これにより、認
識結果に含まれる認識誤りの修正を効率的に行なうこと
ができる。
【0032】実施例6 本実施例は認識の対象パターンが音声の場合を示すもの
である。音声認識の場合の修正部3において、同一音声
抽出部(同一文字列抽出部39に相当)では同一カテゴ
リを示す誤認識音声の候補が集められ、その音声のラベ
ル用の音声(カテゴリ名)に続いて集められた原音声が
信頼度の高い順に出力される。この時、原音声がラベル
の音声と同じカテゴリであれば、同一カテゴリであるこ
とを示す指示をタブレットやマウスなどの端末を用いて
行う。この指示された原音声に対応する誤認識音声の候
補を、ラベルとして出力された音声のカテゴリ名の示す
コード情報に変換することにより、誤認識音声が正解音
声に修正され、音声認識の確認修正を効率よく行うこと
ができる。
である。音声認識の場合の修正部3において、同一音声
抽出部(同一文字列抽出部39に相当)では同一カテゴ
リを示す誤認識音声の候補が集められ、その音声のラベ
ル用の音声(カテゴリ名)に続いて集められた原音声が
信頼度の高い順に出力される。この時、原音声がラベル
の音声と同じカテゴリであれば、同一カテゴリであるこ
とを示す指示をタブレットやマウスなどの端末を用いて
行う。この指示された原音声に対応する誤認識音声の候
補を、ラベルとして出力された音声のカテゴリ名の示す
コード情報に変換することにより、誤認識音声が正解音
声に修正され、音声認識の確認修正を効率よく行うこと
ができる。
【0033】本実施例では、音声認識の場合を示したも
ので、誤認識音声の候補をまとめて音声出力し、同一の
音声だけを選択的に抽出した後、まとめて修正指示を行
って正解コードに変換することにより、効率よく確認修
正ができる。
ので、誤認識音声の候補をまとめて音声出力し、同一の
音声だけを選択的に抽出した後、まとめて修正指示を行
って正解コードに変換することにより、効率よく確認修
正ができる。
【0034】
【発明の効果】以上説明したように本発明は、以下に示
すような効果がある。 (1)請求項1の発明は、未修正の認識結果の中で不自
然なものを検出し、その中で同一傾向を示す認識情報や
検証情報を自動的に抽出し、これを同一カテゴリごとに
まとめて一括修正の操作ができるようにしたことによ
り、オペレータの修正に要する時間を少なくすることが
でき、データ入力の生産性が向上すると共に、修正操作
を容易にすることができる。 (2)請求項2の発明は、未修正の認識結果の中からオ
ペレータが修正した履歴情報と同じ傾向を示す認識情報
や検証情報を自動的に抽出し、これを同一カテゴリごと
にまとめて一括修正の操作ができるようにしたことによ
り、履歴情報を用いて効率良く、しかも検出もれの少な
い一括修正できる。 (3)請求項3の発明は、オペレータが選択あるいは入
力した正解文字または正解コードを利用して、同一の認
識誤り候補の文字列またはコード列、あるいは訂正候補
の文字列またはコード列を正解文字または正解コードに
書き換えるようにしたことにより、オペレータが正解情
報の入力を行う必要がなくなり、オペレータの確認修正
作業の生産性が向上する。 (4)請求項4の発明は、抽出された同一文字列または
同一コード列およびその前後の文字またはコードを同時
に表示部に表示することにより、オペレータは当該同一
文字列または同一コード列の文字カテゴリを前後の文字
またはコードから同形文字または同形コードや類似文字
または類似コードの識別が容易に推測でき、オペレータ
の確認作業を支援することができる。 (5)請求項5の発明は、認識誤り候補の文字列または
コード列、あるいは訂正候補の文字列またはコード列が
同一カテゴリを示すものに対して、信頼度の高い順に自
動的に抽出することにより、認識結果に含まれる認識誤
りの修正を効率的に行うことができる。
すような効果がある。 (1)請求項1の発明は、未修正の認識結果の中で不自
然なものを検出し、その中で同一傾向を示す認識情報や
検証情報を自動的に抽出し、これを同一カテゴリごとに
まとめて一括修正の操作ができるようにしたことによ
り、オペレータの修正に要する時間を少なくすることが
でき、データ入力の生産性が向上すると共に、修正操作
を容易にすることができる。 (2)請求項2の発明は、未修正の認識結果の中からオ
ペレータが修正した履歴情報と同じ傾向を示す認識情報
や検証情報を自動的に抽出し、これを同一カテゴリごと
にまとめて一括修正の操作ができるようにしたことによ
り、履歴情報を用いて効率良く、しかも検出もれの少な
い一括修正できる。 (3)請求項3の発明は、オペレータが選択あるいは入
力した正解文字または正解コードを利用して、同一の認
識誤り候補の文字列またはコード列、あるいは訂正候補
の文字列またはコード列を正解文字または正解コードに
書き換えるようにしたことにより、オペレータが正解情
報の入力を行う必要がなくなり、オペレータの確認修正
作業の生産性が向上する。 (4)請求項4の発明は、抽出された同一文字列または
同一コード列およびその前後の文字またはコードを同時
に表示部に表示することにより、オペレータは当該同一
文字列または同一コード列の文字カテゴリを前後の文字
またはコードから同形文字または同形コードや類似文字
または類似コードの識別が容易に推測でき、オペレータ
の確認作業を支援することができる。 (5)請求項5の発明は、認識誤り候補の文字列または
コード列、あるいは訂正候補の文字列またはコード列が
同一カテゴリを示すものに対して、信頼度の高い順に自
動的に抽出することにより、認識結果に含まれる認識誤
りの修正を効率的に行うことができる。
【図1】本発明の一実施例の文字認識装置の構成図であ
る。
る。
【図2】図1中の修正部3の構成図である。
【図3】図2中の認識情報格納部31中の認識情報の内
容を示す図である。
容を示す図である。
【図4】図2中の検証情報格納部32中の検証情報の内
容を示す図である。
容を示す図である。
【図5】図2中の同一文字列抽出部39およびオペレー
タが行なう処理を示すフローチャートである。
タが行なう処理を示すフローチャートである。
【図6】オペレータが同じ文字カテゴリをまとめて修正
する場合の表示部35の表示を示す図である。
する場合の表示部35の表示を示す図である。
【図7】表示部35における認識結果の表示を示す図で
ある。
ある。
【図8】図7の履歴情報410から重複する情報を除去
した修正情報420を示す図である。
した修正情報420を示す図である。
【図9】オペレータが選択あるいは入力した正解文字の
情報を利用して後続の修正処理を容易にできるようにし
た実施例3のフローチャートである。
情報を利用して後続の修正処理を容易にできるようにし
た実施例3のフローチャートである。
【図10】実施例4における表示部35の内容を説明す
るための図である。
るための図である。
【図11】文字認識装置の従来例の構成図である。
【図12】図11の文字認識装置の修正部3Aの構成図
である。
である。
1 入力部 2 認識部 3,3A 修正部 4 出力部 5 制御部 30 検証処理部 31 認識情報格納部 32 検証情報格納部 33 言語処理部 34 表示処理部 35 表示部 36,36A 修正処理部 37 修正入力部 38 修正済み情報格納部 39 同一文字列抽出部 40 同一文字列格納部 41 履歴情報格納部 42 修正情報格納部 311 入力文字パターン 312 文字の特徴 313 認識結果 314 候補文字 315 距離値 316 位置情報 317 選択情報 321 認識誤り候補の文字列 322 認識誤り候補の文字列が存在する認識情報の
格納アドレス 323 信頼度 324 訂正候補の文字列 351 入力文字パターン表示 352 認識結果の文字表示 353 訂正候補の文字列表示 354 選択入力文字パターン群表示 355 否選択入力文字パターン群表示 391〜394 ステップ 410 履歴情報 411 正解文字 412 言語履歴情報 413 入力履歴情報 420 修正情報 421 利用回数 422 正利用回数 423 負利用回数 501〜507 ステップ
格納アドレス 323 信頼度 324 訂正候補の文字列 351 入力文字パターン表示 352 認識結果の文字表示 353 訂正候補の文字列表示 354 選択入力文字パターン群表示 355 否選択入力文字パターン群表示 391〜394 ステップ 410 履歴情報 411 正解文字 412 言語履歴情報 413 入力履歴情報 420 修正情報 421 利用回数 422 正利用回数 423 負利用回数 501〜507 ステップ
Claims (5)
- 【請求項1】 文字、図形、音声等のパターン情報を自
動的に認識し、認識結果を検証、および確認修正するの
に必要な認識情報、すなわち認識処理系から得られる入
力文字イメージまたは音声、文字の特徴または音声の特
徴、認識結果、認識結果に含まれる候補情報である候補
文字または候補コードと距離値、あるいは類似度を保存
しておく認識情報格納部と、前記認識情報に対して言語
処理や候補情報による検証を施し、認識誤り候補の文字
列またはコード列、およびそれらの文字列またはコード
列に対する訂正候補の文字列またはコード列を抽出して
検証情報格納部に記憶しておく検証処理部等を有し、文
字パターン情報またはコード列情報を計算機で処理でき
るようなコードデータに変換する修正部を含むパターン
認識装置において、 前記検証情報格納部中の認識誤り候補の文字列またはコ
ード列、あるいはそれらの訂正候補の文字列またはコー
ド列が同じ、あるいは類似のカテゴリから成っているも
のを同一カテゴリの文字またはコードが誤ったものと見
なして自動的に抽出する同一文字列またはコード列抽出
部と、 該同一文字列またはコード列抽出部で得られた複数の同
一、あるいは類似のカテゴリの文字列群またはコード列
群を入力文字イメージまたは入力音声とともに表示部に
表示し、オペレータが文字列またはコード列を複数個選
択し、複数カ所を一度に正解文字または正解音声に変換
したり、新たな正解文字または正解コードを入力したり
できるようにする修正処理部とを備えたことを特徴とす
るパターン認識装置。 - 【請求項2】 オペレータが選択、あるいは入力した正
解文字または正解コード、認識誤り候補の文字列または
コード列と、訂正候補の文字列またはコード列と、認識
情報とを蓄積する履歴情報格納部と、修正情報格納部を
備え、 前記修正部は、該履歴情報格納部の履歴情報の中の重複
する情報を1つにまとめて他の情報を除去し、同一カテ
ゴリが答えになると思われる情報を選択・まとめるため
の修正情報を算出して前記修正情報格納部に格納し、検
証情報および認識情報の中から前記修正情報格納部内の
修正情報と同一の認識誤り候補の文字列またはコード
列、あるいは同一の訂正候補の文字列またはコード列を
検出し、前記文字列またはコード列が同じ、あるいは類
似のカテゴリからなっているものを同一カテゴリの文字
または音声が誤ったものと見なして自動的に抽出する請
求項1記載のパターン認識装置。 - 【請求項3】 前記修正部は、オペレータが選択あるい
は入力した正解文字または正解コードを利用して、前記
表示部上に表示された複数の文字列またはコード列の中
から同一の認識誤り候補の文字列またはコード列、ある
いは訂正候補の文字列またはコード列をオペレータが選
択した正解文字または正解コードに書き換える機能と、
この処理を繰り返すことによって認識誤り候補の文字列
またはコード列の種々のカテゴリに対して正解文字また
は正解コードに修正する機能を有する、請求項2記載の
パターン認識装置。 - 【請求項4】 前記修正部は、同一の認識誤り候補の文
字列またはコード列、あるいは訂正候補の文字列または
コード列、文字イメージまたは入力音声、およびその前
後に格納されている認識情報を前記認識情報格納部の中
から自動的に抽出し、これらを同時に前記表示部に表示
する請求項1または2記載のパターン認識装置。 - 【請求項5】 前記修正部は、検証情報および認識情報
の中から前記修正情報格納部内の修正情報と同一の認識
誤り候補の文字列またはコード列、あるいは同一の訂正
候補の文字列またはコード列の確からしさを信頼度とし
て算出する同一文字列または同一コード列検出の機能
と、前記文字列または前記コード列が同じ、あるいは類
似のカテゴリから成っているものを同一カテゴリの文字
またはコードが誤ったものと見なし、その確からしさを
信頼度として算出するとともに信頼度の高い順から自動
的に抽出する機能を有する請求項1または2記載のパタ
ーン認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4217946A JPH0668261A (ja) | 1992-08-17 | 1992-08-17 | パターン認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4217946A JPH0668261A (ja) | 1992-08-17 | 1992-08-17 | パターン認識装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0668261A true JPH0668261A (ja) | 1994-03-11 |
Family
ID=16712188
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4217946A Pending JPH0668261A (ja) | 1992-08-17 | 1992-08-17 | パターン認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0668261A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002279353A (ja) * | 2001-03-15 | 2002-09-27 | Ricoh Co Ltd | 文字認識装置、その方法、および記録媒体 |
-
1992
- 1992-08-17 JP JP4217946A patent/JPH0668261A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2002279353A (ja) * | 2001-03-15 | 2002-09-27 | Ricoh Co Ltd | 文字認識装置、その方法、および記録媒体 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0696263A (ja) | パターン認識装置 | |
| JP3394694B2 (ja) | フォーマット情報登録方法及びocrシステム | |
| JPH0668261A (ja) | パターン認識装置 | |
| JPH0612520A (ja) | 文字認識装置の確認修正方式 | |
| KR950001061B1 (ko) | 문서인식 수정장치 | |
| JP2890788B2 (ja) | 文書認識装置 | |
| JPH0713991A (ja) | 誤認文字修正装置 | |
| JP2002207960A (ja) | 認識文字修正方法及び認識文字修正プログラム | |
| JPH05108867A (ja) | パターン認識装置 | |
| JPH06119483A (ja) | 文字読み取り装置 | |
| JPS61163472A (ja) | 文字認識装置 | |
| JPH0636066A (ja) | 文字認識装置の確認修正処理方式 | |
| JPH0520492A (ja) | 文書認識修正装置 | |
| JP2024081434A (ja) | 計算機システム及びグラフ認識方法 | |
| JPH06251187A (ja) | 文字認識誤り修正方法及び装置 | |
| JP2953162B2 (ja) | 文字認識装置 | |
| JPH03240183A (ja) | 認識文字自動修正方式 | |
| JP2669897B2 (ja) | 誤読文字の修正方法 | |
| CN117273001A (zh) | 病历实体提取方法及装置 | |
| JPS63143684A (ja) | 文字認識装置における認識結果修正方法 | |
| JPH04268684A (ja) | 認識文字の修正方法 | |
| JPH06195514A (ja) | 文字認識装置 | |
| JPS6398788A (ja) | 認識装置 | |
| JPH08221507A (ja) | 文書認識方法および装置 | |
| JPH06187507A (ja) | 文字認識装置 |