JPH0696288A - 文字認識装置及び機械翻訳装置 - Google Patents
文字認識装置及び機械翻訳装置Info
- Publication number
- JPH0696288A JPH0696288A JP4240602A JP24060292A JPH0696288A JP H0696288 A JPH0696288 A JP H0696288A JP 4240602 A JP4240602 A JP 4240602A JP 24060292 A JP24060292 A JP 24060292A JP H0696288 A JPH0696288 A JP H0696288A
- Authority
- JP
- Japan
- Prior art keywords
- character
- reading
- character recognition
- unit
- layout
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Document Processing Apparatus (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】 文の終了を示す記号を正しく認識することが
できる文字認識装置を提供することを目的とする。 【構成】 紙面上の記載内容を読み取った結果などのイ
メージデータに対して文字認識を行う文字認識装置にお
いて、文字認識により、句読点やピリオド、カンマの認
識結果に曖昧性がある場合に、その句読点やピリオド、
カンマの前後を解析することにより、その場所で文が終
了する可能性が高い場合には、句点またはピリオドなど
文の終了を示す記号を優先させ、それ以外の場合は、読
点・カンマなど文を終了させない記号を優先させる機能
を有することを特徴とする。 【効果】 文字認識の精度が向上する。
できる文字認識装置を提供することを目的とする。 【構成】 紙面上の記載内容を読み取った結果などのイ
メージデータに対して文字認識を行う文字認識装置にお
いて、文字認識により、句読点やピリオド、カンマの認
識結果に曖昧性がある場合に、その句読点やピリオド、
カンマの前後を解析することにより、その場所で文が終
了する可能性が高い場合には、句点またはピリオドなど
文の終了を示す記号を優先させ、それ以外の場合は、読
点・カンマなど文を終了させない記号を優先させる機能
を有することを特徴とする。 【効果】 文字認識の精度が向上する。
Description
【0001】
【産業上の利用分野】本発明は、原稿に記載された文字
を読取る文字認識装置,及び第1の言語を第2の言語に
翻訳する機械翻訳装置に関する。
を読取る文字認識装置,及び第1の言語を第2の言語に
翻訳する機械翻訳装置に関する。
【0002】
【従来の技術】近年の文書の処理の電子化に伴い、紙に
印刷された文書を読み取り、電子メディア化する文字読
取装置が開発されている。従来の文字認識装置は、各種
文書が記載された原稿を読み取るスキャナなどの読み取
り部により読み取る。このとき、読み取り部は原稿を文
字の集まりとして捕らえるのではなく、点の集まりから
なる画像データとして読み取る。そして、読み取り部が
読み取った画像データから文字認識部は任意の範囲を取
り出し、認識用辞書に格納している標準文字パターン照
合処理を行う。この結果、前記文字認識部で照合ができ
れば、この文字は出力部に出力されると共に記録部に記
録される。これらの処理を行う事によって原稿上の文字
が該装置に入力される。しかし、これらの処理では、数
字の”0”とアルファベットの”O”、数字の”1”と
小文字の”l(エル)”と大文字の”I(ア
イ)”、”、(読点)”と”。(句点)”、”.(ピリ
オド)”と”,(カンマ)”など類似した文字の間に曖
昧性が残り、読み間違いが起こる場合があった。このた
め、曖昧性がある部分をオペレータに示し、修正を促す
機能が備えられている。
印刷された文書を読み取り、電子メディア化する文字読
取装置が開発されている。従来の文字認識装置は、各種
文書が記載された原稿を読み取るスキャナなどの読み取
り部により読み取る。このとき、読み取り部は原稿を文
字の集まりとして捕らえるのではなく、点の集まりから
なる画像データとして読み取る。そして、読み取り部が
読み取った画像データから文字認識部は任意の範囲を取
り出し、認識用辞書に格納している標準文字パターン照
合処理を行う。この結果、前記文字認識部で照合ができ
れば、この文字は出力部に出力されると共に記録部に記
録される。これらの処理を行う事によって原稿上の文字
が該装置に入力される。しかし、これらの処理では、数
字の”0”とアルファベットの”O”、数字の”1”と
小文字の”l(エル)”と大文字の”I(ア
イ)”、”、(読点)”と”。(句点)”、”.(ピリ
オド)”と”,(カンマ)”など類似した文字の間に曖
昧性が残り、読み間違いが起こる場合があった。このた
め、曖昧性がある部分をオペレータに示し、修正を促す
機能が備えられている。
【0003】また、文字認識装置を計算機を用いて文章
の翻訳を行う機械翻訳装置の入力装置として使用する場
合が増えてきている。機械翻訳装置では、入力された文
章を文に分割し、分割された文毎に一文単位で翻訳を行
う。文への分割は、改行やピリオド、句点等文末を示す
記号によって行う場合が多い。しかし、文字認識装置で
の認識結果には、”、(読点)”と”。(句
点)”、”.(ピリオド)”と”,(カンマ)”の曖昧
性があり、これらを誤って認識する場合が多く、他の文
字より小さい記号であるためオペレータもこれらの認識
誤りを見落とすことが多かった。このため、このよう
に”、(読点)”と”。(句点)”、”.(ピリオ
ド)”と”,(カンマ)”の認識誤りを含むデータを機
械翻訳システムの入力データとして使用すると、文章中
に於ける文の分割に誤りが生じ、機械翻訳の結果が著し
く悪くなるという問題があった。
の翻訳を行う機械翻訳装置の入力装置として使用する場
合が増えてきている。機械翻訳装置では、入力された文
章を文に分割し、分割された文毎に一文単位で翻訳を行
う。文への分割は、改行やピリオド、句点等文末を示す
記号によって行う場合が多い。しかし、文字認識装置で
の認識結果には、”、(読点)”と”。(句
点)”、”.(ピリオド)”と”,(カンマ)”の曖昧
性があり、これらを誤って認識する場合が多く、他の文
字より小さい記号であるためオペレータもこれらの認識
誤りを見落とすことが多かった。このため、このよう
に”、(読点)”と”。(句点)”、”.(ピリオ
ド)”と”,(カンマ)”の認識誤りを含むデータを機
械翻訳システムの入力データとして使用すると、文章中
に於ける文の分割に誤りが生じ、機械翻訳の結果が著し
く悪くなるという問題があった。
【0004】また、機械翻訳、文書データベース、電子
出版等、計算機を用いた文書処理が盛んに行われるにつ
れ、新聞、雑誌、マニュアルなどの一般に流通している
既存の文書を簡単に入力したいという要求が増えてきた
ため、原稿のレイアウトを自動的に認識する機能を備え
た文字認識装置もある。
出版等、計算機を用いた文書処理が盛んに行われるにつ
れ、新聞、雑誌、マニュアルなどの一般に流通している
既存の文書を簡単に入力したいという要求が増えてきた
ため、原稿のレイアウトを自動的に認識する機能を備え
た文字認識装置もある。
【0005】例えば、従来装置は図17に示すように、
まず各種原稿を読み取り部301によって読み取る。こ
の時、読み取り部301は原稿を文字の集まりとして扱
うのでなく、点の集まりからなる画像データとして入力
する。そして、読み取り部301が読み取った画像デー
タから文字認識部302は任意の範囲を切出し、図示し
ない認識用辞書に格納されている標準パターンとパター
ン照合処理を行なう。この結果、前記文字認識部302
で照合ができれば、その文字コードを出力部303に出
力するとともに、記憶部304に記憶する。これらの処
理を行なうことで、原稿上の文字が該装置に入力され
る。なお、制御部305は各部の制御を行なうものであ
る。
まず各種原稿を読み取り部301によって読み取る。こ
の時、読み取り部301は原稿を文字の集まりとして扱
うのでなく、点の集まりからなる画像データとして入力
する。そして、読み取り部301が読み取った画像デー
タから文字認識部302は任意の範囲を切出し、図示し
ない認識用辞書に格納されている標準パターンとパター
ン照合処理を行なう。この結果、前記文字認識部302
で照合ができれば、その文字コードを出力部303に出
力するとともに、記憶部304に記憶する。これらの処
理を行なうことで、原稿上の文字が該装置に入力され
る。なお、制御部305は各部の制御を行なうものであ
る。
【0006】また、一般に流通している既存文書は、紙
の質、紙の表面の加工、文字の背景等の違いで、入力さ
れる画像を一定に保つことができない。このため、予め
定められた読取りレベルを選択して文字画像を読み取る
ことができる。この場合、読み取りレベルは、読み取り
部301から原稿を読み取る前に、例えば、薄い原稿、
普通の原稿、濃い原稿等を出力部303に表示を行ない
オペレータが選択することで実現されている。この選択
された読み取りレベルは、読み取り濃度の白黒を判定す
るしきい値として読み取り部301に送られ、送られた
しきい値に従って、画像データが入力される。
の質、紙の表面の加工、文字の背景等の違いで、入力さ
れる画像を一定に保つことができない。このため、予め
定められた読取りレベルを選択して文字画像を読み取る
ことができる。この場合、読み取りレベルは、読み取り
部301から原稿を読み取る前に、例えば、薄い原稿、
普通の原稿、濃い原稿等を出力部303に表示を行ない
オペレータが選択することで実現されている。この選択
された読み取りレベルは、読み取り濃度の白黒を判定す
るしきい値として読み取り部301に送られ、送られた
しきい値に従って、画像データが入力される。
【0007】しかし、この種の文字読取り装置の読み取
りレベルは、予め定められた値をオペレータが選択する
ようになっている。どの値を選択するかは、オペレータ
の感覚で相違し、どの値で読み取るのが最適であるか知
ることは困難であるという問題点があった。
りレベルは、予め定められた値をオペレータが選択する
ようになっている。どの値を選択するかは、オペレータ
の感覚で相違し、どの値で読み取るのが最適であるか知
ることは困難であるという問題点があった。
【0008】一方、従来における機械翻訳装置では、文
字認識装置によって原稿を読取っている。このような文
字認識装置には、原稿上のどの部分に文字があるか、ま
た、どの部分が記事としてまとまりがあるかを解析する
レイアウト解析機能を有し、その解析結果に従って文字
認識を行う機能を有するものもある。さらに、読み取っ
た原稿を印刷したり、ファイルとして出力したりする際
に、レイアウト解析の結果を利用して、もとの原稿に近
いイメージで出力する機能を有するものもある。
字認識装置によって原稿を読取っている。このような文
字認識装置には、原稿上のどの部分に文字があるか、ま
た、どの部分が記事としてまとまりがあるかを解析する
レイアウト解析機能を有し、その解析結果に従って文字
認識を行う機能を有するものもある。さらに、読み取っ
た原稿を印刷したり、ファイルとして出力したりする際
に、レイアウト解析の結果を利用して、もとの原稿に近
いイメージで出力する機能を有するものもある。
【0009】また、日本語文書の読取りが行われるにお
よび、縦書き文書の読取りや、レイアウト解析の一部と
して文字が横書きか縦書きかを識別して読み取る機能も
開発されている。
よび、縦書き文書の読取りや、レイアウト解析の一部と
して文字が横書きか縦書きかを識別して読み取る機能も
開発されている。
【0010】一方、計算機上で文書をWYSWYGで編集する
DTP アプリケーションが開発されている。こういったツ
ールを使用すると、原稿を見た通りに計算機上に再現で
きる。しかし、こういったツールでは、横書きが中心で
あり、縦書きの表示ができるものは少ない。したがっ
て、文書読取り装置によって、縦書きの文書を読取り、
レイアウトを反映させて出力しても、それをWYSWYGで編
集することができない。
DTP アプリケーションが開発されている。こういったツ
ールを使用すると、原稿を見た通りに計算機上に再現で
きる。しかし、こういったツールでは、横書きが中心で
あり、縦書きの表示ができるものは少ない。したがっ
て、文書読取り装置によって、縦書きの文書を読取り、
レイアウトを反映させて出力しても、それをWYSWYGで編
集することができない。
【0011】さらに、機械翻訳システムの入力装置とし
て、文書読取装置を使用する場合には、入力原稿のイメ
ージで翻訳結果を出力するシステムも開発されている
が、例えば日本語の縦書き文書を英語に翻訳する場合に
は、翻訳結果である英文を縦書きすることが出来ないの
で、レイアウト情報を利用することが出来なかった。
て、文書読取装置を使用する場合には、入力原稿のイメ
ージで翻訳結果を出力するシステムも開発されている
が、例えば日本語の縦書き文書を英語に翻訳する場合に
は、翻訳結果である英文を縦書きすることが出来ないの
で、レイアウト情報を利用することが出来なかった。
【0012】
【発明が解決しようとする課題】上述したように、従来
の文字認識装置では、読み誤り箇所の候補をオペレータ
に示していたが、”、(読点)”、”。(句
点)”、”.(ピリオド)”、”,(カンマ)”といっ
た記号は見落とし易く、また、この様な文の終了を示す
記号の認識誤りを含むデータを機械翻訳システムの入力
データとして使用すると、文章中に於ける文の分割に誤
りが生じ、機械翻訳の結果が著しく悪くなるが、従来の
文字認識装置では文の終了を示す記号は他の文字と同程
度の重要性しかなかったため、これらの記号の認識率が
必ずしも高くないという問題が有った。
の文字認識装置では、読み誤り箇所の候補をオペレータ
に示していたが、”、(読点)”、”。(句
点)”、”.(ピリオド)”、”,(カンマ)”といっ
た記号は見落とし易く、また、この様な文の終了を示す
記号の認識誤りを含むデータを機械翻訳システムの入力
データとして使用すると、文章中に於ける文の分割に誤
りが生じ、機械翻訳の結果が著しく悪くなるが、従来の
文字認識装置では文の終了を示す記号は他の文字と同程
度の重要性しかなかったため、これらの記号の認識率が
必ずしも高くないという問題が有った。
【0013】また、従来の文字認識装置は、読み取る原
稿の違いをオペレータが感覚的に指示することで実現さ
れ、どの読み取りレベルで原稿を読み取るのが認識装置
にとって最適であるか知ることが困難であった。更に、
原稿に合った最適な読み取りレベルを記憶する方法が提
供されていないため同様な原稿を読み取る場合に簡単に
読み取りベルを指示することができないという問題点が
あった。
稿の違いをオペレータが感覚的に指示することで実現さ
れ、どの読み取りレベルで原稿を読み取るのが認識装置
にとって最適であるか知ることが困難であった。更に、
原稿に合った最適な読み取りレベルを記憶する方法が提
供されていないため同様な原稿を読み取る場合に簡単に
読み取りベルを指示することができないという問題点が
あった。
【0014】そして、従来の機械翻訳装置では、縦書き
の文書を読み込んだときそのレイアウト情報を有効に使
用できないという問題があった。
の文書を読み込んだときそのレイアウト情報を有効に使
用できないという問題があった。
【0015】この発明はこのような従来の課題を解決す
るためになされたもので、その第1の目的は、文字中の
句読点,ピリオド及びカンマを正しく認識し得る文字認
識装置を提供することである。また、第2の目的は、読
取る原稿に適合した最適な読取りレベルで文字を認識す
ることのできる文字認識装置を提供することである。更
に、第3の目的は、レイアウト情報を有効に利用して翻
訳結果を出力し得る機械翻訳装置を提供することであ
る。
るためになされたもので、その第1の目的は、文字中の
句読点,ピリオド及びカンマを正しく認識し得る文字認
識装置を提供することである。また、第2の目的は、読
取る原稿に適合した最適な読取りレベルで文字を認識す
ることのできる文字認識装置を提供することである。更
に、第3の目的は、レイアウト情報を有効に利用して翻
訳結果を出力し得る機械翻訳装置を提供することであ
る。
【0016】
【課題を解決するための手段】上記目的を達成するた
め、本願第1の発明は、入力されたイメージデータの文
字認識を行なう文字認識装置において、読取られた文字
中に存在する句読点,ピリオド,カンマの認識性に曖昧
性があるか否かを判定する手段と、曖昧性があると判定
された場合には当該曖昧な句読点,ピリオド,カンマの
前後の文章を参照して句読点,ピリオド,カンマのいず
れかを決定する手段と、を有することが特徴である。
め、本願第1の発明は、入力されたイメージデータの文
字認識を行なう文字認識装置において、読取られた文字
中に存在する句読点,ピリオド,カンマの認識性に曖昧
性があるか否かを判定する手段と、曖昧性があると判定
された場合には当該曖昧な句読点,ピリオド,カンマの
前後の文章を参照して句読点,ピリオド,カンマのいず
れかを決定する手段と、を有することが特徴である。
【0017】また、本願第2の発明は、設定された読取
りレベルに従って文書画像を入力する手段と、入力され
た文書画像から文字行を切出し、該文字行から各文字を
切出して文字認識する手段とを備えた文字認識装置にお
いて、文書画像を読取る原稿の質、濃淡等の各属性に応
じた読取りレベルを予め格納する手段と、実際に原稿を
読取る際には当該原稿の属性を識別し、これに対応する
読取りレベルにて読取りを行なう手段と、を有すること
を特徴とする。
りレベルに従って文書画像を入力する手段と、入力され
た文書画像から文字行を切出し、該文字行から各文字を
切出して文字認識する手段とを備えた文字認識装置にお
いて、文書画像を読取る原稿の質、濃淡等の各属性に応
じた読取りレベルを予め格納する手段と、実際に原稿を
読取る際には当該原稿の属性を識別し、これに対応する
読取りレベルにて読取りを行なう手段と、を有すること
を特徴とする。
【0018】更に、本願第3の発明は第1の言語を第2
の言語に翻訳する機械翻訳装置において、原稿に記載さ
れた第1の言語文字の画像データを認識し、当該文字の
レイアウトを解析するレイアウト解析手段と、この第1
の言語文字が縦書きであるか横書きであるかを判定する
文字方向判定手段と、第1の言語文字と、これを翻訳し
た第2の言語文字との文字方向が異なる場合には前記レ
イアウト解析手段にて解析されたレイアウトの方向を文
字方向と同様に変更し、変更後のレイアウトで第2の言
語文字を出力する手段と、を有することを特徴とする。
の言語に翻訳する機械翻訳装置において、原稿に記載さ
れた第1の言語文字の画像データを認識し、当該文字の
レイアウトを解析するレイアウト解析手段と、この第1
の言語文字が縦書きであるか横書きであるかを判定する
文字方向判定手段と、第1の言語文字と、これを翻訳し
た第2の言語文字との文字方向が異なる場合には前記レ
イアウト解析手段にて解析されたレイアウトの方向を文
字方向と同様に変更し、変更後のレイアウトで第2の言
語文字を出力する手段と、を有することを特徴とする。
【0019】
【作用】上述の如く構成された本願第1の発明に係る文
字認識装置では、句読点やピリオド、カンマの認識結果
に曖昧性がある場合に、その句読点やピリオド、カンマ
の前後を解析することにより、その場所で文が終了する
可能性が高い場合には、句点またはピリオドなど文の終
了を示す記号を優先させ、それ以外の場合は、読点・カ
ンマなど文を終了させない記号を優先させる機能を有
し、文の終了を示す記号を正しく認識することができ
る。
字認識装置では、句読点やピリオド、カンマの認識結果
に曖昧性がある場合に、その句読点やピリオド、カンマ
の前後を解析することにより、その場所で文が終了する
可能性が高い場合には、句点またはピリオドなど文の終
了を示す記号を優先させ、それ以外の場合は、読点・カ
ンマなど文を終了させない記号を優先させる機能を有
し、文の終了を示す記号を正しく認識することができ
る。
【0020】また、本願第2の発明に係る文字認識装置
では、読み取る原稿の紙の質、紙の表面の加工、文字の
背景等の違いで一定でない読み取りレベルをオペレータ
が選択する必要がなく、原稿に合った最適な読み取りレ
ベルを求めることができる。かつ、その読み取りレベル
に識別名を付けて記憶することで、同様の原稿を読み取
るとき識別名で簡単に読み取りレベルを指示することが
でき、オペレータの労力を大幅に軽減できる。
では、読み取る原稿の紙の質、紙の表面の加工、文字の
背景等の違いで一定でない読み取りレベルをオペレータ
が選択する必要がなく、原稿に合った最適な読み取りレ
ベルを求めることができる。かつ、その読み取りレベル
に識別名を付けて記憶することで、同様の原稿を読み取
るとき識別名で簡単に読み取りレベルを指示することが
でき、オペレータの労力を大幅に軽減できる。
【0021】更に、本願第3の発明に係る機械翻訳装置
では、縦書きの文書の場合はレイアウト情報を回転し、
横書きの文書として出力することによって、レイアウト
情報を有効に利用できる。
では、縦書きの文書の場合はレイアウト情報を回転し、
横書きの文書として出力することによって、レイアウト
情報を有効に利用できる。
【0022】
【実施例】以下、本発明の実施例を図面に基づいて説明
する。図1は本発明の第1実施例に係る文字認識装置で
ある。同図において、入力部1は、コマンドを入力した
り、認識結果に対する修正文字を入力するためのもので
通常、キーボードやマウス、タッチパネルなどが用いら
れる。表示部2は、前記入力部より入力されたコマンド
や文字列を表示したり、後述する読み取り部からの読み
取り結果や文字認識部による文字認識の途中状態や認識
結果などを表示したりするもので、通常ビットマップデ
ィスプレイなどが用いられるが、オペレータが装着した
ゴーグルや壁面に投射しても良い。なお、画面を分割
し、片方を読み取り部が読み取った画像イメージを表示
させ、他方に本装置が認識した文字を対応させて表示す
ることもできる。記録部3は後述する読み取り部で読み
取った画像データや、文字認識部による文字認識の途中
経過や最終結果等を記録するものである。読み取り部4
は原稿を読み取る為の物で、例えばラインイメージセン
サを備えたスキャナなどが用いられる。なお、このスキ
ャナの解像度により、読み取れる文字の種類が決まる。
文字認識部5は前記読み取り部が原稿を読み取った結果
得られた画像等のデータを文字として認識するものであ
る。前記読み取り部が原稿を読み取る時は、文字単位で
読み取っているのではなく、原稿の一端から順次スキャ
ンしていき、各点に情報があるか無いかの2値で表して
画像データを得る。このため解像度を上げるほど、より
細かく原稿を読み取る事になり、より複雑な文字も読み
取る事ができる。そして、文字認識部5は画像データの
任意の範囲を対象にして認識用辞書6に予め記録してい
る標準文字パターンとのパターン照合を行う。このパタ
ーン照合処理を画像データの全ての処理に対して行い、
これらの対応する文字の認識を行う。文末記号優先処理
部7は、文字認識部によって認識された結果を読み込
み、句読点やピリオド、カンマに曖昧性がある場合に
は、その記号の前後を解析し、この部分が文の切れ目に
なる可能性が高い場合には、句点やピリオドといった文
末を示す記号を優先し、それ以外の場合には読点やカン
マといった文末以外の記号を優先するといった処理を行
うものである。制御部8は、前記各部の制御やデータの
受け渡しを行うためのものである。
する。図1は本発明の第1実施例に係る文字認識装置で
ある。同図において、入力部1は、コマンドを入力した
り、認識結果に対する修正文字を入力するためのもので
通常、キーボードやマウス、タッチパネルなどが用いら
れる。表示部2は、前記入力部より入力されたコマンド
や文字列を表示したり、後述する読み取り部からの読み
取り結果や文字認識部による文字認識の途中状態や認識
結果などを表示したりするもので、通常ビットマップデ
ィスプレイなどが用いられるが、オペレータが装着した
ゴーグルや壁面に投射しても良い。なお、画面を分割
し、片方を読み取り部が読み取った画像イメージを表示
させ、他方に本装置が認識した文字を対応させて表示す
ることもできる。記録部3は後述する読み取り部で読み
取った画像データや、文字認識部による文字認識の途中
経過や最終結果等を記録するものである。読み取り部4
は原稿を読み取る為の物で、例えばラインイメージセン
サを備えたスキャナなどが用いられる。なお、このスキ
ャナの解像度により、読み取れる文字の種類が決まる。
文字認識部5は前記読み取り部が原稿を読み取った結果
得られた画像等のデータを文字として認識するものであ
る。前記読み取り部が原稿を読み取る時は、文字単位で
読み取っているのではなく、原稿の一端から順次スキャ
ンしていき、各点に情報があるか無いかの2値で表して
画像データを得る。このため解像度を上げるほど、より
細かく原稿を読み取る事になり、より複雑な文字も読み
取る事ができる。そして、文字認識部5は画像データの
任意の範囲を対象にして認識用辞書6に予め記録してい
る標準文字パターンとのパターン照合を行う。このパタ
ーン照合処理を画像データの全ての処理に対して行い、
これらの対応する文字の認識を行う。文末記号優先処理
部7は、文字認識部によって認識された結果を読み込
み、句読点やピリオド、カンマに曖昧性がある場合に
は、その記号の前後を解析し、この部分が文の切れ目に
なる可能性が高い場合には、句点やピリオドといった文
末を示す記号を優先し、それ以外の場合には読点やカン
マといった文末以外の記号を優先するといった処理を行
うものである。制御部8は、前記各部の制御やデータの
受け渡しを行うためのものである。
【0023】図2は、本発明に於ける文字認識装置の全
体の処理の流れを示すフローチャートである。原稿を文
字データとして電子化するためには、まず、原稿を読み
取り部により読み取る(ステップST1)。次に、読み
取った結果に対して文字認識を行う(ステップST
2)。この認識結果中に認識時に曖昧性が有ると判断さ
れた句読点、カンマ、ピリオドが有るか否かを検査し
(ステップST3)、ある場合には認識結果を文末記号
優先処理部に転送し、文末記号優先処理を行い(ステッ
プST4)、最終的な結果を得る。
体の処理の流れを示すフローチャートである。原稿を文
字データとして電子化するためには、まず、原稿を読み
取り部により読み取る(ステップST1)。次に、読み
取った結果に対して文字認識を行う(ステップST
2)。この認識結果中に認識時に曖昧性が有ると判断さ
れた句読点、カンマ、ピリオドが有るか否かを検査し
(ステップST3)、ある場合には認識結果を文末記号
優先処理部に転送し、文末記号優先処理を行い(ステッ
プST4)、最終的な結果を得る。
【0024】図3は文末記号優先部の構成の一例を示す
ブロック図である。文末記号優先処理部は認識結果を認
識結果入力部11を通し受けとり、必要な処理を制御部
12で行い、出力部13を介して処理結果を出力する。
制御部12では、句点・ピリオドと読点・カンマのうち
どちらかを優先するかの判断を行う。判断の為に、制御
部は、文末になりやすい語リスト14、文頭になりやす
い語リスト15、文の切れ目になりやすい語リスト1
6、切れ目判定条件17、形態素解析部18等を利用す
る。文末になりやすい語リスト14には、日本語の場合
では例えば「です」「ます」「でした」などが記録され
ており、この語が曖昧性のある句読点の直前に在る場合
には、句点を優先するという処理を行う。文頭になりや
すい語リスト15には、日本語の場合、例えば「しか
し」などの接続詞や間投詞などが記録されており、この
語が曖昧性のある句読点の直後にある場合には句点を優
先するという処理を行う。文の切れ目になりやすい語リ
スト16には、例えば「?」などの記号が記録されてお
り、この語が曖昧性のある句読点の前後に在る場合には
句点を優先するという処理を行う。切れ目判定条件17
には、例えば、改行の直前の曖昧性のある句読点は句点
優先、あるいは、大文字の直前の場合はピリオド優先な
どの規則が記述されている。また、形態素解析部では曖
昧性のある句読点の前の部分を形態素解析し、制御部で
はその結果を使用し、句読点の直前が終助詞、助動詞や
用言の終止形で在る場合には句点を優先させる。
ブロック図である。文末記号優先処理部は認識結果を認
識結果入力部11を通し受けとり、必要な処理を制御部
12で行い、出力部13を介して処理結果を出力する。
制御部12では、句点・ピリオドと読点・カンマのうち
どちらかを優先するかの判断を行う。判断の為に、制御
部は、文末になりやすい語リスト14、文頭になりやす
い語リスト15、文の切れ目になりやすい語リスト1
6、切れ目判定条件17、形態素解析部18等を利用す
る。文末になりやすい語リスト14には、日本語の場合
では例えば「です」「ます」「でした」などが記録され
ており、この語が曖昧性のある句読点の直前に在る場合
には、句点を優先するという処理を行う。文頭になりや
すい語リスト15には、日本語の場合、例えば「しか
し」などの接続詞や間投詞などが記録されており、この
語が曖昧性のある句読点の直後にある場合には句点を優
先するという処理を行う。文の切れ目になりやすい語リ
スト16には、例えば「?」などの記号が記録されてお
り、この語が曖昧性のある句読点の前後に在る場合には
句点を優先するという処理を行う。切れ目判定条件17
には、例えば、改行の直前の曖昧性のある句読点は句点
優先、あるいは、大文字の直前の場合はピリオド優先な
どの規則が記述されている。また、形態素解析部では曖
昧性のある句読点の前の部分を形態素解析し、制御部で
はその結果を使用し、句読点の直前が終助詞、助動詞や
用言の終止形で在る場合には句点を優先させる。
【0025】図4,5は文末記号優先部の一実施例の動
作の概要を示すフローチャートである。文末記号優先部
は、認識結果Aを読み込む事により動作を開始する(ス
テップST11)。次に読み込んだデータ中に、文字認
識部で曖昧性が有ると判断された句読点、カンマ、ピリ
オドがあるか検索しこれをBとする(ステップST1
2)。Bの直前の語句が「文末になりやすい語句リス
ト」に含まれているか否かを検査する(ステップST1
3)。含まれている場合には、Bは文末を表す記号であ
る可能性が高いので、句点・ピリオドを優先させる(ス
テップST20)。含まれていない場合には、Bの直後
の語句が「文頭になりやすい語句リスト」に含まれてい
るか否かを検査する(ステップST14)。含まれてい
る場合には、Bは文末を表す記号である可能性が高いの
で、句点・ピリオドを優先させる(ステップST2
0)。含まれていない場合には、Bの直前・直後の語句
が「文の切れ目になりやすい語句リスト」に含まれてい
るか否かを検査する(ステップST15)。含まれてい
る場合には、Bは文末を表す記号である可能性が高いの
で、句点・ピリオドを優先させる(ステップST2
0)。含まれていない場合には、Bが文の切れ目条件を
満たしているか否かを検査する(ステップST16)。
満たしている場合には、Bは文末を表す記号である可能
性が高いので、句点・ピリオドを優先させる(ステップ
ST20)。満たしていない場合には、A中のBの全部
を形態素解析を行い、Bの直前の単語の品詞と活用形を
得る(ステップST17)。これが、終助詞、あるいは
用言・助動詞の終止形である場合には、Bは文末を表す
記号である可能性が高いので、句点・ピリオドを優先さ
せる(ステップST20)。それ以外の場合は、Bは文
末を表す記号でない可能性が高いので、読点・カンマを
優先させる(ステップST19)。こういった処理をA
中に曖昧性がある句読点、カンマ、ピリオドが無くなる
まで繰り返す(ステップST21)。
作の概要を示すフローチャートである。文末記号優先部
は、認識結果Aを読み込む事により動作を開始する(ス
テップST11)。次に読み込んだデータ中に、文字認
識部で曖昧性が有ると判断された句読点、カンマ、ピリ
オドがあるか検索しこれをBとする(ステップST1
2)。Bの直前の語句が「文末になりやすい語句リス
ト」に含まれているか否かを検査する(ステップST1
3)。含まれている場合には、Bは文末を表す記号であ
る可能性が高いので、句点・ピリオドを優先させる(ス
テップST20)。含まれていない場合には、Bの直後
の語句が「文頭になりやすい語句リスト」に含まれてい
るか否かを検査する(ステップST14)。含まれてい
る場合には、Bは文末を表す記号である可能性が高いの
で、句点・ピリオドを優先させる(ステップST2
0)。含まれていない場合には、Bの直前・直後の語句
が「文の切れ目になりやすい語句リスト」に含まれてい
るか否かを検査する(ステップST15)。含まれてい
る場合には、Bは文末を表す記号である可能性が高いの
で、句点・ピリオドを優先させる(ステップST2
0)。含まれていない場合には、Bが文の切れ目条件を
満たしているか否かを検査する(ステップST16)。
満たしている場合には、Bは文末を表す記号である可能
性が高いので、句点・ピリオドを優先させる(ステップ
ST20)。満たしていない場合には、A中のBの全部
を形態素解析を行い、Bの直前の単語の品詞と活用形を
得る(ステップST17)。これが、終助詞、あるいは
用言・助動詞の終止形である場合には、Bは文末を表す
記号である可能性が高いので、句点・ピリオドを優先さ
せる(ステップST20)。それ以外の場合は、Bは文
末を表す記号でない可能性が高いので、読点・カンマを
優先させる(ステップST19)。こういった処理をA
中に曖昧性がある句読点、カンマ、ピリオドが無くなる
まで繰り返す(ステップST21)。
【0026】なお、ステップST13からST18の条
件判断の順序はこの順番に限らないし、すべての条件を
使用する必要もない。また、これらの条件の論理和や論
理積によって判断を行う事もできる。
件判断の順序はこの順番に限らないし、すべての条件を
使用する必要もない。また、これらの条件の論理和や論
理積によって判断を行う事もできる。
【0027】次に、本実施例に係わる文字読み取り装置
の動作を画面の図を参照して説明する。
の動作を画面の図を参照して説明する。
【0028】表1に示す様に”I have a pen, book and
bag. You …”文書を認識した際、”I have a pen. bo
ok and bag, You …”としてしまい、「.」と「,」に
は曖昧性があるとする。
bag. You …”文書を認識した際、”I have a pen. bo
ok and bag, You …”としてしまい、「.」と「,」に
は曖昧性があるとする。
【0029】
【表1】 このとき、”bag ”の次のカンマは次が大文字であるた
めピリオドである可能性が高く、”pen ”の次のピリオ
ドは図4,5に示す条件のどれにも当てはまらないため
カンマである可能性が高い事がわかる。このため、優先
度を付け直して出力したものが表2であり、正しい認識
結果となっていることがわかる。
めピリオドである可能性が高く、”pen ”の次のピリオ
ドは図4,5に示す条件のどれにも当てはまらないため
カンマである可能性が高い事がわかる。このため、優先
度を付け直して出力したものが表2であり、正しい認識
結果となっていることがわかる。
【0030】
【表2】 なお、第1の実施例では、日本語及び英語を例にあげて
説明しているが、これは、この言語に限定するものでは
なく、各リストや条件を対象言語に適したものに変更す
ることにより他の言語の認識にも適用できる。
説明しているが、これは、この言語に限定するものでは
なく、各リストや条件を対象言語に適したものに変更す
ることにより他の言語の認識にも適用できる。
【0031】次に、本発明の第2実施例について説明す
る。図6は第2実施例を示す構成図であり、以下、日本
語の原稿を読取る例について説明する。
る。図6は第2実施例を示す構成図であり、以下、日本
語の原稿を読取る例について説明する。
【0032】図6において、読み取り部21は原稿を読
み取るもので、例えばイメージセンサを備えたスキャナ
が用いられる。なお、このスキャナの解像度により読み
取れる文字の種類が決まる。また、しきい値は、例えば
1〜256の段階で設定でき、読み取る原稿に合わせて
制御できる。
み取るもので、例えばイメージセンサを備えたスキャナ
が用いられる。なお、このスキャナの解像度により読み
取れる文字の種類が決まる。また、しきい値は、例えば
1〜256の段階で設定でき、読み取る原稿に合わせて
制御できる。
【0033】出力部22は前記読み取り部21で読み取
られた画像データに対し、後述するパターン照合処理し
た結果を表示するために、例えばビットマップディスプ
レイ等が使用される。なお、ディスプレイの画面上を分
割して、読み取り部21で入力した画像データと本装置
が認識した文字を対応させて表示することもできる。
られた画像データに対し、後述するパターン照合処理し
た結果を表示するために、例えばビットマップディスプ
レイ等が使用される。なお、ディスプレイの画面上を分
割して、読み取り部21で入力した画像データと本装置
が認識した文字を対応させて表示することもできる。
【0034】入力部23は出力部22に表示され認識さ
れた文字の修正、読み取りレベルに付けられた識別名の
選択等の文字認識装置を制御するための各種コマンドの
入力を可能にしたもので、キーボード、マウス等が使用
される。
れた文字の修正、読み取りレベルに付けられた識別名の
選択等の文字認識装置を制御するための各種コマンドの
入力を可能にしたもので、キーボード、マウス等が使用
される。
【0035】文字認識部24は前記読み取り部21が原
稿を読み取った画像データを文字として認識するもので
ある。前記読み取り部21が原稿を読み取るときは、文
字単位で読み取るのでなく、原稿の一端から順次スキャ
ン(走査)していき、各点に情報があるかないかの2値
で表された画像データを得る。このため解像度を上げる
ほどより細かく原稿を読み取ることになり、より複雑な
文字を読み取ることができる。そして文字認識部24は
画像データの任意の範囲を対象にして(つまり文字単
位、単語単位で切出して)文字認識部24が予め記憶し
ている標準文字パターンとのパターン照合処理を行な
う。このパターン照合処理を画像データの全てに対して
行ない、これらに対応する文字認識を行なう。
稿を読み取った画像データを文字として認識するもので
ある。前記読み取り部21が原稿を読み取るときは、文
字単位で読み取るのでなく、原稿の一端から順次スキャ
ン(走査)していき、各点に情報があるかないかの2値
で表された画像データを得る。このため解像度を上げる
ほどより細かく原稿を読み取ることになり、より複雑な
文字を読み取ることができる。そして文字認識部24は
画像データの任意の範囲を対象にして(つまり文字単
位、単語単位で切出して)文字認識部24が予め記憶し
ている標準文字パターンとのパターン照合処理を行な
う。このパターン照合処理を画像データの全てに対して
行ない、これらに対応する文字認識を行なう。
【0036】最適読取りレベル判定部25は文字認識部
24で認識された結果どれだけ正しく認識されているか
形態素解析をすることで判定する。形態素解析で失敗す
る文字がないときは、最適な読取りレベルと判定する。
形態素解析で失敗する文字数が多いときは、読取りレベ
ルを変更し、再度読取り部21から原稿を読み取る。
24で認識された結果どれだけ正しく認識されているか
形態素解析をすることで判定する。形態素解析で失敗す
る文字がないときは、最適な読取りレベルと判定する。
形態素解析で失敗する文字数が多いときは、読取りレベ
ルを変更し、再度読取り部21から原稿を読み取る。
【0037】形態素解析辞書部26は形態素解析をする
ための辞書で単語単位の見出し語情報、付属語情報等を
記憶する。記憶部27は、読み取り部21で読み取った
画像データ、文字認識部23による文字認識結果、読取
りレベルと対応する識別名等を記憶するものである。制
御部28は前記各部の制御やデータの仲介を行なうもの
である。
ための辞書で単語単位の見出し語情報、付属語情報等を
記憶する。記憶部27は、読み取り部21で読み取った
画像データ、文字認識部23による文字認識結果、読取
りレベルと対応する識別名等を記憶するものである。制
御部28は前記各部の制御やデータの仲介を行なうもの
である。
【0038】図7〜図11は制御部28の動作を示すフ
ローチャートである。オペレータが読取り部21に読み
取らせる原稿をセットすると、出力部22にどの読取り
レベルで行なうかが表示される。実施例では、既に原稿
に合った最適な読取りレベルに識別名を付けられて記憶
されている場合はその識別名が一覧表として表示され
る。最適な読取りレベルが判らないときは最適な読取り
レベルの設定モードが選択できるようになっている(ス
テップST31)。
ローチャートである。オペレータが読取り部21に読み
取らせる原稿をセットすると、出力部22にどの読取り
レベルで行なうかが表示される。実施例では、既に原稿
に合った最適な読取りレベルに識別名を付けられて記憶
されている場合はその識別名が一覧表として表示され
る。最適な読取りレベルが判らないときは最適な読取り
レベルの設定モードが選択できるようになっている(ス
テップST31)。
【0039】入力部23で識別名が選択されたときは識
別名に対応した読取りレベルを読取り部21に設定する
(ステップST32〜ST33)。その後、読取りモー
ドswを0にする(ステップST34)。読取りモード
swは、原稿の読取り、文字認識、形態素解析を共通に
使用するためのスイッチである。
別名に対応した読取りレベルを読取り部21に設定する
(ステップST32〜ST33)。その後、読取りモー
ドswを0にする(ステップST34)。読取りモード
swは、原稿の読取り、文字認識、形態素解析を共通に
使用するためのスイッチである。
【0040】最適な読取りレベルの設定モードが選択さ
れたときは、標準の読取りレベルを読取り部21に設定
する(ステップST35)。その後、読取りモードsw
を1に設定する(ステップST36)。
れたときは、標準の読取りレベルを読取り部21に設定
する(ステップST35)。その後、読取りモードsw
を1に設定する(ステップST36)。
【0041】設定された読取りレベルで原稿の読取りを
読取り部21で行なう(ステップST37)。読み取っ
た画像データは記憶部27に記憶され読み取りが終了
後、文字認識部24でレイアウト解析、文字認識と順番
に行われる(ステップST38)。
読取り部21で行なう(ステップST37)。読み取っ
た画像データは記憶部27に記憶され読み取りが終了
後、文字認識部24でレイアウト解析、文字認識と順番
に行われる(ステップST38)。
【0042】文字認識された結果は記憶部27に記憶さ
れる。この文字認識された文字列は形態解析され形態素
解析に失敗した文字列はマーキングされる(ステップS
T39)。レイアウト解析、文字認識、形態素解析は公
知の技術であるので詳細な説明は省略する。
れる。この文字認識された文字列は形態解析され形態素
解析に失敗した文字列はマーキングされる(ステップS
T39)。レイアウト解析、文字認識、形態素解析は公
知の技術であるので詳細な説明は省略する。
【0043】設定された読み取りレベルで入力された画
像データの文字認識はここで終了する。読み取りモード
swが0のときは、識別名が付けられて記憶されていた
読み取りレベルで入力する要求がなされたときで、認識
された文字及び形態素解析で失敗した文字列を他の文字
と区別して表示する(ステップST40)。
像データの文字認識はここで終了する。読み取りモード
swが0のときは、識別名が付けられて記憶されていた
読み取りレベルで入力する要求がなされたときで、認識
された文字及び形態素解析で失敗した文字列を他の文字
と区別して表示する(ステップST40)。
【0044】読み取りモードswが1のときは、最適な
読取りレベルの設定モードが選択されたときで、形態素
解析で失敗した文字列をカウントする(ステップST4
1)。
読取りレベルの設定モードが選択されたときで、形態素
解析で失敗した文字列をカウントする(ステップST4
1)。
【0045】形態素解析で失敗した文字数が一定数以下
(実施例ではオペレータが設定を変えられるようになっ
ているが、この説明は省略する。例えば5文字と設定さ
れ、失敗文字数が、5文字以下のときは読み取りレベル
の変更は行なわない)のときは、他にもっと最適な読み
取りレベルが存在する可能性もあるが、実施例では最適
な読み取りレベルで画像データを読み取れたとする(ス
テップST42)。この失敗許容文字数を0に設定する
と形態素解析に失敗する文字数が一番少ない読み取りレ
ベルが求められる。
(実施例ではオペレータが設定を変えられるようになっ
ているが、この説明は省略する。例えば5文字と設定さ
れ、失敗文字数が、5文字以下のときは読み取りレベル
の変更は行なわない)のときは、他にもっと最適な読み
取りレベルが存在する可能性もあるが、実施例では最適
な読み取りレベルで画像データを読み取れたとする(ス
テップST42)。この失敗許容文字数を0に設定する
と形態素解析に失敗する文字数が一番少ない読み取りレ
ベルが求められる。
【0046】形態素解析に失敗した文字数が一定数以上
のときで、かつ、読み取りレベルが標準のときは標準値
を基に増減を行なう(ステップST43〜ST44)。
読み取りレベルの増減は、例えば、文字毎に標準的な文
字構成ビット数を記憶し、このビット数と設定されてい
る読み取りレベルで読み取った文字毎のビット数を比較
する。比較する対象の文字の種類は全ての文字で行なう
と精度は高いが、代表的な文字を対象に行なうことが可
能である。よく出現する漢字、平仮名、数字を対象に比
較することで増減の方向を知ることもできる。
のときで、かつ、読み取りレベルが標準のときは標準値
を基に増減を行なう(ステップST43〜ST44)。
読み取りレベルの増減は、例えば、文字毎に標準的な文
字構成ビット数を記憶し、このビット数と設定されてい
る読み取りレベルで読み取った文字毎のビット数を比較
する。比較する対象の文字の種類は全ての文字で行なう
と精度は高いが、代表的な文字を対象に行なうことが可
能である。よく出現する漢字、平仮名、数字を対象に比
較することで増減の方向を知ることもできる。
【0047】変更された読み取りレベルが標準値に比
べ、増加しているときは、増減フラグに1を設定する。
減少しているときは、増減フラグに−1を設定する(ス
テップST45〜ST47)。増減する量はNで、実施
例ではオペレータが設定を変えられるようになっている
が、この説明は省略する。このNの値を小さくすると紙
面の微妙な変化に対応した読み取りレベルを求めること
ができる。次の読み取りレベルが求まったら、読み取り
レベルをスキャナに設定し、再度、原稿の読み取りを行
なう。
べ、増加しているときは、増減フラグに1を設定する。
減少しているときは、増減フラグに−1を設定する(ス
テップST45〜ST47)。増減する量はNで、実施
例ではオペレータが設定を変えられるようになっている
が、この説明は省略する。このNの値を小さくすると紙
面の微妙な変化に対応した読み取りレベルを求めること
ができる。次の読み取りレベルが求まったら、読み取り
レベルをスキャナに設定し、再度、原稿の読み取りを行
なう。
【0048】標準の読み取りレベルで読み取ったときで
ないときは、前回の読み取りレベルでの形態素解析の失
敗文字数と今回の新たに設定された読み取りレベル形態
素解析の失敗文字数と比較を行なう(ステップST4
8)。前回の読み取りレベルに比べ増加したときは読み
取りレベルの変更が正しくなかったので逆方向の読み取
りレベルに変更する。但し、このとき既に逆方向に対し
て読み取りレベルの変更を行なっているときは、失敗文
字数が最小である一つ前の読み取りレベルを最適値とす
る(ステップST49、ステップST58)。逆方向に
対して読み取りレベルの変更を行なっていないときは、
逆方向増減フラグを1にする(ステップST50)。
ないときは、前回の読み取りレベルでの形態素解析の失
敗文字数と今回の新たに設定された読み取りレベル形態
素解析の失敗文字数と比較を行なう(ステップST4
8)。前回の読み取りレベルに比べ増加したときは読み
取りレベルの変更が正しくなかったので逆方向の読み取
りレベルに変更する。但し、このとき既に逆方向に対し
て読み取りレベルの変更を行なっているときは、失敗文
字数が最小である一つ前の読み取りレベルを最適値とす
る(ステップST49、ステップST58)。逆方向に
対して読み取りレベルの変更を行なっていないときは、
逆方向増減フラグを1にする(ステップST50)。
【0049】増減フラグの値が1のときは、標準値に増
加したときであるので逆方向すなわち標準値−Nの値に
変更する。増減フラグが−1のときは、標準値+Nに変
更する(ステップST51〜ST53)。
加したときであるので逆方向すなわち標準値−Nの値に
変更する。増減フラグが−1のときは、標準値+Nに変
更する(ステップST51〜ST53)。
【0050】ステップST48の比較で失敗文字数が前
回に比べ減少したときは、または、等しいときは読み取
りレベルの変更が正しかったのでさらに同一方向の読み
取りレベルに変更する。増減フラグの値が1のときは、
前回の読み取りレベル+Nに変更する。増減フラグが−
1のときは、前回の読み取りレベル−Nに変更する(ス
テップST54〜ST56)。ステップST48の比較
で失敗文字数が等しいときは実施例では、減少したと扱
っているが逆方向に読み取りレベルを変更することもで
きる。または、読み取りレベルが最適な値であるとする
こともできる。
回に比べ減少したときは、または、等しいときは読み取
りレベルの変更が正しかったのでさらに同一方向の読み
取りレベルに変更する。増減フラグの値が1のときは、
前回の読み取りレベル+Nに変更する。増減フラグが−
1のときは、前回の読み取りレベル−Nに変更する(ス
テップST54〜ST56)。ステップST48の比較
で失敗文字数が等しいときは実施例では、減少したと扱
っているが逆方向に読み取りレベルを変更することもで
きる。または、読み取りレベルが最適な値であるとする
こともできる。
【0051】増減された読み取りレベルをスキャナに設
定し、再度、原稿の読み取りを行なう(ステップST5
7)。
定し、再度、原稿の読み取りを行なう(ステップST5
7)。
【0052】ステップST42の比較で形態素解析の失
敗文字数が許容文字数のときは、許容文字数以下となっ
た読み取りレベルに識別名を付けて記憶する。オペレー
タが識別名を入力すると読み取りレベルと対応させて記
憶部27に記憶する(ステップST59〜ST60)。
敗文字数が許容文字数のときは、許容文字数以下となっ
た読み取りレベルに識別名を付けて記憶する。オペレー
タが識別名を入力すると読み取りレベルと対応させて記
憶部27に記憶する(ステップST59〜ST60)。
【0053】文字認識された文字列は出力部22に表示
される。このとき、形態素解析で失敗した文字列は他と
区別して表示する(ステップST61)。この表示でオ
ペレータは形態素解析に失敗した文字列の前後を注意し
て見れば認識誤りを簡単に発見できる。
される。このとき、形態素解析で失敗した文字列は他と
区別して表示する(ステップST61)。この表示でオ
ペレータは形態素解析に失敗した文字列の前後を注意し
て見れば認識誤りを簡単に発見できる。
【0054】なお、ここまでの説明は、スキャナから2
値(0または1)で画像データを読み取り文字認識をす
る方法について述べたが、多値で読み取ることができる
スキャナでは、読み取りレベルに応じて多値から2値に
変換することもできる。この場合は、図7において、読
み取りレベルを変更する度に原稿を読み取っていたステ
ップST37の替わりに読み取りレベルに応じて多値か
ら2値に変換する構成にすることで実現できる。
値(0または1)で画像データを読み取り文字認識をす
る方法について述べたが、多値で読み取ることができる
スキャナでは、読み取りレベルに応じて多値から2値に
変換することもできる。この場合は、図7において、読
み取りレベルを変更する度に原稿を読み取っていたステ
ップST37の替わりに読み取りレベルに応じて多値か
ら2値に変換する構成にすることで実現できる。
【0055】また、第2実施例では、読み取りレベルを
読み取った頁全体に1つ設定することで説明したが、読
み取る原稿によっては、部分的に濃淡が異なる場所や文
字の背景が相違することがある。このような原稿のとき
は、例えばレイアウト認識されたブロック単位に最適な
読み取りレベルで読み取ることもできる。例えば、ブロ
ック1は読み取りレベルを濃い原稿レベルで、ブロック
2と3は薄い原稿レベルで等、ブロック毎に形態素解析
で失敗する文字数が最小な読み取りレベルで読み取った
画像データの認識結果を出力できる。
読み取った頁全体に1つ設定することで説明したが、読
み取る原稿によっては、部分的に濃淡が異なる場所や文
字の背景が相違することがある。このような原稿のとき
は、例えばレイアウト認識されたブロック単位に最適な
読み取りレベルで読み取ることもできる。例えば、ブロ
ック1は読み取りレベルを濃い原稿レベルで、ブロック
2と3は薄い原稿レベルで等、ブロック毎に形態素解析
で失敗する文字数が最小な読み取りレベルで読み取った
画像データの認識結果を出力できる。
【0056】この他、読み取りレベルを変更して複数回
読み取り、文字認識、形態素解析を行なう場合は、ある
読み取りレベルで読み取ったとき形態素解析に失敗した
文字列が、別の読み取りレベルでは失敗しない場合に複
数の読み取りレベルの成功した文字列を集めて1つの認
識文字列とすることもできる。このように構成すること
により、原稿の濃淡のバラツキを吸収することができ
る。
読み取り、文字認識、形態素解析を行なう場合は、ある
読み取りレベルで読み取ったとき形態素解析に失敗した
文字列が、別の読み取りレベルでは失敗しない場合に複
数の読み取りレベルの成功した文字列を集めて1つの認
識文字列とすることもできる。このように構成すること
により、原稿の濃淡のバラツキを吸収することができ
る。
【0057】次に、本発明の第3実施例について説明す
る。図12は第3実施例に係る機械翻訳装置の構成を示
すブロック図である。
る。図12は第3実施例に係る機械翻訳装置の構成を示
すブロック図である。
【0058】同図において、入力部31は、本発明に於
ける文字認識装置の動作に必要なコマンドを入力した
り、認識結果に対する修正文字を入力したりするもので
あり、通常キーボードやマウス、タッチパネルなどが用
いられる。表示部32は、前記入力部から入力されたコ
マンドや文字列を表示したり、後述する読取り部からの
読取り結果や文字認識部による文字認識の途中状態や認
識結果などを表示したりするもので、通常ビットマップ
ディスプレイやCRT ディスプレイなどが用いられるが、
オペレータが装着したゴーグルや壁面に投射してもよ
い。なお、画面を分割して片方を読取り部が読み取った
画像イメージを表示させ、他方に本装置が認識した結果
を対応させて表示することもできる。レイアウト解析部
33は、画像イメージから文字の記述されている部分を
識別したり、文字が縦書きであるか横書きであるかを判
別するためのものである。レイアウト記録部34はレイ
アウト解析部33で認識されたレイアウト情報を記録す
るためのものである。読取り部35は原稿を読み取るた
めのもので、例えばラインイメージセンサを備えたスキ
ャナなどが用いられる。なお、このスキャナの解像度に
より、読み取れる文字の種類が決まる。文字認識部36
は前記読取り部が原稿を読み取った結果得られた画像な
どのデータを文字として認識するものである。認識用辞
書37は、前記文字認識部に於ける文字認識の時にパタ
ーン照合を行うために用いる。翻訳部38は、文字認識
部で認識した結果を翻訳するためのものである。レイア
ウト反映部39は、前記レイアウト記録部に記録されて
いるレイアウト情報と文字認識の結果を翻訳部によって
翻訳した結果得られた文字情報とを組み合わせて、元の
原稿のイメージに近い状態で出力するための処理を行う
ものである。レイアウト回転部40は、レイアウト認識
部で原稿が縦書きであると判定された場合には、レイア
ウト情報を回転させ、横書きのレイアウトに変換するた
めのものである。記録部41は、認識したデータや読み
取ったデータ画像データなどを記録するためのものであ
り、通常磁気的、電気的に実現される。制御部42は前
記各部の制御やデータの受け渡しを行うためのものであ
る。
ける文字認識装置の動作に必要なコマンドを入力した
り、認識結果に対する修正文字を入力したりするもので
あり、通常キーボードやマウス、タッチパネルなどが用
いられる。表示部32は、前記入力部から入力されたコ
マンドや文字列を表示したり、後述する読取り部からの
読取り結果や文字認識部による文字認識の途中状態や認
識結果などを表示したりするもので、通常ビットマップ
ディスプレイやCRT ディスプレイなどが用いられるが、
オペレータが装着したゴーグルや壁面に投射してもよ
い。なお、画面を分割して片方を読取り部が読み取った
画像イメージを表示させ、他方に本装置が認識した結果
を対応させて表示することもできる。レイアウト解析部
33は、画像イメージから文字の記述されている部分を
識別したり、文字が縦書きであるか横書きであるかを判
別するためのものである。レイアウト記録部34はレイ
アウト解析部33で認識されたレイアウト情報を記録す
るためのものである。読取り部35は原稿を読み取るた
めのもので、例えばラインイメージセンサを備えたスキ
ャナなどが用いられる。なお、このスキャナの解像度に
より、読み取れる文字の種類が決まる。文字認識部36
は前記読取り部が原稿を読み取った結果得られた画像な
どのデータを文字として認識するものである。認識用辞
書37は、前記文字認識部に於ける文字認識の時にパタ
ーン照合を行うために用いる。翻訳部38は、文字認識
部で認識した結果を翻訳するためのものである。レイア
ウト反映部39は、前記レイアウト記録部に記録されて
いるレイアウト情報と文字認識の結果を翻訳部によって
翻訳した結果得られた文字情報とを組み合わせて、元の
原稿のイメージに近い状態で出力するための処理を行う
ものである。レイアウト回転部40は、レイアウト認識
部で原稿が縦書きであると判定された場合には、レイア
ウト情報を回転させ、横書きのレイアウトに変換するた
めのものである。記録部41は、認識したデータや読み
取ったデータ画像データなどを記録するためのものであ
り、通常磁気的、電気的に実現される。制御部42は前
記各部の制御やデータの受け渡しを行うためのものであ
る。
【0059】図13は、第3実施例の動作を示すフロー
チャートである。原稿を文字データとして電子化するた
めには、まず、原稿を読取り部により読み取る(ステッ
プST71)。つぎに、読み取った結果に対してレイア
ウト認識を行う(ステップST72)。レイアウト認識
では、文字がある場所をブロックとして捕らえる他、文
字が縦書きであるか横書きであるかをも認識する。次に
レイアウト認識の結果を参考に文字認識を行う(ステッ
プST73)。そして、文字認識結果を翻訳し(ステッ
プST74)、文字認識の結果をレイアウト認識の結果
に反映させ、原稿に近いイメージで出力する(ステップ
ST75)。
チャートである。原稿を文字データとして電子化するた
めには、まず、原稿を読取り部により読み取る(ステッ
プST71)。つぎに、読み取った結果に対してレイア
ウト認識を行う(ステップST72)。レイアウト認識
では、文字がある場所をブロックとして捕らえる他、文
字が縦書きであるか横書きであるかをも認識する。次に
レイアウト認識の結果を参考に文字認識を行う(ステッ
プST73)。そして、文字認識結果を翻訳し(ステッ
プST74)、文字認識の結果をレイアウト認識の結果
に反映させ、原稿に近いイメージで出力する(ステップ
ST75)。
【0060】図14は、図13におけるステップST7
5のレイアウト反映機能の処理の流れを示すフローチャ
ートである。レイアウト反映機能では、まず、レイアウ
ト認識で得られた結果を読み込む(ステップST8
1)。次に、文字認識の翻訳結果を読み込む(ステップ
ST82)。そして、ステップST81で読み込んだ情
報が縦書きのデータであれば(ステップST83)、レ
イアウト情報を回転させる(ステップST84)。ステ
ップST82で読み込んだ文字データをレイアウトデー
タの該当箇所に挿入することによってレイアウト反映が
終了する(ステップST85)。
5のレイアウト反映機能の処理の流れを示すフローチャ
ートである。レイアウト反映機能では、まず、レイアウ
ト認識で得られた結果を読み込む(ステップST8
1)。次に、文字認識の翻訳結果を読み込む(ステップ
ST82)。そして、ステップST81で読み込んだ情
報が縦書きのデータであれば(ステップST83)、レ
イアウト情報を回転させる(ステップST84)。ステ
ップST82で読み込んだ文字データをレイアウトデー
タの該当箇所に挿入することによってレイアウト反映が
終了する(ステップST85)。
【0061】次に、第3実施例で示した機械翻訳装置の
全体の動作の概要について説明する。
全体の動作の概要について説明する。
【0062】いま、表3に示すような縦書きの原稿を電
子化する例で説明する。
子化する例で説明する。
【0063】
【表3】 この原稿を読み取り部から読取り、レイアウト認識する
と図15のようになる。図15では、文字が書かれてい
る部分の塊を矩形のブロックとして認識し、その頂点の
座標を記録している。また、このデータが縦書きである
ということも記録している。文字認識後、レイアウト反
映部では、このデータが縦書きであるため図16に示す
ように、座標を変換する。そして、これのデータに対し
翻訳結果を対応するブロックに反映させると表4のよう
な結果を出力することができる。
と図15のようになる。図15では、文字が書かれてい
る部分の塊を矩形のブロックとして認識し、その頂点の
座標を記録している。また、このデータが縦書きである
ということも記録している。文字認識後、レイアウト反
映部では、このデータが縦書きであるため図16に示す
ように、座標を変換する。そして、これのデータに対し
翻訳結果を対応するブロックに反映させると表4のよう
な結果を出力することができる。
【表4】
【0064】
【発明の効果】以上説明したように、本願第1の発明に
よる文字認識装置では、句読点やピリオド、カンマの認
識結果に曖昧性がある場合に、その句読点やピリオド、
カンマの前後を解析することにより、その場所で文が終
了する可能性が高い場合には、句点またはピリオドなど
文の終了を示す記号を優先させ、それ以外の場合は、読
点・カンマなど文を終了させない記号を優先させる機能
を有し、文の終了を示す記号を正しく認識することがで
きる。
よる文字認識装置では、句読点やピリオド、カンマの認
識結果に曖昧性がある場合に、その句読点やピリオド、
カンマの前後を解析することにより、その場所で文が終
了する可能性が高い場合には、句点またはピリオドなど
文の終了を示す記号を優先させ、それ以外の場合は、読
点・カンマなど文を終了させない記号を優先させる機能
を有し、文の終了を示す記号を正しく認識することがで
きる。
【0065】また、本願第2の発明に係る文字認識装置
によれば、原稿毎に異なるスキャナの読み取りレベルを
最適な値に設定することができ、誤った読取りレベルで
の認識をなくしオペレータの負担を大幅に軽減できる。
また、原稿にあった最適な読み取りレベルに識別名を付
けて記憶することで読み取りレベルを意識する必要がな
くなる。
によれば、原稿毎に異なるスキャナの読み取りレベルを
最適な値に設定することができ、誤った読取りレベルで
の認識をなくしオペレータの負担を大幅に軽減できる。
また、原稿にあった最適な読み取りレベルに識別名を付
けて記憶することで読み取りレベルを意識する必要がな
くなる。
【0066】また、本願第3の発明に係る機械翻訳装置
では、縦書きの文書の場合はレイアウト情報を回転し、
横書きの文書として出力することによって、レイアウト
情報を有効に利用することができるという効果が得られ
る。
では、縦書きの文書の場合はレイアウト情報を回転し、
横書きの文書として出力することによって、レイアウト
情報を有効に利用することができるという効果が得られ
る。
【図1】本発明の第1実施例に係る文字認識装置の構成
を示すブロック図である。
を示すブロック図である。
【図2】第1実施例の動作を示すフローチャートであ
る。
る。
【図3】文末記号優先部の概略を表すブロック図であ
る。
る。
【図4】文末記号優先部の動作を示すフローチャートの
第1の分図である。
第1の分図である。
【図5】文末記号優先部の動作を示すフローチャートの
第2の分図である。
第2の分図である。
【図6】本発明の第2実施例に係る文字認識装置の構成
を示すブロック図である。
を示すブロック図である。
【図7】第2実施例の動作を示すフローチャートの第1
の分図である。
の分図である。
【図8】第2実施例の動作を示すフローチャートの第2
の分図である。
の分図である。
【図9】第2実施例の動作を示すフローチャートの第3
の分図である。
の分図である。
【図10】第2実施例の動作を示すフローチャートの第
4の分図である。
4の分図である。
【図11】第2実施例の動作を示すフローチャートの第
5の分図である。
5の分図である。
【図12】本発明の第3実施例に係る機械翻訳装置の構
成を示すブロック図である。
成を示すブロック図である。
【図13】第3実施例の動作を示すフローチャートであ
る。
る。
【図14】レイアウト反映機能の処理動作を示すローチ
ャートである。
ャートである。
【図15】レイアウトの認識結果の例を示す説明図であ
る。
る。
【図16】レイアウトデータの回転例を示す説明図であ
る。
る。
【図17】従来における文字認識装置を示すブロック図
である。
である。
1 入力部 2 表示部 3 記録部 4 読取部 5 文字認識部 6 認識用辞書 7 文末記号優先処理部 8 制御部 21 読み取り部 22 出力部 23 入力部 24 文字認識部 25 最適読み取りレベル判定部 26 形態素解析辞書 27 記憶部 28 制御部 31 入力部 32 表示部 33 レイアウト解析部 34 レイアウト記録部 35 読取り部 36 文字認識部 37 認識用辞書 38 翻訳部 39 レイアウト反映部 40 レイアウト回転部 41 記録部 42 制御部
Claims (3)
- 【請求項1】 入力されたイメージデータの文字認識を
行なう文字認識装置において、 読取られた文字中に存在する句読点,ピリオド,カンマ
の認識性に曖昧性があるか否かを判定する手段と、曖昧
性があると判定された場合には当該曖昧な句読点,ピリ
オド,カンマの前後の文章を参照して句読点,ピリオ
ド,カンマのいずれかを決定する手段と、を有すること
を特徴とする文字認識装置。 - 【請求項2】 設定された読取りレベルに従って文書画
像を入力する手段と、入力された文書画像から文字行を
切出し、該文字行から各文字を切出して文字認識する手
段とを備えた文字認識装置において、 文書画像を読取る原稿の質、濃淡等の各属性に応じた読
取りレベルを予め格納する手段と、 実際に原稿を読取る際には当該原稿の属性を識別し、こ
れに対応する読取りレベルにて読取りを行なう手段と、 を有することを特徴とする文字認識装置。 - 【請求項3】 第1の言語を第2の言語に翻訳する機械
翻訳装置において、原稿に記載された第1の言語文字の
画像データを認識し、当該文字のレイアウトを解析する
レイアウト解析手段と、 この第1の言語文字が縦書きであるか横書きであるかを
判定する文字方向判定手段と、 第1の言語文字と、これを翻訳した第2の言語文字との
文字方向が異なる場合には前記レイアウト解析手段にて
解析されたレイアウトの方向を文字方向と同様に変更
し、変更後のレイアウトで第2の言語文字を出力する手
段と、を有することを特徴とする機械翻訳装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4240602A JPH0696288A (ja) | 1992-09-09 | 1992-09-09 | 文字認識装置及び機械翻訳装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4240602A JPH0696288A (ja) | 1992-09-09 | 1992-09-09 | 文字認識装置及び機械翻訳装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0696288A true JPH0696288A (ja) | 1994-04-08 |
Family
ID=17061937
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4240602A Pending JPH0696288A (ja) | 1992-09-09 | 1992-09-09 | 文字認識装置及び機械翻訳装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0696288A (ja) |
Cited By (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0779594A3 (en) * | 1995-12-14 | 1998-01-14 | Xerox Corporation | Automatic method of identifying sentence boundaries in a document image |
| US5848191A (en) * | 1995-12-14 | 1998-12-08 | Xerox Corporation | Automatic method of generating thematic summaries from a document image without performing character recognition |
| US5850476A (en) * | 1995-12-14 | 1998-12-15 | Xerox Corporation | Automatic method of identifying drop words in a document image without performing character recognition |
| JP2009152673A (ja) * | 2007-12-18 | 2009-07-09 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
| JP2010231812A (ja) * | 2010-06-22 | 2010-10-14 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
| US8719029B2 (en) | 2010-12-22 | 2014-05-06 | Fujifilm Corporation | File format, server, viewer device for digital comic, digital comic generation device |
| JP2017162390A (ja) * | 2016-03-11 | 2017-09-14 | 株式会社東芝 | 言語処理装置、方法、およびプログラム |
-
1992
- 1992-09-09 JP JP4240602A patent/JPH0696288A/ja active Pending
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0779594A3 (en) * | 1995-12-14 | 1998-01-14 | Xerox Corporation | Automatic method of identifying sentence boundaries in a document image |
| US5848191A (en) * | 1995-12-14 | 1998-12-08 | Xerox Corporation | Automatic method of generating thematic summaries from a document image without performing character recognition |
| US5850476A (en) * | 1995-12-14 | 1998-12-15 | Xerox Corporation | Automatic method of identifying drop words in a document image without performing character recognition |
| US5892842A (en) * | 1995-12-14 | 1999-04-06 | Xerox Corporation | Automatic method of identifying sentence boundaries in a document image |
| JP2009152673A (ja) * | 2007-12-18 | 2009-07-09 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
| US8201084B2 (en) | 2007-12-18 | 2012-06-12 | Fuji Xerox Co., Ltd. | Image processing apparatus and computer readable medium |
| JP2010231812A (ja) * | 2010-06-22 | 2010-10-14 | Fuji Xerox Co Ltd | 画像処理装置及び画像処理プログラム |
| US8719029B2 (en) | 2010-12-22 | 2014-05-06 | Fujifilm Corporation | File format, server, viewer device for digital comic, digital comic generation device |
| JP2017162390A (ja) * | 2016-03-11 | 2017-09-14 | 株式会社東芝 | 言語処理装置、方法、およびプログラム |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CA2077274C (en) | Method and apparatus for summarizing a document without document image decoding | |
| JP2862626B2 (ja) | 電子辞書及び情報検索方法 | |
| EP0439951B1 (en) | Data processing | |
| US6466694B2 (en) | Document image processing device and method thereof | |
| US5748805A (en) | Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information | |
| JP4332356B2 (ja) | 情報検索装置及び方法並びに制御プログラム | |
| US20060217959A1 (en) | Translation processing method, document processing device and storage medium storing program | |
| US6035062A (en) | Character recognition method and apparatus | |
| JPH0696288A (ja) | 文字認識装置及び機械翻訳装置 | |
| JP4208566B2 (ja) | 文書画像検索装置及びその方法、文書画像検索システム、プログラム | |
| JP2008129793A (ja) | 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体 | |
| JP2024003769A (ja) | 文字認識システム、コンピュータによる文字の認識方法、および文字検索システム | |
| JP2002063197A (ja) | 検索装置、記録媒体およびプログラム | |
| JP3122417B2 (ja) | 情報表示方法及び情報処理装置 | |
| JPH08221558A (ja) | 文書ファイリング方法及び装置 | |
| JP4101345B2 (ja) | 文字認識装置 | |
| JPH0883280A (ja) | 文書処理装置 | |
| JP3083171B2 (ja) | 文字認識装置及び方法 | |
| EP0692768A2 (en) | Full text storage and retrieval in image at OCR and code speed | |
| JP2005208687A (ja) | 多言語文書処理装置及びプログラム | |
| JP3952009B2 (ja) | 翻訳メモリシステム、翻訳方法、および翻訳メモリシステム用プログラム | |
| JPH06223221A (ja) | 文字認識装置 | |
| JPH04293185A (ja) | ファイリング装置 | |
| JP2986255B2 (ja) | 文字認識装置 | |
| JP2829186B2 (ja) | 光学的文字読取装置 |