JPH0696288A

JPH0696288A - 文字認識装置及び機械翻訳装置

Info

Publication number: JPH0696288A
Application number: JP4240602A
Authority: JP
Inventors: Etsuo Ito; 悦雄伊藤; Kimito Takeda; 公人武田
Original assignee: Toshiba Corp
Current assignee: Toshiba Corp
Priority date: 1992-09-09
Filing date: 1992-09-09
Publication date: 1994-04-08

Abstract

(57)【要約】【目的】文の終了を示す記号を正しく認識することが
できる文字認識装置を提供することを目的とする。【構成】紙面上の記載内容を読み取った結果などのイ
メージデータに対して文字認識を行う文字認識装置にお
いて、文字認識により、句読点やピリオド、カンマの認
識結果に曖昧性がある場合に、その句読点やピリオド、
カンマの前後を解析することにより、その場所で文が終
了する可能性が高い場合には、句点またはピリオドなど
文の終了を示す記号を優先させ、それ以外の場合は、読
点・カンマなど文を終了させない記号を優先させる機能
を有することを特徴とする。【効果】文字認識の精度が向上する。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、原稿に記載された文字
を読取る文字認識装置，及び第１の言語を第２の言語に
翻訳する機械翻訳装置に関する。

【０００２】

【従来の技術】近年の文書の処理の電子化に伴い、紙に
印刷された文書を読み取り、電子メディア化する文字読
取装置が開発されている。従来の文字認識装置は、各種
文書が記載された原稿を読み取るスキャナなどの読み取
り部により読み取る。このとき、読み取り部は原稿を文
字の集まりとして捕らえるのではなく、点の集まりから
なる画像データとして読み取る。そして、読み取り部が
読み取った画像データから文字認識部は任意の範囲を取
り出し、認識用辞書に格納している標準文字パターン照
合処理を行う。この結果、前記文字認識部で照合ができ
れば、この文字は出力部に出力されると共に記録部に記
録される。これらの処理を行う事によって原稿上の文字
が該装置に入力される。しかし、これらの処理では、数
字の”０”とアルファベットの”Ｏ”、数字の”１”と
小文字の”ｌ（エル）”と大文字の”Ｉ（ア
イ）”、”、（読点）”と”。（句点）”、”．（ピリ
オド）”と”，（カンマ）”など類似した文字の間に曖
昧性が残り、読み間違いが起こる場合があった。このた
め、曖昧性がある部分をオペレータに示し、修正を促す
機能が備えられている。

【０００３】また、文字認識装置を計算機を用いて文章
の翻訳を行う機械翻訳装置の入力装置として使用する場
合が増えてきている。機械翻訳装置では、入力された文
章を文に分割し、分割された文毎に一文単位で翻訳を行
う。文への分割は、改行やピリオド、句点等文末を示す
記号によって行う場合が多い。しかし、文字認識装置で
の認識結果には、”、（読点）”と”。（句
点）”、”．（ピリオド）”と”，（カンマ）”の曖昧
性があり、これらを誤って認識する場合が多く、他の文
字より小さい記号であるためオペレータもこれらの認識
誤りを見落とすことが多かった。このため、このよう
に”、（読点）”と”。（句点）”、”．（ピリオ
ド）”と”，（カンマ）”の認識誤りを含むデータを機
械翻訳システムの入力データとして使用すると、文章中
に於ける文の分割に誤りが生じ、機械翻訳の結果が著し
く悪くなるという問題があった。

【０００４】また、機械翻訳、文書データベース、電子
出版等、計算機を用いた文書処理が盛んに行われるにつ
れ、新聞、雑誌、マニュアルなどの一般に流通している
既存の文書を簡単に入力したいという要求が増えてきた
ため、原稿のレイアウトを自動的に認識する機能を備え
た文字認識装置もある。

【０００５】例えば、従来装置は図１７に示すように、
まず各種原稿を読み取り部３０１によって読み取る。こ
の時、読み取り部３０１は原稿を文字の集まりとして扱
うのでなく、点の集まりからなる画像データとして入力
する。そして、読み取り部３０１が読み取った画像デー
タから文字認識部３０２は任意の範囲を切出し、図示し
ない認識用辞書に格納されている標準パターンとパター
ン照合処理を行なう。この結果、前記文字認識部３０２
で照合ができれば、その文字コードを出力部３０３に出
力するとともに、記憶部３０４に記憶する。これらの処
理を行なうことで、原稿上の文字が該装置に入力され
る。なお、制御部３０５は各部の制御を行なうものであ
る。

【０００６】また、一般に流通している既存文書は、紙
の質、紙の表面の加工、文字の背景等の違いで、入力さ
れる画像を一定に保つことができない。このため、予め
定められた読取りレベルを選択して文字画像を読み取る
ことができる。この場合、読み取りレベルは、読み取り
部３０１から原稿を読み取る前に、例えば、薄い原稿、
普通の原稿、濃い原稿等を出力部３０３に表示を行ない
オペレータが選択することで実現されている。この選択
された読み取りレベルは、読み取り濃度の白黒を判定す
るしきい値として読み取り部３０１に送られ、送られた
しきい値に従って、画像データが入力される。

【０００７】しかし、この種の文字読取り装置の読み取
りレベルは、予め定められた値をオペレータが選択する
ようになっている。どの値を選択するかは、オペレータ
の感覚で相違し、どの値で読み取るのが最適であるか知
ることは困難であるという問題点があった。

【０００８】一方、従来における機械翻訳装置では、文
字認識装置によって原稿を読取っている。このような文
字認識装置には、原稿上のどの部分に文字があるか、ま
た、どの部分が記事としてまとまりがあるかを解析する
レイアウト解析機能を有し、その解析結果に従って文字
認識を行う機能を有するものもある。さらに、読み取っ
た原稿を印刷したり、ファイルとして出力したりする際
に、レイアウト解析の結果を利用して、もとの原稿に近
いイメージで出力する機能を有するものもある。

【０００９】また、日本語文書の読取りが行われるにお
よび、縦書き文書の読取りや、レイアウト解析の一部と
して文字が横書きか縦書きかを識別して読み取る機能も
開発されている。

【００１０】一方、計算機上で文書をWYSWYGで編集する
DTP アプリケーションが開発されている。こういったツ
ールを使用すると、原稿を見た通りに計算機上に再現で
きる。しかし、こういったツールでは、横書きが中心で
あり、縦書きの表示ができるものは少ない。したがっ
て、文書読取り装置によって、縦書きの文書を読取り、
レイアウトを反映させて出力しても、それをWYSWYGで編
集することができない。

【００１１】さらに、機械翻訳システムの入力装置とし
て、文書読取装置を使用する場合には、入力原稿のイメ
ージで翻訳結果を出力するシステムも開発されている
が、例えば日本語の縦書き文書を英語に翻訳する場合に
は、翻訳結果である英文を縦書きすることが出来ないの
で、レイアウト情報を利用することが出来なかった。

【００１２】

【発明が解決しようとする課題】上述したように、従来
の文字認識装置では、読み誤り箇所の候補をオペレータ
に示していたが、”、（読点）”、”。（句
点）”、”．（ピリオド）”、”，（カンマ）”といっ
た記号は見落とし易く、また、この様な文の終了を示す
記号の認識誤りを含むデータを機械翻訳システムの入力
データとして使用すると、文章中に於ける文の分割に誤
りが生じ、機械翻訳の結果が著しく悪くなるが、従来の
文字認識装置では文の終了を示す記号は他の文字と同程
度の重要性しかなかったため、これらの記号の認識率が
必ずしも高くないという問題が有った。

【００１３】また、従来の文字認識装置は、読み取る原
稿の違いをオペレータが感覚的に指示することで実現さ
れ、どの読み取りレベルで原稿を読み取るのが認識装置
にとって最適であるか知ることが困難であった。更に、
原稿に合った最適な読み取りレベルを記憶する方法が提
供されていないため同様な原稿を読み取る場合に簡単に
読み取りベルを指示することができないという問題点が
あった。

【００１４】そして、従来の機械翻訳装置では、縦書き
の文書を読み込んだときそのレイアウト情報を有効に使
用できないという問題があった。

【００１５】この発明はこのような従来の課題を解決す
るためになされたもので、その第１の目的は、文字中の
句読点，ピリオド及びカンマを正しく認識し得る文字認
識装置を提供することである。また、第２の目的は、読
取る原稿に適合した最適な読取りレベルで文字を認識す
ることのできる文字認識装置を提供することである。更
に、第３の目的は、レイアウト情報を有効に利用して翻
訳結果を出力し得る機械翻訳装置を提供することであ
る。

【００１６】

【課題を解決するための手段】上記目的を達成するた
め、本願第１の発明は、入力されたイメージデータの文
字認識を行なう文字認識装置において、読取られた文字
中に存在する句読点，ピリオド，カンマの認識性に曖昧
性があるか否かを判定する手段と、曖昧性があると判定
された場合には当該曖昧な句読点，ピリオド，カンマの
前後の文章を参照して句読点，ピリオド，カンマのいず
れかを決定する手段と、を有することが特徴である。

【００１７】また、本願第２の発明は、設定された読取
りレベルに従って文書画像を入力する手段と、入力され
た文書画像から文字行を切出し、該文字行から各文字を
切出して文字認識する手段とを備えた文字認識装置にお
いて、文書画像を読取る原稿の質、濃淡等の各属性に応
じた読取りレベルを予め格納する手段と、実際に原稿を
読取る際には当該原稿の属性を識別し、これに対応する
読取りレベルにて読取りを行なう手段と、を有すること
を特徴とする。

【００１８】更に、本願第３の発明は第１の言語を第２
の言語に翻訳する機械翻訳装置において、原稿に記載さ
れた第１の言語文字の画像データを認識し、当該文字の
レイアウトを解析するレイアウト解析手段と、この第１
の言語文字が縦書きであるか横書きであるかを判定する
文字方向判定手段と、第１の言語文字と、これを翻訳し
た第２の言語文字との文字方向が異なる場合には前記レ
イアウト解析手段にて解析されたレイアウトの方向を文
字方向と同様に変更し、変更後のレイアウトで第２の言
語文字を出力する手段と、を有することを特徴とする。

【００１９】

【作用】上述の如く構成された本願第１の発明に係る文
字認識装置では、句読点やピリオド、カンマの認識結果
に曖昧性がある場合に、その句読点やピリオド、カンマ
の前後を解析することにより、その場所で文が終了する
可能性が高い場合には、句点またはピリオドなど文の終
了を示す記号を優先させ、それ以外の場合は、読点・カ
ンマなど文を終了させない記号を優先させる機能を有
し、文の終了を示す記号を正しく認識することができ
る。

【００２０】また、本願第２の発明に係る文字認識装置
では、読み取る原稿の紙の質、紙の表面の加工、文字の
背景等の違いで一定でない読み取りレベルをオペレータ
が選択する必要がなく、原稿に合った最適な読み取りレ
ベルを求めることができる。かつ、その読み取りレベル
に識別名を付けて記憶することで、同様の原稿を読み取
るとき識別名で簡単に読み取りレベルを指示することが
でき、オペレータの労力を大幅に軽減できる。

【００２１】更に、本願第３の発明に係る機械翻訳装置
では、縦書きの文書の場合はレイアウト情報を回転し、
横書きの文書として出力することによって、レイアウト
情報を有効に利用できる。

【００２２】

【実施例】以下、本発明の実施例を図面に基づいて説明
する。図１は本発明の第１実施例に係る文字認識装置で
ある。同図において、入力部１は、コマンドを入力した
り、認識結果に対する修正文字を入力するためのもので
通常、キーボードやマウス、タッチパネルなどが用いら
れる。表示部２は、前記入力部より入力されたコマンド
や文字列を表示したり、後述する読み取り部からの読み
取り結果や文字認識部による文字認識の途中状態や認識
結果などを表示したりするもので、通常ビットマップデ
ィスプレイなどが用いられるが、オペレータが装着した
ゴーグルや壁面に投射しても良い。なお、画面を分割
し、片方を読み取り部が読み取った画像イメージを表示
させ、他方に本装置が認識した文字を対応させて表示す
ることもできる。記録部３は後述する読み取り部で読み
取った画像データや、文字認識部による文字認識の途中
経過や最終結果等を記録するものである。読み取り部４
は原稿を読み取る為の物で、例えばラインイメージセン
サを備えたスキャナなどが用いられる。なお、このスキ
ャナの解像度により、読み取れる文字の種類が決まる。
文字認識部５は前記読み取り部が原稿を読み取った結果
得られた画像等のデータを文字として認識するものであ
る。前記読み取り部が原稿を読み取る時は、文字単位で
読み取っているのではなく、原稿の一端から順次スキャ
ンしていき、各点に情報があるか無いかの２値で表して
画像データを得る。このため解像度を上げるほど、より
細かく原稿を読み取る事になり、より複雑な文字も読み
取る事ができる。そして、文字認識部５は画像データの
任意の範囲を対象にして認識用辞書６に予め記録してい
る標準文字パターンとのパターン照合を行う。このパタ
ーン照合処理を画像データの全ての処理に対して行い、
これらの対応する文字の認識を行う。文末記号優先処理
部７は、文字認識部によって認識された結果を読み込
み、句読点やピリオド、カンマに曖昧性がある場合に
は、その記号の前後を解析し、この部分が文の切れ目に
なる可能性が高い場合には、句点やピリオドといった文
末を示す記号を優先し、それ以外の場合には読点やカン
マといった文末以外の記号を優先するといった処理を行
うものである。制御部８は、前記各部の制御やデータの
受け渡しを行うためのものである。

【００２３】図２は、本発明に於ける文字認識装置の全
体の処理の流れを示すフローチャートである。原稿を文
字データとして電子化するためには、まず、原稿を読み
取り部により読み取る（ステップＳＴ１）。次に、読み
取った結果に対して文字認識を行う（ステップＳＴ
２）。この認識結果中に認識時に曖昧性が有ると判断さ
れた句読点、カンマ、ピリオドが有るか否かを検査し
（ステップＳＴ３）、ある場合には認識結果を文末記号
優先処理部に転送し、文末記号優先処理を行い（ステッ
プＳＴ４）、最終的な結果を得る。

【００２４】図３は文末記号優先部の構成の一例を示す
ブロック図である。文末記号優先処理部は認識結果を認
識結果入力部１１を通し受けとり、必要な処理を制御部
１２で行い、出力部１３を介して処理結果を出力する。
制御部１２では、句点・ピリオドと読点・カンマのうち
どちらかを優先するかの判断を行う。判断の為に、制御
部は、文末になりやすい語リスト１４、文頭になりやす
い語リスト１５、文の切れ目になりやすい語リスト１
６、切れ目判定条件１７、形態素解析部１８等を利用す
る。文末になりやすい語リスト１４には、日本語の場合
では例えば「です」「ます」「でした」などが記録され
ており、この語が曖昧性のある句読点の直前に在る場合
には、句点を優先するという処理を行う。文頭になりや
すい語リスト１５には、日本語の場合、例えば「しか
し」などの接続詞や間投詞などが記録されており、この
語が曖昧性のある句読点の直後にある場合には句点を優
先するという処理を行う。文の切れ目になりやすい語リ
スト１６には、例えば「？」などの記号が記録されてお
り、この語が曖昧性のある句読点の前後に在る場合には
句点を優先するという処理を行う。切れ目判定条件１７
には、例えば、改行の直前の曖昧性のある句読点は句点
優先、あるいは、大文字の直前の場合はピリオド優先な
どの規則が記述されている。また、形態素解析部では曖
昧性のある句読点の前の部分を形態素解析し、制御部で
はその結果を使用し、句読点の直前が終助詞、助動詞や
用言の終止形で在る場合には句点を優先させる。

【００２５】図４，５は文末記号優先部の一実施例の動
作の概要を示すフローチャートである。文末記号優先部
は、認識結果Ａを読み込む事により動作を開始する（ス
テップＳＴ１１）。次に読み込んだデータ中に、文字認
識部で曖昧性が有ると判断された句読点、カンマ、ピリ
オドがあるか検索しこれをＢとする（ステップＳＴ１
２）。Ｂの直前の語句が「文末になりやすい語句リス
ト」に含まれているか否かを検査する（ステップＳＴ１
３）。含まれている場合には、Ｂは文末を表す記号であ
る可能性が高いので、句点・ピリオドを優先させる（ス
テップＳＴ２０）。含まれていない場合には、Ｂの直後
の語句が「文頭になりやすい語句リスト」に含まれてい
るか否かを検査する（ステップＳＴ１４）。含まれてい
る場合には、Ｂは文末を表す記号である可能性が高いの
で、句点・ピリオドを優先させる（ステップＳＴ２
０）。含まれていない場合には、Ｂの直前・直後の語句
が「文の切れ目になりやすい語句リスト」に含まれてい
るか否かを検査する（ステップＳＴ１５）。含まれてい
る場合には、Ｂは文末を表す記号である可能性が高いの
で、句点・ピリオドを優先させる（ステップＳＴ２
０）。含まれていない場合には、Ｂが文の切れ目条件を
満たしているか否かを検査する（ステップＳＴ１６）。
満たしている場合には、Ｂは文末を表す記号である可能
性が高いので、句点・ピリオドを優先させる（ステップ
ＳＴ２０）。満たしていない場合には、Ａ中のＢの全部
を形態素解析を行い、Ｂの直前の単語の品詞と活用形を
得る（ステップＳＴ１７）。これが、終助詞、あるいは
用言・助動詞の終止形である場合には、Ｂは文末を表す
記号である可能性が高いので、句点・ピリオドを優先さ
せる（ステップＳＴ２０）。それ以外の場合は、Ｂは文
末を表す記号でない可能性が高いので、読点・カンマを
優先させる（ステップＳＴ１９）。こういった処理をＡ
中に曖昧性がある句読点、カンマ、ピリオドが無くなる
まで繰り返す（ステップＳＴ２１）。

【００２６】なお、ステップＳＴ１３からＳＴ１８の条
件判断の順序はこの順番に限らないし、すべての条件を
使用する必要もない。また、これらの条件の論理和や論
理積によって判断を行う事もできる。

【００２７】次に、本実施例に係わる文字読み取り装置
の動作を画面の図を参照して説明する。

【００２８】表１に示す様に”I have a pen, book and
bag. You …”文書を認識した際、”I have a pen. bo
ok and bag, You …”としてしまい、「．」と「，」に
は曖昧性があるとする。

【００２９】

【表１】このとき、”bag ”の次のカンマは次が大文字であるた
めピリオドである可能性が高く、”pen ”の次のピリオ
ドは図４，５に示す条件のどれにも当てはまらないため
カンマである可能性が高い事がわかる。このため、優先
度を付け直して出力したものが表２であり、正しい認識
結果となっていることがわかる。

【００３０】

【表２】なお、第１の実施例では、日本語及び英語を例にあげて
説明しているが、これは、この言語に限定するものでは
なく、各リストや条件を対象言語に適したものに変更す
ることにより他の言語の認識にも適用できる。

【００３１】次に、本発明の第２実施例について説明す
る。図６は第２実施例を示す構成図であり、以下、日本
語の原稿を読取る例について説明する。

【００３２】図６において、読み取り部２１は原稿を読
み取るもので、例えばイメージセンサを備えたスキャナ
が用いられる。なお、このスキャナの解像度により読み
取れる文字の種類が決まる。また、しきい値は、例えば
１〜２５６の段階で設定でき、読み取る原稿に合わせて
制御できる。

【００３３】出力部２２は前記読み取り部２１で読み取
られた画像データに対し、後述するパターン照合処理し
た結果を表示するために、例えばビットマップディスプ
レイ等が使用される。なお、ディスプレイの画面上を分
割して、読み取り部２１で入力した画像データと本装置
が認識した文字を対応させて表示することもできる。

【００３４】入力部２３は出力部２２に表示され認識さ
れた文字の修正、読み取りレベルに付けられた識別名の
選択等の文字認識装置を制御するための各種コマンドの
入力を可能にしたもので、キーボード、マウス等が使用
される。

【００３５】文字認識部２４は前記読み取り部２１が原
稿を読み取った画像データを文字として認識するもので
ある。前記読み取り部２１が原稿を読み取るときは、文
字単位で読み取るのでなく、原稿の一端から順次スキャ
ン（走査）していき、各点に情報があるかないかの２値
で表された画像データを得る。このため解像度を上げる
ほどより細かく原稿を読み取ることになり、より複雑な
文字を読み取ることができる。そして文字認識部２４は
画像データの任意の範囲を対象にして（つまり文字単
位、単語単位で切出して）文字認識部２４が予め記憶し
ている標準文字パターンとのパターン照合処理を行な
う。このパターン照合処理を画像データの全てに対して
行ない、これらに対応する文字認識を行なう。

【００３６】最適読取りレベル判定部２５は文字認識部
２４で認識された結果どれだけ正しく認識されているか
形態素解析をすることで判定する。形態素解析で失敗す
る文字がないときは、最適な読取りレベルと判定する。
形態素解析で失敗する文字数が多いときは、読取りレベ
ルを変更し、再度読取り部２１から原稿を読み取る。

【００３７】形態素解析辞書部２６は形態素解析をする
ための辞書で単語単位の見出し語情報、付属語情報等を
記憶する。記憶部２７は、読み取り部２１で読み取った
画像データ、文字認識部２３による文字認識結果、読取
りレベルと対応する識別名等を記憶するものである。制
御部２８は前記各部の制御やデータの仲介を行なうもの
である。

【００３８】図７〜図１１は制御部２８の動作を示すフ
ローチャートである。オペレータが読取り部２１に読み
取らせる原稿をセットすると、出力部２２にどの読取り
レベルで行なうかが表示される。実施例では、既に原稿
に合った最適な読取りレベルに識別名を付けられて記憶
されている場合はその識別名が一覧表として表示され
る。最適な読取りレベルが判らないときは最適な読取り
レベルの設定モードが選択できるようになっている（ス
テップＳＴ３１）。

【００３９】入力部２３で識別名が選択されたときは識
別名に対応した読取りレベルを読取り部２１に設定する
（ステップＳＴ３２〜ＳＴ３３）。その後、読取りモー
ドｓｗを０にする（ステップＳＴ３４）。読取りモード
ｓｗは、原稿の読取り、文字認識、形態素解析を共通に
使用するためのスイッチである。

【００４０】最適な読取りレベルの設定モードが選択さ
れたときは、標準の読取りレベルを読取り部２１に設定
する（ステップＳＴ３５）。その後、読取りモードｓｗ
を１に設定する（ステップＳＴ３６）。

【００４１】設定された読取りレベルで原稿の読取りを
読取り部２１で行なう（ステップＳＴ３７）。読み取っ
た画像データは記憶部２７に記憶され読み取りが終了
後、文字認識部２４でレイアウト解析、文字認識と順番
に行われる（ステップＳＴ３８）。

【００４２】文字認識された結果は記憶部２７に記憶さ
れる。この文字認識された文字列は形態解析され形態素
解析に失敗した文字列はマーキングされる（ステップＳ
Ｔ３９）。レイアウト解析、文字認識、形態素解析は公
知の技術であるので詳細な説明は省略する。

【００４３】設定された読み取りレベルで入力された画
像データの文字認識はここで終了する。読み取りモード
ｓｗが０のときは、識別名が付けられて記憶されていた
読み取りレベルで入力する要求がなされたときで、認識
された文字及び形態素解析で失敗した文字列を他の文字
と区別して表示する（ステップＳＴ４０）。

【００４４】読み取りモードｓｗが１のときは、最適な
読取りレベルの設定モードが選択されたときで、形態素
解析で失敗した文字列をカウントする（ステップＳＴ４
１）。

【００４５】形態素解析で失敗した文字数が一定数以下
（実施例ではオペレータが設定を変えられるようになっ
ているが、この説明は省略する。例えば５文字と設定さ
れ、失敗文字数が、５文字以下のときは読み取りレベル
の変更は行なわない）のときは、他にもっと最適な読み
取りレベルが存在する可能性もあるが、実施例では最適
な読み取りレベルで画像データを読み取れたとする（ス
テップＳＴ４２）。この失敗許容文字数を０に設定する
と形態素解析に失敗する文字数が一番少ない読み取りレ
ベルが求められる。

【００４６】形態素解析に失敗した文字数が一定数以上
のときで、かつ、読み取りレベルが標準のときは標準値
を基に増減を行なう（ステップＳＴ４３〜ＳＴ４４）。
読み取りレベルの増減は、例えば、文字毎に標準的な文
字構成ビット数を記憶し、このビット数と設定されてい
る読み取りレベルで読み取った文字毎のビット数を比較
する。比較する対象の文字の種類は全ての文字で行なう
と精度は高いが、代表的な文字を対象に行なうことが可
能である。よく出現する漢字、平仮名、数字を対象に比
較することで増減の方向を知ることもできる。

【００４７】変更された読み取りレベルが標準値に比
べ、増加しているときは、増減フラグに１を設定する。
減少しているときは、増減フラグに−１を設定する（ス
テップＳＴ４５〜ＳＴ４７）。増減する量はＮで、実施
例ではオペレータが設定を変えられるようになっている
が、この説明は省略する。このＮの値を小さくすると紙
面の微妙な変化に対応した読み取りレベルを求めること
ができる。次の読み取りレベルが求まったら、読み取り
レベルをスキャナに設定し、再度、原稿の読み取りを行
なう。

【００４８】標準の読み取りレベルで読み取ったときで
ないときは、前回の読み取りレベルでの形態素解析の失
敗文字数と今回の新たに設定された読み取りレベル形態
素解析の失敗文字数と比較を行なう（ステップＳＴ４
８）。前回の読み取りレベルに比べ増加したときは読み
取りレベルの変更が正しくなかったので逆方向の読み取
りレベルに変更する。但し、このとき既に逆方向に対し
て読み取りレベルの変更を行なっているときは、失敗文
字数が最小である一つ前の読み取りレベルを最適値とす
る（ステップＳＴ４９、ステップＳＴ５８）。逆方向に
対して読み取りレベルの変更を行なっていないときは、
逆方向増減フラグを１にする（ステップＳＴ５０）。

【００４９】増減フラグの値が１のときは、標準値に増
加したときであるので逆方向すなわち標準値−Ｎの値に
変更する。増減フラグが−１のときは、標準値＋Ｎに変
更する（ステップＳＴ５１〜ＳＴ５３）。

【００５０】ステップＳＴ４８の比較で失敗文字数が前
回に比べ減少したときは、または、等しいときは読み取
りレベルの変更が正しかったのでさらに同一方向の読み
取りレベルに変更する。増減フラグの値が１のときは、
前回の読み取りレベル＋Ｎに変更する。増減フラグが−
１のときは、前回の読み取りレベル−Ｎに変更する（ス
テップＳＴ５４〜ＳＴ５６）。ステップＳＴ４８の比較
で失敗文字数が等しいときは実施例では、減少したと扱
っているが逆方向に読み取りレベルを変更することもで
きる。または、読み取りレベルが最適な値であるとする
こともできる。

【００５１】増減された読み取りレベルをスキャナに設
定し、再度、原稿の読み取りを行なう（ステップＳＴ５
７）。

【００５２】ステップＳＴ４２の比較で形態素解析の失
敗文字数が許容文字数のときは、許容文字数以下となっ
た読み取りレベルに識別名を付けて記憶する。オペレー
タが識別名を入力すると読み取りレベルと対応させて記
憶部２７に記憶する（ステップＳＴ５９〜ＳＴ６０）。

【００５３】文字認識された文字列は出力部２２に表示
される。このとき、形態素解析で失敗した文字列は他と
区別して表示する（ステップＳＴ６１）。この表示でオ
ペレータは形態素解析に失敗した文字列の前後を注意し
て見れば認識誤りを簡単に発見できる。

【００５４】なお、ここまでの説明は、スキャナから２
値（０または１）で画像データを読み取り文字認識をす
る方法について述べたが、多値で読み取ることができる
スキャナでは、読み取りレベルに応じて多値から２値に
変換することもできる。この場合は、図７において、読
み取りレベルを変更する度に原稿を読み取っていたステ
ップＳＴ３７の替わりに読み取りレベルに応じて多値か
ら２値に変換する構成にすることで実現できる。

【００５５】また、第２実施例では、読み取りレベルを
読み取った頁全体に１つ設定することで説明したが、読
み取る原稿によっては、部分的に濃淡が異なる場所や文
字の背景が相違することがある。このような原稿のとき
は、例えばレイアウト認識されたブロック単位に最適な
読み取りレベルで読み取ることもできる。例えば、ブロ
ック１は読み取りレベルを濃い原稿レベルで、ブロック
２と３は薄い原稿レベルで等、ブロック毎に形態素解析
で失敗する文字数が最小な読み取りレベルで読み取った
画像データの認識結果を出力できる。

【００５６】この他、読み取りレベルを変更して複数回
読み取り、文字認識、形態素解析を行なう場合は、ある
読み取りレベルで読み取ったとき形態素解析に失敗した
文字列が、別の読み取りレベルでは失敗しない場合に複
数の読み取りレベルの成功した文字列を集めて１つの認
識文字列とすることもできる。このように構成すること
により、原稿の濃淡のバラツキを吸収することができ
る。

【００５７】次に、本発明の第３実施例について説明す
る。図１２は第３実施例に係る機械翻訳装置の構成を示
すブロック図である。

【００５８】同図において、入力部３１は、本発明に於
ける文字認識装置の動作に必要なコマンドを入力した
り、認識結果に対する修正文字を入力したりするもので
あり、通常キーボードやマウス、タッチパネルなどが用
いられる。表示部３２は、前記入力部から入力されたコ
マンドや文字列を表示したり、後述する読取り部からの
読取り結果や文字認識部による文字認識の途中状態や認
識結果などを表示したりするもので、通常ビットマップ
ディスプレイやCRT ディスプレイなどが用いられるが、
オペレータが装着したゴーグルや壁面に投射してもよ
い。なお、画面を分割して片方を読取り部が読み取った
画像イメージを表示させ、他方に本装置が認識した結果
を対応させて表示することもできる。レイアウト解析部
３３は、画像イメージから文字の記述されている部分を
識別したり、文字が縦書きであるか横書きであるかを判
別するためのものである。レイアウト記録部３４はレイ
アウト解析部３３で認識されたレイアウト情報を記録す
るためのものである。読取り部３５は原稿を読み取るた
めのもので、例えばラインイメージセンサを備えたスキ
ャナなどが用いられる。なお、このスキャナの解像度に
より、読み取れる文字の種類が決まる。文字認識部３６
は前記読取り部が原稿を読み取った結果得られた画像な
どのデータを文字として認識するものである。認識用辞
書３７は、前記文字認識部に於ける文字認識の時にパタ
ーン照合を行うために用いる。翻訳部３８は、文字認識
部で認識した結果を翻訳するためのものである。レイア
ウト反映部３９は、前記レイアウト記録部に記録されて
いるレイアウト情報と文字認識の結果を翻訳部によって
翻訳した結果得られた文字情報とを組み合わせて、元の
原稿のイメージに近い状態で出力するための処理を行う
ものである。レイアウト回転部４０は、レイアウト認識
部で原稿が縦書きであると判定された場合には、レイア
ウト情報を回転させ、横書きのレイアウトに変換するた
めのものである。記録部４１は、認識したデータや読み
取ったデータ画像データなどを記録するためのものであ
り、通常磁気的、電気的に実現される。制御部４２は前
記各部の制御やデータの受け渡しを行うためのものであ
る。

【００５９】図１３は、第３実施例の動作を示すフロー
チャートである。原稿を文字データとして電子化するた
めには、まず、原稿を読取り部により読み取る（ステッ
プＳＴ７１）。つぎに、読み取った結果に対してレイア
ウト認識を行う（ステップＳＴ７２）。レイアウト認識
では、文字がある場所をブロックとして捕らえる他、文
字が縦書きであるか横書きであるかをも認識する。次に
レイアウト認識の結果を参考に文字認識を行う（ステッ
プＳＴ７３）。そして、文字認識結果を翻訳し（ステッ
プＳＴ７４）、文字認識の結果をレイアウト認識の結果
に反映させ、原稿に近いイメージで出力する（ステップ
ＳＴ７５）。

【００６０】図１４は、図１３におけるステップＳＴ７
５のレイアウト反映機能の処理の流れを示すフローチャ
ートである。レイアウト反映機能では、まず、レイアウ
ト認識で得られた結果を読み込む（ステップＳＴ８
１）。次に、文字認識の翻訳結果を読み込む（ステップ
ＳＴ８２）。そして、ステップＳＴ８１で読み込んだ情
報が縦書きのデータであれば（ステップＳＴ８３）、レ
イアウト情報を回転させる（ステップＳＴ８４）。ステ
ップＳＴ８２で読み込んだ文字データをレイアウトデー
タの該当箇所に挿入することによってレイアウト反映が
終了する（ステップＳＴ８５）。

【００６１】次に、第３実施例で示した機械翻訳装置の
全体の動作の概要について説明する。

【００６２】いま、表３に示すような縦書きの原稿を電
子化する例で説明する。

【００６３】

【表３】この原稿を読み取り部から読取り、レイアウト認識する
と図１５のようになる。図１５では、文字が書かれてい
る部分の塊を矩形のブロックとして認識し、その頂点の
座標を記録している。また、このデータが縦書きである
ということも記録している。文字認識後、レイアウト反
映部では、このデータが縦書きであるため図１６に示す
ように、座標を変換する。そして、これのデータに対し
翻訳結果を対応するブロックに反映させると表４のよう
な結果を出力することができる。

【表４】

【００６４】

【発明の効果】以上説明したように、本願第１の発明に
よる文字認識装置では、句読点やピリオド、カンマの認
識結果に曖昧性がある場合に、その句読点やピリオド、
カンマの前後を解析することにより、その場所で文が終
了する可能性が高い場合には、句点またはピリオドなど
文の終了を示す記号を優先させ、それ以外の場合は、読
点・カンマなど文を終了させない記号を優先させる機能
を有し、文の終了を示す記号を正しく認識することがで
きる。

【００６５】また、本願第２の発明に係る文字認識装置
によれば、原稿毎に異なるスキャナの読み取りレベルを
最適な値に設定することができ、誤った読取りレベルで
の認識をなくしオペレータの負担を大幅に軽減できる。
また、原稿にあった最適な読み取りレベルに識別名を付
けて記憶することで読み取りレベルを意識する必要がな
くなる。

【００６６】また、本願第３の発明に係る機械翻訳装置
では、縦書きの文書の場合はレイアウト情報を回転し、
横書きの文書として出力することによって、レイアウト
情報を有効に利用することができるという効果が得られ
る。

【図面の簡単な説明】

【図１】本発明の第１実施例に係る文字認識装置の構成
を示すブロック図である。

【図２】第１実施例の動作を示すフローチャートであ
る。

【図３】文末記号優先部の概略を表すブロック図であ
る。

【図４】文末記号優先部の動作を示すフローチャートの
第１の分図である。

【図５】文末記号優先部の動作を示すフローチャートの
第２の分図である。

【図６】本発明の第２実施例に係る文字認識装置の構成
を示すブロック図である。

【図７】第２実施例の動作を示すフローチャートの第１
の分図である。

【図８】第２実施例の動作を示すフローチャートの第２
の分図である。

【図９】第２実施例の動作を示すフローチャートの第３
の分図である。

【図１０】第２実施例の動作を示すフローチャートの第
４の分図である。

【図１１】第２実施例の動作を示すフローチャートの第
５の分図である。

【図１２】本発明の第３実施例に係る機械翻訳装置の構
成を示すブロック図である。

【図１３】第３実施例の動作を示すフローチャートであ
る。

【図１４】レイアウト反映機能の処理動作を示すローチ
ャートである。

【図１５】レイアウトの認識結果の例を示す説明図であ
る。

【図１６】レイアウトデータの回転例を示す説明図であ
る。

【図１７】従来における文字認識装置を示すブロック図
である。

【符号の説明】

１入力部２表示部３記録部４読取部５文字認識部６認識用辞書７文末記号優先処理部８制御部２１読み取り部２２出力部２３入力部２４文字認識部２５最適読み取りレベル判定部２６形態素解析辞書２７記憶部２８制御部３１入力部３２表示部３３レイアウト解析部３４レイアウト記録部３５読取り部３６文字認識部３７認識用辞書３８翻訳部３９レイアウト反映部４０レイアウト回転部４１記録部４２制御部

Claims

【特許請求の範囲】

【請求項１】入力されたイメージデータの文字認識を
行なう文字認識装置において、読取られた文字中に存在する句読点，ピリオド，カンマ
の認識性に曖昧性があるか否かを判定する手段と、曖昧
性があると判定された場合には当該曖昧な句読点，ピリ
オド，カンマの前後の文章を参照して句読点，ピリオ
ド，カンマのいずれかを決定する手段と、を有すること
を特徴とする文字認識装置。
【請求項２】設定された読取りレベルに従って文書画
像を入力する手段と、入力された文書画像から文字行を
切出し、該文字行から各文字を切出して文字認識する手
段とを備えた文字認識装置において、文書画像を読取る原稿の質、濃淡等の各属性に応じた読
取りレベルを予め格納する手段と、実際に原稿を読取る際には当該原稿の属性を識別し、こ
れに対応する読取りレベルにて読取りを行なう手段と、を有することを特徴とする文字認識装置。
【請求項３】第１の言語を第２の言語に翻訳する機械
翻訳装置において、原稿に記載された第１の言語文字の
画像データを認識し、当該文字のレイアウトを解析する
レイアウト解析手段と、この第１の言語文字が縦書きであるか横書きであるかを
判定する文字方向判定手段と、第１の言語文字と、これを翻訳した第２の言語文字との
文字方向が異なる場合には前記レイアウト解析手段にて
解析されたレイアウトの方向を文字方向と同様に変更
し、変更後のレイアウトで第２の言語文字を出力する手
段と、を有することを特徴とする機械翻訳装置。