JP2006268372A

JP2006268372A - 翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラム

Info

Publication number: JP2006268372A
Application number: JP2005084840A
Authority: JP
Inventors: Katsuhiko Itonori; 勝彦糸乘; Hiroaki Ikegami; 博章池上; Hideaki Ashikaga; 英昭足利; Shunichi Kimura; 俊一木村; Hiroki Yoshimura; 宏樹吉村; Masanori Onda; 昌徳恩田; Masahiro Kato; 雅弘加藤; Masaki Satake; 雅紀佐竹
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 2005-03-23
Filing date: 2005-03-23
Publication date: 2006-10-05
Also published as: US20060215909A1; US7623716B2

Abstract

【課題】翻訳後、原文中の文字列とその文字列の内容に対応する領域とをそれぞれ近い場所に配置した画像を用紙に印刷する。これにより、原文と同じ読み易さの翻訳文を使用者に提供する。
【解決手段】翻訳後、文中の図１の文字列と図１とが別頁に配置されるような場合（文字列「図１」と図１とが別紙になる）であっても、図１の文字列を含む文字領域を段落で分割し、この段落間に図１を配置する。これにより、図７（ｂ）に示すように、文字列を含む文字領域と図面とを同頁に配置する。
【選択図】図７

Description

本発明は、文字または文書の言語を他の言語に変換する翻訳に関する。

グローバルコミュニケーション時代の到来とともに、コンピュータを用いて、辞書データや所定のアルゴリズムを用いて文書構造を解析する等して文字を他の文字に置換することにより、ある言語の文章を他の言語の文章に翻訳するという、いわゆる機械翻訳が盛んに行われるようになってきている。なお、文書が電子化されたものではない（文書データがない）場合は、翻訳処理を行う前に、印刷された原稿をスキャナ装置で読み取って文字認識処理を行って文字情報を抽出するＯＣＲ処理が行われることになる。

また、翻訳前と後では、１文の長さが異なるため、原稿に図面、表、写頁等のイメージも含んだ場合には、イメージの位置がずれることがあった。そこで、原稿のイメージの位置と翻訳後のイメージの位置を固定する技術が知られている（特許文献１、参照）。
特開平５−１０８７１６号公報

上記技術では、原稿（以下、「原文」という）を文書枠とイメージ枠とに分け、翻訳した結果を文書枠内に充てがう。この際、原文のイメージ枠を最優先にして、翻訳後の文書を文書枠に充てがうため、文書枠を拡張したり、文字のフォントサイズを変更している。このため、作成された翻訳後の文書は、各文書枠間の間隔が狭くなったり、文書枠毎にフォントサイズが異なったりして、読みにくいものになる、といった問題があった。

一方、フォントサイズやレイアウトの各領域の大きさを考慮せずに翻訳結果を文書枠内に充てがうと、文書中の図表番号や対応する図表番号が別の頁に配置されるなどして、さらに読みにくい翻訳結果となる。

本発明は、上記事情に鑑みてなされたもので、翻訳後の文書を、原文中の文字列とその対応する領域と近い場所に配置することにより、原文と同じ読み易さを提供することのできる翻訳装置、画像処理装置、画像形成装置、翻訳方法及びプログラムを提供することを目的としている。

上記目的を達成するために、本発明は、文字を含む画像データを解析して、文字領域と、この文字領域と構成要素が異なる他の領域とに分けて抽出する領域抽出手段と、前記画像解析手段で文字領域と判定された領域内の文字を認識する文字認識手段と、前記文字認識手段による文字認識の結果から前記他の領域に関係する文字列を抽出し、この文字列に対し、この文字列が抽出された文字領域および前記他の領域を対応付けた対応表を作成する対応表作成手段と、前記文字の認識結果を翻訳する翻訳手段と、前記対応表に基づき、前記文字列を含む翻訳結果とこの文字列に対応する他の領域とを同じ頁に貼り付ける貼付手段と、を備えたことを特徴とする。

上記構成において、前記他の領域は図表領域であり、前記文字列は図表番号であり、前記対応表は、図表領域に対する図表番号と文字領域中の図表番号とを関連付けることを特徴とする。

上記構成において、前記他の領域は脚注領域であり、前記文字列は脚注番号であり、前記対応表は、脚注領域に対する脚注番号と文字領域中の脚注番号とを関連付けることを特徴とする。

上記構成において、前記他の領域は頭注領域であり、前記文字列は頭注番号であり、前記対応表は、頭注領域に対する頭注番号と文字領域中の頭注番号とを関連付けることを特徴とする。

上記構成において、前記貼付手段は、前記文字列を含む文字領域が段落で分かれ、文字列が含まれる段落の直後に他の領域を配置できるスペースが頁内に存在する場合には、文字領域を分割して文字列が含まれる段落の直後に他の領域を配置することを特徴とする。

上記構成において、前記貼付手段は、前記文字列を含む文字領域が段落で分かれ、文字列が含まれる段落が頁の最後に配置される場合には、文字領域を分割して文字列が含まれる段落と他の領域を次頁の先頭に配置することを特徴とする。

上記構成において、前記貼付手段は、前記文字列を含む文字領域が複数存在する場合には、最初に出現する文字列の存在する文字領域の直後に他の領域を配置することを特徴とする。

本発明が採用する画像処理装置は、印刷された画像を読み取り、画像データとして出力する画像読取手段と、上記のいずれかに記載の翻訳装置と、を備えたことを特徴とする。

本発明が採用する画像形成装置は、画像を記録材上に形成する画像形成手段と、上記のいずれかに記載の翻訳装置と、を備えたことを特徴とする。

本発明が採用する翻訳方法は、画像データを解析して、文字領域と、この文字領域と構成要素が異なる他の領域とを抽出するステップと、前記画像解析手段で文字領域と判定された領域内の文字を認識するステップと、前記文字認識手段による文字認識の結果から前記他の領域に関係する文字列を抽出し、この文字列に対し、この文字列が抽出された文字領域および前記他の領域を対応付けた対応表を作成するステップと、前記文字の認識結果を翻訳するステップと、前記対応表に基づき、前記文字列を含む翻訳結果とこの文字列に対応する他の領域とを同じ頁に貼り付けるステップと、を備えたことを特徴とする。

本発明が採用するプログラムは、画像データを解析して、文字領域と、この文字領域と構成要素が異なる他の領域とを抽出する機能と、前記画像解析手段で文字領域と判定された領域内の文字を認識する機能と、前記文字認識手段による文字認識の結果から前記他の領域に関係する文字列を抽出し、この文字列に対し、この文字列が抽出された文字領域および前記他の領域を対応付けた対応表を作成する機能と、前記文字の認識結果を翻訳する機能と、前記対応表に基づき、前記文字列を含む翻訳結果とこの文字列に対応する他の領域とを同じ頁に貼り付ける機能と、を備えたことを特徴とする。

以下、本発明の実施形態について、図面を参照して説明する。
図１は、本発明の実施形態に係る翻訳機能を備えた画像形成装置１００を示す図である。図に示すように、画像形成装置１００は、翻訳処理部１と、操作部１０２と、ネットワークＩ／Ｆ部１０３と、記憶部１０４と、印字部１０５と、画像読取部１０６とを備えている。
印字部１０５は、感光体、露光部、現像部、転写部及び定着部（いずれも図示せず）等を備え、翻訳処理部１より供給された画像データに基づいたトナー像を形成し、記録材である用紙上に定着させる。操作部１０２は、液晶ディスプレイ（図示せず）からなる表示手段や各種のボタン等を備え、ユーザからの指示が入力される。ユーザは、操作部１０２を用いて使用する用紙を選択したり、印刷の設定指示を行う。

画像読取部１０６は、読取面に載置された原稿の画像をスキャンし、画像データを得る。記憶部１０４は、画像読取部１０６によって読み取られた画像データ等を記憶する。前記翻訳処理部１、操作部１０２、記憶部１０４、印字部１０５及び画像読取部１０６等の間は、ネットワークＩ／Ｆ部１０３によってデータ通信可能になる。

翻訳処理部１は、図２に示すように、ＣＰＵ（Central Processing Unit）１１、ＲＡＭ(Random Access Memory)１２及びＲＯＭ（Read Only Memory）１３を備えており、画像形成装置１００の各部を制御するほか、入力された画像データに対して各種の画像処理及び翻訳処理を行うための各種の演算を実行する。このとき、画像データはＲＡＭ１２に一時記憶される。また、ＲＯＭ１３には、画像データ処理及び翻訳処理に必要な各種の画像処理プログラム及び翻訳処理プログラムが格納されている。また、ＲＡＭ１２には、後述する対応表が記憶されている。

この対応表は、図６に示すように、文字領域と図表領域とを対応付ける場合には、文字領域中の図表番号を基準にして、この図表番号に対応するキャプション領域、対応する図表領域、対応する文字領域、図表番号の訳語が関連付ける。
ここで、キャプションとは、図・表の下側或いは上側に付けられる説明文のことである。

次に、翻訳処理部１の機能について、図３の機能ブロック図を参照しつつ説明する。
翻訳処理部１は、文書解析部２、文字認識部３、翻訳部４、対応関係検索部５、対応表記憶部６および翻訳結果貼付部７を具備している。

文書解析部２は、画像読取部１０６で読み取られた画像データを解析し、文字領域、図表領域等の構成要素に分割する。本実施形態では、他の領域を図表領域として抽出する。
より具体的には、図４に示すように、画像Ｇをこの文書解析部２で処理すると、タイトル部分→文字領域Ｔ１、右側の文字領域→文字領域Ｔ２、右上の文字領域→文字領域Ｔ３、右下の図面→図表領域Ｆ１、図面下のキャプション部分→文字領域Ｔ４、左下の棒線部分→図表領域Ｆ２、棒線部下のキャプション部分→文字領域Ｔ５といった具合に領域を分ける。

文字認識部３は、文書解析部２で文字領域と判定された領域に対して、文字の認識を行う。即ち、ＯＣＲ（Optical Character Reader）処理を施し、この文字領域における文字を画像データとして読み取り、文字認識を行う。この場合、文字領域Ｔ１〜Ｔ５について文字認識を行うことになる。

翻訳部４は、文字認識部３で読み取った文字データの言語の種類を、ＲＯＭ１３内の言語情報と比較し、その言語を特定した上で、文字データに対して翻訳処理を施し、例えば日本語から英語に翻訳した翻訳データを作成する。

対応関係検索部５では、翻訳前の文字データから図番号の検索を文字領域Ｔ１〜Ｔ５毎に行い、図番号に関係する文字列を検索によって抽出し、文字列、キャプション領域、対応する文字領域を対応記憶部６の対応表に書き込む（例えば、図６（ａ）参照）。
この処理では、各領域の配置が分かっているため、図４に示すように、始めにこの頁に存在する図表領域Ｆ１およびＦ２を抽出し、この図表領域Ｆ１のキャプション部分に当たるであろう文字領域を確定し、この文字領域Ｔ４の文字データから図番号の検索を行う。同様に、図表領域Ｆ２のキャプション部分に当たるであろう文字領域を確定し、この文字領域Ｔ５の文字データから図番号の検索を行う。この抽出結果から図表番号に関係する文字列、キャプション部分に当たる文字領域を抽出する。さらに、この文字列を検索対象として他の文字領域Ｔ１〜Ｔ３の全文検索を順に行い、初めて登場するこの文字列（文頭にもっとも近い）を含む文字領域を対応する文字領域とする。

そして、対応関係検索部５は、確定された抽出された文字列，キャプション部分に当たる文字領域，図面の対応領域および文字列を含む文字領域を、対応表記憶部６の対応表に書き込む。さらに、対応関係検索部５は、文字列に対応した訳語を翻訳データから読み出し、訳語を対応表に書き込む。

また、キャプション部分に当たる文字領域は、図表領域に隣接し、かつ比較的短いの文字領域であること基準に判定すればよい。さらに、図表領域の大きさや位置から図表か否かを判定することにより、本文と脚注を区切る棒線部分を図表領域と認識し、脚注に当たる文字領域をキャプションとして認識してしまう不具合を防止する。

翻訳結果貼付部７は、後述する貼付処理によって翻訳後の翻訳文と図表とを、所定の処理によって頁に貼り付ける。その後、所定の処理の施されたデータが画像データとしてＲＡＭ１２に一時的に記憶される。ここでは、便宜上、説明を分かり易くするため、頁に翻訳文および図表を貼り付ける物理的な動作として記載する。

次に、具体例を示して、貼付処理について説明する。
この例では、図７或いは図８に示す画像Ｇを、日本語から英語に翻訳する場合を示す。画像Ｇの画像データを、文書解析部２で処理することにより、右側に文字領域Ｔ１−１、右上に文字領域Ｔ１−２、右下の図表領域Ｆ１、図表領域Ｆ１の下にキャプション部分に当たる文字領域Ｔ２が配置されることが認識される。さらに、対応関係検索部５が、前述した処理を行って図６に示す対応表を作成する。対応表には、前述した翻訳処理部１は、文書解析部２、文字認識部３、翻訳部４、対応関係検索部５までの処理により、対応表記憶部６の対応表には、文字列→図１、キャプション部分に当たる文字領域→Ｔ２、図面の対応領域→Ｆ１、文字列を含む文字領域→Ｔ１（Ｔ１−１＋Ｔ１−２）、文字列に対応した訳語→Ｆｉｇ１が書き込まれている。

ここで、図５に示す貼付処理の流れ図を参照しつつ、その処理について説明する。
まず、ＣＰＵ１１は、対応表から対応関係を１つ取り出す（ステップＳ１）。この場合、文字列「図１」に対応する各領域等が取り出される。

次に、ＣＰＵ１１は、取り出した文字列「図１」に対応する各領域が１頁内に存在しているか否かを判定する（ステップＳ２）。具体的には、日本語から英語に翻訳すると、１つの単語の長さが長くなるため、１文、１段落が長くなり、当然貼付に必要となる文字領域が広がる。このため、図７（ａ）に示すように、原文が１頁だったものが、２頁に亘ってしまい、訳語「Ｆｉｇ１」と図表領域Ｆ１とが別頁になってしまう（ステップＳ２；ＮＯ）。

そこで、ＣＰＵ１１は、対応する文字領域Ｔ１を段落で分割し（ステップＳ３）、図７（ｂ）に示すように、分割した文字領域の間に図表領域Ｆ１を配置する（ステップＳ４）。

さらに、ＣＰＵ１１は、再び文字列「図１」に対応する各領域が１頁内に存在しているか否かを判定する（ステップＳ５）。図７（ｂ）に示すように、訳語「Ｆｉｇ１」と図表領域Ｆ１とが同じ頁に配置された場合（ステップＳ５；ＹＥＳ）には、ステップＳ７に移行して、対応表を参照して他の対応関係があるか否かを判定し、まだ処理していない対応関係がある場合（ステップＳ７；ＹＥＳ）には、ステップＳ１以降の処理を繰り返し、全ての対応関係が処理された場合（ステップＳ７；ＮＯ）には、この貼付処理を終了する。

一方、ＣＰＵ１１は、訳語「Ｆｉｇ１」と図表領域Ｆ１とが同じ頁に配置されていない場合（ステップＳ５；ＮＯ）には、図８（ｂ）に示すように、次頁の先頭に図表領域Ｆ１と文字領域Ｔ２を配置する（ステップＳ６）。

ＣＰＵ１１は、対応表を参照して残りの対応関係の処理を行い、各対応関係で配置が終了した場合（ステップＳ７；ＮＯ）には、処理された各頁のデータを画像データとしてＲＡＭ１２に記憶してこの処理を終了する。

さらに、翻訳処理部１は画像形成装置１００の一部として構成されているため、使用者による操作部２の操作によって印刷が指令されると、翻訳処理部１にて処理された翻訳後の画像データが印字部６へ出力され、印字部６は、その画像データの画像を用紙に印刷する。

このように、本実施形態による画像形成装置１００は、図７（ｂ）或いは図８（ｂ）に示すように、翻訳後の文書を、原文中の文字列とその文字列に対応する領域とを互いに近い場所に配置した画像を用紙に印刷することができる。これにより、使用者は、原文と同じ読み易さの翻訳文を取得することができる。

なお、上記実施形態では、原文の文字領域に対して翻訳後の文字領域が長くなる場合を例にとって説明したが、逆に、原文の領域に対して翻訳後の文字領域が短くなる場合も、翻訳処理部１を施すことにより、同様の効果を奏することができる。

また、前記実施形態では、他の領域を図表領域として記載したが、本発明はこれに限らず、脚注や頭注であっても、写真であっても適用することができる。この場合、抽出される文字列は「注」、「写真」等となる。

さらに、原文及び翻訳文の言語の種類としては、上記実施形態に限定されないのは勿論であり、日本語、英語の他、例えば、ドイツ語、フランス語、ロシア語、スペイン語、中国語あるいは韓国語などにも適用可能である。

なお、前記実施形態における貼付処理では、ステップＳ３〜Ｓ５の処理を１回行うものとして述べたが、文字領域Ｔ１内の段落が複数ある場合には、この処理を繰り返して行い、その結果、訳語「Ｆｉｇ１」と図表領域Ｆ１とが同頁に配置されない際に、ステップＳ６の処理を行ってもよい。さらに、ステップＳ３の処理で、文字領域Ｔ１内の段落が複数ある場合には、文字列「図１」が初めて出願する段落の次に図表領域Ｆ１がくるように処理してもよい。

また、上述の実施形態においては、本発明は、画像形成装置１００の形態で実施されるものとして説明したが、このような形態に限定されるものではない。例えば、本発明は上述の画像形成装置１００における翻訳処理部１の部分のみの機能を有する翻訳装置あるいは画像処理装置として提供されることも可能である。この場合、翻訳装置あるいは画像処理装置は、上述の翻訳処理部１の機能を備えたＡＳＩＣ（Application Specific Integrated Circuit）であっても良い。また、本発明は、上述の翻訳処理する翻訳処理プログラムＰＲＧを、磁気ディスク、フロッピー（登録商標）ディスク、ＣＤ（Compact Disk）、ＤＶＤ（Digital Versatile Disk）、ＲＡＭ等の種々の記録媒体に記録した状態で提供することも可能である。

本発明の実施形態に係る画像形成装置を示したブロック図である。同実施形態に係る画像形成装置の翻訳処理部の構成を示した図である。同実施形態に係る画像形成装置の翻訳処理部の構成を示した機能ブロック図である。翻訳処理部の文書解析部における処理を示す具体例である。翻訳処理部の翻訳結果貼付部における貼付処理を示すフローチャートである。翻訳処理部における対応表を示す図である。翻訳処理部における貼付処理処理を説明する図である。翻訳処理部における貼付処理処理を説明する図である。

符号の説明

１…翻訳処理部、２…文書解析部、３…文字認識部、４…翻訳部、５…対応関係検索部、６…対応表記憶部、７…翻訳結果貼付部、１００…画像形成装置、１０５…印字部（画像形成手段）、１０６…画像読取部（画像読取手段）、Ｇ…画像。

Claims

文字を含む画像データを解析して、文字領域と、この文字領域と構成要素が異なる他の領域とに分けて抽出する領域抽出手段と、
前記画像解析手段で文字領域と判定された領域内の文字を認識する文字認識手段と、
前記文字認識手段による文字認識の結果から前記他の領域に関係する文字列を抽出し、この文字列に対し、この文字列が抽出された文字領域および前記他の領域を対応付けた対応表を作成する対応表作成手段と、
前記文字の認識結果を翻訳する翻訳手段と、
前記対応表に基づき、前記文字列を含む翻訳結果とこの文字列に対応する他の領域とを同じ頁に貼り付ける貼付手段と、を備えた
ことを特徴とする翻訳装置。
請求項１記載の翻訳装置において、
前記他の領域は図表領域であり、前記文字列は図表番号であり、
前記対応表は、図表領域に対する図表番号と文字領域中の図表番号とを関連付ける
ことを特徴とする翻訳装置。
請求項１記載の翻訳装置において、
前記他の領域は脚注領域であり、前記文字列は脚注番号であり、
前記対応表は、脚注領域に対する脚注番号と文字領域中の脚注番号とを関連付ける
ことを特徴とする翻訳装置。
請求項１記載の翻訳装置において、
前記他の領域は頭注領域であり、前記文字列は頭注番号であり、
前記対応表は、頭注領域に対する頭注番号と文字領域中の頭注番号とを関連付ける
ことを特徴とする翻訳装置。
請求項１記載の翻訳装置において、
前記貼付手段は、前記文字列を含む文字領域が段落で分かれ、文字列が含まれる段落の直後に他の領域を配置できるスペースが頁内に存在する場合には、文字領域を分割して文字列が含まれる段落の直後に他の領域を配置する
ことを特徴とする翻訳装置。
請求項１記載の翻訳装置において、
前記貼付手段は、前記文字列を含む文字領域が段落で分かれ、文字列が含まれる段落が頁の最後に配置される場合には、文字領域を分割して文字列が含まれる段落と他の領域を次頁の先頭に配置する
ことを特徴とする翻訳装置。
請求項１記載の翻訳装置において、
前記貼付手段は、前記文字列を含む文字領域が複数存在する場合には、最初に出現する文字列の存在する文字領域の直後に他の領域を配置する
ことを特徴とする翻訳装置。
印刷された画像を読み取り、画像データとして出力する画像読取手段と、請求項１から７のいずれかに記載の翻訳装置と、を備えた
ことを特徴とする画像処理装置。
画像を記録材上に形成する画像形成手段と、請求項１から７のいずれかに記載の翻訳装置と、を備えた
ことを特徴とする画像形成装置。
画像データを解析して、文字領域と、この文字領域と構成要素が異なる他の領域とを抽出するステップと、
前記画像解析手段で文字領域と判定された領域内の文字を認識するステップと、
前記文字認識手段による文字認識の結果から前記他の領域に関係する文字列を抽出し、この文字列に対し、この文字列が抽出された文字領域および前記他の領域を対応付けた対応表を作成するステップと、
前記文字の認識結果を翻訳するステップと、
前記対応表に基づき、前記文字列を含む翻訳結果とこの文字列に対応する他の領域とを同じ頁に貼り付けるステップと、を備えた
ことを特徴とする翻訳方法。
画像データを解析して、文字領域と、この文字領域と構成要素が異なる他の領域とを抽出する機能と、
前記画像解析手段で文字領域と判定された領域内の文字を認識する機能と、
前記文字認識手段による文字認識の結果から前記他の領域に関係する文字列を抽出し、この文字列に対し、この文字列が抽出された文字領域および前記他の領域を対応付けた対応表を作成する機能と、
前記文字の認識結果を翻訳する機能と、
前記対応表に基づき、前記文字列を含む翻訳結果とこの文字列に対応する他の領域とを同じ頁に貼り付ける機能と、を備えた
ことを特徴とするプログラム。