JPH0554075A - Translation device - Google Patents
Translation deviceInfo
- Publication number
- JPH0554075A JPH0554075A JP3215685A JP21568591A JPH0554075A JP H0554075 A JPH0554075 A JP H0554075A JP 3215685 A JP3215685 A JP 3215685A JP 21568591 A JP21568591 A JP 21568591A JP H0554075 A JPH0554075 A JP H0554075A
- Authority
- JP
- Japan
- Prior art keywords
- image
- character
- image information
- output
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】 文章中に表を含むような文字原稿において
も、安定した文字認識・翻訳処理を行う。
【構成】 ページメモリ401に記憶した画像情報から
表部分と表以外部分を検出し、別々に、文字単位の画像
情報を摘出し、文字認識処理および翻訳処理を行う。そ
して、表部分における原稿画像又は認識画像に、翻訳語
の文字画像情報を合成し、合成後の画像情報が表の罫線
で囲まれるブロック内に入るように表の大きさを変化さ
せる。その後、変化させた表部分が、編集後の表以外部
分に組み込めるか判定し、組み込める場合は、表以外部
分に表部分を組み込んだ画像情報を出力画像メモリ40
2に書き込み、組み込めない場合は、表以外部分の画像
情報と表部分の画像情報を別々に出力画像メモリ402
に書き込み、この文字画像情報をプリンタ200が出力
する。
(57) [Summary] [Purpose] Stable character recognition and translation processing is performed even for text manuscripts that include tables in the text. [Structure] A front portion and a portion other than the front portion are detected from image information stored in a page memory 401, and image information in character units is extracted separately, and character recognition processing and translation processing are performed. Then, the character image information of the translated word is combined with the original image or the recognition image in the front portion, and the size of the table is changed so that the combined image information falls within the block surrounded by the ruled lines of the table. Thereafter, it is determined whether the changed table portion can be incorporated in a portion other than the edited table. If it can be incorporated, the image information in which the table portion is incorporated in the portion other than the table is output.
If the data cannot be written in and embedded in the second image data, the image information of the portion other than the table and the image information of the front portion are separately output.
, And the printer 200 outputs this character image information.
Description
【0001】[0001]
【産業上の利用分野】本発明は、翻訳装置に関し、特
に、文章中にマーカーでマークされた表を含む原稿を光
学的に読み取り、これに画像処理を施し出力する翻訳装
置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a translation device, and more particularly, to a translation device for optically reading a document containing a table marked with markers in a sentence, performing image processing on the document, and outputting the image.
【0002】[0002]
【従来の技術】例えばアルファベット等からなる文章原
稿を光学的に読み取って文字を認識し、認識した文字を
単語単位で翻訳して出力する翻訳装置では、まず、スキ
ャナで読み取りメモリに格納された画像情報から文字単
位の画像を切り出す処理が行われる。この文字の切り出
しは、切り出し方向(行方向,列方向)の黒画素数のヒ
ストグラムを計算し、あるしきい値を決めそれによって
行や文字の区切りを判別して文字画像を切り出してい
た。2. Description of the Related Art In a translation apparatus for optically reading a text manuscript consisting of, for example, an alphabet, recognizing characters, translating the recognized characters word by word and outputting the words, an image stored in a memory is first read by a scanner. A process of cutting out an image in character units from the information is performed. In this character cutout, a histogram of the number of black pixels in the cutout direction (row direction, column direction) is calculated, and a certain threshold value is determined to determine the line or character delimiter and the character image is cut out.
【0003】[0003]
【発明が解決しようとする課題】しかし、アルファベッ
ト等からなる文章原稿が表を含む場合では、表が罫線を
含むことや表中の行,文字間隔がそれ以外のところと異
なることが多いため、従来のように行方向,列方向に黒
画素数をカウントしてそのヒストグラムより行や文字の
区切りを認識して文字の切出しを行う方法はうまくいか
ず翻訳に支障をきたしていた。However, when a text manuscript consisting of alphabets or the like includes a table, the table often includes ruled lines, and the lines and character spacing in the table are often different from other places. The conventional method of counting the number of black pixels in the row direction and the column direction and recognizing the line or character delimiter from the histogram to cut out the character does not work well, causing a problem in translation.
【0004】そこで本発明は、文章中に表を含むような
文字原稿においても、安定した文字認識・翻訳処理を行
う翻訳装置を提供することを目的とする。Therefore, an object of the present invention is to provide a translation apparatus which performs stable character recognition / translation processing even for a text original containing a table in a sentence.
【0005】[0005]
【課題を解決するための手段】本願の発明は、原稿画像
を読み取る画像読取手段(100);画像読取手段(1
00)が読み取った画像情報を記憶する画像記憶手段
(401);画像記憶手段(401)に記憶した画像情
報から表部分を検出する表検出手段(1541a,15
41b);表部分を示す情報から罫線を検出する罫線検
出手段(1541c);罫線検出手段(1541c)が
検出した罫線で囲まれるブロック内の、ブロック毎の画
像情報から文字単位の画像情報を摘出する表部分文字切
り出し手段(1541d,1542,1543);罫線
検出手段(1541c)が検出した罫線で囲まれるブロ
ック外の、画像情報から文字単位の画像情報を摘出する
文字切り出し手段(1542,1543);表部分文字
切り出し手段(1541d,1542,1543)およ
び文字切り出し手段(1542,1543)が切り出し
た画像情報の行方向間隔から単語単位で画像情報を摘出
する単語領域検出手段(1544);表部分文字切り出
し手段(1541d,1542,1543)および文字
切り出し手段(1542,1543)が切り出した画像
情報の文字を認識する文字認識手段(1545);単語
領域検出手段(1544)が検出した単語単位の、文字
認識手段(1545)が認識した文字の並びでなる単語
を翻訳する翻訳手段(1546);表部分における原稿
画像および文字認識手段(1545)が認識した文字画
像のうちいずれか一方に、表部分における翻訳手段(1
546)の翻訳語の文字画像情報を合成し、合成後の画
像情報が前記ブロック内に入るように表の大きさを変化
させる表編集手段(1547a);表以外部分における
原稿画像および文字認識手段(1545)が認識した文
字画像のうちいずれか一方に、表以外部分における翻訳
手段(1546)の翻訳語の文字画像情報を合成する表
以外編集手段(1547b);表編集手段(1547
a)が大きさを変化させた表部分が、表以外編集手段
(1547b)が合成した表以外部分に組み込めるか判
定し、組み込める場合は、表以外部分に表部分を組み込
んだ画像情報を出力画像メモリ(402)に書き込み、
組み込めない場合は、表以外部分の画像情報と表部分の
画像情報を別々に出力画像メモリ(402)に書き込む
出力画像作成手段(1547c);および、出力画像メ
モリ(402)に記憶した画像情報を出力する出力手段
(200);を備える。なお、カッコ内の記号は、図面
に示し後述する実施例の対応要素又は対応事項を示す。According to the invention of the present application, an image reading means (100) for reading an original image; an image reading means (1)
Image storage means (401) for storing the image information read by (00); table detection means (1541 a, 15) for detecting a front portion from the image information stored in the image storage means (401).
41b); ruled line detecting means (1541c) for detecting ruled lines from information indicating a table portion; image information in character units is extracted from image information for each block in a block surrounded by the ruled lines detected by the ruled line detecting means (1541c) Front part character cut-out means (1541d, 1542, 1543); character cut-out means (1542, 1543) for extracting image information in character units from image information outside the block surrounded by the ruled lines detected by the ruled line detection means (1541c) A word portion detecting means (1544) for extracting image information in word units from the line direction interval of the image information cut out by the character cutting means (1541d, 1542, 1543) and the character cutting means (1542, 1543); Character cutout means (1541d, 1542, 1543) and character cutout means (1 42,1543) character recognition means (1545) for recognizing the characters of the image information cut out; words composed of a sequence of characters recognized by the character recognition means (1545) in word units detected by the word area detection means (1544) Translating means (1546) for translating the original image in the front portion and the character image recognized by the character recognizing means (1545) to the translating means (1
546) Character image information of the translated word is combined, and a table editing unit (1547a) is configured to change the size of the table so that the combined image information falls within the block; a document image and a character recognition unit in a portion other than the table. Other than the table editing means (1547b) for combining the character image information of the translated word of the translation means (1546) in the portion other than the table with one of the character images recognized by (1545); the table editing means (1547).
It is determined whether or not the table portion whose size is changed in a) can be embedded in the portion other than the table synthesized by the editing means (1547b) other than the table. If it can be incorporated, the image information including the table portion in the portion other than the table is output Write to memory (402),
If it cannot be incorporated, output image creating means (1547c) for writing the image information of the portion other than the table and the image information of the surface portion separately to the output image memory (402); and the image information stored in the output image memory (402). An output means (200) for outputting is provided. Symbols in parentheses indicate corresponding elements or corresponding matters in the embodiments shown in the drawings and described later.
【0006】また、本願の好ましい実施態様としては、
前記表検出手段は、マーカーで指定された原稿画像の領
域を検出する指定領域検出手段(1541a);およ
び、指定領域検出手段が検出した領域の内側と外側を分
離する指定領域分離手段(1541b);を有し、分離
された領域の内側を表部分とする。Further, as a preferred embodiment of the present application,
The table detecting means is a designated area detecting means (1541a) for detecting the area of the document image designated by the marker; and a designated area separating means (1541b) for separating the inside and the outside of the area detected by the designated area detecting means. , And the inside of the separated area is the front portion.
【0007】[0007]
【作用】本願の発明によれば、表検出手段(1541
a,1541b)は、画像記憶手段(401)に記憶し
た画像情報から表部分を検出し、検出された情報から罫
線を、罫線検出手段(1541c)が検出する。そし
て、表部分文字切り出し手段(1541d,1542,
1543)は、この罫線で囲まれるブロック内の、ブロ
ック毎の画像情報から文字単位の画像情報を摘出し、文
字切り出し手段(1542,1543)は、該罫線で囲
まれるブロック外の、画像情報から文字単位の画像情報
を摘出する。According to the invention of the present application, the table detecting means (1541)
a, 1541b) detects the front portion from the image information stored in the image storage means (401), and the ruled line detection means (1541c) detects the ruled line from the detected information. Then, the front portion character cutting means (1541d, 1542,
1543) extracts the image information in character units from the image information for each block in the block surrounded by the ruled lines, and the character cutting means (1542, 1543) extracts from the image information outside the block surrounded by the ruled lines. Extract image information in character units.
【0008】すなわち、文字の切り出しが表部分と表以
外部分で別々に行われるので、例えば表部分と表以外部
分の行,文字間隔が異なる場合でも文字の切り出しは確
実に行われる。That is, since the character is cut out separately for the front portion and the portion other than the table, the character can be surely cut out even if the line and the character spacing of the front portion and the portion other than the table are different.
【0009】そして、単語領域検出手段(1544)
は、表部分文字切り出し手段(1541d,1542,
1543)および文字切り出し手段(1542,154
3)が切り出した画像情報の行方向間隔から単語単位で
画像情報を摘出し、文字認識手段(1545)は、同じ
く表部分文字切り出し手段(1541d,1542,1
543)および文字切り出し手段(1542,154
3)が切り出した画像情報の文字を認識する。次に、翻
訳手段(1546)は、単語領域検出手段(1544)
が検出した単語単位の、文字認識手段(1545)が認
識した文字の並びでなる単語を翻訳する。A word area detecting means (1544)
Is a front part character cutting means (1541d, 1542,
1543) and character cutting means (1542, 154)
3) The image information is extracted word by word from the line direction interval of the image information cut out by 3), and the character recognition means (1545) is also the front part character cutout means (1541d, 1542, 1).
543) and character cutting means (1542, 154)
3) Recognize the characters of the image information cut out. Next, the translation means (1546) is the word area detection means (1544).
Translates a word composed of a sequence of characters recognized by the character recognition means (1545) for each word detected by.
【0010】従って、文字切り出しに続いて行われる文
字認識および翻訳が、表に影響されることなく安定して
行われる。Therefore, the character recognition and the translation performed after the character segmentation are stably performed without being affected by the table.
【0011】そして、表編集手段(1547a)は、表
部分における原稿画像および文字認識手段(1545)
が認識した文字画像のうちいずれか一方に、表部分にお
ける翻訳手段(1546)の翻訳語の文字画像情報を合
成し、合成後の画像情報が前記ブロック内に入るように
表の大きさを変化させ、表以外編集手段(1547b)
は、表以外部分における原稿画像および文字認識手段
(1545)が認識した文字画像のうちいずれか一方
に、表以外部分における翻訳手段(1546)の翻訳語
の文字画像情報を合成する。その後、出力画像作成手段
(1547c)は、表編集手段(1547a)が大きさ
を変化させた表部分が、表以外編集手段(1547b)
が合成した表以外部分に組み込めるか判定し、組み込め
る場合は、表以外部分に表部分を組み込んだ画像情報を
出力画像メモリ(402)に書き込み、組み込めない場
合は、表以外部分の画像情報と表部分の画像情報を別々
に出力画像メモリ(402)に書き込み、この文字画像
情報を出力手段(200)が出力する。The table editing means (1547a) is a document image and character recognition means (1545) in the front part.
The character image information of the translated word of the translating means (1546) in the table portion is combined with either one of the character images recognized by the user, and the size of the table is changed so that the combined image information falls within the block. Edit means other than table (1547b)
Combines the character image information of the translated word of the translation means (1546) in the portion other than the table with one of the document image in the portion other than the table and the character image recognized by the character recognition means (1545). After that, in the output image creating means (1547c), the table portion whose size is changed by the table editing means (1547a) is other than the table editing means (1547b).
Determines whether it can be embedded in a part other than the combined table. If it can be embedded, the image information in which the table part is embedded in the part other than the table is written in the output image memory (402). The image information of the part is separately written in the output image memory (402), and the character image information is output by the output means (200).
【0012】従って、可能な限りオリジナル原稿のイメ
ージを残し、それが不可能の場合、すなわち翻訳結果を
1枚の記録紙に出力できない場合には、表とそれ以外を
別々に出力するので、特に情報量を減らすことはない。Therefore, when the image of the original document is left as much as possible and it is impossible, that is, when the translation result cannot be output on one sheet of recording paper, the table and the others are output separately. It does not reduce the amount of information.
【0013】また、本発明の好ましい実施態様によれ
ば、指定領域検出手段(1541a)が検出したマーカ
ーで指定された原稿画像の領域の、内側と外側を、指定
領域分離手段(1541b)が分離し、表検出手段は、
分離された領域の内側を表部分として検出するので、オ
ペレータはマーカーで表部分を囲むようにマークするこ
とで容易に表部分と表以外部分が認識される。本発明の
他の目的および特徴は、図面を参照した以下の実施例の
説明より明らかになろう。Further, according to a preferred embodiment of the present invention, the designated area separating means (1541b) separates the inside and the outside of the area of the original image designated by the marker detected by the designated area detecting means (1541a). However, the table detection means
Since the inside of the separated area is detected as the front portion, the operator marks the front portion with the marker so that the front portion and the portion other than the front portion can be easily recognized. Other objects and features of the present invention will become apparent from the following description of embodiments with reference to the drawings.
【0014】[0014]
【実施例】図1に、本発明の一実施例である翻訳機能を
有するデジタル複写機の機構部の概要を示す。機構部
は、主に画像読取部(スキャナ)100および画像記録
部(レーザプリンタ)200で構成されている。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS FIG. 1 shows an outline of a mechanical portion of a digital copying machine having a translation function which is an embodiment of the present invention. The mechanical unit mainly includes an image reading unit (scanner) 100 and an image recording unit (laser printer) 200.
【0015】スキャナ100の、原稿(図示せず)を載
置するためのコンタクトガラス1は、光源2a,2bに
よって照明され、読取原稿からの反射光(原稿像)はミ
ラー3,4,5,6,7,およびレンズ8を介してCC
Dイメージセンサ9の受光面に結像される。光源2(2
a,2b)およびミラー3は、コンタクトガラス1の下
面をコンタクトガラス1と平行に副走査方向(図1にお
いて左右方向)に移動する走行体10に搭載され、ミラ
ー4,5はその走行体10に連動して1/2の速度で副
走査方向に移動する走行体11に搭載されている。主走
査方向は、CCDイメージセンサ9の固体走査によって
行われ、原稿画像はCCDイメージセンサ9によって読
み取られ、前述のような光学系が移動することで原稿全
面が走査されるようになっている。なお、図中39は、
原稿を押圧するための圧板である。The contact glass 1 of the scanner 100 on which a document (not shown) is placed is illuminated by the light sources 2a and 2b, and the reflected light (document image) from the read document is mirrors 3, 4, 5 and. CC through 6, 7 and lens 8
An image is formed on the light receiving surface of the D image sensor 9. Light source 2 (2
a, 2b) and the mirror 3 are mounted on a traveling body 10 that moves the lower surface of the contact glass 1 in parallel with the contact glass 1 in the sub-scanning direction (left-right direction in FIG. 1), and the mirrors 4 and 5 are mounted on the traveling body 10. It is mounted on the traveling body 11 that moves in the sub-scanning direction at a speed of 1/2 in conjunction with. The main scanning direction is performed by solid-state scanning of the CCD image sensor 9, the original image is read by the CCD image sensor 9, and the entire surface of the original is scanned by moving the optical system as described above. In the figure, 39 is
A pressure plate for pressing the document.
【0016】レーザプリンタ200は、レーザ書込み
系、画像再生系ならびに給紙系により構成される。レー
ザ書込み系は、レーザ出力ユニット21、結像レンズ2
2ならびにミラー23を備えている。レーザ出力ユニッ
ト21の内部には、レーザ光源であるレーザダイオード
及び電気モータによって高速で定速回転する多角形ミラ
ー(ポリゴンミラー)が設けられている。レーザ書込み
系から出力されるレーザ光が、画像再生系の感光体ドラ
ム24に照射される。感光体ドラム24の周囲には、帯
電チャーシャ25、イレーサ26、現像ユニット27、
転写チャージャ28、分離チャージャ29、分離爪3
0、クリーニングユニット31などが備わっている。な
お、感光体ドラム24の一端近傍でレーザビームが照射
される位置に主走査同期信号(MSYNC)を発生する
ビームセンサ(図示せず)が配置されている。The laser printer 200 comprises a laser writing system, an image reproducing system and a paper feeding system. The laser writing system includes a laser output unit 21 and an imaging lens 2
2 and a mirror 23. Inside the laser output unit 21, there is provided a laser diode, which is a laser light source, and a polygon mirror (polygon mirror) that rotates at a high speed and a constant speed by an electric motor. The laser light output from the laser writing system is applied to the photosensitive drum 24 of the image reproducing system. Around the photosensitive drum 24, a charging charger 25, an eraser 26, a developing unit 27,
Transfer charger 28, separation charger 29, separation claw 3
0, a cleaning unit 31, and the like. A beam sensor (not shown) that generates a main scanning synchronization signal (MSSYNC) is arranged near the one end of the photosensitive drum 24 at a position where the laser beam is emitted.
【0017】このレーザプリンタ200における画像再
生プロセスを簡単に説明する。感光体ドラム24の周面
は、帯電チャージャ25によって一様に高電位に帯電さ
れる。その周面にレーザ光が照射されると、照射された
部分は電位が下がる。レーザ光は記録再生の黒/白に応
じてオン/オフ制御されるので、レーザ光の照射によっ
て、感光体ドラム24の周面に記録画像に対応する電位
分布、すなわち静電潜像が形成される。静電潜像が形成
された部分が現像ユニット27を通ると、その電位の高
低に応じてトナーが付着し、静電潜像が可視化したトナ
ー像となる。トナー像が形成された部分に、所定のタイ
ミングで記録シート32がカセットから送り込まれ、ト
ナー像に重なる。このトナー像は転写チャージャ28に
よって記録シート32に転写し、その後分離チャージャ
29ならびに分離爪30によって、感光体ドラム24か
ら分離される。分離された記録シート32は、搬送ベル
ト34によって搬送され、ヒータを内蔵した定着ローラ
35によって加熱着された後、排紙トレイ36に排紙さ
れる。The image reproducing process in the laser printer 200 will be briefly described. The peripheral surface of the photosensitive drum 24 is uniformly charged to a high potential by the charging charger 25. When the peripheral surface is irradiated with laser light, the potential of the irradiated portion is lowered. Since the laser light is controlled to be turned on / off in accordance with black / white for recording / reproduction, the potential distribution corresponding to the recorded image, that is, an electrostatic latent image is formed on the peripheral surface of the photosensitive drum 24 by the irradiation of the laser light. It When the portion on which the electrostatic latent image is formed passes through the developing unit 27, toner adheres according to the level of the potential, and the electrostatic latent image becomes a visualized toner image. The recording sheet 32 is fed from the cassette to the portion where the toner image is formed at a predetermined timing and overlaps the toner image. This toner image is transferred to the recording sheet 32 by the transfer charger 28, and then separated from the photosensitive drum 24 by the separation charger 29 and the separation claw 30. The separated recording sheet 32 is conveyed by a conveyor belt 34, heated and fixed by a fixing roller 35 having a built-in heater, and then ejected to an ejection tray 36.
【0018】本実施例では、レーザプリンタ200は給
紙系を2系統有している。一方の給紙系は、上段給紙カ
セット33aおよび手差し給紙台33cが備わってお
り、上段給紙カセット33aまたは手差し給紙台33c
にセットされた記録シート32aは、給紙ローラ37a
によって給紙される。もう一方の給紙系には下段給紙カ
セット33bが備わり、下段給紙カセット33b内の記
録シート32bは、給紙ローラ37bによって給紙され
る。そしていずれかの給紙ローラから給紙された記録シ
ート32は、レジストローラ38に当接した状態で一旦
停止し、記録プロセスの進行に同期したタイミングで感
光体ドラム24に送り込まれる。In this embodiment, the laser printer 200 has two paper feeding systems. One paper feed system is provided with an upper paper feed cassette 33a and a manual paper feed tray 33c. The upper paper feed cassette 33a or the manual paper feed tray 33c is provided.
The recording sheet 32a set in the
Fed by. The other sheet feeding system is provided with a lower sheet feeding cassette 33b, and the recording sheet 32b in the lower sheet feeding cassette 33b is fed by a sheet feeding roller 37b. Then, the recording sheet 32 fed from any one of the sheet feeding rollers is temporarily stopped while being in contact with the registration roller 38, and is fed to the photosensitive drum 24 at a timing synchronized with the progress of the recording process.
【0019】図2に、図1に示す複写機の電装部の概要
を示す。電装部は、主に原稿を読み取って画像データ信
号を出力する画像読取部100,画像データ信号を加工
する画像処理部150,画像データ信号に基づいて記録
を行う画像記録部200,メモリ回路400,操作ボー
ド500およびこれらのユニット等を制御する制御部3
00により構成されている。FIG. 2 shows an outline of the electrical equipment section of the copying machine shown in FIG. The electrical component section mainly reads an original and outputs an image data signal, an image reading section 100, an image processing section 150 that processes the image data signal, an image recording section 200 that performs recording based on the image data signal, a memory circuit 400, A control unit 3 for controlling the operation board 500 and these units, etc.
It is composed of 00.
【0020】画像読取部100において、CCDイメー
ジセンサ9により読み取られた画像信号は、増幅器10
1である決められた電圧振幅に増幅され、A/D変換回
路102によりデジタルデータに変換され、シェーディ
ング補正回路103に入力される。シェーディング補正
回路103は、光源2a,2bの照度むら、CCDイメ
ージセンサ9内部の受光素子の感度むらおよび暗電流に
対する補正等を施す回路である。また、画像読取部10
0は、キャリッジ駆動モータMおよびモータMの回転制
御を行うモータ制御回路104を有する。In the image reading section 100, the image signal read by the CCD image sensor 9 is output to the amplifier 10
It is amplified to a predetermined voltage amplitude of 1, converted into digital data by the A / D conversion circuit 102, and input to the shading correction circuit 103. The shading correction circuit 103 is a circuit for performing correction for uneven illuminance of the light sources 2a and 2b, uneven sensitivity of a light receiving element inside the CCD image sensor 9 and dark current. In addition, the image reading unit 10
Reference numeral 0 has a carriage drive motor M and a motor control circuit 104 for controlling the rotation of the motor M.
【0021】シェーディング補正回路103から出力さ
れた画像データ信号は、画像処理部150の空間フィル
タ回路151に入力される。空間フィルタ回路151で
は、文字や線字の解像力をあげるMTF補正,写真等の
ノイズを除去する平滑化処理等を行う。The image data signal output from the shading correction circuit 103 is input to the spatial filter circuit 151 of the image processing section 150. The spatial filter circuit 151 performs MTF correction for increasing the resolution of characters and line characters, smoothing processing for removing noise such as photographs, and the like.
【0022】空間フィルタ回路151から出力された画
像データ信号は、出力変調回路152に入力され、ここ
でプリンタの特性を考慮した補正を考慮した中間調表現
処理および画像記録部40で作る書き込み信号に対応す
るコードデータに変換し、これを出力回路153から画
像記録部200へ出力する。なお、編集回路154はコ
ードデータに種々の加工処理や編集処理を施して出力さ
せる回路である。The image data signal output from the spatial filter circuit 151 is input to the output modulation circuit 152, where it is converted into a halftone expression process in consideration of the correction considering the characteristics of the printer and a write signal created in the image recording unit 40. The corresponding code data is converted and output from the output circuit 153 to the image recording unit 200. The editing circuit 154 is a circuit that performs various types of processing and editing on the code data and outputs the code data.
【0023】画像記録部200において、LDドライブ
回路201は、温度等によるレーザ光の出力変動を補正
しながら、画像処理部150から出力された画像データ
信号に応じてLD202を付勢し、変調されたレーザ光
をLD202に出射させる。制御部300は、プログラ
ムに従って様々な制御を行うCPU301,制御プログ
ラムが格納されているROM302,制御プログラムが
一時的に使用するRAM303およびI/Oポート30
4等を備えるマイクロコンピュータであって、この複写
機全体の制御を行う。In the image recording unit 200, the LD drive circuit 201 energizes and modulates the LD 202 in accordance with the image data signal output from the image processing unit 150, while correcting the output fluctuation of the laser light due to temperature or the like. The emitted laser light is emitted to the LD 202. The control unit 300 includes a CPU 301 that performs various controls according to a program, a ROM 302 that stores the control program, a RAM 303 that is temporarily used by the control program, and an I / O port 30.
A microcomputer including 4 and the like controls the entire copying machine.
【0024】メモリ回路400は、読み取った画像を一
旦格納するページメモリ401,出力画像を格納する出
力画像メモリ402,翻訳に必要な辞書等が格納されて
いる辞書メモリ403から構成される。The memory circuit 400 is composed of a page memory 401 for temporarily storing the read image, an output image memory 402 for storing the output image, and a dictionary memory 403 for storing a dictionary necessary for translation.
【0025】図3に、図2の編集回路154の構成を示
す。符号1541は、原稿画像から表部分を切り取る表
部分判断切り取り回路であり、この回路1541は表部
分を区別するためにマーカー処理したマーカー部分を検
知するマーク検出回路1541a,検知されたマーカー
部分の内側(表画像)をページメモリ401の原稿画像
から分離する表部分分離回路1541b,得られた表画
像から罫線を認識し罫線情報として蓄える罫線検出回路
1541c,および表部分分離回路1541bで得られ
た表画像から表中の文字部分を切り出すブロック切り出
し回路1541dを有する。また、符号1542は行毎
の文字画像の切り出しを行う行切出し回路,1543は
行毎に切り出した文字画像から1文字づつの切り出しを
行う1文字毎の切出し回路,符号1544は切り出され
た文字画像から単語を抽出する単語抽出回路,符号15
45は単語単位で文字を認識する文字認識回路,符号1
546は認識した文字を翻訳する翻訳回路,符号154
7は翻訳した単語の文字画像などを出力画像メモリ40
2に書き込む出力画像作成回路である。なお、出力画像
作成回路1547は翻訳結果を加えるために表の大きさ
を変化させ表の出力画像を編集する表編集回路1547
a,翻訳結果を加えて表以外の部分の出力画像を編集す
る表以外編集回路1547b,および表編集結果と表以
外部分の編集結果の大きさによって表が組み込めるかど
うかを判断し、組み込めれば表以外部分に表を組み込ん
だ出力画像を作成し、組み込めなければ別々の出力画像
とする表組み込み回路1547cを有する。FIG. 3 shows the configuration of the editing circuit 154 shown in FIG. Reference numeral 1541 is a front portion determination cutout circuit for cutting out the front portion from the original image. This circuit 1541 is a mark detection circuit 1541a for detecting a marker portion subjected to marker processing for distinguishing the front portion, inside the detected marker portion. A table part separation circuit 1541b for separating the (table image) from the document image of the page memory 401, a ruled line detection circuit 1541c for recognizing ruled lines from the obtained table image and storing them as ruled line information, and a table obtained by the table part separation circuit 1541b. It has a block cutout circuit 1541d for cutting out the character portion in the table from the image. Further, reference numeral 1542 is a line cutout circuit for cutting out a character image for each line, 1543 is a cutout circuit for each character for cutting out one character from the character image cut out for each line, and reference numeral 1544 is a cutout character image. A word extraction circuit for extracting a word from the reference numeral 15
Reference numeral 45 is a character recognition circuit for recognizing characters in word units, reference numeral 1
Reference numeral 546 is a translation circuit for translating a recognized character, reference numeral 154.
7 is an output image memory 40 for outputting character images of translated words
2 is an output image creating circuit to be written in 2. The output image creation circuit 1547 changes the size of the table to add the translation result and edits the output image of the table.
a, a non-table editing circuit 1547b for editing the output image of the part other than the table by adding the translation result, and whether or not the table can be built based on the size of the table editing result and the editing result of the part other than the table. It has a table embedding circuit 1547c that creates an output image in which a table is incorporated in a portion other than the table and creates a separate output image if it cannot be incorporated.
【0026】図4に、CPU301の翻訳を行う場合の
処理動作を示し、図5にそのサブルーチンを示す。FIG. 4 shows the processing operation of the CPU 301 for translation, and FIG. 5 shows its subroutine.
【0027】カラーフェルトペンなどで直接マークがつ
けられた原稿がコンタクトガラス1にセットされオペレ
ータにより翻訳指示があると、スキャナ部100で原稿
を光学的に読み取り(ステップ1:以下カッコ内ではス
テップ又はサブルーチンという語を省略する)、読み取
った原稿画像をページメモリ401に格納する(1)。
そして、格納した原稿画像に対して表部分の切り取り処
理を行う(2)。When a manuscript directly marked with a color felt pen or the like is set on the contact glass 1 and a translation instruction is given by the operator, the manuscript is optically read by the scanner section 100 (step 1: hereinafter in parentheses, step or The word "subroutine" is omitted), and the read original image is stored in the page memory 401 (1).
Then, the front part is cut off from the stored original image (2).
【0028】図5を参照する。表部分切り取り処理
(2)は、まず、マーカーでマークされた表部分を認識
する(21)。この表部分の認識は、本出願人が特開平
1−204192号公報として提案したと同様に、マー
ク検出回路1541aを原稿の主走査方向のサイズを検
知する回路とマークエリアを検知する回路で構成する。
すなわち、図6の(a)に示す例の、原稿画像から原稿
サイズを検知し、図6の(b)に示すように、その幅に
わたって各主走査毎に濃度を調べて地肌濃度を検出し、
黒レベル(最高濃度)との間を階調数(例えば64階
調)に応じて分割し、あるレベル以上(例えば62)の
ものをマークとして検出する。Referring to FIG. In the front portion cutting process (2), first, the front portion marked with a marker is recognized (21). In order to recognize the front portion, the mark detection circuit 1541a is composed of a circuit for detecting the size of the document in the main scanning direction and a circuit for detecting the mark area, as proposed by the present applicant in Japanese Patent Laid-Open No. 1-204192. To do.
That is, in the example shown in FIG. 6A, the original size is detected from the original image, and as shown in FIG. 6B, the density is checked for each main scan to detect the background density. ,
The black level (maximum density) is divided according to the number of gradations (for example, 64 gradations), and a certain level or higher (for example, 62) is detected as a mark.
【0029】そして、図7に示すように、各主走査線上
で認識されたマーカーとマーカーの間に、はさまれた部
分を表領域の一部として認識し、連続した走査線でその
領域の一部分のつながりを調べ、領域として決定する。
つまり、連続した主走査線上に存在する領域部分同士の
副走査線方向の座標区間に重なりがあれば、それら2つ
の部分領域は同じ領域であると判断する。従って、図7
の例では領域1と領域2に分けられ、これらは互に異な
ることを示す。Then, as shown in FIG. 7, the portion sandwiched between the markers recognized on each main scanning line is recognized as a part of the table area, and the continuous scanning lines detect the area between the markers. Examine the connection of a part and decide as the area.
That is, if the coordinate sections in the sub-scanning line direction of the area portions existing on the continuous main scanning line overlap, it is determined that these two partial areas are the same area. Therefore, FIG.
In the above example, it is divided into a region 1 and a region 2, which indicate that they are different from each other.
【0030】なお、この領域認識については一旦読み込
んだ原稿画像をCRT等のディスプレイ装置に表示し、
その表示されたディスプレイ上で、カーソル,ライトペ
ン,マウスなどを用いて領域指定のマークをつける方法
や、複写機付属のデジタイザー上に原稿をおき、タッチ
ペンによって領域指定のマークをつける方法を用いても
よい。For this area recognition, the original image once read is displayed on a display device such as a CRT,
Using the cursor, light pen, mouse, etc., on the displayed display, you can make a mark for specifying the area, or put a document on the digitizer attached to the copier and use the touch pen to make a mark for specifying the area. Good.
【0031】次に、認識された表部分とそれ以外の部分
の分離を行う(22)。この分離は、表部分の認識処理
(21)の際にリアルタイムで認識した部分領域をペー
ジメモリ401内に設けられた表画像を記憶する表画像
記憶部分に書き込んでいく。その際、一つ前の走査線上
の部分領域とのつながりがない部分領域、すなわち、別
の領域内にあると判断された場合は、別の表画像記憶部
分にその部分領域を書き込み、表カウントを1つ増や
す。そして、書き込みと同時に原稿画像内でマーク領域
内と判断した部分領域を濃度0にクリアする。これによ
り、図8の(a)に示す原稿画像は、分離後は図8の
(b)に示すように部分領域は領域毎に表画像記憶部分
に書き込まれ、部分領域以外は、図8の(c)に示すよ
うに部分領域が除去された形で記憶される。Next, the recognized table portion and the other portion are separated (22). In this separation, the partial area recognized in real time in the recognition processing (21) of the front portion is written into the front image storage portion for storing the front image provided in the page memory 401. At that time, if it is determined that the partial area is not connected to the partial area on the previous scanning line, that is, it is in another area, the partial area is written to another table image storage area and the table count is performed. Increase one. Simultaneously with writing, the partial area determined to be within the mark area in the original image is cleared to have the density of zero. As a result, in the original image shown in FIG. 8A, after separation, partial areas are written in the front image storage area for each area as shown in FIG. As shown in (c), the partial area is stored in a removed form.
【0032】なお、この表部分とそれ以外の部分の分離
は、その境界をメモリ内に記憶し、その後の処理を領域
内と領域外で別に行うようにしてもよい。The boundary between the front portion and the other portion may be stored in the memory, and the subsequent processing may be performed separately inside and outside the area.
【0033】次に、表部分として分離した部分の罫線を
認識して、そのパターンを記録する(23)。そして、
罫線で囲まれた文字部分を表の1つ1つの欄内の領域
(ブロック)毎に分離する(24)。このブロック毎の
分離は、特開平1−119885号公報として知られて
いる様に、まず、表部分の縦横の罫線を抽出し、抽出し
た罫線によって囲まれたブロック領域を算出し、そのブ
ロック領域を表画像から切り出すことにより行う。な
お、図9に示すように、罫線抽出時に得られた罫線パタ
ーン情報は出力編集が終了するまでページメモリ401
内に格納しておく。再度、図4のメインフローに戻る。
表部分切り取り処理(2)が終了すると、分離した表中
文字部分のブロックと、表以外の部分について行毎の原
稿文字の切り出し処理を行う(3)。そして、切り出さ
れた行に対して単語毎の切り出しを行う単語抽出処理を
行う(4)。単語毎の切り出しは、文字毎の切り出しに
より得られる文字の間隔に基づいて実施する。次に、抽
出した単語を単語単位で認識し(5)、それぞれの単語
に相当する日本語を翻訳辞書から検索し翻訳を行う
(6)。次に、ページメモリ401に記憶した表の罫線
パターン情報をもとに原稿画像(これにかえて認識文字
画像としてもよい)と翻訳結果が表中に納まるように表
を編集し結果を出力画像メモリ402に書き込む
(7)。Next, the ruled line of the part separated as the front part is recognized and the pattern is recorded (23). And
The character portion surrounded by the ruled lines is separated for each area (block) in each column of the table (24). As for this block-by-block separation, as known from Japanese Patent Laid-Open No. 1-119885, first, vertical and horizontal ruled lines of a table portion are extracted, a block area surrounded by the extracted ruled lines is calculated, and the block area is calculated. Is cut out from the front image. As shown in FIG. 9, the ruled line pattern information obtained at the time of ruled line extraction is stored in the page memory 401 until the output editing is completed.
Store it inside. Again, it returns to the main flow of FIG.
When the front part cutting process (2) is completed, the original character cutting process for each line is performed for the separated block of the character part in the table and the part other than the table (3). Then, a word extraction process is performed to cut out each word from the cut line (4). The cutout for each word is performed based on the character spacing obtained by the cutout for each character. Next, the extracted words are recognized word by word (5), and Japanese corresponding to each word is searched from the translation dictionary and translated (6). Next, based on the ruled line pattern information of the table stored in the page memory 401, the table is edited so that the original image (which may be replaced by the recognized character image) and the translation result are included in the table, and the result is output as an image. Write to the memory 402 (7).
【0034】表編集について具体的に説明する。表部分
の画像を表形式で出力しようとする場合、表の中に含ま
れる情報量が増えるので表の罫線を書き換える必要がで
てくる。すなわち、表中のブロック毎に文字認識,翻訳
されているので、それらのブロック出力を記憶しておい
た罫線パターンの対応する位置に埋め込む形で編集を行
う。The table editing will be specifically described. When an image of the front portion is to be output in a table format, the amount of information contained in the table increases, so that it becomes necessary to rewrite the ruled lines of the table. That is, since the characters are recognized and translated for each block in the table, the edits are performed by embedding the block outputs in the corresponding positions of the stored ruled line pattern.
【0035】例えば、図10の(a)に示し原稿画像中
の表において、原稿画像文字と翻訳結果を上下に並べて
出力する場合を考える。なお、図10の(b)に、図1
0の(a)に示す表の罫線パターン情報を示す。原稿画
像文字に翻訳結果が加えられるため1行分の原文が2行
分の出力になる。そのため、図11の(a)に示すよう
に、まず、格納されている罫線パターンの縦方向(列方
向)の間隔を2倍し、次に、左端に位置するブロック
(A),(B),(C),(D)から出力画像メモリ4
02に原稿画像と翻訳結果の出力を行い、それらの縦に
並ぶブロック全てが書き終った時点で、それらのブロッ
クの中で一番横幅の大きいもの(ブロック(D))に合
わせて、右隣のブロックとの境界罫線を引く。但し、こ
の例の場合のように格納されている罫線パターンでそれ
らのブロックの横方向の長さが異なる場合は、横方向の
長さが一番短いブロック集団(ブロック(A),
(B),(C))のうち幅の一番大きいもの(ブロック
(B))に合わせてそれらの集団の横に境界罫線(第1
境界罫線)を引く。次に、図11の(b)に示すよう
に、引かれた境界に沿って縦に並ぶブロック(E),
(F),(G)の書き込みを行い、それが終了した時点
で罫線パターンを参照し、まだ引かれていない一番右側
の境界罫線(第2境界罫線)を引くことを繰り返す。次
に、図11の(c)に示すように、残りのブロック
(H),(I),(J),(K)を含め、全てのブロッ
クについて書き込みが終った時点で表の右枠の罫線を引
き、横方向の罫線を引く。For example, let us consider a case where the original image characters and the translation result are arranged side by side in the table of the original image shown in FIG. It is to be noted that FIG.
0 shows the ruled line pattern information of the table shown in FIG. Since the translation result is added to the manuscript image characters, the original sentence for one line is output for two lines. Therefore, as shown in (a) of FIG. 11, first, the interval of the stored ruled line pattern in the vertical direction (column direction) is doubled, and then the blocks (A) and (B) located at the left end. , (C), (D) output image memory 4
The original image and the translation result are output to 02, and when all of the vertically arranged blocks have been written, the right side of the block is aligned with the one with the largest width (block (D)). Draw a border line with the block. However, if the horizontal lengths of the blocks differ according to the stored ruled line pattern as in this example, the block group having the shortest horizontal length (block (A),
(B) and (C)), the boundary ruled line (first
Draw a border line). Next, as shown in FIG. 11B, the blocks (E), which are vertically arranged along the drawn boundary,
The writing of (F) and (G) is performed, the ruled line pattern is referred to when the writing is completed, and the rightmost boundary ruled line (second boundary ruled line) which has not been drawn is repeatedly drawn. Next, as shown in (c) of FIG. 11, when writing is completed for all blocks including the remaining blocks (H), (I), (J), and (K), the right frame of the table Draw a ruled line and draw a horizontal ruled line.
【0036】この結果、最終的に得られた罫線の情報は
罫線パターン情報を更新することで蓄えられ、図10の
(b)に示したもとの罫線パターン情報は、図12に示
すような、罫線パターン情報に変更される。すなわち、
横罫線y座標の各間隔は2倍され、縦罫線x座標は翻訳
結果が原稿画像からはみ出す分、大きくなる。As a result, the finally obtained ruled line information is stored by updating the ruled line pattern information, and the original ruled line pattern information shown in FIG. 10B is the ruled line information as shown in FIG. The pattern information is changed. That is,
Each interval of the horizontal ruled line y coordinate is doubled, and the vertical ruled line x coordinate becomes larger as the translation result protrudes from the original image.
【0037】次に、表以外の部分は、翻訳結果をもとの
文字画像とともに編集し結果を出力画像メモリ402に
書き込む(8)。その後、表編集結果と表以外の編集結
果をその大きさを判断して組み込む出力割付を行う
(9)。Next, in the portions other than the table, the translation result is edited together with the original character image and the result is written in the output image memory 402 (8). After that, output allocation is performed by incorporating the table edit result and the edit result other than the table by judging the size thereof (9).
【0038】出力割付について具体的に説明する。図1
2に示す出力表の罫線パターン情報から最も大きなx座
標(12.3)と最も小さなx座標(5.2)の差(表
の横幅)を算出し、その算出値(7.1=12.3−
5.2)と、図13に示す、オリジナル文字原稿の表部
分として切り出した画像部分の切り出し横幅を比較す
る。そして、算出値が切り出し横幅と等しい又はそれよ
り小さい場合は、切り出し境界線の内に表部分が納まる
ので、図14に示すように、表を表以外の画像に組み込
む編集を行って出力する。一方、算出値が切り出し横幅
よりも大きい場合は、表が表以外の画像に組み込めない
ので、図15に示すように、表と表以外の部分は別に出
力する。また、図12に示す出力表の罫線パターン情報
から得られる最も大きなy座標(25.2)と最も小さ
なy座標(9.6)の差(表の縦幅)の算出値(15.
6=25.2−9.6)が、表を切り出した部分の横に
隣接する表以外の部分の編集結果の縦の長さ(図14に
示す表切り出し部隣接縦幅)よりも大きい場合や表を切
り出した部分が紙の終りにかかってしまった場合も、表
が表以外の画像に組み込めないので、図15に示すよう
に、表と表以外の部分は別に出力する。The output allocation will be specifically described. Figure 1
The difference (horizontal width of the table) between the largest x-coordinate (12.3) and the smallest x-coordinate (5.2) is calculated from the ruled line pattern information of the output table shown in FIG. 2, and the calculated value (7.1 = 12. 3-
5.2) is compared with the cut-out lateral width of the image portion cut out as the front portion of the original character document shown in FIG. If the calculated value is equal to or smaller than the cutout width, the table portion fits within the cutout boundary line, so that the table is edited by incorporating it into an image other than the table as shown in FIG. On the other hand, if the calculated value is larger than the cutout width, the table cannot be embedded in an image other than the table, and therefore the table and the portion other than the table are separately output as shown in FIG. Further, a calculated value (15.50) of a difference (vertical width of the table) between the largest y coordinate (25.2) and the smallest y coordinate (9.6) obtained from the ruled line pattern information of the output table shown in FIG.
6 = 25.2-9.6) is larger than the vertical length (adjacent vertical width of the table cutout portion shown in FIG. 14) of the edited result of the portion other than the table adjacent to the side of the portion where the table is cut out. Even when the cut-out portion of the table or the cut-out portion is caught at the end of the paper, the table cannot be embedded in the image other than the table. Therefore, as shown in FIG. 15, the table and the portion other than the table are separately output.
【0039】次に、出力画像メモリ402内に作成され
た出力画像を出力し(10)、プリンタ200で記録紙
に転写して排出する(11)。Next, the output image created in the output image memory 402 is output (10), transferred to the recording paper by the printer 200 and discharged (11).
【0040】以上により、図16に示すように、マーク
の施された入力原稿は、表が表以外の画像に組み込むこ
とができる場合、1枚の記録紙に表および表以外を含み
翻訳の施された出力画像に変更される。As described above, as shown in FIG. 16, when the table can be incorporated in an image other than the table, the marked input document is translated on one recording sheet including the table and the table. The output image is changed.
【0041】[0041]
【発明の効果】以上説明したように本願の発明によれ
ば、文字の切り出しが表部分と表以外部分で別々に行わ
れるので、例えば表部分と表以外部分の行,文字間隔が
異なる場合でも文字の切り出しは確実に行われ、その
後、引き続いて行われる文字認識および翻訳が、表に影
響されることなく安定して行われる。As described above, according to the invention of the present application, the characters are cut out separately in the table portion and the portion other than the table. Therefore, for example, even when the line and the character spacing of the table portion and the portion other than the table are different. The characters are reliably cut out, and the subsequent character recognition and translation are performed stably without being affected by the table.
【0042】また、可能な限りオリジナル原稿のイメー
ジは残され、それが不可能の場合、すなわち翻訳結果を
1枚の記録紙に出力できない場合には、表とそれ以外を
別々に出力するので、特に情報量を減らすことはない。Further, the image of the original document is left as much as possible, and when it is impossible, that is, when the translation result cannot be output on one recording sheet, the table and the others are output separately. There is no particular reduction in the amount of information.
【0043】更に、本発明の好ましい実施態様によれ
ば、オペレータはマーカーで表部分を囲むようにマーク
することで容易に表部分と表以外部分が認識される。Further, according to a preferred embodiment of the present invention, the operator marks the front portion with the marker so that the front portion and the portion other than the front portion can be easily recognized.
【図1】 本発明の一実施例の翻訳機能を有するデジタ
ル複写機の機構部の概要を示すブロック図である。FIG. 1 is a block diagram showing an outline of a mechanical unit of a digital copying machine having a translation function according to an embodiment of the present invention.
【図2】 図1に示すデジタル複写機の電装部の概要を
示すブロック図である。FIG. 2 is a block diagram showing an outline of an electric component section of the digital copying machine shown in FIG.
【図3】 図2に示す編集回路154の構成概要を示す
ブロック図である。3 is a block diagram showing a schematic configuration of an editing circuit 154 shown in FIG.
【図4】 図2に示すCPU301の処理動作の内容の
一部を示すフローチャートである。FIG. 4 is a flowchart showing a part of the content of the processing operation of CPU 301 shown in FIG.
【図5】 図4に示す表部分切り取り処理(2)の内容
を示すフローチャートである。FIG. 5 is a flowchart showing the contents of a front part cutting process (2) shown in FIG.
【図6】 表部分の認識を示し、(a)は、マークの施
された原稿画像を示す平面図であり、(b)は、濃度検
出を示すブロック図である。6A and 6B show recognition of a front portion, FIG. 6A is a plan view showing a marked original image, and FIG. 6B is a block diagram showing density detection.
【図7】 原稿画像の主走査線毎の表領域を示す平面図
である。FIG. 7 is a plan view showing a front area of a document image for each main scanning line.
【図8】 原稿画像から表画像を分離する様子を示し、
(a)は、領域指定され、メモリに読み込まれた原稿画
像を示す平面図,(b)は、(a)の領域指定された、
メモリ内の表画像を示す平面図,および(c)は、
(a)の原稿画像から表画像が分離されたメモリ内の画
像を示す平面図である。FIG. 8 shows how a front image is separated from a document image,
(A) is a plan view showing an original image read into a memory by specifying an area, (b) shows a specified area in (a),
The plan view showing the front image in the memory and (c) are
It is a top view which shows the image in memory which the front image was isolate | separated from the original image of (a).
【図9】 指定領域からの罫線の抽出およびこれにより
得られた罫線パターン情報を示すブロック図である。FIG. 9 is a block diagram showing extraction of ruled lines from a designated area and ruled line pattern information obtained thereby.
【図10】 (a)は、原稿画像中の表の一例を示す平
面図,(b)は、(a)の罫線パターン情報を示すブロ
ック図である。10A is a plan view showing an example of a table in a document image, and FIG. 10B is a block diagram showing ruled line pattern information in FIG. 10A.
【図11】 表編集を示し、(a)は、図10の(a)
に示す表を縦方向(列方向)に2倍して第1境界罫線を
引いた状態を示す平面図,(b)は、第2境界罫線を引
いた状態を示す平面図,および(c)は、右枠罫線およ
び横方向罫線を引いた状態を示す平面図である。FIG. 11 shows table editing, (a) of FIG.
2 is a plan view showing a state in which the table shown in FIG. 2 is doubled in the vertical direction (column direction) and a first boundary ruled line is drawn, (b) is a plan view showing a state in which a second boundary ruled line is drawn, and (c) [Fig. 6] is a plan view showing a state in which a right frame ruled line and a horizontal direction ruled line are drawn.
【図12】 表編集後の出力表の罫線パターン情報を示
すブロック図である。FIG. 12 is a block diagram showing ruled line pattern information of an output table after table editing.
【図13】 表の切り出し境界線および切り出し横幅を
示したオリジナル原稿画像を示す平面図である。FIG. 13 is a plan view showing an original document image showing a cutout boundary line and a cutout horizontal width of a table.
【図14】 図13に示す切り出し横幅が算出値以上の
場合の、出力画像を示す平面図である。FIG. 14 is a plan view showing an output image when the cutout width shown in FIG. 13 is equal to or larger than a calculated value.
【図15】 図13に示す切り出し横幅が算出値より小
さい場合の、出力画像を示す平面図である。FIG. 15 is a plan view showing an output image when the cutout width shown in FIG. 13 is smaller than the calculated value.
【図16】 表が表以外の画像に組み込むことができる
場合、マークの施された入力原稿が、1枚の記録紙に表
および表以外を含み翻訳の施された出力画像に変更され
ることを示す平面図である。FIG. 16: When a table can be incorporated in an image other than the table, the marked input manuscript is changed to a translated output image including the table and the table other than one sheet of recording paper. FIG.
100:画像読取部(画像読取手段) 150:画像処理部 154:編集回路 1541:表部分判
断切り取り回路 1541a:マーク検出回路(表検出手段,指定領域検
出手段) 1541b:表部分分離回路(表検出手段,指定領域分
離手段) 1541c:罫線検出回路(罫線検出手段) 1541d:ブロック切り出し回路(表部分文字切り出
し手段) 1542:行切出し回路(表部分文字切り出し手段,文
字切り出し手段) 1543:各行中の一文字毎の切り出し回路(表部分文
字切り出し手段,文字切り出し手段) 1544:単語抽出回路(単語領域検出手段) 1545:文字認識回路(文字認識手段) 1546:翻訳回路(翻訳手段) 1547:出力画像作成回路 1547a:表編集回路(表編集手段) 1547b:表以外編集回路(表以外編集手段) 1547c:表組み込み回路(出力画像作成手段) 200:画像記録部(出力手段) 300:制御部 301:CPU 302:ROM 303:RAM 304:I/Oポート 400:メモリ回路 401:ページメモリ(画像記憶手段) 402:出力画像メモリ(出力画像メモリ) 403:辞書メモリ 500:操作ボードReference numeral 100: image reading unit (image reading unit) 150: image processing unit 154: editing circuit 1541: front portion determination cutout circuit 1541a: mark detection circuit (front detection unit, designated area detection unit) 1541b: front portion separation circuit (front detection) 1541c: Ruled line detection circuit (ruled line detection means) 1541d: Block cutout circuit (front portion character cutout means) 1542: Line cutout circuit (front portion character cutout means, character cutout means) 1543: In each line Cutout circuit for each character (front part character cutout means, character cutout means) 1544: word extraction circuit (word area detection means) 1545: character recognition circuit (character recognition means) 1546: translation circuit (translation means) 1547: output image creation Circuit 1547a: Table editing circuit (table editing means) 1547b: Other than table Circuit (editing means other than table) 1547c: Table built-in circuit (output image creating means) 200: Image recording section (output means) 300: Control section 301: CPU 302: ROM 303: RAM 304: I / O port 400: Memory circuit 401: page memory (image storage means) 402: output image memory (output image memory) 403: dictionary memory 500: operation board
───────────────────────────────────────────────────── フロントページの続き (72)発明者 横 山 雅 人 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 田 中 智 憲 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 多 和 田 高 明 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 ─────────────────────────────────────────────────── --- Continuation of the front page (72) Inventor Masato Yokoyama 1-3-6 Nakamagome, Ota-ku, Tokyo Inside Ricoh Co., Ltd. (72) Inventor Tomonori Tanaka 1-3-3 Nakamagome, Ota-ku, Tokyo No. 6 in Ricoh Co., Ltd. (72) Inventor Takaaki Tada 1-3-6 Nakamagome, Ota-ku, Tokyo In Ricoh Co., Ltd.
Claims (2)
取手段が読み取った画像情報を記憶する画像記憶手段;
画像記憶手段に記憶した画像情報から表部分を検出する
表検出手段;表部分を示す情報から罫線を検出する罫線
検出手段;罫線検出手段が検出した罫線で囲まれるブロ
ック内の、ブロック毎の画像情報から文字単位の画像情
報を摘出する表部分文字切り出し手段;罫線検出手段が
検出した罫線で囲まれるブロック外の、画像情報から文
字単位の画像情報を摘出する文字切り出し手段;表部分
文字切り出し手段および文字切り出し手段が切り出した
画像情報の行方向間隔から単語単位で画像情報を摘出す
る単語領域検出手段;表部分文字切り出し手段および文
字切り出し手段が切り出した画像情報の文字を認識する
文字認識手段;単語領域検出手段が検出した単語単位
の、文字認識手段が認識した文字の並びでなる単語を翻
訳する翻訳手段;表部分における原稿画像および文字認
識手段が認識した文字画像のうちいずれか一方に、表部
分における翻訳手段の翻訳語の文字画像情報を合成し、
合成後の画像情報が前記ブロック内に入るように表の大
きさを変化させる表編集手段;表以外部分における原稿
画像および文字認識手段が認識した文字画像のうちいず
れか一方に、表以外部分における翻訳手段の翻訳語の文
字画像情報を合成する表以外編集手段;表編集手段が大
きさを変化させた表部分が、表以外編集手段が合成した
表以外部分に組み込めるか判定し、組み込める場合は、
表以外部分に表部分を組み込んだ画像情報を出力画像メ
モリに書き込み、組み込めない場合は、表以外部分の画
像情報と表部分の画像情報を別々に出力画像メモリに書
き込む出力画像作成手段;および、 出力画像メモリに記憶した画像情報を出力する出力手
段;を備える翻訳装置。1. An image reading unit for reading an original image; an image storage unit for storing image information read by the image reading unit;
Table detecting means for detecting a table portion from the image information stored in the image storing means; Ruled line detecting means for detecting a ruled line from information indicating the table portion; Image for each block in a block surrounded by the ruled lines detected by the ruled line detecting means Table portion character cutting means for extracting image information in character units from information; Character cutting means for extracting image information in character units from image information outside a block surrounded by ruled lines detected by the ruled line detection means; table portion character cutting means And a word area detecting means for extracting the image information in word units from the line direction interval of the image information cut out by the character cutting means; a character recognition means for recognizing a character of the image information cut out by the front part character cutting means and the character cutting means; A translation means for translating a word composed of a sequence of characters recognized by the character recognition means for each word detected by the word area detection means; In either one of the character image is an original image and the character recognition means recognized in the branching, synthesizes the character image information translated translation means in Table moiety,
Table editing means for changing the size of the table so that the combined image information is contained in the block; one of the document image in the portion other than the table and the character image recognized by the character recognition means in the portion other than the table Editing means other than the table for synthesizing the character image information of the translation word of the translating means: It is judged whether the table portion whose size has been changed by the table editing means can be incorporated into the portion other than the table synthesized by the editing means other than the table. ,
Output image creating means for writing the image information in which the front portion is incorporated in the portion other than the table to the output image memory and writing the image information of the portion other than the table and the image information of the front portion separately in the output image memory; and A translation device comprising: output means for outputting the image information stored in the output image memory.
原稿画像の領域を検出する指定領域検出手段;および、
指定領域検出手段が検出した領域の内側と外側を分離す
る指定領域分離手段;を有し、分離された領域の内側を
表部分とする、請求項1記載の翻訳装置。2. The specified area detecting means for detecting an area of an original image specified by a marker, the table detecting means;
The translation device according to claim 1, further comprising: designated area separating means for separating the inside and the outside of the area detected by the designated area detecting means, wherein the inside of the separated area is a front portion.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3215685A JPH0554075A (en) | 1991-08-28 | 1991-08-28 | Translation device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3215685A JPH0554075A (en) | 1991-08-28 | 1991-08-28 | Translation device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0554075A true JPH0554075A (en) | 1993-03-05 |
Family
ID=16676465
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3215685A Pending JPH0554075A (en) | 1991-08-28 | 1991-08-28 | Translation device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0554075A (en) |
-
1991
- 1991-08-28 JP JP3215685A patent/JPH0554075A/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5138465A (en) | Method and apparatus for highlighting nested information areas for selective editing | |
| US6163623A (en) | Method and apparatus for recognizing images of documents and storing different types of information in different files | |
| JP2001274969A (en) | Image processor | |
| US5960229A (en) | Image processing method and apparatus | |
| JP3622994B2 (en) | Bar code recording device | |
| JP3247723B2 (en) | Image relocation copier | |
| JPH0554075A (en) | Translation device | |
| JPH0554069A (en) | Digital translator | |
| JP3361673B2 (en) | Information reproducing apparatus and information reproducing method | |
| US5696843A (en) | Automatic image quality controlling apparatus for use in an electronic copier | |
| JP3255676B2 (en) | Digital copier | |
| JPH0554188A (en) | Picture processor | |
| JP3255675B2 (en) | Digital copier with image relocation function | |
| JP3629962B2 (en) | Image recognition device | |
| JP3489788B2 (en) | Original image processing device | |
| JP3629959B2 (en) | Image recognition device | |
| JP3244768B2 (en) | Copy machine with image direction designation function | |
| JPH08186672A (en) | Digital copier with scoring and question paper registration functions | |
| JP7779130B2 (en) | Image recognition device and image recognition method | |
| JPH0477965A (en) | digital copying machine | |
| JPH0562014A (en) | Character recognition device | |
| JP2009010690A (en) | Image reading apparatus and image forming apparatus | |
| JPH0546659A (en) | Digital translation / copying device | |
| JPH01144181A (en) | Optical character reader | |
| JPS6336668A (en) | Mark information read control device |