JPH06110996A - テキストイメージ及び書式イメージの併合による自動イメージ生成 - Google Patents

テキストイメージ及び書式イメージの併合による自動イメージ生成

Info

Publication number
JPH06110996A
JPH06110996A JP5160860A JP16086093A JPH06110996A JP H06110996 A JPH06110996 A JP H06110996A JP 5160860 A JP5160860 A JP 5160860A JP 16086093 A JP16086093 A JP 16086093A JP H06110996 A JPH06110996 A JP H06110996A
Authority
JP
Japan
Prior art keywords
image
text
field
data
format
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5160860A
Other languages
English (en)
Inventor
George G Robertson
ジョージ・ジー・ロバートソン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xerox Corp
Original Assignee
Xerox Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xerox Corp filed Critical Xerox Corp
Publication of JPH06110996A publication Critical patent/JPH06110996A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T11/00Two-dimensional [2D] image generation
    • G06T11/60Creating or editing images; Combining images with text

Landscapes

  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Processing Or Creating Images (AREA)
  • Record Information Processing For Printing (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】書式及びテキストの入力イメージを利用して、
フィールドにテキストを納めた書式を示す出力イメージ
を自動的に得る。 【構成】イメージ入力回路要素から、第1のフィールド
(12)を含む書式を示す第1のイメージセット(1
0)、及びテキストを示す第2のイメージセットを定義
した入力イメージデータ(20)を受信し、第1のイメ
ージセットから書式イメージデータ、第2のイメージセ
ットからテキストイメージデータ、及び第1のフィール
ドまわりの境界位置を示す位置決めデータを自動的に
得、書式イメージデータ、テキストイメージデータ、及
び位置決めデータを利用することにより、自動的に、テ
キスト及び書式を示し、かつ、第1のフィールドの境界
内に配置されるテキストを示す第3のイメージセット
(30)を定義した出力イメージデータを得て、出力イ
メージデータをイメージ出力回路要素に送る。

Description

【発明の詳細な説明】
【0001】本発明は、テキストを含むイメージを自動
的に生成する技法に関するものである。
【0002】スガヌマらに対する米国特許第4,54
2,378号には、リストから受領書または証明書とい
った個々の書類を作成し、あるいは、逆に、個々の書類
からリストを作成するための文書処理技法の記載があ
る。
【0003】スガヌマらの図1及び2に関連して例示さ
れ、解説されているように、まず、プラテンの所定の位
置に証明書の書式を置いて、走査が行われる。信号は、
2進デジタル化されて、メモリに記憶される。次に、証
明書を必要とする、受領書を含むページを本から選択し
て、プラテンの所定の位置に置き、操作パネルで、受領
書の位置番号を指定し、受領書を走査して、証明書の書
式の場合と同様に、信号はメモリに記憶される。制御セ
クションは、メモリから証明書の書式に関するデータを
読み取り、本からのデータから必要な追加部分を読み出
して、電子的にそれを証明書の書式に関するデータに重
ねている間に、その部分を転記し、最終的な捺印証明書
のためのデータを作成する。捺印証明書のためのデータ
は、次に、プリンタに転送され、操作パネルで出力され
るもとの受領書の位置を指定して、プリントされる。受
領書の面積及びそれを転写すべき書式の面積が異なる場
合には、拡大または縮小操作によって、アライメントを
とることが可能である。
【0004】スガヌマらの図3及び4に関連して例示さ
れ、解説されているように、切り抜かれる(転記され
る)個々の書類のイメージデータ部分は、あらかじめ、
座標によって指定され、システムによって認識される。
次に、リスト書式をプラテンの所定の位置に置いて、走
査が行われる。信号は、デジタル化して、メモリにファ
イルされる。次に、個々の書類(署名がなされた)が、
リストに現れる順序でスタックされて、自動文書フィー
ダの所定位置に置かれると、次に、プラテンが個々の書
類を走査し、必要な情報をメモリにファイルする。次
に、制御セクションが、メモリからリスト書式に関する
データを読み取り、個々の書類データのあらかじめ記憶
されている指定の部分を切り抜いて、電子的に重ねてい
る間に、リスト書式に関するデータに転記し、リストに
関するデータを作成する。リストに関するデータは、電
子プリンタに転送され、プリントされる。
【0005】コラム4の42行〜46行において、スガ
ヌマらの示すように、もとの書類またはリストに参照記
号をつけることが可能であり、その位置は、その認識に
基づいて計算することができる。コラム4の47行〜5
1行において、スガヌマらの示すように、個々の書類の
入力順は、システムが個々の書類に付けられた記号また
は数字を認識することによって決定することができる。
【0006】本発明は、書式のフィールドにテキストを
挿入する際に生じる問題を処理することを目的とするも
のである。多くの書式には、テキストを挿入するフィー
ルドが1つ以上含まれている。
【0007】テキスト編集ソフトウェアの中には、ユー
ザがテキストを書式に挿入することができるものもあ
る。ただし、これができるのは、書式が、用いられる特
定のテキスト編集ソフトウェアによって編集可能な、電
子文書として利用できる場合に限られるので、滅多なこ
とではあり得ない。編集可能な書式バージョンは、一般
に利用できないが、たとえ利用できたとしても、書式の
改訂のため、おそらく、すたれることになる。
【0008】電子文書において利用可能なテキストが、
紙の文書として利用可能な書式のフィールドにプリント
できる場合もある。例えば、テキスト編集ソフトウェア
を利用して、テキストの書式作成を行い、マージン、ブ
ランクスペース、または、他の書式特徴を挿入すること
によって、テキストが、フィールド内に納まるように位
置決めされ、形成されていると思えるようにすることが
可能である。書式作成されたテキストは、従って、その
書式のコピーにプリントすることが可能である。しか
し、フィールド内に正確にテキストを位置決めするに
は、何回か繰り返す必要があるので、この技法も非能率
的である。
【0009】テキストを手動でタイプするか、または、
書き込むことによって、紙の文書として利用可能な書式
のフィールドにテキストを挿入することが可能である。
ただし、既存の文書中においてテキストの利用が可能で
ある場合、再タイプまたは再書き込みは非能率的であ
り、エラーを生じる可能性がある。
【0010】紙の文書において利用可能な、あるいは、
電子文書から紙にプリント可能なテキストを切り抜い
て、紙の文書として利用可能な書式のフィールド内に貼
り付けることも可能である。さらに、切り抜いて、貼り
付けるバージョンの書式をコピーすることも可能であ
る。ワードのように、テキストの小セグメントを切り抜
いて、貼り付けなければならない場合には、この技法
は、非能率的であり、面倒である。さらに、この技法
は、貼り付けられるセグメントの歪み、または、貼り付
けられるセグメントのエッジを示すラインまたはシャド
ーといった人工的要素を導入する可能性がある。
【0011】本発明は、さらに、これらの課題を回避す
る書式のフィールド内にテキストを挿入するための技法
の発見に基づくものである。この技法には、書式のイメ
ージとテキストのイメージを併合する(merge) 効果があ
る。
【0012】該技法は、入力イメージデータを受信し、
この入力イメージデータを利用して、自動的に出力イメ
ージデータが得られるようにすることによって実現可能
である。入力イメージデータは、書式を含む第1のイメ
ージを定義する。入力イメージデータは、また、テキス
トを含む第2のイメージも定義する。出力イメージデー
タは、第2のイメージからのテキストがフィールド内に
納められた、第1のイメージからの書式を含む第3のイ
メージを定義する。
【0013】出力イメージデータを得るため、該技法で
は、入力イメージデータから書式イメージデータ、テキ
ストイメージデータ、及び、位置決めデータを自動的に
得る。書式イメージデータは、書式のイメージを定義す
る。テキストイメージデータは、テキストのイメージを
定義する。位置決めデータは、テキストをフィールド内
に配置することができるように、書式内におけるフィー
ルドの境界位置を表示する。該技法では、さらに、書式
イメージデータ、テキストイメージデータ、及び、位置
決めデータを利用して、自動的に出力イメージデータを
得るので、第3のイメージには、テキストがフィールド
の境界内に位置決めされた書式が含まれることになる。
【0014】本発明の技法は、効率がよく、容易な自動
書式充填(automatic form filling)を可能にするので、
有利である。
【0015】図1は、2つのイメージ、すなわち、書式
に関するイメージとテキストに関するイメージを併合し
て、書式内のフィールドにテキストを位置決めする方法
を示す概略流れ図である。図2は、図1のように書式及
びテキストのイメージを併合する際における一般的なア
クションを示すフローチャートである。図3は、図2の
ように、イメージを自動的に併合するシステムによって
アクセス可能なソフトウェア製品を示す概略ブロック図
である。図4は、書式とテキストのイメージを自動的に
併合することの可能なファックスサーバを示す概略ブロ
ック図である。図5は、書式とテキストのイメージを自
動的に併合することの可能な処理回路要素を備えたデジ
タルコピー機を示す概略ブロック図である。図6は、書
式とテキストのイメージを自動的に併合することの可能
なCPUを備えたコンピュータを示す概略ブロック図で
ある。図7は、単純な書式のイメージと単純なテキスト
のイメージを自動的に併合するアクションを示す概略流
れ図である。図8は、フィールドにマーキングを施され
た書式のイメージとテキストセグメントにマーキングを
施されたテキストのイメージを自動的に併合する場合の
アクションを示す概略流れ図である。図9は、コード化
された書式を識別する情報を備えた書式のイメージとテ
キストセグメントを示すコード化された情報を備えたテ
キストのイメージを自動的に併合する場合のアクション
を示す概略流れ図である。図10は、図7〜9のよう
に、イメージを自動的に併合する場合の一般的なアクシ
ョンを示す概略流れ図である。図11は、パラグラフ間
の間隔によって、テキストセグメントとフィールドのリ
ンクに関する情報が得られる、テキストイメージの概略
図である。図12は、書式充填操作を要求するための書
式を含んでおり、フィールド及びテキストのマークによ
って、リンクに関するフィールドとテキストセグメント
の継続が指示されている、一連のイメージの概略図であ
る。図13は、書式充填操作を要求するカバーシート、
及び、分離シートを含んでおり、コード化情報によっ
て、リンクに関するフィールド及びテキストセグメント
のタイプが指示されている、一連のイメージの概略図で
ある。
【0016】図1〜3には、本発明の一般的な特徴が示
されている。図1は、2つのイメージ、すなわち、書式
に関するイメージと、テキストに関するイメージを併合
して、フィールド内にテキストが配置された書式のイメ
ージが自動的に得られるようにする方法を示した概略流
れ図である。図2は、図1の場合のように2つのイメー
ジを自動的に併合する際における一般的なアクションを
示すフローチャートである。図3は、アクセスすること
によって、図2の場合のように自動的に2つのイメージ
を併合することができるソフトウェア製品を示した概略
ブロック図である。
【0017】図1のイメージ10には、フィールド12
を備えた書式が示されている。フィールド12には、ラ
インで包囲されたブランク領域が例示されている。多く
の書式には、フィールドまわりに、ライン、コーナ記
号、エッジ、または、テキストを挿入すべき境界を示す
同様の境界キューが含まれている。また、多くの書式に
は、フィールドの境界内、または、そのすぐ外側に、フ
ィールドに挿入すべきテキストのタイプを示す少量のテ
キストが含まれている。
【0018】図1のイメージ20には、テキスト「WO
RDS GO INTO FIELD」が示されてい
る。
【0019】図1におけるイメージ30を定義するデー
タは、イメージ10及び20を定義するデータから自動
的に得られる。イメージ10の書式を定義するデータ
は、イメージ10を定義するデータから得られる。イメ
ージ20のテキストを定義するデータは、イメージ20
を定義するデータから得られる。フィールド12の境界
を示す位置決めデータは、やはり、イメージ10を定義
するデータから得られるので、図示のように、テキスト
をイメージ30のフィールド32内に位置決めすること
が可能になる。
【0020】図2のボックス40におけるアクション
は、図1のイメージ10同様、フィールドを備えた書式
を示す第1のイメージセット、及び、図1のイメージ2
0と同様、テキストを示す第2のイメージセットを定義
する入力イメージデータを受信することである。ボック
ス42におけるアクションは、自動的に、書式のイメー
ジを定義する書式イメージデータ、テキストのイメージ
を定義するテキストイメージデータ、及び、フィールド
の境界の位置を示す位置決めデータを得ることである。
ボックス44におけるアクションは、ボックス42で得
たデータを利用して、図1におけるイメージ30と同
様、テキストがフィールドの境界内に納められた書式を
示す第3のイメージセットを定義するデータを自動的に
得ることである。
【0021】図3には、図3に示すようなコンポーネン
トを含むシステムにおいて用いることの可能な製品であ
る、ソフトウェア製品60が示されている。ソフトウェ
ア製品60には、記憶媒体アクセス装置64によってア
クセス可能なデータ記憶媒体62が含まれている。例え
ば、データ記憶媒体62は、組をなす1つ以上のフロッ
ピーディスクのような磁気媒体、組をなす1つ以上のC
D−ROMのような光学媒体、または、データの記憶に
適した他の媒体とすることが可能である。
【0022】データ記憶媒体62は、記憶媒体アクセス
装置64が、プロセッサ66に対して与えることの可能
なデータを記憶している。プロセッサ66は、イメージ
入力回路要素70からイメージを定義するデータを受信
するように接続されている。データは、ファクシミリ
(ファックス)機72、デジタルコピー機またはコンピ
ュータの入力/出力装置のスキャナとすることが可能な
スキャナ74、キーボード及びマウス、または、ペンま
たはスタイラスベースの入力装置といった、ユーザ入力
装置によって制御される書式エディタまたは他の対話式
イメージエディタとすることが可能な書式エディタ7
6、あるいは、ローカルエリアネットワークまたはイメ
ージを定義するデータを送信することの可能な他のネッ
トワークとすることが可能なネットワーク78から得る
ことが可能である。
【0023】プロセッサ66は、また、イメージを定義
するデータをイメージ出力回路要素80に供給するよう
に接続されている。データは、さらに、ファックス機8
2、プリンタ84、ディスプレイ86、または、ネット
ワーク88にも供給することができる。プリンタ84
は、デジタルコピー機またはコンピュータの入力/出力
装置のプリンタとすることが可能である。
【0024】データ記憶媒体62以外に、ソフトウェア
製品62には、記憶媒体62によって記憶されたデータ
が含まれている。記憶されたデータには、図2のボック
ス40におけるアクションを実施するために実行可能な
イメージ受信命令90を指示するデータが含まれてい
る。記憶されたデータには、応答命令92を指示するデ
ータも含まれている。応答命令92を実行することによ
って、図2のボックス42に示すように、書式イメージ
データ、テキストイメージデータ、及び、位置決めデー
タを自動的に得ることが可能である。応答命令92を実
行することによって、図2のボックス44に示すよう
に、併合したイメージを定義するデータを自動的に得る
ことも可能である。
【0025】上述の一般的な特徴は、併合したイメージ
を得るための、各種機械におけるさまざまな方法によっ
て実現することができる。
【0026】図4〜6には、従来の部品を修正すること
によって本発明を実施することが可能になる3つの機械
が示されている。図4には、ファックスサーバの実施例
が示されている。図5には、デジタルコピー機の実施例
が示されている。図6には、コンピュータの実施例が示
されている。
【0027】図4の場合、ファックス機120を利用し
て、イメージセットを定義するデータが、ファックスサ
ーバ122に送られる。送られたデータは、第1の書式
を示すイメージ130、第2の書式を示すイメージ13
2、及び、テキストを示すイメージ134を定義する。
第1の書式には、第2の書式とテキストを併合する書式
充填操作を要求するマーキングが施されたチェックボッ
クス136を備える第1のフィールドが含まれている。
【0028】ファックスサーバ122は、イメージを定
義するデータ130を利用して、チェックボックス13
4にマーキングが施されていることを示す、イメージを
定義するデータ130の情報に基づいて、書式充填操作
に関する要求を示す書式充填要求データを得る。次に、
この要求に応答して、ファックスサーバ122は、イメ
ージを定義するデータ132を利用して、書式を示すイ
メージを定義する書式イメージデータを自動的に得る。
ファックスサーバ122は、また、イメージを定義する
データ134を利用して、テキストを示すイメージを定
義するテキストイメージデータを自動的に得る。ファッ
クスサーバ122は、また、イメージを定義するデータ
130、132、及び、134を利用して、テキストを
フィールド内に位置決めすることができるように、書式
のフィールドまわりにおける境界の位置を示す位置決め
データを自動的に得る。ファックスサーバ122は、書
式イメージデータ、テキストイメージデータ、及び、位
置決めデータを利用して、フィールド内にテキストを納
めた書式を示すイメージを定義するデータを自動的に得
る。ファックスサーバ122は、このデータをファック
ス機120に送り、これがプリントされて、イメージ1
40が得られることになる。
【0029】図5の場合、デジタルコピー機160に
は、書式を示すイメージ164及びテキストを示すイメ
ージ166を定義するデータを得る走査回路要素162
が含まれている。ユーザインターフェイス回路要素17
0には、押しボタン、感熱または感圧素子、容量検知素
子、または、触れる動作を検知する他の装置とすること
が可能な、タッチセンシング装置172が含まれてい
る。ユーザが装置172に触れると、ユーザインターフ
ェイス回路要素170は、装置172に触れたことを示
すタッチデータを送り出す。
【0030】処理回路要素180は、タッチデータを利
用して、書式充填操作に関する要求を示す書式充填要求
データを得る。次に、処理回路要素180は、この要求
に応じて、イメージ164及び166を定義するデータ
を利用して、書式を示すイメージを定義する書式イメー
ジデータ、テキストを示すイメージを定義するテキスト
イメージデータ、及び、テキストをフィールド内に位置
決めすることができるように、書式のフィールドまわり
における境界位置を示す位置決めデータを自動的に得
る。処理回路要素180は、形状イメージデータ、テキ
ストイメージデータ、及び、位置決めデータを利用し
て、テキストがフィールド内に納まった書式を示すイメ
ージを定義するデータを自動的に得る。このデータは、
プリント回路要素190に送られて、イメージ192が
プリントされる。
【0031】図6の場合、スキャナ200は、書式を示
すイメージ202及びテキストを示すイメージ204を
定義するデータを得る。このデータは、ワークステーシ
ョンまたはパーソナルコンピュータといったコンピュー
タのCPU210に供給される。CPU210は、キー
ボード212及びマウス214からユーザアクションを
示すデータを受信し、イメージを定義するデータをディ
スプレイ216に供給するように接続されている。CP
Uは、書式充填操作を要求するために、選択できる選択
可能なユニット220を含むイメージを送り出す。ユー
ザは、マウス214を利用して、ポインタの位置決めを
行い、選択可能なユニット220の選択を指示する信号
を送り出すことができる。
【0032】CPU210は、この信号を利用して、書
式充填操作の要求を示す書式充填要求データを得る。C
PU210は、要求に応答し、イメージ202及び20
4を定義するデータを利用して、書式を示すイメージを
定義する書式イメージデータ、テキストを示すイメージ
を定義するテキストイメージデータ、及び、フィールド
内にテキストを位置決めすることができるように、書式
のフィールドまわりにおける境界の位置を示す位置決め
データを自動的に得る。このデータは、プリンタ230
に供給されて、イメージ232がプリントされることに
なる。
【0033】図7〜10には、書式イメージデータ、テ
キストイメージデータ、及び、位置決めデータを自動的
に得て、これを利用し、フィールド内にテキストが納ま
った書式を示すイメージを定義するデータを自動的に得
る方法が示されている。図7には、単純なイメージから
書式イメージデータ、テキストイメージデータ、及び、
位置決めデータを得る実施例が示されている。図8に
は、ユーザによるマーキングが施されたイメージから書
式イメージデータ、テキストイメージデータ、及び、位
置決めデータを得る実施例が示されている。図9には、
機械に読み取り可能なコード化情報を含むイメージから
書式イメージデータ、テキストイメージデータ、及び、
位置決めデータを得る実施例が示されている。図10に
は、書式及びテキストの歪み除去、テキストのスケーリ
ング、及び、テキストの再書式作成が示されている。
【0034】図7の場合、イメージ250には、フィー
ルド252及び254を含む書式が示されている。フィ
ールド252は、比較的小さいフィールドであり、一
方、フィールド254は、比較的大きいフィールドであ
る。イメージ260は、テキスト262を示している
が、非テキスト情報(図示せず)を含むことも可能であ
る。上述のように、ファックス機または他の走査回路要
素を利用して、イメージ250及び260を定義するデ
ータを得ることが可能である。
【0035】イメージ250を定義するデータを利用し
て、イメージ270、すなわち、フィールド252及び
254内のピクセルが、全て、黒で、該フィールド外の
ピクセルが、全て、白い、イメージ250のバージョン
を定義するデータを得ることも可能である。イメージ2
70は、形態学的技法によって得られるマスクとするこ
とも可能である。例えば、イメージ270を定義するデ
ータは、まず、閉じた境界に達するまで、イメージのエ
ッジから内側に黒のピクセルで充填する形態学的エッジ
充填操作を実施することによって得ることが可能であ
り、次に、エッジを充填したイメージを反転して、イメ
ージ270におけるように、フィールド252及び25
4内が黒のピクセルになり、他の部分は白のピクセルに
なるようにすることができる。
【0036】別様のべた塗りの領域内における小さな特
徴は、イメージ250を定義するデータに形態学的(mol
phological) 開放操作を施して、全体に白い領域内の黒
のピクセルを白のピクセルに変換することによって、除
去することができる。大きいフィールド内にネストされ
た小さいフィールドを見つけるため、大きい方のフィー
ルド内において、任意の位置から始めて、形態学的充填
操作を実施することができ、充填操作によって充填され
た領域が大きいフィールドより小さければ、大きいフィ
ールドからその充填した領域を除去することが可能であ
り、非充填領域に対してさらに充填操作を実施すること
によって、他のより小さいフィールドを見つけることが
できる。上述のエッジ充填操作によって見つかったフィ
ールドの内容を抽出することが所望の場合、反転したエ
ッジ充填イメージに、もう1度エッジ充填を施して、反
転することにより、内容のイメージを得ることが可能で
あり、次に、このイメージを利用して、フィールドの内
容を削除することができる。
【0037】フィールドの境界が、連続していない場合
には、エッジ充填技法がうまく作用しないこともあり得
る。エッジの充填前に、形態学的閉鎖操作を実施して、
フィールドの境界におけるギャップを閉じることが可能
である。代替案として、形態学的技法を利用して、イメ
ージ250内の接続された各構成要素毎に境界をなすボ
ックスを見つけ、その後、境界ボックスにサイズ判定基
準を当てはめることが可能である。フィールドは、接続
された最大の構成要素であるため、たとえその境界が連
続していなくても、サイズ判定基準によって選択される
ことになる。従って、境界ボックスを利用することによ
って、イメージ270を定義するデータを得ることが可
能である。
【0038】次に、イメージ270を定義するデータを
利用して、イメージ280、すなわち、セグメント28
2内のピクセルが、全て、黒で、他のピクセルが、全
て、白い、イメージ270のバージョンを定義するデー
タを得ることができる。イメージ280におけるセグメ
ント282内のピクセルは、ブランク領域の判定基準及
びサイズしきい値をイメージ270内の黒セグメントの
それぞれに適用することによって、他のピクセルから弁
別することができる。次に、イメージ280を定義する
データを利用して、セグメント282の水平及び垂直境
界を示すデータといった位置決めデータを得ることがで
きる。
【0039】ブランク領域の各種判定基準を利用して、
既にテキストまたはグラフィックスを含んでいるセグメ
ントからセグメント282を弁別することができる。例
えば、セグメント内の白のピクセルをカウントして、セ
グメント内における白のピクセル対全ピクセルの割合を
求めることが可能である。次に、この割合としきい値の
比較を行って、そのセグメントが主として白であるか否
かの判定を行うことができる。そうでなければ、そのセ
グメントは、充填すべき候補ではないということにな
る。
【0040】同様に、各種サイズのしきい値を利用する
ことも可能である。例えば、サイズのしきい値は、連続
した黒ピクセルの数、または、各方向に1インチといっ
た寸法とすることが可能である。セグメント274のよ
うなしきい値未満のセグメントは、そのサイズが小さい
ため、テキストを充填すべき候補にはならない。しきい
値は、各セグメントにおける黒ピクセルのカウント、ま
たは、各セグメントに納まる最大矩形の高さと幅の測定
値に適用することが可能である。省略時のサイズしきい
値を用いる代わりに、書式上のマーク、ユーザインター
フェイス回路要素、または、グラフィカルユーザインタ
ーフェイルを介して、ユーザからサイズしきい値を表し
たデータを得ることができる。
【0041】同様に、イメージ260を定義するデータ
を利用して、イメージ290、すなわち、テキスト26
2まわりの境界ボックス内のピクセルが、全て、黒で、
その他のピクセルが、全て、白い、イメージ260のバ
ージョンを定義するデータを得ることが可能である。イ
メージ290をマスクとすることも可能である。イメー
ジ290のセグメント292内におけるピクセルは、テ
キスト領域判定基準を適用することによって、他のピク
セルから弁別することが可能である。次に、セグメント
292まわりに、境界ボックスを得ることができ、この
境界ボックスの充填によって、イメージ290を定義す
るデータを生成することが可能になる。この技法は、テ
キストの多くのイメージに有効に作用するが、他のテキ
ストイメージのために同様の技法を開発することも可能
である。
【0042】さまざまなテキスト領域判定基準を用いる
ことが可能である。例えば、水平フィルタによる4回に
わたる整理編集を行い、引き続き、テキストの各行を充
填する形態学的水平閉鎖操作、及び、テキストの各列を
充填する形態学的垂直閉鎖操作を施すことができる。こ
れらの操作によって、テキストの水平行を含む領域に接
続された構成要素を形成することができる。次に、接続
された構成要素のまわりに、境界ボックスを得ることが
できる。テキストを含むイメージからグラフィックスを
除去することが可能になる。
【0043】次に、イメージ290を定義するデータを
利用して、イメージ294、すなわち、テキスト262
だけしか含んでいないイメージを定義するデータを抽出
することができる。これは、イメージ290の各ピクセ
ルを反転し、次に、反転イメージにおける各白のピクセ
ル毎に、同じ位置にあるイメージ260からピクセルを
得ることによって実施可能である。
【0044】次に、イメージ294の境界ボックスの寸
法、及び、セグメント282内に納めることの可能な最
大矩形の寸法を利用して、フィールド254に納まるよ
うに、イメージ294にスケーリングを施すべきか否か
の判定を行うことができる。スケーリングを施すべきで
あるという場合には、Scott他のUS−A5,09
7,518に記載の技法または他の従来の技法に基づい
て、適合するスケーリング施すことが可能である。イメ
ージ294のスケーリングによって、イメージ296を
定義するデータが得られる。
【0045】次に、イメージ296を定義するデータ及
びイメージ250を定義するデータを利用して、イメー
ジ300、すなわち、フィールド302がイメージ26
0におけるテキスト262と同じシーケンスのワードを
示し、一方、イメージ300の残りの部分が、フィール
ド252と同じフィールド304を含んでおり、イメー
ジ250に示す書式の残りの部分と同じになる、イメー
ジ250のバージョンを定義するデータを得ることが可
能である。例えば、イメージ296の上方左手コーナを
イメージ280におけるセグメント282の上方左手コ
ーナと同じ位置に配置し、次に、イメージ250の各ピ
クセルと、もしある場合には、イメージ296における
同じ位置のピクセルとの間においてOR演算を実施する
ことによって、イメージ296及び250を利用するこ
とも可能である。結果として、イメージ250内におい
て黒のピクセルは、イメージ300においても黒である
が、イメージ296における黒のピクセルと同じ位置に
ある、イメージ250における白のピクセルは、黒のピ
クセルにスイッチされ、一方、他の白のピクセルは、白
のままということになる。
【0046】図8は、図7に似ているが、上述の判定基
準及びサイズしきい値を必要としない実施例を示してい
る。
【0047】図8の場合、イメージ320は、図7にお
けるイメージ250と同様、フィールド322及び32
4を含む書式を示している。さらに、ユーザは、フィー
ルド324内にマーク326を付けて、フィールド32
4にテキストを充填すべきであることを指示している。
【0048】イメージ320を定義するデータを利用し
て、イメージ330、すなわち、フィールド324内の
ピクセルが、全て、黒で、フィールド324外のピクセ
ルが、全て、白い、イメージ320のバージョンを定義
するデータを得ることが可能である。イメージ330
は、マスクとすることも可能である。例えば、フィール
ド322及び324に関するマスクは、図7のイメージ
270に関連して上述のように、得ることが可能であ
り、次に、マーク326は、その大きさ及び曲率、すな
わち、フィールド322及び324の境界のような直線
の特徴だけでなく小さい文字とも区別する組み合わせ判
定基準に基づいて、検出することが可能であり、次に、
マーク326からのピクセルを種として利用して、マス
クの反転バージョンに充填を行うことが可能であり、充
填した反転マスクと非反転マスクをAND演算によって
組み合わせて、イメージ330を定義するデータを得る
ことが可能である。代替案として、マーク326を強調
マークにし、ブルームバーグ (Bloomberg)らの米国特許
第5,048,109号明細書に記載のある技法を利用
して、検出できるようにすることも可能である。他の同
様の各種技法を利用することも可能である。
【0049】次に、イメージ320を定義するデータ及
びイメージ330を定義するデータを利用して、イメー
ジ340、すなわち、イメージ330のセグメント33
2によって形成される領域内のピクセルが、全て、白で
あり、従って、マーク324が除去されることになる、
イメージ320のバージョンを定義するデータを得るこ
とが可能になる。イメージ320と同様、イメージ34
0には、フィールド342及び344が含まれている。
【0050】イメージ350には、マーク352で囲ま
れたテキストが示されている。マーク352は、ユーザ
が、マークで囲んだテキストを利用して、イメージ32
0に示す書式のフィールドを充填するように指示するた
めに、付けることができる。
【0051】イメージ350を定義するデータを利用し
て、イメージ360、すなわち、マーク352で囲んだ
テキストまわりの境界ボックス内のピクセルが、全て、
黒で、その他のピクセルが、全て、白い、イメージ35
0のバージョンを定義するデータを得ることが可能であ
る。例えば、マーク352は、その大きさ及び曲率、す
なわち、その内側にあるような小さい文字から区別する
組み合わせ判定基準に基づいて検出することが可能であ
り、次に、マーク352の内側のテキストに関するマー
クは、図7のイメージ270に関連して解説のような技
法を用いて、得ることが可能であり、従って、イメージ
360を定義するデータが得られることになる。代替案
として、マーク352を強調マークにし、ブルームバー
グらの米国特許第5,048,109号明細書に記載の
ある技法を利用して、検出できるようにすることも可能
である。他の同様の各種技法を利用することも可能であ
る。マーク352がテキストとクロスする場合、さら
に、テキストからマーク352を取り除くステップが、
必要になる可能性もある。
【0052】次に、イメージ360を定義するデータを
利用して、イメージ364を定義するデータを抽出し、
これにスケーリングを施すことによって、図7に示すよ
うに、イメージ366を定義するデータを得ることが可
能である。さらに、図7に示すように、イメージ366
を定義するデータ及びイメージ340を定義するデータ
を利用して、イメージ370、すなわち、フィールド3
72が、イメージ350のマーク352によって囲まれ
たテキストと同じシーケンスのワードを示し、一方、イ
メージ370の残りの部分は、フィールド342と同じ
フィールド374を含んでおり、イメージ340に示す
書式の残りの部分と同じになる、併合されたイメージを
定義するデータを得ることが可能になる。
【0053】図8のマーク326及び352は、検出を
容易にする、特殊なマーキング物質で付けることが可能
である。
【0054】図9は、図7及び図8に似ているが、判定
基準、サイズ、しきい値、ユーザマーク、及び、上述の
イメージ処理の大部分を必要としない、実施例を示すも
のである。
【0055】図9の場合、イメージ400には、イメー
ジ400を定義するデータを受信するプロセッサが読み
取って、フィールド402及び404、及び、イメージ
400に示す書式の他の特徴を定義するデータを得るこ
とが可能な、機械に読み取り可能な書式を識別する情報
406が含まれている。プロセッサは、このデータを利
用して、フィールド404が、書式充填操作の要求に応
答して、テキストを充填すべきフィールドであることを
判定することができる。プロセッサは、さらに、このデ
ータを利用して、フィールド404の境界を示す位置決
めデータを得ることが可能である。
【0056】イメージ410には、テキスト412、テ
キスト412の開始位置を示す機械に読み取り可能な情
報414、及び、テキスト412の終了位置を示す機械
に読み取り可能な情報416が示されている。イメージ
410を定義するデータを受信するプロセッサは、従っ
て、テキスト412の境界を示すデータを得ることがで
きる。
【0057】イメージ400及び410の機械に読み取
り可能な情報をコード化して、イメージに含めることも
可能である。代替案として、機械に読み取り可能な情報
をコード化して、シェパード(Shepard) の米国特許第
4,021,777号明細書に解説の方法でイメージに
含めることも可能である。
【0058】プロセッサは、テキスト412の境界を示
すデータ及びイメージ410を示すデータを利用して、
イメージ420を定義するデータを抽出し、これにスケ
ーリングを施して、図7及び8に示すように、イメージ
422を定義するデータを得ることが可能である。さら
に、図7及び8に示すように、次に、イメージ422を
定義するデータ及びイメージ400を定義するデータを
利用して、イメージ430、すなわち、フィールド43
2が、イメージ410におけるテキスト412と同じシ
ーケンスのワードを示し、一方、イメージ430の残り
の部分は、フィールド402と同じフィールド434を
含んでおり、イメージ400に示す書式の残りの部分と
同じになる、併合されたイメージを定義するデータを得
ることが可能になる。
【0059】図10には、上述の実施例のいずれかと共
に生じる可能性のある例が示されている。プロセッサ
は、イメージ450及び460に関する書式充填操作の
要求を受信する。イメージ450は、反時計廻り方向に
わずかに歪んだフィールド452を備えた書式を示して
いる。イメージ460は、時計廻り方向にわずかに歪ん
だテキスト462を示している。逆の歪みに加えて、フ
ィールド452は、比較的高さが低く、幅が広いが、テ
キスト462は、比較的高さが高く、幅が狭い。
【0060】第1のステップでは、両方のイメージの内
容に歪み除去を施す。イメージ450を定義するデータ
を利用して、イメージ470、すなわち、フィールド4
72がフィールド452と同じであるが、歪んでいな
い、イメージ450のバージョンを定義するデータを得
ることが可能である。同様に、イメージ460を定義す
るデータを利用して、イメージ480、すなわち、テキ
スト482がテキスト462と同じであるが、歪んでい
ない、イメージ460のバージョンを定義するデータを
得ることが可能である。歪みは、タナカらの米国特許第
4,759,076号明細書に記載のように、検出し、
補正することができる。
【0061】次のステップは、テキスト482がフィー
ルド472に納まったイメージを定義するデータを得る
ことである。イメージ490は、図7〜9における実施
例に基づき、テキスト482にスケーリングを施して、
フィールド492内に納まるようにした例である。ただ
し、フィールド492内のワードは、極めて小さいの
で、読み易さが十分ではない。読み易さは、文字の高さ
を求めて、その高さと、それ以下では読み取りが十分に
行えなくなるしきい値との比較を行うことによって判定
することができる。代替案として、読み易さは、フィー
ルド内に納まるようにするために、テキストイメージに
施すことが必要な縮小率が50%を超える場合に、例え
ば、テキストの読み易さが十分でなくなるといった、ス
ケーリングの範囲に基づいて判定することも可能であ
る。
【0062】スケーリングによって、テキスト482の
満足のいくイメージが得られないと判定すると、プロセ
ッサは、テキスト482内のワードの位置決めをやり直
して、同じ配列に留まるが、結果として、異なる形状に
なるようにすることができる。イメージ500は、ワー
ド「lines」が、最初の行に再位置決めされ、ワー
ド「were at a」が、2行目に再位置決めされ
た例である。ただし、このアプローチは、ワード「sk
ew」がフィールド502内に納まらず、従って、省略
されているので、図示の例でも満足のいくものではな
い。
【0063】こうしたアプローチの代わりに、イメージ
470及び480を定義するデータを利用して、フィー
ルド512内に納まるように、テキスト482に対して
スケーリングと再書式作成の両方を施した、イメージ5
10を得ることも可能である。プロセッサは、フィール
ド472のサイズ、及び、テキスト482におけるワー
ドサイズ及び間隔に基づいて、さまざまなやり方で、自
動的にスケーリング及び再書式作成の決定を行うことが
できる。例えば、テキスト482を3行に再書式作成し
て、フィールド472に納まるようにスケーリングを施
すことが可能であり、これで満足できなければ、次に、
2行に再書式作成して、納まるようにスケーリングをほ
どことが可能であり、やはり、満足できなければ、次
に、1行に再書式作成して、等等。あるいは、可能な全
ての再書式作成を試みて、その比較を行い、フィールド
472に納めるのに必要なスケーリングが最小ですむも
のを見つけ出すことも可能である。
【0064】図10に示すように、フィールドに納まる
が、そのフィールドに対して不適切な書式作成が施され
ているテキストに対して、再書式作成を施すことも可能
である。例えば、細い列のテキストに再書式作成を施し
て、広いフィールドに納め、後続のテキストのためにフ
ィールドの下部に追加スペースを残すことも可能であ
る。
【0065】上述の実施例の場合、単一のテキストセグ
メントを利用して、単一のフィールドの充填が行われて
いる。しかし、フィールドの中に、他のフィールドと継
続したものがあったり、テキストが文書の異なる部分か
ら取り出されるといったことが考えられる、多くの用途
では、いくつかの異なるフィールドにテキストを充填す
ることが望ましい。これは、各フィールドをそのフィー
ルドの充填に用いられるテキストとリンクさせることに
よって実現可能である。
【0066】図11〜13には、書式充填操作における
リンクが示されている。図11には、テキストのパラグ
ラフ間における間隔によって、パラグラフとフィールド
のリンクに用いられる情報を得ることの可能にする方法
が示されている。図12には、フィールド及びテキスト
内のマークによって、フィールドとテキストセグメント
間の継続を示し、一連のフィールドと一連のテキストセ
グメントのリンクを可能にする方法が示されている。図
13には、コード化した情報によって、フィールド及び
テキストセグメントの特徴を示し、フィールドと適合す
るテキストセグメントのリンクを可能にする方法が示さ
れている。
【0067】図11には、図7の実施例に用いられる異
なるフィールドに挿入されるテキストを示す方法が示さ
れている。イメージ550には、3つのパラグラフに分
割される、テキストのいくつかの行が含まれている。パ
ラグラフ552及び554は、1スペース分分離されて
おり、パラグラフ554及び556は、2スペース分分
離されている。パラグラフ間の間隔は、測定可能であ
り、それを行うための技法をイメージの適合するセグメ
ントに適用して、特定のパラグラフの間隔を測定するこ
とができる。
【0068】2つ以上のフィールドを備えた書式を示す
イメージ及びイメージ550を形成するデータを受信す
るプロセッサは、間隔の差を利用して、フィールド及び
テキストのリンクを決定することができる。プロセッサ
は、書式内において見いだされる順番に各フィールドを
取り扱い、イメージ550内において見いだされる順番
に各フィールドにテキストを充填することができる。プ
ロセッサは、従って、パラグラフ552のテキストと第
1のフィールドをリンクすることができる。パラグラフ
552と554の間が1スペースであることが分かる
と、プロセッサは、パラグラフ554のテキストと最初
のフィールドをリンクすることもできる。しかし、ラグ
ラフ554と556の間が2スペースであることが分か
ると、プロセッサは、パラグラフ556のテキストと最
初のフィールドに後続する第2のフィールドをリンクす
ることができる。
【0069】図12には、図8の実施例に用いられるフ
ィールド及びテキストセグメントの継続を示す方法が示
されている。
【0070】イメージ570は、プロセッサが、書式を
記述するデータを得るために利用可能な、機械に読み取
り可能な書式を識別する情報が含まれた書式を示してい
る。例えば、識別情報を利用して、書式の記述を直接得
ることもできるし、あるいは、記憶されている書式の記
述にアクセスするためのデータを得ることもできる。書
式の記述を利用して、書式のフィールドからデータを得
ることも可能である。
【0071】イメージ570には、書式充填操作を要求
するためのフィールドが含まれており、このフィールド
のチェックボックス574にマーキングを施すことによ
って、要求が指示される。もう1つのフィールドには、
充填すべき書式の2桁のページ数を表すチェックボック
スグリッド576が含まれており、必要があれば、プロ
セッサによる認識のため、ボックス578に大きい方の
数を書き込むことができる。
【0072】イメージ570を定義するデータを受信す
るプロセッサは、書式を示す第1のイメージセット58
0、及び、テキストを示す第2のイメージセット600
を受信する。イメージ570を定義するデータから、グ
リッド576及びボックス578のマークによって指示
されたページ数を表したデータを得ることができる。次
に、このページ数を利用して、イメージ580とイメー
ジ600の間の離隔距離を求めることができる。
【0073】プロセッサは、イメージ580のフィール
ドに関するデータを順次得ることが可能である。イメー
ジ580には、充填を指示したマーク576の付いたフ
ィールド584が含まれている。イメージ588には、
充填を指示したマーク592の付いたフィールド590
が含まれており、また、それには、「c」が含まれてい
るので、そのシーケンスにおいて直前のフィールドであ
る、フィールド584との継続が指示されている。イメ
ージ588には、フィールド594も含まれ、イメージ
596には、フィールド598が含まれているが、それ
ぞれ、充填を指示するマーキングが施されている。
【0074】次に、プロセッサは、イメージ600から
のテキストとフィールドのリンクを行うことができる。
イメージ602には、それが包囲するテキストセグメン
トを利用して、フィールドに充填を行うことを指示した
マーク604が付いており、従って、マーク604に囲
まれたテキストセグメントとフィールド584をリンク
させることができる。イメージ606には、それが包囲
するテキストセグメントを利用することを指示したマー
ク608が付いており、また、テキストセグメントに
は、マーキングを施された先行テキストセグメントとの
継続を指示する「c」のマーキングも施されているの
で、マーク608によって囲まれたテキストセグメント
とフィールド584とのリンクを行うことも可能であ
る。イメージ606には、テキストセグメントを囲むマ
ーク610も含まれ、イメージ612には、テキストセ
グメントを囲むマーク614が含まれており、これらの
テキストセグメントは、フィールド594及び598の
ような、そのシーケンスにおいて後続のフィールドとリ
ンクさせることができる。
【0075】次に、プロセッサは、イメージセット58
0及び600を定義するデータと共に、このリンクデー
タを利用して、フィールドにテキストが納まった書式を
定義するデータを生成することができる。マーク604
によって囲まれたテキストセグメントが、フィールド5
84にとって大きすぎる場合、フィールド590は、フ
ィールド584の継続であるため、オーバフローはフィ
ールド590に移行することが可能である。マーク60
4で囲まれたテキストセグメントによって、フィールド
584が充填されない場合、マーク608によって囲ま
れたテキストセグメントは、マーク604におけるテキ
ストセグメントと継続しているので、マーク608によ
って囲まれたテキストセグメントの一部を利用して、フ
ィールド584を充填することができる。マーク604
及び608によって囲まれたテキストセグメントによっ
て、フィールド584及び590を充填することができ
ない場合、上述のように、スケーリング及び再書式作成
操作を実施することができる。
【0076】図12の追加マーク「c」を認識して、除
去することが可能である。例えば、各「c」マークは、
フィールドの境界のような直線の特徴だけでなく、小さ
い文字との区別も行う組み合わせ判定基準である、その
曲率と大きさに基づいて検出することが可能であり、次
に、各「c」マークからのピクセルを種として利用し
て、それを囲んでいるマークを充填することができ、さ
らに、図8に関連して上述の操作を実施して、フィール
ドまたはテキストに関するマスクを得ることが可能であ
り、テキストにクロスする「c」マークは除去すること
ができる。同様の他の各種技法を利用することも可能で
ある。「c」を用いて、継続を示すのではなく、数字を
用いることも可能である。マークは、「c」であろう
と、数字であろうと、テキストの上ではなく、テキスト
の側部の余白に配置して、検出及び除去を容易にするこ
とが可能である。
【0077】図13には、図9の実施例に用いられるフ
ィールド及びテキストセグメントの特徴を示す方法が例
示されている。
【0078】イメージ650には、プロセッサが利用し
て、シートを記述したデータを求めることができる、機
械に読み取り可能な識別情報652を含むシートが示さ
れている。図示の例では、シートは、書式及び後続する
テキストのイメージに対する書式充填操作が要求されて
いることを指示する、書式充填カバーシートである。従
って、識別情報を利用して、書式充填操作が要求されて
いることを指示するデータを得ることができる。
【0079】イメージ650を定義するデータを受信す
るプロセッサは、書式を示す第1のイメージセット66
0、別のシートを示す分離イメージ680、及び、テキ
ストを示す第2のイメージセット690も受信する。
【0080】プロセッサは、書式を識別する情報を利用
して、イメージ660のフィールドに関するデータを得
ることができる。イメージ662には、機械に読み取り
可能な書式の識別情報664が含まれているが、ここで
は、例示として、イメージ662のフィールド666
が、「X」タイプのフィールドであることを示す情報が
含まれている。同様に、イメージ668には、機械に読
み取り可能な書式の識別情報670が含まれているが、
この場合、イメージ668のフィールド672が、
「Y」タイプのフィールドであることを示す情報が含ま
れている。タイプX及びYは、例えば、あるフィールド
における名前及びアドレス及び別のフィールドにおける
記述といった、各フィールドに挿入される内容のタイプ
を表している。あるいは、各フィールドのタイプは、フ
ィールドに含めるべきテキストの別の特徴を指示するこ
ともできるし、あるいは、フィールドを充填すべきか否
かを指示することもできる。タイプ以外に、書式を識別
する情報は、書式の同じシートまたは別のシートにおい
て、フィールドが別のフィールドと継続していることを
示すことも可能である。
【0081】分離イメージ380には、プロセッサが利
用して、シートを記述したデータを得ることができる、
機械に読み取り可能な識別情報682が含まれている。
図示の例では、シートは、分離シートであり、先行イメ
ージが、書式の最後のイメージであり、次のイメージ
は、テキストの最初のイメージであることを指示してい
る。
【0082】分離イメージ680の受信後、プロセッサ
は、イメージ690からのテキストセグメントとイメー
ジ660のフィールドをリンクすることができる。イメ
ージ690には、テキストセグメント694の開始を指
示する機械に読み取り可能な情報696及び終了を指示
する機械に読み取り可能な情報698を備えた、テキス
トセグメント694が含まれている。機械に読み取り可
能な情報696及び698は、図示のように、テキスト
セグメント694が「Y」タイプであることも指示して
いるので、プロセッサは、それと、やはり、「Y」タイ
プである、イメージ668内のフィールド668をリン
クさせる。同様に、イメージ700には、テキストセグ
メント702の開始を指示する機械に読み取り可能な情
報704及び終了を指示する機械に読み取り可能な情報
706を備えた、テキストセグメント702が含まれて
いる。機械に読み取り可能な情報704及び706は、
図示のように、テキストセグメント702が「X」タイ
プであることも指示しているので、プロセッサは、それ
と、やはり、「X」タイプである、イメージ662内の
フィールド666をリンクさせる。
【0083】次に、プロセッサは、イメージセット66
0及び690を定義するデータと共に、リンクデータを
利用して、フィールドにテキストセグメントが納まった
書式を定義するデータを生成する。テキストセグメント
をリンクされるフィールドに納めることができない場
合、上述のように、スケーリング及び再書式作成操作を
実施することも可能である。
【0084】機械に読み取り可能な情報696、69
8、704、及び、706は、ユーザの要求に応じて、
テキストエディタによってテキストに挿入することが可
能である。
【0085】表Iには、図12に示すフィールド及びテ
キストセグメントに関して得ることのできる、フィール
ドの境界を示す位置決めデータを含めたリンクデータが
示されている。リンクデータは、フィールドにテキスト
の納まったイメージを定義するデータを自動的に得る際
におけるプロセッサのアクセスを可能にする、適切なデ
ータ構造に記憶することが可能である。
【表1】
【0086】表Iに示すように、リンクデータには、そ
れぞれ、いくつかのデータ項目を含む、一連の項目を含
むことが可能である。各項目は、例示のように、フィー
ルドを識別し、書式のシートを指示するデータ項目から
始まっている。シート1で始まり、シート2に継続する
フィールド1の場合、リンクデータには、シート1のフ
ィールド1の部分と、シート2のフィールド1の部分の
両方に関する項目が含まれている。
【0087】各項目には、上方左コーナのx及びy座
標、高さ、及び、幅として例示されている、フィールド
の位置を示すデータ項目も含まれている。各項目には、
さらに、フィールドにリンクしたテキストセグメントに
関連するデータ項目が含まれているので、2つのテキス
トセグメントにリンクしたフィールド1には、そのテキ
ストセグメントに関する独立した項目が含まれることに
なる。
【0088】各テキストセグメントに関連したデータ項
目には、それが現れるテキストのページ、その位置、及
び、先行項目のテキストセグメントと継続しているか否
かの表示が含まれている。
【0089】表Iのリンクデータを利用して、フィール
ドにいかに充填を行うかを決定するプロセッサは、ま
ず、シート1のフィールド1にページ1からのテキスト
セグメントを充填する。該テキストセグメントによって
フィールドが充填されない場合には、ページ2からのテ
キストセグメントも、フィールドに含まれる。オーバラ
ンは、シート1のフィールド1と継続したシート2のフ
ィールド1に挿入される。次に、残りのフィールドに、
それぞれのテキストセグメントが充填される。
【0090】同様に、図13において要求される書式充
填操作のために、表Iと同様のデータ構造を作成するこ
とも可能である。その場合、機械に読み取り可能な情報
によって指示されるタイプが、フィールドとテキストセ
グメント間のリンクに用いられる。
【0091】図10に関連して解説のスケーリング及び
再書式作成は、表Iに例示のようにリンクされたフィー
ルドとテキストセグメントの組み合わせに利用すること
ができる。例えば、フィールド及び1つ以上継続したフ
ィールドと一連のテキストセグメントをリンクする場
合、テキストセグメントを利用して、できれば、スケー
リングまたは再書式作成を行わずに、フィールド及びそ
れに継続するフィールドに充填することが可能である。
最後の継続するフィールドに達し、それに納まるよう
に、残りのテキストセグメントにスケーリングを施す
と、判読できなくなる場合、最後のフィールドにおいて
必要なスケーリングを控えめにするため、先行テキスト
セグメントに対するスケーリング、及び、おそらくは、
再書式作成が必要になる。
【0092】本発明は、多種多様な書式及びテキストに
対してさまざまなやり方で適用することが可能である。
【0093】本発明は、書式に、ユーザがテキストの充
填を所望する、サイズの異なるさまざまなテキストフィ
ールドが含まれている場合に、とりわけ、有効である。
例えば、本発明の提案書式には、多くの小フィールド、
さらに、本発明の記述のための比較的大きい1つのフィ
ールドを備えた第1のシートを含めることができる。記
述については、必要があれば、後続シートにおけるより
大きいフィールドに継続することが可能である。この例
の場合、ユーザは、標準的なテキストエディタによって
本発明の記述を作成してプリントし、本発明の技法を利
用して、適合するフィールドの記述に関する本発明の提
案書式を得ることができる。残りの小フィールドについ
ては、手書き、または、タイプライタで完成することが
できる。
【0094】本発明の解説は、両方とも、スキャナから
受信する、書式とテキストのイメージを自動的に併合す
る実施例に関連して行ってきた。本発明は、スキャナ以
外の信号源から受信する書式及びテキストのイメージに
ついても実施することが可能である。
【0095】本発明の解説は、ソフトウェアの実施例に
関連して行ってきたが、本発明は、特殊化ハードウェア
についても実施することが可能である。
【0096】本発明の解説は、英語によるテキストに作
用する実施例に関連して行ってきた。本発明は、ワード
の位置決めに関連した英語の規則に従う他の言語による
テキストにも容易に拡張することが可能である。本発明
は、縦書き行、右から左に書かれる行といった、他の規
則に従う言語によるテキストにも拡張することができ
る。
【0097】本発明の解説は、フィールドにテキストを
充填する実施例に関連して行ってきたが、本発明は、い
くつかのフィールドにテキストを充填し、他のフィール
ドにグラフィカル項目を充填するように実施することも
可能であり、この場合、グラフィカル項目は、フィール
ドに納まるようにスケーリングを施すことはできるが、
再書式作成を施すことはできない。グラフィカル項目の
タイプには、識別可能なものもある。
【0098】本発明の解説は、テキスト内の文字及びワ
ードを認識する必要のない実施例に関連して行ってき
た。しかし、本発明は、文字またはワードの認識を行う
操作に関しても実施することができる。
【0099】本発明の解説は、テキストにおける配列と
同じ配列のワードを含む異なるバージョンのテキストを
得る実施例に関連して行ってきたが、本発明は、ワード
を変更するか、または、テキスト内におけるワードの配
列を変更することによって、テキストを修正する操作と
組み合わせて利用することも可能である。
【図面の簡単な説明】
【図1】 2つのイメージ、すなわち、書式に関するイ
メージとテキストに関するイメージを併合して、書式内
のフィールドにテキストを位置決めする方法を示す概略
流れ図である。
【図2】 図1のように書式及びテキストのイメージを
併合する際における一般的なアクションを示すフローチ
ャートである。
【図3】 図2のように、イメージを自動的に併合する
システムによってアクセス可能なソフトウェア製品を示
す概略ブロック図である。
【図4】 書式とテキストのイメージを自動的に併合す
ることの可能なファックスサーバを示す概略ブロック図
である。
【図5】 書式とテキストのイメージを自動的に併合す
ることの可能な処理回路要素を備えたデジタルコピー機
を示す概略ブロック図である。
【図6】 書式とテキストのイメージを自動的に併合す
ることの可能なCPUを備えたコンピュータを示す概略
ブロック図である。
【図7】 単純な書式のイメージと単純なテキストのイ
メージを自動的に併合するアクションを示す概略流れ図
である。
【図8】 フィールドにマーキングを施された書式のイ
メージとテキストセグメントにマーキングを施されたテ
キストのイメージを自動的に併合する場合のアクション
を示す概略流れ図である。
【図9】 コード化された書式を識別する情報を備えた
書式のイメージとテキストセグメントを示すコード化さ
れた情報を備えたテキストのイメージを自動的に併合す
る場合のアクションを示す概略流れ図である。
【図10】 図7〜9のように、イメージを自動的に併
合する場合の一般的なアクションを示す概略流れ図であ
る。
【図11】 パラグラフ間の間隔によって、テキストセ
グメントとフィールドのリンクに関する情報が得られ
る、テキストイメージの概略図である。
【図12】 書式充填操作を要求するための書式を含ん
でおり、フィールド及びテキストのマークによって、リ
ンクに関するフィールドとテキストセグメントの継続が
指示されている、一連のイメージの概略図である。
【図13】 書式充填操作を要求するカバーシート、及
び、分離シートを含んでおり、コード化情報によって、
リンクに関するフィールド及びテキストセグメントのタ
イプが指示されている、一連のイメージの概略図であ
る。
【符号の説明】 60 ソフトウェア製品、62 データ記憶媒体、64
記憶媒体アクセス装置、66 プロセッサ、70 イ
メージ入力回路要素、72 ファクシミリ機、74 ス
キャナ、76 書式エディタ、78 ネットワーク、8
0 イメージ出力回路要素、82 ファクシミリ機、8
4 プリンタ、86 ディスプレイ、88ネットワー
ク、120 ファクシミリ機、122 ファックスサー
バ、160デジタルコピー機、162 走査回路要素、
170 ユーザインターフェイス回路要素、172 タ
ッチセンシング装置、180 処理回路要素、190
プリント回路要素、200 スキャナ、210 CP
U、212 キーボード、214 マウス、216 デ
ィスプレイ

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】入力としてイメージを定義するデータを受
    信するイメージ入力回路要素と、 出力としてイメージを定義するデータを送り出すイメー
    ジ出力回路要素と、 イメージ入力回路要素からイメージを定義するデータを
    受信し、イメージ出力回路要素にイメージを定義するデ
    ータを送るように接続されたプロセッサから成るシステ
    ムを操作する方法において、 プロセッサを操作して、イメージ入力回路要素から、第
    1のフィールドを含む書式を示す第1のイメージセッ
    ト、及び、テキストを示す第2のイメージセットを定義
    した入力イメージデータを受信するステップと、 プロセッサを操作して、入力イメージデータを利用し、
    第1のイメージセットから書式のイメージを定義する書
    式イメージデータ、第2のイメージセットからテキスト
    のイメージを定義するテキストイメージデータ、及び、
    第1のフィールド内においてテキストの位置決めが行え
    るように、第1のフィールドまわりの境界位置を示す位
    置決めデータを自動的に得るステップと、 プロセッサを操作して、書式イメージデータ、テキスト
    イメージデータ、及び、位置決めデータを利用すること
    により、自動的に、テキスト及び書式を示し、かつ、第
    1のフィールドの境界内に配置されるテキストを示す、
    第3のイメージセットを定義した出力イメージデータを
    得て、該出力イメージデータをイメージ出力回路要素に
    送るステップを含む、前記方法。
JP5160860A 1992-08-21 1993-06-30 テキストイメージ及び書式イメージの併合による自動イメージ生成 Pending JPH06110996A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US933426 1986-11-21
US93342692A 1992-08-21 1992-08-21

Publications (1)

Publication Number Publication Date
JPH06110996A true JPH06110996A (ja) 1994-04-22

Family

ID=25463932

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5160860A Pending JPH06110996A (ja) 1992-08-21 1993-06-30 テキストイメージ及び書式イメージの併合による自動イメージ生成

Country Status (2)

Country Link
EP (1) EP0585074A3 (ja)
JP (1) JPH06110996A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7783111B2 (en) 2005-10-24 2010-08-24 Konica Minolta Business Technologies, Inc. Writing image acquisition apparatus, writing information extraction method, and storage medium

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100513408B1 (ko) * 1995-02-08 2006-01-27 소니 가부시끼 가이샤 화상편집장치
DE69704367T2 (de) * 1996-09-24 2001-10-31 Colorage, Inc. Rechnersystem und verfahren zur seitenbeschreibungsverarbeitung
US6269190B1 (en) 1996-09-24 2001-07-31 Electronics For Imaging, Inc. Computer system for processing images using a virtual frame buffer
JPH11129568A (ja) * 1997-11-04 1999-05-18 Fujitsu Ltd プリンタ
US6775023B1 (en) 1999-07-30 2004-08-10 Canon Kabushiki Kaisha Center server, information processing apparatus and method, and print system
EP0977113A3 (en) * 1998-07-31 2005-06-08 Canon Kabushiki Kaisha Center server, information processing apparatus and method, and print system
US6981028B1 (en) 2000-04-28 2005-12-27 Obongo, Inc. Method and system of implementing recorded data for automating internet interactions
US9785627B2 (en) 2014-01-23 2017-10-10 Xerox Corporation Automated form fill-in via form retrieval
US9582230B1 (en) 2015-10-09 2017-02-28 Xerox Corporation Method and system for automated form document fill-in via image processing

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01240981A (ja) * 1988-03-23 1989-09-26 Fuji Xerox Co Ltd 画像編集装置
JPH0362267A (ja) * 1989-07-31 1991-03-18 Toshiba Corp イメージ処理装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57150062A (en) * 1981-03-12 1982-09-16 Fuji Xerox Co Ltd Processing of papers
JPS59146373A (ja) * 1983-02-10 1984-08-22 Fuji Xerox Co Ltd 伝票処理装置
US5140650A (en) * 1989-02-02 1992-08-18 International Business Machines Corporation Computer-implemented method for automatic extraction of data from printed forms
US5025396A (en) * 1989-03-21 1991-06-18 International Business Machines Corporation Method and apparatus for merging a digitized image with an alphanumeric character string

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01240981A (ja) * 1988-03-23 1989-09-26 Fuji Xerox Co Ltd 画像編集装置
JPH0362267A (ja) * 1989-07-31 1991-03-18 Toshiba Corp イメージ処理装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7783111B2 (en) 2005-10-24 2010-08-24 Konica Minolta Business Technologies, Inc. Writing image acquisition apparatus, writing information extraction method, and storage medium

Also Published As

Publication number Publication date
EP0585074A2 (en) 1994-03-02
EP0585074A3 (en) 1995-03-15

Similar Documents

Publication Publication Date Title
US5748805A (en) Method and apparatus for supplementing significant portions of a document selected without document image decoding with retrieved information
US7926732B2 (en) OCR sheet-inputting device, OCR sheet, program for inputting an OCR sheet and program for drawing an OCR sheet form
JP4181892B2 (ja) 画像処理方法
US6208744B1 (en) Document image processor and method for setting a document format conforming to a document image
US6377704B1 (en) Method for inset detection in document layout analysis
US8732570B2 (en) Non-symbolic data system for the automated completion of forms
EP0690415B1 (en) Editing scanned document images using simple interpretations
EP0543598B1 (en) Method and apparatus for document image processing
US20040139391A1 (en) Integration of handwritten annotations into an electronic original
EP0544432A2 (en) Method and apparatus for document processing
US5642473A (en) Paper saving reprographic device
US7965293B2 (en) Image processing device, image processing method, and image processing program for reconstructing data
JP2021117750A (ja) 情報処理装置、制御方法及びプログラム
JPH06110996A (ja) テキストイメージ及び書式イメージの併合による自動イメージ生成
JP4232679B2 (ja) 画像形成装置およびプログラム
JP4785655B2 (ja) 文書処理装置及び文書処理方法
US20040057064A1 (en) Method to edit a document on a peripheral device
JP5020698B2 (ja) 画像処理装置、画像処理方法、画像処理プログラム
JP2008257543A (ja) 画像処理システム及びプログラム
JP2637679B2 (ja) ワードイメージの再配置によりテキストの特性を自動的に変更する方法
JP2008129793A (ja) 文書処理システムおよび装置および方法、およびプログラムを記録した記録媒体
JP2006221569A (ja) 文書処理システム、文書処理方法、プログラムおよび記憶媒体
JPH0696288A (ja) 文字認識装置及び機械翻訳装置
WO2023062799A1 (ja) 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム
JP2000050055A (ja) ファクシミリ装置及び送信方法

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19961129