JPH06110996A

JPH06110996A - テキストイメージ及び書式イメージの併合による自動イメージ生成

Info

Publication number: JPH06110996A
Application number: JP5160860A
Authority: JP
Inventors: George G Robertson; ジョージ・ジー・ロバートソン
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 1992-08-21
Filing date: 1993-06-30
Publication date: 1994-04-22
Also published as: EP0585074A2; EP0585074A3

Abstract

(57)【要約】【目的】書式及びテキストの入力イメージを利用して、
フィールドにテキストを納めた書式を示す出力イメージ
を自動的に得る。【構成】イメージ入力回路要素から、第１のフィールド
（１２）を含む書式を示す第１のイメージセット（１
０）、及びテキストを示す第２のイメージセットを定義
した入力イメージデータ（２０）を受信し、第１のイメ
ージセットから書式イメージデータ、第２のイメージセ
ットからテキストイメージデータ、及び第１のフィール
ドまわりの境界位置を示す位置決めデータを自動的に
得、書式イメージデータ、テキストイメージデータ、及
び位置決めデータを利用することにより、自動的に、テ
キスト及び書式を示し、かつ、第１のフィールドの境界
内に配置されるテキストを示す第３のイメージセット
（３０）を定義した出力イメージデータを得て、出力イ
メージデータをイメージ出力回路要素に送る。

Description

【発明の詳細な説明】

【０００１】本発明は、テキストを含むイメージを自動
的に生成する技法に関するものである。

【０００２】スガヌマらに対する米国特許第４，５４
２，３７８号には、リストから受領書または証明書とい
った個々の書類を作成し、あるいは、逆に、個々の書類
からリストを作成するための文書処理技法の記載があ
る。

【０００３】スガヌマらの図１及び２に関連して例示さ
れ、解説されているように、まず、プラテンの所定の位
置に証明書の書式を置いて、走査が行われる。信号は、
２進デジタル化されて、メモリに記憶される。次に、証
明書を必要とする、受領書を含むページを本から選択し
て、プラテンの所定の位置に置き、操作パネルで、受領
書の位置番号を指定し、受領書を走査して、証明書の書
式の場合と同様に、信号はメモリに記憶される。制御セ
クションは、メモリから証明書の書式に関するデータを
読み取り、本からのデータから必要な追加部分を読み出
して、電子的にそれを証明書の書式に関するデータに重
ねている間に、その部分を転記し、最終的な捺印証明書
のためのデータを作成する。捺印証明書のためのデータ
は、次に、プリンタに転送され、操作パネルで出力され
るもとの受領書の位置を指定して、プリントされる。受
領書の面積及びそれを転写すべき書式の面積が異なる場
合には、拡大または縮小操作によって、アライメントを
とることが可能である。

【０００４】スガヌマらの図３及び４に関連して例示さ
れ、解説されているように、切り抜かれる（転記され
る）個々の書類のイメージデータ部分は、あらかじめ、
座標によって指定され、システムによって認識される。
次に、リスト書式をプラテンの所定の位置に置いて、走
査が行われる。信号は、デジタル化して、メモリにファ
イルされる。次に、個々の書類（署名がなされた）が、
リストに現れる順序でスタックされて、自動文書フィー
ダの所定位置に置かれると、次に、プラテンが個々の書
類を走査し、必要な情報をメモリにファイルする。次
に、制御セクションが、メモリからリスト書式に関する
データを読み取り、個々の書類データのあらかじめ記憶
されている指定の部分を切り抜いて、電子的に重ねてい
る間に、リスト書式に関するデータに転記し、リストに
関するデータを作成する。リストに関するデータは、電
子プリンタに転送され、プリントされる。

【０００５】コラム４の４２行〜４６行において、スガ
ヌマらの示すように、もとの書類またはリストに参照記
号をつけることが可能であり、その位置は、その認識に
基づいて計算することができる。コラム４の４７行〜５
１行において、スガヌマらの示すように、個々の書類の
入力順は、システムが個々の書類に付けられた記号また
は数字を認識することによって決定することができる。

【０００６】本発明は、書式のフィールドにテキストを
挿入する際に生じる問題を処理することを目的とするも
のである。多くの書式には、テキストを挿入するフィー
ルドが１つ以上含まれている。

【０００７】テキスト編集ソフトウェアの中には、ユー
ザがテキストを書式に挿入することができるものもあ
る。ただし、これができるのは、書式が、用いられる特
定のテキスト編集ソフトウェアによって編集可能な、電
子文書として利用できる場合に限られるので、滅多なこ
とではあり得ない。編集可能な書式バージョンは、一般
に利用できないが、たとえ利用できたとしても、書式の
改訂のため、おそらく、すたれることになる。

【０００８】電子文書において利用可能なテキストが、
紙の文書として利用可能な書式のフィールドにプリント
できる場合もある。例えば、テキスト編集ソフトウェア
を利用して、テキストの書式作成を行い、マージン、ブ
ランクスペース、または、他の書式特徴を挿入すること
によって、テキストが、フィールド内に納まるように位
置決めされ、形成されていると思えるようにすることが
可能である。書式作成されたテキストは、従って、その
書式のコピーにプリントすることが可能である。しか
し、フィールド内に正確にテキストを位置決めするに
は、何回か繰り返す必要があるので、この技法も非能率
的である。

【０００９】テキストを手動でタイプするか、または、
書き込むことによって、紙の文書として利用可能な書式
のフィールドにテキストを挿入することが可能である。
ただし、既存の文書中においてテキストの利用が可能で
ある場合、再タイプまたは再書き込みは非能率的であ
り、エラーを生じる可能性がある。

【００１０】紙の文書において利用可能な、あるいは、
電子文書から紙にプリント可能なテキストを切り抜い
て、紙の文書として利用可能な書式のフィールド内に貼
り付けることも可能である。さらに、切り抜いて、貼り
付けるバージョンの書式をコピーすることも可能であ
る。ワードのように、テキストの小セグメントを切り抜
いて、貼り付けなければならない場合には、この技法
は、非能率的であり、面倒である。さらに、この技法
は、貼り付けられるセグメントの歪み、または、貼り付
けられるセグメントのエッジを示すラインまたはシャド
ーといった人工的要素を導入する可能性がある。

【００１１】本発明は、さらに、これらの課題を回避す
る書式のフィールド内にテキストを挿入するための技法
の発見に基づくものである。この技法には、書式のイメ
ージとテキストのイメージを併合する(merge) 効果があ
る。

【００１２】該技法は、入力イメージデータを受信し、
この入力イメージデータを利用して、自動的に出力イメ
ージデータが得られるようにすることによって実現可能
である。入力イメージデータは、書式を含む第１のイメ
ージを定義する。入力イメージデータは、また、テキス
トを含む第２のイメージも定義する。出力イメージデー
タは、第２のイメージからのテキストがフィールド内に
納められた、第１のイメージからの書式を含む第３のイ
メージを定義する。

【００１３】出力イメージデータを得るため、該技法で
は、入力イメージデータから書式イメージデータ、テキ
ストイメージデータ、及び、位置決めデータを自動的に
得る。書式イメージデータは、書式のイメージを定義す
る。テキストイメージデータは、テキストのイメージを
定義する。位置決めデータは、テキストをフィールド内
に配置することができるように、書式内におけるフィー
ルドの境界位置を表示する。該技法では、さらに、書式
イメージデータ、テキストイメージデータ、及び、位置
決めデータを利用して、自動的に出力イメージデータを
得るので、第３のイメージには、テキストがフィールド
の境界内に位置決めされた書式が含まれることになる。

【００１４】本発明の技法は、効率がよく、容易な自動
書式充填(automatic form filling)を可能にするので、
有利である。

【００１５】図１は、２つのイメージ、すなわち、書式
に関するイメージとテキストに関するイメージを併合し
て、書式内のフィールドにテキストを位置決めする方法
を示す概略流れ図である。図２は、図１のように書式及
びテキストのイメージを併合する際における一般的なア
クションを示すフローチャートである。図３は、図２の
ように、イメージを自動的に併合するシステムによって
アクセス可能なソフトウェア製品を示す概略ブロック図
である。図４は、書式とテキストのイメージを自動的に
併合することの可能なファックスサーバを示す概略ブロ
ック図である。図５は、書式とテキストのイメージを自
動的に併合することの可能な処理回路要素を備えたデジ
タルコピー機を示す概略ブロック図である。図６は、書
式とテキストのイメージを自動的に併合することの可能
なＣＰＵを備えたコンピュータを示す概略ブロック図で
ある。図７は、単純な書式のイメージと単純なテキスト
のイメージを自動的に併合するアクションを示す概略流
れ図である。図８は、フィールドにマーキングを施され
た書式のイメージとテキストセグメントにマーキングを
施されたテキストのイメージを自動的に併合する場合の
アクションを示す概略流れ図である。図９は、コード化
された書式を識別する情報を備えた書式のイメージとテ
キストセグメントを示すコード化された情報を備えたテ
キストのイメージを自動的に併合する場合のアクション
を示す概略流れ図である。図１０は、図７〜９のよう
に、イメージを自動的に併合する場合の一般的なアクシ
ョンを示す概略流れ図である。図１１は、パラグラフ間
の間隔によって、テキストセグメントとフィールドのリ
ンクに関する情報が得られる、テキストイメージの概略
図である。図１２は、書式充填操作を要求するための書
式を含んでおり、フィールド及びテキストのマークによ
って、リンクに関するフィールドとテキストセグメント
の継続が指示されている、一連のイメージの概略図であ
る。図１３は、書式充填操作を要求するカバーシート、
及び、分離シートを含んでおり、コード化情報によっ
て、リンクに関するフィールド及びテキストセグメント
のタイプが指示されている、一連のイメージの概略図で
ある。

【００１６】図１〜３には、本発明の一般的な特徴が示
されている。図１は、２つのイメージ、すなわち、書式
に関するイメージと、テキストに関するイメージを併合
して、フィールド内にテキストが配置された書式のイメ
ージが自動的に得られるようにする方法を示した概略流
れ図である。図２は、図１の場合のように２つのイメー
ジを自動的に併合する際における一般的なアクションを
示すフローチャートである。図３は、アクセスすること
によって、図２の場合のように自動的に２つのイメージ
を併合することができるソフトウェア製品を示した概略
ブロック図である。

【００１７】図１のイメージ１０には、フィールド１２
を備えた書式が示されている。フィールド１２には、ラ
インで包囲されたブランク領域が例示されている。多く
の書式には、フィールドまわりに、ライン、コーナ記
号、エッジ、または、テキストを挿入すべき境界を示す
同様の境界キューが含まれている。また、多くの書式に
は、フィールドの境界内、または、そのすぐ外側に、フ
ィールドに挿入すべきテキストのタイプを示す少量のテ
キストが含まれている。

【００１８】図１のイメージ２０には、テキスト「ＷＯ
ＲＤＳＧＯＩＮＴＯＦＩＥＬＤ」が示されてい
る。

【００１９】図１におけるイメージ３０を定義するデー
タは、イメージ１０及び２０を定義するデータから自動
的に得られる。イメージ１０の書式を定義するデータ
は、イメージ１０を定義するデータから得られる。イメ
ージ２０のテキストを定義するデータは、イメージ２０
を定義するデータから得られる。フィールド１２の境界
を示す位置決めデータは、やはり、イメージ１０を定義
するデータから得られるので、図示のように、テキスト
をイメージ３０のフィールド３２内に位置決めすること
が可能になる。

【００２０】図２のボックス４０におけるアクション
は、図１のイメージ１０同様、フィールドを備えた書式
を示す第１のイメージセット、及び、図１のイメージ２
０と同様、テキストを示す第２のイメージセットを定義
する入力イメージデータを受信することである。ボック
ス４２におけるアクションは、自動的に、書式のイメー
ジを定義する書式イメージデータ、テキストのイメージ
を定義するテキストイメージデータ、及び、フィールド
の境界の位置を示す位置決めデータを得ることである。
ボックス４４におけるアクションは、ボックス４２で得
たデータを利用して、図１におけるイメージ３０と同
様、テキストがフィールドの境界内に納められた書式を
示す第３のイメージセットを定義するデータを自動的に
得ることである。

【００２１】図３には、図３に示すようなコンポーネン
トを含むシステムにおいて用いることの可能な製品であ
る、ソフトウェア製品６０が示されている。ソフトウェ
ア製品６０には、記憶媒体アクセス装置６４によってア
クセス可能なデータ記憶媒体６２が含まれている。例え
ば、データ記憶媒体６２は、組をなす１つ以上のフロッ
ピーディスクのような磁気媒体、組をなす１つ以上のＣ
Ｄ−ＲＯＭのような光学媒体、または、データの記憶に
適した他の媒体とすることが可能である。

【００２２】データ記憶媒体６２は、記憶媒体アクセス
装置６４が、プロセッサ６６に対して与えることの可能
なデータを記憶している。プロセッサ６６は、イメージ
入力回路要素７０からイメージを定義するデータを受信
するように接続されている。データは、ファクシミリ
（ファックス）機７２、デジタルコピー機またはコンピ
ュータの入力／出力装置のスキャナとすることが可能な
スキャナ７４、キーボード及びマウス、または、ペンま
たはスタイラスベースの入力装置といった、ユーザ入力
装置によって制御される書式エディタまたは他の対話式
イメージエディタとすることが可能な書式エディタ７
６、あるいは、ローカルエリアネットワークまたはイメ
ージを定義するデータを送信することの可能な他のネッ
トワークとすることが可能なネットワーク７８から得る
ことが可能である。

【００２３】プロセッサ６６は、また、イメージを定義
するデータをイメージ出力回路要素８０に供給するよう
に接続されている。データは、さらに、ファックス機８
２、プリンタ８４、ディスプレイ８６、または、ネット
ワーク８８にも供給することができる。プリンタ８４
は、デジタルコピー機またはコンピュータの入力／出力
装置のプリンタとすることが可能である。

【００２４】データ記憶媒体６２以外に、ソフトウェア
製品６２には、記憶媒体６２によって記憶されたデータ
が含まれている。記憶されたデータには、図２のボック
ス４０におけるアクションを実施するために実行可能な
イメージ受信命令９０を指示するデータが含まれてい
る。記憶されたデータには、応答命令９２を指示するデ
ータも含まれている。応答命令９２を実行することによ
って、図２のボックス４２に示すように、書式イメージ
データ、テキストイメージデータ、及び、位置決めデー
タを自動的に得ることが可能である。応答命令９２を実
行することによって、図２のボックス４４に示すよう
に、併合したイメージを定義するデータを自動的に得る
ことも可能である。

【００２５】上述の一般的な特徴は、併合したイメージ
を得るための、各種機械におけるさまざまな方法によっ
て実現することができる。

【００２６】図４〜６には、従来の部品を修正すること
によって本発明を実施することが可能になる３つの機械
が示されている。図４には、ファックスサーバの実施例
が示されている。図５には、デジタルコピー機の実施例
が示されている。図６には、コンピュータの実施例が示
されている。

【００２７】図４の場合、ファックス機１２０を利用し
て、イメージセットを定義するデータが、ファックスサ
ーバ１２２に送られる。送られたデータは、第１の書式
を示すイメージ１３０、第２の書式を示すイメージ１３
２、及び、テキストを示すイメージ１３４を定義する。
第１の書式には、第２の書式とテキストを併合する書式
充填操作を要求するマーキングが施されたチェックボッ
クス１３６を備える第１のフィールドが含まれている。

【００２８】ファックスサーバ１２２は、イメージを定
義するデータ１３０を利用して、チェックボックス１３
４にマーキングが施されていることを示す、イメージを
定義するデータ１３０の情報に基づいて、書式充填操作
に関する要求を示す書式充填要求データを得る。次に、
この要求に応答して、ファックスサーバ１２２は、イメ
ージを定義するデータ１３２を利用して、書式を示すイ
メージを定義する書式イメージデータを自動的に得る。
ファックスサーバ１２２は、また、イメージを定義する
データ１３４を利用して、テキストを示すイメージを定
義するテキストイメージデータを自動的に得る。ファッ
クスサーバ１２２は、また、イメージを定義するデータ
１３０、１３２、及び、１３４を利用して、テキストを
フィールド内に位置決めすることができるように、書式
のフィールドまわりにおける境界の位置を示す位置決め
データを自動的に得る。ファックスサーバ１２２は、書
式イメージデータ、テキストイメージデータ、及び、位
置決めデータを利用して、フィールド内にテキストを納
めた書式を示すイメージを定義するデータを自動的に得
る。ファックスサーバ１２２は、このデータをファック
ス機１２０に送り、これがプリントされて、イメージ１
４０が得られることになる。

【００２９】図５の場合、デジタルコピー機１６０に
は、書式を示すイメージ１６４及びテキストを示すイメ
ージ１６６を定義するデータを得る走査回路要素１６２
が含まれている。ユーザインターフェイス回路要素１７
０には、押しボタン、感熱または感圧素子、容量検知素
子、または、触れる動作を検知する他の装置とすること
が可能な、タッチセンシング装置１７２が含まれてい
る。ユーザが装置１７２に触れると、ユーザインターフ
ェイス回路要素１７０は、装置１７２に触れたことを示
すタッチデータを送り出す。

【００３０】処理回路要素１８０は、タッチデータを利
用して、書式充填操作に関する要求を示す書式充填要求
データを得る。次に、処理回路要素１８０は、この要求
に応じて、イメージ１６４及び１６６を定義するデータ
を利用して、書式を示すイメージを定義する書式イメー
ジデータ、テキストを示すイメージを定義するテキスト
イメージデータ、及び、テキストをフィールド内に位置
決めすることができるように、書式のフィールドまわり
における境界位置を示す位置決めデータを自動的に得
る。処理回路要素１８０は、形状イメージデータ、テキ
ストイメージデータ、及び、位置決めデータを利用し
て、テキストがフィールド内に納まった書式を示すイメ
ージを定義するデータを自動的に得る。このデータは、
プリント回路要素１９０に送られて、イメージ１９２が
プリントされる。

【００３１】図６の場合、スキャナ２００は、書式を示
すイメージ２０２及びテキストを示すイメージ２０４を
定義するデータを得る。このデータは、ワークステーシ
ョンまたはパーソナルコンピュータといったコンピュー
タのＣＰＵ２１０に供給される。ＣＰＵ２１０は、キー
ボード２１２及びマウス２１４からユーザアクションを
示すデータを受信し、イメージを定義するデータをディ
スプレイ２１６に供給するように接続されている。ＣＰ
Ｕは、書式充填操作を要求するために、選択できる選択
可能なユニット２２０を含むイメージを送り出す。ユー
ザは、マウス２１４を利用して、ポインタの位置決めを
行い、選択可能なユニット２２０の選択を指示する信号
を送り出すことができる。

【００３２】ＣＰＵ２１０は、この信号を利用して、書
式充填操作の要求を示す書式充填要求データを得る。Ｃ
ＰＵ２１０は、要求に応答し、イメージ２０２及び２０
４を定義するデータを利用して、書式を示すイメージを
定義する書式イメージデータ、テキストを示すイメージ
を定義するテキストイメージデータ、及び、フィールド
内にテキストを位置決めすることができるように、書式
のフィールドまわりにおける境界の位置を示す位置決め
データを自動的に得る。このデータは、プリンタ２３０
に供給されて、イメージ２３２がプリントされることに
なる。

【００３３】図７〜１０には、書式イメージデータ、テ
キストイメージデータ、及び、位置決めデータを自動的
に得て、これを利用し、フィールド内にテキストが納ま
った書式を示すイメージを定義するデータを自動的に得
る方法が示されている。図７には、単純なイメージから
書式イメージデータ、テキストイメージデータ、及び、
位置決めデータを得る実施例が示されている。図８に
は、ユーザによるマーキングが施されたイメージから書
式イメージデータ、テキストイメージデータ、及び、位
置決めデータを得る実施例が示されている。図９には、
機械に読み取り可能なコード化情報を含むイメージから
書式イメージデータ、テキストイメージデータ、及び、
位置決めデータを得る実施例が示されている。図１０に
は、書式及びテキストの歪み除去、テキストのスケーリ
ング、及び、テキストの再書式作成が示されている。

【００３４】図７の場合、イメージ２５０には、フィー
ルド２５２及び２５４を含む書式が示されている。フィ
ールド２５２は、比較的小さいフィールドであり、一
方、フィールド２５４は、比較的大きいフィールドであ
る。イメージ２６０は、テキスト２６２を示している
が、非テキスト情報（図示せず）を含むことも可能であ
る。上述のように、ファックス機または他の走査回路要
素を利用して、イメージ２５０及び２６０を定義するデ
ータを得ることが可能である。

【００３５】イメージ２５０を定義するデータを利用し
て、イメージ２７０、すなわち、フィールド２５２及び
２５４内のピクセルが、全て、黒で、該フィールド外の
ピクセルが、全て、白い、イメージ２５０のバージョン
を定義するデータを得ることも可能である。イメージ２
７０は、形態学的技法によって得られるマスクとするこ
とも可能である。例えば、イメージ２７０を定義するデ
ータは、まず、閉じた境界に達するまで、イメージのエ
ッジから内側に黒のピクセルで充填する形態学的エッジ
充填操作を実施することによって得ることが可能であ
り、次に、エッジを充填したイメージを反転して、イメ
ージ２７０におけるように、フィールド２５２及び２５
４内が黒のピクセルになり、他の部分は白のピクセルに
なるようにすることができる。

【００３６】別様のべた塗りの領域内における小さな特
徴は、イメージ２５０を定義するデータに形態学的(mol
phological) 開放操作を施して、全体に白い領域内の黒
のピクセルを白のピクセルに変換することによって、除
去することができる。大きいフィールド内にネストされ
た小さいフィールドを見つけるため、大きい方のフィー
ルド内において、任意の位置から始めて、形態学的充填
操作を実施することができ、充填操作によって充填され
た領域が大きいフィールドより小さければ、大きいフィ
ールドからその充填した領域を除去することが可能であ
り、非充填領域に対してさらに充填操作を実施すること
によって、他のより小さいフィールドを見つけることが
できる。上述のエッジ充填操作によって見つかったフィ
ールドの内容を抽出することが所望の場合、反転したエ
ッジ充填イメージに、もう１度エッジ充填を施して、反
転することにより、内容のイメージを得ることが可能で
あり、次に、このイメージを利用して、フィールドの内
容を削除することができる。

【００３７】フィールドの境界が、連続していない場合
には、エッジ充填技法がうまく作用しないこともあり得
る。エッジの充填前に、形態学的閉鎖操作を実施して、
フィールドの境界におけるギャップを閉じることが可能
である。代替案として、形態学的技法を利用して、イメ
ージ２５０内の接続された各構成要素毎に境界をなすボ
ックスを見つけ、その後、境界ボックスにサイズ判定基
準を当てはめることが可能である。フィールドは、接続
された最大の構成要素であるため、たとえその境界が連
続していなくても、サイズ判定基準によって選択される
ことになる。従って、境界ボックスを利用することによ
って、イメージ２７０を定義するデータを得ることが可
能である。

【００３８】次に、イメージ２７０を定義するデータを
利用して、イメージ２８０、すなわち、セグメント２８
２内のピクセルが、全て、黒で、他のピクセルが、全
て、白い、イメージ２７０のバージョンを定義するデー
タを得ることができる。イメージ２８０におけるセグメ
ント２８２内のピクセルは、ブランク領域の判定基準及
びサイズしきい値をイメージ２７０内の黒セグメントの
それぞれに適用することによって、他のピクセルから弁
別することができる。次に、イメージ２８０を定義する
データを利用して、セグメント２８２の水平及び垂直境
界を示すデータといった位置決めデータを得ることがで
きる。

【００３９】ブランク領域の各種判定基準を利用して、
既にテキストまたはグラフィックスを含んでいるセグメ
ントからセグメント２８２を弁別することができる。例
えば、セグメント内の白のピクセルをカウントして、セ
グメント内における白のピクセル対全ピクセルの割合を
求めることが可能である。次に、この割合としきい値の
比較を行って、そのセグメントが主として白であるか否
かの判定を行うことができる。そうでなければ、そのセ
グメントは、充填すべき候補ではないということにな
る。

【００４０】同様に、各種サイズのしきい値を利用する
ことも可能である。例えば、サイズのしきい値は、連続
した黒ピクセルの数、または、各方向に１インチといっ
た寸法とすることが可能である。セグメント２７４のよ
うなしきい値未満のセグメントは、そのサイズが小さい
ため、テキストを充填すべき候補にはならない。しきい
値は、各セグメントにおける黒ピクセルのカウント、ま
たは、各セグメントに納まる最大矩形の高さと幅の測定
値に適用することが可能である。省略時のサイズしきい
値を用いる代わりに、書式上のマーク、ユーザインター
フェイス回路要素、または、グラフィカルユーザインタ
ーフェイルを介して、ユーザからサイズしきい値を表し
たデータを得ることができる。

【００４１】同様に、イメージ２６０を定義するデータ
を利用して、イメージ２９０、すなわち、テキスト２６
２まわりの境界ボックス内のピクセルが、全て、黒で、
その他のピクセルが、全て、白い、イメージ２６０のバ
ージョンを定義するデータを得ることが可能である。イ
メージ２９０をマスクとすることも可能である。イメー
ジ２９０のセグメント２９２内におけるピクセルは、テ
キスト領域判定基準を適用することによって、他のピク
セルから弁別することが可能である。次に、セグメント
２９２まわりに、境界ボックスを得ることができ、この
境界ボックスの充填によって、イメージ２９０を定義す
るデータを生成することが可能になる。この技法は、テ
キストの多くのイメージに有効に作用するが、他のテキ
ストイメージのために同様の技法を開発することも可能
である。

【００４２】さまざまなテキスト領域判定基準を用いる
ことが可能である。例えば、水平フィルタによる４回に
わたる整理編集を行い、引き続き、テキストの各行を充
填する形態学的水平閉鎖操作、及び、テキストの各列を
充填する形態学的垂直閉鎖操作を施すことができる。こ
れらの操作によって、テキストの水平行を含む領域に接
続された構成要素を形成することができる。次に、接続
された構成要素のまわりに、境界ボックスを得ることが
できる。テキストを含むイメージからグラフィックスを
除去することが可能になる。

【００４３】次に、イメージ２９０を定義するデータを
利用して、イメージ２９４、すなわち、テキスト２６２
だけしか含んでいないイメージを定義するデータを抽出
することができる。これは、イメージ２９０の各ピクセ
ルを反転し、次に、反転イメージにおける各白のピクセ
ル毎に、同じ位置にあるイメージ２６０からピクセルを
得ることによって実施可能である。

【００４４】次に、イメージ２９４の境界ボックスの寸
法、及び、セグメント２８２内に納めることの可能な最
大矩形の寸法を利用して、フィールド２５４に納まるよ
うに、イメージ２９４にスケーリングを施すべきか否か
の判定を行うことができる。スケーリングを施すべきで
あるという場合には、Ｓｃｏｔｔ他のＵＳ−Ａ５，０９
７，５１８に記載の技法または他の従来の技法に基づい
て、適合するスケーリング施すことが可能である。イメ
ージ２９４のスケーリングによって、イメージ２９６を
定義するデータが得られる。

【００４５】次に、イメージ２９６を定義するデータ及
びイメージ２５０を定義するデータを利用して、イメー
ジ３００、すなわち、フィールド３０２がイメージ２６
０におけるテキスト２６２と同じシーケンスのワードを
示し、一方、イメージ３００の残りの部分が、フィール
ド２５２と同じフィールド３０４を含んでおり、イメー
ジ２５０に示す書式の残りの部分と同じになる、イメー
ジ２５０のバージョンを定義するデータを得ることが可
能である。例えば、イメージ２９６の上方左手コーナを
イメージ２８０におけるセグメント２８２の上方左手コ
ーナと同じ位置に配置し、次に、イメージ２５０の各ピ
クセルと、もしある場合には、イメージ２９６における
同じ位置のピクセルとの間においてＯＲ演算を実施する
ことによって、イメージ２９６及び２５０を利用するこ
とも可能である。結果として、イメージ２５０内におい
て黒のピクセルは、イメージ３００においても黒である
が、イメージ２９６における黒のピクセルと同じ位置に
ある、イメージ２５０における白のピクセルは、黒のピ
クセルにスイッチされ、一方、他の白のピクセルは、白
のままということになる。

【００４６】図８は、図７に似ているが、上述の判定基
準及びサイズしきい値を必要としない実施例を示してい
る。

【００４７】図８の場合、イメージ３２０は、図７にお
けるイメージ２５０と同様、フィールド３２２及び３２
４を含む書式を示している。さらに、ユーザは、フィー
ルド３２４内にマーク３２６を付けて、フィールド３２
４にテキストを充填すべきであることを指示している。

【００４８】イメージ３２０を定義するデータを利用し
て、イメージ３３０、すなわち、フィールド３２４内の
ピクセルが、全て、黒で、フィールド３２４外のピクセ
ルが、全て、白い、イメージ３２０のバージョンを定義
するデータを得ることが可能である。イメージ３３０
は、マスクとすることも可能である。例えば、フィール
ド３２２及び３２４に関するマスクは、図７のイメージ
２７０に関連して上述のように、得ることが可能であ
り、次に、マーク３２６は、その大きさ及び曲率、すな
わち、フィールド３２２及び３２４の境界のような直線
の特徴だけでなく小さい文字とも区別する組み合わせ判
定基準に基づいて、検出することが可能であり、次に、
マーク３２６からのピクセルを種として利用して、マス
クの反転バージョンに充填を行うことが可能であり、充
填した反転マスクと非反転マスクをＡＮＤ演算によって
組み合わせて、イメージ３３０を定義するデータを得る
ことが可能である。代替案として、マーク３２６を強調
マークにし、ブルームバーグ (Bloomberg)らの米国特許
第５，０４８，１０９号明細書に記載のある技法を利用
して、検出できるようにすることも可能である。他の同
様の各種技法を利用することも可能である。

【００４９】次に、イメージ３２０を定義するデータ及
びイメージ３３０を定義するデータを利用して、イメー
ジ３４０、すなわち、イメージ３３０のセグメント３３
２によって形成される領域内のピクセルが、全て、白で
あり、従って、マーク３２４が除去されることになる、
イメージ３２０のバージョンを定義するデータを得るこ
とが可能になる。イメージ３２０と同様、イメージ３４
０には、フィールド３４２及び３４４が含まれている。

【００５０】イメージ３５０には、マーク３５２で囲ま
れたテキストが示されている。マーク３５２は、ユーザ
が、マークで囲んだテキストを利用して、イメージ３２
０に示す書式のフィールドを充填するように指示するた
めに、付けることができる。

【００５１】イメージ３５０を定義するデータを利用し
て、イメージ３６０、すなわち、マーク３５２で囲んだ
テキストまわりの境界ボックス内のピクセルが、全て、
黒で、その他のピクセルが、全て、白い、イメージ３５
０のバージョンを定義するデータを得ることが可能であ
る。例えば、マーク３５２は、その大きさ及び曲率、す
なわち、その内側にあるような小さい文字から区別する
組み合わせ判定基準に基づいて検出することが可能であ
り、次に、マーク３５２の内側のテキストに関するマー
クは、図７のイメージ２７０に関連して解説のような技
法を用いて、得ることが可能であり、従って、イメージ
３６０を定義するデータが得られることになる。代替案
として、マーク３５２を強調マークにし、ブルームバー
グらの米国特許第５，０４８，１０９号明細書に記載の
ある技法を利用して、検出できるようにすることも可能
である。他の同様の各種技法を利用することも可能であ
る。マーク３５２がテキストとクロスする場合、さら
に、テキストからマーク３５２を取り除くステップが、
必要になる可能性もある。

【００５２】次に、イメージ３６０を定義するデータを
利用して、イメージ３６４を定義するデータを抽出し、
これにスケーリングを施すことによって、図７に示すよ
うに、イメージ３６６を定義するデータを得ることが可
能である。さらに、図７に示すように、イメージ３６６
を定義するデータ及びイメージ３４０を定義するデータ
を利用して、イメージ３７０、すなわち、フィールド３
７２が、イメージ３５０のマーク３５２によって囲まれ
たテキストと同じシーケンスのワードを示し、一方、イ
メージ３７０の残りの部分は、フィールド３４２と同じ
フィールド３７４を含んでおり、イメージ３４０に示す
書式の残りの部分と同じになる、併合されたイメージを
定義するデータを得ることが可能になる。

【００５３】図８のマーク３２６及び３５２は、検出を
容易にする、特殊なマーキング物質で付けることが可能
である。

【００５４】図９は、図７及び図８に似ているが、判定
基準、サイズ、しきい値、ユーザマーク、及び、上述の
イメージ処理の大部分を必要としない、実施例を示すも
のである。

【００５５】図９の場合、イメージ４００には、イメー
ジ４００を定義するデータを受信するプロセッサが読み
取って、フィールド４０２及び４０４、及び、イメージ
４００に示す書式の他の特徴を定義するデータを得るこ
とが可能な、機械に読み取り可能な書式を識別する情報
４０６が含まれている。プロセッサは、このデータを利
用して、フィールド４０４が、書式充填操作の要求に応
答して、テキストを充填すべきフィールドであることを
判定することができる。プロセッサは、さらに、このデ
ータを利用して、フィールド４０４の境界を示す位置決
めデータを得ることが可能である。

【００５６】イメージ４１０には、テキスト４１２、テ
キスト４１２の開始位置を示す機械に読み取り可能な情
報４１４、及び、テキスト４１２の終了位置を示す機械
に読み取り可能な情報４１６が示されている。イメージ
４１０を定義するデータを受信するプロセッサは、従っ
て、テキスト４１２の境界を示すデータを得ることがで
きる。

【００５７】イメージ４００及び４１０の機械に読み取
り可能な情報をコード化して、イメージに含めることも
可能である。代替案として、機械に読み取り可能な情報
をコード化して、シェパード(Shepard) の米国特許第
４，０２１，７７７号明細書に解説の方法でイメージに
含めることも可能である。

【００５８】プロセッサは、テキスト４１２の境界を示
すデータ及びイメージ４１０を示すデータを利用して、
イメージ４２０を定義するデータを抽出し、これにスケ
ーリングを施して、図７及び８に示すように、イメージ
４２２を定義するデータを得ることが可能である。さら
に、図７及び８に示すように、次に、イメージ４２２を
定義するデータ及びイメージ４００を定義するデータを
利用して、イメージ４３０、すなわち、フィールド４３
２が、イメージ４１０におけるテキスト４１２と同じシ
ーケンスのワードを示し、一方、イメージ４３０の残り
の部分は、フィールド４０２と同じフィールド４３４を
含んでおり、イメージ４００に示す書式の残りの部分と
同じになる、併合されたイメージを定義するデータを得
ることが可能になる。

【００５９】図１０には、上述の実施例のいずれかと共
に生じる可能性のある例が示されている。プロセッサ
は、イメージ４５０及び４６０に関する書式充填操作の
要求を受信する。イメージ４５０は、反時計廻り方向に
わずかに歪んだフィールド４５２を備えた書式を示して
いる。イメージ４６０は、時計廻り方向にわずかに歪ん
だテキスト４６２を示している。逆の歪みに加えて、フ
ィールド４５２は、比較的高さが低く、幅が広いが、テ
キスト４６２は、比較的高さが高く、幅が狭い。

【００６０】第１のステップでは、両方のイメージの内
容に歪み除去を施す。イメージ４５０を定義するデータ
を利用して、イメージ４７０、すなわち、フィールド４
７２がフィールド４５２と同じであるが、歪んでいな
い、イメージ４５０のバージョンを定義するデータを得
ることが可能である。同様に、イメージ４６０を定義す
るデータを利用して、イメージ４８０、すなわち、テキ
スト４８２がテキスト４６２と同じであるが、歪んでい
ない、イメージ４６０のバージョンを定義するデータを
得ることが可能である。歪みは、タナカらの米国特許第
４，７５９，０７６号明細書に記載のように、検出し、
補正することができる。

【００６１】次のステップは、テキスト４８２がフィー
ルド４７２に納まったイメージを定義するデータを得る
ことである。イメージ４９０は、図７〜９における実施
例に基づき、テキスト４８２にスケーリングを施して、
フィールド４９２内に納まるようにした例である。ただ
し、フィールド４９２内のワードは、極めて小さいの
で、読み易さが十分ではない。読み易さは、文字の高さ
を求めて、その高さと、それ以下では読み取りが十分に
行えなくなるしきい値との比較を行うことによって判定
することができる。代替案として、読み易さは、フィー
ルド内に納まるようにするために、テキストイメージに
施すことが必要な縮小率が５０％を超える場合に、例え
ば、テキストの読み易さが十分でなくなるといった、ス
ケーリングの範囲に基づいて判定することも可能であ
る。

【００６２】スケーリングによって、テキスト４８２の
満足のいくイメージが得られないと判定すると、プロセ
ッサは、テキスト４８２内のワードの位置決めをやり直
して、同じ配列に留まるが、結果として、異なる形状に
なるようにすることができる。イメージ５００は、ワー
ド「ｌｉｎｅｓ」が、最初の行に再位置決めされ、ワー
ド「ｗｅｒｅａｔａ」が、２行目に再位置決めされ
た例である。ただし、このアプローチは、ワード「ｓｋ
ｅｗ」がフィールド５０２内に納まらず、従って、省略
されているので、図示の例でも満足のいくものではな
い。

【００６３】こうしたアプローチの代わりに、イメージ
４７０及び４８０を定義するデータを利用して、フィー
ルド５１２内に納まるように、テキスト４８２に対して
スケーリングと再書式作成の両方を施した、イメージ５
１０を得ることも可能である。プロセッサは、フィール
ド４７２のサイズ、及び、テキスト４８２におけるワー
ドサイズ及び間隔に基づいて、さまざまなやり方で、自
動的にスケーリング及び再書式作成の決定を行うことが
できる。例えば、テキスト４８２を３行に再書式作成し
て、フィールド４７２に納まるようにスケーリングを施
すことが可能であり、これで満足できなければ、次に、
２行に再書式作成して、納まるようにスケーリングをほ
どことが可能であり、やはり、満足できなければ、次
に、１行に再書式作成して、等等。あるいは、可能な全
ての再書式作成を試みて、その比較を行い、フィールド
４７２に納めるのに必要なスケーリングが最小ですむも
のを見つけ出すことも可能である。

【００６４】図１０に示すように、フィールドに納まる
が、そのフィールドに対して不適切な書式作成が施され
ているテキストに対して、再書式作成を施すことも可能
である。例えば、細い列のテキストに再書式作成を施し
て、広いフィールドに納め、後続のテキストのためにフ
ィールドの下部に追加スペースを残すことも可能であ
る。

【００６５】上述の実施例の場合、単一のテキストセグ
メントを利用して、単一のフィールドの充填が行われて
いる。しかし、フィールドの中に、他のフィールドと継
続したものがあったり、テキストが文書の異なる部分か
ら取り出されるといったことが考えられる、多くの用途
では、いくつかの異なるフィールドにテキストを充填す
ることが望ましい。これは、各フィールドをそのフィー
ルドの充填に用いられるテキストとリンクさせることに
よって実現可能である。

【００６６】図１１〜１３には、書式充填操作における
リンクが示されている。図１１には、テキストのパラグ
ラフ間における間隔によって、パラグラフとフィールド
のリンクに用いられる情報を得ることの可能にする方法
が示されている。図１２には、フィールド及びテキスト
内のマークによって、フィールドとテキストセグメント
間の継続を示し、一連のフィールドと一連のテキストセ
グメントのリンクを可能にする方法が示されている。図
１３には、コード化した情報によって、フィールド及び
テキストセグメントの特徴を示し、フィールドと適合す
るテキストセグメントのリンクを可能にする方法が示さ
れている。

【００６７】図１１には、図７の実施例に用いられる異
なるフィールドに挿入されるテキストを示す方法が示さ
れている。イメージ５５０には、３つのパラグラフに分
割される、テキストのいくつかの行が含まれている。パ
ラグラフ５５２及び５５４は、１スペース分分離されて
おり、パラグラフ５５４及び５５６は、２スペース分分
離されている。パラグラフ間の間隔は、測定可能であ
り、それを行うための技法をイメージの適合するセグメ
ントに適用して、特定のパラグラフの間隔を測定するこ
とができる。

【００６８】２つ以上のフィールドを備えた書式を示す
イメージ及びイメージ５５０を形成するデータを受信す
るプロセッサは、間隔の差を利用して、フィールド及び
テキストのリンクを決定することができる。プロセッサ
は、書式内において見いだされる順番に各フィールドを
取り扱い、イメージ５５０内において見いだされる順番
に各フィールドにテキストを充填することができる。プ
ロセッサは、従って、パラグラフ５５２のテキストと第
１のフィールドをリンクすることができる。パラグラフ
５５２と５５４の間が１スペースであることが分かる
と、プロセッサは、パラグラフ５５４のテキストと最初
のフィールドをリンクすることもできる。しかし、ラグ
ラフ５５４と５５６の間が２スペースであることが分か
ると、プロセッサは、パラグラフ５５６のテキストと最
初のフィールドに後続する第２のフィールドをリンクす
ることができる。

【００６９】図１２には、図８の実施例に用いられるフ
ィールド及びテキストセグメントの継続を示す方法が示
されている。

【００７０】イメージ５７０は、プロセッサが、書式を
記述するデータを得るために利用可能な、機械に読み取
り可能な書式を識別する情報が含まれた書式を示してい
る。例えば、識別情報を利用して、書式の記述を直接得
ることもできるし、あるいは、記憶されている書式の記
述にアクセスするためのデータを得ることもできる。書
式の記述を利用して、書式のフィールドからデータを得
ることも可能である。

【００７１】イメージ５７０には、書式充填操作を要求
するためのフィールドが含まれており、このフィールド
のチェックボックス５７４にマーキングを施すことによ
って、要求が指示される。もう１つのフィールドには、
充填すべき書式の２桁のページ数を表すチェックボック
スグリッド５７６が含まれており、必要があれば、プロ
セッサによる認識のため、ボックス５７８に大きい方の
数を書き込むことができる。

【００７２】イメージ５７０を定義するデータを受信す
るプロセッサは、書式を示す第１のイメージセット５８
０、及び、テキストを示す第２のイメージセット６００
を受信する。イメージ５７０を定義するデータから、グ
リッド５７６及びボックス５７８のマークによって指示
されたページ数を表したデータを得ることができる。次
に、このページ数を利用して、イメージ５８０とイメー
ジ６００の間の離隔距離を求めることができる。

【００７３】プロセッサは、イメージ５８０のフィール
ドに関するデータを順次得ることが可能である。イメー
ジ５８０には、充填を指示したマーク５７６の付いたフ
ィールド５８４が含まれている。イメージ５８８には、
充填を指示したマーク５９２の付いたフィールド５９０
が含まれており、また、それには、「ｃ」が含まれてい
るので、そのシーケンスにおいて直前のフィールドであ
る、フィールド５８４との継続が指示されている。イメ
ージ５８８には、フィールド５９４も含まれ、イメージ
５９６には、フィールド５９８が含まれているが、それ
ぞれ、充填を指示するマーキングが施されている。

【００７４】次に、プロセッサは、イメージ６００から
のテキストとフィールドのリンクを行うことができる。
イメージ６０２には、それが包囲するテキストセグメン
トを利用して、フィールドに充填を行うことを指示した
マーク６０４が付いており、従って、マーク６０４に囲
まれたテキストセグメントとフィールド５８４をリンク
させることができる。イメージ６０６には、それが包囲
するテキストセグメントを利用することを指示したマー
ク６０８が付いており、また、テキストセグメントに
は、マーキングを施された先行テキストセグメントとの
継続を指示する「ｃ」のマーキングも施されているの
で、マーク６０８によって囲まれたテキストセグメント
とフィールド５８４とのリンクを行うことも可能であ
る。イメージ６０６には、テキストセグメントを囲むマ
ーク６１０も含まれ、イメージ６１２には、テキストセ
グメントを囲むマーク６１４が含まれており、これらの
テキストセグメントは、フィールド５９４及び５９８の
ような、そのシーケンスにおいて後続のフィールドとリ
ンクさせることができる。

【００７５】次に、プロセッサは、イメージセット５８
０及び６００を定義するデータと共に、このリンクデー
タを利用して、フィールドにテキストが納まった書式を
定義するデータを生成することができる。マーク６０４
によって囲まれたテキストセグメントが、フィールド５
８４にとって大きすぎる場合、フィールド５９０は、フ
ィールド５８４の継続であるため、オーバフローはフィ
ールド５９０に移行することが可能である。マーク６０
４で囲まれたテキストセグメントによって、フィールド
５８４が充填されない場合、マーク６０８によって囲ま
れたテキストセグメントは、マーク６０４におけるテキ
ストセグメントと継続しているので、マーク６０８によ
って囲まれたテキストセグメントの一部を利用して、フ
ィールド５８４を充填することができる。マーク６０４
及び６０８によって囲まれたテキストセグメントによっ
て、フィールド５８４及び５９０を充填することができ
ない場合、上述のように、スケーリング及び再書式作成
操作を実施することができる。

【００７６】図１２の追加マーク「ｃ」を認識して、除
去することが可能である。例えば、各「ｃ」マークは、
フィールドの境界のような直線の特徴だけでなく、小さ
い文字との区別も行う組み合わせ判定基準である、その
曲率と大きさに基づいて検出することが可能であり、次
に、各「ｃ」マークからのピクセルを種として利用し
て、それを囲んでいるマークを充填することができ、さ
らに、図８に関連して上述の操作を実施して、フィール
ドまたはテキストに関するマスクを得ることが可能であ
り、テキストにクロスする「ｃ」マークは除去すること
ができる。同様の他の各種技法を利用することも可能で
ある。「ｃ」を用いて、継続を示すのではなく、数字を
用いることも可能である。マークは、「ｃ」であろう
と、数字であろうと、テキストの上ではなく、テキスト
の側部の余白に配置して、検出及び除去を容易にするこ
とが可能である。

【００７７】図１３には、図９の実施例に用いられるフ
ィールド及びテキストセグメントの特徴を示す方法が例
示されている。

【００７８】イメージ６５０には、プロセッサが利用し
て、シートを記述したデータを求めることができる、機
械に読み取り可能な識別情報６５２を含むシートが示さ
れている。図示の例では、シートは、書式及び後続する
テキストのイメージに対する書式充填操作が要求されて
いることを指示する、書式充填カバーシートである。従
って、識別情報を利用して、書式充填操作が要求されて
いることを指示するデータを得ることができる。

【００７９】イメージ６５０を定義するデータを受信す
るプロセッサは、書式を示す第１のイメージセット６６
０、別のシートを示す分離イメージ６８０、及び、テキ
ストを示す第２のイメージセット６９０も受信する。

【００８０】プロセッサは、書式を識別する情報を利用
して、イメージ６６０のフィールドに関するデータを得
ることができる。イメージ６６２には、機械に読み取り
可能な書式の識別情報６６４が含まれているが、ここで
は、例示として、イメージ６６２のフィールド６６６
が、「Ｘ」タイプのフィールドであることを示す情報が
含まれている。同様に、イメージ６６８には、機械に読
み取り可能な書式の識別情報６７０が含まれているが、
この場合、イメージ６６８のフィールド６７２が、
「Ｙ」タイプのフィールドであることを示す情報が含ま
れている。タイプＸ及びＹは、例えば、あるフィールド
における名前及びアドレス及び別のフィールドにおける
記述といった、各フィールドに挿入される内容のタイプ
を表している。あるいは、各フィールドのタイプは、フ
ィールドに含めるべきテキストの別の特徴を指示するこ
ともできるし、あるいは、フィールドを充填すべきか否
かを指示することもできる。タイプ以外に、書式を識別
する情報は、書式の同じシートまたは別のシートにおい
て、フィールドが別のフィールドと継続していることを
示すことも可能である。

【００８１】分離イメージ３８０には、プロセッサが利
用して、シートを記述したデータを得ることができる、
機械に読み取り可能な識別情報６８２が含まれている。
図示の例では、シートは、分離シートであり、先行イメ
ージが、書式の最後のイメージであり、次のイメージ
は、テキストの最初のイメージであることを指示してい
る。

【００８２】分離イメージ６８０の受信後、プロセッサ
は、イメージ６９０からのテキストセグメントとイメー
ジ６６０のフィールドをリンクすることができる。イメ
ージ６９０には、テキストセグメント６９４の開始を指
示する機械に読み取り可能な情報６９６及び終了を指示
する機械に読み取り可能な情報６９８を備えた、テキス
トセグメント６９４が含まれている。機械に読み取り可
能な情報６９６及び６９８は、図示のように、テキスト
セグメント６９４が「Ｙ」タイプであることも指示して
いるので、プロセッサは、それと、やはり、「Ｙ」タイ
プである、イメージ６６８内のフィールド６６８をリン
クさせる。同様に、イメージ７００には、テキストセグ
メント７０２の開始を指示する機械に読み取り可能な情
報７０４及び終了を指示する機械に読み取り可能な情報
７０６を備えた、テキストセグメント７０２が含まれて
いる。機械に読み取り可能な情報７０４及び７０６は、
図示のように、テキストセグメント７０２が「Ｘ」タイ
プであることも指示しているので、プロセッサは、それ
と、やはり、「Ｘ」タイプである、イメージ６６２内の
フィールド６６６をリンクさせる。

【００８３】次に、プロセッサは、イメージセット６６
０及び６９０を定義するデータと共に、リンクデータを
利用して、フィールドにテキストセグメントが納まった
書式を定義するデータを生成する。テキストセグメント
をリンクされるフィールドに納めることができない場
合、上述のように、スケーリング及び再書式作成操作を
実施することも可能である。

【００８４】機械に読み取り可能な情報６９６、６９
８、７０４、及び、７０６は、ユーザの要求に応じて、
テキストエディタによってテキストに挿入することが可
能である。

【００８５】表Ｉには、図１２に示すフィールド及びテ
キストセグメントに関して得ることのできる、フィール
ドの境界を示す位置決めデータを含めたリンクデータが
示されている。リンクデータは、フィールドにテキスト
の納まったイメージを定義するデータを自動的に得る際
におけるプロセッサのアクセスを可能にする、適切なデ
ータ構造に記憶することが可能である。

【表１】

【００８６】表Ｉに示すように、リンクデータには、そ
れぞれ、いくつかのデータ項目を含む、一連の項目を含
むことが可能である。各項目は、例示のように、フィー
ルドを識別し、書式のシートを指示するデータ項目から
始まっている。シート１で始まり、シート２に継続する
フィールド１の場合、リンクデータには、シート１のフ
ィールド１の部分と、シート２のフィールド１の部分の
両方に関する項目が含まれている。

【００８７】各項目には、上方左コーナのｘ及びｙ座
標、高さ、及び、幅として例示されている、フィールド
の位置を示すデータ項目も含まれている。各項目には、
さらに、フィールドにリンクしたテキストセグメントに
関連するデータ項目が含まれているので、２つのテキス
トセグメントにリンクしたフィールド１には、そのテキ
ストセグメントに関する独立した項目が含まれることに
なる。

【００８８】各テキストセグメントに関連したデータ項
目には、それが現れるテキストのページ、その位置、及
び、先行項目のテキストセグメントと継続しているか否
かの表示が含まれている。

【００８９】表Ｉのリンクデータを利用して、フィール
ドにいかに充填を行うかを決定するプロセッサは、ま
ず、シート１のフィールド１にページ１からのテキスト
セグメントを充填する。該テキストセグメントによって
フィールドが充填されない場合には、ページ２からのテ
キストセグメントも、フィールドに含まれる。オーバラ
ンは、シート１のフィールド１と継続したシート２のフ
ィールド１に挿入される。次に、残りのフィールドに、
それぞれのテキストセグメントが充填される。

【００９０】同様に、図１３において要求される書式充
填操作のために、表Ｉと同様のデータ構造を作成するこ
とも可能である。その場合、機械に読み取り可能な情報
によって指示されるタイプが、フィールドとテキストセ
グメント間のリンクに用いられる。

【００９１】図１０に関連して解説のスケーリング及び
再書式作成は、表Ｉに例示のようにリンクされたフィー
ルドとテキストセグメントの組み合わせに利用すること
ができる。例えば、フィールド及び１つ以上継続したフ
ィールドと一連のテキストセグメントをリンクする場
合、テキストセグメントを利用して、できれば、スケー
リングまたは再書式作成を行わずに、フィールド及びそ
れに継続するフィールドに充填することが可能である。
最後の継続するフィールドに達し、それに納まるよう
に、残りのテキストセグメントにスケーリングを施す
と、判読できなくなる場合、最後のフィールドにおいて
必要なスケーリングを控えめにするため、先行テキスト
セグメントに対するスケーリング、及び、おそらくは、
再書式作成が必要になる。

【００９２】本発明は、多種多様な書式及びテキストに
対してさまざまなやり方で適用することが可能である。

【００９３】本発明は、書式に、ユーザがテキストの充
填を所望する、サイズの異なるさまざまなテキストフィ
ールドが含まれている場合に、とりわけ、有効である。
例えば、本発明の提案書式には、多くの小フィールド、
さらに、本発明の記述のための比較的大きい１つのフィ
ールドを備えた第１のシートを含めることができる。記
述については、必要があれば、後続シートにおけるより
大きいフィールドに継続することが可能である。この例
の場合、ユーザは、標準的なテキストエディタによって
本発明の記述を作成してプリントし、本発明の技法を利
用して、適合するフィールドの記述に関する本発明の提
案書式を得ることができる。残りの小フィールドについ
ては、手書き、または、タイプライタで完成することが
できる。

【００９４】本発明の解説は、両方とも、スキャナから
受信する、書式とテキストのイメージを自動的に併合す
る実施例に関連して行ってきた。本発明は、スキャナ以
外の信号源から受信する書式及びテキストのイメージに
ついても実施することが可能である。

【００９５】本発明の解説は、ソフトウェアの実施例に
関連して行ってきたが、本発明は、特殊化ハードウェア
についても実施することが可能である。

【００９６】本発明の解説は、英語によるテキストに作
用する実施例に関連して行ってきた。本発明は、ワード
の位置決めに関連した英語の規則に従う他の言語による
テキストにも容易に拡張することが可能である。本発明
は、縦書き行、右から左に書かれる行といった、他の規
則に従う言語によるテキストにも拡張することができ
る。

【００９７】本発明の解説は、フィールドにテキストを
充填する実施例に関連して行ってきたが、本発明は、い
くつかのフィールドにテキストを充填し、他のフィール
ドにグラフィカル項目を充填するように実施することも
可能であり、この場合、グラフィカル項目は、フィール
ドに納まるようにスケーリングを施すことはできるが、
再書式作成を施すことはできない。グラフィカル項目の
タイプには、識別可能なものもある。

【００９８】本発明の解説は、テキスト内の文字及びワ
ードを認識する必要のない実施例に関連して行ってき
た。しかし、本発明は、文字またはワードの認識を行う
操作に関しても実施することができる。

【００９９】本発明の解説は、テキストにおける配列と
同じ配列のワードを含む異なるバージョンのテキストを
得る実施例に関連して行ってきたが、本発明は、ワード
を変更するか、または、テキスト内におけるワードの配
列を変更することによって、テキストを修正する操作と
組み合わせて利用することも可能である。

【図面の簡単な説明】

【図１】２つのイメージ、すなわち、書式に関するイ
メージとテキストに関するイメージを併合して、書式内
のフィールドにテキストを位置決めする方法を示す概略
流れ図である。

【図２】図１のように書式及びテキストのイメージを
併合する際における一般的なアクションを示すフローチ
ャートである。

【図３】図２のように、イメージを自動的に併合する
システムによってアクセス可能なソフトウェア製品を示
す概略ブロック図である。

【図４】書式とテキストのイメージを自動的に併合す
ることの可能なファックスサーバを示す概略ブロック図
である。

【図５】書式とテキストのイメージを自動的に併合す
ることの可能な処理回路要素を備えたデジタルコピー機
を示す概略ブロック図である。

【図６】書式とテキストのイメージを自動的に併合す
ることの可能なＣＰＵを備えたコンピュータを示す概略
ブロック図である。

【図７】単純な書式のイメージと単純なテキストのイ
メージを自動的に併合するアクションを示す概略流れ図
である。

【図８】フィールドにマーキングを施された書式のイ
メージとテキストセグメントにマーキングを施されたテ
キストのイメージを自動的に併合する場合のアクション
を示す概略流れ図である。

【図９】コード化された書式を識別する情報を備えた
書式のイメージとテキストセグメントを示すコード化さ
れた情報を備えたテキストのイメージを自動的に併合す
る場合のアクションを示す概略流れ図である。

【図１０】図７〜９のように、イメージを自動的に併
合する場合の一般的なアクションを示す概略流れ図であ
る。

【図１１】パラグラフ間の間隔によって、テキストセ
グメントとフィールドのリンクに関する情報が得られ
る、テキストイメージの概略図である。

【図１２】書式充填操作を要求するための書式を含ん
でおり、フィールド及びテキストのマークによって、リ
ンクに関するフィールドとテキストセグメントの継続が
指示されている、一連のイメージの概略図である。

【図１３】書式充填操作を要求するカバーシート、及
び、分離シートを含んでおり、コード化情報によって、
リンクに関するフィールド及びテキストセグメントのタ
イプが指示されている、一連のイメージの概略図であ
る。

【符号の説明】６０ソフトウェア製品、６２データ記憶媒体、６４
記憶媒体アクセス装置、６６プロセッサ、７０イ
メージ入力回路要素、７２ファクシミリ機、７４ス
キャナ、７６書式エディタ、７８ネットワーク、８
０イメージ出力回路要素、８２ファクシミリ機、８
４プリンタ、８６ディスプレイ、８８ネットワー
ク、１２０ファクシミリ機、１２２ファックスサー
バ、１６０デジタルコピー機、１６２走査回路要素、
１７０ユーザインターフェイス回路要素、１７２タ
ッチセンシング装置、１８０処理回路要素、１９０
プリント回路要素、２００スキャナ、２１０ＣＰ
Ｕ、２１２キーボード、２１４マウス、２１６デ
ィスプレイ

Claims

【特許請求の範囲】

【請求項１】入力としてイメージを定義するデータを受
信するイメージ入力回路要素と、出力としてイメージを定義するデータを送り出すイメー
ジ出力回路要素と、イメージ入力回路要素からイメージを定義するデータを
受信し、イメージ出力回路要素にイメージを定義するデ
ータを送るように接続されたプロセッサから成るシステ
ムを操作する方法において、プロセッサを操作して、イメージ入力回路要素から、第
１のフィールドを含む書式を示す第１のイメージセッ
ト、及び、テキストを示す第２のイメージセットを定義
した入力イメージデータを受信するステップと、プロセッサを操作して、入力イメージデータを利用し、
第１のイメージセットから書式のイメージを定義する書
式イメージデータ、第２のイメージセットからテキスト
のイメージを定義するテキストイメージデータ、及び、
第１のフィールド内においてテキストの位置決めが行え
るように、第１のフィールドまわりの境界位置を示す位
置決めデータを自動的に得るステップと、プロセッサを操作して、書式イメージデータ、テキスト
イメージデータ、及び、位置決めデータを利用すること
により、自動的に、テキスト及び書式を示し、かつ、第
１のフィールドの境界内に配置されるテキストを示す、
第３のイメージセットを定義した出力イメージデータを
得て、該出力イメージデータをイメージ出力回路要素に
送るステップを含む、前記方法。