JPH01205261A - 文書処理装置 - Google Patents
文書処理装置Info
- Publication number
- JPH01205261A JPH01205261A JP63028790A JP2879088A JPH01205261A JP H01205261 A JPH01205261 A JP H01205261A JP 63028790 A JP63028790 A JP 63028790A JP 2879088 A JP2879088 A JP 2879088A JP H01205261 A JPH01205261 A JP H01205261A
- Authority
- JP
- Japan
- Prior art keywords
- document
- code
- data
- element data
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Processing Or Creating Images (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明9目的〕
(産業上の利用分野)
本発明は、文書を構成する文書要素データの文字・図形
が占める領域の位置、大きさを識別する文書処理装置に
関する。
が占める領域の位置、大きさを識別する文書処理装置に
関する。
(従来の技術)
分割して作成した文書の要素データをまとまった1つの
文書として整形出力する場合、「何を」「どこに」 「
どんな大きさで」合成するか、決定しなくてはいけない
事情は多量にある。
文書として整形出力する場合、「何を」「どこに」 「
どんな大きさで」合成するか、決定しなくてはいけない
事情は多量にある。
現在、−膜内な文書処理システム、または組版システム
等では、こういった決定はすべてユーザによって指定さ
れなくてはならない。例えば、整形文書中に別のファイ
ル中の表をコピーする場合、元のファイル中の表の存在
する位置と大きさを指定する必要がある。
等では、こういった決定はすべてユーザによって指定さ
れなくてはならない。例えば、整形文書中に別のファイ
ル中の表をコピーする場合、元のファイル中の表の存在
する位置と大きさを指定する必要がある。
OCR等ではイメージの存在する範囲を識別し、そのデ
ータを切り出して別の文書中の任意の位置に再現するシ
ステムはある。しかし、コードで記録されている文書や
図形を処理するシステムにおいて、イメージに変換せず
に同様の処理を行うものはない。
ータを切り出して別の文書中の任意の位置に再現するシ
ステムはある。しかし、コードで記録されている文書や
図形を処理するシステムにおいて、イメージに変換せず
に同様の処理を行うものはない。
(発明が解決しようとする課題)
このように、従来の文書処理装置では1文字コードや図
形パラメータ等であられされた文書を構成する要素デー
タを処理する場合、データそのものに範囲が限定されな
い場合、ユーザが範囲を区切って、その範囲内のデータ
を抽出しなくてはならず1手間がかかった。
形パラメータ等であられされた文書を構成する要素デー
タを処理する場合、データそのものに範囲が限定されな
い場合、ユーザが範囲を区切って、その範囲内のデータ
を抽出しなくてはならず1手間がかかった。
そこで、本発明は要素データ中の必要な範囲を自動的に
切り出し、余白等の不必要な部分をのぞくことにより、
整形文書中の任意の位置に再現する等の処理を可能にし
、文書の合成、整形を容易にすることを目的とする。
切り出し、余白等の不必要な部分をのぞくことにより、
整形文書中の任意の位置に再現する等の処理を可能にし
、文書の合成、整形を容易にすることを目的とする。
(課題を解決するための手段)
本発明は文字9図形又は画像イメージを文字コード、図
形パラメータ、ドツトパターン等として表現し、それら
を入力、記憶、出力する文書処理装置において、実際に
印刷、または表示される領域の範囲を算出し、空白の部
分と実際に印刷される領域を識別する手段を有すること
を特徴とする。
形パラメータ、ドツトパターン等として表現し、それら
を入力、記憶、出力する文書処理装置において、実際に
印刷、または表示される領域の範囲を算出し、空白の部
分と実際に印刷される領域を識別する手段を有すること
を特徴とする。
(作 用)
本発明は、文書を整形出力する際に文書を構成する文書
要素データ中の文字や図形等が実際に表示(印刷)され
る領域を識別することにより、その領域内のデータのみ
抽出して、整形文書中の任意の位置に再gl(合成)で
きるようにした。
要素データ中の文字や図形等が実際に表示(印刷)され
る領域を識別することにより、その領域内のデータのみ
抽出して、整形文書中の任意の位置に再gl(合成)で
きるようにした。
したがって、本発明によれば、文書要素データの合成等
が容易に行え、人手をかけずに整形文書を生成すること
が可能になる。
が容易に行え、人手をかけずに整形文書を生成すること
が可能になる。
(実 施 例)
第1図はこの発明の一実施例を示すブロック図である。
文書を構成する各要素データは例えば、キーボード、マ
ウス等からなる入力部10、あるいはすでに入力されて
いる場合は文書要素データ記憶部20から呼び出されて
文書管理部30に送られる。
ウス等からなる入力部10、あるいはすでに入力されて
いる場合は文書要素データ記憶部20から呼び出されて
文書管理部30に送られる。
コード解析部40は文字コード解析部411図形コード
解析部42等に分かれ、合成される要素データ中のコー
ドを種別に解析し、そのまま表示された時の位置や大き
さを算出する。
解析部42等に分かれ、合成される要素データ中のコー
ドを種別に解析し、そのまま表示された時の位置や大き
さを算出する。
領域識別部50は、コード解析部40で算出された個々
の文字や図形の位置や大きさから、それらが含まれる領
域の開始位置と大きさを決定する。
の文字や図形の位置や大きさから、それらが含まれる領
域の開始位置と大きさを決定する。
コード抽出部60は文字コード抽出部61、図形コード
抽出部62等に分かれ5文書要素データから領域識別部
50で識別された領域内に含まれるコードのみ抽出する
。
抽出部62等に分かれ5文書要素データから領域識別部
50で識別された領域内に含まれるコードのみ抽出する
。
文書整形処理部70は、コード抽出部60で抽出された
コードを整形文書の任意の位置に合成する。
コードを整形文書の任意の位置に合成する。
整形文書表示部80は文書整形処理部70によって合成
された整形文書を表示するCRTデイスプレィ。
された整形文書を表示するCRTデイスプレィ。
プリンタ等である。
次にこのように構成された文′:#整形装置の動作につ
いて説明する。
いて説明する。
データ入力部IOを介して、第2図、第3図、第4図に
示すような文書要素データ1,2.3が入力されたとす
る。文書要素データ1は文字コードからなる文章データ
であり、これをある書式に基づいて整形処理する際に図
表データである文書要素データ2.3を整形文書の指定
位置に割りつけるよう指示する。
示すような文書要素データ1,2.3が入力されたとす
る。文書要素データ1は文字コードからなる文章データ
であり、これをある書式に基づいて整形処理する際に図
表データである文書要素データ2.3を整形文書の指定
位置に割りつけるよう指示する。
本実施例では、要素データ1中で1図1に示す」「図2
に示す」とあられされた参照箇所の近くに割りつける。
に示す」とあられされた参照箇所の近くに割りつける。
そこで、文書管理部30は、割り付けられる図1゜2に
概当する文書要素データ2,3をデータ入力部10また
は文書要素データ記憶部2oがらコード解析部40に送
る。
概当する文書要素データ2,3をデータ入力部10また
は文書要素データ記憶部2oがらコード解析部40に送
る。
文書要素データ2,3は第3図、第4図に示すように、
表示上は一頁に割りつけられているが、データ構造中で
は文字コードと図形コードで別々に記録されている。
表示上は一頁に割りつけられているが、データ構造中で
は文字コードと図形コードで別々に記録されている。
例えば要素データ2のデータ構造が第5図(a)。
(b)のように記録されているとする。文字情報は(a
)に示すように改行やスペース、あるいは倍角のような
文字の大きさ等を指定する属性コードを含む文字コード
の並びであられされる。
)に示すように改行やスペース、あるいは倍角のような
文字の大きさ等を指定する属性コードを含む文字コード
の並びであられされる。
文字コード解析部41では、この文字コードの並びを1
例えば第6図(a)のようなアルゴリズムで。
例えば第6図(a)のようなアルゴリズムで。
表示された状態における文字の位置や大きさを数桁し、
1行ごとの文字の開始行、終了行を第7図に示すように
配列ScQ、 ecQに求める。次に第6図(b)のよ
うなアルゴリズムでこの配列から頁中の文字全体の占め
る矩形領域の開始行、開始けた、終了行、終了けたを求
める。
1行ごとの文字の開始行、終了行を第7図に示すように
配列ScQ、 ecQに求める。次に第6図(b)のよ
うなアルゴリズムでこの配列から頁中の文字全体の占め
る矩形領域の開始行、開始けた、終了行、終了けたを求
める。
また、要素データ2の図形情報は例えば第5図(b)の
ようなデータ構造で記録されている。ここで、rect
angle、 arrowは矩形、矢印等図形の種類を
あられす図形コードであり、それぞれが含んでいる数字
は図形の位置する座標やサイズを頁左上ずみを(0,O
)としてあられしたものである。
ようなデータ構造で記録されている。ここで、rect
angle、 arrowは矩形、矢印等図形の種類を
あられす図形コードであり、それぞれが含んでいる数字
は図形の位置する座標やサイズを頁左上ずみを(0,O
)としてあられしたものである。
例えばrectangle (工x y Vs + 工
v V)は図形ノ開始座e:4(左上の座標)が(工z
−?+)で幅が工。
v V)は図形ノ開始座e:4(左上の座標)が(工z
−?+)で幅が工。
高さがνの矩形をあられし、arrow O:i tν
、。
、。
r、0)は、始点(工x*?t)から長さrで工方向と
の角度が0の矢印をあられしているとする。
の角度が0の矢印をあられしているとする。
図形コード解析部42ではこの図形コードの並びを例え
ば第8図のようなアルゴリズムでそれぞれの図形の占め
る矩形領域の開始座標、終了座標を求め、第9図のよう
な配列で図形全体の占める矩形領域を算出する。
ば第8図のようなアルゴリズムでそれぞれの図形の占め
る矩形領域の開始座標、終了座標を求め、第9図のよう
な配列で図形全体の占める矩形領域を算出する。
次に、文字領域と図形領域の座標を一致させる。
例えば、この例では1文字のIが16.1幅が20なの
で、第10図の斜線部分に示すように文字領域をT、−
/座標であられすと開始位置(go、 220) 、終
了位置(272,360)になる。図形領域は第9図で
求められたように開始位置(64,200)終了位置(
288,280)であるから、第11図の斜線部分であ
られされる。この文字領域と図形領域の両方を含む最小
の矩形領域は双方の座標の比較により、開始位置(64
,200)、終了位置(288,360)で、サイズは
(224,160)と求められる。(第12図斜線部分
) コード抽出部60では領域識別部で求められた領域の開
始位置、終了位置の範囲内のデータのみ抽出する。この
場合、文字コード抽出部において、第5図(a)から1
行〜10行の改行および12行、14行、 18行の不
要なスペースを除いて、第13図のような文字コード列
が抽出される。また、図形についても同様に不要なデー
タを除いて、第14図に示すとおり座標を識別された領
域内の相対座標に変換する。
で、第10図の斜線部分に示すように文字領域をT、−
/座標であられすと開始位置(go、 220) 、終
了位置(272,360)になる。図形領域は第9図で
求められたように開始位置(64,200)終了位置(
288,280)であるから、第11図の斜線部分であ
られされる。この文字領域と図形領域の両方を含む最小
の矩形領域は双方の座標の比較により、開始位置(64
,200)、終了位置(288,360)で、サイズは
(224,160)と求められる。(第12図斜線部分
) コード抽出部60では領域識別部で求められた領域の開
始位置、終了位置の範囲内のデータのみ抽出する。この
場合、文字コード抽出部において、第5図(a)から1
行〜10行の改行および12行、14行、 18行の不
要なスペースを除いて、第13図のような文字コード列
が抽出される。また、図形についても同様に不要なデー
タを除いて、第14図に示すとおり座標を識別された領
域内の相対座標に変換する。
つづいて1文書整形処理部70において第15図のよう
な整形を行う途中で「図1に示す」という参照箇所の下
部に文書要素データ2を割りつける場合、図中に点線で
示した割り付は位置の開始座標(16,320)が決定
される。この位置にデータ抽出部で抽出された文字コー
ドや図形コードを合成するためには第16図のように例
えば文字コードに関しては抽出された第13図のデータ
そのままではなく適当なスペースを左側におぎなって文
書中に挿入する等して、指定された位置に元と同じ表示
状麿を保って再現する。また図形コードに関しては第1
4図の相対座標に割り付は位置の開始座標(16゜32
0)を加えることで、整形文書中の絶対座標に変換する
。
な整形を行う途中で「図1に示す」という参照箇所の下
部に文書要素データ2を割りつける場合、図中に点線で
示した割り付は位置の開始座標(16,320)が決定
される。この位置にデータ抽出部で抽出された文字コー
ドや図形コードを合成するためには第16図のように例
えば文字コードに関しては抽出された第13図のデータ
そのままではなく適当なスペースを左側におぎなって文
書中に挿入する等して、指定された位置に元と同じ表示
状麿を保って再現する。また図形コードに関しては第1
4図の相対座標に割り付は位置の開始座標(16゜32
0)を加えることで、整形文書中の絶対座標に変換する
。
あるいはデータ構造として図表領域等の大きさと位置を
指定し、その中の文字コード、図形コードは図表領域中
の相対座標であられすことを許すものにおいては、第1
3図、第14図のようにデータ指出部で抽出されたコー
ドを図表領域として格納しておけば、割りっけ位置とサ
イズを指定するだけで第17図に示すようにデータの合
成が簡単にできる。
指定し、その中の文字コード、図形コードは図表領域中
の相対座標であられすことを許すものにおいては、第1
3図、第14図のようにデータ指出部で抽出されたコー
ドを図表領域として格納しておけば、割りっけ位置とサ
イズを指定するだけで第17図に示すようにデータの合
成が簡単にできる。
また、割りつけ位置の決定時にも、領域識別時に正確な
サイズが(224,160)を求められているので、マ
ージンも考慮した最適な配置を決めることができる。
サイズが(224,160)を求められているので、マ
ージンも考慮した最適な配置を決めることができる。
また、第4図の文書要素データ3の文字コードが第18
図に示すようにタブコード等を使用している場合、その
まま合成すると整形文書のタブ位置とずれて、正確に再
現できないこともある。そこで例えば第19図のように
この文字コードデータのタブコードを文書要素データ3
のタブ位置にあわせて、適当な数のスペースコード等に
おきかえて、領域の識別やコードの抽出を行う。これに
よって、第20図のように元のデータと見ために等しい
形で再現ができる。あるいは、整形文書が図表領域のタ
ブ位置を抽出した文書データにあわせて変更する。
図に示すようにタブコード等を使用している場合、その
まま合成すると整形文書のタブ位置とずれて、正確に再
現できないこともある。そこで例えば第19図のように
この文字コードデータのタブコードを文書要素データ3
のタブ位置にあわせて、適当な数のスペースコード等に
おきかえて、領域の識別やコードの抽出を行う。これに
よって、第20図のように元のデータと見ために等しい
形で再現ができる。あるいは、整形文書が図表領域のタ
ブ位置を抽出した文書データにあわせて変更する。
他にも、この方法を応用すればより、対話的な操作を可
能にする。例えばワードプロセッサ上等でユーザが範囲
を指定しなくても一度に文字や図形をコピー、移動、削
除することができるようになる。
能にする。例えばワードプロセッサ上等でユーザが範囲
を指定しなくても一度に文字や図形をコピー、移動、削
除することができるようになる。
また、領域識別部で識別する領域は矩形に限定されず、
その内部情報の実際の形状を領域の形とすることも可能
である。その他ひし形やハート形などの種々の形に変形
することも可能である。
その内部情報の実際の形状を領域の形とすることも可能
である。その他ひし形やハート形などの種々の形に変形
することも可能である。
また割りつけサイズも必ずしも領域識別部で判定された
領域の大きさに一致しなくてよく、上下左右のマージン
(余白部)をユーザの指定値にするなどの変形も可能で
ある。
領域の大きさに一致しなくてよく、上下左右のマージン
(余白部)をユーザの指定値にするなどの変形も可能で
ある。
あるいは、要素データの縁近辺が文字であるか、図形で
あるかによって属性をつけ、文字の場合はマージンを多
くして、地の文章を区別をする等の整形処理も考えられ
る。
あるかによって属性をつけ、文字の場合はマージンを多
くして、地の文章を区別をする等の整形処理も考えられ
る。
以上述べたように、本発明によれば、コードであられさ
れた文書要求データ中の必要な範囲を自動的に切りだし
、余白等の不要な部分を除いて、整形文書中の任意の位
置に見ためをそこなわず再現することができる。このた
め、切り出しや割りつけにおける領域のサイズ指定等ユ
ーザの負担をなくし、自動割りつけ時にも効果がある。
れた文書要求データ中の必要な範囲を自動的に切りだし
、余白等の不要な部分を除いて、整形文書中の任意の位
置に見ためをそこなわず再現することができる。このた
め、切り出しや割りつけにおける領域のサイズ指定等ユ
ーザの負担をなくし、自動割りつけ時にも効果がある。
第1図〜第20図は本発明の一実施例にかかわる文書処
理装置を説明するための図で、第1図は同装置の全体の
ブロック図、第2図〜第4図は文書要素データの例を示
す図、第5図は文書要素データ2のデータ構造を示す図
、第6図は文字コード解析部の手順を示す流れ図、第7
図は文字領域の位置を求める図、第8図は図形コード解
析部の手順を示す流れ図、第9図は図形領域の位置を求
める図、第10図は文字領域の位置を示す図、第11図
は図形領域の位置を示す図、第12図は文字図形両方を
含む領域の位置を示す図、第13図は文字コード抽出部
により抽出された文字コードを示す図、第14図は図形
コード抽出部により抽出された図形コードを示す図、第
15図は整形文書における要素データ2の割りつけ位置
を示す図、第16図は整形文書における要素データ2の
割りっけの1例を示す図、第17図は整形文書における
要素データ2の割りっけの別の例を示す図、第18図は
要素データ3のデータ構造の一部を示す図、第19図は
要素データ3の変換されたデータ構造の一部を示す図、
第20図は整形された文書の一例を示す図である。 10・・・データ入力部、 20・・・文書要素データ記憶部、 30・・・文書管理部、 40・・・コード解析部
、41・・・文書コード解析部、42・・・図形コード
解析部、50・・・領域識別部、 60・・・コー
ド抽出部、61・・・文字コード抽出部、62・・・図
形コード抽出部、70・・・文書整形処理部、 80・
・・整形文書表示部。 代理人 弁理士 則 近 憲 佑 同 松山光之 丈i委未デークl 第 2 図 第 3 図 第 4 図 (a)
(bン第 5 図 第 7 図 第12図 第13図 第14図 第17図 第18図
理装置を説明するための図で、第1図は同装置の全体の
ブロック図、第2図〜第4図は文書要素データの例を示
す図、第5図は文書要素データ2のデータ構造を示す図
、第6図は文字コード解析部の手順を示す流れ図、第7
図は文字領域の位置を求める図、第8図は図形コード解
析部の手順を示す流れ図、第9図は図形領域の位置を求
める図、第10図は文字領域の位置を示す図、第11図
は図形領域の位置を示す図、第12図は文字図形両方を
含む領域の位置を示す図、第13図は文字コード抽出部
により抽出された文字コードを示す図、第14図は図形
コード抽出部により抽出された図形コードを示す図、第
15図は整形文書における要素データ2の割りつけ位置
を示す図、第16図は整形文書における要素データ2の
割りっけの1例を示す図、第17図は整形文書における
要素データ2の割りっけの別の例を示す図、第18図は
要素データ3のデータ構造の一部を示す図、第19図は
要素データ3の変換されたデータ構造の一部を示す図、
第20図は整形された文書の一例を示す図である。 10・・・データ入力部、 20・・・文書要素データ記憶部、 30・・・文書管理部、 40・・・コード解析部
、41・・・文書コード解析部、42・・・図形コード
解析部、50・・・領域識別部、 60・・・コー
ド抽出部、61・・・文字コード抽出部、62・・・図
形コード抽出部、70・・・文書整形処理部、 80・
・・整形文書表示部。 代理人 弁理士 則 近 憲 佑 同 松山光之 丈i委未デークl 第 2 図 第 3 図 第 4 図 (a)
(bン第 5 図 第 7 図 第12図 第13図 第14図 第17図 第18図
Claims (5)
- (1)文字図形コード等からなる文書要素データを文章
データ中に編集して文書として出力する文書処理装置に
おいて、文書要素データに対して実際に文字図形等が表
示、印刷される領域範囲を検出し空白部分と識別する手
段を具備したことを特徴とする文書処理装置。 - (2)識別する手段は文書要素データ中で所定位置を原
点と定め、検出された領域範囲の原点からの相対位置及
び大きさを求めるものである請求項1記載の文書処理装
置。 - (3)識別する手段は文書要素データから領域範囲を相
対位置及び大きさに基いて切り出し、文書データ中の所
定領域に埋め込むものである請求項2記載の文書処理装
置。 - (4)識別する手段は領域範囲の大きさを文字コード、
図形コード等のデータ全てを含む最少の大きさの矩形と
するものである請求項2記載の文書処理装置。 - (5)識別する手段は文書要素データから空白、タブ、
改行等の実際に表示、印刷されないコードを空白部分と
して認識するものである請求項1記載の文書処理装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63028790A JPH01205261A (ja) | 1988-02-12 | 1988-02-12 | 文書処理装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63028790A JPH01205261A (ja) | 1988-02-12 | 1988-02-12 | 文書処理装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH01205261A true JPH01205261A (ja) | 1989-08-17 |
Family
ID=12258219
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63028790A Pending JPH01205261A (ja) | 1988-02-12 | 1988-02-12 | 文書処理装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH01205261A (ja) |
-
1988
- 1988-02-12 JP JP63028790A patent/JPH01205261A/ja active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3734852B2 (ja) | 画像編集方法及び編集システム | |
| EP0051857A1 (en) | Method for editing document | |
| US5787449A (en) | Method and system for manipulating the architecture and the content of a document separately from each other | |
| JPS63245556A (ja) | 図表データ割付け方法 | |
| JPH0552545B2 (ja) | ||
| JP4054428B2 (ja) | 画像検索装置及びその方法、コンピュータ可読メモリ | |
| JPS60164863A (ja) | ワードプロセッサの手書き入力データ処理方法 | |
| JP2003186889A (ja) | 文書に注釈付けし、文書イメージから要約を生成する方法及び装置 | |
| JPH0612540B2 (ja) | 文書作成支援装置 | |
| JPS58208865A (ja) | 文書作成装置 | |
| JP2000168294A (ja) | 電子黒板システム | |
| JPH01205261A (ja) | 文書処理装置 | |
| JPH08221417A (ja) | 構造化文書の新旧対照編集装置 | |
| JP2002232679A (ja) | 画像処理方法及び装置及びコンピュータプログラム及び記憶媒体 | |
| JPS5846427A (ja) | 文書編集装置 | |
| JP3076348B2 (ja) | 文書整形装置及び文書整形方法 | |
| JPS61228572A (ja) | 文書作成編集装置 | |
| JP4334987B2 (ja) | 領域指定機能およびデータ切り出し機能を備えたdtp編集装置 | |
| JP2505735B2 (ja) | 文書処理装置 | |
| JPH06119327A (ja) | 文書処理装置 | |
| JPS63197266A (ja) | 文書イメ−ジ編集装置 | |
| JPS63108430A (ja) | 文書表示方式 | |
| Chao | Graphics extraction in a PDF document | |
| JPH0734197B2 (ja) | 情報処理装置 | |
| JPH08202859A (ja) | 電子ファイリング装置及びその方法 |