JPH0776970B2 - 文書整形装置 - Google Patents

文書整形装置

Info

Publication number
JPH0776970B2
JPH0776970B2 JP63009580A JP958088A JPH0776970B2 JP H0776970 B2 JPH0776970 B2 JP H0776970B2 JP 63009580 A JP63009580 A JP 63009580A JP 958088 A JP958088 A JP 958088A JP H0776970 B2 JPH0776970 B2 JP H0776970B2
Authority
JP
Japan
Prior art keywords
document
frame
unit
document data
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP63009580A
Other languages
English (en)
Other versions
JPH01185761A (ja
Inventor
勇 岩井
洋一 竹林
美和子 土井
美佳 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63009580A priority Critical patent/JPH0776970B2/ja
Publication of JPH01185761A publication Critical patent/JPH01185761A/ja
Publication of JPH0776970B2 publication Critical patent/JPH0776970B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、文書の論理的構造に基づいて、指定された領
域内に文書を自動的に配置する文書整形装置に関する。
(従来の技術) 近年、文書データからその論理構造や意味構造を抽出
し、これらの構造データから上記文書を自動的に所定の
出力フォーマットに整形する文書処理システムの開発が
進められている。(情報処理学会第34回全国大会講演論
文集“知的文書処理システムにおける文書構造生成機能
について“岩井勇、土井美和子、福井美佳,pp.1309−p
p.1310)。この種のシステムでは、文書をあるフォーマ
ットで出力する場合、予め文書を配置する為のフレーム
を定義して、そのフレームに従って文書を流し込むこと
が行われる。例えば、技術文献の文書整形を例にとる
と、先頭頁については、標題、著者名、所属、要約等を
割付けるためのシングルカラムのフレームが、頁上部に
設定され、本文を割付けるためのダブルカラムのフレー
ムが、上記フレームの下に設定される。また、2頁目以
降は、全てダブルカラムのフレームが設定される。この
ように、従来は文書の性質に合せてフレーム構造を予め
設定し、この設定されたフレーム内に文書データを流し
込むようにしていた。
しかしながら、フレームを予め設定しておくと、例え
ば、文書データの内容に変更があった場合、設定された
フレームに文書データが入り切らなかったり、また、逆
にフレームの面積に対して文書データ量が極端に少なく
なり、大きなスペースが発生して文書の見栄えが悪くな
るという欠点があった。従って、このような場合、再度
フレームを設定し直す必要があるが、この作業はフレー
ム構造が複雑である場合、非常に面倒な作業となってい
た。また、この問題は、罫線設定を行なった後のデータ
修正時にも同様に発生していた。
(発明が解決しようとする課題) このように、従来の文書整形装置では、予め設定された
文書の配置領域と、この配置領域に配置すべき文書デー
タとが整合せずに、文書データが割付け不能となった
り、文書の見栄えが低下する等の問題があった。
本発明は、上記問題点に鑑みなされたもので、文書デー
タの整形処理を領域情報に基づいて行なう文書整形装置
において、常に文書データと領域情報との整合がとれ、
見易く見栄えの良い文書を整形できる文書整形装置を提
供することを目的とする。
[発明の構成] (課題を解決するための手段) 本発明は、第1図に示すように、文書データを入力する
入力部10と、この入力部10を介して入力された文書デー
タの構造属性を解析する構造解析部20と、前記文書デー
タの構造属性に応じた割付け領域を各頁毎に特定する領
域情報を記憶する領域情報記憶部30と、前記構造解析部
20で求められた前記文書データの構造属性と前記領域情
報記憶部30に記憶された領域情報とに基づいて前記文書
データをその構造属性に応じた前記割付け領域に割付け
る文書整形部40と、この文書整形部40で割付けた状態を
監視し前記文書データと前記割付け領域との不整合が生
じた場合にこれを検知する出力状態監視部50と、この出
力状態監視部50で前記不整合が検知されたときに前記領
域情報記憶部30の記憶内容を上記不整合が解消されるよ
うに修正する領域情報修正部60と、前記文書整形部40で
割付けられた文書を出力する出力部70とを具備したこと
を特徴としている。
(作用) 本発明によれば、文書データの構造属性に応じた割付け
領域を各頁毎に特定する領域情報を領域情報記憶部に記
憶しているので、文書整形部は、前記領域情報と文書デ
ータの構造属性情報とから、その文書データをどの領域
に割付ければ良いかを判別できる。そして、出力状態監
視部が、この文書整形部で文書データを割付けた場合の
文書データと領域情報との不整合を検出し、領域情報修
正部が、上記不整合を解消すべく前記領域情報記憶部の
記憶内容を修正するので、常に、文書データと領域情報
との整合性がとれ、見易く見栄えの良い文書を自動整形
することができる。
(実施例) 以下、図面に基づいて本発明の一実施例について説明す
る。
第2図〜第10図は、本実施例に係る文書整形装置を説明
するための図である。
この装置は、第2図にその全体構成を示すように、入力
部10と、構造解析部20と、フレーム情報記憶部31と、文
書整形部40と、出力状態監視部51と、フレーム情報修正
部61と、出力部70とで構成されている。
入力部10は、文書データを入力するためのもので、原文
を直接入力するためのキーボード11や、既に作成された
原文を記憶しているディスクファイル12等から、入力制
御部13を介して例えばパラグラフ単位に文書データを取
出し、構造解析部20に与えるように構成されている。入
力制御部13は、例えば第3図に示すように、入力原文中
の改行コードのように文書の構造を規定する単位の区切
りコードによって入力原文を分割する。
構造解析部20は、上記入力部10からパラグラフ単位で入
力される文書データの構造属性を抽出するもので、構造
属性抽出部21と、構造解析辞書22と、文書データ記憶部
23とで構成されている。構造解析辞書22には、日本語辞
書、形態素解析規則、論理解析規則等が備えられてい
る。構造属性抽出部21は、この構造解析辞書22を参照し
て入力された文書データの形態要素のつながり関係、前
後の文の構造をもとに、標題、章見出し、章段落等の構
造属性を抽出する。文書データ記憶部23は、第3図に示
すように、入力された文書データをパラグラフ単位で上
記抽出された構造属性と対応させて記憶する。
フレーム情報記憶部31は、文書データの割付け領域であ
るフレームに関する情報を記憶する部分である。第4図
にフレーム情報記憶部31の内容を示す。即ち、フレーム
情報記憶部31には、各ページの情報として、ページ情報
とフレーム情報とがページ毎に格納されている。ページ
情報は、フレームを配置するための外枠の情報であり、
ページ番号、ページサイズ、1行の文字数、1ページの
行数、そのページに含まれるフレーム数から構成され
る。フレーム情報は、そのページに定義される1又は複
数のフレームの各フレームについてフレーム番号、フレ
ームの種類(シングルカラムかダブルカラムか)、フレ
ームX,Y位置、フレームX,Yサイズ、隣接するフレームの
番号、割付ける文書の構造属性等を特定する情報であ
る。これらの情報は、後述するフレーム情報修正部61に
よって適宜修正、追加、削除される。
文書整形部40は、文書データ記憶部23に記憶された文書
データを、その構造属性情報とフレーム情報記憶部31に
格納されたフレーム情報とに基づいて、指定フレーム内
に割付け処理するもので、文書整形制御部41と整形規則
辞書42とから構成されている。整形規則辞書42は、例え
ば第5図に示すように、各構造属性に応じた割付け規則
を備えたものとなっている。
出力状態監視部51は、文書整形部40で割付けられる文書
データがフレーム枠をはみ出したり、フレーム内に極端
に余白が残ってしまったり、そのページに割付けるべき
文書データのフレームが存在しない等の、文書データと
フレームとの間の不整合が発生した場合、これを検出す
る。
フレーム情報修正部61は、上記出力状態監視部51が文書
データとフレームとの間の不整合を検出した場合、フレ
ーム情報記憶部31の内容を不整合の生じない内容に修正
するものである。
出力部70は、フレーム情報記憶部31の内容が不整合のな
い状態に修正された後、文章整形部40にて整形された文
書を出力するもので、出力制御を司る出力制御部71と、
この出力制御部71の制御のもとに文書を表示するCRTデ
ィスプレイ72と、このCRTディスプレイ72に表示された
文書を紙の形態で出力するプリンタ73とで構成されてい
る。
次に以上のように構成された本実施例の装置の動作につ
いて説明する。
入力部10を介して第3図に示した文書がパラグラフ単位
で構造解析部20に入力されると、構造情報抽出部21は、
構造解析辞書を参照しながら、上記入力文書の構造属性
を抽出する。第3図の例では、文番号1は、最初の文章
で、「文章整形装置」という名詞句で終わっているの
で、これは標題であると判定される。文番号2は、「山
田太郎」という固有名詞であることが構造解析辞書22中
の日本語辞書によって分るので、前後の関係からこれは
著者名であると判定される。同様にして所属、章見出
し、章段落等の論理構造属性が抽出される。入力文書デ
ータの全てのパラグラフについて構造属性が抽出された
ら、抽出された構造属性情報は文書データとともに文書
データ記憶部23に格納される。
続いて文書データ記憶部23に格納された文書データは、
文書整形部40に与えられ、文書整形処理に供される。即
ち、例えば、フレーム情報記憶部31に記憶された第1ペ
ージのフレーム情報によって第6図(a)に示すような
3つのフレーム#1,#2,#3が定義され、第1フレーム
の「フレームのYサイズ」として「3行」が、また「割
付ける文書の構造属性」として「標題」、「著者名」及
び「所属」が定義され、第2,第3フレームの「割付ける
文書の構造属性」として「章見出し」、「章段落」等が
定義されているとする。文書整形部40は、まず、第1文
「文書整形装置」を読出し、その属性が「標題」である
ことから、「標題」を割付け可能な第1フレームに、第
5図の規則に基づき、この第1文を1行目にセンタリン
グして割付ける。続いて文書整形部40は、第2文の「山
田太郎」、第3文の「○x△株式会社」についても同様
に整形規則辞書42に従って第1フレームに割付ける。次
に第4文「xxxx研究所」を取出して、その属性「所属」
に応じた第1フレームに割当てようとすると、第6図
(a)に示すように、第1フレームは、3行分のスペー
スしかないため、この第4文ははみ出してしまうことに
なる。このような事態が発生すると、出力状態監視部51
はこれを検知しフレーム情報61に1文はみ出しが発生し
たことを示す情報を出力する。
この情報を受取ったフレーム情報修正部61は、フレーム
情報記憶部31にアクセスして現フレーム(第1フレー
ム)に関する情報のうちYサイズを1つ増やす。次に下
側に隣接するフレームの番号(ここでは#2,#3)を取
出し、これら第2、第3フレームのYサイズを1つ減ら
すとともにY位置を一つ増やす。これによって第6図
(b)に示すように、第1フレームが1行分拡大され、
第2,第3フレームが1行分縮小する。そして、文書整形
制御部41は、再度、整形規則辞書42から第1フレームの
情報を取出し、第4文の割付け処理を行なう。
第5文以降は、構造属性が「省見出し」、「章段落」、
・・・と続くので、第2フレームから第3フレームへと
割付けが行われる。
更に第11文が取出されると、その構造属性が「脚注」と
なっている。この時点では、「脚注」を格納すべきフレ
ームが第1ページのフレーム情報に定義されていないの
で、再び出力状態監視部51はこれを検知しフレーム情報
61に未定義フレームへの割付けが発生したことを示す情
報を出力する。
この情報を受取ったフレーム情報修正部61は、その構造
属性が「脚注」であることから、脚注参照箇所を抽出
し、該参照箇所を含むフレーム(第2フレーム)に関す
る情報のうちYサイズを1つ減らす。次に「脚注」用の
新たな第4フレームを第2フレームの下に形成すべく新
たなフレーム情報を登録する。これによって第6図
(c)に示すように、脚注用の第4フレームが形成され
ることになる。
更に第54文が割付けられると、次の文が存在しないこと
から、この文が文書データの最終文であることがわか
る。このとき割付けが行われていたフレームがダブルカ
ラムである場合、第7図(a)に示すように、第6フレ
ームのYサイズa21+b1に対し、余白部分b1が存在して
いると、出力状態監視部51はこれを検知し、フレーム情
報修正部61にダブルカラムのフレーム内に余白が発生し
たことを示す情報を出力する。
この情報を受取ったフレーム情報修正部61は、第6フレ
ームとこれと左右に隣接する第5フレームのYサイズを
a11から(a11+a21)/2=c1=c2に変更する。これによ
って、第7図(b)に示すようにダフルカラムのフレー
ムの左右のYサイズを揃えた形の文書を整形できる。
このようにして、正しいフレーム情報が登録されたら、
文書整形部40は、最終的に文書の割付け処理を実行し、
得られた文書を出力部を介して出力する。
以上の処理を第8図〜第10図に示す。即ち、第8図に示
すように、この装置では、1パラグラフずつ文書整形処
理を行ない、はみ出しやフレームの不存在が発生するか
どうかを調べ、これらが検知されたらフレーム修正処理
を実行する。フレームの修正は、第9図に示すように、
原フレームの収納属性とはみ出し文書の属性との同一性
に応じてフレーム修正処理と新フレーム設定処理のいず
れか一方を選択する。また、第8図において、割付けが
終了したら、文書末尾整形処理を行なう。この文書末尾
整形処理は、第10図に示すように、現フレームがダブル
カラムで、原フレームに余白が残っている時に、前述し
た左右のフレームのサイズを統一すれば良い。
以上の実施例によれば、フレームサイズと文書データと
の整合性がとれるばかりでなく、ダブルカラムの文書末
尾のサイズも揃えることができるので、見栄えの良い見
易い文書を整形できる。
なお、上記実施例では、文書データの割付け領域として
フレームの自動設定について説明したが、同様に罫線の
内外の文書データを構造属性に基づいて判定することに
より、罫線の設定処理に本発明を適用することも可能で
ある。
[発明の効果] 以上述べたように、本発明によれば、文書データの構造
属性と領域情報とに基づいて、文書データを所定の領域
に割付けながら文書データと領域情報との整合性をとっ
ていくので、最終的に設定された領域情報は文書データ
と整合性の取れたものとなる。このため、見栄え良く見
易い文書を整形できるという効果を奏する。
【図面の簡単な説明】
第1図は本発明の構成を示すブロック図、第2図〜第10
図は本発明の一実施例に係る文書整形装置を説明するた
めの図で、第2図は全体ブロック図、第3図は文書デー
タと構造属性抽出部で抽出された構造属性を示す図、第
4図はフレーム情報記憶部の記憶内容を示す図、第5図
は整形規則辞書の内容を示す図、第6図及び第7図は同
装置によりフレームが形成されていく様子を時系列的に
示した図、第8図〜第10図は同装置の作用を説明するた
めの流れ図である。 10……入力部、11……キーボード、12……ディスクファ
イル、13……入力制御部、20……構造解析部、21……構
造属性抽出部、22……構造解析辞書、23……文書データ
記憶部、40……文書整形部、41……文書整形制御部、42
……整形規則辞書、50,51……出力状態監視部、60……
領域情報修正部、61……フレーム情報修正部、70……出
力部、71……出力制御部、72……CRTディスプレイ、73
……プリンタ。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】文書データを入力する入力部と、この入力
    部を介して入力された文書データの構造属性を解析する
    構造解析部と、前記文書データの構造属性に応じた割付
    け領域を各頁毎に特定する領域情報を記憶する領域情報
    記憶部と、前記構造解析部で求められた前記文書データ
    の構造属性と前記領域情報記憶部に記憶された領域情報
    とに基づいて前記文書データをその構造属性に応じた前
    記割付け領域に割付ける文書整形部と、この文書整形部
    で割付けた状態を監視し前記文書データと前記割付け領
    域との不整合が生じた場合にこれを検知する出力状態監
    視部と、この出力状態監視部で前記不整合が検知された
    ときに前記領域情報記憶部の記憶内容を上記不整合が解
    消されるように修正する領域情報修正部と、前記文書整
    形部で割付けられた文書を出力する出力部とを具備した
    ことを特徴とする文書整形装置。
  2. 【請求項2】前記領域情報記憶部は、各頁毎にページ番
    号、ページサイズ、1ページの行数等のページ情報と、
    そのページに含まれるフレームのフレーム番号、フレー
    ムの種類、フレーム位置、フレームサイズ、割付け可能
    な構造属性等のフレーム情報とを記憶してなるものであ
    る請求項1記載の文書整形装置。
  3. 【請求項3】前記出力状態監視部は、割付けるべき文書
    データに対する前記割付け領域の収納スペースの不整合
    や、割付けるべき領域の不存在等を検出するものであ
    り、前記領域情報修正部は、前記出力状態監視部からの
    情報に基づいてフレームの大きさを修正したり、新たな
    フレームを追加するものである請求項2記載の文書整形
    装置。
JP63009580A 1988-01-21 1988-01-21 文書整形装置 Expired - Lifetime JPH0776970B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63009580A JPH0776970B2 (ja) 1988-01-21 1988-01-21 文書整形装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63009580A JPH0776970B2 (ja) 1988-01-21 1988-01-21 文書整形装置

Publications (2)

Publication Number Publication Date
JPH01185761A JPH01185761A (ja) 1989-07-25
JPH0776970B2 true JPH0776970B2 (ja) 1995-08-16

Family

ID=11724247

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63009580A Expired - Lifetime JPH0776970B2 (ja) 1988-01-21 1988-01-21 文書整形装置

Country Status (1)

Country Link
JP (1) JPH0776970B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0573548A (ja) * 1990-12-18 1993-03-26 Casio Comput Co Ltd 文書整形装置
JP3835194B2 (ja) 2001-03-30 2006-10-18 セイコーエプソン株式会社 ディジタルコンテンツ作成システム及びディジタルコンテンツ作成プログラム

Also Published As

Publication number Publication date
JPH01185761A (ja) 1989-07-25

Similar Documents

Publication Publication Date Title
EP0094517B1 (en) Footnote assembly management
US6522999B2 (en) Apparatus and method for controlling the display of a translation or dictionary searching process
JP2695844B2 (ja) 文書整形装置
DE3586273T2 (de) Implizite erzeugung einer superblockstruktur in einem vieldaten-edierungsgeraet.
CA2154508C (en) Method and system for providing side notes in word processing
US4912669A (en) Document-editing system
EP1126380A1 (en) Converting a formatted document into an XML-document
US5129052A (en) Dynamic selection of recursively nested logical element data formats
JPH0776958B2 (ja) 文書整形装置
US4953108A (en) Document processor having a document composition function
JPH0776970B2 (ja) 文書整形装置
US5835921A (en) Data processing apparatus for creating and storing a text file from input data
JPS5994131A (ja) ワ−ドプロセツサ
EP0094516B1 (en) Footnote formatting
CA1175574A (en) Column formatting by typed example
JP2763227B2 (ja) 書式決定方法
JPH01185762A (ja) 文書整形装置
JP3076348B2 (ja) 文書整形装置及び文書整形方法
US5895478A (en) Right and center font justification for a document system library
Downes et al. The amsart, amsproc, and amsbook document classes
JP2696961B2 (ja) 文書書式設定方法
JPH05151208A (ja) 文書処理装置
JPH03273445A (ja) 文書処理装置
JP2001312489A (ja) 文書論理構造抽出方法
JPH01162975A (ja) パラグラフ単位の文書編集方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070816

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080816

Year of fee payment: 13

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080816

Year of fee payment: 13