JPH0668748B2 - 文書整形方法 - Google Patents

文書整形方法

Info

Publication number
JPH0668748B2
JPH0668748B2 JP62054111A JP5411187A JPH0668748B2 JP H0668748 B2 JPH0668748 B2 JP H0668748B2 JP 62054111 A JP62054111 A JP 62054111A JP 5411187 A JP5411187 A JP 5411187A JP H0668748 B2 JPH0668748 B2 JP H0668748B2
Authority
JP
Japan
Prior art keywords
document
format
rule
document data
shaping
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62054111A
Other languages
English (en)
Other versions
JPS63221457A (ja
Inventor
美和子 土井
勇 岩井
美佳 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP62054111A priority Critical patent/JPH0668748B2/ja
Publication of JPS63221457A publication Critical patent/JPS63221457A/ja
Publication of JPH0668748B2 publication Critical patent/JPH0668748B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は、文書データの論理構造に基づいて文書出力フ
ォーマットを決定する文書整形方法に係わり、特に指定
されたページ条件を守った出力形態の決定を可能にした
文書整形方法に関する。
(従来の技術) 一般にワードプロセッサでは、予め設定されたフォーマ
ットに基づいた文書データのページ割り付けが行われて
いる。従って、例えば学会の全国大会の発表論文集のよ
うに、納めるべきページ数に条件のある文書では、作成
された文書の文字数から、上記ページ数を超えないよう
に1ページ当りの文字数及び行数を設定する必要があっ
た。
しかしながら、文書中に章見出しや節見出し等の見出し
が存在する場合には、この見出し及びその前後に空行を
とるかどうかなどの諸条件を考慮したうえで、文書の出
力フォーマットを決定しなければならず、全文書にわた
って全ての見出しを考慮してフォーマットを決定するの
は非常に手間がかかる作業であった。
(発明が解決しようとする問題点) このように、従来のワードプロセッサでは、予め指定さ
れたページ数内に文書を効率良く納めるため、文書作成
者が文書の文字数及び行数を決定したり、見出しの部分
の調整をする等の試行錯誤を繰返すという繁雑な作業が
必要であった。
本発明は、このような事実に基づき、文書データから把
握される文書構造に基いて、指定されたページ条件を満
たすように文書データの出力フォーマットを決定する文
書整形方法を提供することを目的とする。
[発明の構成] (問題点を解決するための手段) 本発明は、文書データを入力するとともに制約ページ数
を指定する入力部と、この入力部により入力された文書
データから形態的特徴を検出し、上記文書データの章・
節等の論理構造を解析する論理構造解析部と、ここで得
られた前記入力文書データの論理構造を記憶する論理構
造記憶部と、この論理構造記憶部に記憶された論理構造
に基づいて前記文書データを展開する際の書式及びこの
書式を決定する整形規則を記憶した整形規則辞書と、前
記文書データが前記指定されたページ数内に納まるよう
に前記整形規則を適用して前記書式を決定する整形処理
部と、この整形処理部により処理された結果を出力する
出力部とを具備したことを特徴としている。
(作用) 本発明によれば、論理構造解析部で解析された入力文書
の論理構造を展開する書式と、この書式を決定する整形
規則とを整形規則辞書に格納し、上記整形規則の適用を
整形処理部で決定するようにしている。整形処理部で
は、例えば所定の書式で文書を展開したときの指定ペー
ジ数に対する超過分、不足分等を計算し、この計算結果
から、最適な整形規則を選択して適用し、指定されたペ
ージ数内に前記文書データが納まるように文書展開の書
式を変更するようにしているので、所定のページ数内に
納まる最適な文書構造が選択される。したがって、本発
明によれば、ユーザに負担をかけることなく、しかも得
られる文書は文書構造の統一された見易い形態となる。
(実施例) 以下、図面を参照しながら本発明の一実施例について説
明する。
第1図は本実施例に係る文書整形方法の概略構成図であ
る。
入力部1は、例えばキーボードなどからなる入力手段で
あり、文書データやページ制約情報等、必要なデータを
入力するためのものである。この入力部1を介して入力
されたデータは、装置全体の制御を司る文書管理部2に
与えられる。文書管理部2に与えられた文書データは、
原文記憶部3に格納される。文書管理部2は、原文記憶
部3に格納された文書データの区切りコード、例えば改
行コードを検出し、これを1文の最後とみなして1文毎
に分解する。表示部4は、このように分解された文書デ
ータを第2図に示すように文番号とともに表示する。
論理構造解析部5は、内部に日本語辞書を備えており、
この日本語辞書を参照して入力文書の形態要素のつなが
り関係、前後の文の構造をもとに、章、節等の論理構造
を判定する。例えば、第2図の例では文番号1は最初の
文章で「文書理解システム」という名詞句で終わってい
るので、この1番の文の属性は標題であると判断する。
また、この標題には見出しパターンが付加されていない
ので、見出しパターンにはnullコードが与えられる。文
番号2は、「大川太郎」という固有名詞であることが日
本語辞書を参照して分るので、これは著者名であると判
断する。この著者名についても見出しパターンはnullで
ある。このようにして解析された結果を第3図に示す。
この解析された論理構造は、構造記憶部6に格納され
る。数字+後置部等の見出しパターンは、検出された順
に、例えば章見出し、節見出しとし、かつ同一構造のも
のは同一レベルの見出しと考えて属性を決定していく。
整形規則辞書7は、得られた論理構造の展開形態(書
式)と、指定されたページに納まるようにするには、そ
の書式をどのように変更すべきかに関する規則とを備え
ている。第4図は記憶されている書式の例である。星印
が付いているところが現在選択されている書式である。
また、規則は第5図に示される。
即ち、規則は、整形記憶辞書7に記憶されている書式
のうち「属性:後文」を1行ずつ減らして行く規則で、
例えば第6図(a)から同図(b)に示すように、見出
しと次に続く段落との間を行を縮めるものである。この
規則は、小見出し→項見出し→節見出し→章見出しの
順、つまりレベルの低い順に適用される。最も小さな間
隔(空行0)になれば、それ以上この規則は適用されな
い。又、この規則は、記憶されている書式がもともと
「後文=空行0」を選択しているときには適用されな
い。
規則は、整形規則辞書7に記憶されている書式の「属
性:前文」を1行ずつ減らしていく規則で、例えば第6
図(b)から同図(c)に示すように、見出しとその前
の段落との間の行を縮めるためのものである。最も小さ
い間隔(空行0)になれば、この規則は適用されない。
以後は規則と同様である。
規則は、整形規則辞書7に記憶されている「属性:後
文」を空白1にし、さらに見出しの「属性:下線」を
「有」にする規則で、第6図(c)から同図(d)に示
すように、見出しとそれに続く段落との間を改行せずに
空白により区切るようにし、その分、見出しが目立つよ
うに下線を引くように変更することを意味している。
また、規則とは、1行当りの字数及び1頁当りの行
数をそれぞれ1字及び1行ずつ増やすものである。この
規則を適用すると、当然、文字間隔、行ピッチも変更さ
れる。その他、文字サイズの変更(規則6)等、指定さ
れたページ内に文書が納まるようにするための様々な規
則が、整形規則辞書7には格納されている。
整形処理部8は、上記整形規則辞書7の規則を適用し
て、文書データが指定されたページ数内に納まるように
最適な書式を決定するる。
さらに、出力部9は、この整形処理部8で決定された書
式で文書データを出力する。
次に、このように構成された本実施例に係る装置の動作
について説明する。
入力部1を介して第2図の文書データが入力され、原文
記憶部3にこれが格納されると、論理構造解析部5は、
第7図に示す処理を行なって文書データの論理構造を決
定する。
即ち、まず、文書データ中から見出し語がある可動かが
判定され(a)、見出し語がある場合には、見出し候補
を作成する(b)。次に、作成された見出し候補のなか
で一致する見出し規則が有るかどうかを確認し(c)、
見出しを作る(d)。もし見出し語が検出されなかった
場合及び一致する見出し規則が得られなかった場合に
は、見出し無しとして処理をする(e)。次に、一致す
る文書構造規則があるかどうかを調べ(f)、一致する
文書構造規則がある場合には、文書構造を作る(g)。
そして、その文書構造を構造記憶部6に書込む(h)。
もし、一致する文書規則がない場合には、エラー処理を
行なう(i)。
以上の処理を行なうと、構造記憶部6には、第3図に示
すような論理構造が格納される。
次に、整形処理部8での動作を第8図に基づき声明す
る。
まず、整形処理部8は、予め指定された書式、或は初期
設定された書式に基づいて、文書データを展開する
(j)。この展開の結果、指定されたページ数の中に納
まっているかどうかを確認する(k)。ここで指定のペ
ージ数に納まっている場合には、ここでの処理は終了す
るが、指定ページを超過している場合には、余分な行数
mを計算する(l)。規則1から順に適用しながら
(n,m,o)、その都度、短くなる行数nを計算する
(p)。この計算は、m≦nになるまで続行される
(q)。
例えば、文書データをA4で2ページに納めて出力する
ように指定され、初期展開を第4図の書式に従って展開
したところ、2ページに納まらずに、4行分余ったとす
る。この場合、整形処理部8は、整形規則辞書7の規則
を規則1から順番に適用して、短くできる行数を計算す
る。
いま、この文書に節見出しが4か所あり、かつ規則が
適用できれば、全体で1行×4=4行分短くできる。こ
の場合は、4行短くなれば、指定の2ページに納まるの
で、整形処理部7は、ページ制約が守れたと判断して処
理を終了する。文書管理部4は、新しい書式の文書を表
示部4で表示させるとともに、出力部9を介してプリン
トアウトさせる。
このような処理を行なうことにより、ユーザになんら負
担をかけることなく、指定されたページ数内に、見易い
形で納まった文書を得ることができる。
なお、以上は指定ページからはみ出す場合の短縮方法に
ついて重点的に説明しているが、指定ページに足りない
場合についても、殆ど同様に処理することができる。こ
の場合には、第5図の規則、の空行変更値を(−
1)→(+1)に変更できるようにしておく。そして、
第9図に示すように、指定ページに足りない行数mを求
めた後(r)、mの正負を判定し(s)、m=0であれ
ば指定ページ数に丁度納まっているので終了し、m<0
ならば上記変更値を(−1)にセットし(t)、m>0
ならば上記変更値を(+1)にセットする(u)。そし
て、規則をから順に適用し、増えた行数nを計算する
(v)。そして、|m|≦|n|になったら(w)、処
理を終了すればよい。
なお、以上の各実施例では第5図に示すような整形規則
に従ってページ制約を守る例を説明したが、この規則を
変更することは十分可能である。また、規則の適用順序
や規則の内容も、ユーザの指定により種々変更すること
は可能である。
また、書式の構造や論理構造も、上記実施例で示した内
容に限定されるものではない。
更には、規則の適用により、指定ページに納めることが
困難な場合には、その旨のメッセージを出すようにする
ことも可能である。また、見出し語とその本文とがペー
ジわたりしないように、例えば見出し語がページの最後
の行に位置したときには、その見出し語を次のページに
送る等の処理を、論理構造に基づき行なえば、更に見易
い文書を得ることができる。
[発明の効果] 以上述べたように、本発明によれば、ユーザは納めたい
ページ数を指定するだけで書式の変更により指定ページ
に納めることができるので、ユーザへの負担を少なくで
き、しかも得られる文書は見易いものであるという効果
が得られる。
【図面の簡単な説明】
第1図〜第8図は本発明の一実施例に係る文書整形方法
を説明するための図で、第1図は全体構成を示すブロッ
ク図、第2図は表示部における表示形態の一例を示す
図、第3図は構造記憶部に記憶される論理構造の一例を
示す図、第4図は整形規則辞書に格納される書式データ
を示す図、第5図は同辞書に格納される整形規則を示す
図、第6図は同規則を適用して変化する文書形態の例を
示す図、第7図は論理構造解析手順を示す流れ図、第8
図は文書整形手順を示す流れ図、第9図は本発明の他の
実施例に係る文書整形手順を示す流れ図である。 1……入力部、2……文書管理部、3……原文記憶部、
4……表示部、5……論理構造解析部、6……構造記憶
部、7……整形規則辞書、8……整形処理部、9……出
力部。

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】入力された文書データに所定の処理を施し
    て出力する文書整形方法において、 前記文書データを出力する際に納めるべきページ数を指
    示し、 入力された文書データの形態的特徴を抽出し、 抽出された形態的特徴から前記文書データの見出し・段
    落あるいは章・節などの論理構造を求め、 求められた論理構造に基づいて前記文書データが指示さ
    れた前記ページ数内に納まるように予め記憶された整形
    規則を適用して前記文書データを展開する際の書式を決
    定し、 この決定された書式に従って前記データを出力部に展開
    することを特徴とする文書整形方法。
  2. 【請求項2】前記整形規定は、見出しと段落との間にあ
    る空白行などの区切り要素を章・節などの階層により優
    先順位をつけながら文書全体に関して統一して変形する
    ものであることを特徴とする特許請求の範囲第1項記載
    の文書整形方法。
  3. 【請求項3】前記整形規定は、ページ当たりの行数ある
    いは1行当たりの文字数を変更するものであることを特
    徴とする特許請求の範囲第1項記載の文書整形方法。
  4. 【請求項4】前記整形規則を適用して書式を決定すると
    きに、前記論理構造に基づいて見出しとこれを受ける段
    落とがページ渡りしないように書式を決定することを特
    徴とする特許請求の範囲第2項または第3項記載の文書
    整形方法。
JP62054111A 1987-03-11 1987-03-11 文書整形方法 Expired - Lifetime JPH0668748B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62054111A JPH0668748B2 (ja) 1987-03-11 1987-03-11 文書整形方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62054111A JPH0668748B2 (ja) 1987-03-11 1987-03-11 文書整形方法

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP4066681A Division JP2763227B2 (ja) 1992-03-25 1992-03-25 書式決定方法

Publications (2)

Publication Number Publication Date
JPS63221457A JPS63221457A (ja) 1988-09-14
JPH0668748B2 true JPH0668748B2 (ja) 1994-08-31

Family

ID=12961483

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62054111A Expired - Lifetime JPH0668748B2 (ja) 1987-03-11 1987-03-11 文書整形方法

Country Status (1)

Country Link
JP (1) JPH0668748B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0460756A (ja) * 1990-06-29 1992-02-26 Casio Comput Co Ltd 自動調整文書処理装置
JPH0460755A (ja) * 1990-06-29 1992-02-26 Casio Comput Co Ltd 自動調整文書処理装置
JPH04233066A (ja) * 1990-12-28 1992-08-21 Casio Comput Co Ltd 文書処理装置
JP2763227B2 (ja) * 1992-03-25 1998-06-11 株式会社東芝 書式決定方法
JP2002157238A (ja) 2000-09-06 2002-05-31 Seiko Epson Corp 閲覧情報作成システム、ディジタルコンテンツ作成システム及びディジタルコンテンツ配信システム、並びにディジタルコンテンツ作成プログラム

Also Published As

Publication number Publication date
JPS63221457A (ja) 1988-09-14

Similar Documents

Publication Publication Date Title
US7805671B1 (en) Style sheet generation
US20020010719A1 (en) Method and system for generating document summaries with location information
US5787449A (en) Method and system for manipulating the architecture and the content of a document separately from each other
JP2765665B2 (ja) タイポグラフィカル情報付き文書の翻訳装置
JPS62245367A (ja) 文書処理装置
JPH077410B2 (ja) 文書レイアウト方法
Peels et al. Document architecture and text formatting
JPH0668748B2 (ja) 文書整形方法
US5689723A (en) Method for allowing single-byte character set and double-byte character set fonts in a double-byte character set code page
JP2763227B2 (ja) 書式決定方法
JP3076348B2 (ja) 文書整形装置及び文書整形方法
JPS60254367A (ja) 文章分析装置
JPH01205265A (ja) 文書整形装置
JP2829264B2 (ja) 文書レイアウト方法
KR100434526B1 (ko) 문맥정보및지역적문서형태를이용한문장추출방법
JP2680540B2 (ja) 文書レイアウト方法
JP2680501B2 (ja) 文書出力方法
JPH09185603A (ja) 文書作成装置及び文字列形態制御方法
JPH077409B2 (ja) 文書処理装置
JP2682570B2 (ja) 文書レイアウト方法
JP2680500B2 (ja) 文書レイアウト方法
JPS61156366A (ja) ワ−ドプロセツサ
JPH06290209A (ja) 文切り装置
JP2789596B2 (ja) 文書処理装置
JPS6366665A (ja) 文書解析整形装置

Legal Events

Date Code Title Description
EXPY Cancellation because of completion of term