JPH04263358A - 電子文書生成方式 - Google Patents

電子文書生成方式

Info

Publication number
JPH04263358A
JPH04263358A JP3023527A JP2352791A JPH04263358A JP H04263358 A JPH04263358 A JP H04263358A JP 3023527 A JP3023527 A JP 3023527A JP 2352791 A JP2352791 A JP 2352791A JP H04263358 A JPH04263358 A JP H04263358A
Authority
JP
Japan
Prior art keywords
document
logical structure
character string
specific
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3023527A
Other languages
English (en)
Inventor
Kazuya Chiba
和也 千葉
Hitoki Kiyoujima
仁樹 京嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP3023527A priority Critical patent/JPH04263358A/ja
Publication of JPH04263358A publication Critical patent/JPH04263358A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はワープロ、あるいは文書
処理機能を持つワークステーション等で処理される電子
文書を対象とし、この電子文書の論理構造を自動的に変
換する電子文書生成方式に関する。
【0002】
【従来の技術】この種の電子文書としては論理構造つま
り木構造を有するものがあり、例えばODA文書と称さ
れるものが該当する。このODA文書は国際標準化機構
(ISO)が提唱する解放型システム間相互接続(OS
I)の体系に位置づけられるオフィス文書編集交換アー
キテクチャー(ODA;Office Documen
t Architecture)において用いられてい
る(ISO/IS 8613,Information
 Processing−Text and Offi
ce Systems−Office Documen
t Architecture(ODA) and I
nterchange Format(1988) を
参照)。
【0003】このODA文書は論理構造ばかりでなく、
割り付け構造をも有している。ここで、論理構造とは章
、節などのように文書を論理的な視点から見た場合の構
造を表現したものであり、また割り付け構造とは文書を
ページに割り振るときの配置を表現するものである。 これらの論理構造および割り付け構造についてはひな型
の共通論理構造および共通割り付け構造がそれぞれ予め
規定されており、任意のODA文書(以下、特定文書と
称す)を作成するに際しては、特定文書の特定論理構造
は共通論理構造に基づいて制約された構造となり、また
特定文書の特定割り付け構造は共通割り付け構造に基づ
いて制約された構造となる。
【0004】第8図は共通論理構造を例示しており、こ
の共通論理構造には識別子Go が付与されている。同
図において、“技術情報文書”、“本文”、“特許概要
”、“特許説明”、“説明図部”、“段落”、“図”、
“ヘッダ”はそれぞれオブジェクトクラスである。
【0005】また、第9図は第8図に示した共通論理構
造に基づいて制約された特定文書の特定論理構造を示し
ており、1つの“技術情報文書”、1つの“本文”、1
つの“特許概要”、1つの“特許説明”、1つの“説明
図部”、3つの“段落”、2つの“図”、1つの“ヘッ
ダ”はそれぞれオブジェクトである。なお、最下位にお
ける3つの“段落”および2つの“図”である各オブジ
ェクトには内容部がそれぞれ付与され、これらの内容部
が特定文書における文書の一節、図等に該当する。
【0006】第8図における各オブジェクトクラスは下
位の構造を制約する構造式(以下、属性GFS(Gen
erator for subordinates)の
値と称す)をそれぞれ有しており、この属性GFSの値
は“SEQ”、“AGG”、“OPT”、“REP”、
“OPTREP”、“CHO”、“Object cl
ass identifier ”と称する7種類の各
項を組み合わせて形成される。これらの項のうちの項“
Object class identifier ”
はオブジェクトクラスを識別するための文字列であって
、例えば英大文字“A”,“B”,…、あるいは“図”
、“段落”、“Claim ”、“Figure”等で
表される。なお、第8図におけるオブジェクトクラスに
対応する第9図におけるオブジェクトは該オブジェクト
クラスと同じ文字列を用いて表される。また、他の6つ
の各項“SEQ”、“AGG”、“OPT”、“REP
”、“OPTREP”、“CHO”は次のように評価さ
れる。
【0007】(1)項“SEQ”は直下の各オブジェク
トが指定された順序で存在しなければならない。
【0008】(2)項“AGG”は直下の各オブジェク
トが任意の順序で存在できる。
【0009】(3)項“CHO”は直下の各オブジェク
トの内、任意の1つが存在しなければならない。
【0010】(4)項“OPT”は直下の1つのオブジ
ェクトの存在は任意である。
【0011】(5)項“REP”は直下の1つのオブジ
ェクトの1つ以上繰り返しが存在しなければならない。
【0012】(6)項“OPTREP”は直下のオブジ
ェクトの0個以上の繰り返しである。
【0013】ここで、第8図における“特許説明”のオ
ブジェクトクラスをYとするとともに、このオブジェク
トクラスYの下位にある“段落”のオブジェクトクラス
をZとすると、オブジェクトクラスYの属性GFSの値
は(REP  Z)であり、この制約を満たす第9図に
おける構造は並べられた3つの“段落”のオブジェクト
、つまり(Z  Z  Z)となる。なお、ここでは3
つの並び(Z  ZZ)を例示しているが、(Z)、(
Z  Z)、(Z  Z  Z  Z)等の並びが(R
EPZ)の制約を満たす。
【0014】さて、1つの共通論理構造に制約される特
定文書を他の共通論理構造に制約される他の特定文書に
変換する場合は、両者の共通論理構造に基づく変換用の
プログラムを作成しておけば、この変換用プログラムを
用いることにより、前者の共通論理構造を満たす様々な
特定論理構造から後者の共通論理構造を満たす様々な他
の特定論理構造への変換が可能となる。このような変換
用プログラムに関する従来技術を次に述べる。
【0015】いま、米国の特許明細書(特定文書)から
国内向けの技術情報文書(他の特定文書)へと変換する
場合を一例として考える。第10図は米国の特許明細書
の共通論理構造を示す図であり、この共通論理構造には
識別子Gi が付与されている。また、第8図は国内向
けの技術情報文書の共通論理構造を示す図であり、この
共通論理構造には識別子Go が付与されている。
【0016】ここで、米国の特許明細書の共通論理構造
におけるオブジェクトクラスと、国内向けの技術情報文
書の共通論理構造におけるオブジェクトクラスとの対応
付けに関する2つの変換仕様を次に示す。なお、第10
図における“Header”のオブジェクトクラスを含
むそれ以下の構造、および第8図における“ヘッダ”の
オブジェクトクラスを含むそれ以下の構造は省略する。
【0017】(1)米国の特許明細書における“Eff
ect of invention ”および“Cla
im ”の各オブジェクトクラスは国内向けの技術情報
文書における“特許説明”のオブジェクトクラスに対応
する。
【0018】(2)米国の特許明細書における“Fig
ures ”のオブジェクトクラスは国内向けの技術情
報文書における“説明図部”のオブジェクトクラスに対
応する。
【0019】次に、米国の特許明細書の特定論理構造に
おけるオブジェクトの個数と、国内向けの技術情報文書
の特定論理構造におけるオブジェクトの個数との対応付
けに関する2つの変換仕様を示す。
【0020】(3)国内向けの技術情報文書における“
特許説明”の直下にある“段落”のオブジェクトの個数
は米国の特許明細書における“Effect of i
nvention ”の直下にある“Pargraph
”のオブジェクトの個数と、“Claim ”の直下に
ある“Pargraph”のオブジェクトの個数との和
に等しくする。
【0021】(4)国内向けの技術情報文書における“
説明図部”の直下にある“図”のオブジェクトの個数は
米国の特許明細書における“Figures ”の直下
にある“Figure”のオブジェクトの個数に等しく
する。
【0022】これらの変換仕様に基づいて作成された変
換用プログラムを第11図に示す。同図において、記述
項目11−Aは上記各変換仕様(1),(3)に基づい
ており、記述項目11−Bは上記各変換仕様(2),(
4)に基づいている。なお、この変換用プログラムの記
述は変換の対象となるオブジェクトを共通論理構造にお
ける根からたどって指定するという方式がとられている
。例えば、記述項目11−Aにおける“特許説明#1.
特許概要#1.本文#1.技術情報文書#1.@Go 
”に従えば、識別子Go の共通論理構造における“技
術情報文書”の直下にある“本文”、この“本文”の直
下にある“特許概要”、この“特許概要”の直下にある
“特許説明”、この“特許説明”に従属するオブジェク
トと順次たどることができる。また、関数α(X)は、
Xの従属子に含まれる論理オブジェクトの数を返す。
【0023】このような変換用プログラムに基づいて特
定文書を他の特定文書に変換する場合は、変換用プログ
ラムの各記述項目を逐次評価して、各記述項目の条件を
満たすようなオブジェクト並びに内容部を順次生成し、
これにより他の特定文書を生成することとなる。
【0024】ここで、第10図に示した共通論理構造に
制約される米国の特許明細書(特定文書)の特定論理構
造が第12図に示すようなものであるとすると、この特
定論理構造を上記変換用プログラムに従って変換し、こ
れにより得られた国内向けの技術情報文書(他の特定文
書)の特定論理構造が第9図に示すようなものとなる。
【0025】
【発明が解決しようとする課題】しかしながら、上記従
来の変換用プログラムを用いた方式では変換用プログラ
ムの記述に対する制限が緩く、どのような記述であって
もなしうるので、複数の変換条件間に矛盾を含む変換用
プログラムが記述されてしまうことがあり、このような
場合には変換不可能の事態を生じることとなる。例えば
、第13図(a)に示すような識別子Gi2の共通論理
構造から第13図(b)に示すような識別子Go2の共
通論理構造への変換用プログラムとして、第13図(c
)に示すような記述がなされている場合、第13図(a
)の共通論理構造に制約される特定文書においてオブジ
ェクトBに従属するオブジェクトDの個数とオブジェク
トEに従属するオブジェクトFの個数とが一致しなけれ
ば、第13図(b)の共通論理構造に制約される特定文
書においてオブジェクトGに従属するオブジェクトHの
個数を特定することが不可能になるという不都合を生じ
てしまう。
【0026】また、例えば先に述べた第11図に示す変
換用プログラムに基づいて、第9図に示した共通論理構
造の制約を満たさない第14図に示すような特定論理構
造の特定文書を変換しようとする場合は、変換処理に際
して“Claim ”を評価することができず、エラー
となる。すなわち、共通論理構造の制約を満たさない特
定文書が変換対象となってしまった場合には、エラーに
当然なる。このような事態を回避するためには、変換処
理に先立って、変換すべき特定文書が共通論理構造を満
たすか否かを確かめるという方法が考えられるが、この
ために処理過程を煩雑かつ複雑にすることは好ましいこ
とではない。
【0027】さらに、変換用プログラムを作成するに際
しては、異なる2つの共通論理構造を把握しなければな
らないが、これらの共通論理構造と上記変換用プログラ
ムの記述内容とを対比することは直観的に行い難く、こ
のため見通しが悪くなって、変換用プログラムの設計が
極めて困難になる。
【0028】そこで、本発明はプログラムの記述を適宜
に制限することによりプログラムに矛盾が含まれないよ
うにすること、変換すべき特定文書が共通論理構造の制
約を満たすか否かを簡単に確認できるようにすること、
および変換処理過程が簡単でかつプログラムの設計が容
易な電子文書生成方式を提供することを目的とする。
【課題を解決するための手段】本発明では入力文書を文
書構造および各内容に分離して、前記入力文書の文書構
造を示す第1の文字列を形成し、さらに前記第1の文字
列を予め定められた変換規則に従って出力文書の文書構
造を示す第2の文字列に変換し、この第2の文字列に基
づいて前記出力文書の文書構造を形成して、前記各内容
および前記出力文書の文書構造を合成することにより該
出力文書を形成するようにしている。
【0029】
【作用】本発明によれば、入力文書の文書構造を第1の
文字列に一旦変換し、所定の変換規則に基づいて第1の
文字列から第2の文字列を生成し、この第2の文字列に
よって示される文書構造に入力文書の内容を付与するこ
とにより出力文書を得るようにしている。したがって、
所定の変換規則は文字列に対する変換規則であって、単
純化されたものとなる。これに伴い、変換処理過程も簡
単化される。
【0030】
【実施例】以下、本発明の実施例を添付図面を参照して
詳細に説明する。
【0031】第1図は本発明に係わる電子文書生成方式
の一実施例である変換処理過程を示しており、ここでは
ODA文書である入力された特定文書1(以下、入力特
定文書と称す)を同じくODA文書である特定文書2(
以下、出力特定文書と称す)に変換して出力している。 なお、この実施例の変換処理はワープロ、文書処理機能
を持つワークステーション等における中央処理装置およ
びメモリ等においてなされるものである。
【0032】同図において、入力特定文書1は内容部分
離処理ステップ11にて特定論理構造と内容部に分離さ
れ、これにより第1の特定論理構造12および内容部群
13が形成される。この第1の特定論理構造12は文字
列形成処理ステップ14で文字列に変換され、これによ
り第1の文字列15が形成される。この第1の文字列1
5は論理構造変換処理ステップ16にて論理構造変換規
則16−1に基づく変換処理を施され、これにより第2
の文字列17が形成される。この第2の文字列17は木
構造形成処理ステップ18にて特定論理構造に変換され
、これにより第2の特定論理構造19が形成される。 この第2の特定論理構造19は内容部付加処理ステップ
20にて内容部群13の内容部が付加され、これにより
出力特定文書2が形成される。
【0033】次に、第1図に示した各処理ステップを逐
次更に詳しく述べる。なお、ここでは例えば入力特定文
書1を第2図(a)に示すようなものとし、この入力特
定文書1を制約する共通論理構造を第3図に示すような
ものとするとともに、出力特定文書2を制約する共通論
理構造を第4図に示すようなものとする。
【0034】まず、第1図における内容分離処理ステッ
プ11では、入力特定文書1を第2図(b)に示すよう
な各オブジェクトA,B,D1 ,E,F2 ,F3 
からなる第1の特定論理構造12と、第2図(c)に示
すような各内容部C1 ,C2 ,C3 からなる内容
部群13とに分離する。また、ここでは各内容部C1 
,C2 ,C3 を識別するために、該各内容部にはそ
れぞれの肩文字1 ,2 ,3 が付加されており、こ
れに伴い該各内容部C1 ,C2 ,C3 を有する各
オブジェクトD1 ,F2 ,F3 にもそれぞれ同じ
肩文字が付加される。
【0035】次に、第1図における文字列形成処理ステ
ップ14では、第2図(b)に示した第1の特定論理構
造12を第2図(d)に示すような第1の文字列15に
変換する。ここで、特定論理構造から文字列への文字列
変換規則を示す。
【0036】(規則1)内容部を付与されたオブジェク
トXに対応する文字列は、Xである。
【0037】(規則2)内容部を付与されていないオブ
ジェクトXに対応する文字列は、該オブジェクトXの直
下にある各オブジェクトに対応する文字列をそれぞれy
1 ,y2 ,…,yn (n≧0)とすると、X[y
1  y2   …yn ]である。
【0038】(規則3)根のオブジェクトに対応する文
字列は、該根から始まる論理構造全体に対応する文字列
である。
【0039】これらの文字列変換規則に基づけば、第2
図(b)に示した第1の特定論理構造12におけるオブ
ジェクトBの直下に内容部を付与されたオブジェクトD
1 があることからB[D1 ]を導くことができると
ともに、オブジェクトEの直下にそれぞの内容部を付与
された各オブジェクトF2 ,F3 があることからE
[F2 F3 ]を導くことができ、さらに根のオブジ
ェクトAの直下に各オブジェクトB,Eがあることから
根のオブジェクトAに対応する文字列、つまり第1の特
定論理構造12に対応する第1の文字列15がA[B[
D1 ]E[F2 F3 ]]となることは明らかであ
る。
【0040】次に、第1図における論理構造変換処理ス
テップ16では、論理構造変換規則16−1が第3図お
よび第4図に示した各共通論理構造に基づいて第2図(
e)に示すように予め定められているとすると、この論
理構造変換規則16−1に従って第2図(d)に示した
第1の文字列15から第2図(g)に示すようなG[H
1 H2 H3 ]という第2の文字列17を導き出す
【0041】ここで、この論理構造変換規則16−1を
実行するプログラム(以下、変換プログラムと称す)は
、シンタックス・ダイレクテッド・トランスレーション
(Syntax−Directed Translat
ions、以下SDTと称す)として記述されたもので
ある(SDTについては、Gonzalez,R.C.
and Thomason,M.G.:Syntax−
Directed Translations,Syn
tactic Pattern Recognitio
n,Addison−Wesley Publishi
ng Company,pp.57−60(1978)
を参照)。
【0042】さらに、このSDTは文脈自由文法(Co
ntext−freeGrammar, 以下CFGと
称す)に基づいて作成される。いま、CFGの生成規則
をA→αとすると、CFGに基づいて作成されるSDT
の生成規則はA→α,βとなる。ただし、α,βに出現
する非終端記号の種類と数は一致していなければいけな
い(ここで、同じ非終端記号が2つ以上あったとき、α
とβ間での対応を示すために、肩文字が使われることが
ある)。
【0043】このSDTの生成規則A→α,βにおいて
、A→αの形をした規則を集めて得られるCFGをSD
Tの入力文法と言い、またA→βの形をした規則を集め
て得られるCFGをSDTの出力文法と言う。入力文法
に従ってAがαに書替えられると、これに伴い出力文法
に従ってAがβに書替えられる。このような書替えを繰
返すことにより、開始記号から入力された文字列xが導
き出され、これに伴い開始記号から出力される文字列y
が導き出される。これらの文字列x,yが導き出される
と、入力された文字列xが出力される文字列yに変換さ
れたこととなる。
【0044】第2図(e)には論理構造変換規則16−
1つまりSDTの生成規則が例示されており、入力文法
16−2に該当するのは{S→A[B[M]E[N]]
、M→DM、M→D、N→FN、N→F}であり、出力
文法16−3に該当するのは{S→G[MN]、M→H
M、M→H、N→HN、N→H}である。
【0045】第5図は論理構造変換規則16−1に基づ
く処理過程を例示しており、入力文法16−2に基づい
て第2図(d)に示した第1の文字列15を導き出すと
ともに、この第1の文字列15の導出過程(第1図に示
す解析木16−5に該当する)を参照しつつ出力文法1
6−3に基づいて第2図(g)に示した第2の文字列1
7を導き出すという処理過程を示している。
【0046】まず、入力文法16−2に基づく導出過程
では、A[B[M]E[N]]を導き出し、さらにM→
Dに基づいてA[B[D1 ]E[N]]を導く。引き
続き、N→FNに基づいてA[B[D1 ]E[F2 
N]]を導き、さらにN→Fに基づいてA[B[D1 
]E[F2 F3]]を導く。この結果、第1の文字列
15であるA[B[D1 ]E[F2 F3 ]]を得
、またこの導出過程に対応する第2図(f)に示すよう
な解析木16−5を得ることができる。
【0047】一方、出力文法16−3に基づく導出過程
は、第2図(f)に示した解析木16−5を参照しつつ
進行する。まずG[MN]を導き出し、さらにM→Hに
基づいてG[H1 N]を導く。ここで、導かれたG[
H1 N]におけるH1 は入力側のM→Dに基づき導
かれたA[B[D1 ]E[N]]におけるD1 に対
応し、H1 にはD1 と同じ肩文字1 が付加される
。引き続き、出力文法16−3におけるN→HNに基づ
いてG[H1 H2 N]を導き出す。ここで、導かれ
たG[H1 H2 N]におけるH2 は入力側のN→
FNに基づき導かれたA[B[D1 ]E[F2 N]
]におけるF2 に対応し、H2 にはF2 と同じ肩
文字2 が付加される。さらに、出力文法16−3にお
けるN→Hに基づいてG[H1 H2 H3 ]を導き
出す。ここで、導かれたG[H1 H2 H3 ]にお
けるH3 は入力側のN→Fに基づき導かれたA[B[
D1 ]E[F2 F3]]におけるF3 に対応し、
H3 にはF3 と同じ肩文字3 が付加される。この
結果、第2の文字列17であるG[H1 H2H3 ]
を得る。
【0048】以上の処理過程を経ることにより、第1の
文字列15であるA[B[D1 ]E[F2 F3 ]
]は第2の文字列17であるG[H1 H2 H3 ]
に変換されたこととなる。
【0049】このような入力文法16−2に基づく導出
過程は第1図における構文解析ステップ16−4で行わ
れ、これにより解析木16−5が形成される。また、論
理構造変換規則16−1に基づく変換処理は第1図にお
ける構文解析ステップ16−4および出力文字列生成ス
テップ16−6で行われる。なお、構文解析ステップ1
6−4で行われる変換処理のみに着目すれば、これは構
文解析である(Younger,D.H.:Recog
nition and parsing of con
text−free languages in ti
me n3,Inform.Contr.,Vol.1
0,No.2,pp.189−208(1967)を参
照)。
【0050】ここで、構文解析ステップ16−4での構
文解析が失敗した場合、つまり入力文法16−2に基づ
いて第1の特定論理構造12を示す第1の文字列15を
導くことができなかったときには、この構文解析ステッ
プ16−4からエラーメッセージ出力ステップ21へと
移り、これによりエラーメッセージがオペレータに通知
される。この場合、第1の特定論理構造12は第3図に
示した共通論理構造の制約を満たしていないこととなる
【0051】次に、第1図における木構造形成処理ステ
ップ18では、第2の文字列17であるG[H1 H2
 H3 ]に基づいて第2の特定論理構造19を形成す
る。この第2の文字列17から第2の特定論理構造19
への変換は、先に述べた3つの文字列変換規則に従って
行われる。すなわち、G[H1 H2 H3 ]に基づ
けば根のオブジェクトGの直下に3つの各オブジェクト
H1 ,H2 ,H3 が属することから、第2図(h
)に示すような第2の特定論理構造19が導かれる。
【0052】次に、第1図における内容部付加処理ステ
ップ20では、第2の特定論理構造19に対して内容部
群13の各内容を付与し、これにより出力特定文書2を
形成する。すなわち、第2図(h)に示した第2の特定
論理構造19における最下位の各オブジェクトH1 ,
H2 ,H3 に対して第2図(c)に示した各内容部
C1 ,C2 ,C3 をそれぞれ付与する。このとき
、各オブジェクトH1 ,H2 ,H3 のそれぞれの
肩文字と各内容部C1 ,C2 ,C3 のそれぞれの
肩文字とに対応関係を持たせ、該各オブジェクトにそれ
ぞれの内容部が割り当てられる。これにより、第2図(
i)に示すような出力特定文書2が形成され、この出力
特定文書2が出力される。
【0053】ここで、入力された入力特定文書1と出力
された出力特定文書2とを比較してみると、第2図(a
)に示した入力特定文書1における最下位のオブジェク
トDの個数とオブジェクトFの個数との和が、第2図(
i)に示した出力特定文書2における最下位のオブジェ
クトHの個数に一致しており、また入力特定文書1にお
ける各オブジェクトD,F,Fに属するそれぞれの内容
部C1 ,C2 ,C3 が出力特定文書2における各
オブジェクトH,H,Hにそれぞれ割り振られている。 したがって、入力特定文書1から出力特定文書2への変
換は何等矛盾を生じることなく行われたことが明らかで
ある。
【0054】このように本実施例では、内容分離処理ス
テップ11にて入力特定文書1を第1の特定論理構造1
2と各内容部とに分離し、文字列形成処理ステップ14
にて第1の特定論理構造12を第1の文字列15に変換
し、論理構造変換処理ステップ16にて第1の文字列1
5を第2の文字列17に変換し、木構造形成処理ステッ
プ18にて第2の文字列17を第2の特定論理構造19
に変換し、内容部付加処理ステップ20にて第2の特定
論理構造19に対して各内容部を付与することにより出
力特定文書2を形成している。これらのステップのうち
の論理構造変換処理ステップ16に着目してみれば、こ
のステップにて第1の特定論理構造12から第2の特定
論理構造19への変換が行われているのであって、この
変換は文字列から文字列への変換であることから、その
変換処理は木構造から木構造への直接の変換処理に比べ
れば、簡単な内容で済ませることが可能となる。
【0055】また、論理構造変換処理ステップ16にお
ける構文解析ステップ16−4での構文解析が失敗した
場合にはエラーメッセージが出力され、このときには第
1の特定論理構造12が第3図に示した共通論理構造の
制約を満たしていないことが明らかとなるので、入力特
定文書の特定論理構造が所定の共通論理構造の制約を満
たすか否かを確認するための格別の処理を採用する必要
が全くない。
【0056】ところで、先に述べたSDTの生成規則に
対しては次に示すような4つの条件を課しており、SD
Tはこれら4つの条件を満たなければならない。
【0057】(条件1)入力文法によって生成しうる文
字列の集合は、入力側の共通論理構造の制約を満たす特
定論理構造の集合に対応する文字列の集合に等しい。
【0058】(条件2)出力文法によって生成しうる文
字列の集合は、出力側の共通論理構造の制約を満たす特
定論理構造の集合に対応する文字列の集合の部分集合で
ある。
【0059】(条件3)SDTの各生成規則A→α,β
における文字列α,βは、それぞれ次の各条件を満たさ
なければならない。
【0060】1)“[”および“]”は必ず対で用いら
れ、一対の“[”および“]”のうちの“[”の方が文
字列中で最初に用いられる。
【0061】2)“[”の直前には“[”および“]”
以外の文字が必ずくる。
【0062】(条件4)各規則A→α,βについて、“
(α中に現れる最下位のオブジェクトに対応する終端記
号の数)≧(β中に現れる最下位のオブジェクトに対応
する終端記号の数)”を満たさなければならない。
【0063】ここで、上記各条件について第2図(e)
に示したSDTの生成規則を考察してみる。
【0064】まず、条件1については、入力文法によっ
て生成しうる文字列の集合が{A[B[Dm ]E[F
n ]](m ≧1,n ≧1)}であり、これは第3
図に示した共通論理構造の制約を満たす特定論理構造の
集合に対応する文字列の集合に等しいので、該条件が満
たされる。この条件を満たした場合は、該共通論理構造
の制約を満たす入力特定文書を必ず変換できることが保
証される。
【0065】次に、条件2については、出力文法によっ
て生成しうる文字列の集合が{G[Hn ](n ≧2
)}であり、これは第4図に示した共通論理構造の制約
を満たす特定論理構造の集合に対応する文字列の集合{
G[Hn ](n ≧1)}の部分集合なので、該条件
が満たされる。この条件を満たした場合は、出力特定文
書が出力側の共通論理構造の制約を満たす特定文書の集
合に入ることが保証される。次に、条件3は、例えば1
番目の規則をみると、入力文法の文字列A[B[M]E
[N]]、および出力文法の文字列G[MN]において
それぞれ満たされており、また2番目から5番目の規則
については明らかに満たされている。この条件が満たさ
れている場合は、変換処理に際して特定文書の木構造を
破壊しないことが保証される。
【0066】次に、条件4については、1番目の規則に
おける入力文法中の最下位オブジェクトに対応する終端
記号の数と出力文法中の最下位オブジェクトに対応する
終端記号の数との関係は0≧0であり、2番目の規則に
おける入力文法中の最下位オブジェクトに対応する終端
記号(D)の数と出力文法中の最下位オブジェクトに対
応する終端記号(H)の数との関係は1≧1であり、3
番目の規則における入力文法中の最下位オブジェクトに
対応する終端記号(D)の数と出力文法中の最下位オブ
ジェクトに対応する終端記号(H)の数との関係は1≧
1であり、4番目の規則における入力文法中の最下位オ
ブジェクトに対応する終端記号(F)の数と出力文法中
の最下位オブジェクトに対応する終端記号(H)の数と
の関係は1≧1であり、5番目の規則における入力文法
中の最下位オブジェクトに対応する終端記号(F)の数
と出力文法中の最下位オブジェクトに対応する終端記号
(H)の数との関係は1≧1であるので、該条件が満た
される。この条件を満たした場合は、入力特定文書の各
内容部を出力特定文書に移したときに、出力特定文書に
おいて内容部を持たない最下位のオブジェクトが存在し
ないことが保証される。
【0067】このような4つの条件を満たすようにSD
Tの生成規則を記述すれば、生成規則に矛盾を生じるよ
うなことはなく、入力側の共通論理構造に制約される入
力特定文書を出力側の共通論理構造に制約される出力特
定文書に必ず変換することができるようになる。また、
上記各条件のうちの条件3および条件4を満たすか否か
の判定は自動化することが可能であり、条件1および条
件2を満たすか否かの判定は生成規則の作成者の考察に
基づくものとなるが容易に行いうる。
【0068】さらに、このSDTの生成規則における入
力文法と第3図に示した入力側の共通論理構造とを比較
してみると、S→A[B[M]E[N]]がオブジェク
トAの属性GFS値に対応し、M→DMおよびM→Dが
オブジェクトBの属性GFS値に対応し、N→FNおよ
びN→FがオブジェクトEの属性GFS値に対応してい
ることが明らかである。このような対応関係は出力文法
と第4図に示した出力側の共通論理構造との間にもあり
、これはオブジェクトの属性GFS値による制約がCF
Gの生成規則による文字列の導出と概念的に近いことに
起因する。このため、入力側の共通論理構造および出力
側の共通論理構造を把握しつつ生成規則を作成すること
が容易になる。また、SDTの生成規則は文字列を配列
してなる単純なものなので、書きやすく読みやすく、変
換処理の過程を考察することが容易であり、プログラム
の見通しの良い設計が可能となる。
【0069】第6図はSDT生成規則の他の例を示して
おり、このSDT生成規則は第7図図(a)に示す入力
側の共通論理構造および第7図(b)に示す出力側の共
通論理構造に基づくものである。
【0070】第6図において、記述項目6LはSDT生
成規則における入力文法であり、記述項目6RはSDT
生成規則における出力文法である。また、第7図(a)
において、“Body”、“Figures ”、“E
ffect of invention ”、“Exa
mples”、“Claim ”、“Figure”、
“Paragraph ”はそれぞれオブジェクトクラ
スである。 さらに、第7図(b)において、“特許概要”、“特許
説明”、“説明図部”、“段落”、“図”はそれぞれオ
ブジェクトクラスである。
【0071】ここで、入力特定文書の特定論理構造にお
ける“Figures”のオブジェクトに従属する“F
igure”のオブジェクトと、出力特定文書の特定論
理構造における“説明図部”のオブジェクトに従属する
“図”のオブジェクトとは対応関係を持たされており、
SDT生成規則における入力文法に従って非終端記号<
図+ >から終端記号<Figure>を導くと、これ
に伴い出力文法に従って終端記号<図>が導かれる。よ
って、“Figure”のオブジェクトの個数と、“図
”のオブジェクトの個数とは等しくなる。
【0072】また、入力特定文書の特定論理構造におけ
る“Effect of invention ”のオ
ブジェクトに従属する“Paragraph ”のオブ
ジェクトおよび“Claim ”のオブジェクトに従属
する“Paragraph ”のオブジェクトと、出力
特定文書の特定論理構造における“特許説明”のオブジ
ェクトに従属する“段落”のオブジェクトとは対応関係
を持たされており、SDT生成規則における入力文法に
従って非終端記号<説明Par+>から終端記号<Pa
ragraph >を導くと、これに伴い出力文法に従
って終端記号<段落>が導かれる。よって、“Para
graph ”のオブジェクトの総和と、“段落”のオ
ブジェクトの個数とは等しくなる。
【0073】さらに、入力特定文書の特定論理構造にお
ける“Examples”のオブジェクトに従属する“
Paragraph ”のオブジェクトに対応関係を持
つ出力特定文書の特定論理構造におけるオブジェクトは
設定されておらず、SDT生成規則における入力文法に
従って非終端記号<削除Par+>から終端記号<Pa
ragraph >を導くと、これに伴い出力文法に従
って終端記号<ε>が導かれる。この終端記号<ε>は
空の文字列を表しており、このため出力特定文書におい
ては該当するオブジェクトが存在せず、その内容部も存
在しないこととなる。
【0074】なお、上記実施例ではSDTの生成規則を
利用して文字列の変換処理を行っているが、本発明はこ
れに限定されるものでなく、要は入力特定文書の特定論
理構造を文字列に一旦変換し、この文字列を出力特定文
書の特定論理構造を示す文字列に変換できればよいので
あって、入力側の共通論理構造および出力側の共通論理
構造に基づく生成規則であれば適用しうる。
【0075】
【発明の効果】以上説明したように本発明によれば、入
力文書の文書構造を第1の文字列に一旦変換し、所定の
変換規則に基づいて第1の文字列から第2の文字列を生
成し、この第2の文字列によって示される文書構造に入
力文書の内容を付与することにより出力文書を得るよう
にしている。したがって、所定の変換規則は文字列に対
する変換規則であって、単純化されたものとなる。この
ため、変換処理過程が簡単化され、そのためのプログラ
ムの設計制作が容易となる。
【0076】また、本発明の実施例によれば、上記変換
規則に種々の条件を課すことにより、プログラムに矛盾
が含まれないようにすることを可能ならしめている。さ
らに、上記変換規則における構文解析に失敗したか否か
により、入力特定文書が入力側の共通論理構造の制約を
満たさないか否かを確認することができる。
【図面の簡単な説明】
【図1】本発明に係わる電子文書生成方式の一実施例で
ある変換処理過程を示す図。
【図2】第1図に示した実施例における変換処理過程の
一例を説明するために用いられた図
【図3】第2図に示した入力特定文書を制約する共通論
理構造を示す図。
【図4】第2図に示した出力特定文書を制約する共通論
理構造を示す図。
【図5】第1図に示した実施例における論理構造変換規
則に基づく処理過程を説明するために用いられた図。
【図6】論理構造変換規則の他の例を示す図。
【図7】第6図に示した論理構造変換規則を適用された
入力側の共通論理構造および出力側の共通論理構造を示
す図。
【図8】技術情報文書と称する文書の共通論理構造を示
す図。
【図9】第8図に示した共通論理構造に基づいて制約さ
れた特定文書の特定論理構造を示す図。
【図10】米国の特許明細書と称する文書の共通論理構
造を示す図。
【図11】従来の変換用プログラムを例示する図。
【図12】第10図に示した共通論理構造に制約される
特定論理構造を例示する図。
【図13】従来の変換用プログラムにおける矛盾の一例
を説明するために用いられた図。
【図14】第10図に示した共通論理構造の制約を満た
さない米国の特許明細書と称する文書の特定論理構造を
例示する図。
【符号の説明】
1…入力特定文書 2…出力特定文書 11…内容部分離処理ステップ 12…第1の特定論理構造 13…内容部群 14…文字列形成処理ステップ 15…第1の文字列 16…論理構造変換処理ステップ 16−1…論理構造変換規則 16−2…入力文法 16−3…出力文法 16−4…構文解析ステップ 16−5…解析木 16−6…出力文字列生成ステップ 17…第2の文字列 18…木構造形成処理ステップ18 19…第2の特定論理構造 20…内容部付加処理ステップ 21…エラーメッセージ出力ステップ

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】入力文書の文書構造を示す第1の文字列を
    形成するステップと、前記第1の文字列を予め定められ
    た変換規則に従って出力文書の文書構造を示す第2の文
    字列に変換するステップと、前記第2の文字列に基づい
    て前記出力文書の文書構造を形成するステップと、を備
    えたことを特徴とする電子文書生成方式。
  2. 【請求項2】第2の文字列に変換するステップは文脈自
    由文法に基づく構文解析を第1の文字列に対して行う処
    理を含み、この構文解析の結果に応じて前記第1の文字
    列が変換可能であるか否かを判別することを特徴とする
    請求項(1) 記載の電子文書生成方式。
JP3023527A 1991-02-18 1991-02-18 電子文書生成方式 Pending JPH04263358A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3023527A JPH04263358A (ja) 1991-02-18 1991-02-18 電子文書生成方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3023527A JPH04263358A (ja) 1991-02-18 1991-02-18 電子文書生成方式

Publications (1)

Publication Number Publication Date
JPH04263358A true JPH04263358A (ja) 1992-09-18

Family

ID=12112923

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3023527A Pending JPH04263358A (ja) 1991-02-18 1991-02-18 電子文書生成方式

Country Status (1)

Country Link
JP (1) JPH04263358A (ja)

Similar Documents

Publication Publication Date Title
US4969093A (en) Method of data stream construct management utilizing format shells and shell fragments
US6003033A (en) System and method for describing and creating a user defined arbitrary data structure corresponding to a tree in a computer memory
US5434962A (en) Method and system for automatically generating logical structures of electronic documents
US9239821B2 (en) Translation file
US8046683B2 (en) Structural editing with schema awareness
US6502101B1 (en) Converting a hierarchical data structure into a flat data structure
US6014680A (en) Method and apparatus for generating structured document
US5438512A (en) Method and apparatus for specifying layout processing of structured documents
DE69129107T2 (de) Automatisches übersetzungs-und fernübertragungssystem
US20030074636A1 (en) Enabling easy generation of XML documents from XML specifications
DE60304066T2 (de) Verfahren zur Normalisierung einer Diskursrepräsentationsstruktur und normalisierte Datenstruktur
JP2006178946A (ja) ワークブックを表現するためのファイルフォーマット、方法およびコンピュータプログラム製品
JP4303079B2 (ja) テキストフォーマッティングまたはマークアップ言語フォーマッティングとアウトライン構造との間の変換のためのシステムおよび方法
DE69715525T2 (de) Verfahren und System um Datenstrukturen zu vereinigen
Raposo et al. The wargo system: Semi-automatic wrapper generation in presence of complex data access modes
Arnon Scrimshaw: A language for document queries and transformations
JPH02112068A (ja) テキスト簡略表示方式
JPH04263358A (ja) 電子文書生成方式
US4905146A (en) Explicit specification of valid compound document data stream structure and content
CN101339504B (zh) 一种基于文本的人机命令输出格式检查方法
EP0501753A2 (en) System for and method of generating a data structure
Ramalho et al. Algebraic specification of documents
Mönnich et al. A regular query for context-sensitive relations
Nicholas et al. On the Interchangeability of SGML and ODA.
Lizorkin et al. Implementation of the XML linking language XLink by functional methods