JPH04263358A

JPH04263358A - 電子文書生成方式

Info

Publication number: JPH04263358A
Application number: JP3023527A
Authority: JP
Inventors: Kazuya Chiba; 和也千葉; Hitoki Kiyoujima; 仁樹京嶋
Original assignee: Fuji Xerox Co Ltd
Current assignee: Fujifilm Business Innovation Corp
Priority date: 1991-02-18
Filing date: 1991-02-18
Publication date: 1992-09-18

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はワープロ、あるいは文書
処理機能を持つワークステーション等で処理される電子
文書を対象とし、この電子文書の論理構造を自動的に変
換する電子文書生成方式に関する。

【０００２】

【従来の技術】この種の電子文書としては論理構造つま
り木構造を有するものがあり、例えばＯＤＡ文書と称さ
れるものが該当する。このＯＤＡ文書は国際標準化機構
（ＩＳＯ）が提唱する解放型システム間相互接続（ＯＳ
Ｉ）の体系に位置づけられるオフィス文書編集交換アー
キテクチャー（ＯＤＡ；Ｏｆｆｉｃｅ　Ｄｏｃｕｍｅｎ
ｔ　Ａｒｃｈｉｔｅｃｔｕｒｅ）において用いられてい
る（ＩＳＯ／ＩＳ　８６１３，Ｉｎｆｏｒｍａｔｉｏｎ
　Ｐｒｏｃｅｓｓｉｎｇ−Ｔｅｘｔ　ａｎｄ　Ｏｆｆｉ
ｃｅ　Ｓｙｓｔｅｍｓ−Ｏｆｆｉｃｅ　Ｄｏｃｕｍｅｎ
ｔ　Ａｒｃｈｉｔｅｃｔｕｒｅ（ＯＤＡ）　ａｎｄ　Ｉ
ｎｔｅｒｃｈａｎｇｅ　Ｆｏｒｍａｔ（１９８８）　を
参照）。

【０００３】このＯＤＡ文書は論理構造ばかりでなく、
割り付け構造をも有している。ここで、論理構造とは章
、節などのように文書を論理的な視点から見た場合の構
造を表現したものであり、また割り付け構造とは文書を
ページに割り振るときの配置を表現するものである。これらの論理構造および割り付け構造についてはひな型
の共通論理構造および共通割り付け構造がそれぞれ予め
規定されており、任意のＯＤＡ文書（以下、特定文書と
称す）を作成するに際しては、特定文書の特定論理構造
は共通論理構造に基づいて制約された構造となり、また
特定文書の特定割り付け構造は共通割り付け構造に基づ
いて制約された構造となる。

【０００４】第８図は共通論理構造を例示しており、こ
の共通論理構造には識別子Ｇｏ　が付与されている。同
図において、“技術情報文書”、“本文”、“特許概要
”、“特許説明”、“説明図部”、“段落”、“図”、
“ヘッダ”はそれぞれオブジェクトクラスである。

【０００５】また、第９図は第８図に示した共通論理構
造に基づいて制約された特定文書の特定論理構造を示し
ており、１つの“技術情報文書”、１つの“本文”、１
つの“特許概要”、１つの“特許説明”、１つの“説明
図部”、３つの“段落”、２つの“図”、１つの“ヘッ
ダ”はそれぞれオブジェクトである。なお、最下位にお
ける３つの“段落”および２つの“図”である各オブジ
ェクトには内容部がそれぞれ付与され、これらの内容部
が特定文書における文書の一節、図等に該当する。

【０００６】第８図における各オブジェクトクラスは下
位の構造を制約する構造式（以下、属性ＧＦＳ（Ｇｅｎ
ｅｒａｔｏｒ　ｆｏｒ　ｓｕｂｏｒｄｉｎａｔｅｓ）の
値と称す）をそれぞれ有しており、この属性ＧＦＳの値
は“ＳＥＱ”、“ＡＧＧ”、“ＯＰＴ”、“ＲＥＰ”、
“ＯＰＴＲＥＰ”、“ＣＨＯ”、“Ｏｂｊｅｃｔ　ｃｌ
ａｓｓ　ｉｄｅｎｔｉｆｉｅｒ　”と称する７種類の各
項を組み合わせて形成される。これらの項のうちの項“
Ｏｂｊｅｃｔ　ｃｌａｓｓ　ｉｄｅｎｔｉｆｉｅｒ　”
はオブジェクトクラスを識別するための文字列であって
、例えば英大文字“Ａ”，“Ｂ”，…、あるいは“図”
、“段落”、“Ｃｌａｉｍ　”、“Ｆｉｇｕｒｅ”等で
表される。なお、第８図におけるオブジェクトクラスに
対応する第９図におけるオブジェクトは該オブジェクト
クラスと同じ文字列を用いて表される。また、他の６つ
の各項“ＳＥＱ”、“ＡＧＧ”、“ＯＰＴ”、“ＲＥＰ
”、“ＯＰＴＲＥＰ”、“ＣＨＯ”は次のように評価さ
れる。

【０００７】（１）項“ＳＥＱ”は直下の各オブジェク
トが指定された順序で存在しなければならない。

【０００８】（２）項“ＡＧＧ”は直下の各オブジェク
トが任意の順序で存在できる。

【０００９】（３）項“ＣＨＯ”は直下の各オブジェク
トの内、任意の１つが存在しなければならない。

【００１０】（４）項“ＯＰＴ”は直下の１つのオブジ
ェクトの存在は任意である。

【００１１】（５）項“ＲＥＰ”は直下の１つのオブジ
ェクトの１つ以上繰り返しが存在しなければならない。

【００１２】（６）項“ＯＰＴＲＥＰ”は直下のオブジ
ェクトの０個以上の繰り返しである。

【００１３】ここで、第８図における“特許説明”のオ
ブジェクトクラスをＹとするとともに、このオブジェク
トクラスＹの下位にある“段落”のオブジェクトクラス
をＺとすると、オブジェクトクラスＹの属性ＧＦＳの値
は（ＲＥＰ　　Ｚ）であり、この制約を満たす第９図に
おける構造は並べられた３つの“段落”のオブジェクト
、つまり（Ｚ　　Ｚ　　Ｚ）となる。なお、ここでは３
つの並び（Ｚ　　ＺＺ）を例示しているが、（Ｚ）、（
Ｚ　　Ｚ）、（Ｚ　　Ｚ　　Ｚ　　Ｚ）等の並びが（Ｒ
ＥＰＺ）の制約を満たす。

【００１４】さて、１つの共通論理構造に制約される特
定文書を他の共通論理構造に制約される他の特定文書に
変換する場合は、両者の共通論理構造に基づく変換用の
プログラムを作成しておけば、この変換用プログラムを
用いることにより、前者の共通論理構造を満たす様々な
特定論理構造から後者の共通論理構造を満たす様々な他
の特定論理構造への変換が可能となる。このような変換
用プログラムに関する従来技術を次に述べる。

【００１５】いま、米国の特許明細書（特定文書）から
国内向けの技術情報文書（他の特定文書）へと変換する
場合を一例として考える。第１０図は米国の特許明細書
の共通論理構造を示す図であり、この共通論理構造には
識別子Ｇｉ　が付与されている。また、第８図は国内向
けの技術情報文書の共通論理構造を示す図であり、この
共通論理構造には識別子Ｇｏ　が付与されている。

【００１６】ここで、米国の特許明細書の共通論理構造
におけるオブジェクトクラスと、国内向けの技術情報文
書の共通論理構造におけるオブジェクトクラスとの対応
付けに関する２つの変換仕様を次に示す。なお、第１０
図における“Ｈｅａｄｅｒ”のオブジェクトクラスを含
むそれ以下の構造、および第８図における“ヘッダ”の
オブジェクトクラスを含むそれ以下の構造は省略する。

【００１７】（１）米国の特許明細書における“Ｅｆｆ
ｅｃｔ　ｏｆ　ｉｎｖｅｎｔｉｏｎ　”および“Ｃｌａ
ｉｍ　”の各オブジェクトクラスは国内向けの技術情報
文書における“特許説明”のオブジェクトクラスに対応
する。

【００１８】（２）米国の特許明細書における“Ｆｉｇ
ｕｒｅｓ　”のオブジェクトクラスは国内向けの技術情
報文書における“説明図部”のオブジェクトクラスに対
応する。

【００１９】次に、米国の特許明細書の特定論理構造に
おけるオブジェクトの個数と、国内向けの技術情報文書
の特定論理構造におけるオブジェクトの個数との対応付
けに関する２つの変換仕様を示す。

【００２０】（３）国内向けの技術情報文書における“
特許説明”の直下にある“段落”のオブジェクトの個数
は米国の特許明細書における“Ｅｆｆｅｃｔ　ｏｆ　ｉ
ｎｖｅｎｔｉｏｎ　”の直下にある“Ｐａｒｇｒａｐｈ
”のオブジェクトの個数と、“Ｃｌａｉｍ　”の直下に
ある“Ｐａｒｇｒａｐｈ”のオブジェクトの個数との和
に等しくする。

【００２１】（４）国内向けの技術情報文書における“
説明図部”の直下にある“図”のオブジェクトの個数は
米国の特許明細書における“Ｆｉｇｕｒｅｓ　”の直下
にある“Ｆｉｇｕｒｅ”のオブジェクトの個数に等しく
する。

【００２２】これらの変換仕様に基づいて作成された変
換用プログラムを第１１図に示す。同図において、記述
項目１１−Ａは上記各変換仕様（１），（３）に基づい
ており、記述項目１１−Ｂは上記各変換仕様（２），（
４）に基づいている。なお、この変換用プログラムの記
述は変換の対象となるオブジェクトを共通論理構造にお
ける根からたどって指定するという方式がとられている
。例えば、記述項目１１−Ａにおける“特許説明＃１．
特許概要＃１．本文＃１．技術情報文書＃１．＠Ｇｏ　
”に従えば、識別子Ｇｏ　の共通論理構造における“技
術情報文書”の直下にある“本文”、この“本文”の直
下にある“特許概要”、この“特許概要”の直下にある
“特許説明”、この“特許説明”に従属するオブジェク
トと順次たどることができる。また、関数α（Ｘ）は、
Ｘの従属子に含まれる論理オブジェクトの数を返す。

【００２３】このような変換用プログラムに基づいて特
定文書を他の特定文書に変換する場合は、変換用プログ
ラムの各記述項目を逐次評価して、各記述項目の条件を
満たすようなオブジェクト並びに内容部を順次生成し、
これにより他の特定文書を生成することとなる。

【００２４】ここで、第１０図に示した共通論理構造に
制約される米国の特許明細書（特定文書）の特定論理構
造が第１２図に示すようなものであるとすると、この特
定論理構造を上記変換用プログラムに従って変換し、こ
れにより得られた国内向けの技術情報文書（他の特定文
書）の特定論理構造が第９図に示すようなものとなる。

【００２５】

【発明が解決しようとする課題】しかしながら、上記従
来の変換用プログラムを用いた方式では変換用プログラ
ムの記述に対する制限が緩く、どのような記述であって
もなしうるので、複数の変換条件間に矛盾を含む変換用
プログラムが記述されてしまうことがあり、このような
場合には変換不可能の事態を生じることとなる。例えば
、第１３図（ａ）に示すような識別子Ｇｉ２の共通論理
構造から第１３図（ｂ）に示すような識別子Ｇｏ２の共
通論理構造への変換用プログラムとして、第１３図（ｃ
）に示すような記述がなされている場合、第１３図（ａ
）の共通論理構造に制約される特定文書においてオブジ
ェクトＢに従属するオブジェクトＤの個数とオブジェク
トＥに従属するオブジェクトＦの個数とが一致しなけれ
ば、第１３図（ｂ）の共通論理構造に制約される特定文
書においてオブジェクトＧに従属するオブジェクトＨの
個数を特定することが不可能になるという不都合を生じ
てしまう。

【００２６】また、例えば先に述べた第１１図に示す変
換用プログラムに基づいて、第９図に示した共通論理構
造の制約を満たさない第１４図に示すような特定論理構
造の特定文書を変換しようとする場合は、変換処理に際
して“Ｃｌａｉｍ　”を評価することができず、エラー
となる。すなわち、共通論理構造の制約を満たさない特
定文書が変換対象となってしまった場合には、エラーに
当然なる。このような事態を回避するためには、変換処
理に先立って、変換すべき特定文書が共通論理構造を満
たすか否かを確かめるという方法が考えられるが、この
ために処理過程を煩雑かつ複雑にすることは好ましいこ
とではない。

【００２７】さらに、変換用プログラムを作成するに際
しては、異なる２つの共通論理構造を把握しなければな
らないが、これらの共通論理構造と上記変換用プログラ
ムの記述内容とを対比することは直観的に行い難く、こ
のため見通しが悪くなって、変換用プログラムの設計が
極めて困難になる。

【００２８】そこで、本発明はプログラムの記述を適宜
に制限することによりプログラムに矛盾が含まれないよ
うにすること、変換すべき特定文書が共通論理構造の制
約を満たすか否かを簡単に確認できるようにすること、
および変換処理過程が簡単でかつプログラムの設計が容
易な電子文書生成方式を提供することを目的とする。

【課題を解決するための手段】本発明では入力文書を文
書構造および各内容に分離して、前記入力文書の文書構
造を示す第１の文字列を形成し、さらに前記第１の文字
列を予め定められた変換規則に従って出力文書の文書構
造を示す第２の文字列に変換し、この第２の文字列に基
づいて前記出力文書の文書構造を形成して、前記各内容
および前記出力文書の文書構造を合成することにより該
出力文書を形成するようにしている。

【００２９】

【作用】本発明によれば、入力文書の文書構造を第１の
文字列に一旦変換し、所定の変換規則に基づいて第１の
文字列から第２の文字列を生成し、この第２の文字列に
よって示される文書構造に入力文書の内容を付与するこ
とにより出力文書を得るようにしている。したがって、
所定の変換規則は文字列に対する変換規則であって、単
純化されたものとなる。これに伴い、変換処理過程も簡
単化される。

【００３０】

【実施例】以下、本発明の実施例を添付図面を参照して
詳細に説明する。

【００３１】第１図は本発明に係わる電子文書生成方式
の一実施例である変換処理過程を示しており、ここでは
ＯＤＡ文書である入力された特定文書１（以下、入力特
定文書と称す）を同じくＯＤＡ文書である特定文書２（
以下、出力特定文書と称す）に変換して出力している。なお、この実施例の変換処理はワープロ、文書処理機能
を持つワークステーション等における中央処理装置およ
びメモリ等においてなされるものである。

【００３２】同図において、入力特定文書１は内容部分
離処理ステップ１１にて特定論理構造と内容部に分離さ
れ、これにより第１の特定論理構造１２および内容部群
１３が形成される。この第１の特定論理構造１２は文字
列形成処理ステップ１４で文字列に変換され、これによ
り第１の文字列１５が形成される。この第１の文字列１
５は論理構造変換処理ステップ１６にて論理構造変換規
則１６−１に基づく変換処理を施され、これにより第２
の文字列１７が形成される。この第２の文字列１７は木
構造形成処理ステップ１８にて特定論理構造に変換され
、これにより第２の特定論理構造１９が形成される。この第２の特定論理構造１９は内容部付加処理ステップ
２０にて内容部群１３の内容部が付加され、これにより
出力特定文書２が形成される。

【００３３】次に、第１図に示した各処理ステップを逐
次更に詳しく述べる。なお、ここでは例えば入力特定文
書１を第２図（ａ）に示すようなものとし、この入力特
定文書１を制約する共通論理構造を第３図に示すような
ものとするとともに、出力特定文書２を制約する共通論
理構造を第４図に示すようなものとする。

【００３４】まず、第１図における内容分離処理ステッ
プ１１では、入力特定文書１を第２図（ｂ）に示すよう
な各オブジェクトＡ，Ｂ，Ｄ１　，Ｅ，Ｆ２　，Ｆ３　
からなる第１の特定論理構造１２と、第２図（ｃ）に示
すような各内容部Ｃ１　，Ｃ２　，Ｃ３　からなる内容
部群１３とに分離する。また、ここでは各内容部Ｃ１　
，Ｃ２　，Ｃ３　を識別するために、該各内容部にはそ
れぞれの肩文字１　，２　，３　が付加されており、こ
れに伴い該各内容部Ｃ１　，Ｃ２　，Ｃ３　を有する各
オブジェクトＤ１　，Ｆ２　，Ｆ３　にもそれぞれ同じ
肩文字が付加される。

【００３５】次に、第１図における文字列形成処理ステ
ップ１４では、第２図（ｂ）に示した第１の特定論理構
造１２を第２図（ｄ）に示すような第１の文字列１５に
変換する。ここで、特定論理構造から文字列への文字列
変換規則を示す。

【００３６】（規則１）内容部を付与されたオブジェク
トＸに対応する文字列は、Ｘである。

【００３７】（規則２）内容部を付与されていないオブ
ジェクトＸに対応する文字列は、該オブジェクトＸの直
下にある各オブジェクトに対応する文字列をそれぞれｙ
１　，ｙ２　，…，ｙｎ　（ｎ≧０）とすると、Ｘ［ｙ
１　　ｙ２　　　…ｙｎ　］である。

【００３８】（規則３）根のオブジェクトに対応する文
字列は、該根から始まる論理構造全体に対応する文字列
である。

【００３９】これらの文字列変換規則に基づけば、第２
図（ｂ）に示した第１の特定論理構造１２におけるオブ
ジェクトＢの直下に内容部を付与されたオブジェクトＤ
１　があることからＢ［Ｄ１　］を導くことができると
ともに、オブジェクトＥの直下にそれぞの内容部を付与
された各オブジェクトＦ２　，Ｆ３　があることからＥ
［Ｆ２　Ｆ３　］を導くことができ、さらに根のオブジ
ェクトＡの直下に各オブジェクトＢ，Ｅがあることから
根のオブジェクトＡに対応する文字列、つまり第１の特
定論理構造１２に対応する第１の文字列１５がＡ［Ｂ［
Ｄ１　］Ｅ［Ｆ２　Ｆ３　］］となることは明らかであ
る。

【００４０】次に、第１図における論理構造変換処理ス
テップ１６では、論理構造変換規則１６−１が第３図お
よび第４図に示した各共通論理構造に基づいて第２図（
ｅ）に示すように予め定められているとすると、この論
理構造変換規則１６−１に従って第２図（ｄ）に示した
第１の文字列１５から第２図（ｇ）に示すようなＧ［Ｈ
１　Ｈ２　Ｈ３　］という第２の文字列１７を導き出す
。

【００４１】ここで、この論理構造変換規則１６−１を
実行するプログラム（以下、変換プログラムと称す）は
、シンタックス・ダイレクテッド・トランスレーション
（Ｓｙｎｔａｘ−Ｄｉｒｅｃｔｅｄ　Ｔｒａｎｓｌａｔ
ｉｏｎｓ、以下ＳＤＴと称す）として記述されたもので
ある（ＳＤＴについては、Ｇｏｎｚａｌｅｚ，Ｒ．Ｃ．
ａｎｄ　Ｔｈｏｍａｓｏｎ，Ｍ．Ｇ．：Ｓｙｎｔａｘ−
Ｄｉｒｅｃｔｅｄ　Ｔｒａｎｓｌａｔｉｏｎｓ，Ｓｙｎ
ｔａｃｔｉｃ　Ｐａｔｔｅｒｎ　Ｒｅｃｏｇｎｉｔｉｏ
ｎ，Ａｄｄｉｓｏｎ−Ｗｅｓｌｅｙ　Ｐｕｂｌｉｓｈｉ
ｎｇ　Ｃｏｍｐａｎｙ，ｐｐ．５７−６０（１９７８）
を参照）。

【００４２】さらに、このＳＤＴは文脈自由文法（Ｃｏ
ｎｔｅｘｔ−ｆｒｅｅＧｒａｍｍａｒ，　以下ＣＦＧと
称す）に基づいて作成される。いま、ＣＦＧの生成規則
をＡ→αとすると、ＣＦＧに基づいて作成されるＳＤＴ
の生成規則はＡ→α，βとなる。ただし、α，βに出現
する非終端記号の種類と数は一致していなければいけな
い（ここで、同じ非終端記号が２つ以上あったとき、α
とβ間での対応を示すために、肩文字が使われることが
ある）。

【００４３】このＳＤＴの生成規則Ａ→α，βにおいて
、Ａ→αの形をした規則を集めて得られるＣＦＧをＳＤ
Ｔの入力文法と言い、またＡ→βの形をした規則を集め
て得られるＣＦＧをＳＤＴの出力文法と言う。入力文法
に従ってＡがαに書替えられると、これに伴い出力文法
に従ってＡがβに書替えられる。このような書替えを繰
返すことにより、開始記号から入力された文字列ｘが導
き出され、これに伴い開始記号から出力される文字列ｙ
が導き出される。これらの文字列ｘ，ｙが導き出される
と、入力された文字列ｘが出力される文字列ｙに変換さ
れたこととなる。

【００４４】第２図（ｅ）には論理構造変換規則１６−
１つまりＳＤＴの生成規則が例示されており、入力文法
１６−２に該当するのは｛Ｓ→Ａ［Ｂ［Ｍ］Ｅ［Ｎ］］
、Ｍ→ＤＭ、Ｍ→Ｄ、Ｎ→ＦＮ、Ｎ→Ｆ｝であり、出力
文法１６−３に該当するのは｛Ｓ→Ｇ［ＭＮ］、Ｍ→Ｈ
Ｍ、Ｍ→Ｈ、Ｎ→ＨＮ、Ｎ→Ｈ｝である。

【００４５】第５図は論理構造変換規則１６−１に基づ
く処理過程を例示しており、入力文法１６−２に基づい
て第２図（ｄ）に示した第１の文字列１５を導き出すと
ともに、この第１の文字列１５の導出過程（第１図に示
す解析木１６−５に該当する）を参照しつつ出力文法１
６−３に基づいて第２図（ｇ）に示した第２の文字列１
７を導き出すという処理過程を示している。

【００４６】まず、入力文法１６−２に基づく導出過程
では、Ａ［Ｂ［Ｍ］Ｅ［Ｎ］］を導き出し、さらにＭ→
Ｄに基づいてＡ［Ｂ［Ｄ１　］Ｅ［Ｎ］］を導く。引き
続き、Ｎ→ＦＮに基づいてＡ［Ｂ［Ｄ１　］Ｅ［Ｆ２　
Ｎ］］を導き、さらにＮ→Ｆに基づいてＡ［Ｂ［Ｄ１　
］Ｅ［Ｆ２　Ｆ３］］を導く。この結果、第１の文字列
１５であるＡ［Ｂ［Ｄ１　］Ｅ［Ｆ２　Ｆ３　］］を得
、またこの導出過程に対応する第２図（ｆ）に示すよう
な解析木１６−５を得ることができる。

【００４７】一方、出力文法１６−３に基づく導出過程
は、第２図（ｆ）に示した解析木１６−５を参照しつつ
進行する。まずＧ［ＭＮ］を導き出し、さらにＭ→Ｈに
基づいてＧ［Ｈ１　Ｎ］を導く。ここで、導かれたＧ［
Ｈ１　Ｎ］におけるＨ１　は入力側のＭ→Ｄに基づき導
かれたＡ［Ｂ［Ｄ１　］Ｅ［Ｎ］］におけるＤ１　に対
応し、Ｈ１　にはＤ１　と同じ肩文字１　が付加される
。引き続き、出力文法１６−３におけるＮ→ＨＮに基づ
いてＧ［Ｈ１　Ｈ２　Ｎ］を導き出す。ここで、導かれ
たＧ［Ｈ１　Ｈ２　Ｎ］におけるＨ２　は入力側のＮ→
ＦＮに基づき導かれたＡ［Ｂ［Ｄ１　］Ｅ［Ｆ２　Ｎ］
］におけるＦ２　に対応し、Ｈ２　にはＦ２　と同じ肩
文字２　が付加される。さらに、出力文法１６−３にお
けるＮ→Ｈに基づいてＧ［Ｈ１　Ｈ２　Ｈ３　］を導き
出す。ここで、導かれたＧ［Ｈ１　Ｈ２　Ｈ３　］にお
けるＨ３　は入力側のＮ→Ｆに基づき導かれたＡ［Ｂ［
Ｄ１　］Ｅ［Ｆ２　Ｆ３］］におけるＦ３　に対応し、
Ｈ３　にはＦ３　と同じ肩文字３　が付加される。この
結果、第２の文字列１７であるＧ［Ｈ１　Ｈ２Ｈ３　］
を得る。

【００４８】以上の処理過程を経ることにより、第１の
文字列１５であるＡ［Ｂ［Ｄ１　］Ｅ［Ｆ２　Ｆ３　］
］は第２の文字列１７であるＧ［Ｈ１　Ｈ２　Ｈ３　］
に変換されたこととなる。

【００４９】このような入力文法１６−２に基づく導出
過程は第１図における構文解析ステップ１６−４で行わ
れ、これにより解析木１６−５が形成される。また、論
理構造変換規則１６−１に基づく変換処理は第１図にお
ける構文解析ステップ１６−４および出力文字列生成ス
テップ１６−６で行われる。なお、構文解析ステップ１
６−４で行われる変換処理のみに着目すれば、これは構
文解析である（Ｙｏｕｎｇｅｒ，Ｄ．Ｈ．：Ｒｅｃｏｇ
ｎｉｔｉｏｎ　ａｎｄ　ｐａｒｓｉｎｇ　ｏｆ　ｃｏｎ
ｔｅｘｔ−ｆｒｅｅ　ｌａｎｇｕａｇｅｓ　ｉｎ　ｔｉ
ｍｅ　ｎ３，Ｉｎｆｏｒｍ．Ｃｏｎｔｒ．，Ｖｏｌ．１
０，Ｎｏ．２，ｐｐ．１８９−２０８（１９６７）を参
照）。

【００５０】ここで、構文解析ステップ１６−４での構
文解析が失敗した場合、つまり入力文法１６−２に基づ
いて第１の特定論理構造１２を示す第１の文字列１５を
導くことができなかったときには、この構文解析ステッ
プ１６−４からエラーメッセージ出力ステップ２１へと
移り、これによりエラーメッセージがオペレータに通知
される。この場合、第１の特定論理構造１２は第３図に
示した共通論理構造の制約を満たしていないこととなる
。

【００５１】次に、第１図における木構造形成処理ステ
ップ１８では、第２の文字列１７であるＧ［Ｈ１　Ｈ２
　Ｈ３　］に基づいて第２の特定論理構造１９を形成す
る。この第２の文字列１７から第２の特定論理構造１９
への変換は、先に述べた３つの文字列変換規則に従って
行われる。すなわち、Ｇ［Ｈ１　Ｈ２　Ｈ３　］に基づ
けば根のオブジェクトＧの直下に３つの各オブジェクト
Ｈ１　，Ｈ２　，Ｈ３　が属することから、第２図（ｈ
）に示すような第２の特定論理構造１９が導かれる。

【００５２】次に、第１図における内容部付加処理ステ
ップ２０では、第２の特定論理構造１９に対して内容部
群１３の各内容を付与し、これにより出力特定文書２を
形成する。すなわち、第２図（ｈ）に示した第２の特定
論理構造１９における最下位の各オブジェクトＨ１　，
Ｈ２　，Ｈ３　に対して第２図（ｃ）に示した各内容部
Ｃ１　，Ｃ２　，Ｃ３　をそれぞれ付与する。このとき
、各オブジェクトＨ１　，Ｈ２　，Ｈ３　のそれぞれの
肩文字と各内容部Ｃ１　，Ｃ２　，Ｃ３　のそれぞれの
肩文字とに対応関係を持たせ、該各オブジェクトにそれ
ぞれの内容部が割り当てられる。これにより、第２図（
ｉ）に示すような出力特定文書２が形成され、この出力
特定文書２が出力される。

【００５３】ここで、入力された入力特定文書１と出力
された出力特定文書２とを比較してみると、第２図（ａ
）に示した入力特定文書１における最下位のオブジェク
トＤの個数とオブジェクトＦの個数との和が、第２図（
ｉ）に示した出力特定文書２における最下位のオブジェ
クトＨの個数に一致しており、また入力特定文書１にお
ける各オブジェクトＤ，Ｆ，Ｆに属するそれぞれの内容
部Ｃ１　，Ｃ２　，Ｃ３　が出力特定文書２における各
オブジェクトＨ，Ｈ，Ｈにそれぞれ割り振られている。したがって、入力特定文書１から出力特定文書２への変
換は何等矛盾を生じることなく行われたことが明らかで
ある。

【００５４】このように本実施例では、内容分離処理ス
テップ１１にて入力特定文書１を第１の特定論理構造１
２と各内容部とに分離し、文字列形成処理ステップ１４
にて第１の特定論理構造１２を第１の文字列１５に変換
し、論理構造変換処理ステップ１６にて第１の文字列１
５を第２の文字列１７に変換し、木構造形成処理ステッ
プ１８にて第２の文字列１７を第２の特定論理構造１９
に変換し、内容部付加処理ステップ２０にて第２の特定
論理構造１９に対して各内容部を付与することにより出
力特定文書２を形成している。これらのステップのうち
の論理構造変換処理ステップ１６に着目してみれば、こ
のステップにて第１の特定論理構造１２から第２の特定
論理構造１９への変換が行われているのであって、この
変換は文字列から文字列への変換であることから、その
変換処理は木構造から木構造への直接の変換処理に比べ
れば、簡単な内容で済ませることが可能となる。

【００５５】また、論理構造変換処理ステップ１６にお
ける構文解析ステップ１６−４での構文解析が失敗した
場合にはエラーメッセージが出力され、このときには第
１の特定論理構造１２が第３図に示した共通論理構造の
制約を満たしていないことが明らかとなるので、入力特
定文書の特定論理構造が所定の共通論理構造の制約を満
たすか否かを確認するための格別の処理を採用する必要
が全くない。

【００５６】ところで、先に述べたＳＤＴの生成規則に
対しては次に示すような４つの条件を課しており、ＳＤ
Ｔはこれら４つの条件を満たなければならない。

【００５７】（条件１）入力文法によって生成しうる文
字列の集合は、入力側の共通論理構造の制約を満たす特
定論理構造の集合に対応する文字列の集合に等しい。

【００５８】（条件２）出力文法によって生成しうる文
字列の集合は、出力側の共通論理構造の制約を満たす特
定論理構造の集合に対応する文字列の集合の部分集合で
ある。

【００５９】（条件３）ＳＤＴの各生成規則Ａ→α，β
における文字列α，βは、それぞれ次の各条件を満たさ
なければならない。

【００６０】１）“［”および“］”は必ず対で用いら
れ、一対の“［”および“］”のうちの“［”の方が文
字列中で最初に用いられる。

【００６１】２）“［”の直前には“［”および“］”
以外の文字が必ずくる。

【００６２】（条件４）各規則Ａ→α，βについて、“
（α中に現れる最下位のオブジェクトに対応する終端記
号の数）≧（β中に現れる最下位のオブジェクトに対応
する終端記号の数）”を満たさなければならない。

【００６３】ここで、上記各条件について第２図（ｅ）
に示したＳＤＴの生成規則を考察してみる。

【００６４】まず、条件１については、入力文法によっ
て生成しうる文字列の集合が｛Ａ［Ｂ［Ｄｍ　］Ｅ［Ｆ
ｎ　］］（ｍ　≧１，ｎ　≧１）｝であり、これは第３
図に示した共通論理構造の制約を満たす特定論理構造の
集合に対応する文字列の集合に等しいので、該条件が満
たされる。この条件を満たした場合は、該共通論理構造
の制約を満たす入力特定文書を必ず変換できることが保
証される。

【００６５】次に、条件２については、出力文法によっ
て生成しうる文字列の集合が｛Ｇ［Ｈｎ　］（ｎ　≧２
）｝であり、これは第４図に示した共通論理構造の制約
を満たす特定論理構造の集合に対応する文字列の集合｛
Ｇ［Ｈｎ　］（ｎ　≧１）｝の部分集合なので、該条件
が満たされる。この条件を満たした場合は、出力特定文
書が出力側の共通論理構造の制約を満たす特定文書の集
合に入ることが保証される。次に、条件３は、例えば１
番目の規則をみると、入力文法の文字列Ａ［Ｂ［Ｍ］Ｅ
［Ｎ］］、および出力文法の文字列Ｇ［ＭＮ］において
それぞれ満たされており、また２番目から５番目の規則
については明らかに満たされている。この条件が満たさ
れている場合は、変換処理に際して特定文書の木構造を
破壊しないことが保証される。

【００６６】次に、条件４については、１番目の規則に
おける入力文法中の最下位オブジェクトに対応する終端
記号の数と出力文法中の最下位オブジェクトに対応する
終端記号の数との関係は０≧０であり、２番目の規則に
おける入力文法中の最下位オブジェクトに対応する終端
記号（Ｄ）の数と出力文法中の最下位オブジェクトに対
応する終端記号（Ｈ）の数との関係は１≧１であり、３
番目の規則における入力文法中の最下位オブジェクトに
対応する終端記号（Ｄ）の数と出力文法中の最下位オブ
ジェクトに対応する終端記号（Ｈ）の数との関係は１≧
１であり、４番目の規則における入力文法中の最下位オ
ブジェクトに対応する終端記号（Ｆ）の数と出力文法中
の最下位オブジェクトに対応する終端記号（Ｈ）の数と
の関係は１≧１であり、５番目の規則における入力文法
中の最下位オブジェクトに対応する終端記号（Ｆ）の数
と出力文法中の最下位オブジェクトに対応する終端記号
（Ｈ）の数との関係は１≧１であるので、該条件が満た
される。この条件を満たした場合は、入力特定文書の各
内容部を出力特定文書に移したときに、出力特定文書に
おいて内容部を持たない最下位のオブジェクトが存在し
ないことが保証される。

【００６７】このような４つの条件を満たすようにＳＤ
Ｔの生成規則を記述すれば、生成規則に矛盾を生じるよ
うなことはなく、入力側の共通論理構造に制約される入
力特定文書を出力側の共通論理構造に制約される出力特
定文書に必ず変換することができるようになる。また、
上記各条件のうちの条件３および条件４を満たすか否か
の判定は自動化することが可能であり、条件１および条
件２を満たすか否かの判定は生成規則の作成者の考察に
基づくものとなるが容易に行いうる。

【００６８】さらに、このＳＤＴの生成規則における入
力文法と第３図に示した入力側の共通論理構造とを比較
してみると、Ｓ→Ａ［Ｂ［Ｍ］Ｅ［Ｎ］］がオブジェク
トＡの属性ＧＦＳ値に対応し、Ｍ→ＤＭおよびＭ→Ｄが
オブジェクトＢの属性ＧＦＳ値に対応し、Ｎ→ＦＮおよ
びＮ→ＦがオブジェクトＥの属性ＧＦＳ値に対応してい
ることが明らかである。このような対応関係は出力文法
と第４図に示した出力側の共通論理構造との間にもあり
、これはオブジェクトの属性ＧＦＳ値による制約がＣＦ
Ｇの生成規則による文字列の導出と概念的に近いことに
起因する。このため、入力側の共通論理構造および出力
側の共通論理構造を把握しつつ生成規則を作成すること
が容易になる。また、ＳＤＴの生成規則は文字列を配列
してなる単純なものなので、書きやすく読みやすく、変
換処理の過程を考察することが容易であり、プログラム
の見通しの良い設計が可能となる。

【００６９】第６図はＳＤＴ生成規則の他の例を示して
おり、このＳＤＴ生成規則は第７図図（ａ）に示す入力
側の共通論理構造および第７図（ｂ）に示す出力側の共
通論理構造に基づくものである。

【００７０】第６図において、記述項目６ＬはＳＤＴ生
成規則における入力文法であり、記述項目６ＲはＳＤＴ
生成規則における出力文法である。また、第７図（ａ）
において、“Ｂｏｄｙ”、“Ｆｉｇｕｒｅｓ　”、“Ｅ
ｆｆｅｃｔ　ｏｆ　ｉｎｖｅｎｔｉｏｎ　”、“Ｅｘａ
ｍｐｌｅｓ”、“Ｃｌａｉｍ　”、“Ｆｉｇｕｒｅ”、
“Ｐａｒａｇｒａｐｈ　”はそれぞれオブジェクトクラ
スである。さらに、第７図（ｂ）において、“特許概要”、“特許
説明”、“説明図部”、“段落”、“図”はそれぞれオ
ブジェクトクラスである。

【００７１】ここで、入力特定文書の特定論理構造にお
ける“Ｆｉｇｕｒｅｓ”のオブジェクトに従属する“Ｆ
ｉｇｕｒｅ”のオブジェクトと、出力特定文書の特定論
理構造における“説明図部”のオブジェクトに従属する
“図”のオブジェクトとは対応関係を持たされており、
ＳＤＴ生成規則における入力文法に従って非終端記号＜
図＋　＞から終端記号＜Ｆｉｇｕｒｅ＞を導くと、これ
に伴い出力文法に従って終端記号＜図＞が導かれる。よ
って、“Ｆｉｇｕｒｅ”のオブジェクトの個数と、“図
”のオブジェクトの個数とは等しくなる。

【００７２】また、入力特定文書の特定論理構造におけ
る“Ｅｆｆｅｃｔ　ｏｆ　ｉｎｖｅｎｔｉｏｎ　”のオ
ブジェクトに従属する“Ｐａｒａｇｒａｐｈ　”のオブ
ジェクトおよび“Ｃｌａｉｍ　”のオブジェクトに従属
する“Ｐａｒａｇｒａｐｈ　”のオブジェクトと、出力
特定文書の特定論理構造における“特許説明”のオブジ
ェクトに従属する“段落”のオブジェクトとは対応関係
を持たされており、ＳＤＴ生成規則における入力文法に
従って非終端記号＜説明Ｐａｒ＋＞から終端記号＜Ｐａ
ｒａｇｒａｐｈ　＞を導くと、これに伴い出力文法に従
って終端記号＜段落＞が導かれる。よって、“Ｐａｒａ
ｇｒａｐｈ　”のオブジェクトの総和と、“段落”のオ
ブジェクトの個数とは等しくなる。

【００７３】さらに、入力特定文書の特定論理構造にお
ける“Ｅｘａｍｐｌｅｓ”のオブジェクトに従属する“
Ｐａｒａｇｒａｐｈ　”のオブジェクトに対応関係を持
つ出力特定文書の特定論理構造におけるオブジェクトは
設定されておらず、ＳＤＴ生成規則における入力文法に
従って非終端記号＜削除Ｐａｒ＋＞から終端記号＜Ｐａ
ｒａｇｒａｐｈ　＞を導くと、これに伴い出力文法に従
って終端記号＜ε＞が導かれる。この終端記号＜ε＞は
空の文字列を表しており、このため出力特定文書におい
ては該当するオブジェクトが存在せず、その内容部も存
在しないこととなる。

【００７４】なお、上記実施例ではＳＤＴの生成規則を
利用して文字列の変換処理を行っているが、本発明はこ
れに限定されるものでなく、要は入力特定文書の特定論
理構造を文字列に一旦変換し、この文字列を出力特定文
書の特定論理構造を示す文字列に変換できればよいので
あって、入力側の共通論理構造および出力側の共通論理
構造に基づく生成規則であれば適用しうる。

【００７５】

【発明の効果】以上説明したように本発明によれば、入
力文書の文書構造を第１の文字列に一旦変換し、所定の
変換規則に基づいて第１の文字列から第２の文字列を生
成し、この第２の文字列によって示される文書構造に入
力文書の内容を付与することにより出力文書を得るよう
にしている。したがって、所定の変換規則は文字列に対
する変換規則であって、単純化されたものとなる。この
ため、変換処理過程が簡単化され、そのためのプログラ
ムの設計制作が容易となる。

【００７６】また、本発明の実施例によれば、上記変換
規則に種々の条件を課すことにより、プログラムに矛盾
が含まれないようにすることを可能ならしめている。さ
らに、上記変換規則における構文解析に失敗したか否か
により、入力特定文書が入力側の共通論理構造の制約を
満たさないか否かを確認することができる。

【図面の簡単な説明】

【図１】本発明に係わる電子文書生成方式の一実施例で
ある変換処理過程を示す図。

【図２】第１図に示した実施例における変換処理過程の
一例を説明するために用いられた図

【図３】第２図に示した入力特定文書を制約する共通論
理構造を示す図。

【図４】第２図に示した出力特定文書を制約する共通論
理構造を示す図。

【図５】第１図に示した実施例における論理構造変換規
則に基づく処理過程を説明するために用いられた図。

【図６】論理構造変換規則の他の例を示す図。

【図７】第６図に示した論理構造変換規則を適用された
入力側の共通論理構造および出力側の共通論理構造を示
す図。

【図８】技術情報文書と称する文書の共通論理構造を示
す図。

【図９】第８図に示した共通論理構造に基づいて制約さ
れた特定文書の特定論理構造を示す図。

【図１０】米国の特許明細書と称する文書の共通論理構
造を示す図。

【図１１】従来の変換用プログラムを例示する図。

【図１２】第１０図に示した共通論理構造に制約される
特定論理構造を例示する図。

【図１３】従来の変換用プログラムにおける矛盾の一例
を説明するために用いられた図。

【図１４】第１０図に示した共通論理構造の制約を満た
さない米国の特許明細書と称する文書の特定論理構造を
例示する図。

【符号の説明】

１…入力特定文書２…出力特定文書１１…内容部分離処理ステップ１２…第１の特定論理構造１３…内容部群１４…文字列形成処理ステップ１５…第１の文字列１６…論理構造変換処理ステップ１６−１…論理構造変換規則１６−２…入力文法１６−３…出力文法１６−４…構文解析ステップ１６−５…解析木１６−６…出力文字列生成ステップ１７…第２の文字列１８…木構造形成処理ステップ１８１９…第２の特定論理構造２０…内容部付加処理ステップ２１…エラーメッセージ出力ステップ

Claims

【特許請求の範囲】

【請求項１】入力文書の文書構造を示す第１の文字列を
形成するステップと、前記第１の文字列を予め定められ
た変換規則に従って出力文書の文書構造を示す第２の文
字列に変換するステップと、前記第２の文字列に基づい
て前記出力文書の文書構造を形成するステップと、を備
えたことを特徴とする電子文書生成方式。
【請求項２】第２の文字列に変換するステップは文脈自
由文法に基づく構文解析を第１の文字列に対して行う処
理を含み、この構文解析の結果に応じて前記第１の文字
列が変換可能であるか否かを判別することを特徴とする
請求項（１）　記載の電子文書生成方式。