JPH01205263A - 文書処理装置 - Google Patents

文書処理装置

Info

Publication number
JPH01205263A
JPH01205263A JP63028787A JP2878788A JPH01205263A JP H01205263 A JPH01205263 A JP H01205263A JP 63028787 A JP63028787 A JP 63028787A JP 2878788 A JP2878788 A JP 2878788A JP H01205263 A JPH01205263 A JP H01205263A
Authority
JP
Japan
Prior art keywords
referring
key
extracting
document
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63028787A
Other languages
English (en)
Other versions
JP3130523B2 (ja
Inventor
Miwako Doi
美和子 土井
Isamu Iwai
岩井 勇
Miyoshi Fukui
美佳 福井
Yoichi Takebayashi
洋一 竹林
Koji Yamaguchi
浩司 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63028787A priority Critical patent/JP3130523B2/ja
Publication of JPH01205263A publication Critical patent/JPH01205263A/ja
Application granted granted Critical
Publication of JP3130523B2 publication Critical patent/JP3130523B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の目的〕 (産業上の利用分野) 本発明は、あいまい性のある参照構造を抽出する参照構
造抽出方式に関する。
(従来の技術) 文章データより図表を参照している「第**図」「表串
*」などの箇所を抽出し、該当図表を同じ頁、あるいは
同じ段に配置させるものとしては。
特開昭61−21570がある。
しかし、文章中の参照構造として、図表参照以外に、m
l出の章や節などを「第1章で述べたように」などのよ
うに参照している文章内参照や、r〜は文献(υで」な
どのように参考文献を参照している文献参照がある。
従来の文書処理ではこれらの参照構造を抽出できないの
で文献の挿入や、文章の訂正などに応じて、文献番号や
章・節番号がずれたときに、参照箇所と参照されている
箇所とで、番号が正しく照応しなくなるという問題が生
じた。
又1図表参照も、「第1図から第3図に」 (第1図と
第2図、第3図を参照)、1図1.2.3に」 (第1
図、第2図、第3図を参照)、「図1〜3に」 (第1
図、第2図、第3図を参照あるいは図1〜3というもの
を参照)などのように、複雑な参照をしている場合には
、正しく参照構造が抽出できなかった。
文献参照についても同様にr〜は文献(1,2)で」 
(文献(ト)と■を参照)などの場合があり、同様のこ
とが言える。
(発明が解決しようとする課題) 従来の文書処理システムでは文章に含まれている文章内
参照や文献参照などが抽出できず、番号のずれなどをユ
ーザがひとつひとつ訂正する必要があった。
図表参照についても、あいまいで複雑な参照構造は正し
く抽出できず、図表の割付けなどを正しく行うことがで
きなかった。
本発明はこのような事情を背景としてなされたもので、
文章データに含まれる種々の参照情報を抽出し、図表の
割付け1文献の番号づけなどを可能とすることを目的と
している。
〔発明の構成〕
(課題を解決するための手段) 本発明は、文章データを解析して参照箇所候補を抽出す
るための参照箇所抽出手段と、図表や参照文献あるいは
文章などの参照情報を解析して、参照のキーとなる参照
キー候補を抽出するための参照キー抽出手段と、参照箇
所候補と参照キー候補とを照合して互いに対応する参照
箇所と参照キーとを決定する参照構造抽出手段とを具備
していることを特徴としている。
(作 用) 本発明では7文章データ中の図表、文献などを参照して
いる参照構造に基づき、図表の参照箇所近傍への割り付
け、参照されている文献などの提示番号の統一などを約
う整形処理部を有している。
従って、ユーザがいちいち参照構造を指定しなくても1
図表の割りつけ、必要な文献の提示などが行えるので、
効率よく1文書処理を行うことができる。
(実施例) 以下、図面を参照しながら本発明の実施例について説明
する。
第1図は、本発明の第1の実施例に係る文書処理システ
ムの概I@構成図である。
オペレータにより操作されるキーボード、あるいはマウ
ス等より構成される入力部2は、原文データや図表など
の参照情報を入力するために使用される。入力部2より
入力された原文データ及び参照情報は文書記憶部1に格
納される。
文書管理部5は、入力部2より入力された、もしくは文
書記憶部1に格納された原文データ及び参照情報を表示
制御部4へ送って、出力部3に第2図のように表示した
り、参照構造抽出部13へ送って参照構造を抽出したり
する制御を行う。
次に、第2図(a)を例にとりながら、参照構造抽出部
13の動体について説明する。
参照構造抽出部13は、文書管理部5より送られてきた
データが、原文データであれば、参照箇所候補抽出部8
へ、参照情報であれば、参照キー候補抽出部9へ送る。
参照箇所候補抽出部8は、参照箇所抽出規則辞書11に
格納されている。例えば第4図のような形式で記述され
た参照箇所抽出規則と、参照予約語辞書IOに例えば第
3図のような形式で格納されている参照用語と参照記号
をもとり、第5図のような流れにそって参照箇所候補の
抽出を行う。
第3図の形式は、例えば「図」という語は、カテゴリー
が、参照用語で、図を参照するものであり、raj2Q
Jというカテゴリーは、数字の前後、つまり「図1」 
「(第)1図」という形があることを示している。
同じ図参照でもC: FigJという語はrforJカ
テゴリーなので、rFig、IJという、数字の前にあ
る形のみが可能であることを示している。文献参照であ
る用語「〔〕」のrbetJカテゴリーは、用語の間(
between)のみに数字が入るr (1,21Jの
ような形のみが可能であることを示している。
参照記号のカテゴリーruniJは、候補のないことを
示している。つまり「3.1図」という参照箇所に対し
ては、「3.1」という形式の参照キーのみがマツチす
る。
rsplJは、数字を分割した候補を作ることを示して
いる。つまり1図1,3」という参照に対しては、「図
1」とr図3」という2つの参照箇所候補を抽出する。
rconJは数字の連続性を補足した候補を作ることを
示している。つまり「図1から3」という参照に対して
は、r図IJ  1図2」 「図3」という3つの参照
箇所候補を抽出する。
第2図(a)の第1O文目は、規則■と■に一致し、第
11文目は、規則■と■に一致し、第12文目は、規則
■と20に一致し、第6図に示すような参照箇所候補が
抽出される。
第6図は、参照箇所候補の存在するカラム開始と終了位
置、及び参照の属性とパターンから構成されている。
第10文目は、参照記号「−」のカテゴリがrconJ
とruniJなので、第1候補を「図1」 「図2」「
図3」を参照するパターンとし、第2候補をruniJ
の1図1−3」を参照するパターンとして抽出している
参照キー候補抽出部9も、参照箇所候補抽出部8と同様
に、例えば、第7図のような形で記述された参照キー抽
出規則辞書12に格納された参照キー抽出規則と、参照
予約語辞書lOに格納された参照用語をもとに、参照キ
ー候補の抽出を行う。
例えば、第8図のような参照情報に対する抽出結果は第
8文目は規則AとDに一致し、第23文目と24文目は
規則AとGに一致して、第9図のようになる。
第9図は、8文目に見出しく参照キー)があり、参照の
属性がr図」でパターンが「2」であり、図の開始文が
1で、終了文が8であることを示している。
次に参照構造決定部7が、参照箇所候補の参照パターン
(第6図)と参照キー候補の参照パターン(第9図)と
が一致するかを判定し、一致したものだけ、参照構造を
決定し、参照構造記憶部6に書き込む。
第2図(a)の第10文目の第2の候補に一致する参照
パターンはなく、第1の候補に一致するパターンのみが
あるので、第2の候補は削除される。
この結果、参照構造は第10図のようになる。
第10文目には3つの参照箇所があるので3つのセルが
作られる。各セルは例えばそれぞれ文番号、開始終了位
置参照の属性、パターン、参照している実体へのポイン
タ、参照箇所間の兄弟関係である1つ若いパターンをも
つセルへのポインタ、双子関係である同じパターンをも
つセルへのポインタをもっている。例えば第10文目の
1図2」には第10文目の「図3」への参照の第として
のポインタがあり、参照実体へのポインタ、及び第12
文目の1図2」への双子のポインタが格納されている。
このように参照構造が決定されると、例えば文書管理部
5は、参照構造記憶部6の内容にもとづき、参照箇所の
抽出された箇所を、反転表示する指示を表示制御部4へ
送る。その結果、出力部3の表示は、第2図(b)のよ
うになる。
例えば、第2図(b)の反転表示部を入力部2により指
示し、参照情報の表示を指示すると、第2図(c)のよ
うに、例えば、図2の実体が表示される。
以上、本実施例では、第3図、第4図、第6図、第7図
、第9図、第10図に示すような辞書、規則、参照構造
に従うものとして説明したが、これに限定されるもので
はない。
例えば、参照箇所「図2(a)」に対して、「図2」と
「図2(a)」という2種の候補を抽出する変形なども
可能である。
又、参照箇所候補の抽出、参照キー候補の抽出は、それ
ぞれ別プロセスにて、並行して行うような制御も可能で
ある。
あるいは、参照キー候補の抽出をあらかじめ行っておき
、参照箇所候補の抽出と参照構造の決定をまとめて行う
ような制御も可能である。
又、決定された参照構造も、ユーザの指定により変更す
ることも可能である。(第2図(C))参照構造に基づ
き、参照番号を「図1」から「第1図」あるいはrFi
gure tJなどに変更したり、文書全体の通し番号
や堂内で閉じた通し番号に変更したりすることも可能で
ある。
また、原文データの訂正により、参照番号がずれたりし
た場合、参照箇所間の兄弟関係に従って、参照番号を統
一することも可能である。
また、参照箇所の近傍に図表などの参照情報を割りつけ
るときに、参照箇所のうち双子関係の一番先頭(第10
図の第10文目の「図2」)に割りつけたり、逆に一番
最後(第12文目の1図2」)に割りつけたりすること
も可能である。どちらに割りつけるかをユーザに指定さ
せるようにすることも可能である。
〔発明の効果〕
以上述べたように、本発明によれば原文中で図表や文献
、前出の章や節を参照しているあいまい性のある箇所を
抽出して、参照されている実体との間にある参照構造を
正しく抽出できる。抽出された参照構造にもとづき、オ
ペレータに負担をかけることなく図表を配置したり、適
宜必要な参照情報を表示したりできるので、その効果は
大きい。
【図面の簡単な説明】
第1図は本発明の一実施例の概略構成図、第2図は画面
の表示例を示す図、第3図は辞書の一例を示す図、第4
図は参照箇所抽出規則の一例を示す図、第5図は規則適
用の流れ図、第6図は参照箇所候補抽出部による参照構
造格納の一例を示す図、第7図は参照キー抽出規則の一
例を示す図、第8図は参照情報の表示例を示す図、第9
図は参照キー候補抽出部による参照構造格納の一例を示
す図、第10図は参照構造のセルの様子を示す図である
。 1・・・文書記憶部      2・・・入力部3・・
・出力部        4・・・表示制御部5・・・
文書管理部      6・・・参照構造記憶部7・・
・参照構造決定部    8・・・参照箇所候補抽出部
9・・・参照キー候補抽出部  10・・・参照予約語
辞書11・・・参照箇所抽出規則辞書 12・・・参照
キー抽出規則辞書13・・・参照構造抽出部 代理人 弁理士 則 近 憲 佑 同  松山光之 第1図 支審否 (a) (b) (C) 第2図 第3ツ ク〉:良F〜警二輛ヤ駐シ3 〔〕:朝−島間 第4.コ 第5N [1: 終女9己号 第7図 第8図 第9図 第10 図

Claims (3)

    【特許請求の範囲】
  1. (1)テキストデータ及び参照情報を入力するための入
    力手段と、前記テキストデータ中から参照情報を引用し
    ている参照箇所をあいまい度に応じて抽出する参照箇所
    抽出手段と、前記参照情報中から参照のキーとなるキー
    情報を抽出する参照キー抽出手段と、前記参照箇所抽出
    手段により抽出された参照箇所候補と前記参照キー抽出
    手段により抽出された参照キー候補とを照合して参照構
    造を決定する参照構造決定手段と、この参照構造決定手
    段により決定された参照構造に基いて前記テキストデー
    タの整形処理を適宜行って出力する出力手段とを具備し
    たことを特徴とする参照構造抽出方式。
  2. (2)出力手段は、テキストデータ中の参照構造の存在
    を反転、高輝度等の表示アトリビュートにより表示する
    ものである請求項1記載の参照構造抽出方式。
  3. (3)入力手段は、前記出力手段により表示された参照
    構造を指示することにより、参照構造の特定・削除・訂
    正等を行うものである請求項2記載の参照構造抽出方式
JP63028787A 1988-02-12 1988-02-12 文書処理装置 Expired - Fee Related JP3130523B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63028787A JP3130523B2 (ja) 1988-02-12 1988-02-12 文書処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63028787A JP3130523B2 (ja) 1988-02-12 1988-02-12 文書処理装置

Publications (2)

Publication Number Publication Date
JPH01205263A true JPH01205263A (ja) 1989-08-17
JP3130523B2 JP3130523B2 (ja) 2001-01-31

Family

ID=12258140

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63028787A Expired - Fee Related JP3130523B2 (ja) 1988-02-12 1988-02-12 文書処理装置

Country Status (1)

Country Link
JP (1) JP3130523B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0484360A (ja) * 1990-07-27 1992-03-17 Nec Corp 文章検査装置
JPH04296970A (ja) * 1991-02-19 1992-10-21 Nec Corp 文章検査装置
JP2012212289A (ja) * 2011-03-31 2012-11-01 Dainippon Printing Co Ltd 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム
JP2021174474A (ja) * 2020-04-30 2021-11-01 株式会社日本法務システム研究所 プログラム、端末及び情報処理システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0484360A (ja) * 1990-07-27 1992-03-17 Nec Corp 文章検査装置
JPH04296970A (ja) * 1991-02-19 1992-10-21 Nec Corp 文章検査装置
JP2012212289A (ja) * 2011-03-31 2012-11-01 Dainippon Printing Co Ltd 書籍情報検索装置、書籍情報検索システム、書籍情報検索方法およびプログラム
JP2021174474A (ja) * 2020-04-30 2021-11-01 株式会社日本法務システム研究所 プログラム、端末及び情報処理システム

Also Published As

Publication number Publication date
JP3130523B2 (ja) 2001-01-31

Similar Documents

Publication Publication Date Title
JPH0776969B2 (ja) 文書処理装置
US5564046A (en) Method and system for creating a database by dividing text data into nodes which can be corrected
KR19980080220A (ko) 언어 식별 장치, 언어 식별 방법 및 언어 식별의 프로그램을 기록한 기록매체
JPH09190449A (ja) 索引自動生成方法とその利用方法
JPH08241332A (ja) 全文登録語検索装置および方法
JPH01205263A (ja) 文書処理装置
JPS60164863A (ja) ワードプロセッサの手書き入力データ処理方法
JPH09106399A (ja) 機械翻訳装置及び機械翻訳方法
JP3470930B2 (ja) 自然語解析方法及び装置
JPH01205265A (ja) 文書整形装置
JPS63298563A (ja) 文章要約システム
US7613709B2 (en) System and method for editing operations of a text object model
JP3352709B2 (ja) 文書整形装置および文書整形装置の処理方法
JPH08160930A (ja) 複数言語によるコンピュータの画面表示方法
JPH11272666A (ja) 文書編集システム、方法、及び記録媒体
JPS6366663A (ja) 文書構造管理方式
JPH04157567A (ja) 文脈構造表示装置
JPH0628396A (ja) 電子化辞書装置
JPH04167123A (ja) 混在データ処理方式
JP2002358301A (ja) 電子辞書
JPH0290364A (ja) 機械翻訳システムの対訳辞書及び共起関係辞書の作成方法
JPH077413B2 (ja) 文章用語検定装置
JPH04270450A (ja) 文書作成装置
JPH02297264A (ja) 文書処理装置
JP2002082804A (ja) 動的識別子情報を利用するエディタ

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees