JPH0241565A - シソーラス更新支援装置 - Google Patents
シソーラス更新支援装置Info
- Publication number
- JPH0241565A JPH0241565A JP63192338A JP19233888A JPH0241565A JP H0241565 A JPH0241565 A JP H0241565A JP 63192338 A JP63192338 A JP 63192338A JP 19233888 A JP19233888 A JP 19233888A JP H0241565 A JPH0241565 A JP H0241565A
- Authority
- JP
- Japan
- Prior art keywords
- concept
- thesaurus
- candidate
- word
- candidate concept
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、情報検索において必須なシソーラスの更新作
業を効率化するためのシソーラス更新支援装置に関する
。
業を効率化するためのシソーラス更新支援装置に関する
。
〔従来の技術〕
従来、情報検索用シソーラスの更新作業は、殆んど人手
に頼って行われているため、更新には、膨大な労力が必
要であり、また、このため、更新の周期が長くなるとい
う問題があった。これらの作業を支援する機能としては
、従来、用語間の上位・下位関係での矛盾、循環等の検
査機能が提供されている程度であった。
に頼って行われているため、更新には、膨大な労力が必
要であり、また、このため、更新の周期が長くなるとい
う問題があった。これらの作業を支援する機能としては
、従来、用語間の上位・下位関係での矛盾、循環等の検
査機能が提供されている程度であった。
なお、この種の技術として関連するものに1例えばrJ
IC3T科学技術用語シソーラス1987年版の作成」
(情報管理、Vol、29.Na1l、1987)に開
示された技術を挙げることができる。
IC3T科学技術用語シソーラス1987年版の作成」
(情報管理、Vol、29.Na1l、1987)に開
示された技術を挙げることができる。
商用データベース、社内データベース等でシソーラスを
使用した情報検索を行う際には、ユーザのニーズに合せ
て、シソーラスを効率的に更新できる機能が必要である
。しかしながら、上記従来技術においては、これが充分
でないという重大な問題があった。
使用した情報検索を行う際には、ユーザのニーズに合せ
て、シソーラスを効率的に更新できる機能が必要である
。しかしながら、上記従来技術においては、これが充分
でないという重大な問題があった。
本発明は上記事情に鑑みてなされたもので、その目的と
するところは、従来の技術における上述の如き問題点を
解消し、基本シソーラスの更新時に生ずる膨大な労力を
要する未知語のカテゴリを探索する作業を計算機で支援
することにより、シソーラス更新作業を効率化すること
が可能な、シソーラス更新支援装置を提供することにあ
る。
するところは、従来の技術における上述の如き問題点を
解消し、基本シソーラスの更新時に生ずる膨大な労力を
要する未知語のカテゴリを探索する作業を計算機で支援
することにより、シソーラス更新作業を効率化すること
が可能な、シソーラス更新支援装置を提供することにあ
る。
本発明の上述の目的は、シソーラスの更新作業を支援す
るシソーラス更新支援装置において、利用者がシソーラ
スに登録を要求した用語が既にシソーラスに登録されて
いるか否かを判定し、未知語を抽出するとともに、前記
未知語が、シソーラス登録語と部分一致するか否かを判
定し、前記未知語の部分要素あるいは全体と同一の部分
要素を持つシソーラス登録語をすべて未知語の候補概念
として抽出する部分一致語抽出部と、少なくとも前記未
知語の部分要素と同一の部分要素を持つシソーラス登録
語をすべて未知語の候補概念として抽出する部分一致語
抽出部と、該部分一致語抽出部から得られるシソーラス
登録語の中で、前記未知語の部分要素と同一の部分要素
を持つシソーラス登録語を未知語の候補概念として選択
する第1の候補概念選択部と、前記未知語の語構成パタ
ーンに類似する候補概念に高い尤度を与える語構成パタ
ーン評価部と、前記語構成パターン評価部から得られる
尤度、更に、候補概念の概念カテゴリへの集中度によっ
て、前記第1の候補概念選択部から得られる候補概念が
属する概念カテゴリに優先度を与える候補概念カテゴリ
評価部と、優先度の順に当該候補概念カテゴリの概念関
係構造を表示するとともに、その中から利用者が妥当と
判断した概念カテゴリを選択し、シソーラスの概念構造
の中に未知語を位置付ける更新支援インタフェース処理
部と、前記各部を制御する更新支援制御部を具備するこ
とを特徴とするシソーラス更新支援装置、もしくは、上
記各手段に加えて、あるまとまった単位の文書の中で付
与された既にシソーラスに登録されているキーワードと
、当該文書中で付与された未知語に対して上記第1の候
補概念選択部から得られる候補概念との類似関係を検査
し、意味的に類似度の高い候補概念に高い尤度を与える
共起概念尤度評価部と、上記部分一致語抽山部から得ら
れるシソーラス登録語の中で、未知語全体を部分要素と
するシソーラス登録語を、未知語の概念候補として選択
する第2の候補概念選択部とを設け、上記語構成パター
ン評価部および共起概念尤度評価部から得られる尤度、
更に、候補概念の概念カテゴリへの集中度によって、上
記第1あるいは第2の候補概念選択部から得られる候補
概念が属する概念カテゴリに優先度を与える候補概念カ
テゴリ評価部と、優先度の順に当該候補概念カテゴリの
概念関係構造を表示するとともに、その中から利用者が
妥当と判断した概念カテゴリを選択し、シソーラスの概
念構造の中に未知語を位置付ける更新支援インタフェー
ス処理部を設けたことを特徴とする特許請求の範囲第1
項記載のシソーラス更新支援装置により達成される。
るシソーラス更新支援装置において、利用者がシソーラ
スに登録を要求した用語が既にシソーラスに登録されて
いるか否かを判定し、未知語を抽出するとともに、前記
未知語が、シソーラス登録語と部分一致するか否かを判
定し、前記未知語の部分要素あるいは全体と同一の部分
要素を持つシソーラス登録語をすべて未知語の候補概念
として抽出する部分一致語抽出部と、少なくとも前記未
知語の部分要素と同一の部分要素を持つシソーラス登録
語をすべて未知語の候補概念として抽出する部分一致語
抽出部と、該部分一致語抽出部から得られるシソーラス
登録語の中で、前記未知語の部分要素と同一の部分要素
を持つシソーラス登録語を未知語の候補概念として選択
する第1の候補概念選択部と、前記未知語の語構成パタ
ーンに類似する候補概念に高い尤度を与える語構成パタ
ーン評価部と、前記語構成パターン評価部から得られる
尤度、更に、候補概念の概念カテゴリへの集中度によっ
て、前記第1の候補概念選択部から得られる候補概念が
属する概念カテゴリに優先度を与える候補概念カテゴリ
評価部と、優先度の順に当該候補概念カテゴリの概念関
係構造を表示するとともに、その中から利用者が妥当と
判断した概念カテゴリを選択し、シソーラスの概念構造
の中に未知語を位置付ける更新支援インタフェース処理
部と、前記各部を制御する更新支援制御部を具備するこ
とを特徴とするシソーラス更新支援装置、もしくは、上
記各手段に加えて、あるまとまった単位の文書の中で付
与された既にシソーラスに登録されているキーワードと
、当該文書中で付与された未知語に対して上記第1の候
補概念選択部から得られる候補概念との類似関係を検査
し、意味的に類似度の高い候補概念に高い尤度を与える
共起概念尤度評価部と、上記部分一致語抽山部から得ら
れるシソーラス登録語の中で、未知語全体を部分要素と
するシソーラス登録語を、未知語の概念候補として選択
する第2の候補概念選択部とを設け、上記語構成パター
ン評価部および共起概念尤度評価部から得られる尤度、
更に、候補概念の概念カテゴリへの集中度によって、上
記第1あるいは第2の候補概念選択部から得られる候補
概念が属する概念カテゴリに優先度を与える候補概念カ
テゴリ評価部と、優先度の順に当該候補概念カテゴリの
概念関係構造を表示するとともに、その中から利用者が
妥当と判断した概念カテゴリを選択し、シソーラスの概
念構造の中に未知語を位置付ける更新支援インタフェー
ス処理部を設けたことを特徴とする特許請求の範囲第1
項記載のシソーラス更新支援装置により達成される。
本発明に係るシソーラス更新支援装置においては、利用
者がシソーラスに登録するために、更新支援インタフェ
ース処理部あるいはファイルから入力した用語について
、部分一致語抽山部において、既にシソーラスに登録さ
れているが否がが判定され、更に、未知語と判定された
場合には、それらが部分要素に分解され、それぞれの部
分要素についてもシソーラス登録語と一致するが否がか
判定される。前記候補概念第1選択部は、未知語の部分
要素と同じ部分要素翫持っシソーラス登録語を選択する
。語構成パターン評価部は、候補概念第1選択部から出
方される候補概念に、語構成パターンの一致度によって
尤度を与え、また、共起概念尤度評価部は、未知語と既
にシソーラスに登録されているキーワードとの、例えば
、論文。
者がシソーラスに登録するために、更新支援インタフェ
ース処理部あるいはファイルから入力した用語について
、部分一致語抽山部において、既にシソーラスに登録さ
れているが否がが判定され、更に、未知語と判定された
場合には、それらが部分要素に分解され、それぞれの部
分要素についてもシソーラス登録語と一致するが否がか
判定される。前記候補概念第1選択部は、未知語の部分
要素と同じ部分要素翫持っシソーラス登録語を選択する
。語構成パターン評価部は、候補概念第1選択部から出
方される候補概念に、語構成パターンの一致度によって
尤度を与え、また、共起概念尤度評価部は、未知語と既
にシソーラスに登録されているキーワードとの、例えば
、論文。
新聞記事等の如き、あるまとまった単位の文書における
共起関係に基づいて尤度を与える。前記概念候補カテゴ
リ評価部は、前述の尤度と候補概念の概念カテゴリへの
集中度を基に、候補概念が属する概念カテゴリに評価値
を与え、更新支援制御部は、これらの評価値に基づいて
、更新支援インタフェース処理部に、シソーラスの該当
部分を表示する。利用者は、前記手段により、計算機が
表示する未知語の候補概念を検査するのみで、妥当な概
念を探索でき、シソーラスの更新作業を効率化できるも
のである。
共起関係に基づいて尤度を与える。前記概念候補カテゴ
リ評価部は、前述の尤度と候補概念の概念カテゴリへの
集中度を基に、候補概念が属する概念カテゴリに評価値
を与え、更新支援制御部は、これらの評価値に基づいて
、更新支援インタフェース処理部に、シソーラスの該当
部分を表示する。利用者は、前記手段により、計算機が
表示する未知語の候補概念を検査するのみで、妥当な概
念を探索でき、シソーラスの更新作業を効率化できるも
のである。
以下、本発明の実施例を図面に基づいて詳細に説明する
。
。
第1図は1本発明の一実施例であるシソーラス更新支援
装置の構成を示すブロック図である。図において、記号
1は利用者がシソーラスに登録を要求した用語、すなわ
ち、未知語が既にシソーラスに登録されているか否かを
判定し、シソーラスに登録されていない用語を抽出する
とともに、上記未知語が、既にシソーラスにRtaされ
ている用語、すなわち、シソーラス登録語と部分一致す
るか否かを判定し、上記未知語の部分要素あるいは全体
と同一の部分要素を持つシソーラス登録語をすべて未知
語の候補概念として抽出する部分一致語抽山部を示して
いる。
装置の構成を示すブロック図である。図において、記号
1は利用者がシソーラスに登録を要求した用語、すなわ
ち、未知語が既にシソーラスに登録されているか否かを
判定し、シソーラスに登録されていない用語を抽出する
とともに、上記未知語が、既にシソーラスにRtaされ
ている用語、すなわち、シソーラス登録語と部分一致す
るか否かを判定し、上記未知語の部分要素あるいは全体
と同一の部分要素を持つシソーラス登録語をすべて未知
語の候補概念として抽出する部分一致語抽山部を示して
いる。
2は上記部分一致語抽山部1から得られるシソーラス登
録語の中で、上記未知語を部分要素とするシソーラス登
録語を未知語の候補概念として選択する候補概念第1選
択部、3は上記未知語の語構成パターンに類似する候補
概念に高い尤度を与える語構成パターン評価部、4はあ
るまとまった単位の文書の中で付与されたキーワードと
、当該まとまった単位の文書の中で発生した未知語に対
する候補概念との類似関係を検査し、意味的に類似度の
高い候補概念に高い尤度を与える共起概念尤度評価部、
5は前記部分−散油山部1がら得られるシソーラス登録
語を未知語の候補概念として選択する候補概念第2選択
部を示している。
録語の中で、上記未知語を部分要素とするシソーラス登
録語を未知語の候補概念として選択する候補概念第1選
択部、3は上記未知語の語構成パターンに類似する候補
概念に高い尤度を与える語構成パターン評価部、4はあ
るまとまった単位の文書の中で付与されたキーワードと
、当該まとまった単位の文書の中で発生した未知語に対
する候補概念との類似関係を検査し、意味的に類似度の
高い候補概念に高い尤度を与える共起概念尤度評価部、
5は前記部分−散油山部1がら得られるシソーラス登録
語を未知語の候補概念として選択する候補概念第2選択
部を示している。
また、6は上記候補概念第1選択部2または候補概念第
2選択部5から得られる候補概念が属する概念カテゴリ
に共起概念尤度評価部4がら得られる尤度と、語構成パ
ターン評価部3がら得られる尤度、更に、候補概念の概
念カテゴリへの集中度によって優先度を与える候補概念
カテゴリ評価部、7は優先度の順番こ候補概念が属する
概念カテゴリの概念関係構造を表示するとともに、その
中から利用者が妥当と判断した概念カテゴリを選択し、
シソーラスの概念構造の中に未知語を位置付ける機能を
有する更新支援用インタフェース処理部、8はこの支援
装置の各部を制御する更新支援制御部、9は更新の対象
としているシソーラスを示している。
2選択部5から得られる候補概念が属する概念カテゴリ
に共起概念尤度評価部4がら得られる尤度と、語構成パ
ターン評価部3がら得られる尤度、更に、候補概念の概
念カテゴリへの集中度によって優先度を与える候補概念
カテゴリ評価部、7は優先度の順番こ候補概念が属する
概念カテゴリの概念関係構造を表示するとともに、その
中から利用者が妥当と判断した概念カテゴリを選択し、
シソーラスの概念構造の中に未知語を位置付ける機能を
有する更新支援用インタフェース処理部、8はこの支援
装置の各部を制御する更新支援制御部、9は更新の対象
としているシソーラスを示している。
第2図(a)〜(c)に、本実施例の動作フローを示す
。すなわち、同図(a)は本装置全体の動作フロー、同
図(b)は語構成パターン評価部3の動作フロー、同図
(c)は共起概念尤度評価部4の動作フローを示してい
る。
。すなわち、同図(a)は本装置全体の動作フロー、同
図(b)は語構成パターン評価部3の動作フロー、同図
(c)は共起概念尤度評価部4の動作フローを示してい
る。
以下、具体例に基づいて、本実施例の動作を説明する。
第3図に示すように、「年金資産」という用語10がシ
ソーラス9に登録を要求された場合、部分−致語抽山部
1は、シソーラスをサーチし、当該用語「年金資産」が
既に登録されているか否かを検査する(ステップ21)
。この場合、「年金資産」は未知語と判断されるので、
ステップ22で「年金資産」を部分要素〔年金、資産〕
に介割し、それらを部分要素とするシソーラス登録語1
1[年金2年金信託2年金預金、厚生年金、・・・・・
、資産、棚卸し資産、在外資産、資産売却、・・・・〕
、あるいは、未知語全体を部分要素とするシソーラス登
録語を候°補概念として出力する(ステップ23.24
)。
ソーラス9に登録を要求された場合、部分−致語抽山部
1は、シソーラスをサーチし、当該用語「年金資産」が
既に登録されているか否かを検査する(ステップ21)
。この場合、「年金資産」は未知語と判断されるので、
ステップ22で「年金資産」を部分要素〔年金、資産〕
に介割し、それらを部分要素とするシソーラス登録語1
1[年金2年金信託2年金預金、厚生年金、・・・・・
、資産、棚卸し資産、在外資産、資産売却、・・・・〕
、あるいは、未知語全体を部分要素とするシソーラス登
録語を候°補概念として出力する(ステップ23.24
)。
候補概念第1選択部2は、これらの候補の中から、未知
語と共通の部分要素を持つシソーラス登録語のみを選択
し、候補概念第2選択部5は、未知語全体を部分要素と
するシソーラス登録語を選択する(ステップ25)。こ
の例の場合、未知語全体を部分要素とするシソーラス登
録語は存在せず、部分一致語抽山部1からの出力と候補
概念第2選択部5からの出力は同じになる。
語と共通の部分要素を持つシソーラス登録語のみを選択
し、候補概念第2選択部5は、未知語全体を部分要素と
するシソーラス登録語を選択する(ステップ25)。こ
の例の場合、未知語全体を部分要素とするシソーラス登
録語は存在せず、部分一致語抽山部1からの出力と候補
概念第2選択部5からの出力は同じになる。
語構成パターン評価部3は、未知語の語構成パターンと
候補概念の語構成パターンとを比較し、パターンが一致
する。あるいは、未知語の部分要素と完全一致する候補
概念に高い尤度を与える。
候補概念の語構成パターンとを比較し、パターンが一致
する。あるいは、未知語の部分要素と完全一致する候補
概念に高い尤度を与える。
この例の場合には、〔年金2年金信託2年金預金、資産
、棚卸し資産、在外資産〕12に高い評価値が与えられ
る(ステップ26および31〜40)。
、棚卸し資産、在外資産〕12に高い評価値が与えられ
る(ステップ26および31〜40)。
共起概念尤度評価部4は、あるまとまった単位の文書の
中で付与されたキーワードと未知語に対する候補概念の
類似関係を検査する。この例の場合、未知語「年金資産
」と同じ文書に付与されているキーワードには、〔年金
2個人年金、銀行、資金運用〕13があり、候補概念の
中で「年金」に高い尤度が与えられる(ステップ27お
よび41〜47)、なお、候補概念と文書に付与された
キーワードが一致した場合、最も高い尤度が与えられる
が、キーワードが属する概念カテゴリに含まれる語に候
補概念が一致した場合、それに次ぐ尤度が与えられる。
中で付与されたキーワードと未知語に対する候補概念の
類似関係を検査する。この例の場合、未知語「年金資産
」と同じ文書に付与されているキーワードには、〔年金
2個人年金、銀行、資金運用〕13があり、候補概念の
中で「年金」に高い尤度が与えられる(ステップ27お
よび41〜47)、なお、候補概念と文書に付与された
キーワードが一致した場合、最も高い尤度が与えられる
が、キーワードが属する概念カテゴリに含まれる語に候
補概念が一致した場合、それに次ぐ尤度が与えられる。
候補概念評価部6は、語構成パターン評価部3および共
起概念尤度評価部4から得られる尤度によって候補概念
が属する概念カテゴリに評価値を与える(ステップ28
)。この例の場合、語構成パターンによっても、共起関
係によっても、高い尤度が与えられる「年金」14が属
する概念カテゴリに最も高い評価値が与えられる。
起概念尤度評価部4から得られる尤度によって候補概念
が属する概念カテゴリに評価値を与える(ステップ28
)。この例の場合、語構成パターンによっても、共起関
係によっても、高い尤度が与えられる「年金」14が属
する概念カテゴリに最も高い評価値が与えられる。
更新支援制御部8は、この評価値の高い順に候補概念カ
テゴリの概念関係構造を更新支援インタフェース処理部
7に表示し、利用者は妥当と判断される候補概念カテゴ
リを選択するとともに、ポインティング操作等によって
、未知語をシソーラス上の該当する概念構造に位置付け
る。
テゴリの概念関係構造を更新支援インタフェース処理部
7に表示し、利用者は妥当と判断される候補概念カテゴ
リを選択するとともに、ポインティング操作等によって
、未知語をシソーラス上の該当する概念構造に位置付け
る。
第4図に例を示すように、「調査」15という用語が登
録要求された場合、この語については未知語全体を部分
要素とするシソーラス登録語のみが存在するため、候補
概念第2選択部5は、「調査」15を部分要素とするシ
ソーラス登録語〔海洋調査、深海調査2国勢調査、意識
調査、・・・・〕16等を候補概念として出力する。候
補概念カテゴリ評価部6は、これらの候補概念が集中す
る概念カテゴリに高い評価値を与え、更新支援制御部8
は、評価値の高い順に、候補カテゴリを更新支援インタ
フェース処理部7に表示し、利用者は、見当と判断され
る候補概念カテゴリを選択するとともに、ボインティン
グ操作等によって未知語を該当する概念構造に位置付け
る。
録要求された場合、この語については未知語全体を部分
要素とするシソーラス登録語のみが存在するため、候補
概念第2選択部5は、「調査」15を部分要素とするシ
ソーラス登録語〔海洋調査、深海調査2国勢調査、意識
調査、・・・・〕16等を候補概念として出力する。候
補概念カテゴリ評価部6は、これらの候補概念が集中す
る概念カテゴリに高い評価値を与え、更新支援制御部8
は、評価値の高い順に、候補カテゴリを更新支援インタ
フェース処理部7に表示し、利用者は、見当と判断され
る候補概念カテゴリを選択するとともに、ボインティン
グ操作等によって未知語を該当する概念構造に位置付け
る。
上記各実施例によれば、従来膨大な労力を要したシソー
ラスの更新作業を、計算機で支援することにより、容易
化、効率化できる利点がある。
ラスの更新作業を、計算機で支援することにより、容易
化、効率化できる利点がある。
なお、上記実施例は、本発明の一例として示したもので
あり、本発明はこれに限定されるべきものではない。
あり、本発明はこれに限定されるべきものではない。
以上、詳細に説明した如く、本発明によれば、シソーラ
スの更新を支援するシソーラス更新支援装置を、前述の
如き機能を有する部分−敬語抽出部、第1の候補概念選
択部1語構成パターン評価部、候補概念カテゴリ評価部
、更新支援インタフェース処理部および更新支援制御部
から構成したので、シソーラスの更新作業を効率化でき
るとともに、対話的に作業を進めることで誤りを少なく
できるシソーラス更新支援装置を実現できるという顕著
な効果を奏するものである。
スの更新を支援するシソーラス更新支援装置を、前述の
如き機能を有する部分−敬語抽出部、第1の候補概念選
択部1語構成パターン評価部、候補概念カテゴリ評価部
、更新支援インタフェース処理部および更新支援制御部
から構成したので、シソーラスの更新作業を効率化でき
るとともに、対話的に作業を進めることで誤りを少なく
できるシソーラス更新支援装置を実現できるという顕著
な効果を奏するものである。
第1図は本発明の一実施例であるシソーラス編集装置の
構成を示すブロック図、第2図はその全体および各部の
動作フローチャート、第3図、第4図は具体的動作例を
説明する図である。 1:部分一致語抽山部、2:候補概念第1選択部、3:
語構成パターン評価部、4:共起概念尤度評価部、5:
候補概念第2選択部、6:候補概念カテゴリ評価部、7
:更新支援インタフェース処理部、8:更新支援制御部
、9ニジツーラス、10.15 :登録要求語、11,
16:候補概念、12:パターン一致語、13:未知語
と同一文書で共起するキーワード、14:高尤度の候補
概念。 第 図 第 牛 図
構成を示すブロック図、第2図はその全体および各部の
動作フローチャート、第3図、第4図は具体的動作例を
説明する図である。 1:部分一致語抽山部、2:候補概念第1選択部、3:
語構成パターン評価部、4:共起概念尤度評価部、5:
候補概念第2選択部、6:候補概念カテゴリ評価部、7
:更新支援インタフェース処理部、8:更新支援制御部
、9ニジツーラス、10.15 :登録要求語、11,
16:候補概念、12:パターン一致語、13:未知語
と同一文書で共起するキーワード、14:高尤度の候補
概念。 第 図 第 牛 図
Claims (2)
- (1)シソーラスの更新作業を支援するシソーラス更新
支援装置であって、利用者がシソーラスに登録を要求し
た用語が既にシソーラスに登録されているか否かを判定
し、シソーラスに未だ登録されていない用語(未知語)
を抽出するとともに、前記未知語が、既にシソーラスに
登録されている用語(シソーラス登録語)と部分一致す
るか否かを判定し、少なくとも前記未知語の部分要素と
同一の部分要素を持つシソーラス登録語をすべて未知語
の候補概念として抽出する部分一致語抽出部と、該部分
一致語抽出部から得られるシソーラス登録語の中で、前
記未知語の部分要素と同一の部分要素を持つシソーラス
登録語を未知語の候補概念として選択する第1の候補概
念選択部と、前記未知語の語構成パターンに類似する候
補概念に高い尤度を与える語構成パターン評価部と、前
記語構成パターン評価部から得られる尤度、更に、候補
概念の概念カテゴリへの集中度によって、前記第1の候
補概念選択部から得られる候補概念が属する概念カテゴ
リに優先度を与える候補概念カテゴリ評価部と、優先度
の順に当該候補概念カテゴリの概念関係構造を表示する
とともに、その中から利用者が妥当と判断した概念カテ
ゴリを選択し、シソーラスの概念構造の中に未知語を位
置付ける更新支援インタフェース処理部と、前記各部を
制御する更新支援制御部を具備することを特徴とするシ
ソーラス更新支援装置。 - (2)前記各手段に加えて、あるまとまった単位の文書
の中で付与された既にシソーラスに登録されているキー
ワードと、当該文書中で付与された未知語に対して前記
第1の候補概念選択部から得られる候補概念との類似関
係を検査し、意味的に類似度の高い候補概念に高い尤度
を与える共起概念尤度評価部と、前記部分一致語抽出部
から得られるシソーラス登録語の中で、未知語全体を部
分要素とするシソーラス登録語を、未知語の概念候補と
して選択する第2の候補概念選択部とを設け、前記語構
成パターン評価部および共起概念尤度評価部から得られ
る尤度、更に、候補概念の概念カテゴリへの集中度によ
って、前記第1あるいは第2の候補概念選択部から得ら
れる候補概念が属する概念カテゴリに優先度を与える候
補概念カテゴリ評価部と、優先度の順に当該候補概念カ
テゴリの概念関係構造を表示するとともに、その中から
利用者が妥当と判断した概念カテゴリを選択し、シソー
ラスの概念構造の中に未知語を位置付ける更新支援イン
タフェース処理部を設けたことを特徴とする特許請求の
範囲第1項記載のシソーラス更新支援装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63192338A JPH0241565A (ja) | 1988-08-01 | 1988-08-01 | シソーラス更新支援装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63192338A JPH0241565A (ja) | 1988-08-01 | 1988-08-01 | シソーラス更新支援装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0241565A true JPH0241565A (ja) | 1990-02-09 |
Family
ID=16289618
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63192338A Pending JPH0241565A (ja) | 1988-08-01 | 1988-08-01 | シソーラス更新支援装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0241565A (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110263184A (zh) * | 2019-06-20 | 2019-09-20 | 中国医学科学院医学信息研究所 | 一种数据处理方法及相关设备 |
-
1988
- 1988-08-01 JP JP63192338A patent/JPH0241565A/ja active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110263184A (zh) * | 2019-06-20 | 2019-09-20 | 中国医学科学院医学信息研究所 | 一种数据处理方法及相关设备 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Li et al. | Semantic integration in heterogeneous databases using neural networks | |
| KR100850255B1 (ko) | 실시간 데이터 웨어하우징 | |
| US8316292B1 (en) | Identifying multiple versions of documents | |
| US5893094A (en) | Method and apparatus using run length encoding to evaluate a database | |
| EP1342177A1 (en) | Method for structuring and searching information | |
| JP4160548B2 (ja) | 文書要約作成システム、方法、及びプログラム | |
| CN111400323A (zh) | 数据检索方法、系统、设备及存储介质 | |
| JPH08255163A (ja) | 文書検索装置 | |
| JP6470249B2 (ja) | データクレンジングシステム、データクレンジング方法及びデータクレンジングプログラム | |
| JP5790820B2 (ja) | 不整合検出装置、プログラム及び方法、修正支援装置、プログラム及び方法 | |
| JPH09212517A (ja) | 情報代行検索方法及び装置 | |
| JP3123836B2 (ja) | テキスト型データベース装置 | |
| JP2894301B2 (ja) | 文脈情報を用いた文書検索方法および装置 | |
| JPH0241565A (ja) | シソーラス更新支援装置 | |
| CN118349621A (zh) | 一种索引建立方法、检索方法和电子设备 | |
| JP3500097B2 (ja) | 複合メディア検索方法および複合メディア検索用プログラム記録媒体 | |
| US20020147705A1 (en) | Method system and program product for data searching | |
| JPH0944506A (ja) | 文書検索装置 | |
| JP2821213B2 (ja) | データベースのマッチング方法 | |
| JPH1166078A (ja) | 検索要求具体化方法及び装置及び検索要求具体化プログラムを格納した記憶媒体 | |
| JPH07182333A (ja) | 日本語処理装置 | |
| JP3470930B2 (ja) | 自然語解析方法及び装置 | |
| JPH08115340A (ja) | 文書検索装置およびそれに用いるインデックスファイルの作成装置 | |
| JPH05204978A (ja) | 情報検索装置 | |
| JPH0944508A (ja) | データベース自然言語インタフェース装置および方法 |