JPH02190972A - 用例検索システム - Google Patents

用例検索システム

Info

Publication number
JPH02190972A
JPH02190972A JP1010158A JP1015889A JPH02190972A JP H02190972 A JPH02190972 A JP H02190972A JP 1010158 A JP1010158 A JP 1010158A JP 1015889 A JP1015889 A JP 1015889A JP H02190972 A JPH02190972 A JP H02190972A
Authority
JP
Japan
Prior art keywords
keyword
speech
information
search
input section
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1010158A
Other languages
English (en)
Inventor
Yasuji Kobuchi
保司 小渕
Hideo Mitsuyoshi
三吉 秀夫
Akira Hamada
明 濱田
Hirokatsu Akiyama
広勝 秋山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP1010158A priority Critical patent/JPH02190972A/ja
Publication of JPH02190972A publication Critical patent/JPH02190972A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (イ)産業上の利用分野 この発明は言語研究あるいは自然言語処理の研究に有用
な用例検索システムに関する。
(ロ)従来の技術 従来、言語の用例を参照したり言語現象の分析を行うた
めに、用例検索システムにおいては“文脈付き見出し語
°と呼ばれているKWIC(にeyford In C
ontext)がよく用いられている。このKWICは
単語の用例を提供するための言語データベースであり、
言語研究あるいは自然言語処理研究を行うための有用な
言語分析ツールであるとされている。KWICの構成は
、見出し語を、それが用いられている前後の文脈を付け
てソートした表であり、多くのKWICが開発されてい
る。そして通常のKWICは、1個の単語をキーワード
にして分類した形式のものが多い。一方このような単語
単位でソートしたKWICの他に、多少異なる形式を持
つものとして、電子技術総合研究所で開発され新編日本
語品詞列集成、右順編(1979)、左順編(1979
)に記載されている“日本語品詞列集成”があげられる
。この日本語品詞列集成は、品詞付き単語列を品詞でソ
ートし、所定の長さの品詞列とその品詞列に該当する単
語の並びに前後文脈を付して収録したものである。
(ハ)発明が解決しようとする課題 しかし従来のKWICはその名の示すとおり、1個の単
語の表記をキーワードとして検索する仕組みであったり
、印刷物の形聾を取っているものが多いため、必ずしも
上記の目的に即した有用な情報は得られなかった。自然
言語処理IE究者や言語学者が本当に調査したい言語現
象は、個々の単語の用例ではなく、ある制約を持つ語句
同志の共起あるいは複雑なパターンを含む用例であるが
、上記した従来の固定化されたKWrCでは、このよう
な複雑なパターンによる用例検索は不可能であり、よっ
て従来の用例検索システムでは単語の用例を数多く参照
することや、検索しようとする単語が実際にどのような
文脈で用いられているかを広く調査することができなか
った。このような伏況から、柔軟な用例検索システムが
望まれていた。そして言語学者が言語研究を行う際に検
索したい情報は、(1)ある語が使われているか(2)
ある語がどの作品のどのページ・どの行で使われている
か(3)ある語がどの作品のどのページ・どの行で・ど
ういう文脈の中で使われているか(4)ある語がどの作
品のどのページ・どの行で・どういう文脈の中で・どう
いう品詞情報列の中で使われているか(5)ある意味の
語を文脈つきで出せ(6)連用修飾を文脈付きで出せ(
7)主語を文脈付きで出せ(8)「〜の〜する名詞」構
文の用例を出せ(9)ある語にかかる語を出せ(10)
明治上期上流階級の女性の会話文において人称代名詞を
使った文を出せなどの項目である。
この発明は以上の事情を考慮してなされたもので、構造
化された検索キーワードを用いて柔軟に用例検索を行う
ことができる用例検索システムを提供する。
(ニ)課題を解決するための手段および作用この発明に
おいて用例とは用い方の例を意味し、文における用い方
、語句における用い方を含む。
これらの文や語句は、日本語あるいは英語や独語等の外
国語においても適用することができる。
テキストデータベースに付される文番号等とは、文番号
と文番号以外に含めることができる例えば、文をカテゴ
リー別に分類するための情報等である。
定義付きキーワードとは実施例に説明する構造化キーワ
ードを示し、語曇範噴(単!M)を定義するための文法
素性の部分集合である語愈情報を要素とする順序付リス
トである。
KWIC形式とは自動検索において、見出し語だけでな
く、その見出し語が使われている文脈も併せて検索する
形式を示す。
この発明は、出典、文番号、文情報リストが付された文
の用例を表記にて多数記憶し、かつ文情報リストを、文
の用例を構成する単語の品詞分類、表記、品詞M類、活
用型、意味等の情報からなる文法情報の集合として表し
たテキストデータベースと、 少なくともl以」二のキーワードの入力と、各キーワー
ド毎に行われ文の用例を構成する単語の範驕を定義する
ための文法情報の指定と、指定された文法情報を編集す
ることによる定義付きキーワードの作成を行うキーワー
ド入力部と、キーワード入力部から人力される定義付き
キーワードを、整合可能な部分項に変換し、テキストデ
ータベースの文情報リストと整合をとることにより、定
義付きキーワードに該当する文の用例を検索する検索部
と、 検索された文の用例をKWIC形式にて出力する検索結
果出力部とから構成されることを特徴とする用例検索シ
ステムである。
また、第2の発明ではキーワード入力部が、少なくとも
1以上の品詞の指定、または1以上の品詞の指定と指定
した各品詞固有の文法情報の指定によって定義付きキー
ワードの作成を行い、また、第3の発明ではキーワード
入力部が、品詞の指定と、指定した品詞が活用を伴う用
言である際に用言の活用に関する情報を指定することに
より、定義付きキーワードの作成を行い、第4の発明で
はテキストデータベースが、名詞の概念相互を上位/下
位関係で結び体系をなすシソーラスからなる意味情報を
有し、キーワード入力部が、少なくと61以上の名詞の
概念の指定により定義付きキーワードを作成し、検索部
が定義付きキーワードに基づき、概念で結ばれた用例を
テキストデータベースから検索する。また第5の発明で
はキーワード入力部が、助ふ11の指定と、指定した助
薗の種類を指定することにより、定義付きキーワードの
作成を行い、第6の発明ではキーワード入力部が、助詞
の指定と、指定した助詞の意味情報とを指定することに
より定義付きキーワードの作成を行う。
また、この発明の用例検索システムは、次のような特徴
を有する。
(1))1敗個の単語から構成されるパターンを検索キ
ーワードとして日本語文の用例を検索することができる
。さらに検索キーワードの各単語に各種の文法的制約を
課することができる。このような性質を持った検索キー
ワード列を構造化キーワードと呼ぶ。文法的制約として
は“品詞、品詞細分類、活用情報、見出し、出現形”の
ような形態的情報のみならず、概念の階層関係を表すシ
ソーラスの概念名を意味的制約として与えることが可能
である。
(2)検索された用例は、ユーザーが指定する順序にソ
ートされ、KWIC形式で表示される。また検索結果の
中の特定用例についてさらに詳細の文法情報を提供する
ことができる。
(3)ユーザーにとって都合の良い構造化キーワード入
力機能を有する。
(4)構造化キーワードの一部に任意の単語列とマッヂ
ング可能なワイルドカードを用いることができる。
(ホ)実施例 以下図に示す実施例に基づいてこの発明を詳述する。な
お、これによってこの発明は限定されるものではない。
第1図はこの発明の用例検索システムの構成図である。
同図において用例検索システムは、主として入力手段と
してのキーワード入力部10と、検索部11と、検索結
果出力部12と、データ記憶手段としてのテキストデー
タベースI3とから構成される。キーワード入力部10
は検索のための構造化キーワードの単語数や各単!吾の
文法素性等を人力する。検索部11は与えられた構造化
キーワードをCI L (Complex  Inde
terminateLanguage:人工知能的分野
の問題に適する関数形ブ[2グラミング言語“prol
og”の拡張言語)の部分項リストに変換し、テキスト
データベース13の検索を行う。検索結果出力部+2は
検索して得られる用例を、ユーザーが指定する出力モー
ドに従ってKwtc杉式で表示する。テキストデータベ
ース13は検索部11によって検索される対象となるテ
キスト(付加情報付き)が格納されているデータベース
である。なおI4はファイル部、15はプリンタ出力部
を示す。
以下に上記した各部の詳細について説明する。
テキストデータベース (a)素性集合として表現される単語 テキストデータベース13は検索部IIによって検索さ
れる対象となるテキストが格納されているデータベース
である。前述したこの発明の特徴を実現するためには、
データベースに原文の文字づらだけの情報だけでなく、
“品詞、品詞細分類、活用情報、意味情報”などを付加
しておく必要がある。そのほか“単語の切れ目、出典、
文番号”等の情報も必要である。このような情報を簡便
に記述するために本システムではテキストデータの各単
語を“素性名/素性値゛対の集合としてとらえ、各種文
法情報の集合として1個の単語を表現している。これは
文法範噴を素性集合としてとらえる単一化文法理論の枠
組みに基づいている。モして各文の情報は、その集合の
リストとして表現される。各単語を構成する文法素性は
その単語の品詞によって異なる。
(b)品詞分類 表Iに本システムで採用している品詞分類と、各品詞が
持つ分類素性を示す。
(以下余白) 表1 品詞分類と素性 表1かられかるように、 14種類の品詞を導入 している。この品詞分類は、一般的な学校文法に亭拠し
ている。ただし、最後の“補助側“は一般に補助動お1
、補助形容詞などと呼ばれているものの総称である。こ
れらの各品詞に対して現在8種類の文法素性を割り当て
ている。ただし、各品詞が8個4°べての素性値を持つ
のではなく、表1中の“O”印の付いた素性のみを持つ
。各文法素性の役割と値は次のとおりである。
品詞:I4[!lの品詞名のいずれか。
表記二その単語が文中で実際に使用されている表記(出
現形)。
見出し:活用語の終止形。複数表記のある場合代表形。
表記と同一の場合が多い。
種類:品詞によって異なる値を持つ。名詞の場合は“清
適名詞、す変名詞、数詞、固有名詞、形式名詞“のいず
れか。接頭語および接尾語の場合は、それが接続する語
によって“一般、数詞“のいずれか。助詞の場合は“格
助詞、終助詞、副助詞、並立助!111、接続助詞、係
助詞、鵡体助詞”のいずれか。
活用型:“五段、−段、力変、す変、行く、ある、なさ
る”のいずれか。
活用行二五段活用の動詞のみに付加する。
活用形:“未然、連用、終止、連体、仮定、命令′のい
ずれか。
意味:第2図に示す本システム用シソーラスの中の概念
名を要素とするリスト。複数の値を取り得るのでリスト
にする。
(e)文情報の実装 テキストデータベースのそれぞれの文は次のような形式
を持っCILの1個のユニットクローズとして表現され
ている。
5entence  (出典、文番号、文情報リスト)
“文情報リスト”は、各単語を素性集合として表現した
もの(CILの部分項)を要素とするリストである。素
性集・合をCILの部分項として表現する理由は、部分
項はフレームのようなデータ構造を表現しやすく、CI
Lの拡張ユニフィケーションが使用できるからである。
この形式を用いることにより、例えば“自然を守る“と
いう出典の13番口の文”森という環境を例にとってみ
よう”は第3図のように表現される。
キーワード入力部 キーワード入力部IOは、検索のための構造化キーワー
ドの人力を行うためのものであり、通常キーボードまた
はマウスによって構成され、構造化キーワードの単語数
や各単語の文法素性を入力する。
(a)構造化キーワード 検索のための構造化キーワードは次のように定義される
定義1:構造化キーワードは、語棄情報を要素とする順
序付リストである。
定義2:語曇情報とは語鴬範噴(単語)を定義するため
の文法素性の部分集合である。ただし文法素性は“素性
名/T、性値”対として表現される。
このような構造化キーワードを導入することにより、表
記あるいは品詞のみをキーワードとしていた従来のKW
fGでは行えなかった柔軟な検索が可能になる。次に構
造化キーワードの例を示す。
例1:[(品iA/名詞、種類/普通名詞、意味/抽象
概念ン、(品詞/助詞、見出し/を)]例2:[(品詞
/副詞)、*、(品rA/動詞、活用型/五段、活用形
/連用)] 例1は抽象概念という意味素性を持つ普通名詞の次に助
詞“を”が用いられている用例を検索するための構造化
キーワードである。例2はワイルドカード“*“を用い
た例であり、ある副詞の後方に五段活用の動詞の連用形
が現れる用例を検索するための構造化キーワードである
。“*”は複数の単語列を表し、その部分では何でもよ
いという意味になる。したがって例えば“東京*“とす
ると、東京都、東京本社、東京都千代田区など“東京“
で始まる文字すべてが当てはまることになる。
(b)構造化キーワード入力手順 +1tlf+化キーワードは次ぎの順序すなわち(1)
出典(2)品詞(3)表記・見出しく4)種類(5)活
用形・活用行・活用形(6)意味の順序で入力される。
素性値は、“表記・見出し“については直接入力するが
、他の素性は専用のウィンドウ表示においてメニュー選
択方式により行う。(4)〜(6)の素性は品詞の値に
より不要な入力要求を出さないようにしている。第4図
はこのような構造化キーワード入力中の画面の例を示し
、4a〜4eはそれぞれウィンドウ表示を示す。
検索部 検索部11はCPLI(中央処理装置)から構成され、
人力された構造化キーワードをパターンマツチング可能
な部分項に変換し、テキストデータベースI3への検索
を行う。そして検索結果を蓄えておく。
検索結果出力部 検索結果出力部12は、検索した用例をユーザーが指定
するモードに従ってKWfC形式で表示する。そしてユ
ーザーは次のようなモード指定を行うことができる。
(1)表示する文法素性(デフォルトは表記のみ)(2
)ソートするか否か(昇順、降順、出現順)(3)ソー
トの優先順位(どのキーワードのどの素性か) (4)検索結果の出力光(CFt’r、ファイル、エデ
ィタのバッファ) (5)詳細文法素性表示指定(特定検索文の詳細情報表
示) 第5図は構造化キーワード人力手順にて説明した構造化
キーワードによって、検索を実行した結果の例である。
この画面において上下左右方向のスクロールを行わせる
ことが可能である。
なお、この実施例におけるテキストデータベース!3は
、現在マニュアル操作によって形態素情報を付加してい
るが、既に試作されているICO′VのDLIALSの
ように、表記のみの文章に、形態素解析、構文解析、意
味解析等により自動的に種々の言語情報を付加するシス
テムによって構成されるテキストデータベースを用いて
もよい。したがって当然のことながらこの種のシステム
により生成される用例文章データベースもこの実施例に
おけるテキストデータベースI3に含まれる。
(以下余白) 次にこの実施例の動作を第6図〜第12図に示すフロー
チう・−トに従って説明する。
第6図は用例検索における全体の動作を示す図である。
同図においてキーワード入力部lOより構造化キーワー
ドの単語数Nを入力すると(ステップ20)、処理終了
が指定されたかどうかを判断しくステップ21)、処理
終了が指定されていなければキーワード入力部IOから
の構造化キーワードにの人力を受け(ステップ22)、
次いで検索部Ilは、テキストデータベース13に対し
て構造化キーワードKに該当する情報の検索を行う(ス
テップ23)。そして検索が終了すると、検索結果は検
索結果出力部12に転送され、検索結果出力部12は転
送された検索結果を、設定された出カモ−1・に従って
画面上に表示する(ステップ24)。なお、ステップ2
1において処理終了が指定されると、検索した情報の解
除、ウィンドウのクローズ等の終了時の処理を行い(ス
テップ25)、用例検索処理を終了1°る。
次に上記した各処理の詳細フローを説明する。
構造化キーワード人力処理 第7図および第8図に、ステップ22に示す“構造化キ
ーワード人力”の詳細な処理を示す。第7図において、
まず、ステップ20において入力した単語数Nだけ単語
を人力したかどうかを判断しくステップ3α)、Noの
場合は単語を続けて人力しくステップ3I)、次いで単
語数Nだけ入力したかを判断4−る(ステップ32)。
ここでNoの場合ワイルドカード指定の有無を人力しく
ステップ33)ステップ31に戻る。ただしワイルドカ
ードの指定の人力は単語数Nにはカウントされない。ス
テップ3oおよびステップ32においてYesの場合は
、キーワードの他の候補ずなわら新たなキーワードを入
力するかどうか判断しくステップ34)、Yesの場合
はステップ30に戻り、Noの場合は検索処理(ステッ
プ23)に移る。
第8図はステップ31に示す“単語人力″処理の詳細を
示している。まず品詞の入力を行い(ステップ40)、
次いで単語の表記・見出しの入力を行い(ステップ41
)、次いで文法素性すなわち入力した品詞の種類、活用
型、活用行、活用形、意味を人力4゛る(ステップ42
)。ただし素性値は人ツノした品詞の種類によって異な
る。これらの入力は、画面上に表示される人力指示ガイ
ダンスに従って人力され、品詞および文法素性が入力さ
れると、人力した情報は編集され、単語が画面に表示さ
れる(ステップ43)。次いで単語の他の候補を入力す
るかどうかを判断しくステップ44)、Yesの場合は
ステップ40に戻り、Noの場合はステップ32に移る
検索処理 第9図において、ステップ23にて示した“検索”処理
の詳細を示す。まず検索は検索対象と゛なる1文′■゛
の取込みを行い(ステップ50)、対象となる文が汀れ
ば(ステップ51)その1文中に含まれる単語数Mを抽
出しくステップ52)、次に文′rに関する単語ポイン
タ’1’ iを1にセットしくステップ53)、キーワ
ードKに関する単語ポインタKjを目こセットする(ス
テップ54)。次いでマツチング情報エリアをクリアし
くステップ55)、キーワ−ドに関する単語ポインタの
値が、構造化キーワードの単語数N以下であるかどうか
を判断しくステップ56)、Yesの場合は次いで文に
関する単語ポインタの値が、文に含まれる単語数M以下
であるかどうかを判断しくステップ57)、Yesであ
れば、ここで文Tにおける単語ポインタによって指示さ
れる要素と、キーワードKにおける単語ポインタによっ
て指示される要素とが一致すれば(ステップ58)、文
に関する単語ポインタの値iとキーワードに関する単語
ポインタの値jとを記憶(save)する(ステップ5
9)。次に、引き続き検索を行うためiおよびjの値に
それぞれIを加算して(ステップ60)ステップ56に
戻る。ステップ58において要素が一致しなければ、キ
ーワード間にワイルドカードが設定されているかどうか
判断しくステップ61)、Yesの場合は文Tにおける
単語ポインタの値iのみをIJII算して(ステップ6
2)ステップ56に戻る。これはワイルドカードはキー
ワードとしてカウントしないためである。そしてステッ
プ56においてキーワードKにおける単語ポインタの値
jh<構造化キーワードの単語数Nを超えた際は、マツ
チングした情報を検索結果出力部I2の記憶エリアに記
憶させ(ステップ63)、さらに検索対象の文中に、キ
ーワードにと一致する要素が他に存在しないか検索する
ため、キーワードKにおける単語ポインタの値jを1に
セットさせて上記したステップ55〜62の処理を繰り
返す。
なお、マッヂング情報とは、文における単語ポインタi
の値と、キーワードにおける単語ポインタの値jと、出
典と、文番号等である。
検索結果出力 第1O図〜第12図に、ステップ24にて示した“検索
結果出力°処理の詳細を示す。
第10図において、“検索結果出力”は主として出力モ
ード設定(ステップ70)、ウィンドウ表示(ステップ
71)、コマンド入力(ステップ72)、出力処理終了
の指示の有無の判断(ステップ73)、そしてコマンド
実行(ステップ74)の順で処理される。第1t図に、
ステップ70にて示した“出力モード設定″処理を説明
する。まず出力する文法素性を指定し、どの範囲の情報
(表記、品詞分類等)まで必要かを指定する(ステップ
80)。次にセンタリング(第5図に示す一列に配置さ
れたキー“むしろ”および“らう”を示す)させるキー
を指定する(ステップ81)。次いでソートするか否か
の判断を行い(ステップ82)、Yesの場合はソート
方向が昇順であるかまたは降順かを指定する(ステップ
83)。次いでソートの対象となるキーの順序ケなわち
何番目のキーをソートの中心に設定するかを指定しくス
テップ84)、ソートの対象となるキーの文法素性を指
定する(ステップ85)。
この文法素性の指定は、例えばキーの出力を表記でなく
品詞分類によって表示したいときなどに指定される。上
記した処理により出力モードが設定される。
次に第12図に、ステップ71にて示した°ウィンドウ
表示”処理を説明する。まず出力モードにソートが設定
されているかどうかを判断しくステップ90)、Yes
の場合はソートを実行しくステップ91)、設定された
出力モードに従い、表示データを生成しくステップ92
)、生成結果を画面上に表示する(ステップ93)。上
記した処理によりウィンドウ表示が実行される。
次にこのような処理を行う用例検索方式において、構造
化キーワードの入力形態と出力としての詔曇抽出例とを
対比させて以下に示す。
なお説明を簡単にするためにテキストデータベース13
に記憶されている語灸を、“森という環境を例にとって
みよう“の−文だけであると仮定する。また抽出例は、
文の表記をもって出力するらのとする。
(1)形態素情報による抽出 キーワードが[(品詞/動詞)、(品詞/助詞)]のと
き、抽出例は“森という環境を例にとりてみよう”であ
る。この検索方式によれば、キーワード毎に定義を設定
できるとともに、品詞が動詞の場合はさらに動詞固有の
情報である活用型、活用行、活用形を定義でき、また品
詞が名詞であれば活用に関する情報は当然不要となり、
その代わりに名詞固有の情報である上位概念情報(シソ
ーラス)等を設定することができる。
(2)用言の活用情報による抽出 キーワードが[(品詞/動詞、活用型/五段)]のとき
、抽出例は“森という環境を例にとってみよう”、森と
いう環境を例にとってみよう”である。動詞、形容詞、
形容動詞など活用のある自立語を用言と呼ぶが、ここで
は活用のある助動詞も用言として扱う。用言は一般に未
然、連用、終止、連体、仮定、命令の6つの活用がある
。これを構造化キーワードの1つの要素として定義する
ことにより検索を行う。またこの検索方式によれば、構
造化キーワードにおいて、表記が“動<゛、活用形か“
連体形”と設定すると、連体形の°動く”と終止形の“
動く”とを区別することができ、連体形の“動く”に関
連した用例のみを検索することができる。
(3)意味情報による抽出 キーワードが[(意味/抽象概念)]のとき、抽出例は
“森という環境を例にとってみよう“である。
この検索方式によれば、構造化キーワードにおいて意味
を動物とし[(動物)が走る]を設定すると、(動物)
の下位概念をまとめて検索することができる。また、[
が走る]を設定すると多数の用例が検索されるが、[(
無生物)が走る]を設定することにより“汽車が走る”
などのように(生物)を除去した検索を行うことができ
る。
(4)助詞の種類tit報による抽出 キーワードが[【品rA/名詞)、(品詞/助詞、ll
l1格助詞)]のとき、抽出例は“森という環境を例に
とってみよう”、“森という環境を例にとってみよう”
である。この検索方式によれば、格助詞として使われる
゛と”と並列助詞として使われる“と“とを区別して検
索することができる。
(5)助詞の意味情報による抽出 ただしこの場合においては、データベースI3に記憶さ
れている語愈は次ぎの2例と仮定する。
l!A11[風()、で(品詞/助詞、見出し/で1表
記/で、fX類/格助詞、意味/[原因コ)、会社()
を()、休む()] 例2 [紙()、を()、鋏()、で(品詞/助詞、見
出し/で1表記/で1種類/格助詞、意味/[道具〕)
、切る()〕である。なお、()内の情報は省略する。
キーワードが[(品詞/名詞)、(品詞/助詞、意味/
道具)]のとき、抽出例は“紙を鋏で切る“である。
助詞の意味は助詞毎に何種類かあるが、格助詞“で“に
関して意味を分類した例を示すと、学校で勉強する(場
所)、車で荷物を運ぶ(手段、方法)、金づちで釘を打
つ(道具)、風で休む(原因)、粉でパンを作る(材料
)、三日で完了する(@囲、程度)、小声で話す(様t
s)、会社で雇う(主体)などに分類される。したがっ
てこの検索方式によれば、表記が同じ助詞(なおかつ種
類の同じ助詞であってら)を、その使われる役割(この
実施例では意味という)によって区別して検索すること
ができる。
なお、ここに示したキーワードはあくまでも一例であり
、種々のバリエーションが存在する。
(へ)発明の効果 この発明によれば、キーワードに、検索対象を文法的に
制約する情報を付加した定義付きキーワードによってデ
ータ記憶手段の検索を行うので、自然言語研究のための
多様なデータの抽出および解析を効率良(行うことがで
きる。
【図面の簡単な説明】
m1図はこの発明に係る用例検索システムの構成図、第
2図は実施例の用例検索処理で用いられるシソーラスの
説明図、第3図は実施例のテキストデータベースに記憶
される文情報例を示す説明図、第4図は実施例の構造化
キーワード入力状態を示す説明図、第5図は実施例の検
索結果を示す説明図、第6図〜第12図はこの実施例の
動作を示すフローヂャートである。 IO・・・・・・キーワード入力部、 It・・・・・・検索部、 12・・・・・・検索結果出力部、 13・・・・・・テキストデータベース。 第5図 第8図

Claims (1)

  1. 【特許請求の範囲】 1、用例が、その用例を構成する単語毎に品詞分類、表
    記、品詞種類、活用型、意味等の文法情報に分類されて
    多数格納されており、かつその各用例に所望により出典
    、文番号等が付されてなるテキストデータベースと、 所定の順序によって少なくとも1以上の文法情報を指定
    するとともに、文法情報が指定された際に、該文法情報
    を編集することにより定義付きキーワードの作成を行う
    キーワード入力部と、キーワード入力部から入力される
    定義付きキーワードを整合可能な部分項に変換し、変換
    した部分項とテキストデータベースの文情報との整合を
    とることにより、定義付きキーワードに該当する用例を
    検索する検索部と、 検索された用例をKWIC形式にて出力する検索結果出
    力部とから構成されることを特徴とする用例検索システ
    ム。 2、請求項1記載の用例検索システムにおいて、キーワ
    ード入力部が、少なくとも1以上の品詞の指定によって
    、または1以上の品詞の指定と指定した各品詞固有に備
    わる活用形等の情報の指定とによって定義付きキーワー
    ドの作成を行うことを特徴とする請求項1記載の用例検
    索システム。 3、請求項2記載の用例検索システムにおいて、キーワ
    ード入力部が、品詞の指定と、指定した品詞が活用を伴
    う用言である際に用言の活用に関する情報を指定するこ
    とにより、定義付きキーワードの作成を行うことを特徴
    とする請求項2記載の用例検索システム。 4、請求項2記載の用例検索システムにおいて、テキス
    トデータベースが、名詞の概念相互を上位/下位関係で
    結び体系をなすシソーラスからなる意味情報を有し、キ
    ーワード入力部が、少なくとら1以上の名詞の概念の指
    定により定義付きキーワードを作成し、検索部が、定義
    付きキーワードに基づき概念で結ばれた用例を検索する
    ことを特徴とする請求項2記載の用例検索システム。 5、請求項2記載の用例検索システムにおいて、キーワ
    ード入力部が、助詞の指定と、指定した助詞の種類を指
    定することにより、定義付きキーワードの作成を行うこ
    とを特徴とする請求項2記載の用例検索システム。 6、請求項2記載の用例検索システムにおいて、キーワ
    ード入力部が、助詞の指定と、指定した助詞の意味情報
    とを指定することにより定義付きキーワードの作成を行
    うことを特徴とする請求項2記載の用例検索システム。
JP1010158A 1989-01-19 1989-01-19 用例検索システム Pending JPH02190972A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1010158A JPH02190972A (ja) 1989-01-19 1989-01-19 用例検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1010158A JPH02190972A (ja) 1989-01-19 1989-01-19 用例検索システム

Publications (1)

Publication Number Publication Date
JPH02190972A true JPH02190972A (ja) 1990-07-26

Family

ID=11742474

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1010158A Pending JPH02190972A (ja) 1989-01-19 1989-01-19 用例検索システム

Country Status (1)

Country Link
JP (1) JPH02190972A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108721A (ja) * 1991-10-16 1993-04-30 Agency Of Ind Science & Technol 検索キーワード作成装置
JPH0962681A (ja) * 1995-06-13 1997-03-07 Sharp Corp 会話文翻訳装置
JP2007200321A (ja) * 2006-01-27 2007-08-09 Xerox Corp 言語ユーザインターフェース
JP2008140204A (ja) * 2006-12-04 2008-06-19 Toshiba Corp データ検索システム及びプログラム
JP2014142780A (ja) * 2013-01-23 2014-08-07 Ntt Data Corp 用例検索装置、用例検索方法、および用例検索プログラム
JP2016091269A (ja) * 2014-11-04 2016-05-23 株式会社東芝 外国語文作成支援装置、方法及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05108721A (ja) * 1991-10-16 1993-04-30 Agency Of Ind Science & Technol 検索キーワード作成装置
JPH0962681A (ja) * 1995-06-13 1997-03-07 Sharp Corp 会話文翻訳装置
JP2007200321A (ja) * 2006-01-27 2007-08-09 Xerox Corp 言語ユーザインターフェース
JP2008140204A (ja) * 2006-12-04 2008-06-19 Toshiba Corp データ検索システム及びプログラム
JP2014142780A (ja) * 2013-01-23 2014-08-07 Ntt Data Corp 用例検索装置、用例検索方法、および用例検索プログラム
JP2016091269A (ja) * 2014-11-04 2016-05-23 株式会社東芝 外国語文作成支援装置、方法及びプログラム
US10394961B2 (en) 2014-11-04 2019-08-27 Kabushiki Kaisha Toshiba Foreign language sentence creation support apparatus, method, and program

Similar Documents

Publication Publication Date Title
US6760695B1 (en) Automated natural language processing
US5528491A (en) Apparatus and method for automated natural language translation
US6278967B1 (en) Automated system for generating natural language translations that are domain-specific, grammar rule-based, and/or based on part-of-speech analysis
US5321608A (en) Method and system for processing natural language
Vasyl et al. Application of sentence parsing for determining keywords in Ukrainian texts
JPH02159674A (ja) 意味解析装置と構文解析装置
WO2005033909A2 (en) Relationship analysis system and method for semantic disambiguation of natural language
JP2004513458A (ja) ユーザが変更可能な翻訳のウエイト
JP3680865B2 (ja) 自動自然言語翻訳
CN117010363A (zh) 一种基于文本挖掘的技术标准智能辨识方法
JP2609173B2 (ja) 用例主導型機械翻訳方法
CN112487801A (zh) 一种面向安全关键软件的术语推荐方法及系统
JPH02190972A (ja) 用例検索システム
Alexa et al. Commonalities, differences and limitations of text analysis Software: The results of a review
Hicks et al. Content analysis
Amri et al. Amazigh part-of-speech tagging using markov models and decision trees
Kutlu et al. Noun phrase chunking for turkish using a dependency parser
Jagtman et al. Report-COMOLA: a computer system for the analysis of interlanguage data
JPH0561902A (ja) 機械翻訳システム
JP3680489B2 (ja) 機械翻訳装置および機械翻訳処理プログラムを記録したコンピュータ読み取り可能な記録媒体
Nijholt Linguistic engineering: a survey
JP3743711B2 (ja) 自動自然言語翻訳システム
JP2002297592A (ja) 自然文マッチング装置、自然文マッチング方法、及び自然文マッチングプログラム
Al-Johar A portable natural language interface from Arabic to SQL.
JPH0793345A (ja) 文書検索装置