JPH05290081A - Device for generating dictionary and device for analysing language - Google Patents
Device for generating dictionary and device for analysing languageInfo
- Publication number
- JPH05290081A JPH05290081A JP4118193A JP11819392A JPH05290081A JP H05290081 A JPH05290081 A JP H05290081A JP 4118193 A JP4118193 A JP 4118193A JP 11819392 A JP11819392 A JP 11819392A JP H05290081 A JPH05290081 A JP H05290081A
- Authority
- JP
- Japan
- Prior art keywords
- dictionary
- usage
- speech
- word
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
Abstract
(57)【要約】
【目的】 分野に応じた品詞と、該品詞の使用度を設定
する。
【構成】 入力部1は対象分野の語毎の品詞の使用度を
入力し、源辞書2は語毎に一般的に用いられる品詞とそ
の使用度を記憶している。使用度表3は、前記入力部1
により入力された使用度を記憶する。辞書作成部4によ
り辞書情報を作成し、該辞書作成部4により作成された
辞書情報を出力部5により出力する。辞書作成部4は、
源辞書内の語に関して、使用度表に現れる品詞の最少使
用度より小さい使用度を持つ品詞を削除することなどを
行う。
(57) [Summary] [Purpose] Set the part of speech according to the field and the degree of use of the part of speech. [Structure] The input unit 1 inputs the degree of use of a part of speech for each word in the target field, and the source dictionary 2 stores the part of speech generally used for each word and its degree of use. The usage table 3 is the input section 1
The usage level input by is stored. The dictionary creation unit 4 creates dictionary information, and the output unit 5 outputs the dictionary information created by the dictionary creation unit 4. The dictionary creation unit 4
For words in the source dictionary, the part of speech having a usage less than the minimum usage of the part of speech that appears in the usage table is deleted.
Description
【0001】[0001]
【技術分野】本発明は、辞書作成装置及び言語解析装置
に関する。TECHNICAL FIELD The present invention relates to a dictionary creation device and a language analysis device.
【0002】[0002]
【従来技術】自然言語の解析システム等では、語に関す
る情報を記憶した辞書を用いる。この辞書には、品詞に
関する情報が含まれることが多い。また、1つの語に対
して、複数の品詞が対応する場合がある。このような語
を多品詞語と呼ぶ。解析システムでは、多品詞語におけ
る品詞の曖昧さを解消して、正しい品詞を選択すること
が必要となる(品詞多義解消)。この品詞多義解消のた
めに、よく使用される情報として、品詞の使用度があ
る。すなわち、品詞の使用度とは、語がどれくらいその
品詞として使用されやすいかを表わすものである。一般
に、語の品度使用度は、語が属する文章分野によって異
なる。したがって、分野に応じて品詞と品詞の使用度を
設定しなければ正しく品詞多義解消ができないという問
題がある。2. Description of the Related Art A natural language analysis system or the like uses a dictionary that stores information about words. This dictionary often contains information about parts of speech. Also, a plurality of parts of speech may correspond to one word. Such a word is called a multi-part-of-speech word. In the analysis system, it is necessary to resolve the ambiguity of the part-of-speech in the multi-part-of-speech word and select the correct part-of-speech (part-of-speech disambiguation). A frequently used piece of information for eliminating this part of speech polysemy is the degree of part-of-speech usage. That is, the degree of use of a part of speech indicates how easily a word is used as the part of speech. Generally, the degree of use of a word depends on the text field to which the word belongs. Therefore, there is a problem that the part-of-speech disambiguation cannot be correctly resolved unless the part-of-speech and the degree of use of the part-of-speech are set according to the field.
【0003】これらの問題を解決するために、例えば、
特開昭63−37474号公報に「辞書検索方式」が提
案されている。この公報のものは処理するテキストにつ
いて、文書ごとに対象分野と文の種類の情報を蓄積し、
辞書検索時に蓄積情報を利用するものである。また、特
開平1−251160号公報に提案されている「文書処
理装置」は、基本語を登録する基本辞書と、該基本語と
各分野の用語とを分野別に登録する複数の分野別辞書
と、該分野別辞書に登録された用語を合成して登録する
カレント辞書を有するものである。しかしながら、これ
らのものは、分野ごとに辞書を用意すると、それらの共
通部分に関して、種々の辞書調整や管理が重複し、その
作業のコストが増大するという問題点がある。In order to solve these problems, for example,
A "dictionary search system" is proposed in Japanese Patent Laid-Open No. 63-37474. The document in this publication accumulates information about the target field and the type of sentence for each text to be processed,
The stored information is used when searching the dictionary. The "document processing device" proposed in Japanese Patent Application Laid-Open No. 1-251160 includes a basic dictionary for registering basic words, and a plurality of field-specific dictionaries for registering the basic words and terms in each field by field. , Has a current dictionary for combining and registering terms registered in the field-specific dictionary. However, these methods have a problem in that when a dictionary is prepared for each field, various dictionary adjustments and managements are duplicated with respect to their common parts, and the cost of the work increases.
【0004】また、特開昭63−236168号公報に
提案されている「機械翻訳辞書アクセス方式」は、多段
構成の辞書をアクセスする時に、該複数の辞書を優先順
位の高いものから順次アクセスし、複数の辞書に同一デ
ータが存在する場合は優先順位の高い辞書のものを取り
込み、異なるデータについては各辞書のデータを取り込
むものである。しかしながら、優先順が辞書単位にしか
行えず、語毎の細かな優先度の指定ができないという問
題点があった。The "machine translation dictionary access method" proposed in Japanese Patent Laid-Open No. 63-236168, when accessing a multi-stage dictionary, sequentially accesses the plurality of dictionaries in descending order of priority. When the same data exists in a plurality of dictionaries, the one with the higher priority is taken in, and the different data is taken in from each dictionary. However, there is a problem that the order of priority can be performed only in dictionary units, and detailed priority for each word cannot be specified.
【0005】[0005]
【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、分野に応じた品詞と、該品詞の使用度を設定す
るようにした辞書作成装置及び該辞書作成装置によって
作成された辞書を用いた言語解析装置を提供することを
目的としてなされたものである。[Object] The present invention has been made in view of the above situation, and a dictionary creation device and a dictionary created by the dictionary creation device configured to set a part of speech corresponding to a field and a degree of use of the part of speech. It was made for the purpose of providing a language analysis device using.
【0006】[0006]
【構成】本発明は、上記目的を達成するために、(1)
語毎に一般的に用いられる品詞とその使用度を記憶して
いる源辞書と、対象分野の語毎の品詞の使用度を入力す
る入力部と、該入力部により入力された使用度を記憶す
る使用度表と、辞書情報を作成する辞書作成部と、該辞
書作成部により作成された辞書情報を出力する出力部と
を有し、前記辞書作成部は、前記源辞書内の語に関し
て、前記使用度表に現れる品詞の最少使用度より小さい
使用度を持つ品詞を削除すること、或いは、(2)語毎
に一般的に用いられる品詞とその使用度を記憶している
源辞書と、対象分野の語毎の品詞の使用度を入力する入
力部と、該入力部により入力された使用度を記憶する使
用度表と、辞書情報を作成する辞書作成部と、該辞書作
成部により作成された辞書情報を出力する出力部とを有
し、前記辞書作成部は、前記源辞書内の語に関して、あ
る一定の使用度以下で、かつ使用度表に現れない品詞を
削除すること、或いは、(3)語毎に一般的に用いられ
る品詞とその使用度を記憶している源辞書と、対象分野
の語毎の品詞の使用度を入力する入力部と、該入力部に
より入力された使用度を記憶する使用度表と、辞書情報
を作成する辞書作成部と、該辞書作成部により作成され
た辞書情報を出力する出力部とを有し、前記辞書作成部
は、前記源辞書内の語に関して、前記源辞書の使用度と
使用度表の使用度から新しい使用度を設定すること、或
いは、(4)文を入力するための入力部と、結果を出力
するための出力部と、入力文の品詞列を選択する品詞選
択部を少なくとも備え、該品詞選択部では前記(1),
(2)又は(3)記載の辞書作成装置によって作成され
た辞書を用いることを特徴としたものである。以下、本
発明の実施例に基づいて説明する。In order to achieve the above object, the present invention provides (1)
A source dictionary that stores a part-of-speech generally used for each word and its usage, an input unit that inputs the usage of the part-of-speech for each word in the target field, and the usage that is input by the input unit are stored A usage table, a dictionary creating unit that creates dictionary information, and an output unit that outputs the dictionary information created by the dictionary creating unit, and the dictionary creating unit, regarding the words in the source dictionary, Deleting a part-of-speech having a degree of use smaller than the minimum degree of use of the part-of-speech appearing in the degree-of-use table, or (2) a source dictionary storing a part-of-speech generally used for each word and its degree of use; An input unit for inputting the degree of use of a part of speech for each word in the target field, a use degree table for storing the degree of use input by the input unit, a dictionary creating unit for creating dictionary information, and a dictionary creating unit for creating the dictionary information. An output unit that outputs the created dictionary information, and the dictionary creation unit For words in the source dictionary, delete parts of speech that are below a certain degree of usage and do not appear in the usage table, or (3) store commonly used parts of speech for each word and their usage A source dictionary, an input unit for inputting the degree of use of the part of speech for each word in the target field, a use table for storing the use degree input by the input unit, and a dictionary creating unit for creating dictionary information. And an output unit that outputs the dictionary information created by the dictionary creation unit, the dictionary creation unit having a new value for a word in the source dictionary based on the usage of the source dictionary and the usage of the usage table. Setting at least the degree of use, or (4) at least an input unit for inputting a sentence, an output unit for outputting a result, and a part-of-speech selecting unit for selecting a part-of-speech sequence of the input sentence In part, the above (1),
It is characterized by using a dictionary created by the dictionary creating device described in (2) or (3). Hereinafter, description will be given based on examples of the present invention.
【0007】図1は、本発明による辞書作成装置の一実
施例を説明するための構成図で、図中、1は入力部、2
は源辞書、3は使用度表、4は辞書作成部、5は出力部
である。入力部1は対象分野の語毎の品詞の使用度を入
力し、源辞書2は語毎に一般的に用いられる品詞とその
使用度を記憶している。使用度表3は、前記入力部1に
より入力された使用度を記憶する。辞書作成部4により
辞書情報を作成し、該辞書作成部4により作成された辞
書情報を出力部5により出力する。FIG. 1 is a block diagram for explaining an embodiment of a dictionary creating apparatus according to the present invention, in which 1 is an input unit and 2 is
Is a source dictionary, 3 is a usage table, 4 is a dictionary creating unit, and 5 is an output unit. The input unit 1 inputs the degree of use of the part of speech for each word in the target field, and the source dictionary 2 stores the part of speech generally used for each word and the degree of use thereof. The usage table 3 stores the usage levels input by the input unit 1. The dictionary creation unit 4 creates dictionary information, and the output unit 5 outputs the dictionary information created by the dictionary creation unit 4.
【0008】前記辞書作成部4は以下の3つの動作を行
う。 源辞書内の語に関して、使用度表に現れる品詞の最少
使用度より小さい使用度を持つ品詞を削除すること。 源辞書内の語に関して、ある一定の使用度以下で、か
つ使用度表に現れない品詞を削除すること。 源辞書内の語に関して、源辞書の使用度と使用度表の
使用度から新しい使用度を設定すること。The dictionary creating section 4 performs the following three operations. For words in the source dictionary, delete the part of speech that has a usage less than the minimum usage of the part of speech that appears in the usage table. For words in the source dictionary, delete parts of speech that are below a certain degree of usage and do not appear in the usage table. To set a new usage for a word in the source dictionary from the usage of the source dictionary and the usage of the usage table.
【0009】品詞とは、語の分類名である。例えば、名
詞や動詞等がある。一方、品詞の使用度とは、品詞の使
用しやすさを表わす順序尺度であり、大きいほど使用し
やすいことを表す。ここでは、使用度の例として、使用
率、すなわち、語が使用された回数Mと語が品詞Xとし
て使用された回数NよりN/Mによって定義される0〜
1の確率値を考える。図2は、源辞書の記憶内容の例を
示す図である。同様の構造を持つ情報が辞書作成部によ
り作成され、出力部から出力されるものとする。図3
は、使用度表の記憶内容の例を示す図である。同様の構
造をもつ情報が入力部より入力され、この図のように記
憶されるものとする。The part of speech is a classification name of a word. For example, there are nouns and verbs. On the other hand, the degree of use of a part of speech is an ordinal scale indicating the ease of use of the part of speech, and the larger the degree of use, the easier the use. Here, as an example of the degree of use, the use rate, that is, the number M of times a word is used and the number N of times a word is used as a part of speech X are defined by N / M.
Consider a probability value of 1. FIG. 2 is a diagram showing an example of the stored contents of the source dictionary. Information having the same structure is created by the dictionary creating unit and output from the output unit. Figure 3
FIG. 6 is a diagram showing an example of stored contents of a usage table. Information having a similar structure is input from the input unit and stored as shown in this figure.
【0010】図4は、請求項1の実施例(実施例1)の
動作を示すフローチャートである。以下、各ステップに
従って順に説明する。step1 :まず、源辞書から語を取り出す。step2 :次に、バッファをクリアする。step3 :語の語形、品詞、使用度Xを取り出す。step4 :使用度表で語形と品詞の組を検索する。step5 :語形と品詞の組があるかどうかを判断する。語
形と品詞の組が存在すれば、次のstep6に行く。存在し
なければ、後述するstep7へ行く。step6 :前記step5において、語形と品詞の組が存在す
れば、使用度Xをバッファに追加する。FIG. 4 is a flow chart showing the operation of the embodiment (embodiment 1) of claim 1. Hereinafter, each step will be described in order. step1 : First, take out a word from the source dictionary. step2 : Next, the buffer is cleared. step3 : Extract the word form, part of speech, and usage X. step4 : Search the combination of word form and part of speech in the usage table. step5 : Determine whether there is a combination of word form and part of speech. If there is a combination of word form and part of speech, go to the next step6. If it does not exist, go to step 7 described later. Step 6 : If there is a combination of the word form and the part of speech in Step 5 , the usage X is added to the buffer.
【0011】step7:最後の語形、品詞、使用度Xであ
るかどうかを判断する。NOであれば前記step3へ行
く。step8 :前記step7において、YESであればバッファ
内の最小値Minを取り出す。step9 :語の語形、品詞、使用度Xを取り出す。step10 :Min>使用度Xならば、語形、品詞、使用
度Xの組を出力する。step11 :最後の語形、品詞、使用度Xであるかどうか
を判断する。NOであれば、前記step9へ行く。step12 :前記step11において、YESであれば、今
度は最後の源であるかどうかを判断する。NOであれば
前記step1へ行く。YESであれば終了する。[0011] step7: the last word form, part of speech, it is determined whether the use of X. If NO, go to step 3 above. step8 : If YES at step 7, the minimum value Min in the buffer is taken out. step9 : Extract the word form, part of speech, and usage X. step10 : If Min> use level X, output a set of word form, part of speech, and use level X. step11 : It is judged whether it is the last word form, part of speech, or usage X. If NO, go to step 9. step12 : If YES in step 11, it is determined whether or not this is the last source. If NO, go to step 1 above. If YES, the process ends.
【0012】図5は、請求項2の実施例(実施例2)の
動作を示すフローチャートである。以下、各ステップに
従って順に説明する。step1 :まず、使用度の定数Minをセットする。step2 :次に、源語書から語を取り出す。step3 :語の語形、品詞、使用度Xを取り出す。step4 :使用度表で語形と品詞の組を検索する。step5 :語形と品詞の組が存在するかどうかを判断す
る。存在しなければ、後述するstep7へ行く。step6 :前記step5において、語形と品詞の組が存在す
れば、語形、品詞、使用度を出力し、後述するstep9へ
行く。step7 :前記step5において、語形と品詞の組が存在し
なければ、Min<Xを判断する。step8 :前記step7において、Min<Xであれば、語
形、品詞、使用度を出力する。step9 :最後の語形、品詞、使用度Xであるかどうかを
判断する。NOであれば、前記step3へ戻る。step10 :前記step9において、YESであれば、今度
は、最後の語であるかどうかを判断する。NOであれば
前記step2へ戻り、YESであれば終了する。FIG. 5 is a flow chart showing the operation of the second embodiment (second embodiment). Hereinafter, each step will be described in order. step1 : First, the usage constant Min is set. step2 : Next, take out a word from the original word book. step3 : Extract the word form, part of speech, and usage X. step4 : Search the combination of word form and part of speech in the usage table. step5 : It is judged whether or not there is a combination of word form and part of speech. If it does not exist, go to step 7 described later. Step 6 : If there is a combination of the word form and the part of speech in the step 5, the word form, the part of speech, and the degree of use are output, and the process proceeds to step 9 described later. Step7 : In the above Step5, if there is no pair of word form and part of speech, Min <X is judged. step8 : If Min <X in step 7, the word form, part of speech, and degree of use are output. step9 : It is judged whether it is the last word form, part of speech, or usage X. If NO, the process returns to step 3. step10 : If YES in step 9, it is determined whether or not this is the last word. If NO, the process returns to step 2, and if YES, the process ends.
【0013】図6は、請求項3の実施例(実施例3)の
動作を示すフローチャートである。以下、各ステップに
従って順に説明する。step1 :まず、源辞書から語を取り出す。step2 :次に、語の語形、品詞、使用度Xを取り出す。step3 :使用度表で語形と品詞の組をキーとして使用度
Yを検索する。step4 :使用度Yが存在するかどうかを判断する。存在
すれば、後述するstep6へ行く。step5 :前記step4において、使用度Yが存在しなけれ
ば、使用度Yとして定数Zをセットする。step6 :使用度Xと使用度Yとから新しい使用度Wを求
める。使用度Wを求める方法は種々のものが考えられる
が、例えば、次のような重みA,Bによる重みづけの方
法がある。W=A・X+B・Ystep7 :語形、品詞、使用度Wを出力する。step8 :最後の語形、品詞、使用度Xであるかを判断す
る。NOであれば前記step2へ戻る。step9 :前記step8において、YESであれば、今度は
最後の語であるかどうかを判断する。NOであれば前記
step1へ戻り、YESであれば終了する。FIG. 6 is a flowchart showing the operation of the third embodiment (third embodiment). Hereinafter, each step will be described in order. step1 : First, take out a word from the source dictionary. step2 : Next, the word form, the part of speech, and the usage X are extracted. step3 : Using the usage table, search for the usage Y using the combination of the word form and the part of speech as a key. step4 : It is judged whether the usage degree Y exists. If it exists, go to step 6 described later. step5 : If the usage Y does not exist in step 4, a constant Z is set as the usage Y. step6 : A new usage W is obtained from the usage X and the usage Y. There are various possible methods for obtaining the usage W, and for example, the following weighting method using weights A and B is available. W = A * X + B * Y step7 : Word form, part of speech, and usage W are output. step8 : Judge whether it is the last word form, part of speech, or usage X. If NO, the process returns to step 2. step9 : If YES in step 8, it is determined whether or not this is the last word. If NO, then
Return to step 1, and if YES, end.
【0014】図7は、本発明による言語解析装置の一実
施例を説明するための構成図で、図中、11は入力部、
12は出力部、13は辞書、14は品詞選択部である。
入力部11により文を入力し、出力部12により言語解
析結果を出力する。辞書13は、辞書作成装置により作
成された辞書である。品詞選択部14は入力文の品詞列
を選択し、前記実施例1〜3に示した辞書作成装置によ
って作成された辞書を用いて言語解析を行う。すなわ
ち、入力部11より、図8に示すような原文を入力し、
原文バッファの各語に関して辞書を検索し、次に、図9
に示すような品詞候補表を作成して記憶する。品詞候補
表中の各品詞候補の内、使用度が最大のものを1つだけ
選び、品詞選択結果を出力部12により出力する。FIG. 7 is a block diagram for explaining an embodiment of the language analyzing apparatus according to the present invention, in which 11 is an input unit,
Reference numeral 12 is an output unit, 13 is a dictionary, and 14 is a part-of-speech selection unit.
The input unit 11 inputs a sentence, and the output unit 12 outputs a language analysis result. The dictionary 13 is a dictionary created by the dictionary creating device. The part-of-speech selecting unit 14 selects a part-of-speech sequence of an input sentence, and performs language analysis using the dictionary created by the dictionary creating device described in the first to third embodiments. That is, an original sentence as shown in FIG.
The dictionary is searched for each word in the source text buffer, and then in FIG.
A part-of-speech candidate table as shown in is created and stored. Of the parts-of-speech candidates in the part-of-speech candidate table, only one with the highest degree of use is selected, and the output unit 12 outputs the result of selection.
【0015】[0015]
【効果】以上の説明から明らかなように、本発明による
と、以下のような効果がある。分野に応じて簡単に品詞
の使用度を調節できるので、作成した辞書を用いたシス
テムは、その分野に関して、正しく品詞多義解消をする
ことができる。As is apparent from the above description, the present invention has the following effects. Since the degree of use of the part-of-speech can be easily adjusted according to the field, the system using the created dictionary can correct the part-of-speech disambiguation correctly for the field.
【図1】 本発明による辞書作成装置の一実施例を説明
するための構成図である。FIG. 1 is a configuration diagram for explaining an embodiment of a dictionary creation device according to the present invention.
【図2】 本発明による源辞書の記憶内容の例を示す図
である。FIG. 2 is a diagram showing an example of stored contents of a source dictionary according to the present invention.
【図3】 本発明による使用度表の記憶内容の例を示す
図である。FIG. 3 is a diagram showing an example of stored contents of a usage table according to the present invention.
【図4】 本発明の実施例1の動作を説明するためのフ
ローチャートである。FIG. 4 is a flowchart for explaining the operation of the first exemplary embodiment of the present invention.
【図5】 本発明の実施例2のの動作を説明するための
フローチャートである。FIG. 5 is a flowchart for explaining the operation of the second embodiment of the present invention.
【図6】 本発明の実施例3の動作を説明するためのフ
ローチャートである。FIG. 6 is a flowchart for explaining the operation of the third embodiment of the present invention.
【図7】 本発明による言語解析装置の一実施例を説明
するための構成図である。FIG. 7 is a configuration diagram for explaining an embodiment of a language analysis device according to the present invention.
【図8】 本発明による原文の例を示す図である。FIG. 8 is a diagram showing an example of an original sentence according to the present invention.
【図9】 本発明による品詞候補表を示す図である。FIG. 9 is a diagram showing a part-of-speech candidate table according to the present invention.
【図10】 本発明による品詞選択結果を示す図であ
る。FIG. 10 is a diagram showing a part of speech selection result according to the present invention.
1…入力部、2…源辞書、3…使用度表、4…辞書作成
部、5…出力部。1 ... Input unit, 2 ... Source dictionary, 3 ... Usage table, 4 ... Dictionary creating unit, 5 ... Output unit.
Claims (4)
用度を記憶している源辞書と、対象分野の語毎の品詞の
使用度を入力する入力部と、該入力部により入力された
使用度を記憶する使用度表と、辞書情報を作成する辞書
作成部と、該辞書作成部により作成された辞書情報を出
力する出力部とを有し、前記辞書作成部は、前記源辞書
内の語に関して、前記使用度表に現れる品詞の最少使用
度より小さい使用度を持つ品詞を削除することを特徴と
する辞書作成装置。1. A source dictionary storing a part of speech generally used for each word and its usage, an input unit for inputting the usage of the part of speech for each word of a target field, and the input unit A usage table that stores the usage, a dictionary creation unit that creates dictionary information, and an output unit that outputs the dictionary information created by the dictionary creation unit, wherein the dictionary creation unit is the source dictionary. A dictionary creating device for deleting a part of speech having a usage degree smaller than the minimum usage degree of the part of speech that appears in the usage degree table with respect to the words in the dictionary.
用度を記憶している源辞書と、対象分野の語毎の品詞の
使用度を入力する入力部と、該入力部により入力された
使用度を記憶する使用度表と、辞書情報を作成する辞書
作成部と、該辞書作成部により作成された辞書情報を出
力する出力部とを有し、前記辞書作成部は、前記源辞書
内の語に関して、ある一定の使用度以下で、かつ使用度
表に現れない品詞を削除することを特徴とする辞書作成
装置。2. A source dictionary storing a part-of-speech generally used for each word and its usage, an input unit for inputting the usage of the part-of-speech for each word in a target field, and the input unit. A usage table that stores the usage, a dictionary creation unit that creates dictionary information, and an output unit that outputs the dictionary information created by the dictionary creation unit, wherein the dictionary creation unit is the source dictionary. A dictionary creating device for deleting a part-of-speech that is less than a certain level of usage and does not appear in the usage table for words in the.
用度を記憶している源辞書と、対象分野の語毎の品詞の
使用度を入力する入力部と、該入力部により入力された
使用度を記憶する使用度表と、辞書情報を作成する辞書
作成部と、該辞書作成部により作成された辞書情報を出
力する出力部とを有し、前記辞書作成部は、前記源辞書
内の語に関して、前記源辞書の使用度と使用度表の使用
度から新しい使用度を設定することを特徴とする辞書作
成装置。3. A source dictionary storing a part-of-speech generally used for each word and its usage, an input unit for inputting the usage of the part-of-speech for each word in a target field, and the input unit. A usage table that stores the usage, a dictionary creation unit that creates dictionary information, and an output unit that outputs the dictionary information created by the dictionary creation unit, wherein the dictionary creation unit is the source dictionary. A dictionary creating device for setting a new usage degree for the words in the above from the usage degree of the source dictionary and the usage degree of the usage table.
力するための出力部と、入力文の品詞列を選択する品詞
選択部を少なくとも備え、該品詞選択部では請求項1,
2又は3記載の辞書作成装置によって作成された辞書を
用いることを特徴とする言語解析装置。4. An input unit for inputting a sentence, an output unit for outputting a result, and a part-of-speech selecting unit for selecting a part-of-speech sequence of the input sentence.
A language analysis device using a dictionary created by the dictionary creation device according to item 2 or 3.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4118193A JPH05290081A (en) | 1992-04-10 | 1992-04-10 | Device for generating dictionary and device for analysing language |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP4118193A JPH05290081A (en) | 1992-04-10 | 1992-04-10 | Device for generating dictionary and device for analysing language |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH05290081A true JPH05290081A (en) | 1993-11-05 |
Family
ID=14730470
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP4118193A Pending JPH05290081A (en) | 1992-04-10 | 1992-04-10 | Device for generating dictionary and device for analysing language |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH05290081A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1998039711A1 (en) | 1997-03-04 | 1998-09-11 | Hiroshi Ishikura | Language analysis system and method |
-
1992
- 1992-04-10 JP JP4118193A patent/JPH05290081A/en active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1998039711A1 (en) | 1997-03-04 | 1998-09-11 | Hiroshi Ishikura | Language analysis system and method |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20030028566A1 (en) | Text comparison apparatus | |
| US7684975B2 (en) | Morphological analyzer, natural language processor, morphological analysis method and program | |
| JP2002007433A (en) | Information classification device, information classification method, computer-readable recording medium recording information classification program, and information classification program | |
| JPH09282331A (en) | Document similarity determination apparatus and document similarity determination method | |
| JPH1049543A (en) | Document search device | |
| JPH05290081A (en) | Device for generating dictionary and device for analysing language | |
| US20040054677A1 (en) | Method for processing text in a computer and a computer | |
| JPH06251076A (en) | Device and method for retrieving data base | |
| CN110083679B (en) | Search request processing method and device, electronic equipment and storage medium | |
| JPH10207896A (en) | Search term expansion method and apparatus and information search method and apparatus | |
| JP2002108888A (en) | Digital content keyword extraction apparatus and method, and computer-readable recording medium | |
| JP3744136B2 (en) | Translation device and storage medium | |
| JP2003288366A (en) | Similar text search device | |
| KR20160093922A (en) | Method for identifying patient personal information | |
| JPH05282360A (en) | Multilingual input device | |
| JPH10232871A (en) | Search device | |
| JPH04369763A (en) | Kana-kanji conversion device and method | |
| JP3369207B2 (en) | Kanji input device | |
| JP2840258B2 (en) | Method of creating bilingual dictionary and co-occurrence dictionary for machine translation system | |
| JP3036005B2 (en) | Kana-Kanji conversion device | |
| JPS6175952A (en) | Document input processing system | |
| JPS63278174A (en) | translation device | |
| JP2996823B2 (en) | Character recognition device | |
| JP3447127B2 (en) | Machine translation equipment | |
| JP2813207B2 (en) | Voice recognition device |