JPH01229367A - character processing device - Google Patents
character processing deviceInfo
- Publication number
- JPH01229367A JPH01229367A JP63056545A JP5654588A JPH01229367A JP H01229367 A JPH01229367 A JP H01229367A JP 63056545 A JP63056545 A JP 63056545A JP 5654588 A JP5654588 A JP 5654588A JP H01229367 A JPH01229367 A JP H01229367A
- Authority
- JP
- Japan
- Prior art keywords
- information
- word
- candidate
- dictionary
- homophone
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
Description
【発明の詳細な説明】
(産業上の利用分野)
本発明は、文字列の変換を行う文字処理装置における同
音語多義F−1]定方式に関するものである。DETAILED DESCRIPTION OF THE INVENTION (Field of Industrial Application) The present invention relates to a homophone polysemy F-1 definition method in a character processing device that converts character strings.
(従来の技術)
従来、文字列の変換を行なう文字処理装置として、例え
ば日本語ワードプロセッサにおけるカナ戊字変換装近が
広く普及している。カナ浅学変換の結果、多数現われる
同音語候補に対して、個々の単語の品詞の持つ文法的特
性などから同音語の多義解消が行なわれてきたが、単語
と単語が意味的に共起する同音語対の判定に対しては考
慮がなされていないため、誤変換となる場合か多かった
。そこで単語と単語との組、すなわち用例を格納した!
#語対辞書にある組み合わせを第一候補決定に利用する
ことなどが行なわれてきた。また、個々の単語対に限ら
ず、単語に意味的に範噴化した意味分類コードを与え、
個々のi語と意味コートとの共起情報をもって第一候補
決定に利用することなども行なわれてきた。(Prior Art) Conventionally, as a character processing device for converting character strings, for example, a kana-to-ji conversion device in a Japanese word processor has been widely used. As a result of Kana Asagaku conversion, the many homophone candidates that appear have been deambiguated based on the grammatical characteristics of the parts of speech of individual words. Since no consideration was given to determining word pairs, there were many cases of incorrect conversion. Therefore, we stored word-word pairs, that is, usage examples!
# Combinations in word pair dictionaries have been used to determine first candidates. In addition, not only individual word pairs but also words can be given a semantic classification code that is categorized semantically.
Co-occurrence information between individual i-words and meaning coats has also been used to determine the first candidate.
(発明か解決しようとしている問題点)しかしながら、
従来の技術においては、単語と単語が意味的に共起する
ために必要な結合条件(主として、単語間の係り受は関
係をつかさどる助詞の条件)を考慮していないために、
間違った用例の適用をしてしまうという問題があった。(The invention or the problem the problem is being solved) However,
Conventional techniques do not take into account the bonding conditions necessary for words to co-occur semantically (mainly, the dependency between words is the condition of the particle that governs the relationship).
There was a problem of applying the wrong example.
例えば、「料理−温かい」という用例が存在した場合に
、「りょうりをあたたかいへやにはこんだ。」という入
力読みに対して、実際には意味的共起関係がない「りょ
うりをあたたかい」の部分に用例が適用され、「料理が
温かい」となってしまう。正しくは「料理を暖かい部屋
に運んだ。」とならなければならない。For example, if there is an example of ``cooking - warm,'' and the input pronunciation is ``I put the rice bowl in the warm room.'', the sentence ``I put the rice bowl in the warm room.'' has no semantic co-occurrence relationship. The example is applied to the part, resulting in "the food is warm." The correct sentence should be "I brought the food to a warm room."
〔問題点を解決するための手段(及び作用)〕本発明の
目的は、上記従来例の欠点を除去することにある。[Means for Solving the Problems (and Effects)] An object of the present invention is to eliminate the drawbacks of the above-mentioned conventional examples.
すなわち、用例辞占中にJli語と単語が、意味的に共
起するために必要な結合条件を格納しておき、用例を通
用する際に、その結合条件を満たしているときのみ用例
を適用するようにし、結合条件を満たしていないときに
は用例を適用しない文字処理装置を提倶することである
。In other words, the combination conditions necessary for the semantic co-occurrence of Jli words and words are stored in the usage example dictionary, and when using the example, the example is applied only when the combination condition is satisfied. The object of the present invention is to provide a character processing device that does not apply the example when the combination condition is not satisfied.
その為に本発明は以下の手段を備える。To this end, the present invention includes the following means.
すなわち、変換対象の単語の読みを入力する入力手段、
単語の読みと表記とを対応させて格納した単語辞書、単
語どうしの共起対とその共起関係が成立する結合条件と
を格納した用例辞書と、読みを文節に解析する文節認定
手段と、解析された文節対につし)で成立する用例を検
索する用例検索手段と、用例が成立することを判定する
手段として結合条件の判定を行なう結合条件判定手段と
を備えることである。これによって、前述の例では、「
料理が温かい」という用例が存在する場合に、「りよう
りをあたたかい」は、結合条件rが1を満たしていない
ので、その部分に用例が適用されることはない。In other words, an input means for inputting the pronunciation of the word to be converted;
A word dictionary that stores word pronunciations and spellings in correspondence, a usage dictionary that stores co-occurrence pairs of words and combination conditions for establishing the co-occurrence relationship, and clause recognition means that analyzes the pronunciations into clauses; The present invention includes example retrieval means for searching for an example that holds true in the analyzed phrase pair, and combination condition determining means for determining a combination condition as a means for determining whether the example holds true. In the previous example, this would result in "
If there is an example such as ``The food is warm,'' and ``The food is warm,'' the connection condition r does not satisfy 1, so the example is not applied to that part.
また、F喧嘩に勝っ」とr喧嘩を買う」という用例が存
在する場合に、「けんかをかった」という入力に対して
は「喧嘩に勝った」に、「けんかをかった」という入力
に対しては「喧嘩を買った」と、正しく用例を通用し分
けることかできる。In addition, when there are examples such as "F won a fight" and "R bought a fight", the input "started a fight" will be changed to "won the fight" and the input "started a fight". In contrast, you can use the correct example to differentiate between the words, ``I bought a fight.''
以下、図面を参照して本発明の詳細な説明する。 Hereinafter, the present invention will be described in detail with reference to the drawings.
第1図は本発明の全体構成の一例である。FIG. 1 is an example of the overall configuration of the present invention.
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。In the illustrated configuration, the CPU is a microprocessor that performs calculations, logical judgments, etc. for character processing, and uses an address bus AB, a control bus CB, and a data bus D.
B to control each component connected to those buses.
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCBはマイクロプロセッサCPUの
制御の対象とする各構成要素のコントロール信号を転送
して印加する。データバスDBは各構成機器相互間のデ
ータの転送を行なう。Address bus AB transfers address signals indicating the components to be controlled by the microprocessor CPU. The control bus CB transfers and applies control signals for each component to be controlled by the microprocessor CPU. The data bus DB transfers data between each component device.
次にROMは、読出し専用の固定メモリであリアである
。Next, ROM is a read-only fixed memory.
また、RAMは、1ワード16ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。Further, the RAM is a writable random access memory having a configuration of 1 word and 16 bits, and is used for temporary storage of various data from each component.
TBUFは文書バッファであり、キーボードKBより入
力された文書情報を蓄えるためのメモリである。TBUF is a document buffer, which is a memory for storing document information input from the keyboard KB.
YBUFはキーボードKBより入力された読みを格納す
る入力読みバッファ・メモリである。YBUF is an input reading buffer memory that stores readings input from the keyboard KB.
DICはカナ漢字変換を行なうための単語辞書である。DIC is a word dictionary for performing kana-kanji conversion.
DBP0OLはYBUFの読みを文節に解析・変換した
情報を格納する同音語候補格納メモリである。DBP0OL is a homophone candidate storage memory that stores information obtained by analyzing and converting the pronunciation of YBUF into phrases.
YJPOOLはD B POOLと連動して、同音語の
候補に適用されている用例の情報を格納するメモリ、で
ある。YJPOOL is a memory that stores information on examples applied to homophone candidates in conjunction with D B POOL.
LRNDATは個々の単語および用例の学習状態を格納
した学習データ格納メモリである。LRNDAT is a learning data storage memory that stores the learning status of individual words and examples.
FZTBLは付属1悟をDICに格納されている結合情
報に対応させるための付属語列変換テーブルである。FZTBL is an adjunct word string conversion table for making an adjunct 1 word correspond to combination information stored in the DIC.
KBはキーボードであって、アルファベットキー、ひら
がなキー、カタカナキー等の文字記号人カキ−1及び、
変換を指示する変換キーなどの各種のファンクションキ
ーを備えている。KB is a keyboard with character symbols such as alphabet keys, hiragana keys, katakana keys, etc.
It is equipped with various function keys such as a conversion key for instructing conversion.
図において、YOMIは読みを入力するためのキー、C
ONは入力した読みを変換するための変換指示キー、N
XTは変換候補を変更して次候補に変換するための次候
補変換指示キー、SELは現在の同音語表示候補に確定
し同時にその候補表記を学習することを指示するための
選択キーである。In the figure, YOMI is the key for inputting the reading, C
ON is the conversion instruction key to convert the input reading, N
XT is a next candidate conversion instruction key for changing a conversion candidate to the next candidate, and SEL is a selection key for determining the current homophone display candidate and at the same time instructing to learn the candidate notation.
DISKは定型文書を記憶するためのメモリで作成され
た文書の保管を行ない、保管された文書はキーボードの
指示により、必要な時呼び出される。The DISK stores documents created in a memory for storing standard documents, and the stored documents can be called up when necessary by instructions from the keyboard.
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書キできる。後述するCRTコ
ントローラCRTCは、ここに蓄えられたアドレスに対
する表示装置CRT上の位置にカーソルを表示する。CR is a cursor register. The CPU can read and write the contents of the cursor register. A CRT controller CRTC, which will be described later, displays a cursor at a position on the display device CRT corresponding to the address stored here.
D B’U Fは表示用バッファメモリで、TBUFに
蓄えられた文書情報等のパターンを蓄える。D B'U F is a display buffer memory that stores patterns such as document information stored in TBUF.
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担う
。CRTC is cursor register CR and buffer DBUF
It plays the role of displaying the contents stored in the CRT on the display device CRT.
また、CRTは陽極線管等を用いた表示装置であり、そ
の表示器ff1cRTにおけるドツト構成のパターンお
よびカーソルの表示をCRTコントローラで制御する。Further, a CRT is a display device using an anode ray tube or the like, and the display of a dot pattern and a cursor on the display ff1cRT is controlled by a CRT controller.
さらに、CGはキャラクタジェネレータであって、表示
装置CRTに表示する文字、記号のパターンを記憶する
ものである。Furthermore, CG is a character generator that stores patterns of characters and symbols to be displayed on the display device CRT.
かかる各構成要素からなる本発明文字処理装置において
は、キ、−ボードKBからの各種の入力に応じて作動す
るものであって、キーボードKBからの入力が供給され
ると、まず、インタラブド信号がマイクロプロセッサC
PUに送られ、そのマイクロプロセッサCP U h)
ROM内に記憶しである各種の制御信号を読出し、それ
らの制御信号に従って、各種の制御か行なわれる。The character processing device of the present invention comprising these components operates in response to various inputs from the keyboard KB, and when an input from the keyboard KB is supplied, an interwoven signal is first output. Microprocessor C
PU and its microprocessor CPU h)
Various control signals stored in the ROM are read out, and various controls are performed according to these control signals.
第2図は、カナ漢字変換に用いる単語界@DICの構成
を示した図である。FIG. 2 is a diagram showing the configuration of the word world @DIC used for kana-kanji conversion.
辞書は表記変換に用いる単語情報と表記変換の際の第1
候補を決定するための用例情報とで構成されている。単
語情報はその見出し単語固有の単語IDと、単語の読み
を格納する読み、単語の表記を格納する表記、単語の品
詞を格納する品詞、単語の意味属性を格納する意味から
構成されている。単語IDは先頭の単語を1とする連続
番号である。用例情報はその見出し単語の持つ用例・情
報の個数、用例固有の用例ID、その用例が個別用例で
あるか意味用例であるかの用例タイプを記述したタイプ
、用例タイプが個別用例であれは用例の相手の単語の単
語IDを格納し意味用例であれば用例の相手となる意味
属性を格納する用例、用例の相手の単語に付く付属語の
うち用例が成立する条件を満たす代表的な付属語を格納
した結合情報、用例を逆転させても使用可能であるかど
うかの情報を格納する逆転から構成される。用例を一つ
も持たない単語は、用例1青報の個数にOか格納されて
いる。用例IDは単語IDと同じく先頭の用例を1とす
る連続番号である。Dictionaries are used to store word information used in orthographic conversion and the first information used in orthographic conversion.
It consists of example information for determining candidates. The word information consists of a word ID specific to the header word, a pronunciation of the word, a notation that stores the notation of the word, a part of speech that stores the part of speech of the word, and a meaning that stores the semantic attribute of the word. The word ID is a consecutive number starting with 1 for the first word. The example information is a type that describes the number of examples/information that the heading word has, the example ID unique to the example, the example type of whether the example is an individual example or a semantic example, and the example type if the example type is an individual example. If it is a semantic example, it stores the semantic attribute of the other word of the example, and representative adjunct words attached to the other word of the example that satisfy the conditions for the example to hold. It consists of combination information that stores the example, and reversal that stores information about whether it can be used even if the example is reversed. For words that do not have any examples, O is stored in the number of example 1 blue papers. Like the word ID, the example ID is a consecutive number with the first example being 1.
図において例えは、「買うJという単語は300という
連続番号で区別され、読みかrかうJ、表記がr買う」
、品詞が「動詞」であるという単語情報を持つ。そして
t酒を買うJとT喧嘩を買う」という2つの個別単語用
例を持つ。また、r鮭Jという単語は500という連続
番号で区別され、読みが「さけJ、表記がr鮭」、品詞
がr名詞jであり、意味属性が「動物」である単語であ
る。用例個数にOが格納されているのでr鮭1を見出し
語とする用例は登録されていない。In the figure, the example is ``The word ``Kurai J'' is distinguished by consecutive numbers 300, and is pronounced ``R KAJ'' and written ``R KARA''.
, has the word information that the part of speech is "verb". There are two individual word examples: ``J to buy T sake'' and ``T to buy quarrel.'' Further, the word r-salmon J is distinguished by a serial number of 500, has the pronunciation "sake J, written as r-salmon", the part of speech is r-noun j, and has the semantic attribute "animal". Since O is stored in the number of examples, no example with r-salmon 1 as a headword is registered.
第3図は、同音語プールDBP0OLおよび用例情報プ
ールYJPOOLの構成を示した図である。(a)は同
音語プールの全体構成である。同音語プールはカナ漢字
変換処理によって作成された各同音語情報から構成され
る。 (b)は同音語情報の構成を示した図である。FIG. 3 is a diagram showing the configuration of the homophone pool DBP0OL and the example information pool YJPOOL. (a) shows the overall configuration of the homophone pool. The homophone pool is composed of each homophone information created by the kana-kanji conversion process. (b) is a diagram showing the structure of homophone information.
同音語情報は、その同音語を他の同音語と区別するため
の連続番号である同音語ID、その同音語情報の使用メ
モリ・サイズを表わすデータ長、格納されている同音語
の候補の個数を格納する候補個数、同音語の候補の情報
を格納する候補情報、および、同音語の中に格納されて
いる候補情報の中で、後述する優先候補の個数を格納す
る優先個数から構成されている。このような同音語の構
成において、候補情報の列の先頭の候補情報が変換結果
として出力すべき第1候補になるものとし、列の先頭か
ら(優先個数によって示される個数の候補情報が、後述
する優先候補になるものとする。(C)は候補情報の構
成を示した図である。候補情報は、候補の表記、その単
語ID、文節末の活用形を格納する文節末活用、および
、後述の用例情報へのポインタを格納する用例情報ポイ
ンタから構成される。The homophone information includes the homophone ID, which is a sequential number to distinguish the homophone from other homophones, the data length representing the memory size used for the homophone information, and the number of stored homophone candidates. The number of candidates for storing homophone candidates, candidate information for storing information about homophone candidates, and the priority number for storing the number of priority candidates (described later) among the candidate information stored in the homophones. There is. In such a homophone configuration, the candidate information at the beginning of the candidate information string becomes the first candidate to be output as a conversion result, and from the beginning of the string (the number of candidate information indicated by the priority number) is (C) is a diagram showing the structure of the candidate information.The candidate information includes the notation of the candidate, its word ID, the clause-final conjugation that stores the clause-final conjugation, and It consists of an example information pointer that stores a pointer to example information, which will be described later.
候補情報に用例が適用されずに用例情報が、存在しない
場合には、用例情報ポインタに無効値−1が格納される
。(d)は用例情報プールYJPOOLの全体構成であ
る。用例情報プールは、同音語の各候補に適用される用
例の情報を格納する用例情報から構成される。(e)は
、用例情報の構成を示した図である。用例情報は、用例
の相手となる同音語のIDを格納するペア同音語ID、
適用されている用例のIDを格納する用例ID、適用さ
れている用例のタイプ(個別用例または意味用例)を格
納する用例タイプ、および、同じ候補情報に適用されて
いる別の用例情報へのポインタが格納ざねている用例情
報ポインタから構成される。このように、用例情報はリ
スト構造となっている。次の用例情報が存在しない場合
には、用例情報ポインタには無効値−1が格納される。If the example is not applied to the candidate information and the example information does not exist, an invalid value -1 is stored in the example information pointer. (d) shows the overall configuration of the example information pool YJPOOL. The example information pool is composed of example information that stores information on examples applied to each homophone candidate. (e) is a diagram showing the structure of example information. The example information includes a pair homophone ID that stores the ID of the homophone that is the partner of the example;
An example ID that stores the ID of the applied example, an example type that stores the type of applied example (individual example or semantic example), and a pointer to another example information that is applied to the same candidate information. It consists of example information pointers that are in the process of being stored. In this way, the example information has a list structure. If the next example information does not exist, an invalid value -1 is stored in the example information pointer.
以上説明したような同音語プールおよび用例情報プール
の構成において、ある同音語のある候補に用例が適用さ
れている場合、その候補情報に用例情報を格納するとと
もに、用例の相手となる同音語の候補に対する候補情報
にも、同じ用例の情報を格納した用例情報を格納するも
のとする。In the configuration of the homophone pool and example information pool as explained above, when an example is applied to a certain candidate for a certain homophone, the example information is stored in the candidate information, and the example information is stored in the candidate information for the homophone. It is assumed that example information containing information on the same example is also stored as candidate information for the candidate.
第4図は、付属語列変換テーブルFZTBLの構成を示
した図である。付属語列変換テーブルは文節を構成する
付属語列を卑語辞@DICか持つ用例情報中の結合情報
に対応させるための対応変換表である。付属語読みはそ
の付属語列の読みを表わし、対応結合情報はその付属語
列か置換可能な辞書の用例情報中の結合情報を表わす。FIG. 4 is a diagram showing the structure of the adjunct word string conversion table FZTBL. The adjunct word string conversion table is a correspondence conversion table for making the adjunct word string constituting a clause correspond to the combination information in the example information having the idiom dictionary @DIC. The adjunct word reading represents the pronunciation of the adjunct word string, and the corresponding combination information represents the combination information in the example information of the dictionary that can replace the adjunct word string.
例えは、付属語「こそ」は結合情報rが1またはrを」
に、付属語列rざえもがJは結合情報rが」に、それぞ
れ着換して結合判定することができる。For example, the adjunct ``koso'' has binding information r that is 1 or r.''
In addition, the adjunct word string r Zaemo ga J can be replaced with the combination information r ``, respectively, to determine the connection.
第5図は、学習データLRNDATの構成を示した図で
ある。(a)は学習データの全体構成である。学習デー
タは一@語学習データと用例学習データの2つから構成
される。単語学習へのポインタは学習データ内の単語学
習データへのインデックスを格納し、用例学習へのポイ
ンタは学習データ内の用例学習データ列先頭へのインデ
ックスを格納する。(b)(ま単語学習データ列の構成
を示した図である。単語学習データ列は使用サイズと各
単語学習データから構成される。単語学習データ使用サ
イズは単語学習データ列の使用サイズを格納する。単語
学習データは各単語のIDに対応しており、学習ざわて
いる単語には1、学習されていない単語に対しては0が
格納される。(C)は用例学習データ列の構成を示した
図である。用例学習データ列は使用サイズと各用例学習
データから構成される。用例学習データ使用サイズは用
例学習データ列の使用サイズを格納する。用例学習デー
タは各用例IDに対応しており、抑制されている使用禁
止用例には1、抑制されていない使用か脳用例に対して
はOか格納される。FIG. 5 is a diagram showing the structure of learning data LRNDAT. (a) shows the overall structure of the learning data. The learning data consists of two words: one@word learning data and example learning data. The pointer to word learning stores the index to the word learning data within the learning data, and the pointer to example learning stores the index to the beginning of the example learning data string within the learning data. (b) (This is a diagram showing the structure of the word learning data string. The word learning data string is composed of the usage size and each word learning data. The word learning data usage size stores the usage size of the word learning data string. The word learning data corresponds to the ID of each word, and 1 is stored for words that are being learned and 0 is stored for words that have not been learned. (C) shows the structure of the example learning data string. It is a diagram showing the example learning data string.The example learning data string is composed of the usage size and each example learning data.The example learning data usage size stores the usage size of the example learning data string.The example learning data corresponds to each example ID. 1 is stored for suppressed prohibited usage examples, and 0 is stored for unsuppressed usage or brain usage examples.
上述の実施例の作動をフローに従って説明する。The operation of the above embodiment will be explained according to the flow.
第6図は本発明文字処理装置の動作を示すフローチャー
トである。FIG. 6 is a flowchart showing the operation of the character processing device of the present invention.
56−1においてキーホードよりキーが押下され、割り
込みが発生するのを待つ。キーが入力されると36−2
においてキー判別し、キーの種類に応して56−3.5
6−4.56−5.56−6.56−7のいずれかのス
テップに分岐する。At 56-1, a key is pressed on the keyboard and a wait is made for an interrupt to occur. 36-2 when the key is input
56-3.5 depending on the type of key.
Branch to any of steps 6-4.56-5.56-6.56-7.
56−3は読み人カキ−YOMIが押下されたときの処
理であり、押下された読みのコードを入力読みバッファ
・メモリYBUFに蓄える。56-3 is a process when the reader key YOMI is pressed, and the code of the pressed reading is stored in the input reading buffer memory YBUF.
36−4は変換キーCONが押下されたときの処理であ
り、56−3で入力されてYBUFに蓄えられている、
カナ漢字変換の対象となる文字列を漢字に変換し、出力
バッファに出力する。漢字に変換する際に、単語辞書D
IC中に存在する用例情報を用いて、同音語の第1候補
を決定する。36-4 is the process when the conversion key CON is pressed, which is input in 56-3 and stored in YBUF.
Converts the character string subject to Kana-Kanji conversion into Kanji and outputs it to the output buffer. When converting to kanji, use the word dictionary D
A first candidate for a homophone is determined using example information existing in the IC.
56−5は次候補変換キーNXTが押下されたときの処
理であり、56−4によって出力された出力バッファ中
の同音語の別の候補を表示する。56-5 is a process when the next candidate conversion key NXT is pressed, and another candidate for the homophone in the output buffer output by 56-4 is displayed.
56−6は選択キーSELか押下されたときの処理であ
り、画面に表示さ、tlでいる出力バッファ中の同音語
を確定し、確定された文字列を文書中に出力する。さら
に、選択された単語を学習する処理を行なう。56-6 is a process when the selection key SEL is pressed, which is displayed on the screen, determines the homophone in the output buffer at tl, and outputs the determined character string into the document. Furthermore, processing for learning the selected words is performed.
56−7は、YOMI、CON、NXT、SEL以外の
キー(例えは、カーソル移動キーなどの文書編集で用い
るキーなど)が押下された場合の処理であり、同種の文
字処理装置において一11Qに行なわれている処理であ
り、公知であるので特に記述しない。56-7 is a process when a key other than YOMI, CON, NXT, or SEL is pressed (for example, a key used for document editing such as a cursor movement key), and is This is a process that is currently being carried out and is well known, so it will not be described in particular.
56−8は上記の処理の結果、変更された部分を表示す
る表示処理である。文書中のデータ1文字を読んではパ
ターンに展開し、表示バッファに出力するという通常広
く行なわれている処理である。56-8 is a display process for displaying the changed portion as a result of the above process. This is a commonly used process in which a single character of data in a document is read, developed into a pattern, and output to a display buffer.
第7図は、56−4の処理を詳細化したフローチャート
である。FIG. 7 is a detailed flowchart of the process 56-4.
57−1は、文節単位に分ち書きされて入力されたカナ
漢字変換の対象となる文字列を解析し、カナ漢字変換の
出力の候補を同音語プールに出力する処理である。分ち
書きされた単位に文字列を順々に取り出し、単語辞書を
検索して解析を行ない、文節として認定される候補のみ
を同音語プールに出力する処理であって、同種の文字処
理装置において一般に行なわれている処理であり、公知
であるので特に記述しない。57-1 is a process of analyzing a character string to be subjected to kana-kanji conversion, which is input in segments, and outputting candidates for output of kana-kanji conversion to a homophone pool. A process that sequentially extracts a character string in divided units, searches a word dictionary for analysis, and outputs only candidates that are recognized as phrases to a homophone pool. Since this is a commonly performed process and is well known, it will not be described in particular.
57−2は57−1において同音語プールに出力された
解析結果に対して、単語辞書中に格納されている用例の
パターンが存在するかどうかをチエツクし、用例のパタ
ーンが存在すれば、その用例の対象となる同音語の候補
を優先候補としてピックアップする。57-2 checks whether there is an example pattern stored in the word dictionary based on the analysis result output to the homophone pool in 57-1, and if the example pattern exists, it is Homophone candidates to be used as examples are picked up as priority candidates.
57−3は57−2でピックアップされた優先候補や、
卑語学習されている候補の中から、カナ漢字変換の第1
候補を決定する。57-3 is the priority candidate picked up by 57-2,
Among the candidates that have been learned, choose the first one for kana-kanji conversion.
Decide on candidates.
57−4は、出力バッファに格納されたカナ漢字変換の
出力を表示する処理であり、同種の文字処理装置におい
て一般に行なわれている処理であり、公知であるので特
に記述しない。57-4 is a process for displaying the output of the kana-kanji conversion stored in the output buffer, and is a process commonly performed in character processing devices of the same type and is well known, so it will not be described in particular.
第8図は57−2の処理を詳細化したフローチャー1・
である。FIG. 8 is a flowchart 1 which details the process of 57-2.
It is.
優先候補抽出の対象となる同音語を先頭から順次、取り
出してきて、対象同音語がなくなるまですべての同音語
に対して、以下の処理を行なう。Homophones to be extracted as priority candidates are sequentially extracted from the beginning, and the following process is performed on all homophones until there are no more target homophones.
5a−tで同音語中の候補情報を取り出してく る
。5a-t extracts candidate information in homophones.
.
58−2ですべての候補情報について処理したかどうか
を判定し、すべて処理済であるならば優先候補抽出を終
了する。次の候補情報が取り出せたならば、58−3で
候補情報に用例情報が存在するかどうかを判定する。用
例情報が存在するかどうかは、候補情報中の用例情報ポ
インタによって判定できる。すなわち、用例情報ポイン
タの値が“−1”であるならば用例情報は存在しない。At 58-2, it is determined whether all candidate information has been processed, and if all candidate information has been processed, priority candidate extraction is ended. If the next candidate information is retrieved, it is determined in 58-3 whether or not the example information exists in the candidate information. Whether or not example information exists can be determined by the example information pointer in the candidate information. That is, if the value of the example information pointer is "-1", no example information exists.
そうでなければ用例情報ポインタの示す領域に用例情報
が存在する。用例情報が存在しないならば優先候補抽出
処理を終了する。Otherwise, example information exists in the area indicated by the example information pointer. If the example information does not exist, the priority candidate extraction process ends.
用例情報が存在する場合、58−4で逆方向用例情報の
抽出を行ない、58−5で正方向用例情報の抽出を行な
う。If example information exists, backward example information is extracted at 58-4, and forward example information is extracted at 58-5.
58−5の処理を終了したならば、次の候補情報を処理
するため58−1ヘルーブする。When the processing in 58-5 is completed, the processing in 58-1 is performed to process the next candidate information.
第9図は、58−4の処理を詳細化したフローチャート
である。FIG. 9 is a detailed flowchart of the process 58-4.
59−1において、候補情報に格納されている単語ID
によって、その単語に存在する用例の情報を、一つずつ
辞書の中から取ってくる。In 59-1, the word ID stored in the candidate information
information on the examples that exist for the word is retrieved one by one from the dictionary.
59−2において、39−1で候補情報の単語に対して
辞書中に用例が存在するかどうか、辞書中の用例をすべ
て取り終えたかどうかを判定する。用例が存在していれ
ば59−3へ進み、用例が存在していないか、辞書中の
用例をすべて取り終えていれば逆方向用例抽出処理を終
えてリターンする。In step 59-2, it is determined in step 39-1 whether an example exists in the dictionary for the word of the candidate information and whether all examples in the dictionary have been taken. If the example exists, the process advances to 59-3; if the example does not exist or all the examples in the dictionary have been taken, the backward example extraction process is completed and the process returns.
59−3において、取り出されてきた用例を逆転させて
適用させることが可能かどうかをチエツクする。その情
報は辞書中に格納されている。逆転可能であれば59−
4へ進み、逆転できなければ59−1へ進む。At step 59-3, it is checked whether the retrieved example can be reversed and applied. That information is stored in a dictionary. If reversal is possible, 59-
Go to 4, and if you can't turn it around, go to 59-1.
59−4において、取り出された用例を逆転して適用し
た場合に、入力された読みに対して成立可能かどうかの
判定を行なう。成立可能であれば59−5へ進み、成立
可能でなければ59−1へ進む。In step 59-4, it is determined whether or not the input reading can be established when the retrieved example is reversed and applied. If it can be established, the process proceeds to 59-5, and if it cannot be established, the process proceeds to 59-1.
59−5において、成立可能な用例の情報を用例情報に
格納する。すなわち、用例情報プールに用例の情報を用
例情報として格納し、対象となっている同音語の候補情
報に用例情報が存在しなければ、用例情報ポインタに新
たに作成された用例情報へのポインタを格納する。候補
情報に用例情報が存在すれは、用例情報のリストの末尾
に新たに作成された用例情報を付は加える。また、対象
となっている同音語の候補情報だけでなく、用例の相手
となる同音語の候補情報にも同じようにして用例情報を
格納する。In step 59-5, information on valid examples is stored in example information. In other words, example information is stored as example information in the example information pool, and if no example information exists in the target homophone candidate information, a pointer to the newly created example information is set in the example information pointer. Store. If example information exists in the candidate information, the newly created example information is added to the end of the example information list. In addition, example information is stored not only for the target homophone, but also for the homophone that is the counterpart of the example.
第10図は、59−4の処理を詳細化したフローチャー
トである。FIG. 10 is a detailed flowchart of the process 59-4.
510−1において、対象となっている文節に後続する
文節が存在するかどうかチエツクする。後続する文節か
存在すれば5IO−2へ進み、存在しなければ5IO−
7へ進む。At 510-1, it is checked whether there is a clause following the target clause. If the following clause exists, proceed to 5IO-2, otherwise proceed to 5IO-
Proceed to 7.
S 10−2において、対象となっている文節の末尾の
活用形が連体形であるかどうかをチエツクする。連体形
であれはS 10−3へ進み、連体形でなければ
S I O−7へ進む。In S10-2, it is checked whether the conjugated form at the end of the target clause is an adnominal form. If it is an adjoint form, the process proceeds to S10-3; if it is not an adjoint form, the process proceeds to SIO-7.
310−3において、後続する文節に対する同音語から
候補情報を一つずつ取ってくる。At 310-3, candidate information is retrieved one by one from the homophones for the following clauses.
S 10−4において、S 10−3で候補情報が取っ
てこねたかどうかを判定する。候補情報が取ってこれね
ば5IO−5へ進み、すべての候補情報を取り終えて、
候補情報が取ってこれなければS 10−7へ進む。In S10-4, it is determined whether the candidate information has been retrieved in S10-3. If candidate information is not obtained, proceed to 5IO-5, and after obtaining all candidate information,
If candidate information is not retrieved, the process advances to S10-7.
S 10−5において、S 10−3で得た候補情報の
単語が用例の相手となりつるかどうかを判定する。すな
わち、用例のタイプが個別用例であれば、辞書中の用例
情報の用例の項目に格納されている単語IDとS I
O−3で得た候補情報の東語IDが一致していれは、用
例の相手となるものとし、一致しなければ用例の相手と
ならないものとする。用例のタイプが意味用例であれは
、辞書中の用例情報の用例の項目に格納され°Cいる。In S10-5, it is determined whether the word of the candidate information obtained in S10-3 can be used as an example. In other words, if the type of example is an individual example, the word ID and S I stored in the example item of the example information in the dictionary are
If the Togo IDs of the candidate information obtained in O-3 match, they will be used as examples, and if they do not match, they will not be used as examples. If the type of example is a semantic example, it is stored in the example item of example information in the dictionary.
意味属性と、5IO−3で得た候補情報の単語IDから
得られる意味属性とが一致していれは、用例の相手とな
るものとし、−致しなければ用例の相手とならないもの
とする。用例の相手になると判定されればS 10−6
へ進み、用例の相手にならないと判定されればS I
O−3へ進む。If the semantic attribute and the semantic attribute obtained from the word ID of the candidate information obtained in 5IO-3 match, the word will be used as an example, and if they do not match, it will not be used as the example. S 10-6 if it is determined that the person will be the other party of the example.
Proceed to SI
Proceed to O-3.
510−6において、用例が成立するというリターン・
コードを設定する。At 510-6, the return that the example holds;
Set the code.
S I O−7において、用例が成立しないというリタ
ーン・コードを設定する。。In SIO-7, a return code indicating that the example does not hold is set. .
第11図は、58−5の処理を詳細化したフローチャー
トである。FIG. 11 is a detailed flowchart of the process 58-5.
511−1において、候補情報に格納されている単語I
Dによって、その単語に存在する用例の情報を、一つず
つ辞書の中から取って(る。511-1, the word I stored in the candidate information
By using D, information on the usage examples that exist for the word is retrieved from the dictionary one by one.
5it−2において、Sl 1−1で候補情報の単語に
対して辞書中に用例が存在するかどうか、辞書中の用例
をすべて取り終えたかどうかを判定する。用例が存在し
ていれば5ll−3へ進み、用例が存在していないか、
辞書中の用例をすべて取り終えていれば正方向用例抽出
処理を終えてリターンする。In 5it-2, it is determined in Sl 1-1 whether an example exists in the dictionary for the word of the candidate information and whether all examples in the dictionary have been taken. If the example exists, proceed to 5ll-3, and check if the example does not exist.
If all the examples in the dictionary have been extracted, the forward example extraction process is completed and the process returns.
5tt−3において、取り出された用例を正方向に適用
した場合に、入力された読みに対して成立可能かどうか
の判定を行なう。成立可能であれば5ll−4へ進み、
成立可能でなければ5ll−1へ進む。At 5tt-3, it is determined whether or not the input reading can be established when the extracted example is applied in the forward direction. If it can be established, proceed to 5ll-4,
If it cannot be established, proceed to 5ll-1.
5ll−4において、成立可能な用例の情報を用例情報
に格納する。すなわち、用例情報プールに用例の情報を
用例情報として格納し、対象となっている同音語の候補
情報に用例情報が存在しなけれは、用イ舛情報ポインタ
に新たに作・成された用例情報へのポインタを格納する
。候補情報に用例情報が存在すれは、用例情報のリスト
の末尾に新たに作成された用例情報を付は加える。また
、対象となっている同音語の候補情報だけでなく、用例
の相手となる同音語の候補情報にも同しようにして用例
情報を格納する。In 5ll-4, information on valid examples is stored in example information. In other words, example information is stored as example information in the example information pool, and if example information does not exist in the target homophone candidate information, the newly created example information is stored in the usage information pointer. Stores a pointer to. If example information exists in the candidate information, the newly created example information is added to the end of the example information list. In addition, example information is stored not only for the target homophone, but also for the target homophone.
第12図は、5it−3の処理を詳細化したフローチャ
ートである。FIG. 12 is a detailed flowchart of the processing of 5it-3.
S+2−1において、対象となっている文節の前の文節
か存在するかどうか
チエツクする。前の文節が存在すれば512−2へ進み
、存在しなけれはS 12−8へ進む。At S+2-1, it is checked whether there is a clause before the target clause. If the previous phrase exists, the process proceeds to 512-2; otherwise, the process proceeds to S12-8.
S I 2−2において、前の文節に対する同音語から
候補情報を一つずつ取ってくる。In S I 2-2, candidate information is obtained one by one from the homophones for the previous phrase.
512−3において、312−2で候補情報か取ってこ
れたかどうかを判定する。候補情報か取ってこれればS
12−4へ進み、すへての候補情報を取り終えて、候
補情報が取ってこれなければS 12−8へ進む。At 512-3, it is determined whether candidate information has been retrieved at 312-2. S if you can get candidate information
The process proceeds to S12-4, and if all the candidate information has been obtained, and no candidate information has been obtained, the process proceeds to S12-8.
S 12−4において、512−2で得た候補情報の単
語が用例の相手となりつるかどうかを判定する。すなわ
ち、用例のタイプが個別用例であれば、辞書中の用例情
報の用例の項目に格納されている単語IDと312−2
で得た候補情報の単語IDが一致していれば、用例の相
手となるものとし、一致しなければ用例の相手とならな
いものとする。用例のタイプが意味用例であれば、辞書
中の用例情報の用例の項目に格納されている意味属性と
、512−2で得た候補情報の単語IDから得られる意
味属性とが一致していれば、用例の相手となるものとし
、−致しなければ用例の相手とならないものとする。用
例の相手になると判定されれば512−5へ進み、用例
の相手にならないと判定されればS 12−2へ進む。In S12-4, it is determined whether the word of the candidate information obtained in 512-2 can be used as an example. That is, if the type of example is an individual example, the word ID stored in the example item of the example information in the dictionary and 312-2
If the word IDs of the candidate information obtained in (2) match, the words will be used as examples, and if they do not match, they will not be used as examples. If the type of example is a semantic example, the semantic attribute stored in the example item of the example information in the dictionary and the semantic attribute obtained from the word ID of the candidate information obtained in 512-2 must match. If it does, it will be the partner of the example, and if it does not, it will not be the partner of the example. If it is determined that the user will be the target of the example, the process advances to 512-5, and if it is determined that the target is not the target of the example, the process advances to S12-2.
S 12−5において、S 12−2で得た候補情報の
自立部以外の残り読み(付属語列)を付属語列変換テー
ブルによって、結合情報に変換する。In S12-5, the remaining pronunciations (adjunct word strings) other than the independent part of the candidate information obtained in S12-2 are converted into combined information using the adjunct word string conversion table.
312−6において、前の文節の同音語の候補が、用例
の結合条件を満たしているかどうかを判定する。すなわ
ち、512−5において、付属語列変換テーブルによっ
て結合情報に変換できなければ、結合条件を満たしてい
ないものとする。また、512−5で得た結合情報と、
辞書中の用例情報の結合情報との間に、一致する情報が
あれば結合条件を満たしているものとし、一致する情報
かなければ結合条件を満たしていないものとする。結合
条件を満たしていれはS + 2−7へ進み、結合条件
を満たしていなけれは512−2へ進む。At 312-6, it is determined whether the homophone candidate of the previous clause satisfies the example combination condition. That is, in step 512-5, if it cannot be converted into join information using the adjunct word string conversion table, it is determined that the join condition is not satisfied. In addition, the connection information obtained in 512-5,
If there is matching information with the combination information of the example information in the dictionary, it is assumed that the combination condition is satisfied, and if there is no matching information, it is assumed that the combination condition is not satisfied. If the connection condition is satisfied, the process proceeds to S + 2-7; if the connection condition is not satisfied, the process proceeds to 512-2.
S 10−7において、用例が成立するというリターン
・コートを設定する。At S10-7, a return code indicating that the example is true is set.
512−8において、用例が成立しないというリターン
・コートを設定する。At 512-8, a return code is set that the example does not hold.
(以回π傘“白) し−−(。(Next time π umbrella “white”) Shi---(.
第13図は57−3の処理を詳細化したフローチャート
である。FIG. 13 is a detailed flowchart of the process 57-3.
第1候補決定を行なわなければならない同音語を先頭か
ら順次、取り出してきて、対象同音語がなくなるまです
べての同音語に対して、以下の処理を行なう。The homophones for which the first candidate determination must be made are sequentially extracted from the beginning, and the following process is performed on all homophones until there are no target homophones left.
513−1で同音語内の候補情報のうちから優先候補を
ピックアップする。優先候補のピックアップは同音語が
持つ候補情報のうち、用例情報ポインタが−1”でない
ものの個数を優先個数にセットし、優先個数にカウント
された候補情報を順次先頭に韮び換えていく。すべての
候補情報について、優先候補のピックアップが終了した
ならば、S 13−2に進み、抑制された用例を優先候
補から除外する処理を行なう。候補情報の先頭から優先
個数分の候補情報について、以下の処理を行なうことに
より、抑制用例の優先除外を行なう。まず候補情報内の
用例情報ポインタをたどり、用例情報内の用例IDを取
り出す。取り出した用例IDの示す用例学習データが抑
制状態にあるかどうかをチエツクする。用例情報ポイン
タか終端に達するまで、すなわちポインタ価が“−1”
を示すまでの用例IDについて抑制されているかどうか
を調べた結果、候補++’を報の用例情報ポインタが示
ずすへての用例情報が抑制されていた場合のみ、その候
補情報を優先候補から除外する。すなわち、優先個数を
1減らし、候?i′li情報を優先候補末尾の直後に並
び換える。In step 513-1, priority candidates are picked up from candidate information within the homophone. To pick up priority candidates, among the candidate information of the homophone, the number of items whose example information pointer is not -1'' is set as the priority number, and the candidate information counted in the priority number is sequentially moved to the top.All. When the pick-up of priority candidates is completed for the candidate information, the process proceeds to S13-2 and a process of excluding the suppressed examples from the priority candidates is performed.For the candidate information for the priority number from the beginning of the candidate information, the following is performed. By performing the process described above, suppression examples are prioritized and excluded.First, the example information pointer in the candidate information is traced, and the example ID in the example information is extracted.Whether the example learning data indicated by the extracted example ID is in a suppressed state. Until the example information pointer reaches the end, that is, the pointer value is “-1”.
As a result of checking whether or not the example IDs up to the point where the example ID indicates the candidate ++' have been suppressed, only if the example information pointer does not indicate the candidate ++' is suppressed, that candidate information is selected from the priority candidates. exclude. In other words, reduce the priority number by 1 and select Sort the i'li information immediately after the end of the priority candidate.
513−3で313−2の結果、優先候補が残っている
かどうかを、優先個数が0か否かによって判定し、(I
’先候補が一つもない場合は513−5へ、優先候補が
1個以上残っている場合は313−4へそれぞれ分岐す
る。In 513-3, as a result of 313-2, it is determined whether or not there are any priority candidates remaining, depending on whether the number of priority candidates is 0 or not, and (I
'If there is no prior candidate, the process branches to 513-5, and if one or more priority candidates remain, the process branches to 313-4.
513−4で優先候補として残された候補情報のうち、
個別単語用例を持つ候補が存在するかどうかをチエツク
する。個別単語用例の存在チエツクは、候補情報の先頭
から優先個数分の候補情報について、以下の処理を行な
うことにより行なわれる。先ず、候補情報内の用例情報
ポインタをたどり、用例情報ポインタの示ずすへての用
例情報について用例のタイプを調へ、一つでも個別単語
用例かあれば“個別単語用例あり°°と判定される。用
例情報ポインタか終端に達するまで、すなわちポインタ
値が”−1′。Among the candidate information left as priority candidates in 513-4,
Check if there are any candidates with individual word examples. The existence check for individual word examples is performed by performing the following process on the priority number of candidate information starting from the beginning of the candidate information. First, follow the example information pointer in the candidate information, check the type of example for the example information indicated by the example information pointer, and if there is at least one individual word example, it is determined that there is an individual word example. until the example information pointer reaches the end, that is, the pointer value is "-1".
を示ずまで用例のタイプを調へてすべて意味属性用例で
あれば“個別単語用例なし”と判定される。If the types of examples are examined and all are semantic attribute examples, it is determined that there is no individual word example.
判定の結果、個別単語用例ありならば313−6へ、個
別単語用例なしならば313−7へ分岐する。As a result of the determination, if there is an example of an individual word, the process branches to 313-6, and if there is no example of an individual word, the process branches to 313-7.
513−6で813−5の個別単語用例検索の結果、す
へて意味属性用例である候補情報を優先候補から除外す
る。すなわち、優先個数を1減らし、候補情報をイ受光
Iyc補末尾の直後に並び換える。In step 513-6, as a result of the individual word example search in 813-5, candidate information that is all semantic attribute examples is excluded from the priority candidates. That is, the priority number is decreased by 1, and the candidate information is rearranged immediately after the Iyc supplementary end.
上記処理の結果、優先候補が一つに絞られたかどうかを
313−7で判定する。すなわち優先個数が1であるか
どうかを判定する。優先個数が1であるならばS 13
−9へ進み、優先候補を第1候補として決定する。優先
個数が1でない場合は、まだ一つに絞られていないため
、513−8で単語学習による候補の絞り込みを行なう
。As a result of the above processing, it is determined in step 313-7 whether or not the priority candidates have been narrowed down to one. That is, it is determined whether the priority number is 1 or not. If the priority number is 1, S 13
Proceed to -9 and determine the priority candidate as the first candidate. If the priority number is not 1, it has not yet been narrowed down to one, and the candidates are narrowed down by word learning in step 513-8.
513−8で優先候補の単語IDを取り出し、iI+、
語IDの示す単語学習データを調へ、単語学習されてい
る候補が存在したならば、513−11で単語学習され
そいる候補を第1候補として決定する。−!Ii語学習
されている候補が複数個あったならば、先に格納されて
いる候補情報を第1候補とする。優先候補中のすべての
候補に単語学習されているものかなかった場合は、51
3−10で優先候補の先頭に格納されている候補を第1
候補として決定する。513-8 extracts the word ID of the priority candidate, iI+,
Based on the word learning data indicated by the word ID, if a word-learning candidate exists, the candidate whose word is likely to be learned is determined as the first candidate in 513-11. -! If there are a plurality of candidates that have been studied in the Ii language, the previously stored candidate information is set as the first candidate. If none of the priority candidates have words learned, 51
In step 3-10, select the candidate stored at the beginning of the priority candidates as the first
Decided as a candidate.
513−3で優先候補が一つも存在し、ないと判定され
た場合は、S 13−5で単語学習による第1候補決定
の判定を行なう。候補情報の単語IDを取り出し、単語
IDの示す単語学習データを調べ、単語学習されている
候補が存在したならば、313−11で4i語学習され
ている候補を第1候補として決定する。単語学習されて
いる候補か複数個あったならば、先に格納されている候
補情報を第1候補とする。すへての候補情報に単語学習
されているものがなかった場合は、5I3−12で先頭
の候補情報を第1候補として決定する。If it is determined in step 513-3 that there is no priority candidate, it is determined in step S13-5 whether the first candidate is determined by word learning. The word ID of the candidate information is extracted, the word learning data indicated by the word ID is checked, and if a word-learning candidate exists, the 4i-word learning candidate is determined as the first candidate in 313-11. If there are multiple word-learned candidates, the previously stored candidate information is set as the first candidate. If no word has been learned among all the candidate information, the first candidate information is determined as the first candidate in 5I3-12.
第14図は56−6の処理を詳細化したフローチャート
である。FIG. 14 is a detailed flowchart of the process 56-6.
S+4−1において選択キーSELによって選択・確定
を指示された候補か格納されている同音語内に用例か存
在するかどうかを同音語中のすへての候補情報について
、用例情報ポインタを参照することにより判定する。す
なわち、用例情報ポインタの値が“−1”であるならば
、用例なしと判定される。すべての候補情報について用
例が一つも存在しなければ、S 14−3へ、一つでも
用例が存在すればS 14−2へそれぞれ分岐する。In S+4-1, check whether there is an example in the stored homophone for the candidate whose selection/confirmation was instructed by the selection key SEL, and refer to the example information pointer for all candidate information in the homophone. Judgment is made by That is, if the value of the example information pointer is "-1", it is determined that there is no example. If there is no example for all the candidate information, the process branches to S14-3, and if there is at least one example, the process branches to S14-2.
S 14−2で選択された単語によって成立する用例が
用例情報中に存在するかどうかを以下のように判定する
。In step S14-2, it is determined as follows whether or not there is an example established by the word selected in the example information.
まず、選択された情語の候補・情報中における用例情報
ポインタをたどり、ペア同音語IDおよび用例IDを取
り出す。取り出したペア同音語IDの示す同音語内の先
頭候補情報の用例情報ポインタをたどり、ベア同音語I
Dが、選択された単語の存在する同音語!Dであるもの
があるかどうかを検索する。そのような用例情報が検索
されなければ、用例は成立しないと判定される。ベア同
音語IDか、選択された単語の同音語IDと一致する用
例情報が検索されたならば、用例IDを取り出し、選択
された単語の用例情報中の用例IDと一致するかどうか
をチエツクする。用例IDが一致すれば、成立用例が存
在すると判定される。一致しなけれは用例は成立しない
と判定される。用例が成立すると判定されたならば、5
14−6へ進み、用例が成立しないと判定されたならば
、ベア同音語の次の用例情報について同様の判定を行な
う。ペア同音語の用例情報についてずへて用例が成立し
なければ、選択された単語の次の用例情報について、同
様の判定処理を行なう。選択された単語の用例・[青報
がないならば、成立する用例なしと判定され、514−
5へ分岐する。First, the example information pointer in the candidate/information of the selected emotion word is followed, and the pair homophone ID and example ID are extracted. Follow the example information pointer of the first candidate information in the homophone indicated by the extracted pair homophone ID, and find the bare homophone I.
D is an existing homophone of the selected word! Search to see if there is something that is D. If such example information is not retrieved, it is determined that the example does not hold true. If the bare homophone ID or the example information that matches the homophone ID of the selected word is retrieved, take out the example ID and check whether it matches the example ID in the example information of the selected word. . If the example IDs match, it is determined that a valid example exists. If they do not match, it is determined that the example does not hold. If it is determined that the example holds true, 5
The process advances to step 14-6, and if it is determined that the example does not hold, a similar determination is made for the next example information of the bare homophone. If the usage example does not hold through the usage example information of the paired homophone, the same determination process is performed for the next usage example information of the selected word. Usage example of the selected word [If there is no blue report, it is determined that there is no valid example, and 514-
Branch to 5.
S I 4−4は用例抑制解除の処理である。514−
2で成立用例と判定された用例の用例IDの示す用例学
習データを使用可能状態にする。SI 4-4 is a process for canceling example suppression. 514-
The example learning data indicated by the example ID of the example determined to be a valid example in step 2 is made usable.
S 14−3は514−1にて選択された単語に用例か
存在しなかった場合に、選択されなかった他の同音語の
用例を抑制するための用例存在判定を行なう。In step S14-3, if there is no example of the word selected in step 514-1, the existence of examples is determined to suppress examples of other homophones that were not selected.
そのために、選択された単語の存在する同音語中の選択
された候補情報以外のすべての用例情報に用例情報が存
在しているかどうかを判定し、用例が存在するならば、
S 14−5で用例IDの示す用例学習データを使用禁
止状態にする。To do this, it is determined whether or not example information exists in all example information other than the selected candidate information in the homophones in which the selected word exists, and if examples exist,
In S14-5, the example learning data indicated by the example ID is disabled.
514−6は単語学習処理を行なう。選択された表記の
単語IDの示す単語学習データを学習状態にし、同音話
中の選択されなかった候?in情報のJ¥語IDの示す
乍語学習データの学習状態を解除する処理を行なう。514-6 performs word learning processing. The word learning data indicated by the word ID of the selected notation is put into the learning state, and the unselected words in the same phonetic speech are displayed. A process is performed to cancel the learning state of the 乍word learning data indicated by the J\word ID of the in information.
514−7で選択された表記の文書への確定処理を行な
う。確定処理は確定文字コートを文書バッファTBUF
へ格納するという同種の文字処理装置で通常行なわれて
いる処理であり、公知であるので詳述しない。At step 514-7, the selected notation is confirmed in the document. Confirmation processing transfers the confirmed character code to the document buffer TBUF.
This is a process that is normally performed in character processing devices of the same type and is well known, so it will not be described in detail.
〔他の実施例)
以上の説明において用いた辞書は単語情報と用例情報と
を同一見出し語の下に記述した単一の辞書構造であるが
、単語情報と用例情報とを分離した各辞書テーブルとし
ても同様に処理することができる。さらに用例のタイプ
別に辞書を構成し、各辞書に辞書個別のIDを持たせ、
用例の存在する辞書IDによって用例の優先順位を持た
せて処理を行なってもよい。[Other Examples] The dictionary used in the above explanation has a single dictionary structure in which word information and usage example information are described under the same headword, but each dictionary table has separate word information and usage example information. It can be processed in the same way as . Furthermore, dictionaries are configured for each type of usage, and each dictionary has its own ID.
Processing may be performed by giving priority to the examples based on the dictionary ID in which the examples exist.
また、以上の説明では、隣接した文節間にのみ用例を適
用していたが、隣接していない文節間に用例を適用する
ことも、容易に実現できる。その際、文節間の構文解析
処理(係り受は解析処理)を施すことによって、用例の
誤った適用を避けることができる。Furthermore, in the above description, examples are applied only between adjacent bunsetsu, but examples can also be easily applied between non-adjacent bunsetsu. In this case, by performing a syntactic analysis process between clauses (an analysis process for dependencies), incorrect application of the example can be avoided.
以上の説明においては、分ち書き入力された文節間に用
例を適用する場合を述べたが、べた書きに入力された読
み列に対しても、自動的に文節に分割する処理を付は加
えることによって、同じように用例を適用できる。また
、用例の存在を加味しながら文節に分割することも可能
である。In the above explanation, we have described the case where usage examples are applied between clauses input in separate writing, but processing for automatically dividing into clauses can also be added to reading sequences input in solid writing. By doing so, you can apply the example in the same way. It is also possible to divide sentences into clauses while taking into account the existence of usage examples.
1“ミ宝コ
(効果の説明)
以上の説明から明らかなように、本発明によれは多義性
のある同音語に対しても、用例の適用の際に結合条件を
判定することによって、用例を正しく適用することがで
き、同音語の第1候補決定を正確に行なうことができる
ため、次候補に変換することが不要となり、効率の良い
入力作業を行なうことができる。1. "Mihoko" (Explanation of Effect) As is clear from the above explanation, the present invention allows the use of synonyms even for ambiguous homophones by determining the concatenation condition when applying the example. can be applied correctly and the first candidate for the homophone can be determined accurately, so there is no need to convert to the next candidate, and efficient input work can be performed.
第1図は本発明の全体構成のブロック図、第2図は本発
明の辞書構成の例を示す図、第3図は本発明の同音語プ
ールおよび用例情報プールの構成を示す図、
第4図は本発明の付属語変換テーブルの構成を示す図、
第5図は本発明の学習データの構成を示す図、
第6図〜第14図は本発明文字処理装置の動作を示すフ
ローチャートである。
第4図 付属話列変換テーブルの鳴成第7図
Cヨn
第8図
第9区
第10図
第11ス
第12図FIG. 1 is a block diagram of the overall configuration of the present invention, FIG. 2 is a diagram showing an example of the dictionary configuration of the present invention, FIG. 3 is a diagram showing the configuration of the homophone pool and the example information pool of the present invention, and FIG. 5 is a diagram showing the structure of the adjunct word conversion table of the present invention, FIG. 5 is a diagram showing the structure of learning data of the present invention, and FIGS. 6 to 14 are flowcharts showing the operation of the character processing device of the present invention. . Figure 4: Reference of attached story sequence conversion table Figure 7: C-yon Figure 8: Section 9: Figure 10: Figure 11: Figure 12
Claims (1)
、 共起関係を有する単語と単語との組と、共起関係が発生
するための結合条件とを格納した用例辞書と、 前記入力手段によって入力された読みを、前記単語辞書
を検索することにより文節として認定する文節認定手段
と、 前記文節認定手段によって認定された文節の対について
、前記用例辞書を検索し、成立する用例を抽出する用例
検索手段とを有する文字処理装置において、 前記用例検索手段において用例の成立を判定する手段と
して、前記用例辞書中に格納されている結合条件の判定
を行なう結合条件判定手段を備えることを特徴とする文
字処理装置。[Claims] An input means for inputting the pronunciation of a word, a word dictionary storing correspondence between the pronunciation and the notation of the word, a pair of words having a co-occurrence relationship, and a word dictionary having a co-occurrence relationship. a usage dictionary that stores combination conditions for generation of phrases; a phrase recognition means for recognizing the pronunciation inputted by the input means as a phrase by searching the word dictionary; and a phrase recognized by the phrase recognition means. and example search means for searching the example dictionary and extracting valid examples for the pair, wherein the example search means determines whether the examples are valid for the pair, and the example search means uses the examples stored in the example dictionary as a means for determining whether the examples are valid. 1. A character processing device comprising a combination condition determining means for determining a combination condition.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63056545A JP2756251B2 (en) | 1988-03-09 | 1988-03-09 | Character processor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63056545A JP2756251B2 (en) | 1988-03-09 | 1988-03-09 | Character processor |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH01229367A true JPH01229367A (en) | 1989-09-13 |
| JP2756251B2 JP2756251B2 (en) | 1998-05-25 |
Family
ID=13030063
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63056545A Expired - Fee Related JP2756251B2 (en) | 1988-03-09 | 1988-03-09 | Character processor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2756251B2 (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04256162A (en) * | 1991-02-08 | 1992-09-10 | Sharp Corp | Word processor with learning function |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS592125A (en) * | 1982-06-29 | 1984-01-07 | Comput Basic Mach Technol Res Assoc | "kana" (japanese syllabary) "kanji" (chinese character) converting system |
-
1988
- 1988-03-09 JP JP63056545A patent/JP2756251B2/en not_active Expired - Fee Related
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS592125A (en) * | 1982-06-29 | 1984-01-07 | Comput Basic Mach Technol Res Assoc | "kana" (japanese syllabary) "kanji" (chinese character) converting system |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH04256162A (en) * | 1991-02-08 | 1992-09-10 | Sharp Corp | Word processor with learning function |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2756251B2 (en) | 1998-05-25 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP0637805B1 (en) | Context-sensitive method of finding information about a word in an electronic dictionary | |
| JPS5840684A (en) | Automatic translating system between natural languages | |
| JP3680865B2 (en) | Automatic natural language translation | |
| Thet et al. | Word segmentation for the Myanmar language | |
| JPH01229364A (en) | Character processing device and method | |
| JPH01229367A (en) | character processing device | |
| JPH01229369A (en) | character processing device | |
| JPS5892063A (en) | Idiom processing method | |
| KR100463376B1 (en) | A Translation Engine Apparatus for Translating from Source Language to Target Language and Translation Method thereof | |
| JPH01229366A (en) | Character processor | |
| JPS58123129A (en) | Converting device of japanese syllabary to chinese character | |
| Chan | Concordancers and concordances: Tools for Chinese language teaching and research | |
| JPH01229368A (en) | Character processor | |
| JPH01229365A (en) | character processing device | |
| JP2958044B2 (en) | Kana-Kanji conversion method and device | |
| JP3873305B2 (en) | Kana-kanji conversion device and kana-kanji conversion method | |
| JP2997151B2 (en) | Kanji conversion device | |
| JP2856775B2 (en) | Document creation device | |
| JPS61282966A (en) | Kana/kanji conversion system | |
| JPS6386073A (en) | Japanese modification relation analysis device | |
| JP3253311B2 (en) | Language processing apparatus and language processing method | |
| JPS62214468A (en) | Kana-kanji converter | |
| JPH0442350A (en) | character processing device | |
| JPH0567076A (en) | Kana-Kanji converter | |
| JPH03191472A (en) | Sentence analyzer and machine translation device using the same |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |