JPH0573540A - Kana-Kanji converter - Google Patents
Kana-Kanji converterInfo
- Publication number
- JPH0573540A JPH0573540A JP3236297A JP23629791A JPH0573540A JP H0573540 A JPH0573540 A JP H0573540A JP 3236297 A JP3236297 A JP 3236297A JP 23629791 A JP23629791 A JP 23629791A JP H0573540 A JPH0573540 A JP H0573540A
- Authority
- JP
- Japan
- Prior art keywords
- rule
- kana
- dictionary
- word
- pointer
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000006243 chemical reaction Methods 0.000 claims abstract description 95
- 238000000034 method Methods 0.000 description 23
- 235000016496 Panda oleosa Nutrition 0.000 description 7
- 240000000220 Panda oleosa Species 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 239000003550 marker Substances 0.000 description 6
- 102100030386 Granzyme A Human genes 0.000 description 2
- 101001009599 Homo sapiens Granzyme A Proteins 0.000 description 2
- 102100032352 Leukemia inhibitory factor Human genes 0.000 description 2
- 108090000581 Leukemia inhibitory factor Proteins 0.000 description 2
- 238000012790 confirmation Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- -1 Y factor Proteins 0.000 description 1
- 230000036461 convulsion Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】 規則辞書を用いるかな漢字変換装置におい
て、規則辞書を作成する労力低減と、規則辞書のメモリ
容量低減を図り変換効率を向上する。
【構成】 かな読み文字列は入力装置から入力され、か
な漢字変換プログラムは単語の読みに対する表記を記憶
した基本辞書と品詞情報部と接続テーブルとを参照し、
入力されたかな読み文字列をかな漢字変換する。規則検
索プログラムは、前記基本辞書の単語列のパターンとそ
の書き換え情報を持つ規則を記憶した規則辞書と品詞情
報に対応した品詞IDをまとめた品詞情報部とを参照し
前記規則辞書中の規則と一致するものを検索する。規則
書き換えプログラムは、一致した規則が検索されたと
き、該当のかな漢字変換結果の内容を規則辞書に基づい
て書き換える。
(57) [Abstract] [Purpose] In a kana-kanji conversion device that uses a rule dictionary, it is possible to reduce the labor of creating the rule dictionary and the memory capacity of the rule dictionary to improve the conversion efficiency. [Structure] A kana-reading character string is input from an input device, and a kana-kanji conversion program refers to a basic dictionary storing a notation for reading a word, a part-of-speech information section, and a connection table,
Converts the input kana-reading character string into kana-kanji. The rule search program refers to a rule dictionary that stores a pattern of a word string of the basic dictionary and rules having rewriting information thereof, and a part-of-speech information section that collects a part-of-speech ID corresponding to the part-of-speech information, and refers to the rules in the rule dictionary. Search for a match. The rule rewriting program rewrites the content of the corresponding kana-kanji conversion result based on the rule dictionary when a matching rule is retrieved.
Description
【0001】[0001]
【産業上の利用分野】本発明は、日本語ワードプロセッ
サ等のかな漢字変換処理装置に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a kana-kanji conversion processing device such as a Japanese word processor.
【0002】[0002]
【従来の技術】従来、この種のかな漢字変換装置として
は、特開平3−142658号公報で開示されているよ
うに、かなとそれに対応する漢字等の表記が一対になっ
て記憶されている基本辞書と、特定の複数の単語列にお
ける表記方法が各事例別に記憶されている規則辞書とを
備えているものが知られている。2. Description of the Related Art Conventionally, as a kana-kanji conversion device of this kind, as disclosed in Japanese Patent Laid-Open No. 3-142658, a kana and a corresponding kanji character are basically stored as a pair. It is known to have a dictionary and a rule dictionary in which a notation method in a plurality of specific word strings is stored for each case.
【0003】このようなかな漢字変換装置では、まず、
基本辞書を参照して通常のかな漢字変換が実行され、変
換結果記憶部にそのかな漢字変換の結果が記憶される。
そして、記憶されたかな漢字変換結果と規則辞書中のパ
ターンとが一致すれば、その規則辞書の書き換え情報に
従ってかな漢字変換結果の表記を書き換え、表示装置に
より表示するようにしていた。また、このような一連の
作用を規則変換と称していた。In such a kana-kanji conversion device, first,
Normal kana-kanji conversion is executed with reference to the basic dictionary, and the result of the kana-kanji conversion is stored in the conversion result storage section.
Then, if the stored kana-kanji conversion result matches the pattern in the rule dictionary, the kana-kanji conversion result is rewritten according to the rewriting information of the rule dictionary and displayed on the display device. Moreover, such a series of actions was called rule conversion.
【0004】例えば、「あかちゃんがたつ」と入力した
とき、まず、基本辞書を参照した通常のかな漢字変換を
行い、「赤ちゃんが建つ」と変換される。次に、規則辞
書を検索し該当するパターンがあれば、その書き換え情
報に従って「赤ちゃんが立つ」と書き換えていた。For example, when "Aka-chan ga tatsu" is input, first, the normal kana-kanji conversion with reference to the basic dictionary is performed, and "babies build" is converted. Next, he searched the rule dictionary and, if there was a corresponding pattern, rewrites it as "baby stands" according to the rewriting information.
【0005】[0005]
【発明が解決しようとする課題】しかしながら、上記方
法では、例えば、「赤ちゃんがゆっくり建つ」、「赤ち
ゃんがしっかり建つ」などのような「赤ちゃんが+副詞
+建つ」という誤変換結果に対して、誤変換された「建
つ」を正しい表記の「立つ」に書き換えるための規則
を、それぞれの副詞ごとに別々にパターンを作って規則
辞書に記憶していた。従って、副詞が異なるだけ、同じ
ようなパターンを多く記憶する必要があり、このため、
規則辞書を作るための作業量も多くなり、さらに規則辞
書のメモリ容量も大きくなっていた。However, in the above method, for example, for a mistranslation result of "baby + adverb + build" such as "baby slowly builds" or "baby firmly builds", The rules for rewriting the wrongly converted "standing" into the correct notation "standing" were created in separate patterns for each adverb and stored in the rule dictionary. Therefore, it is necessary to memorize many similar patterns as the adverbs are different.
The amount of work for creating the rule dictionary has increased, and the memory capacity of the rule dictionary has also increased.
【0006】本発明は、上記問題点を解決するためにな
されたものであり、規則辞書に任意の品詞を表す品詞情
報を記憶させ、ひとつの規則で文の構造が同じいくつも
のパターンに対応させることにより、規則辞書の容量を
少なくし、かつ正確な変換が可能なかな漢字変換装置を
提供することを目的とする。The present invention has been made in order to solve the above-mentioned problems, and stores part-of-speech information representing an arbitrary part-of-speech in a rule dictionary so that one rule corresponds to several patterns having the same sentence structure. Thus, an object of the present invention is to provide a kana-kanji conversion device capable of reducing the capacity of the rule dictionary and performing accurate conversion.
【0007】[0007]
【課題を解決するための手段】この問題を解決するため
に本発明のかな漢字変換装置は、図1に示すように、か
な読み文字列を入力するための入力手段と、単語の読み
に対する表記等を記憶した基本辞書と、基本辞書を参照
し、かな漢字変換を行うかな漢字変換手段と、かな漢字
変換手段によるかな漢字変換結果を記憶する変換結果記
憶手段と、かな漢字変換の結果を出力するための出力手
段とを備え、更に、基本辞書の特定の単語の品詞等の情
報と、当該単語を含む単語列のパターンと、その単語列
に対しての書き換え情報とを記憶した規則辞書と、変換
結果記憶手段の内容について規則辞書中から品詞情報を
参照して一致するパターンを検索する規則検索手段と、
規則検索手段により一致したパターンが検索されたと
き、該当の変換結果記憶手段の内容を規則辞書の書き換
え情報に基づいて書き換える規則書き換え手段とを備え
ている。In order to solve this problem, a kana-kanji conversion device of the present invention, as shown in FIG. 1, has an input means for inputting a kana-reading character string, a notation for reading a word, etc. And a kana-kanji conversion means for performing kana-kanji conversion by referring to the basic dictionary, a conversion result storage means for storing kana-kanji conversion results by the kana-kanji conversion means, and an output means for outputting the kana-kanji conversion result. And a rule dictionary storing information such as a part of speech of a specific word in the basic dictionary, a pattern of a word string including the word, and rewriting information for the word string, and a conversion result storage unit. Rule searching means for searching a matching pattern by referring to the part-of-speech information from the rule dictionary for contents,
And a rule rewriting unit that rewrites the contents of the corresponding conversion result storing unit based on the rewriting information of the rule dictionary when the matching pattern is searched by the rule searching unit.
【0008】[0008]
【作用】上記の構成を有する本発明のかな漢字変換装置
では、まず、入力手段から入力されたかな読み文字列を
かな漢字変換手段にて、基本辞書を参照してかな漢字変
換を行う。そして、変換結果記憶手段はかな漢字変換さ
れた結果を記憶する。規則辞書には、任意の品詞情報を
含む特定の複数の単語列に対応する書き換え規則が記憶
されており、規則検索手段によりかな漢字変換の結果の
中に規則辞書に一致するパターンがあれば、規則書き換
え手段はその規則に従って表記を書き換え、出力手段に
より出力する。In the kana-kanji conversion device of the present invention having the above-described structure, first, the kana-kanji conversion string input from the input means is converted by the kana-kanji conversion means by referring to the basic dictionary. Then, the conversion result storage means stores the result of the kana-kanji conversion. The rule dictionary stores rewriting rules corresponding to a plurality of specific word strings including arbitrary part-of-speech information, and if there is a pattern in the result of kana-kanji conversion by the rule searching means that matches the rule dictionary, the rule The rewriting means rewrites the notation according to the rule and outputs it by the output means.
【0009】[0009]
【実施例】以下、本発明を具体化した一実施例を図面を
参照して説明する。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An embodiment of the present invention will be described below with reference to the drawings.
【0010】まず、図2を参照してかな漢字変換装置全
体の構成を説明する。First, the configuration of the entire kana-kanji conversion device will be described with reference to FIG.
【0011】かな漢字変換する文字列を入力するための
入力装置10は、装置全体を制御するためのCPU(中
央処理装置)12に接続されている。記憶手段としての
RAM20はCPU12に接続されており、RAM20
には、かな漢字変換された結果を記憶するための変換結
果記憶領域22と、入力されたかな読み文字列を記憶す
るための読み入力バッファ領域24と、変換結果記憶領
域22の内容をかな漢字文字列にしたものを記憶するた
めの出力バッファ領域26と、ポインタ情報を記憶する
ワークエリア28とが設けられている。An input device 10 for inputting a character string for kana-kanji conversion is connected to a CPU (central processing unit) 12 for controlling the entire device. The RAM 20 serving as a storage unit is connected to the CPU 12, and the RAM 20
Is a conversion result storage area 22 for storing the result of kana-kanji conversion, a reading input buffer area 24 for storing the input kana reading character string, and the contents of the conversion result storage area 22 for kana-kanji character string. An output buffer area 26 for storing the stored information and a work area 28 for storing pointer information are provided.
【0012】変換結果記憶領域22は、図3に示すよう
に、変換結果全体が単語単位で情報を付して記憶されて
おり、単語順位を表すデータ22a、後述する基本辞書
42中に記憶されているそれぞれの単語を識別するため
の固有の数値である単語ID22b、単語の読み22
c、単語の表記22d、後述する品詞情報部48中に記
憶されている各々の品詞情報を識別するための固有の記
号である品詞ID22e、同音語先頭ID22f、同音
語末尾ID22gがデータとして各単語ごとに記憶され
ている。In the conversion result storage area 22, as shown in FIG. 3, the entire conversion result is stored by adding information on a word-by-word basis, and is stored in the data 22a representing the word rank and a basic dictionary 42 described later. Word ID 22b, which is a unique numerical value for identifying each word that is present, and word reading 22
c, word notation 22d, part-of-speech ID 22e, which is a unique symbol for identifying each part-of-speech information stored in the part-of-speech information section 48 described later, homonym start ID 22f, and homonym end ID 22g, as data It is remembered for each.
【0013】尚、同音語先頭ID22fは、入力装置1
0から入力された文字列(単語)と同音であり、基本辞
書42に記憶された単語ID22bの数値が最も小さい
ものを示すものである。また、同音語末尾ID22g
は、入力装置10から入力された文字列(単語)と同音
であり、基本辞書42に記憶された単語ID22bの数
値が最も大きいものを示すものである。The same-sound word head ID 22f corresponds to the input device 1
This is the same as the character string (word) input from 0, and indicates the smallest numerical value of the word ID 22b stored in the basic dictionary 42. Also, the same phoneme ending ID 22g
Indicates a character having the same sound as a character string (word) input from the input device 10 and having the largest numerical value of the word ID 22b stored in the basic dictionary 42.
【0014】プログラムや辞書等を格納するROM30
はCPU12と接続され、プログラム部32と辞書部4
0とからなる。プログラム部32は、かな漢字変換プロ
グラム34と、規則検索プログラム36と、規則書き換
えプログラム38とを格納している。ROM 30 for storing programs, dictionaries, etc.
Is connected to the CPU 12, and the program section 32 and the dictionary section 4
It consists of 0 and. The program section 32 stores a kana-kanji conversion program 34, a rule retrieval program 36, and a rule rewriting program 38.
【0015】また、辞書部40は基本辞書42と、接続
テーブル44と、規則辞書46と、品詞情報部48とか
ら構成されている。基本辞書42は、図4に示すよう
に、その単語の固有の識別識別番号たる単語ID22b
と、その単語の読み22cと、その単語の表記22d
と、品詞ID22eとが記憶されている。The dictionary unit 40 is composed of a basic dictionary 42, a connection table 44, a rule dictionary 46, and a part-of-speech information unit 48. As shown in FIG. 4, the basic dictionary 42 has a word ID 22b that is a unique identification number of the word.
And reading 22c of the word and notation 22d of the word
And the part-of-speech ID 22e are stored.
【0016】接続テーブル44は、単語同士の接続関係
を品詞情報により規定するデータを記憶している。The connection table 44 stores data that defines the connection relationship between words by means of part-of-speech information.
【0017】規則辞書46は、図5に示すように、複数
の規則が格納されており、1規則の内容は、複数の項目
46a〜46cから構成されている。一般に規則の1項
目の内容は、大きく三つに分けられ、<検索因子−検索
情報:書き換え情報>という形で書かれており、この項
目の組合せで一つの規則がつくられる仕組みになってい
る。検索因子とは、規則検索の方法の種類を示すもの
で、U因子、D因子、Y因子、H因子の4種類がある。As shown in FIG. 5, the rule dictionary 46 stores a plurality of rules, and the content of one rule is composed of a plurality of items 46a to 46c. Generally, the content of one item of the rule is roughly divided into three, and is written in the form of <search factor-search information: rewrite information>, and one rule is created by combining these items. .. The search factor indicates the type of rule search method, and there are four types, U factor, D factor, Y factor, and H factor.
【0018】U因子は変換結果記憶領域22に記憶され
ている単語についての読み及び表記との完全一致を意味
し、D因子は変換結果記憶領域22に記憶されている単
語についての読みつまりその単語と同音での一致を意味
する。また、Y因子は変換結果記憶領域22の中に記憶
されている単語列(一単語でもよい)についての読みと
の一致を意味し、H因子は変換結果記憶領域22中に記
憶されている品詞IDとの一致を意味する。検索情報4
6a〜46cとは、その規則の各々の項目の該当する単
語のことを示し、ここには単語の具体的な読み及び表記
または品詞情報が入る。The U factor means a perfect match with the reading and notation of the word stored in the conversion result storage area 22, and the D factor is the reading or the word of the word stored in the conversion result storage area 22. Means the same tone. Further, the Y factor means a match with the reading of the word string (may be one word) stored in the conversion result storage area 22, and the H factor is the part of speech stored in the conversion result storage area 22. It means a match with the ID. Search information 4
6a to 46c represent the corresponding words of each item of the rule, and the specific reading and notation of the word or the part of speech information is entered here.
【0019】書き換え情報は、無変化マーカーN、削除
マーカーD、または単語列のいずれかであり、無変化マ
ーカーNが格納されているときは規則辞書46の項目に
一致した変換結果記憶領域22中の単語をそのままに
し、書き換えないことを表す。また、削除マーカーDが
格納されているときはその項目を削除することを表し、
単語列のときは規則辞書46の項目と一致した変換結果
記憶領域22中の単語をその単語列に書き換えることを
表している。ここでいう単語列とは、1つ以上の単語が
規則辞書46に単語IDで記憶されたものであり、この
単語IDに基づいて基本辞書42を参照することによ
り、変換結果記憶領域22の単語読み22c、同音語先
頭ID22f、同音語末尾ID22g等の設定が可能で
ある。尚、図5においては、理解しやすいように単語I
Dの部分を数値ではなく読み、または表記で表してい
る。The rewriting information is either the unchanged marker N, the deleted marker D, or the word string. When the unchanged marker N is stored, the rewriting information matches the item of the rule dictionary 46 in the conversion result storage area 22. Indicates that the word is left as it is and is not rewritten. When the delete marker D is stored, it means to delete the item,
When it is a word string, it means that the word in the conversion result storage area 22 that matches the item of the rule dictionary 46 is rewritten to the word string. The word string referred to here is one or more words stored in the rule dictionary 46 by word ID, and by referring to the basic dictionary 42 based on this word ID, the words in the conversion result storage area 22 are It is possible to set the reading 22c, the same-sound word start ID 22f, the same-sound word end ID 22g, and the like. In FIG. 5, the word I is used for easy understanding.
The part of D is read or expressed not by a numerical value.
【0020】品詞情報部48には、図6に示すように、
基本辞書42中の品詞ID42aを介して参照する品詞
情報48bが記憶されている。In the part-of-speech information section 48, as shown in FIG.
Part-of-speech information 48b referred to via the part-of-speech ID 42a in the basic dictionary 42 is stored.
【0021】そして、出力バッファ領域26の内容を表
示するための出力装置としての出力装置50はCPU1
2に接続されている。The output device 50 as an output device for displaying the contents of the output buffer area 26 is the CPU 1
Connected to 2.
【0022】次に、このように構成されたかな漢字変換
装置の動作を図7のフローチャートを参照して説明す
る。Next, the operation of the kana-kanji conversion device configured as described above will be described with reference to the flowchart of FIG.
【0023】例えば、読み文字列「はっきりとしない」
が入力装置10より入力されると、そのかな文字コード
がRAM20の読み入力バッファ領域24に記憶される
(S10)。その後、ROM30のかな漢字変換プログ
ラム34により、基本辞書42と品詞情報部48と接続
テーブル44とを参照して、読み入力バッファ領域24
に記憶されているかな文字コードが漢字かな混じり文に
変換され、読み入力バッファ領域24にかな文字コード
で記憶される。例えば、漢字かな混じり文「はっきり都
市内」と変換され、変換結果記憶領域22に記憶される
(S12)。そして、ROM30の規則検索プログラム
36及び規則書き換えプログラム38により、変換結果
記憶領域22の内容と規則辞書46を参照して規則変換
処理が行われる(S14)。For example, the reading character string "not clear"
Is input from the input device 10, the kana character code is stored in the reading input buffer area 24 of the RAM 20 (S10). After that, the kana-kanji conversion program 34 of the ROM 30 refers to the basic dictionary 42, the part-of-speech information section 48, and the connection table 44 to refer to the reading input buffer area 24.
The kana character code stored in is converted into a kanji / kana mixed sentence and stored in the reading input buffer area 24 as the kana character code. For example, the kanji / kana mixed sentence “clearly in the city” is converted and stored in the conversion result storage area 22 (S12). Then, the rule search program 36 and the rule rewrite program 38 of the ROM 30 refer to the contents of the conversion result storage area 22 and the rule dictionary 46 to perform the rule conversion process (S14).
【0024】次に、規則変換処理の具体的な処理につい
て図8、図9、図10のフローチャートを参照して説明
する。Next, a specific process of the rule conversion process will be described with reference to the flow charts of FIGS. 8, 9 and 10.
【0025】まず、前記変換結果記憶領域22に記憶し
た「はっきり都市内」の先頭の単語「はっきり」にポイ
ンタP1を設定し、ポインタP1のポインタ情報がRA
M20のワークエリア28に記憶される(S30)。First, the pointer P1 is set to the first word "clear" in the "clear city" stored in the conversion result storage area 22, and the pointer information of the pointer P1 is RA.
It is stored in the work area 28 of M20 (S30).
【0026】次に、ポインタP1の指す単語と一致する
規則が規則辞書46中にあるか否かを検索する(S3
2)。図10に示す規則検索サブルーチンにおいては、
まず、ポインタP5を規則辞書46中の先頭の規則6−
1に設定し、ポインタ情報をワークエリア28に記億す
る(S320)。次いで、ポインタP6をポインタP5
の指す規則6−1の先頭の項目46aに設定し、ポイン
タ情報がワークエリア28に記憶される(S322)。
次いで、ポインタP7をポインタP1の指す変換結果記
憶領域22中のかな漢字変換結果の先頭の単語に設定す
る(S324)。Next, it is searched whether or not the rule matching the word pointed by the pointer P1 exists in the rule dictionary 46 (S3).
2). In the rule search subroutine shown in FIG.
First, the pointer P5 is set to the first rule 6- in the rule dictionary 46.
1 is set and the pointer information is stored in the work area 28 (S320). Next, the pointer P6 is changed to the pointer P5.
Is set in the first item 46a of the rule 6-1 pointed to by and the pointer information is stored in the work area 28 (S322).
Next, the pointer P7 is set to the leading word of the kana-kanji conversion result in the conversion result storage area 22 pointed to by the pointer P1 (S324).
【0027】そして、ポインタP6の指す項目の検索情
報が品詞情報であるか否かを判別する(S326)。こ
こでは、ポインタP6の指す項目46aは品詞情報の<
H−「と」続く副詞:N>であるので(S326・YE
S)、図6に示す品詞情報部48を規則検索プログラム
36により、はじめから順次検索し、一致する品詞情報
「と」に続く副詞48cがあるので、ポインタP8を品
詞ID(H06)に設定する。次にポインタP8の示す
品詞IDとポインタP7の示す変換結果記憶部22中の
単語品詞IDが同じか比較をする(340)。この場
合、品詞IDは一致するので(S340・YES)S3
30に進む。Then, it is determined whether or not the search information of the item pointed by the pointer P6 is part-of-speech information (S326). Here, the item 46a pointed to by the pointer P6 is the part of speech information <
H- "to" is an adverb that follows: N> (S326 ・ YE
S), the part-of-speech information part 48 shown in FIG. 6 is sequentially searched by the rule search program 36 from the beginning, and there is an adverb 48c following the matching part-of-speech information "to". Therefore, the pointer P8 is set to the part-of-speech ID (H06). .. Next, the part-of-speech ID indicated by the pointer P8 and the word part-of-speech ID in the conversion result storage unit 22 indicated by the pointer P7 are compared (340). In this case, since the part-of-speech IDs match (S340 / YES), S3
Proceed to 30.
【0028】次に、ポインタP6が末尾項目を示してい
るか否かを判断し(S330)、ポインタP6が末尾項
目ではないので(S330・NO)、ポインタP7を変
換結果記憶領域22中に記憶されている「はっきり」の
次の単語「都市」に移動する。そして、ポインタP6も
規則6−1中の次の項目<Y−とし:と,し>(46
b)に移動し、そのポインタ情報をワークエリア28に
記憶し(S332)、前記326に戻る。ここで、ポイ
ンタP6の示す項目<Y−とし:と,し>(46b)
は、品詞情報ではなく(S326・NO)、ポインタP
6の示す項目<Y−とし:と,し>(46b)とポイン
タP7の示す変換結果記憶領域22中の単語「都市」が
一致するので(S328・YES)、S330に進む。
ポインタP6が示す項目は末尾項目ではないので(S3
30・NO)、ポインタP7を変換結果記憶領域22中
に記憶されている「都市」の次の単語「内」に移動し、
ポインタP6も規則6−1中の次の項目<Y−ない:
な,い>(46c)に移動し、そのポインタ情報をワー
クエリア28に記憶し(S332)、前記326に戻
る。Next, it is determined whether or not the pointer P6 indicates the last item (S330). Since the pointer P6 is not the last item (S330.NO), the pointer P7 is stored in the conversion result storage area 22. Move to the next word "city" after "clear". The pointer P6 is also the next item <Y- in rule 6-1: and,> (46
Then, the pointer information is stored in the work area 28 (S332), and the process returns to the step 326. Here, the item indicated by the pointer P6 <Y-:: ,, >> (46b)
Is not the part-of-speech information (S326 / NO), and the pointer P
Since the item <Y-::, >> (46b) indicated by 6 and the word “city” in the conversion result storage area 22 indicated by the pointer P7 match (YES in S328), the process proceeds to S330.
The item indicated by the pointer P6 is not the last item (S3
30 · NO), the pointer P7 is moved to the word “in” next to “city” stored in the conversion result storage area 22,
The pointer P6 also has the next item <Y-not in rule 6-1:
If not, move to (46c), store the pointer information in the work area 28 (S332), and return to 326.
【0029】以下同様の手順により処理を行う(S32
6〜S332)。ポインタR6が末尾項目となったとき
(S330・YES)、規則フラグをONとし、その情
報をワークエリア28に記憶し(S342)、図8に示
すS32に戻る。Thereafter, the same procedure is performed (S32).
6-S332). When the pointer R6 is the last item (YES in S330), the rule flag is turned on, the information is stored in the work area 28 (S342), and the process returns to S32 shown in FIG.
【0030】尚、一致する規則が検索されないとき(S
328・NO)は、ポインタP5の指す規則が規則辞書
中で最後の規則になるまで(S344・NO)、ポイン
タP5を順次、次の規則へ移動し(S346)、一致す
る規則を検索する(S322〜S346)。ポインタP
5が示す規則が、規則辞書で最後の規則となったときは
(S344・YES)、一致する規則がなかったことを
示す規則フラグOFFをワークエリア28に記憶する
(S348)。When a matching rule is not retrieved (S
328.NO) moves the pointer P5 to the next rule in sequence until the rule pointed to by the pointer P5 becomes the last rule in the rule dictionary (S344.NO) (S346), and searches for a matching rule (S346). S322-S346). Pointer P
When the rule indicated by 5 is the last rule in the rule dictionary (YES in S344), the rule flag OFF indicating that there is no matching rule is stored in the work area 28 (S348).
【0031】ここでは、ワークエリア28の規則フラグ
がONとなっているので(S34・YES)、規則書き
換えプログラム38による規則書き換え処理に入る。ま
ず、ポインタP2をポインタP1の指す単語「はっき
り」に設定し、ポインタP2のポインタ情報をワークエ
リア28に記憶する(S36)。次にポインタP3をポ
インタP7が指す変換結果記憶領域22に記憶した単語
列「はっきり都市内」の末尾の「内」に設定し、ポイン
タP3の情報をワークエリア28に記憶する(S3
8)。次にポインタP4を規則辞書42中マッチした規
則6−1(46a)の先頭項目に設定し、ポインタP4
のポインタ情報をワークエリア28に記憶する(S4
0)。規則辞書46中の規則6−1においてポインタP
4の指す先頭項目<H−「と」に続く副詞:N>(46
a)の書き換え情報は無変化マーカーNがついている
(S44・YES)ので、単語「はっきり」は書き換え
ずそのままにし、S46に進む。Here, since the rule flag of the work area 28 is ON (S34, YES), the rule rewriting process by the rule rewriting program 38 starts. First, the pointer P2 is set to the word "clear" pointed by the pointer P1, and the pointer information of the pointer P2 is stored in the work area 28 (S36). Next, the pointer P3 is set to "in" at the end of the word string "clearly in the city" stored in the conversion result storage area 22 pointed to by the pointer P7, and the information of the pointer P3 is stored in the work area 28 (S3).
8). Next, the pointer P4 is set to the head item of the matched rule 6-1 (46a) in the rule dictionary 42, and the pointer P4 is set.
Information of the pointer is stored in the work area 28 (S4
0). Pointer P in rule 6-1 in rule dictionary 46
4 <H-Adverb following "to": N> (46
Since the rewriting information of a) is attached with the unchanged marker N (S44, YES), the word "clear" is left as it is without rewriting, and the process proceeds to S46.
【0032】尚、ポインタP4の指す項目46b中の書
き換え情報の場所に削除マーカーDが立っているときは
(S44・NO、S48・YES)、変換結果記憶領域
22のポインタP2の指す単語を削除し(S50)、S
46に進む。さらにポインタP4の指す項目46b中の
書き換え情報の場所に単語列があるときは(S44・N
O、S48・NO、S52・YES)、変換結果記憶領
域22のポインタP2の指す単語をその単語列と書き換
え(S54)、S46に進む。When the deletion marker D is set at the location of the rewriting information in the item 46b pointed to by the pointer P4 (S44, NO, S48, YES), the word pointed by the pointer P2 in the conversion result storage area 22 is deleted. (S50), S
Proceed to 46. Furthermore, when there is a word string at the location of the rewriting information in the item 46b pointed by the pointer P4 (S44.N
O, S48, NO, S52, YES), the word pointed to by the pointer P2 in the conversion result storage area 22 is rewritten with the word string (S54), and the process proceeds to S46.
【0033】S46においては、ポインタP2の指す単
語とポインタP3の指す単語が同じか比較する。つま
り、ポインタP2指す単語とポインタP3の指す単語が
等しいときは、ポインタP2が最後の単語まで進んだこ
とを意味する。ここで、ポインタP2の指す「はっき
り」は変換結果記憶領域22に記憶されている変換結果
の最後の単語ではないので(S46・NO)、ポインタ
P2を次の単語「都市」に移動し、ポインタP4を規則
辞書46中の次の項目<Y−とし:とし>に移動する
(S56)、そして、前記S44に戻る。In S46, the word pointed by the pointer P2 is compared with the word pointed by the pointer P3. That is, when the word pointed by the pointer P2 and the word pointed by the pointer P3 are equal, it means that the pointer P2 has advanced to the last word. Here, since "clearly" pointed by the pointer P2 is not the last word of the conversion result stored in the conversion result storage area 22 (S46, NO), the pointer P2 is moved to the next word "city", and the pointer is moved. P4 is moved to the next item in the rule dictionary 46 <Set as Y-: Set as> (S56), and the process returns to S44.
【0034】ここではポインタP4の指す項目<Y−と
し:と,し>に単語列があるので(S44・NO、S4
8・NO、S52・YES)、「都市」を「とし」と書
き換え(S54)、S46に進む。このようにして、順
次変換結果記憶領域22の内容を規則の書き換え指示に
従って処理していく(S44〜S56)。Since there is a word string in the item <Y-::, shi> indicated by the pointer P4 (S44, NO, S4).
8. NO, S52, YES), "city" is rewritten as "to" (S54), and the process proceeds to S46. In this way, the contents of the sequential conversion result storage area 22 are processed according to the rule rewriting instruction (S44 to S56).
【0035】ポインタP2とポインタP3の指す単語が
同じになったとき、つまり、ポインタP2が指す単語
が、変換結果記憶領域22に記憶されている末尾の単語
になったとき(S46・YES)、ポインタP1が変換
結果記憶領域22に記憶されている単語列の末尾の単語
になければ(S58・NO)、ポインタP1を次の単語
へ一つずつ移動させ(S60)、再び同様の規則検索処
理を規則検索プログラム36により行う。この場合は、
ポインタP1を変換結果記憶領域22に記憶された文字
列「はっきり都市内」の二番目の単語「都市」に移動す
る(S58・NO、S60)。そして、S32〜S60
の処理を繰り返す。最後にポインタP1が変換結果記憶
領域22中の末尾の単語のとき(S58・YES)、規
則変換処理を終了する。When the words pointed to by the pointers P2 and P3 become the same, that is, when the word pointed by the pointer P2 becomes the last word stored in the conversion result storage area 22 (S46, YES), If the pointer P1 is not at the end word of the word string stored in the conversion result storage area 22 (S58, NO), the pointer P1 is moved to the next word one by one (S60), and the same rule search process is performed again. Is performed by the rule search program 36. in this case,
The pointer P1 is moved to the second word "city" of the character string "clearly in the city" stored in the conversion result storage area 22 (S58, NO, S60). And S32 to S60
The process of is repeated. Finally, when the pointer P1 is the last word in the conversion result storage area 22 (YES in S58), the rule conversion process ends.
【0036】この結果が再度変換結果記憶領域22に格
納され、そして、前記変換結果記憶領域22の内容が出
力バッファ領域26に格納され、出力装置50に表示さ
れる(図7・S16)。その後、ユーザーから確定キー
が入力されれば終了である(S18・YES)。確定キ
ー以外のものが入力されたときは(S18・NO)、候
補変更処理に進む(S20)。その結果は再度、変換結
果記憶領域22に格納される。そして前記変換結果22
の内容が出力バッファ領域26に格納され、出力装置5
0に表示される(S16)。その後、ユーザーから確定
キーが入力されれば(S18・YES)終了する。This result is stored again in the conversion result storage area 22, and the contents of the conversion result storage area 22 are stored in the output buffer area 26 and displayed on the output device 50 (S16 in FIG. 7). After that, if the confirmation key is input by the user, the process ends (S18, YES). When a key other than the enter key is input (S18, NO), the process proceeds to the candidate changing process (S20). The result is stored again in the conversion result storage area 22. And the conversion result 22
Of the output device 5 is stored in the output buffer area 26.
0 is displayed (S16). After that, if the confirmation key is input by the user (S18, YES), the process ends.
【0037】従来は「はっきりとしない」「びくびくと
しない」など「『と』に続く副詞+としない」という単
語列に関しての規則をいちいち、ひとつひとつの副詞に
ついて作らなければならなかったが、品詞情報を検索因
子として用いることにより、規則辞書作成の労力の削減
と規則辞書の占めるメモリの低減を図ることができる。
また、規則変換を効率的におこなうことも可能である。Conventionally, rules for word strings such as "not clear" and "not jerk" do not say "adverb +" do not follow adverb "" must be made for each adverb. By using as a search factor, it is possible to reduce the labor for creating the rule dictionary and the memory occupied by the rule dictionary.
It is also possible to efficiently perform rule conversion.
【0038】同様に、図5の規則6―2の例のように、
「いがいときれいだった」が「以外ときれいだった」、
「いがいとかんようなひと」が「以外と寛容な人」とな
るなど「以外と+形容動詞」という変換結果になってし
まった場合に、本規則変換において「意外と+形容動
詞」と書き換えられるので、やはり、形容動詞ひとつひ
とつについて、いちいち同じ書き換えをする規則を作ら
なくても済み、上記同様の効果を得ることができる。Similarly, as in the example of rule 6-2 in FIG.
"It was beautiful when I was young," but "It was beautiful except."
If the conversion result of "other than + adjective verb" such as "Iigaitokantohito" becoming "other than forgiving person" is rewritten as "unexpected and + adjective verb" in this rule conversion Therefore, again, it is not necessary to make a rule to rewrite the same adjectives one by one, and the same effect as described above can be obtained.
【0039】また、図5の規則6−3の「あかちゃんが
ゆっくりたつ」「あかちゃんがしっかりたつ」などの例
においても、「赤ちゃんが(副詞)建つ(絶つ、経つ、
…)」という、通常のかな漢字変換結果がなされたとき
に、いちいち、「ゆっくり」「しっかり」などの副詞を
入れ換えただけの同じような規則を作らなくて済み、上
記同様の効果を得ることができる。Also, in the example of "Aka-chan is slowly standing" and "Aka-chan is firmly standing" in Rule 6-3 of FIG. 5, "Baby (adverb) stands (cut, passed,
It is not necessary to make a similar rule just by replacing adverbs such as "slow" and "firm" when the usual kana-kanji conversion result is made, and the same effect as above can be obtained. it can.
【0040】なお、本発明は、上記の例に示すような品
詞情報を用いた規則変換に限らず、基本辞書から参照で
きる情報を用いた規則変換に適用することができる。The present invention can be applied not only to the rule conversion using the part-of-speech information as shown in the above example, but also to the rule conversion using the information that can be referred to from the basic dictionary.
【0041】また、規則辞書の規則数や項目数は本実施
例の数に限ったものではない。The number of rules and the number of items in the rule dictionary are not limited to those in this embodiment.
【0042】[0042]
【発明の効果】以上説明したことから明らかなように、
本発明のかな漢字変換装置は規則変換処理において、こ
れまで、同じ品詞の単語を入れ換えただけの同じような
規則をいくつも作らなければならなかったが、検索情報
として品詞情報を用いることにより、それらをまとめて
規則を作ることができるようになったため、規則辞書作
成の労力低減を図ることができ、規則辞書のメモリ容量
も低減することができる。また、ひとつの規則によっ
て、いくつもの文例に適用することができるようにな
る。As is clear from the above description,
In the rule conversion process, the kana-kanji conversion device of the present invention had to make many similar rules by simply replacing words of the same part of speech, but by using part-of-speech information as search information, Since it is now possible to make rules together, it is possible to reduce the labor for creating the rule dictionary and also reduce the memory capacity of the rule dictionary. Also, one rule can be applied to many sentence examples.
【図1】本発明の構成図である。FIG. 1 is a configuration diagram of the present invention.
【図2】本実施例によるかな漢字変換装置の制御部のブ
ロック図である。FIG. 2 is a block diagram of a control unit of the kana-kanji conversion device according to the present embodiment.
【図3】本実施例による変換結果記憶領域の概念図であ
る。FIG. 3 is a conceptual diagram of a conversion result storage area according to the present embodiment.
【図4】本実施例の基本辞書の内容の概念図である。FIG. 4 is a conceptual diagram of contents of a basic dictionary of this embodiment.
【図5】本実施例の規則辞書の内容の概念図である。FIG. 5 is a conceptual diagram of contents of a rule dictionary of this embodiment.
【図6】本実施例の品詞情報部の内容の概念図である。FIG. 6 is a conceptual diagram of contents of a part-of-speech information unit of the present embodiment.
【図7】本実施例のかな漢字変換装置のフローチャート
である。FIG. 7 is a flowchart of the kana-kanji conversion device of the present embodiment.
【図8】本実施例の規則変換のフローチャートである。FIG. 8 is a flowchart of rule conversion of this embodiment.
【図9】本実施例の規則変換のフローチャートである。FIG. 9 is a flowchart of rule conversion of this embodiment.
【図10】本実施例の規則検索のフローチャートであ
る。FIG. 10 is a flowchart of a rule search according to this embodiment.
10 入力装置 12 CPU 20 RAM 22 変換結果記憶領域 24 読み入力バッファ領域 26 出力バッファ領域 30 ROM 31 プログラム部 34 かな漢字変換プログラム 36 規則検索プログラム 38 規則書き換えプログラム 40 辞書部 42 基本辞書 44 接続テーブル 46 規則辞書 48 品詞情報部 50 出力装置 10 Input Device 12 CPU 20 RAM 22 Conversion Result Storage Area 24 Reading Input Buffer Area 26 Output Buffer Area 30 ROM 31 Program Section 34 Kana-Kanji Conversion Program 36 Rule Search Program 38 Rule Rewriting Program 40 Dictionary Section 42 Basic Dictionary 44 Connection Table 46 Rule Dictionary 48 part-of-speech information section 50 output device
Claims (1)
段と、 単語の読みに対する表記等を記憶した基本辞書と、 前記基本辞書を参照し、かな漢字変換を行うかな漢字変
換手段と、 前記かな漢字変換手段による変換結果を記憶する変換結
果記憶手段と、 前記かな漢字変換の結果を出力するための出力手段とを
備えたかな漢字変換装置において、 前記基本辞書の特定の単語の品詞情報と、当該単語を含
む単語列のパターンと、その単語列に対しての書き換え
情報とを記憶した規則辞書と、 前記変換結果記憶手段の内容について前記規則辞書中か
ら品詞情報を参照して一致するパターンを検索する規則
検索手段と、 前記規則検索手段により一致したパターンが検索された
とき、該当の変換結果記憶手段の内容を前記規則辞書の
書き換え情報に基づいて書き換える規則書き換え手段と
を備えたことを特徴とするかな漢字変換装置。1. A kana-kanji conversion unit for inputting a kana-yomi character string, a basic dictionary storing notations for reading the words, kana-kanji conversion means for converting kana-kanji by referring to the basic dictionary, and the kana-kanji conversion. A kana-kanji conversion device comprising conversion result storage means for storing conversion results by means, and output means for outputting the kana-kanji conversion result, including part-of-speech information of a specific word in the basic dictionary, and the word. A rule dictionary that stores a pattern of a word string and rewriting information for the word string, and a rule search for searching for a matching pattern in the rule dictionary for the contents of the conversion result storage means by referring to part-of-speech information Means, and when the matching pattern is searched by the rule search means, the contents of the corresponding conversion result storage means are converted into rewriting information of the rule dictionary. Kana-kanji conversion apparatus being characterized in that a rule rewriting means for rewriting Zui.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3236297A JPH0573540A (en) | 1991-09-17 | 1991-09-17 | Kana-Kanji converter |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3236297A JPH0573540A (en) | 1991-09-17 | 1991-09-17 | Kana-Kanji converter |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH0573540A true JPH0573540A (en) | 1993-03-26 |
Family
ID=16998708
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3236297A Pending JPH0573540A (en) | 1991-09-17 | 1991-09-17 | Kana-Kanji converter |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0573540A (en) |
-
1991
- 1991-09-17 JP JP3236297A patent/JPH0573540A/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0573540A (en) | Kana-Kanji converter | |
| JP3342027B2 (en) | Kana-Kanji conversion device | |
| JPH0612548B2 (en) | Document processor | |
| JP3342028B2 (en) | Kana-Kanji conversion device | |
| JP2819612B2 (en) | Character converter | |
| JPH0581262A (en) | 'kana'/'kanji' converter | |
| JP3350070B2 (en) | Kana-Kanji conversion device | |
| JP2634926B2 (en) | Kana-Kanji conversion device | |
| JP3342026B2 (en) | Kana-Kanji conversion device | |
| JPH0581238A (en) | Kana-Kanji converter | |
| JPH0573536A (en) | Kana/kanji conversion device | |
| JPH0716192Y2 (en) | Text processor | |
| JPH05108627A (en) | Kana to kanji converter | |
| JPH05108618A (en) | Kana to kanje converter | |
| JPH05143579A (en) | Kana-Kanji converter | |
| JPH05108625A (en) | Kana to kanji converter | |
| JPH05108624A (en) | Kana-Kanji converter | |
| JPH05108623A (en) | Kana-Kanji converter | |
| JPH0623973B2 (en) | Character processor frequency change method | |
| JPH1125083A (en) | Kana-kanji conversion device and computer-readable storage medium | |
| JPH05120266A (en) | Japanese syllabary to chinese character conversion device | |
| JPH05120265A (en) | Kana-Kanji converter | |
| JPH05108626A (en) | Kana to kanji converter | |
| JPH0573539A (en) | Kana/kanji conversion device | |
| JPH06110877A (en) | Kana-Kanji conversion device |