JPH02139662A - Kana/kanji converting device - Google Patents
Kana/kanji converting deviceInfo
- Publication number
- JPH02139662A JPH02139662A JP63293945A JP29394588A JPH02139662A JP H02139662 A JPH02139662 A JP H02139662A JP 63293945 A JP63293945 A JP 63293945A JP 29394588 A JP29394588 A JP 29394588A JP H02139662 A JPH02139662 A JP H02139662A
- Authority
- JP
- Japan
- Prior art keywords
- kana
- character string
- word
- converted
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。(57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.
Description
【発明の詳細な説明】
(イ)産業上の利用分野
この発明は、主として日本語ワードプロセッサのような
文書処理装置に用いられ、入力されたかな文字列を漢字
かな交じり文や片かな平がな交じり文に変換するかな漢
字変換装置に関する。[Detailed description of the invention] (a) Industrial application field This invention is mainly used in document processing devices such as Japanese word processors, and converts input kana character strings into kanji, kana, mixed sentences, and hiragana. This article relates to a kana-kanji conversion device that converts into mixed sentences.
(ロ)従来の技術
上述したような日本語ワードプロセッサのかな漢字変換
処理においては、従来は、キーボードからかな文字列を
入力して、かな漢字変換を指示した場合、その入力され
たかな文字列は、辞書に記憶されている漢字又は漢字か
な交じり表記の単語に順次変換されるようになっており
、表記の選択については、使用者が変換の指示を継続し
て行う1ことにより、所望の表記の単語をキーボードか
ら選択するようにしている。(b) Conventional technology In the kana-kanji conversion process of the Japanese word processor mentioned above, conventionally, when a kana character string is input from the keyboard to instruct kana-kanji conversion, the input kana character string is stored in a dictionary. Words written in kanji or kanji and kana are sequentially converted into the words stored in the kanji or kanji/kana mixture.The user continues to give instructions for conversion, and the word written in the desired notation is selected by the user. is selected from the keyboard.
また、片かな変換処理においては、第1の方法として、
入力された各かな文字を片かな文字にI対lに対応させ
てそのまま片かな文字に変換するようにしたものや、第
2の方法として、入力されたかな文字列を片かな部分と
平がな部分とに分け、平がな部分を付属語辞書によって
検定することにより、片かな部分と平がな部分との適正
配分を決定するようにしたものや(特開昭61−120
276号公報参照)、第3の方法として、入力されたか
な文字列を辞書によって漢字と同じように片かな文字列
に変換するようにしたもの(特開昭60−160469
号公報、特開昭63−49965号公報、いずれも参照
)が見られる。In addition, in the one-sided conversion process, as a first method,
There is a method in which each input kana character is converted to a katakana character by corresponding I to l, and a second method is to convert the input kana character string into a katakana character and a hira character. The proper distribution of the katakana part and the hiragana part is determined by dividing the hiragana part into a katakana part and examining the hiragana part using an attached word dictionary (Japanese Patent Application Laid-Open No. 120-198).
(Refer to Publication No. 276), and as a third method, the input kana character string is converted into a single character string in the same way as kanji using a dictionary (Japanese Patent Laid-Open No. 160469/1983).
(see both Japanese Patent Application Laid-open No. 63-49965).
(ハ)発明が解決しようとする課題
しかしながら、上述のようなかな漢字変換処理において
は、
■所望の単語が表示されるまで何回も変換を指示しなけ
ればならず、変換指示の回数がいたずらに多い。(C) Problems to be Solved by the Invention However, in the above-mentioned kana-kanji conversion process, ■ conversion instructions must be given many times until the desired word is displayed, and the number of conversion instructions becomes unnecessary. many.
■所望の単語に近いものが表示されても、さらに変換を
指示すると、全然別の単語に変換されていまうことがあ
る。■Even if a word similar to the desired word is displayed, if you instruct further conversion, it may end up being converted into a completely different word.
■所望の単語が辞書に無いことが最後まではっきりわか
らない、等の問題がある。■There are problems such as the fact that it is not clear until the end that the desired word is not in the dictionary.
また、片かな変換処理の第1の方法においては、入力さ
れたかな文字列の構成要素を解析しないで単に片かな文
字列に変換してしまうために、付属語(助詞、助動詞等
)も片かな文字に変換してしまという問題がある。In addition, in the first method of katakana conversion processing, the input kana character string is simply converted into a katana character string without analyzing its constituent elements, so attached words (particles, auxiliary verbs, etc.) are also katakana. There is a problem with converting to kana characters.
これは例えば、「鯨が」という表現を例にとると、「く
じらが」と入力した場合には(片かな入力、あるいは、
平がな入力後片かなに一括変換)、「クジラガ」と変換
されてしまい、本来の「クジラが」に変換することはで
きない。これを修正するためには、1文字づつの修正を
行うか、あるいは、「くじらが」を「くじらJと「が」
に分けて入力する方法が考えられるが、操作の手間がか
かりすぎる。For example, if we take the expression "kujiraga" as an example, if you input "kujiraga" (one-sided input, or
(batch conversion to katakana after inputting hiragana), it is converted to ``kujiraga'' and cannot be converted to the original ``kujiraga''. In order to correct this, you need to correct each letter one by one, or change ``Kujiraga'' to ``Kujira J'' and ``GA''.
One possible method is to input the information separately, but it would take too much time and effort.
さらに、第2の方法においては、片かな部分と平がな部
分との適正配分を付属語辞書によって決定するまでに時
間がかるという問題がある。Furthermore, in the second method, there is a problem in that it takes time to determine the appropriate distribution of Katakana and Hiragana parts using the ancillary word dictionary.
そして、第3の方法においては、先程の「鯨が」を例に
とると、辞書に“鯨”と“クジラ“の両方を登録するよ
うにしておけば、変換指示によって容易に「クジラが」
と変換することができるが、この場合には、−語に要す
る辞書メモリの容量が多くなり、限られた容量内では多
くの単語を登録できないという問題がある。In the third method, taking "Kujira ga" as an example, if both "Kujira" and "Kujira" are registered in the dictionary, "Kujira ga" can be easily changed by the conversion instruction.
However, in this case, the dictionary memory capacity required for the - word increases, and there is a problem that many words cannot be registered within the limited capacity.
また、別の例を挙げれば、例えば「しんかんかくは」と
いう文字列が入力された場合には、最後の文字の「はJ
が付属語なのか接尾語なのかはっきりしないため、どこ
まで片かなに変換してよいのかわからないという問題も
ある。これは、漢字に変換する場合であれば、「は」が
付属語のときは「新感覚は」、接尾語のときは「新感覚
派」であり、片かな変換の場合には、それぞれ「シンカ
ンカフは」、あるいは「シンカンカフ派」と変換しなけ
ればならないが、このような付属語と接尾語の判定がで
きない。To give another example, if the character string ``Shinkankakuha'' is input, the last character ``Ha is J
There is also the problem of not knowing to what extent it should be converted into katakana, as it is not clear whether it is an adjunct or a suffix. When converting to kanji, when ``ha'' is an adjunct, it is ``shinsensakuha'', and when it is a suffix, it is ``shinsensakuha'', and in the case of katakana conversion, it is ``shinsensakuha'', respectively. It must be converted to ``Shinkankafwa'' or ``Shinkankafha,'' but it is not possible to determine such adjuncts and suffixes.
この発明は、このような事情を考慮してなされたもので
、かな漢字変換処理においては、単語を1つの読みに対
して複数の同音同義語表記の単語に変換するようにして
単語の選択にN層性を持たせ、また、片かな変換処理に
おいては、単語とそれに続く付属語との構成要素を考慮
して、単語のみを片かな文字に変換するようにしたかな
漢字変換装置を提供するものである。This invention was made in consideration of such circumstances, and in the kana-kanji conversion process, a word is converted into words with multiple homophone synonyms for one reading, thereby reducing the number of words in the selection process. To provide a kana-kanji conversion device that converts only words into katakana characters by giving layers and taking into consideration the constituent elements of the word and the adjunct following it in the katakana conversion process. be.
(ニ)課題を解決するための手段
第1図は本願の請求項1に係る発明の構成を示すブロッ
ク図であり、図に示すように、請求項1に係る発明は、
入力手段101から入力されたかな文字列を記憶する記
憶手段102と、記憶手段102に記憶されたかな文字
列を解析し単語として変換可能なかな文字列と助詞・助
動詞等からなる付属語としてのかな文字列とに分割する
と共に単語として変換可能なかな文字列を漢字又は漢字
かな交じり表記の単語に変換するかな漢字変換手段10
3と、前記単語として変換可能なかな文字列をかな漢字
変換手段103によって変換された単語と同じ読みでか
つ同じ意味の複数種類の同音同義語表記の単語に変換す
る同音同義語変換手段104と、入力手段101から入
力された内容及びかな漢字変換手段103と同音同義語
変換手段104によって変換された内容を表示する表示
手段105を具備してなるかな漢字変換装置である。(d) Means for Solving the Problems FIG. 1 is a block diagram showing the configuration of the invention according to claim 1 of the present application. As shown in the figure, the invention according to claim 1 includes:
A storage means 102 for storing a kana character string inputted from the input means 101, and a storage means 102 for storing a kana character string input from the input means 101, and a kana character string that can be analyzed and converted into a word as an adjunct word consisting of a kana character string, a particle, an auxiliary verb, etc. Kana-Kanji conversion means 10 that divides Kana character strings into Kana character strings and converts Kana character strings that can be converted into words into Kanji or words written with Kanji and Kana mixed.
3, a homophone synonym conversion means 104 that converts the kana character string that can be converted into a word into a plurality of types of homophone synonym notation words that have the same pronunciation and the same meaning as the word converted by the kana-kanji conversion means 103; This is a kana-kanji conversion device comprising a display means 105 for displaying the contents inputted from the input means 101 and the contents converted by the kana-kanji conversion means 103 and the homophone-synonym conversion means 104.
また、第2図は本願の請求項2に係る発明の構成を示す
ブロック図であり、図に示すように、請求項2に係る発
明は、入力手段101から入力されたかな文字列を記憶
する記憶手段+02と、記憶手段102に記憶されたか
な文字列を解析し単語として変換可能なかな文字列と助
詞・助動詞等からなる付属語としてのかな文字列とに分
割すると共に単語として変換可能なかな文字列を漢字又
は漢字かな交じり表記の単語に変換するかな漢字変換手
段+03と、前記単語として変換可能なかな文字列をそ
の各かな文字にl対lに対応する片かな文字列に変換す
る片かな変換手段+06と、入力手段!01から入力さ
れた内容及びかな漢字変換手段103と片かな変換手段
106によって変換された内容を表示する表示手段10
7を具備してなるかな漢字変換装置である。Further, FIG. 2 is a block diagram showing the configuration of the invention according to claim 2 of the present application, and as shown in the figure, the invention according to claim 2 stores the kana character string input from the input means 101. The kana character strings stored in the storage means +02 and the storage means 102 are analyzed and divided into kana character strings that can be converted into words and kana character strings as attached words consisting of particles, auxiliary verbs, etc., and can be converted into words. A kana-kanji conversion means +03 that converts a kana character string into a word written in kanji or a combination of kanji and kana; and a kana character string that converts a kana character string that can be converted into a word into a kana character string that corresponds to each kana character in l to l ratio. Kana conversion means +06 and input means! Display means 10 for displaying the content input from 01 and the content converted by the kana-kanji conversion means 103 and the katakana conversion means 106
This is a kana-kanji conversion device equipped with 7.
なお、この発明における同音同義語表記の単語とは、一
つの語に対して複数の表記が存在することから「出力の
ゆらぎ」とも呼ばれ、読みと意味が同じで表記が異なる
単語を意味する。In addition, in this invention, a word with homophone synonym notation is also called "output fluctuation" because there are multiple notations for one word, and means a word with the same reading and meaning but different notations. .
すなわち、第4図にその一例を示すように、っの単語に
対して、平がな7片かな/通常の漢字表記/通常の漢字
表記とは送りがなの違うもの/当て字/異体字、への各
変換を意味する。In other words, as an example is shown in Figure 4, for the word tsu, there are seven hiragana characters, normal kanji notation, okurigana different from the normal kanji notation, appropriate characters, variant characters, etc. means each conversion.
また、この発明におけるかな漢字変換手段103は、従
来より公知の、通常のかな漢字変換装置であり、かな漢
字変換用の辞書を含むものである。Further, the kana-kanji conversion means 103 in the present invention is a conventionally known ordinary kana-kanji conversion device, and includes a dictionary for kana-kanji conversion.
さらに、この発明における入力手段101としては、か
な文字列を入力できる装置であればよく、例えば、キー
ボード装置、タブレット装置、OCR等や、磁気テープ
、フロッピーディスク等の外部記憶装置が用いられる。Further, the input means 101 in the present invention may be any device that can input a kana character string, such as a keyboard device, a tablet device, an OCR, or an external storage device such as a magnetic tape or floppy disk.
そして、表示手段105,107としては、入力された
かな文字列や、変換された漢字かな交じり文や片かな平
がな交じり文を表示できるものであればよく、例えば、
CRTデイスプレィ装置やLC(液晶)デイスプレィ装
置、あるいはELデイスプレィ装置等が用いられる。The display means 105 and 107 may be any device that can display the input kana character string, the converted kanji-kana mixed sentence, or the katakana-hiragana mixed sentence, for example,
A CRT display device, an LC (liquid crystal) display device, an EL display device, or the like is used.
また、同音同義語変換手段104は、変換のための辞書
を含むが、この辞書は、かな漢字変換手段103に含ま
れた辞書との共有であってもよい。Further, the homophone and synonym conversion means 104 includes a dictionary for conversion, but this dictionary may be shared with the dictionary included in the kana-kanji conversion means 103.
さらに、かな漢字変換手段!03、同音同義語変換手段
104及び片かな変換手段106としては、一般に、C
PU、ROM、RAM、I10ボートからなるマイクロ
コンピュータを用いるのが便利であり、記憶手段102
としては、通常、その中のRA Mが用いられる。In addition, a kana-kanji conversion method! 03, the homophone synonym conversion means 104 and the unilateral conversion means 106 are generally C
It is convenient to use a microcomputer consisting of PU, ROM, RAM, and I10 board, and the storage means 102
As such, RAM is usually used therein.
(ホ)作用
第1図に示した本願の請求項1の発明によれば、入力手
段!01から入力されて記憶手段102に記憶されたか
な文字列は、かな漢字変換手段+03により、単語とし
て変換可能なかな文字列と付属語としてのかな文字列と
に分割され、単語として変換可能なかな文字列は、漢字
又は漢字かな交じり表記の単語に変換される。(E) Effect According to the invention of claim 1 of the present application shown in FIG. 1, the input means! The kana character string input from 01 and stored in the storage means 102 is divided by the kana-kanji conversion means +03 into a kana character string that can be converted into a word and a kana character string as an attached word. The character string is converted into a word written in Kanji or a mixture of Kanji and Kana.
また、単語として変換可能なかな文字列は、同音同義語
変換手段104により、複数種類の同音同義語表記の単
語に変換され、その内容が表示手段105に表示される
。Furthermore, a kana character string that can be converted into a word is converted into words expressed by a plurality of types of homophone and synonyms by the homophone and synonym conversion means 104, and the contents thereof are displayed on the display means 105.
従って、単語として変換可能なかな文字列は、平がな7
片かな/通常の漢字表記/通常の漢字表記とは送りがな
の違うもの/当て字/異体字の、同じ読みで同じ意味の
表記の単語に変換されるため、単語の選択に階層性を持
たせることができ、所望の表記の単語を効率良く選択す
ることができる。Therefore, a kana character string that can be converted into a word is hiragana 7
Katakana/normal kanji notation/words with different kanji from normal kanji notation/aji/variant characters are converted into words with the same reading and the same meaning, so create a hierarchy in the selection of words. , and it is possible to efficiently select words with the desired notation.
また、第2図に示した本願の請求項2の発明によれば、
入力手段+01から入力されて記憶手段+02に記憶さ
れたかな文字列は、かな漢字変換手段103により、単
語として変換可能なかな文字列と付属語としてのかな文
字列とに分割され、単語として変換可能なかな文字列は
、漢字又は漢字かな交じり表記の単語に変換される。Furthermore, according to the invention of claim 2 of the present application shown in FIG.
The kana character string input from the input means +01 and stored in the storage means +02 is divided by the kana-kanji conversion means 103 into a kana character string that can be converted into a word and a kana character string as an attached word, and can be converted as a word. Nakakana character strings are converted into words written in Kanji or a combination of Kanji and Kana.
また、単語として変換可能なかな文字列は、片かな変換
手段106により、その各かな文字にl対lに対応する
片かな文字列に変換され、その内容が表示手段107に
表示される。Furthermore, a kana character string that can be converted into a word is converted by a katakana conversion means 106 into a katakana character string that corresponds to each kana character on a ratio of 1 to 1, and the contents thereof are displayed on a display means 107.
従って、片かな語を辞書に登録しておくよりも辞書メモ
リの容量をはるかに節約することが可能となり、さらに
、付属語の情報が解析されているので、単なる従来の片
かな変換よりも使用者の要望に近い片かな表記を容易に
得ることができる。Therefore, it is possible to save much more dictionary memory space than registering single words in a dictionary, and since information on adjunct words has been analyzed, it is easier to use than just conventional single word conversion. It is possible to easily obtain a simple notation that is close to the wishes of the user.
(へ)実施例
以下、図面に示す実施例に基づいてこの発明を詳述する
。なお、これによってこの発明が限定されるものではな
い。(f) Examples Hereinafter, the present invention will be described in detail based on examples shown in the drawings. Note that this invention is not limited to this.
第3図はこの発明の一実施例の構成を示すブロック図で
ある。FIG. 3 is a block diagram showing the configuration of an embodiment of the present invention.
この図において、!は入力手段としてのキーボードであ
る。キーボードlは、かなキー、アルファベットキー等
の文書入力のための各種のキーと、かな漢字変換を指示
するための変換キー、及び、後述する同音同義語変換と
仮かな変換のための副変換キーとを備えており、かな文
字列の情報や各種の指示情報を制御部2に入力する(変
換キー及び副変換キーは図示しない)。In this figure,! is a keyboard as an input means. The keyboard l has various keys for document input such as kana keys and alphabet keys, a conversion key for instructing kana-kanji conversion, and sub-conversion keys for homophone synonym conversion and temporary kana conversion, which will be described later. , and inputs information on kana character strings and various instruction information to the control unit 2 (conversion keys and subconversion keys are not shown).
制御部2はCPU、ROM、RAM、I10ボートから
なるマイクロコンピュータから構成され、ROMに書き
込まれている制御プログラムに従いデータ処理を行う。The control unit 2 is composed of a microcomputer consisting of a CPU, ROM, RAM, and I10 board, and performs data processing according to a control program written in the ROM.
以下、このデータ処理機能を有する仮想的回路ブロック
を想定して説明する。The following description assumes a virtual circuit block having this data processing function.
3はキーボードlから入力されたかな文字列を記憶する
RAMからなる記憶手段である。Reference numeral 3 denotes storage means consisting of a RAM for storing kana character strings input from the keyboard l.
4はかな漢字変換手段であり、かな漢字変換用の単語辞
書を備えている。4 is a kana-kanji conversion means and is equipped with a word dictionary for kana-kanji conversion.
かな漢字変換手段4は、キーボードlの変換キーが押し
下げられた場合には、まず、記憶手段3に記憶されてい
るかな文字列を解析する。この解析は、単語辞書や文法
などの言語的な情報、単語の出現頻度などの確率的な情
報を利用して、通常用いられる公知のかな漢字変換アル
ゴリズムに基づいて行われ、かな漢字変換手段4は、こ
の解析により、記憶手段3に記憶されているかな文字列
を、接頭語・語幹・接尾語等からなる単語として変換可
能なかな文字列と、助詞・助動詞等からなる付属語とし
てのかな文字列とに分割する。The kana-kanji conversion means 4 first analyzes the kana character string stored in the storage means 3 when the conversion key on the keyboard l is pressed down. This analysis is performed based on a commonly used kana-kanji conversion algorithm, using linguistic information such as word dictionaries and grammar, and probabilistic information such as word frequency. Through this analysis, the kana character string stored in the storage means 3 is converted into a kana character string that can be converted into a word consisting of a prefix, a word stem, a suffix, etc., and a kana character string as an adjunct consisting of a particle, an auxiliary verb, etc. Divide into.
そして、単語として変換可能なかな文字列を漢字又は漢
字かな交じり表記の単語に変換する。Then, a kana character string that can be converted into a word is converted into a word written in kanji or a combination of kanji and kana.
5は同音同義語変換手段であり、キーボードlの変換キ
ーに続いて副変換キーが押し下げられた場合には、かな
漢字変換手段4によって分割された、単語として変換可
能なかな文字列を、かな漢字変換手段4によって変換さ
れた単語と同じ読みでかつ同じ意味の複数種類の同音同
義語表記の単語に変換する。5 is a homophone synonym conversion means, and when the subconversion key is pressed after the conversion key on the keyboard l, the kana character string that has been divided by the kana-kanji conversion means 4 and can be converted into words is converted into kana-kanji. The word converted by means 4 is converted into a plurality of types of words with the same pronunciation and the same meaning as the converted word.
ここで同音同義語表記の単語とは、一つの語に対して複
数の表記が存在することから「出力のゆらぎ」とも呼ば
れ、読みと意味が同じで表記が異なる単語のことである
。Here, words with homophone and synonym notation are also called "output fluctuations" because there are multiple notations for one word, and are words that have the same pronunciation and meaning but different notations.
第4図に示したものは、同音同義語変換の内容の一例を
示す説明図であり、図に示すように、同音同義語変換に
おいては、平がな7片かな/通常の漢字表記/通常の漢
字表記とは送りがなの違うもの/当て字/異体字、が−
単語のグループとされ、これらのグループ単位で変換が
行われる。What is shown in Figure 4 is an explanatory diagram showing an example of the content of homophone synonym conversion. The kanji notation is different from the kanji written in the kanji.
It is treated as a group of words, and conversion is performed in units of these groups.
6は片かな変換手段であり、キーボードlからかな文字
列が入力された後、変換キーが押し下げられないで直接
側変換キーが押し下げられた場合には、かな漢字変換手
段4によって解析された、単語として変換可能なかな文
字列を、その各かな文字に1対1に対応する片かな文字
列に変換する。6 is a one-sided conversion means, and after a kana character string is input from the keyboard l, if the conversion key is not pressed down but the direct conversion key is pressed down, the word that is analyzed by the kana-kanji conversion means 4 is Converts a kana character string that can be converted into a katana character string that corresponds one-to-one to each kana character.
この変換は、記憶手段3に記憶されているかな文字列が
、かな漢字変換手段4によって既に漢字または漢字かな
交じりの単語に変換されている場合には、副変換キーの
押7し下げにより、その単語を一旦平がな文字列に変換
し、その後、その番手がな文字に1対1に対応する片か
な文字列に変換する。If the kana character string stored in the storage means 3 has already been converted into a kanji or a word containing kanji and kana by the kana-kanji conversion means 4, this conversion can be performed by pressing down the sub-conversion key 7. A word is first converted into a hiragana character string, and then converted into a hiragana character string that corresponds one-to-one to the hiragana character string.
7はCRTデイスプレィあるいはLC(液晶)デイスプ
レィ等からなる表示部であり、キーボード1から入力さ
れて記憶手段3に記憶されている内容や、かな漢字変換
手段4、同音同義語変換手段5及び片かな変換手段6に
よって変換された内容を表示する。Reference numeral 7 denotes a display section consisting of a CRT display or LC (liquid crystal) display, which displays the contents entered from the keyboard 1 and stored in the storage means 3, the kana-kanji conversion means 4, the homophone synonym conversion means 5, and the katakana conversion. The contents converted by means 6 are displayed.
第5図及び第6図は片かな変換手段6の片かな変換にお
ける解析過程を説明する図である。5 and 6 are diagrams for explaining the analysis process in unilateral conversion by the unilateral conversion means 6. FIG.
前述した、かな漢字変換手段4による変換においては、
選択する単語、すなわち、表記文字列候補以外に、構成
要素が考慮されてかな漢字変換が行われている。例えば
、「シんかんかくは」という文字列がキーボードlから
入力されて記憶手段3に記憶され、それが、かな漢字変
換手段4によって「新感覚は」という漢字交じり句の候
補として変換されるとした場合には、第5図に示すよう
な情報が入手される。In the conversion by the above-mentioned kana-kanji conversion means 4,
In addition to the word to be selected, that is, the notation character string candidate, the constituent elements are taken into consideration when performing kana-kanji conversion. For example, assume that the character string ``Shinkankakuha'' is input from the keyboard 1 and stored in the storage means 3, and is converted by the kana-kanji conversion means 4 as a candidate for the kanji-mixed phrase ``Shinkankakuha''. In this case, information as shown in FIG. 5 is obtained.
これは、漢字への変換候補が「新感覚は」という表記で
ある場合には、表記データ(文字)数は、接頭語として
は「新」の1文字、語幹としては[感覚」の2文字、接
尾語はなく、付属語としては「は」の1文字、であると
いうことを示し、さらに読みは「しんかんかくは」であ
るので、読みデータ(文字)数は、接頭語としては「し
ん」の2文字、語幹としては「かんかく」の4文字、接
尾語はなく、付属語としては「は」の1文字であるとい
うことを示している。This means that if the conversion candidate to kanji is the notation ``Shinkan wa'', the number of written data (characters) is 1 character for ``Shin'' as the prefix and 2 characters for ``sensation'' as the stem. , there is no suffix, and the adjunct is a single character "wa", and the reading is "shinkankakuha", so the number of reading data (characters) is "shinkankakuha" as a prefix. '', the root word is ``kankaku'' (4 letters), there is no suffix, and the attached word is ``wa'' (one letter).
このような情報を入手した後、キーボード!の副変換キ
ー力q回押し下げられた場合には、「新感覚は」と変換
された表記文字列を、平がなで表した「しんかんかくは
」という入力文字列に一旦変換し、第5図に示したよう
な情報はそのまま保持しておく。After getting such information, keyboard! When the sub-conversion key is pressed down q times, the notation character string converted to "Shinkan wa" is once converted to the input character string "Shinkankakuha" expressed in hiragana, and the fifth The information shown in the figure is retained as is.
そして、キーボードIの副変換キーがさらにもう1回押
し下げられた場合には、例えば、第5図に示したような
情報の内、語幹のみを片かなにするようにあらかじめ設
定しておいた場合には、表記データの語幹部分、つまり
、表記文字列の最初から2番目と3番目を抜いて、読み
データの語幹部分、つまり、読みデータの3番目から6
番目を片かなに換えて表記を行う。結果的に「新カンカ
クは」が得られる。Then, when the sub-conversion key on keyboard I is pressed down one more time, for example, among the information shown in Figure 5, if only the stem of the word is set in advance to be changed to katakana. To do this, remove the stem part of the notation data, that is, the 2nd and 3rd from the beginning of the notation string, and extract the stem part of the reading data, that is, the 3rd to 6th from the beginning of the reading data.
The notation is done by changing the number to Katakana. As a result, "New Kankaku wa" is obtained.
また、接頭語も接尾語も片かなにするようにあらかじめ
設定しておいた場合には、付属語のみを残して片かなに
変換し、「シンカンカフは」が得られる。Furthermore, if the prefix and suffix are set in advance to be katakana, only the attached word is left and converted to katakana, resulting in ``shinkankafu wa''.
また、例えば、かな漢字変換手段4による変換によって
「新感覚派」という表記が候補となる場合には、第6図
に示すような情報を入手する。Further, for example, when the notation ``Shinsensakuha'' becomes a candidate through conversion by the kana-kanji conversion means 4, information as shown in FIG. 6 is obtained.
これは、漢字への変換候補が「新感覚派」という表記で
ある場合には、表記データ(文字)数は、接頭語として
は「新」の1文字、語幹としては「感覚」の2文字、接
尾語としては「派」の1文字、付属語はない、というこ
とを示し、さらに読みは「しんかんかくは」であるので
、読みデータ(文字)数は、接頭語としては「しん」の
2文字、語幹としては「がんかく」の4文字、接尾語と
しては「は」の1文字、付属語はない、ということを示
している。This means that if the candidate for conversion to kanji is the notation ``Shinkan-ha'', the number of written data (characters) is 1 character for ``shin'' as the prefix and 2 characters for ``sensation'' as the stem. , indicates that the suffix is one character of "ha" and there is no attached word, and the reading is "Shinkankakuha", so the number of reading data (characters) is the same as that of "Shin" as a prefix. It has 2 characters, 4 characters for the root word ``gankaku'', 1 character for the suffix ``ha'', and no adjuncts.
このような情報を人手した後、副変換キーが押し下げら
れた場合には、前述と同様に、表記文字列を全て入力文
字列である平がなに変換し、それに続いて副変換キーが
さらに押し下げられた場合には、前述のようにして、「
新カンカク派」、又は「シンカンカフ派」を得る。If the sub-conversion key is pressed after manually inputting such information, all written character strings are converted to hiragana, which is the input string, as described above, and then the sub-conversion key is pressed again. If it is pressed down, as described above,
Obtain "New Kankakuha" or "Shinkankafuha".
このような構成における動作を、以下、第7図に示すフ
ローチャートに基づいて説明する。The operation in such a configuration will be explained below based on the flowchart shown in FIG.
まず、キーボード1からかな文字列が入力され、それが
記憶手段3に記憶されている状態において(ステップ2
01)、キーボード1の変換キーが押し下げられると(
ステップ202)、かな漢字変換手段4により、カウン
ターメモリN、によって変換キーの押し下げ回数がカウ
ントされ(ステップ203)、確率的な頻度情報である
、公知の学習テーブルが検索されて(ステップ204)
、学習候補の有無が判定される(ステップ205)。First, in a state where a kana character string is input from the keyboard 1 and stored in the storage means 3 (step 2
01), when the conversion key on keyboard 1 is pressed down (
Step 202), in the kana-kanji conversion means 4, the number of presses of the conversion key is counted by the counter memory N (step 203), and a known learning table, which is probabilistic frequency information, is searched (step 204).
, the presence or absence of learning candidates is determined (step 205).
そして、学習候補がある場合には学習候補が出力され(
ステップ206)、学習候補がない場合には辞書検索が
行われて(ステップ207)、カウンターメモリN、に
記憶されている表示順位の候補が出力され(ステップ2
08)、ステップ202に戻る。Then, if there are learning candidates, the learning candidates are output (
Step 206), if there are no learning candidates, a dictionary search is performed (Step 207), and the display order candidates stored in the counter memory N are output (Step 2).
08), return to step 202.
また、副変換キーが押し下げられると(ステップ209
)、同音同義語変換手段5、及び片かな変換手段6によ
り、副変換キーの押し下げ回数がカウンターメモリN、
によってカウントされ(ステップ21O)、そのカウン
ト数が1である場合には(ステップ211)、入力文字
列に対する平がな変換処理が行われて(ステップ212
)、平がな文字列候補が表示部7に出力され(ステップ
213)、カウント数が2である場合には(ステップ2
+4)、片かな変換が行われて(ステップ215)、片
かな候補が表示部7に出力され(ステップ216)、そ
れぞれステップ202に戻る。Also, when the secondary conversion key is pressed down (step 209
), the homophone synonym conversion means 5 and the katakana conversion means 6 store the number of presses of the sub-conversion key in a counter memory N,
(step 21O), and if the count is 1 (step 211), the input character string is converted into hiragana (step 212).
), the hiragana character string candidate is output to the display section 7 (step 213), and if the count number is 2 (step 2
+4), one-sided conversion is performed (step 215), one-sided candidates are output to the display unit 7 (step 216), and the process returns to step 202.
そして次は、変換キーの押し下げ回数であるカウンター
メモリN1のカウント数が0であるのかどうかが判定さ
れ(ステップ217)、0である場合、つまり、変換キ
ーカ月回も押し下げられていない場合には、副変換キー
の押し下げ回数が1回とみなされるように、カウンター
メモリN、のカウント数カ月とされて(ステップ21B
)、ステップ21!に戻る。Next, it is determined whether the count number in the counter memory N1, which is the number of times the conversion key has been pressed, is 0 (step 217), and if it is 0, that is, if the conversion key has not been pressed even a month. , the count of the counter memory N is set to several months so that the number of times the sub-conversion key is pressed is regarded as one time (step 21B).
), Step 21! Return to
そして、カウンターメモリNtのカウント数が0でない
場合、つまり、変換キーが何回か押し下げられて、かな
漢字変換が行われている場合であって、かつ、カウンタ
ーメモリN、のカウント数が3の場合には(ステップ2
19)、送りがな変換処理が行われて(ステップ220
)、第4図に示したような送りがな変換候補が表示部7
に出力され(ステップ221)、カウンターメモリN、
のカウント数が4の場合には(ステップ222)、当て
字変換処理が行われて(ステップ223)、同じく第4
図に示したような当て字変換候補が表示部7に出力され
(ステップ224)、さらに、カウンターメモリN、の
カウント数が5の場合には(ステップ225)、異体字
変換処理が行われて(ステップ226)、同じく第4図
に示したような異体字候補が出力されて(ステップ22
7)、それぞれステップ202に戻る。If the count number of counter memory Nt is not 0, that is, if the conversion key is pressed several times and kana-kanji conversion is performed, and if the count number of counter memory N is 3. (Step 2
19), the okurikana conversion process is performed (step 220).
), the display section 7 displays the forward-gana conversion candidates as shown in Fig. 4.
(step 221), counter memory N,
If the count number is 4 (step 222), the matching character conversion process is performed (step 223), and
The correct character conversion candidates as shown in the figure are output to the display unit 7 (step 224), and if the count number in the counter memory N is 5 (step 225), variant character conversion processing is performed ( Step 226), variant character candidates as shown in FIG. 4 are output (Step 22).
7), respectively return to step 202.
そして、カウンターメモリN、のカウント数が6になっ
た場合(副変換キーが6回押し下げられた場合)には、
カウンターメモリN、のカウント数がlとされ(ステッ
プ22B)、ステップ211に戻って再度平がな候補が
表示部7に出力される。Then, when the count number of counter memory N reaches 6 (when the sub-conversion key is pressed down 6 times),
The count number of the counter memory N is set to l (step 22B), and the process returns to step 211, where the hiragana candidates are outputted to the display unit 7 again.
そして、副変換キーの押し下げが終了し、例えば、次の
文字列を入力するためのキーのような、変換候補を確定
するためのキーが押し下げられた場合には(ステップ2
29L表示部7に表示されている表示候補データが学習
テーブルに登録され(ステップ230)、その表示候補
データが文章メモリ(図示せず)に記憶される(ステッ
プ231)。Then, when the pressing of the sub-conversion key is finished and a key for confirming a conversion candidate, such as a key for inputting the next character string, is pressed (step 2
The display candidate data displayed on the 29L display section 7 is registered in the learning table (step 230), and the display candidate data is stored in a text memory (not shown) (step 231).
また、ステップ229において、変換候補を確定するた
めのキー操作が行われない場合には、ステップ202に
戻って、再度各キーの押し下げ操作が判定される。Further, in step 229, if no key operation is performed to confirm the conversion candidate, the process returns to step 202, and the depressing operation of each key is determined again.
このようにして、単語として変換可能なかな文字列は、
第4図に示したような、平がな7片かな/通常の漢字表
記/通常の漢字表記とは送りがなの違うもの/当て字/
異体字として、同じ読みで同じ意味の表記の単語に順次
変換される。In this way, the kana string that can be converted into a word is
As shown in Figure 4, 7 pieces of hiragana / normal kanji notation / different okuri-gana from normal kanji notation / guess characters /
As variant characters, they are sequentially converted into words with the same reading and meaning.
従って、変換キーによって所望の単語に近いものが表示
された場合には、副変換キーにより、その単語の同音同
義語を順次表示させて、単語を階層的に選択するように
すれば、所望の単語を効率良く選択することができる。Therefore, when a word similar to the desired word is displayed using the conversion key, the homophone synonyms of that word can be sequentially displayed using the sub-conversion key, and the word can be selected hierarchically. You can select words efficiently.
また、片かな変換においては、単語に変換されるべき平
がな文字列が、その各年がな文字列にl対lに対応する
片かな文字列に変換され、付属語は平がなのまま保持さ
れるので、片かな語を辞書に登録しておくよりも辞書メ
モリの容量を節約することができ、使用者の要望に近い
片かな表記を容易に得ることができる。In addition, in katakana conversion, the hiragana character string to be converted into a word is converted into a katakana character string that corresponds l to 1 to each year-gana character string, and the adjunct words remain in hiragana. Since the words are retained, the capacity of the dictionary memory can be saved compared to registering single words in a dictionary, and it is possible to easily obtain a simple notation that is close to the user's wishes.
(ト)発明の効果
この発明によれば、かな漢字変換においては、同音同義
語変換を行って、単語の選択に階層性を持たせることに
より、所望の単語を効率よく選択することが可能となり
、また、単語をグループ化することによって、平がなか
ら片かな作り出したリ、あるいは、通常の基本漢字から
送りがなの違うのちや異体字を含むものを作り出したり
することができるので、それぞれ独立に辞書に記憶させ
ておくよりも、辞書メモリの容量を節約することが可能
となる。(g) Effects of the Invention According to this invention, in kana-kanji conversion, by performing homophone synonym conversion and adding hierarchy to word selection, it becomes possible to efficiently select desired words. In addition, by grouping words, it is possible to create ri created from hiragana, or words with different okurigana or variant characters from normal basic kanji, so each word can be dictionary independently. This makes it possible to save the capacity of the dictionary memory.
また、片かな変換においては、単語と付属語の情報が解
析されているので、単に片かな文字列に変換するよりも
、使用者の要望に近い片かな表記を容易に得ることが可
能となる。In addition, in katakana conversion, information on words and adjuncts is analyzed, so it is easier to obtain katakana notation that is closer to the user's wishes than simply converting to a katakana character string. .
第1図は本願の請求項1に係る発明の構成を示すブロッ
ク図、第2図は本願の請求項2に係る発明の構成を示す
ブロック図、第3図はこの発明の一実施例の構成を示す
ブロック図、第4図は同音同義語変換の内容の一例を示
す説明図、第5図及び第6図は片かな変換の解析過程を
説明する図、第7図は実施例の動作を示すフローチャー
トである。
6・・・片かな変換手段、
7・・・表示部。
l・・・キーボード、2・・・制御部、3・・・記憶手
段、4・・・かな漢字変換手段、5・・・同音同義語変
換手段、2′:
第 2 :ごFigure 1 is a block diagram showing the configuration of the invention according to claim 1 of the present application, Figure 2 is a block diagram showing the configuration of the invention according to claim 2 of the present application, and Figure 3 is the configuration of an embodiment of the invention. FIG. 4 is an explanatory diagram showing an example of the contents of homophone and synonym conversion, FIGS. 5 and 6 are diagrams explaining the analysis process of unilateral conversion, and FIG. FIG. 6... One-sided conversion means, 7... Display section. l...keyboard, 2...control unit, 3...storage means, 4...kana-kanji conversion means, 5...homophone synonym conversion means, 2': 2nd: go
Claims (1)
手段と、記憶手段に記憶されたかな文字列を解析し単語
として変換可能なかな文字列と助詞・助動詞等からなる
付属語としてのかな文字列とに分割すると共に単語とし
て変換可能なかな文字列を漢字又は漢字かな交じり表記
の単語に変換するかな漢字変換手段と、前記単語として
変換可能なかな文字列をかな漢字変換手段によって変換
された単語と同じ読みでかつ同じ意味の複数種類の同音
同義語表記の単語に変換する同音同義語変換手段と、入
力手段から入力された内容及びかな漢字変換手段と同音
同義語変換手段によって変換された内容を表示する表示
手段を具備してなるかな漢字変換装置。 2、入力手段から入力されたかな文字列を記憶する記憶
手段と、記憶手段に記憶されたかな文字列を解析し単語
として変換可能なかな文字列と助詞・助動詞等からなる
付属語としてのかな文字列とに分割すると共に単語とし
て変換可能なかな文字列を漢字又は漢字かな交じり表記
の単語に変換するかな漢字変換手段と、前記単語として
変換可能なかな文字列をその各かな文字に1対1に対応
する片かな文字列に変換する片かな変換手段と、入力手
段から入力された内容及びかな漢字変換手段と片かな変
換手段によって変換された内容を表示する表示手段を具
備してなるかな漢字変換装置。[Scope of Claims] 1. A storage means for storing a kana character string input from an input means, and a kana character string that can be analyzed and converted into a word by analyzing the kana character string stored in the storage means, particles, auxiliary verbs, etc. a kana character string as an attached word, and a kana character string that can be converted into a word, and a kana character string that can be converted into a word, and a kana character string that can be converted into a word, and a kana character string that can be converted into a word, and a kana character string that can be converted as a word, and a kana character string that can be converted as a word, and a kana character string that can be converted as a word. Homophone synonym conversion means for converting into a plurality of types of homophone synonym notation words having the same reading and the same meaning as the word converted by the means, contents input from the input means, kana-kanji conversion means, and homophone synonym conversion means A kana-kanji conversion device comprising display means for displaying the converted content. 2. A storage means for storing the kana character string input from the input means, and an auxiliary word consisting of the kana character string, particles, auxiliary verbs, etc. that can be analyzed and converted into words by analyzing the kana character string stored in the storage means. a kana-kanji conversion means that divides a kana character string that can be converted into a word into a word written in kanji or a combination of kanji and kana; and a kana character string that can be converted as a word for each kana character. A kana-kanji conversion device comprising: a katakana conversion means for converting into a katakana character string corresponding to the katakana character string, and a display means for displaying the content input from the input means and the content converted by the kana-kanji conversion means and the katakana conversion means. .
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63293945A JP2802369B2 (en) | 1988-11-21 | 1988-11-21 | Kana-Kanji conversion device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP63293945A JP2802369B2 (en) | 1988-11-21 | 1988-11-21 | Kana-Kanji conversion device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH02139662A true JPH02139662A (en) | 1990-05-29 |
| JP2802369B2 JP2802369B2 (en) | 1998-09-24 |
Family
ID=17801208
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP63293945A Expired - Fee Related JP2802369B2 (en) | 1988-11-21 | 1988-11-21 | Kana-Kanji conversion device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2802369B2 (en) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5957324A (en) * | 1982-06-14 | 1984-04-02 | Ricoh Co Ltd | Data conversion processing method |
| JPS61233862A (en) * | 1985-04-08 | 1986-10-18 | Nec Corp | Kana-kanji converter |
| JPS63262752A (en) * | 1987-04-21 | 1988-10-31 | Matsushita Electric Ind Co Ltd | Kana-Kanji conversion device |
-
1988
- 1988-11-21 JP JP63293945A patent/JP2802369B2/en not_active Expired - Fee Related
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5957324A (en) * | 1982-06-14 | 1984-04-02 | Ricoh Co Ltd | Data conversion processing method |
| JPS61233862A (en) * | 1985-04-08 | 1986-10-18 | Nec Corp | Kana-kanji converter |
| JPS63262752A (en) * | 1987-04-21 | 1988-10-31 | Matsushita Electric Ind Co Ltd | Kana-Kanji conversion device |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2802369B2 (en) | 1998-09-24 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH02139662A (en) | Kana/kanji converting device | |
| JPH0578058B2 (en) | ||
| JPS60254367A (en) | Sentence analyzer | |
| JP3285149B2 (en) | Foreign language electronic dictionary search method and apparatus | |
| JP2621999B2 (en) | Document processing device | |
| JP3622841B2 (en) | Kana-kanji conversion device and kana-kanji conversion method | |
| JPS628259A (en) | Kana (japanese syllabary)-kanji (chinese character) converting system | |
| JPS59197923A (en) | Documentation device | |
| CN102110129A (en) | Electronic dictionary search device and search method using specific functional language | |
| JP3278447B2 (en) | Electronic dictionary | |
| JPS59103136A (en) | Kana-kanji conversion processing device | |
| JPS5998236A (en) | Japanese text input device | |
| JP2819766B2 (en) | Foreign language electronic dictionary search method | |
| JP2002358301A (en) | Electronic dictionary | |
| JPH03110663A (en) | Document processor | |
| JPH0385670A (en) | Two-step display system document processor | |
| JP2002108857A (en) | Electronic dictionary | |
| JPH0414168A (en) | Word processor | |
| JPH0385669A (en) | Retrieval replacing device with function for analyzing declensional kana ending | |
| JPS6278673A (en) | Kana-kanji conversion device | |
| JPS63115264A (en) | Document processor | |
| JPH04671A (en) | Retrieving system for electronic dictionary | |
| JPS63262752A (en) | Kana-Kanji conversion device | |
| JPH0417060A (en) | Kana-kanji conversion device | |
| JPS63174165A (en) | Word processor |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |