JPH0619880A - Kana/kanji converter - Google Patents

Kana/kanji converter

Info

Publication number
JPH0619880A
JPH0619880A JP4175581A JP17558192A JPH0619880A JP H0619880 A JPH0619880 A JP H0619880A JP 4175581 A JP4175581 A JP 4175581A JP 17558192 A JP17558192 A JP 17558192A JP H0619880 A JPH0619880 A JP H0619880A
Authority
JP
Japan
Prior art keywords
character string
kana
kanji
storage means
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4175581A
Other languages
Japanese (ja)
Inventor
Yamahiko Ito
山彦 伊藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric Corp
Original Assignee
Mitsubishi Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric Corp filed Critical Mitsubishi Electric Corp
Priority to JP4175581A priority Critical patent/JPH0619880A/en
Publication of JPH0619880A publication Critical patent/JPH0619880A/en
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 文節の途中や、共起関係のある語と語の間で
変換が確定された場合でも文章の流れに合い、共起関係
にかなったかな漢字変換ができるかな漢字変換装置を得
る。 【構成】 入力手段1よりかな文字列が入力されると、
第2の文字列記憶手段7に記憶されているかな文字列を
読み出して、読み出されたかな文字列の後に、新たに入
力されたかな文字列を連結し、連結された一連のかな文
字列を変換文字列格納手段11に格納して変換の対象と
する。この文字列を文字列区切手段13が文節に区切
り、変換手段15がかな漢字交じり文字列に変換する。
その際、第1の文字列記憶手段5に記憶されている確定
済みのかな漢字文字列の最後の文節や、共起情報格納手
段9中の共起情報を参照する。変換後、表示手段19が
変換結果から第1の文字列記憶手段5に記憶されている
かな漢字文字列を除外したものを表示する。
(57) [Summary] [Purpose] Kana-Kanji conversion that enables Kana-Kanji conversion that matches the co-occurrence relationship, according to the flow of the sentence even when the conversion between the words that have a co-occurrence relationship or between words is confirmed in the middle of a phrase. Get the device. [Configuration] When a kana character string is input by the input means 1,
The kana character string stored in the second character string storage means 7 is read, and the newly input kana character string is connected after the read kana character string, and a series of connected kana character strings. Is stored in the conversion character string storage means 11 and is converted. The character string delimiter 13 divides the character string into phrases, and the converter 15 converts the kana-kanji mixed character string.
At that time, the last clause of the confirmed kana-kanji character string stored in the first character string storage means 5 and the co-occurrence information in the co-occurrence information storage means 9 are referred to. After the conversion, the display unit 19 displays the conversion result excluding the Kana-Kanji character string stored in the first character string storage unit 5.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、かな文字列を辞書に従
って対応するかな漢字交じり文字列に変換するかな漢字
変換装置に関し、さらに詳しくは確定済みの文節と適切
につながるかな漢字変換ができるかな漢字変換装置に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a kana-kanji conversion device for converting a kana-character string into a corresponding kana-kanji mixed character string according to a dictionary, and more particularly to a kana-kanji conversion device capable of appropriately connecting kana-kanji characters to a fixed phrase. .

【0002】[0002]

【従来の技術】日本語ワードプロセッサはかなによって
単語の読み情報を入力し、入力された読み情報に対応す
る漢字を辞書部から読み出すが、この場合に、文法情
報、共起関係、頻度情報などが用いられるのが一般的で
ある。文法情報とは品詞と品詞の接続情報であり、例え
ば名詞の後に助詞は続くが助動詞は続かないという規則
に基づいて、文節の区切りや変換の候補を決定するもの
である。共起関係とは、どの語とどの語が共に現れやす
いかを表した関係である。例えば「あかんぼうがなく」
というかな文字列に対しては「赤ん坊が泣く」、「とり
がなく」というかな文字列に対しては「鳥が鳴く」と変
換されるように、同じ「なく」というかな文字列に対し
て、前に来る語が「赤ん坊が」の場合には「泣く」が、
「鳥が」の場合には「鳴く」がそれぞれ共起関係によっ
て現れやすいのである。頻度情報とは、同じ読みに対し
てどの候補が現れやすいかを過去の入力状況に基づいて
表した情報であり、この頻度情報に基づいて出現頻度が
高い候補を先に出現させることによって、変換の効率を
上げることができる。
2. Description of the Related Art A Japanese word processor inputs word reading information by kana and reads out Kanji corresponding to the input reading information from a dictionary section. In this case, grammatical information, co-occurrence relations, frequency information, etc. It is generally used. The grammar information is connection information between parts of speech and parts of speech, and determines, for example, punctuation and conversion candidates based on the rule that a particle follows a noun but not an auxiliary verb. The co-occurrence relationship is a relationship that represents which word and which word is likely to appear together. For example, “There is no kanbou”
For the same kana character string, "Baby cries" for the kana character string, and "birds cry" for the kana character string. , If the previous word is "baby", "cry",
In the case of "bird", "crowing" tends to appear depending on the co-occurrence relationship. Frequency information is information that shows which candidates are likely to appear for the same reading based on past input situations. The efficiency of can be improved.

【0003】また、べた書き文の自動文節分かち書きの
方法については、例えば情報処理学会論文誌Vol.2
0,No.4,July1979,pp.337−34
5に掲載された論文「べた書き文の分かち書きとかな漢
字変換」に開示されている。図5はこの論文に開示され
た分かち書きおよびかな漢字変換装置の動作を示したフ
ローチャートである。図に基づいて動作を概説すると、
入力文を読み込み(ステップ50)、読み込んだ入力文
を句読点によって分割した文字列(以下「区分」とい
う)に分解し(ステップ51)、分解された区分の中か
ら1つの区分を取り出す(ステップ52)。取り出した
区分に対して接頭語処理、自立語処理、接尾語処理を行
なって文節形を抽出する(ステップ55)。抽出した文
節形に対して二文節最長一致法を適用して適切な区切り
を行い(ステップ57)、区切られた文節に対して漢字
化を行う(ステップ58)。文節の区切りから連続して
2文節が見出だされない場合は、文節の区切りからの最
長の文節形を文節として、付属語分かち書きによって後
続の文字列の区切りを求め(ステップ5)、処理を続行
する。
A method of automatically segmenting a solid written sentence is described in, for example, the IPSJ Journal Vol. Two
0, No. 4, July 1979, pp. 337-34
It is disclosed in the paper “Divided text and kana-kanji conversion” published in No. 5. FIG. 5 is a flow chart showing the operation of the segmentation and kana-kanji conversion device disclosed in this paper. The outline of the operation based on the figure is
The input sentence is read (step 50), the read input sentence is decomposed into character strings (hereinafter referred to as "divisions") divided by punctuation marks (step 51), and one division is extracted from the decomposed divisions (step 52). ). Prefix processing, independent word processing, and suffix processing are performed on the extracted section to extract the phrase form (step 55). The two-phrase longest matching method is applied to the extracted bunsetsu to make an appropriate delimitation (step 57), and the demarcated bunsetsu is converted to kanji (step 58). If two bunsetsu are not found in succession from the bunsetsu delimiter, the longest bunsetsu form from the bunsetsu delimiter is used as a bunsetsu to find the delimiter of the subsequent character string by appending word segmentation (step 5), and the process is continued. To do.

【0004】[0004]

【発明が解決しようとする課題】上記のような従来のか
な漢字変換装置では、変換が確定された文字列は、以降
の変換処理に参照されないので、文節の途中や、共起関
係のある語と語の間でユーザが変換を確定した場合に
は、確定した語に続いて入力されるかな文字列に対して
は確定済みの文字列に適切に対応するかな漢字交じり文
の候補を出現させることができなかった。
In the conventional kana-kanji conversion device as described above, since the character string whose conversion has been confirmed is not referred to in the subsequent conversion processing, it is not included in the middle of a phrase or in a word having a co-occurrence relationship. When the user confirms the conversion between words, for the kana character string that is input after the confirmed word, a candidate kana-kanji mixed sentence that appropriately corresponds to the confirmed character string may appear. could not.

【0005】本発明は上記のような課題を解決するため
になされたもので、文節の途中や、共起関係のある語と
語の間で変換が確定された場合でも文章の流れに合い、
共起関係にかなったかな漢字変換ができるかな漢字変換
装置を得ることを目的としている。
The present invention has been made in order to solve the above problems, and fits the flow of a sentence even in the middle of a bunsetsu or even when a conversion between words having a co-occurrence relationship is decided.
The purpose is to obtain a kana-kanji conversion device that can convert kana-kanji according to a co-occurrence relationship.

【0006】[0006]

【課題を解決するための手段】本発明に係るかな漢字変
換装置は、入力されたかな文字列の直前に位置する確定
済みのかな漢字交じり文字列の最後の文節を記憶する第
1の文字列記憶手段と、該第1の文字列記憶手段に記憶
されたかな漢字交じり文字列に対応するかな文字列を記
憶する第2の文字列記憶手段と、該第2の文字列記憶手
段に記憶されているかな文字列を読み出して、読み出さ
れたかな文字列の後に前記入力されたかな文字列を連結
して格納する変換文字列格納手段と、該変換文字列格納
手段に格納されたかな文字列を第1文節が前記第2の文
字列記憶手段に記憶されているかな文字列を部分文字列
として含むような文節に区切る文字列区切手段と、該文
字列区切手段によって区切られたかな文字列のうち第1
文節は前記第1の文字列記憶手段に記憶されているかな
漢字交じり文字列を部分文字列として含むかな漢字交じ
り文字列に変換し、第2文節以降は該第1文節に適切に
続くかな漢字交じり文字列に変換する変換手段と、該変
換手段によって変換されたかな漢字交じり文字列から前
記第1の文字列記憶手段に記憶されているかな漢字文字
列を除外したかな漢字交じり文字列を表示する表示手段
とを備えたものである。
A kana-kanji conversion device according to the present invention is a first character string storage means for storing the last phrase of a fixed kana-kanji mixed character string located immediately before an input kana character string. A second character string storage means for storing a kana character string corresponding to the kana-kanji mixed character string stored in the first character string storage means; and a kana stored in the second character string storage means. A character string is read out, a converted character string storage means for connecting and storing the input kana character string after the read kana character string, and a kana character string stored in the converted character string storage means Of the kana character string that is divided by the character string delimiter means, the character string delimiter that divides the kana character string stored in the second character string storage means as a partial character string into one clause First
The phrase is converted into a kana-kanji mixed character string that includes the kana-kanji mixed character string stored in the first character string storage means as a partial character string, and the kana-kanji mixed character string that appropriately follows the first phrase after the second phrase. And a display unit for displaying a kana-kanji mixed character string excluding the kana-kanji mixed character string stored in the first character string storage means from the kana-kanji mixed character string converted by the converting means. It is a thing.

【0007】また、変換手段は語と語の共起情報を格納
した共起情報格納手段に格納された共起情報に基づい
て、変換文字列格納手段に格納されたかな文字列の第2
文節以降をかな漢字文字列に変換するようにしたもので
ある。
Further, the conversion means, based on the co-occurrence information stored in the co-occurrence information storage means in which the word-to-word co-occurrence information is stored, the second kana character string stored in the converted character string storage means.
It is designed to convert the text after the phrase into a kana-kanji character string.

【0008】[0008]

【作用】本発明におけるかな漢字変換装置においては、
かな文字列が入力されると第2の文字列記憶手段に記憶
されているかな文字列を読み出して、読み出されたかな
文字列の後に、新たに入力されたかな文字列を連結し、
連結された一連のかな文字列を変換の対象にし、変換後
第1の文字列記憶手段に記憶されているかな漢字文字列
を除外して変換結果を表示する。
In the kana-kanji conversion device of the present invention,
When the kana character string is input, the kana character string stored in the second character string storage means is read, and the newly input kana character string is connected after the read kana character string,
A series of concatenated kana character strings are subjected to conversion, the kana-kanji character string stored in the first character string storage means after conversion is excluded and the conversion result is displayed.

【0009】また、変換文字列格納手段に格納されたか
な文字列の第2文節以降をかな漢字文字列に変換するに
際して、共起情報を参照して共起関係にかなった候補を
出現させる。
Further, when converting the second and subsequent clauses of the kana character string stored in the converted character string storage means into a kana-kanji character string, the co-occurrence information is referred to so that a candidate matching the co-occurrence relationship appears.

【0010】[0010]

【実施例】【Example】

実施例1.図1は本発明に係るかな漢字変換装置の一実
施例を示すブロック図である。図において、1はかなキ
ー、変換キー、確定キー等を備えたキーボードなどから
なる入力手段であり、かな文字列の他表示単語の変更指
示を制御部3へ入力する。制御部3はマイクロプロセッ
サからなり、図示しないメモリに書き込まれている制御
プログラムに従い後述するデータ処理を行う。
Example 1. FIG. 1 is a block diagram showing an embodiment of a kana-kanji conversion device according to the present invention. In the figure, reference numeral 1 denotes an input means such as a keyboard provided with a kana key, a conversion key, a decision key, etc., which inputs a change instruction of a display word other than a kana character string to the control unit 3. The control unit 3 is composed of a microprocessor and performs data processing described later according to a control program written in a memory (not shown).

【0011】5は確定済みのかな漢字文字列の最後の文
節のかな漢字交じり表記を記憶する第1の文字列記憶手
段、7は第1の文字列記憶手段5に記憶された確定済み
のかな漢字文字列に対応するかな表記を記憶する第2の
文字列記憶手段、9は語と語の共起関係の情報を格納し
た共起情報格納手段である。11は第2の文字列記憶手
段7に記憶されているかな文字列を読み出して、この読
み出されたかな文字列の後に入力手段1から入力された
かな文字列を結合し、この結合された一連のかな文字列
を格納する変換文字列格納手段である。13は変換文字
列格納手段に格納されているかな文字列を文節ごとに区
切るかな文字列区切手段、15はかな文字列区切手段1
3によって区切られた文節に対してかな漢字変換を行う
変換手段である。
Reference numeral 5 is a first character string storage means for storing the kana-kanji mixed notation of the last phrase of the confirmed kana-kanji character string, and 7 is a confirmed kana-kanji character string stored in the first character string storage means 5. Second character string storage means for storing kana notation corresponding to, and 9 is co-occurrence information storage means for storing information on the co-occurrence relationship between words. Reference numeral 11 reads the kana character string stored in the second character string storage means 7, combines the kana character string input from the input means 1 after the read kana character string, and combines the kana character strings. It is a conversion character string storage means for storing a series of kana character strings. Reference numeral 13 is a kana character string delimiter that divides the kana character string stored in the converted character string storage means into clauses, and 15 is a kana character string delimiter 1.
It is a conversion means for performing Kana-Kanji conversion for the clauses delimited by 3.

【0012】17は照合手段であり、以下の動作を行
う。即ち、第2の文字列記憶手段7に記憶されているか
な文字列を読み出して、この読み出されたかな文字列と
かな文字列区切手段13によって区切られたかな文字列
の第1文節のかな文字列とを照合すること、及び第1の
文字列記憶手段5に記憶されているかな漢字交じり文字
列を読み出して、この読み出されたかな漢字交じり文字
列と変換手段15によってかな漢字交じり文に変換され
たかな漢字交じり文の第1文節のかな漢字文字列とを照
合することである。19は変換手段15によって変換さ
れたかな漢字交じり文から第1の文字列記憶手段に記憶
されているかな漢字交じり文字列を除外したかな漢字交
じり文を表示する表示手段である。
Reference numeral 17 is a collating means, which performs the following operations. That is, the kana character string stored in the second character string storage means 7 is read out, and the kana character string read out by this kana character string and the kana character string first segment kana separated by the kana character string delimiter 13 are read. The kana-kanji mixed character string stored in the first character string storage means 5 is checked and the read kana-kanji mixed character string and the conversion means 15 are converted into kana-kanji mixed sentences. It is to collate with the Kana-Kanji character string in the first bunsetsu of the Takana-Kanji mixed sentence. Reference numeral 19 is a display means for displaying a kana-kanji mixed sentence in which the kana-kanji mixed character string stored in the first character string storage means is excluded from the kana-kanji mixed sentence converted by the converting means 15.

【0013】図2は本実施例の動作を示すフローチャー
ト、図3はキー操作と表示手段19に表示される表示結
果との関係を説明するための説明図である。図3におい
て(a)〜(e)はキー操作の各段階における表示結果
を示している。以下制御部3の動作を図2及び図3に従
って説明する。先ず「わたしはいとうです」という文字
列の変換を例にして説明すると、入力手段1よりかな文
字列「わたし」を入力し(表示結果は図3の(a))、
入力手段1の変換キーの操作によってかな漢字の候補と
して「私」を出現させ(図3の(b))、さらに確定キ
ーの操作によって「私」を確定する(図3の(c))。
以上は従来と同様の動作である。この時点で、第1の文
字列記憶手段5には「私」というかな漢字文字列が、第
2の文字列記憶手段7には「わたし」というかな文字列
がそれぞれ記憶される。
FIG. 2 is a flow chart showing the operation of this embodiment, and FIG. 3 is an explanatory diagram for explaining the relationship between key operations and the display results displayed on the display means 19. In FIG. 3, (a) to (e) show display results at each stage of key operation. The operation of the control unit 3 will be described below with reference to FIGS. First, the conversion of the character string "I am Ito" is taken as an example, and the kana character string "I" is input from the input means 1 (the display result is (a) in FIG. 3).
By operating the conversion key of the input means 1, "I" appears as a kana-kanji candidate ((b) in FIG. 3), and by operating the enter key, "I" is confirmed ((c) in FIG. 3).
The above is the same operation as the conventional one. At this point, the kana character string "I" is stored in the first character string storage means 5, and the kana character string "I" is stored in the second character string storage means 7.

【0014】次ぎに、入力手段1から「はいとうです」
というかな文字列が入力されと(ステップ30)、表示
手段19には「私はいとうです」という文字列が表示さ
れる(図3の(d))。このとき第2の文字列記憶手段
7に記憶されている「わたし」というかな文字列が読み
出され、この読み出された「わたし」というかな文字列
の後に新しく入力された「はいとうです」が連結されて
「わたしはいとうです」という一連のかな文字列が変換
文字列格納手段11に格納される(ステップ31)。
[0014] Next, from the input means 1, "I'm happy".
When a kana character string is input (step 30), the character string "I am my mother" is displayed on the display means 19 ((d) in FIG. 3). At this time, the kana character string "I" stored in the second character string storage means 7 is read out, and the newly input "Kana" character string is newly input "Haitoto". Are concatenated and a series of kana character strings "I am Itou" are stored in the converted character string storage means 11 (step 31).

【0015】変換文字列格納手段11に格納された「わ
たしはいとうです」というかな文字列は文字列区切手段
13によって「わたしは」と「いとうです」に区切られ
る(ステップ32)。照合手段13が文字列区切手段1
3によって区切られた第1文節である「わたしは」と第
2の文字列記憶手段7に記憶されている「わたし」とい
うかな文字列を照合し、文字列区切手段13によって区
切られた第1文節である「わたしは」が、第2の文字列
記憶手段7のかな文字列である「わたし」を部分文字列
として含んでいるか否かを調べ(ステップ33)、含ん
でいれば第1文節である「わたしは」に対して変換手段
13がかな漢字変換処理を行う(ステップ34)。
The kana character string "I am Ito" stored in the conversion character string storage unit 11 is divided into "I" and "Ito" by the character string delimiter unit 13 (step 32). The collating means 13 is the character string delimiting means 1
The first phrase separated by 3 is collated with the first phrase "Iwa" and the kana character string "I" stored in the second character string storage means 7, and the first character string is separated by the character string separation means 13. It is checked whether or not the phrase "Iwa" includes the kana character string "I" of the second character string storage means 7 as a partial character string (step 33), and if it does, the first phrase. The conversion means 13 performs kana-kanji conversion processing for "Iwa" (step 34).

【0016】文字列区切手段13によって区切られた第
1文節が第2の文字列記憶手段7中の文字列を部分文字
列として含んでいない場合は別の区切りを行い(ステッ
プ32)、新たに区切られた第1文節が第2の文字列記
憶手段7に記憶されているかな文字列を部分文字列とし
て含んでいるか否かを調べる(ステップ33)。部分文
字列として含んでいない場合には、別の区切りができる
かどうかを判断し(ステップ33a)、別の区切りがで
きる場合はステップ32に戻り同じ動作を行う。以上の
動作を繰り返し、可能な全ての区切りを行っても、区切
られた文節の第1文節が第2の文字列記憶手段7中のか
な文字列を部分文字列として含むような区切りが存在し
ない場合には、変換文字列格納手段11に格納されてい
るかな文字列のうち第2の文字列記憶手段7に記憶され
てるかな文字列と同一のかな文字列については第1の文
字列格納手段5中のかな漢字文字列と同一のかな漢字文
字列に変換して確定し(ステップ35)、新たに入力さ
れたかな文字列について変換処理を行う(ステップ3
7)。
If the first phrase delimited by the character string delimiter 13 does not include the character string in the second character string storage 7 as a partial character string, another delimiter is performed (step 32) and a new character is newly added. It is checked whether or not the delimited first clause contains the kana character string stored in the second character string storage means 7 as a partial character string (step 33). If it is not included as a partial character string, it is determined whether another delimiter is possible (step 33a). If another delimiter is possible, the process returns to step 32 and the same operation is performed. Even if the above operation is repeated to perform all possible delimiters, there is no delimiter such that the first bunsetsu of the delimited bunsetsu contains the kana character string in the second character string storage means 7 as a partial character string. In this case, of the kana character strings stored in the converted character string storage means 11, the same kana character string as the kana character string stored in the second character string storage means 7 is the first character string storage means. The kana-kanji character string identical to the kana-kanji character string in 5 is converted and confirmed (step 35), and conversion processing is performed on the newly input kana-character string (step 3).
7).

【0017】ところで、本実施例の場合には文字列区切
手段13によって区切られた第1文節である「わたし
は」が、第2の文字列記憶手段7のかな文字列である
「わたし」を部分文字列として含んでいるので、「わた
しは」に対してかな漢字変換処理を行う(ステップ3
4)。かな漢字変換処理の結果「私は」が候補として出
現すると、照合手段17が変換された第1文節である
「私は」と第1の文字列記憶手段5に記憶されているか
な漢字文字列である「私」を照合し、変換された第1文
節である「私は」が、第1の文字列記憶手段5に記憶さ
れているかな漢字文字列である「私」を部分文字列とし
て含んでいるか否かを調べる(ステップ36)。
By the way, in the case of the present embodiment, the first phrase "Iwa" delimited by the character string delimiter 13 is replaced by the kana character string "I" in the second character string storage unit 7. Since it is included as a partial character string, kana-kanji conversion processing is performed on "Iwa" (step 3).
4). When "Iwa" appears as a candidate as a result of the Kana-Kanji conversion processing, the matching unit 17 is the converted first phrase "Iwa" and the Kana-Kanji character string stored in the first character string storage unit 5. Is "I", which is the first phrase converted by collating "I", included "I", which is the Kana-Kanji character string stored in the first character string storage means 5, as a partial character string? It is checked whether or not (step 36).

【0018】部分文字列として含まない場合には、他の
候補が在るかどうかを判断し(ステップ36a)、他の
候補が在る場合にはステップ34に戻り再変換を行い、
同様の照合を繰り返す。全ての変換結果において、第1
文節のかな漢字文字列が第1の文字列記憶手段5中の文
字列を部分文字列として含まない場合はステップ32に
戻り、第1文節の区切り処理をやり直す。部分文字列と
して含んでいる場合または上述の再変換によって該当す
る候補が出現した場合には、変換文字列格納手段11に
格納されているかな文字列のうち第1文節については変
換後のかな漢字文字列で確定しておき、この第1文節を
除いた部分のかな文字列に対して、かな文字列の区切り
が行われ(ステップ37)、変換キーの操作によってか
な漢字変換が行われ、所望のかな漢字文字列が出現すれ
ば確定する(ステップ38)。
If it is not included as a partial character string, it is judged whether or not there is another candidate (step 36a). If there is another candidate, the process returns to step 34 to perform re-conversion,
The same collation is repeated. First of all conversion results
If the kana-kanji character string of the bunsetsu does not include the character string in the first character string storage means 5 as a partial character string, the process returns to step 32 and the first bunsetsu delimitation process is performed again. When it is included as a partial character string or when a corresponding candidate appears by the above-mentioned re-conversion, the kana-kanji character after conversion is performed for the first phrase of the kana character string stored in the converted character string storage means 11. Kana-kanji is delimited by the row, and the kana-character string of the part excluding the first clause is delimited (step 37), and kana-kanji conversion is performed by operating the conversion key to obtain the desired kana-kanji. If the character string appears, it is confirmed (step 38).

【0019】本実施例の場合には、変換された第1文節
である「私は」が第1の文字列記憶手段5に記憶されて
いるかな漢字文字列である「私」を部分文字列として含
んでいるので、変換文字列格納手段11に格納されてい
るかな文字列である「わたしはいとうです」のうち第1
文節である「わたしは」を「私は」として確定し、これ
を除いた部分のかな文字列である「いとうです」に対し
て、かな文字列の区切りが行われ(本例の場合には「い
とうです」がこれ以上文節に区切ることができないので
この動作は省略される)(ステップ37)、変換キーの
操作によってかな漢字変換が行われ、所望のかな漢字文
字列である「伊藤です」が出現すれば確定する(ステッ
プ38)。
In the case of this embodiment, the converted first phrase "Iwa" is the kana-kanji character string "I" stored in the first character string storage means 5 as a partial character string. Since it contains, the first character in the kana character string “I am Ito” stored in the conversion character string storage means 11.
The phrase "Iwa" is fixed as "Iwa", and the kana character string except for this is separated from the kana character string (in the case of this example, This operation is omitted because "Itosu" cannot be further divided into clauses (step 37). Kana-Kanji conversion is performed by the operation of the conversion key, and the desired Kana-Kanji character string "Ito is" appears. If so, it is confirmed (step 38).

【0020】このとき変換文字列格納手段11内での変
換結果は「私は伊藤です」となり、このかな漢字文字列
から第1の文字列記憶手段5に記憶されているかな漢字
文字列である「私」を除いた「は伊藤です」が表示対象
となる。従って、このときの表示手段19における表示
結果は「私は伊藤です」となる(ステップ39)(図3
の(e))。
At this time, the conversion result in the conversion character string storage means 11 becomes "I am Ito", and the kana-kanji character string stored in the first character string storage means 5 from this kana-kanji character string "I "Is Ito" excluding "is displayed. Therefore, the display result on the display means 19 at this time is "I am Ito" (step 39) (FIG. 3).
(E)).

【0021】従来のかな漢字変換装置では、変換が確定
した文節である「私」を参照しないで確定後新たに入力
したかな文字列のみを対象にして変換を行っていたの
で、例えば本実施例の新たに入力されたかな文字列であ
る「はいとうです」に対しては「配当です」と変換して
いた。しかし、本発明によれば、確定済みの文字列であ
る「私」を参照して新たに入力したかな文字列の変換候
補を出現させるようにしたので、「は伊藤です」と
「私」に正しく続くかな漢字文字列への変換が容易にで
きる。
In the conventional kana-kanji conversion device, the conversion is performed only for the kana character string newly input after the confirmation without referring to the phrase "I" which is the confirmed conversion. The newly entered kana character string "Haitouto" was converted into "dividend." However, according to the present invention, the conversion candidate of the newly input kana character string is made to appear by referring to the fixed character string "I", so that "is Ito" and "I" You can easily convert to the correct Kana-Kanji character string.

【0022】次ぎに、「とりがなく」という文字列の変
換を例にして説明する。図4はキー操作と表示手段19
に表示される表示結果との関係を説明するための説明図
であり、図において(f)〜(j)はキー操作の各段階
における表示結果を示している。入力手段1によって
「とりが」というかな文字列が入力され(表示結果は図
4の(f))、変換キーの操作によって変換が行われ
(図4の(g))、「鳥が」がというかな漢字文字列が
確定する(図4の(h))。この時点で、第1の文字列
記憶手段5には「鳥が」という文字列が入り、第2の文
字列記憶手段7には「とりが」という文字列が入る。
Next, conversion of the character string "Torashiri" will be described as an example. FIG. 4 shows key operation and display means 19.
FIG. 4 is an explanatory diagram for explaining the relationship with the display result displayed in FIG. 3, in which (f) to (j) show the display result at each stage of the key operation. A kana character string "toriga" is input by the input means 1 (display result is (f) in FIG. 4), and conversion is performed by operating the conversion key ((g) in FIG. 4). The kana-kanji character string is fixed ((h) in FIG. 4). At this point, the character string "bird" is stored in the first character string storage means 5, and the character string "toriga" is stored in the second character string storage means 7.

【0023】この後、「なく」というかな文字列が入力
されると(図4の(i))、第2の文字列記憶手段7中
の文字列である「とりが」と新たに入力された「なく」
が連結され「とりがなく」というかな文字列が変換文字
列格納手段11に格納され、変換の対象となる。そし
て、このかな文字列は第1文節が「とりが」、第2文節
が「なく」と区切られ、区切られた第1文節の「とり
が」が第2の文字列記憶手段7中の文字列である「とり
が」を部分文字列として含んでいるかどうか調べる。本
例の場合には含んでいるので、第1文節である「とり
が」に対する変換が行われ、「鳥が」というかな漢字文
字列が候補として出現する。候補として出現した「鳥
が」が第1の文字列記憶手段5中の「鳥が」を部分文字
列として含んでいるかどうかを調べる。本例の場合は含
んでいるので第1文節を「鳥が」としてを確定した後、
第2文節である「なく」に対する変換が行われる。
After that, when a kana character string "nashi" is input ((i) in FIG. 4), "toriga" which is the character string in the second character string storage means 7 is newly input. "Without"
Are concatenated and the kana character string “Torashiri” is stored in the conversion character string storage means 11 and becomes a conversion target. In this kana character string, the first clause is delimited as "toriga" and the second clause is delimited, and the delimited "toriga" of the first clause is a character in the second character string storage means 7. Check to see if it contains the string "Toriga" as a substring. In the case of this example, since it is included, the conversion for the first phrase "Toriga" is performed, and the Kana-kanji character string "Toriga" appears as a candidate. It is checked whether or not "bird" that appears as a candidate includes "bird" in the first character string storage means 5 as a partial character string. In the case of this example, it is included, so after confirming that the first phrase is "bird",
The conversion for the second clause, “null”, is performed.

【0024】このとき、第1文節として確定した「鳥
が」という文字列が共起情報として参照され、これと共
起関係にある「鳴く」が変換候補として出現する(図4
の(j))。従来「鳥が」を確定した後に「なく」とい
うかな文字列を入力して変換した場合には、確定したか
な漢字文字列である「鳥が」が参照されないので、「無
く」「泣く」「鳴く」という変換候補が過去の使用頻度
によって出現し、変換効率が悪かった。しかし、本発明
によれば確定したかな漢字文字列である「鳥が」を参照
にして、新たに入力された「なく」の変換を行うので
「鳥が」と共起関係にある「鳴く」が変換候補として最
初に出現し、効率の良い変換ができる。
At this time, the character string "bird" determined as the first clause is referred to as co-occurrence information, and "crow" having a co-occurrence relationship with this appears as a conversion candidate (FIG. 4).
(J)). Conventionally, when a character string "Kan" is input and converted after "Toriga" is confirmed, "Kana", which is the confirmed Kana-Kanji character string, is not referenced, so "No", "Cry", and "Cry" A conversion candidate appeared according to the frequency of use in the past, and the conversion efficiency was poor. However, according to the present invention, the newly input “n” is converted with reference to the fixed kana-kanji character string “bird”, so that “calling” that has a co-occurrence relationship with “bird” does not occur. It appears first as a conversion candidate and allows efficient conversion.

【0025】[0025]

【発明の効果】以上説明したのように、本発明によれば
確定済みのかな漢字文字列を参照して新たに入力したか
な文字列の変換候補を出現させるようにしたので、確定
済みのかな漢字文字列に正しく続くかな漢字文字列への
変換が容易にできる。
As described above, according to the present invention, a conversion candidate for a newly input kana character string is made to appear by referring to a fixed kana kanji character string, and thus a fixed kana kanji character is determined. You can easily convert to a Kana-Kanji character string that follows the sequence correctly.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明に係るかな漢字変換装置の一実施例を示
すブロック図である。
FIG. 1 is a block diagram showing an embodiment of a kana-kanji conversion device according to the present invention.

【図2】実施例1の動作を示すフローチャートである。FIG. 2 is a flowchart showing the operation of the first embodiment.

【図3】キー操作と表示手段19に表示される表示結果
との関係を説明するための説明図である。
FIG. 3 is an explanatory diagram for explaining a relationship between a key operation and a display result displayed on the display means 19.

【図4】キー操作と表示手段19に表示される表示結果
との関係を説明するための説明図である。
FIG. 4 is an explanatory diagram for explaining a relationship between a key operation and a display result displayed on the display means 19.

【図5】従来の分かち書きおよびかな漢字変換装置の動
作を示したフローチャートである。
FIG. 5 is a flowchart showing the operation of a conventional space-dividing and kana-kanji conversion device.

【符号の説明】[Explanation of symbols]

1 入力手段 5 第1の文字列記憶手段 7 第2の文字列記憶手段 9 共起情報格納手段 11 変換文字列格納手段 13 文字列区切手段 15 変換手段 19 表示手段 DESCRIPTION OF SYMBOLS 1 input means 5 1st character string storage means 7 2nd character string storage means 9 co-occurrence information storage means 11 converted character string storage means 13 character string delimitation means 15 conversion means 19 display means

Claims (2)

【特許請求の範囲】[Claims] 【請求項1】 かな文字列を入力操作し、入力されたか
なに対応した漢字を辞書から探し出してかな漢字交じり
文へ変換するかな漢字変換装置において、 入力されたかな文字列の直前に位置する確定済みのかな
漢字交じり文字列の最後の文節を記憶する第1の文字列
記憶手段と、 該第1の文字列記憶手段に記憶されたかな漢字交じり文
字列に対応するかな文字列を記憶する第2の文字列記憶
手段と、 該第2の文字列記憶手段に記憶されているかな文字列を
読み出して、読み出されたかな文字列の後に前記入力さ
れたかな文字列を連結して格納する変換文字列格納手段
と、 該変換文字列格納手段に格納されたかな文字列を第1文
節が前記第2の文字列記憶手段に記憶されているかな文
字列を部分文字列として含むような文節に区切る文字列
区切手段と、 該文字列区切手段によって区切られたかな文字列のうち
第1文節は前記第1の文字列記憶手段に記憶されている
かな漢字交じり文字列を部分文字列として含むかな漢字
交じり文字列に変換し、第2文節以降は該第1文節に適
切に続くかな漢字交じり文字列に変換する変換手段と、 該変換手段によって変換されたかな漢字交じり文字列か
ら前記第1の文字列記憶手段に記憶されているかな漢字
文字列を除外したかな漢字交じり文字列を表示する表示
手段とを備えたことを特徴とするかな漢字変換装置。
1. A kana-kanji conversion device for inputting a kana character string, searching a dictionary for a kanji corresponding to the input kana, and converting the kana into a kana-kanji mixed sentence. First character string storage means for storing the last phrase of the kana-kanji mixed character string, and a second character for storing a kana character string corresponding to the kana-kanji mixed character string stored in the first character string storage means A column storage means and a conversion character string for reading out the kana character string stored in the second character string storage means and concatenating and storing the input kana character string after the read kana character string. A storage unit and a character that divides the kana character string stored in the converted character string storage unit into phrases such that the first phrase includes the Kana character string stored in the second character string storage unit as a partial character string. Row And a kana-kanji character string delimited by the character string delimiter means, the first clause is converted to a kana-kanji character string containing the kana-kanji character string stored in the first character string storage means as a partial character string. However, the second and subsequent phrases are converted into a kana-kanji mixed character string that appropriately follows the first phrase, and kana-kanji mixed character strings converted by the conversion means are stored in the first character string storage means. A kana-kanji conversion device comprising: display means for displaying kana-kanji mixed character strings excluding the kana-kanji character strings.
【請求項2】 変換手段は語と語の共起情報を格納した
共起情報格納手段に格納された共起情報に基づいて、変
換文字列格納手段に格納されたかな文字列の第2文節以
降をかな漢字文字列に変換することを特徴とする請求項
1記載のかな漢字変換装置。
2. The conversion means, based on the co-occurrence information stored in the co-occurrence information storage means storing the word-to-word co-occurrence information, the second clause of the kana character string stored in the converted character string storage means. 2. The kana-kanji conversion device according to claim 1, wherein the subsequent characters are converted into kana-kanji character strings.
JP4175581A 1992-07-02 1992-07-02 Kana/kanji converter Pending JPH0619880A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4175581A JPH0619880A (en) 1992-07-02 1992-07-02 Kana/kanji converter

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4175581A JPH0619880A (en) 1992-07-02 1992-07-02 Kana/kanji converter

Publications (1)

Publication Number Publication Date
JPH0619880A true JPH0619880A (en) 1994-01-28

Family

ID=15998592

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4175581A Pending JPH0619880A (en) 1992-07-02 1992-07-02 Kana/kanji converter

Country Status (1)

Country Link
JP (1) JPH0619880A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12600862B2 (en) 2020-05-01 2026-04-14 Modern Meadow, Inc. Protein polyurethane alloys and layered materials including the same

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US12600862B2 (en) 2020-05-01 2026-04-14 Modern Meadow, Inc. Protein polyurethane alloys and layered materials including the same

Similar Documents

Publication Publication Date Title
US5890103A (en) Method and apparatus for improved tokenization of natural language text
JPH03224055A (en) Method and device for input of translation text
JP3372532B2 (en) Computer-readable recording medium for emotion information extraction method and emotion information extraction program
Seresangtakul et al. Thai-Isarn dialect parallel corpus construction for machine translation
JPH0619880A (en) Kana/kanji converter
JP3398729B2 (en) Automatic keyword extraction device and automatic keyword extraction method
JP2002073656A (en) Different notation normalization processing, different notation expansion processing method, document search method by the processing method, the processing device, document search device, and program recording medium
JPH10320399A (en) Language identification device, language identification method, and recording medium recording language identification program
JPH08190561A (en) Document correction device
JP2570784B2 (en) Document reader post-processing device
JP3508312B2 (en) Keyword extraction device
JP2729342B2 (en) Kana-kanji conversion method and device
JPH0232467A (en) Machine translation method
JPH01114976A (en) Dictionary structure for document processor
JP3048793B2 (en) Character converter
JPH0350668A (en) character processing device
JP2575947B2 (en) Phrase extraction device
JPS62224859A (en) Japanese language processing system
JPH02110771A (en) Telegraph machine
JPH10340264A (en) Machine translation device and computer-readable recording medium where machine translation processing program is recorded
JPH06101002B2 (en) Writing device
JPS6389975A (en) language analysis device
JPH01281561A (en) Method for extracting japanese sentence correcting candidate character
JPH11161651A (en) Phonetic symbol generator
JP2002236680A (en) Apparatus and method for associating unique names, program for causing a computer to execute the method, and recording medium on which the program is recorded