JPH03116367A - Character processor - Google Patents
Character processorInfo
- Publication number
- JPH03116367A JPH03116367A JP1255492A JP25549289A JPH03116367A JP H03116367 A JPH03116367 A JP H03116367A JP 1255492 A JP1255492 A JP 1255492A JP 25549289 A JP25549289 A JP 25549289A JP H03116367 A JPH03116367 A JP H03116367A
- Authority
- JP
- Japan
- Prior art keywords
- word
- dictionary
- deleted
- deletion
- address
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は仮名漢字変換により漢字仮名混り文を入力する
文字処理装置に関する。DETAILED DESCRIPTION OF THE INVENTION [Field of Industrial Application] The present invention relates to a character processing device for inputting a sentence containing kanji and kana through kana-kanji conversion.
[従来の技術]
現在、日本ワードプロセッサなどの文字処理装置は漢字
仮名混り文の入力を仮名漢字変換を使って行なうことが
一般的である。[Prior Art] Currently, character processing devices such as Japanese word processors generally input sentences containing kanji and kana using kana-kanji conversion.
従来、仮名漢字変換用辞書は外部メモリ(フロッピーデ
ィスク、ハードディスク)に格納することが多かった。Conventionally, kana-kanji conversion dictionaries were often stored in external memory (floppy disk, hard disk).
ところが、−括変換等の変換方式面での改良が進むこと
により辞書アクセスの回数が増大し、また、そうでな(
ても、変換のスピードアップ要求が高まってきたことか
ら、辞書を高速アクセス可能な内部メモリに格納する方
式が主流となっている。However, as improvements in conversion methods such as - bracket conversion progress, the number of dictionary accesses increases, and (
However, due to the increasing demand for faster conversion, the mainstream is to store dictionaries in internal memory that can be accessed at high speed.
内部メモリには、読込/書込ともに可能で揮発性(電源
を切ると記憶内容が消えてしまう)のRAMと、書込が
不可能であるが不揮発性(電源を切っても記憶内容が消
えない)のROMの2種類が一般に広く使用されている
。Internal memory consists of RAM, which can be read and written to and is volatile (memory contents disappear when the power is turned off), and non-volatile RAM, which cannot be written to (memory contents disappear even when the power is turned off). There are two types of ROM that are generally widely used.
辞書をRAMに持つ場合、仮名漢字変換する前の準備と
して辞書を外部メモリからRAMにロードすることにな
るが、ロード時間がかかるという欠点があり、更に、R
AMの方がROMよりも高価であるためコストが高くな
るという欠点もある。このため、辞書はROMに記憶す
るのが一般的である。If the dictionary is stored in RAM, the dictionary must be loaded from external memory to RAM in preparation before kana-kanji conversion, but this has the disadvantage of taking time to load.
Since AM is more expensive than ROM, it also has the disadvantage of higher costs. For this reason, dictionaries are generally stored in ROM.
また、最近は、仮名漢字変換の変換率に対する要求も高
度化しているため、辞書が大容量化する傾向がある。Furthermore, recently, demands on the conversion rate of kana-kanji conversion have become more sophisticated, so there is a tendency for dictionaries to have larger capacities.
このように辞書が大容量化されているため、個人個人に
とってみれば、絶対に使用しないと思われる単語が相当
多く辞書に記憶されていることになる。このような無駄
な単語は、単に無駄でメモリが勿体ないのは仕方がない
ことであるが、誤変換の原因ともなり、オペレータによ
っては存在しない方が有難い単語もある。As the capacity of dictionaries has increased in this way, a considerable number of words that individuals would never use are stored in dictionaries. It is inevitable that such useless words are simply useless and waste memory, but they also cause erroneous conversions, and some operators would be grateful if they did not exist.
例えば、単語数が増えた結果、「神戸(こうべ)」とい
う姓が辞書に格納され、また、「功(こう)」という名
前も辞書に格納されたとする。そのような辞書でオペレ
ータが「神戸港」を変換しようとして「こうべこう」と
打鍵したとすると、仮名漢字変換には通常「姓十名前」
のパターンを優先して変換する処理が組み込まれている
ので、オペレータの意図に反し「神戸功」と変換する可
能性が高い。For example, suppose that as a result of an increase in the number of words, the surname "Kobe" is stored in the dictionary, and the name "Kou" is also stored in the dictionary. If an operator tries to convert ``Kobe Port'' using such a dictionary and types in ``Kobekou,'' then the kana-kanji conversion would normally include ``surname ten names.''
Since it has a built-in process that gives priority to the pattern ``Kobe Isao'', it is likely to be converted to ``Kobe Isao'' against the operator's intention.
このような場合、「功」を「港」に変更すれば、学習が
働き、次回から「神戸港」は正しく変換される。ところ
が、「神戸」という姓が辞書上に存在する限り、「神戸
市」のつもりが「神戸氏」になり、「神戸産」のつもり
が「神戸さん」になるなど、あちこちで誤変換が生じ、
操作性を阻害する。In such a case, if you change "Ko" to "Minato", the learning will work and "Kobe Port" will be converted correctly the next time. However, as long as the surname "Kobe" exists in dictionaries, mistranslations will occur here and there, such as "Kobe City" becoming "Kobe-san" and "Kobe-made" becoming "Kobe-san." ,
Obstructs operability.
そもそ゛も、「神戸」という姓は普通の人にとっては馴
染の薄い姓であり、辞書から削除するという解決策が手
間がな(最も効果が高い。ところが、通常、辞書はRO
M上に存在するので、直接的に単語の削除を行なうこと
はできない。In the first place, the surname "Kobe" is a surname that is not familiar to ordinary people, and the solution of deleting it from the dictionary is time-consuming (and most effective. However, dictionaries usually have RO
Since the word exists on M, it is not possible to directly delete the word.
ROM上の単語を削除する方法として、辞書ROM上の
単語の存在アドレスを記憶し、変換時にその位置の単語
を無視し使用しないようにする方式、削除すべき単語の
読み、表記、品詞などの単語情報を記憶し、変換時にそ
れと一致する単語がROM上の辞書に存在すれば、その
単語を無視し使用しないようにする方式、などが考えら
れる。As a method for deleting a word on ROM, there is a method that memorizes the address of the word on the dictionary ROM and ignores the word at that position during conversion so that it is not used. One possible method is to store word information and, at the time of conversion, if a word matching the word exists in the dictionary on the ROM, that word is ignored and not used.
[発明が解決しようとしている問題点]しかし、上記の
単語情報を記憶する方式による単語の削除は、1単語削
除する度にかなりのメモリを必要とするため、コストが
高くなり、また、変換時に単語情報とマツチングを取る
のでは処理も複雑になり、変換時間も長くなるという欠
点がある。[Problems to be solved by the invention] However, deleting words using the above method of storing word information requires a considerable amount of memory each time one word is deleted, resulting in high costs and Matching with word information has the drawbacks of complicated processing and long conversion time.
また、アドレスを記憶する方式による単語の削除では、
削除単語辞書は、辞書の内容が更新された時に使用でき
なくなってしまう。そのため、複数の種類の機械を使用
するオペレータはその機械語とに削除単語辞書を作成し
なければならず、データ互換性の点で問題がある。In addition, when deleting words using the method of remembering addresses,
The deleted word dictionary becomes unusable when the contents of the dictionary are updated. Therefore, operators using multiple types of machines must create deletion word dictionaries for their machine languages, which poses a problem in terms of data compatibility.
また、アドレスと単語情報の両方を記憶す、る方式も考
えられるが、そのときは仕様メモリが相当太き(なり、
コストがかかりすぎるという欠点がある。Another possibility is to store both address and word information, but in that case the specification memory would be quite large (and
The disadvantage is that it is too costly.
[問題点を解決するための手段(及び作用)]本発明は
、ROM上の辞書に存在する単語を削除するのに、削除
すべき単語の単語情報そのもの(読み、表記、品詞)を
外部メモリに記憶し、また、内部メモリ上には削除単語
の辞書上の存在アドレスを記憶し、変換時には単なるア
ドレスとのマツチングで単語の削除を実現することによ
り、内部メモリの使用サイズを低減できる。また、辞書
の内容が更新された時は単語情報そのものを外部メモリ
よりロードしてアドレス情報を再作成することによりデ
ータ互換性が実現できる。上記により、オペレータごと
に変換率の高い仮名漢字変換を提供し、ひいてはオペレ
ータの候補選択の手間を軽減し、また、互遺性の高い削
除単語辞書を、安価に実現するものである。[Means for Solving the Problems (and Effects)] In order to delete a word existing in a dictionary on a ROM, the present invention stores the word information (pronunciation, spelling, part of speech) of the word to be deleted in an external memory. In addition, the address of the deleted word in the dictionary is stored in the internal memory, and the word is deleted by simply matching with the address during conversion, thereby reducing the size of the internal memory used. Furthermore, when the contents of the dictionary are updated, data compatibility can be achieved by loading the word information itself from external memory and re-creating the address information. As a result of the above, it is possible to provide kana-kanji conversion with a high conversion rate for each operator, thereby reducing the operator's effort in selecting candidates, and to realize a deletion word dictionary with high compatibility at a low cost.
[実施例] 以下図面を参照しながら本発明の詳細な説明する。[Example] The present invention will be described in detail below with reference to the drawings.
第1図は本発明の全体構成の一例である。FIG. 1 is an example of the overall configuration of the present invention.
図示の構成において、CPUは、マイクロプロセッサで
あり、文字処理のための演算、論理判断等を行ない、ア
ドレスバスAB、コントロールバスCB、データバスD
Bを介して、それらのバスに接続された各構成要素を制
御する。In the illustrated configuration, the CPU is a microprocessor that performs calculations, logical judgments, etc. for character processing, and uses an address bus AB, a control bus CB, and a data bus D.
B to control each component connected to those buses.
アドレスバスABはマイクロプロセッサCPUの制御の
対象とする構成要素を指示するアドレス信号を転送する
。コントロールバスCBはマイクロプロセッサCPUの
制御の対象とする各構成要素のコントロール信号を転送
して印加する。データバスDBは各構成機器相互間のデ
ータの転送を行なう。Address bus AB transfers address signals indicating the components to be controlled by the microprocessor CPU. The control bus CB transfers and applies control signals for each component to be controlled by the microprocessor CPU. The data bus DB transfers data between each component device.
つぎにROMは、読出し専用の固定メモリであり、第1
0図〜第14図につき後述するマイクロプロセッサCP
Uによる制御の手順、及び、仮名漢字変換用辞書DIC
を記憶させておく。Next, ROM is a read-only fixed memory, and the first
Microprocessor CP, which will be described later with reference to Figures 0 to 14.
Control procedure by U and dictionary DIC for kana-kanji conversion
Let me remember it.
また、RAMは、1ワード16ビツトの構成の書込み可
能のランダムアクセスメモリであって、各構成要素から
の各種データの一時記憶に用いる。DELDは削除単語
辞書であり、辞書DICから削除した単語を記憶する。Further, the RAM is a writable random access memory having a configuration of 1 word and 16 bits, and is used for temporary storage of various data from each component. DELD is a deleted word dictionary and stores words deleted from dictionary DIC.
5WTBLはサーチ単語テーブルであり、仮名漢字変換
中に必要な単語の存在位置を一時的に記憶するためのテ
ーブルである。5WTBL is a search word table, and is a table for temporarily storing the existing positions of words required during kana-kanji conversion.
KBはキーボードであって、アルファベットキひらがな
キー カタカナキー等の文字記号入カキ−1及び、変換
キー、単語削除キー、実行キー等の本文字処理装置に対
する各種機能を指示するための各種のファンクションキ
ーな備えている。KB is a keyboard, which includes letters and symbols such as alphabet, hiragana, and katakana keys, and various function keys for instructing various functions for this character processing device, such as a conversion key, word deletion key, and execution key. We have everything in place.
DISKは文書データ、削除単語辞書DELDを記憶す
るための外部メモリである。文書、削除単語辞書DEL
Dは必要に応じて保管され、また、保管されたデータは
キーボードの指示により必要な時呼び出される。DISK is an external memory for storing document data and deleted word dictionary DELD. Document, deletion word dictionary DEL
D is saved as needed, and the saved data can be called up when needed by instructions from the keyboard.
CRはカーソルレジスタである。CPUにより、カーソ
ルレジスタの内容を読み書きできる。CR is a cursor register. The CPU can read and write the contents of the cursor register.
後述するCRTコントローラCRTCは、ここに蓄えら
れたアドレスに対応する表示装置CRT上の位置にカー
ソルを表示する。A CRT controller CRTC, which will be described later, displays a cursor at a position on the display device CRT corresponding to the address stored here.
DBUFは表示用バッファメモリで、表示すべきデータ
のパターンを蓄える。DBUF is a display buffer memory that stores data patterns to be displayed.
CRTCはカーソルレジスタCR及びバッファDBUF
に蓄えられた内容を表示器CRTに表示する役割を担う
。CRTC is cursor register CR and buffer DBUF
It plays the role of displaying the contents stored in the CRT on the display device CRT.
またCRTは陰極線管等を用いた表示装置であり、その
表示装置CRTにおけるドツト構成の表示パターンおよ
びカーソルの表示をCRTコントローラで制御する。Further, a CRT is a display device using a cathode ray tube or the like, and a CRT controller controls the dot-configured display pattern and cursor display on the display device CRT.
さらに、CGはキャラクタジエネレー 夕であって、表
示装置CRTに表示する文字、記号のパターンを記憶す
るものである。Furthermore, CG is a character generator that stores patterns of characters and symbols to be displayed on a display device CRT.
かかる各構成要素からなる本発明文字処理装置において
は、キーボードKBからの各種の入力に応じて作動する
ものであって、キーボードKBからの入力が供給される
と、まず、インクラブド信号がマイクロプロセッサCP
Uに送られ、そのマイクロプロセッサCPUがROM内
に記憶しである各種の制御信号を読出し、それらの制御
信号に従って各種の制御が行なわれる。The character processing device of the present invention, which is composed of each of these components, operates in response to various inputs from the keyboard KB. When input from the keyboard KB is supplied, first, an included signal is sent to the microprocessor CP.
The microprocessor CPU reads various control signals stored in the ROM, and various controls are performed in accordance with these control signals.
第2図は本発明装置による変換操作の例を示した図であ
る。2−1はまず、読み列「こうべこう」を入力した時
の画面を示している。カーソルは入力読み列の次に表示
されている。ここで変換キーを打鍵すると2−2の画面
になる。2−2では読み列「こうべこう」が「神戸功」
と変換されている。これは望む変換ではないので、「神
戸」 (姓)を辞書から単語削除するという操作を行な
って、その後もう一度「こうべこう」と入力すると2−
3の画面になる。ここで変換キーを再度打鍵すると2−
4の画面になり、今度は正しく「神戸港」と変換されて
いる。FIG. 2 is a diagram showing an example of a conversion operation performed by the apparatus of the present invention. 2-1 first shows the screen when the reading sequence "Kobekou" is input. The cursor is displayed next to the input reading sequence. If you press the conversion key here, the screen 2-2 will appear. In 2-2, the pronunciation ``Kobekou'' is ``Kobe Isao.''
It has been converted to . This is not the conversion you want, so if you delete the word "Kobe" (surname) from the dictionary and then enter "Kobeko" again, you will get 2-
3 screen will appear. If you press the conversion key again here, 2-
4 screen appears, and this time it is correctly converted to "Kobe Port".
第3図は単語削除の操作を説明した図である。FIG. 3 is a diagram explaining the word deletion operation.
3−1は初期画面を示しており、この状態で単語削除キ
ーを打鍵すると3−2の画面になる。3−2で単語削除
が起動され、削除単語の入力ウィンドウが表示されてい
る。ここで削除すべき単語の読み「こうべ」をオペレー
タが入力すると、ウィンドウ中に削除単語の読みが表示
され、3−3の画面になる。更に変換キーを打鍵すると
、「こうべ」が「神戸」に変換されてウィンドウ中に表
示され、3−4の画面となる。ここで実行キーを打鍵す
ると「神戸」の表記と読みが取り込まれ、品詞の入力ウ
ィンドウが開き、3−5の画面になる。ここで品詞「姓
」をオペレータが入力すると3−6の画面になる。ここ
で実行キーを打鍵する。3-1 shows the initial screen, and when the word deletion key is pressed in this state, the screen 3-2 appears. Word deletion is activated in step 3-2, and a deletion word input window is displayed. When the operator inputs the pronunciation of the word to be deleted, ``Kobe'', the pronunciation of the word to be deleted is displayed in the window, and the screen shown in 3-3 appears. When the conversion key is further pressed, "Kobe" is converted to "Kobe" and displayed in the window, resulting in screen 3-4. If you press the execution key here, the notation and pronunciation of "Kobe" will be imported, a part-of-speech input window will open, and the screen 3-5 will appear. Here, when the operator inputs the part of speech "last name", the screen 3-6 appears. Press the execute key here.
と、読み「こうべ」表記「神戸」品詞「姓」の単語が辞
書より削除され、終了メツセージが3−7に示すように
表示される。Then, the word with the pronunciation "Kobe" written as "Kobe" and the part of speech "surname" is deleted from the dictionary, and the end message is displayed as shown in 3-7.
第4図は辞書DICの構成を示した図である。FIG. 4 is a diagram showing the configuration of dictionary DIC.
辞書はROM上に存在する。従って、内容を変更するこ
とはできない。The dictionary exists on ROM. Therefore, the contents cannot be changed.
辞書は先頭に「辞書バージョン」が格納される。これは
辞書の内容に変更があった時に更新されるようなデータ
であり、全(同じ内容を持つ辞書は同じ辞書バージョン
を持つ。後述するように削除単語のアドレス部を更新す
る必要があるかどうかほこの辞書バージョンで管理され
る。A "dictionary version" is stored at the beginning of the dictionary. This is data that is updated when there is a change in the contents of the dictionary, and all (dictionaries with the same contents have the same dictionary version.Is it necessary to update the address part of the deleted word as described later? It will be managed by Hoko's dictionary version.
辞書バージョンに引き続いて、単語データが格納される
。各単語データは「読み」 「表記」 「品詞」からな
る。Following the dictionary version, word data is stored. Each word data consists of ``pronunciation,''``notation,'' and ``part of speech.''
「読み」には単語の読み情報、例えば、「神戸」であれ
ば「こうべ」が記憶される。コードはJIS X 02
0gコードの下位バイトなどを使用し、1文字1バイト
で格納される。"Yomi" stores word reading information, for example, "Kobe" for "Kobe". The code is JIS X 02
Each character is stored as one byte using the lower byte of the 0g code.
「表記」には単語の表記情報、例えば、「神戸」であれ
ば、「神戸」という字面が1文字2バイトでJIS X
020gコード等を使用して格納される。"Notation" contains the notation information of the word, for example, if it is "Kobe", the character "Kobe" is 1 character, 2 bytes, and JIS X
It is stored using a 020g code or the like.
「品詞」は単語の品詞、例えば、「神戸」であれば、「
姓」 「地名」などが格納される。"Part of speech" is the part of speech of a word, for example, for "Kobe", "
Last name, place name, etc. are stored.
第5図は辞書DICに格納されるデータの例を示した図
である。図に示すように辞書の単語データが読みの昇順
(辞書式配列)で格納される。FIG. 5 is a diagram showing an example of data stored in the dictionary DIC. As shown in the figure, word data in the dictionary is stored in ascending order of pronunciation (lexicographical arrangement).
第6図は削除単語辞書DELDの構成を示した図である
。FIG. 6 is a diagram showing the structure of the deletion word dictionary DELD.
削除単語辞書は外部メモリに保存されている。The deleted word dictionary is stored in external memory.
電源立ち上げ時に必要部分が外部メモリから読み込まれ
、RAMにロードされる。When the power is turned on, the necessary portion is read from external memory and loaded into RAM.
削除単語辞書は3つの部分に分かれる。The deletion word dictionary is divided into three parts.
6−1は「辞書バージョン」を記憶する部分である。辞
書バージョンは削除単語辞書のアドレス部が作成された
時の辞書DICの辞書バージョンがそのまま記憶される
。6-1 is a part that stores a "dictionary version". The dictionary version of the dictionary DIC when the address part of the deleted word dictionary was created is stored as is.
6−2は実体部であり、第7図に詳述するように削除単
語の読み、表記、品詞が記憶される。Reference numeral 6-2 is the entity part, which stores the pronunciation, notation, and part of speech of the deleted word, as detailed in FIG.
6−3はアドレス部であり、第8図に詳述するように削
除単語が辞書DIC上のどこに存在するかを示すポイン
タを記憶する。6-3 is an address field, which stores a pointer indicating where the deleted word exists on the dictionary DIC, as detailed in FIG.
ft 8、RAM上に常に存在するのは6−1の辞書バ
ージョンと6−3のアドレス部のみである。ft 8, only the dictionary version 6-1 and the address part 6-3 always exist on the RAM.
6−2の実体部は普段は外部メモリにのみ存在する。ア
ドレス部を再作成する必要が生じた時に6−2の実体部
が外部メモリより一時的にRAMにロードされる。それ
以外の状況では、実体部に相当するメモリは開放されて
おり、別の目的のために有効利用されている。The actual part 6-2 normally exists only in external memory. When it becomes necessary to recreate the address part, the real part 6-2 is temporarily loaded into the RAM from the external memory. In other situations, the memory corresponding to the entity part is freed and effectively used for another purpose.
第7図は削除単語辞書実体部の詳細構成を示した図であ
る。FIG. 7 is a diagram showing the detailed configuration of the deletion word dictionary entity section.
「読み」 「表記」 「品詞」の3つのフィールドから
なり、削除単語の読み、表記、品詞が記憶される。It consists of three fields: ``pronunciation,''``orthography,'' and ``part of speech.'' The reading, spelling, and part of speech of the deleted word are stored.
削除単語は、通常、辞書DICに存在するはずであり、
存在する時は辞書DIC上の読み、表記、品詞がそのま
ま記憶されることになる。The deleted word should normally exist in the dictionary DIC,
When it exists, the reading, notation, and part of speech in the dictionary DIC will be stored as they are.
図中では削除単語1は「神戸」 (姓)、削除単語2は
「内閣」 (名詞)となっている。In the figure, deleted word 1 is "Kobe" (surname), and deleted word 2 is "cabinet" (noun).
なお、削除単語として辞書DICに存在しない単語が記
述されていても一向に差し支えない。存在しない削除単
語は単に無視されるだけである。Note that there is no problem even if a word that does not exist in the dictionary DIC is written as a deletion word. Deletion words that do not exist are simply ignored.
第8図は削除単語辞書アドレス部の詳細構成を示した図
である。FIG. 8 is a diagram showing the detailed structure of the deletion word dictionary address section.
削除単語辞書アドレス部には削除単語実体部に格納され
・ている削除単語−つ一つに対して、その単語が辞書D
ICのどこに存在するかを記憶している。In the deletion word dictionary address field, for each deletion word stored in the deletion word entity part, that word is stored in the dictionary D.
It remembers where it is in the IC.
削除単語辞書アドレス部は仮名漢字変換処理の高速化の
ために存在するデータであり、このデー夕がなくても、
実体部と、辞書DICとからいつでも再作成できる。The deletion word dictionary address part is data that exists to speed up the kana-kanji conversion process, and even without this data,
It can be recreated at any time from the entity part and the dictionary DIC.
例えば、削除単語1は第7図によると「神戸」(姓)で
あるので、辞書DIC上の「神戸」 (姓)の存在する
アドレスを第1エントリーとして格納する。同様に削除
単語2については「内閣」 (名詞)の存在するアドレ
スを第2エントリーとして格納する。For example, since deletion word 1 is "Kobe" (last name) according to FIG. 7, the address where "Kobe" (last name) exists in the dictionary DIC is stored as the first entry. Similarly, for deletion word 2, the address where "cabinet" (noun) exists is stored as the second entry.
削除単語辞書アドレス部は、辞書DICのバージョンに
依存するデータであり、作成された時の辞書DICの辞
書バージョンが削除単語辞書の先頭に格納される。また
、辞書DICのバージョンが変更した時は、削除単語辞
書実体部のデータを参照して再作成される。The deletion word dictionary address field is data that depends on the version of the dictionary DIC, and the dictionary version of the dictionary DIC at the time of creation is stored at the beginning of the deletion word dictionary. Furthermore, when the version of the dictionary DIC is changed, it is re-created by referring to the data in the deleted word dictionary entity section.
第9図はサーチ単語テーブル5WTBLの構成を示した
図である。FIG. 9 is a diagram showing the structure of the search word table 5WTBL.
サーチ単語テーブルは仮名漢字変換処理を行なう過程に
おいて、入力読み列の解析を行なうのに必要な単語が辞
書DICのどこに存在するかを一時的に記憶したテーブ
ルである。The search word table is a table that temporarily stores where in the dictionary DIC the words necessary to analyze the input pronunciation sequence exist in the process of performing the kana-kanji conversion process.
例えば、入力読み列が「こうべこう」であったときは、
その解析のために「こ」 「こう」 「こうべ」 「う
」 「うべ」 「べこ」 「こう」などの単語が必要で
あり、それらの単語の辞書DIC上の存在位置がフィー
ルド「ポインタ」に記憶される。For example, when the input pronunciation sequence is "Kobekou",
For this analysis, words such as "ko", "ko", "kobe", "u", "ube", "beko", "ko" are required, and the location of these words in the dictionary DIC is stored in the field "pointer". is memorized.
上述の実施例の動作をフローに従って説明する。The operation of the above embodiment will be explained according to the flow.
第10図はキー人力を取り込み、処理を行なう部分のフ
ローチャートである。FIG. 10 is a flowchart of the part that takes in key human power and performs processing.
ステップ10−1はアドレス作成処理であり、第11図
に示すように削除単語辞書の初期設定を行なう:この処
理は通常、電源ON直後に1回だけ実行される。Step 10-1 is an address creation process in which the deletion word dictionary is initialized as shown in FIG. 11: This process is normally executed only once immediately after the power is turned on.
ステップ10−2はキーボードからのデータを取り込む
処理である。ステップ10−3で取り込まれたキーの種
別を判定し、各キーの処理ルーチンに分岐する。Step 10-2 is a process of capturing data from the keyboard. In step 10-3, the type of the retrieved key is determined, and the process branches to a processing routine for each key.
変換キーが入力されたときはステップ10−4に分岐し
、ステップ10−4において第12図に詳述するように
仮名漢字変換の変換処理が行なわれる。その後ステップ
10−2に分岐する。When the conversion key is input, the process branches to step 10-4, and in step 10-4, conversion processing for kana-kanji conversion is performed as detailed in FIG. 12. After that, the process branches to step 10-2.
単語削除キーが入力されたときはステップ10−5に分
岐し、ステップ10−5において第14図に詳述する単
語削除キー理が行なわれる。その後ステップ10−2に
分岐する。When the word deletion key is input, the process branches to step 10-5, and in step 10-5, the word deletion key operation detailed in FIG. 14 is performed. After that, the process branches to step 10-2.
その他のキーのときはステップ10−6に分岐し、挿入
、削除等の通常の文字処理装置において行なわれるその
他の処理が行なわれる。その後ステップ10−2に分岐
する。If it is any other key, the process branches to step 10-6, and other processing such as insertion, deletion, etc. performed in a normal character processing device is performed. After that, the process branches to step 10-2.
第11図はステップ10−1の「アドレス作成処理」を
詳細化したフローチャートである。FIG. 11 is a detailed flowchart of the "address creation process" in step 10-1.
ステップ11−1において削除単語辞書の「辞書バージ
ョン」 「アドレス部」を外部メモリからRAMにロー
ドする。In step 11-1, the "dictionary version" and "address part" of the deletion word dictionary are loaded from the external memory to the RAM.
ステップ11−2において削除単語辞書の辞書バージョ
ンと辞書DICの辞書バージョンを比較する。一致した
時はそのままリターンするが、致しない時は削除単語辞
書アドレス部を再作成する必要があるので、ステップ1
1−3に進む。In step 11-2, the dictionary version of the deleted word dictionary and the dictionary version of the dictionary DIC are compared. If there is a match, it will return as is, but if it does not match, it will be necessary to recreate the deletion word dictionary address part, so step 1
Proceed to 1-3.
ステップ11−3において、再作成のためにまずアドレ
ス部を初期化し、辞書DICの辞書バージョンを辞書バ
ージョンとして削除単語辞書に設定する。また、削除単
語辞書実体部を外部メモリからRAMに読み込む。In step 11-3, for re-creation, the address section is first initialized, and the dictionary version of the dictionary DIC is set as the dictionary version in the deleted word dictionary. Further, the deletion word dictionary entity part is read from the external memory into the RAM.
ステップ11−4において、削除単語を実体部から1単
語取り出す。In step 11-4, one word to be deleted is extracted from the entity part.
ステップ11−5において全ての削除単語について処理
が終了したかどうか判定し、処理が終了している時はリ
ターンする。処理が終了していない時はステップ11−
6の削除単語アドレス決定に進む。In step 11-5, it is determined whether the processing has been completed for all deleted words, and if the processing has been completed, the process returns. If the process is not completed, proceed to step 11-
Proceed to step 6 to determine the deletion word address.
ステップ11−6において、取り出された削除単語と同
じものが辞書DIC上のどこに存在するかサーチし、そ
のアドレスを求める。In step 11-6, a search is made to see where in the dictionary DIC the same word as the extracted word to be deleted exists, and its address is obtained.
ステップ11−7において、上記求めたアドレスを削除
単語辞書アドレス部に設定する。In step 11-7, the address obtained above is set in the deletion word dictionary address field.
ついで、次の削除単語の処理を行なわないといけないの
でステップ11−4に分岐する。Then, since the next deleted word must be processed, the process branches to step 11-4.
第12図はステップ10−4の「変換処理」を詳細化し
たフローチャートである。FIG. 12 is a detailed flowchart of the "conversion process" in step 10-4.
ステップ12−1において入力読み列の解析に必要な単
語をサーチ単語テーブル5WTBLに登録するために第
13に詳述する単語サーチ処理を行なう。In step 12-1, word search processing, which will be described in detail in the thirteenth section, is performed in order to register words necessary for analyzing the input pronunciation sequence in the search word table 5WTBL.
ステップ12−2において、形態素解析、構文解析等を
行なって入力読み列を解析し、文節候補を作成する。In step 12-2, the input pronunciation sequence is analyzed by morphological analysis, syntactic analysis, etc., and clause candidates are created.
ステップ12−3において、各文節候補の尤度を計算し
、どの文節を変換するのが最も尤もらしいかを判断し、
第1候補として決定する。In step 12-3, calculate the likelihood of each clause candidate and determine which clause is most likely to be converted;
Determined as the first candidate.
ステップ12−4において、決定された第1候補に基づ
いて変換結果を作成し、出力する。In step 12-4, a conversion result is created and output based on the determined first candidate.
第13図はステップ12−1の「単語サーチ処理」を詳
細化したフローチャートである。FIG. 13 is a detailed flowchart of the "word search process" in step 12-1.
ステップ13−1において、辞書DICより入力読み列
の解析に必要な単語の読み(サーチすべき読み)を1つ
決定する。In step 13-1, one pronunciation of a word (pronunciation to be searched) necessary for analyzing the input pronunciation sequence is determined from the dictionary DIC.
ステップ13−2においてサーチすべき読みがな(なっ
たかどうか判定し、な(なった時はリターンする。In step 13-2, it is determined whether the reading to be searched for has become ``Na'', and if it has become ``Na'', the process returns.
ステップ13−3においてサーチすべき読みについて実
際に辞書DICをサーチし、アドレスを求める。In step 13-3, the dictionary DIC is actually searched for the pronunciation to be searched, and the address is obtained.
ステップ13−4において見つかったアドレスが削除単
語辞書アドレス部に記載されているかどうかを判定する
ため削除単語辞書アドレス部をサーチする。The deleted word dictionary address section is searched to determine whether the address found in step 13-4 is written in the deleted word dictionary address section.
ステップ13−5において一致するアドレスがあったか
どうか判定し、もし、存在すれば、その単語は削除され
たと見なされるから、そのまま、ステップ13−1に分
岐し、次のサーチ読みの処理に移る。存在しない時はそ
の単語は削除されていないからステップ13−6に進み
、サーチ単語テーブルにそのアドレスを登録する。In step 13-5, it is determined whether there is a matching address, and if there is, the word is considered to have been deleted, and the process branches to step 13-1 to proceed to the next search reading process. If the word does not exist, the word has not been deleted, and the process proceeds to step 13-6, where the address is registered in the search word table.
第14図はステップ10−5の「単語削除処理」を詳細
化したフローチャートである。FIG. 14 is a detailed flowchart of the "word deletion process" in step 10-5.
ステップ14−1において、画面上に単語削除のための
表記入力のウィンドウを表示する。In step 14-1, a notation input window for word deletion is displayed on the screen.
ステップ14−2において、削除単語の表記をオペレー
タから受付ける処理を行なう。オペレータが入力した読
み、選択した表記は内部メモリに一時的に取り込まれる
。オペレータが表記を入力し、実行キーを打鍵した時に
ステップ14−3に移ることになる。In step 14-2, processing is performed to receive the notation of the deleted word from the operator. The reading input by the operator and the notation selected are temporarily stored in the internal memory. When the operator inputs the notation and presses the execution key, the process moves to step 14-3.
ステップ14−3において、品詞入力のウィンドウが表
示される。ここでオペレータの入力する品詞が内部メモ
リに取り込まれることになる。オペレータが品詞を入力
し、実行キーを打鍵すると次のステップ14−4に移る
。In step 14-3, a part-of-speech input window is displayed. At this point, the part of speech input by the operator is imported into the internal memory. When the operator inputs the part of speech and presses the execution key, the process moves to the next step 14-4.
ステップ14−4において、これまでの処理の結果得ら
れた読み、表記、品詞を削除単語データ実体部に登録す
る。実体部は通常RAM上に存在しないから外部メモリ
から読み込まれ登録されることになる。In step 14-4, the pronunciation, spelling, and part of speech obtained as a result of the processing up to now are registered in the deletion word data entity section. Since the actual part does not normally exist on RAM, it is read from external memory and registered.
ステップ14−5において、今削除された単語の辞書D
IC上でのアドレスを求める。In step 14-5, the dictionary D of the word just deleted
Find the address on the IC.
ステップ14−6において、求められたアドレスを削除
単語データアドレスにも登録する。In step 14-6, the obtained address is also registered as a deletion word data address.
ステップ14−7において単語削除の終了処理を行なう
。すなわち、削除単語辞書全体を外部メモリに保存し、
RAM上にある実体部の領域を開放し、終了メツセージ
をウィンドウ上に表示する。適当なタイミングでウィン
ドウを消去してからリターンする。In step 14-7, word deletion termination processing is performed. That is, save the entire deleted word dictionary in external memory,
The area of the entity part on the RAM is released and a termination message is displayed on the window. Clear the window at an appropriate time and return.
[他の実施例]
以上の説明において、辞書の格納されるメモリとしてR
OMの場合を説明したが、書込不可なメモリであれば事
情は全て同じであり、本発明を適用可能である。例えば
、光ディスク、CDROMなどであっても、書込ができ
ないため直接単語を削除することはできないが、本発明
の原理で削除することはできる。[Other Embodiments] In the above description, R is used as the memory in which the dictionary is stored.
Although the case of OM has been described, the situation is the same for any non-writable memory, and the present invention is applicable to it. For example, words cannot be directly deleted from optical disks, CD-ROMs, etc. because they cannot be written to, but they can be deleted using the principles of the present invention.
また、削除単語辞書の持ち方としてアドレスを持つよう
にしたが、アドレス以外であっても辞書のバージョンに
依存するような持ち方であれば、やはり事情が同じであ
るので、本発明を適用できる。例えば、辞書の先頭から
の単語の連番で記憶するようにしても同様の一構成で処
理することができる。In addition, although the deleted word dictionary is held by having an address, the present invention can be applied to any other way of holding the deleted word dictionary depending on the version of the dictionary as the same situation applies. . For example, even if the words are stored in consecutive numbers starting from the beginning of the dictionary, processing can be performed using a similar configuration.
また、削除単語辞書の持ち方として単語の読み、表記、
品詞を持つようにしたが、他にも記憶すべき単語情報が
あれば、記憶する必要があり、また、マツチングに関係
のない情報であれば、記憶を省略することができる。例
えば、辞書中に、頻度が異なり、読み、表記、品詞が一
致する単語が存在するなら、頻度も削除単語辞書に記憶
する必要がある。ところが、読み、表記、品詞が一致し
、頻度のみ異なる単語が存在しないのであれば、無理を
して頻度を削除単語辞書に記憶する必要はない。In addition, how to hold the deleted word dictionary is to read, write, and read the words.
Although the word information has a part of speech, if there is other word information to be stored, it is necessary to store it, and if the information is unrelated to matching, storage can be omitted. For example, if there are words in the dictionary that have different frequencies but have the same pronunciation, spelling, and part of speech, the frequencies also need to be stored in the deleted word dictionary. However, if there are no words that have the same pronunciation, spelling, and part of speech and differ only in frequency, there is no need to forcefully store the frequencies in the deletion word dictionary.
[発明の効果]
以上の説明から明らかなように本発明によれば、仮名漢
字変換用辞書が書込不可なメモリ、例えば、ROMに存
在しても、削除すべき単語の単語情報を外部メモリに記
憶し、内部メモリには単語情報から作成された辞書存在
アドレスのみを記憶しているので、辞書のバージョンに
依存しないデータ互換性の高い削除単語辞書を実現し、
なおかつ変換時間にも負担を欠けることがないので、単
語削除したいオペレータにとって使い易い安価な文字処
理装置を実現することができる。[Effects of the Invention] As is clear from the above description, according to the present invention, even if the kana-kanji conversion dictionary exists in a non-writable memory, such as a ROM, the word information of the word to be deleted can be stored in an external memory. Since the internal memory stores only the dictionary existence address created from the word information, it is possible to create a deleted word dictionary with high data compatibility independent of the dictionary version.
Furthermore, since there is no burden on the conversion time, it is possible to realize an inexpensive character processing device that is easy to use for operators who wish to delete words.
第1図は本発明の全体構成のブロック図、第2図は本発
明における仮名漢字変換の操作例を示した図、
第3図は本発明における単語削除の操作の例を示した図
、
第4図は本発明における辞書DICの構成を示した図、
第5図は本発明における辞書DICに格納される単語の
例を示した図、
第6図は本発明における削除単語辞書の全体構成なを示
した図、
第7図は本発明における削除単語辞書実体部の構成を示
した図、
第8図・は本発明における削除単語辞書アドレス部の構
成を示した図、
第9図は本発明におけるサーチ単語テーブルの構成を示
した図、
第10図〜第14図は本発明文字処理装置の動作を示す
フローチャート。
DISK ・・・外部メモリ
CPU ・・・マイクロプロセッサROM
・・・読出し専用メモリRAM ・・・ランダム
アクセスメモリDIC・・・仮名漢字変換用辞書
DELD ・・・削除単語辞書
5WTBL ・・・サーチ単語テーブル↓
変換キー
↓
「神戸」(姓)を削除してから入力
↓
変換キー
↓
単語削除キー
↓
「こうべ」
↓
変換キー
↓
実行キー
↓
「姓」
↓
実行キー
読み 表記 品詞
読み
表記
品詞
東10
図
鵬/4
図FIG. 1 is a block diagram of the overall configuration of the present invention, FIG. 2 is a diagram showing an operation example of kana-kanji conversion in the present invention, FIG. 3 is a diagram showing an example of word deletion operation in the present invention, Figure 4 is a diagram showing the configuration of the dictionary DIC in the present invention, Figure 5 is a diagram showing an example of words stored in the dictionary DIC in the present invention, and Figure 6 is the overall configuration of the deletion word dictionary in the present invention. 7 is a diagram showing the configuration of the deleted word dictionary entity part in the present invention. Figure 8 is a diagram showing the configuration of the deleted word dictionary address part in the present invention. FIG. 9 is a diagram showing the configuration of the deleted word dictionary address part in the present invention. FIGS. 10 to 14 are flowcharts showing the operation of the character processing device of the present invention. DISK...External memory CPU...Microprocessor ROM
...Read-only memory RAM ...Random access memory DIC ...Kana-kanji conversion dictionary DELD ...Delete word dictionary 5WTBL ...Search word table↓ Conversion key↓ Delete "Kobe" (surname) Input from ↓ Conversion key ↓ Word deletion key ↓ "Kobe" ↓ Conversion key ↓ Execution key ↓ "Last name" ↓ Execution key reading Notation Part-of-speech reading notation Part-of-speech East 10 Zuho/4 Figure
Claims (1)
された読み列を表記に変換する変換手段と、 前記辞書上に記憶されている単語のうち無効であるもの
のポインタと単語の読み、表記、品詞などの単語情報の
両方を記憶した削除単語辞書と、 外部記憶手段と、 前記削除単語辞書に削除したい単語を登録する単語削除
手段とを具備し、前記変換手段は削除単語辞書に登録さ
れた単語を変換せず、前記単語削除手段は削除単語辞書
の単語情報を外部記憶手段のみに記憶させることを特徴
とする文字処理装置。[Scope of Claims] 1. An input means for inputting the pronunciation of a word; a dictionary in which the pronunciation, notation, and part of speech of the word are stored in correspondence; and the pronunciation string input by the input means is read by referring to the dictionary. a conversion means for converting into notation; a deletion word dictionary that stores both pointers of invalid words stored in the dictionary and word information such as pronunciations, spellings, parts of speech, etc.; and an external storage means. , a word deletion means for registering a word to be deleted in the deletion word dictionary, the conversion means does not convert the words registered in the deletion word dictionary, and the word deletion means externally stores word information in the deletion word dictionary. A character processing device characterized by storing data only in a storage means.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1255492A JPH0628059B2 (en) | 1989-09-29 | 1989-09-29 | Character processor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP1255492A JPH0628059B2 (en) | 1989-09-29 | 1989-09-29 | Character processor |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH03116367A true JPH03116367A (en) | 1991-05-17 |
| JPH0628059B2 JPH0628059B2 (en) | 1994-04-13 |
Family
ID=17279506
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP1255492A Expired - Fee Related JPH0628059B2 (en) | 1989-09-29 | 1989-09-29 | Character processor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH0628059B2 (en) |
-
1989
- 1989-09-29 JP JP1255492A patent/JPH0628059B2/en not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| JPH0628059B2 (en) | 1994-04-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPS5858714B2 (en) | translation device | |
| JPH03116367A (en) | Character processor | |
| JPH03116366A (en) | Character processor | |
| JPH03116369A (en) | character processing device | |
| JPH03116368A (en) | character processing device | |
| JPS6246029B2 (en) | ||
| JPS628259A (en) | Kana (japanese syllabary)-kanji (chinese character) converting system | |
| JP2862236B2 (en) | Character processor | |
| JP3278447B2 (en) | Electronic dictionary | |
| JPH0576066B2 (en) | ||
| JP3278148B2 (en) | Character processing apparatus and method | |
| JPH0260022B2 (en) | ||
| JPH01214967A (en) | Character processing device and method | |
| JPH0447451A (en) | character processing device | |
| JPS6089235A (en) | character processing device | |
| JPH01204174A (en) | Character processor | |
| JPS60251461A (en) | Kana-kanji conversion device | |
| JPH0769908B2 (en) | Document processor | |
| JPH0628062B2 (en) | Character processing apparatus and method | |
| JPS63221467A (en) | character processing device | |
| JPH0447443A (en) | character processing device | |
| JPH0327469A (en) | Kana-Kanji conversion device | |
| JPS63221470A (en) | character processing device | |
| JPH01142865A (en) | Machine translator | |
| JPS63221466A (en) | character processing device |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |