JPH07200568A - Character processor - Google Patents
Character processorInfo
- Publication number
- JPH07200568A JPH07200568A JP5350237A JP35023793A JPH07200568A JP H07200568 A JPH07200568 A JP H07200568A JP 5350237 A JP5350237 A JP 5350237A JP 35023793 A JP35023793 A JP 35023793A JP H07200568 A JPH07200568 A JP H07200568A
- Authority
- JP
- Japan
- Prior art keywords
- field
- word
- technical
- input
- conversion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】 入力中の分野に対応した必要な専門語のみを
自動的に指定し、入力中の分野に対応しない不要な専門
語辞書の使用を抑制すること。
【構成】 この装置は、特定の使用領域を持たない一般
語と、特定分野でのみ使用される専門語とを区別して格
納した単語辞書と、専門語の変換を行うか否かを指定す
る専門語辞書変換指定手段と、入力手段と、入力文書の
分野を判定するとともに専門語辞書変換指定手段により
入力された文章の属する文書分野に対応した専門語を指
定し、又入力された文章の属する文書分野に対応しない
専門語辞書の使用を抑制する分野判定手段と、分野に属
する単語を優先的に変換する際に指定された専門語でな
い時は優先処理を行わないようにする変換手段とを有す
る。
(57) [Summary] [Purpose] To automatically specify only the necessary technical terms corresponding to the field being input, and suppress the use of unnecessary technical word dictionaries that do not correspond to the field being input. [Structure] This device includes a word dictionary that stores a general word that does not have a specific usage area and a technical word that is used only in a specific field, and specifies whether to convert the technical word. The word dictionary conversion designation means, the input means, and the field of the input document are determined, and the technical word corresponding to the document field to which the text input by the technical word dictionary conversion designation means belongs is specified, and the input text belongs. A field determination means that suppresses the use of a technical word dictionary that does not correspond to the document field and a conversion means that does not perform priority processing when a word belonging to a field is not a specified technical word when preferentially converted. Have.
Description
【0001】[0001]
【産業上の利用分野】本発明は日本語の処理の文字処理
装置に関し、特にかな漢字変換に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a character processing device for processing Japanese, and more particularly to kana-kanji conversion.
【0002】[0002]
【従来の技術】従来、日本語の入力においては、単語の
読み、表記、品詞を格納した単語辞書を用いてかな漢字
変換を実行している。かな漢字変換のヒット率(変換
率)を向上させるため、様々な方法が提案され実現され
てきた。そのひとつの試みに、入力中の文書の分野を特
定化し、その分野に即した同音語の選択を行う、分野優
先変換処理がある。この分野優先の処理によれば、例え
ば、入力中の分野が「医学」分野であると判断された
時、「風」よりも「風邪」、「石」よりも「医師」を優
先して変換することができる。また、より専門度を高め
た専門語辞書を用いて、分野優先処理に役立てることが
できる。2. Description of the Related Art Conventionally, in inputting Japanese, kana-kanji conversion is performed using a word dictionary that stores word readings, notations, and parts of speech. Various methods have been proposed and realized in order to improve the hit rate (conversion rate) of kana-kanji conversion. One of the attempts is field priority conversion processing in which the field of the document being input is specified and homophones are selected according to the field. According to this field priority processing, for example, when it is determined that the field being input is the "medicine" field, "cold" is prioritized over "wind" and "doctor" is prioritized over "stone". can do. Further, it is possible to use it for field priority processing by using a specialized word dictionary with a higher degree of specialization.
【0003】[0003]
【発明が解決しようとする課題】しかしながら、従来の
専門語を併用した分野優先変換処理では、専門語の使用
の有無は、まったく操作者にゆだねられており、多岐に
わたる作成文書内容に応じて、使用する専門語辞書を切
り替えなければならないという煩雑さがあった。However, in the field-priority conversion process in which conventional technical terms are used in combination, it is entirely up to the operator whether or not to use the technical terms, and depending on the contents of various documents created, There was the complexity of having to switch the technical language dictionary to be used.
【0004】仮に、すべての専門語を常に使用可能にす
ると、作成する文書分野によっては、関係のない専門語
をも用いることもある。それゆえ、該当文書分野には、
ふさわしくない専門語が変換され、変換効率が悪くな
る。また、仮に、すべての専門語を使用しないとする
と、作成文書分野に対応した専門語であっても変換され
ず、やはり変換効率が悪くなる。If all the technical terms are always available, the unrelated technical terms may be used depending on the document field to be created. Therefore, in the relevant document area:
Unsuitable terminology is converted and conversion efficiency deteriorates. If all the technical words are not used, even the technical words corresponding to the created document field are not converted, and the conversion efficiency is deteriorated.
【0005】また、該当文書分野には、ふさわしくない
専門語が変換され、なおかつ無用な単語を用いて解析処
理を行なうことで、変換処理時間を増大させ、良好な入
力、変換の応答性能を得ることができなかった。[0005] Further, technical terms that are not suitable for the relevant document field are converted, and analysis processing is performed using useless words, thereby increasing conversion processing time and obtaining good input and conversion response performance. I couldn't.
【0006】更にまた、従来の分野優先変換処理では、
一般語と専門語とを区別していなかったため、同じ分野
に属している専門語が一般語と同じく優先変換されてし
まい、専門語の知識を持たない一般操作者にとっては効
率的なかな漢字変換とは言えなかった。例えば「医学」
分野の文書であると推定されている状況で、「けんきゅ
う」と入力した時、一般には決して高頻度とは言い難い
「瞼球」とか「腱弓」といった医学用語が、一般語の
「研究」に優先されて変換されてしまう。Furthermore, in the conventional field priority conversion processing,
Since no distinction was made between general words and jargon words, jargon words that belong to the same field are prioritized like common words, which is efficient for general operators who do not have knowledge of jargon words. I couldn't say. For example, "medicine"
When it is presumed that it is a document in the field, when you type "kenkyu", medical terms such as "eyelid bulb" and "tendon arch", which are generally difficult to say, are commonly used. Will be converted with priority over.
【0007】本発明は上述の点に鑑みてなされたもの
で、その目的とするところは、入力文書の分野を判別
し、入力中の分野に対応した必要な専門語のみを自動的
に指定し、入力中の分野に対応しない不要な専門語辞書
の使用を抑制するように、さらには同じ分野に属する単
語でも、一般語と専門語とに区別して、専門語は操作者
の変換指定がなければ分野による優先変換をしないよう
に図った文字処理装置を提供することにある。The present invention has been made in view of the above points, and its purpose is to determine the field of an input document and automatically specify only the necessary technical words corresponding to the field being input. , In order to suppress the use of unnecessary technical term dictionaries that do not correspond to the field you are inputting, and even for words that belong to the same field, you must distinguish between general words and technical words, and the technical words must be specified by the operator. For example, it is to provide a character processing device that does not perform priority conversion depending on the field.
【0008】[0008]
【課題を解決するための手段】上記目的を達成するた
め、本発明は、特定の使用領域を持たない一般語と、特
定分野でのみ使用される専門語とを区別しつつ、単語の
読みに対して、表記文字列を含む当該単語の情報を格納
した単語辞書と、該単語辞書に格納されている専門語へ
の変換を行うか否かを指定する専門語辞書変換指定手段
と、単語の読みを入力する入力手段と、該入力手段によ
って入力された文章の属する文書分野を判定する分野判
定手段と、前記入力手段によって入力された単語の読み
を、前記専門語辞書変換指定手段によって指定されてい
る専門語および一般語のみを検索するとともに、前記分
野判定手段によって判定された分野に属する単語に優先
的に変換する分野優先変換手段とを有し、前記分野判定
手段は、前記専門語辞書変換指定手段を介して、入力さ
れた文章の属する文書分野に対応した専門語を指定する
ことを特徴とする。In order to achieve the above object, the present invention distinguishes between a general word having no specific usage area and a technical word used only in a specific field while reading a word. On the other hand, a word dictionary storing information of the word including a notation character string, a technical word dictionary conversion designating means for designating whether or not to convert to a technical word stored in the word dictionary, and a word dictionary Inputting means for inputting the reading, field determining means for determining the document field to which the sentence input by the input means belongs, and reading of the word input by the inputting means are designated by the technical word dictionary conversion designating means. And a field priority conversion means for preferentially converting to a word belonging to the field determined by the field determination means, and the field determination means, Through the writing conversion specification unit, characterized by specifying a technical term corresponding to the document Field of the inputted sentence.
【0009】また、本発明は好ましくはその一態様とし
て、前記分野判定手段は、前記専門語辞書変換指定手段
を介して、入力された文章の属する文書分野に対応しな
いすべての専門語辞書の使用を抑制することを特徴とす
ることができる。Further, in a preferred aspect of the present invention, the field determining means uses all the technical word dictionaries that do not correspond to the document field to which the input sentence belongs via the technical word dictionary conversion designating means. Can be suppressed.
【0010】また、本発明は好ましくは他の態様とし
て、前記分野優先変換手段は、前記分野判定手段によっ
て判定された分野に属している単語であっても、前記専
門語辞書変換指定手段によって指定されていない専門語
であった場合には、分野による優先変換を行わないこと
を特徴とすることができる。Further, in another aspect of the present invention, preferably, the field priority conversion means specifies the word belonging to the field determined by the field determination means by the technical word dictionary conversion designation means. It can be characterized in that the prioritized conversion according to the field is not performed in the case of a technical term that has not been written.
【0011】[0011]
【作用】本発明では、操作者が自ら専門語辞書の使用可
否の指定をすることなく、入力する文書分野に適した、
専門語を使用することができ、関係のない内容の文書入
力の際には、専門語の使用を抑制することができる。そ
のため、専門性が高く一般には稀な単語が、関係のない
分野の文書入力時に、変換されることを防ぎ、なおか
つ、変換解析対象単語数が抑制されることにより、応答
時間を縮められ、操作性も向上する。According to the present invention, an operator is suitable for a document field to be input without designating whether or not to use the technical term dictionary.
It is possible to use a technical term, and it is possible to suppress the use of the technical term when inputting a document having irrelevant contents. Therefore, it is possible to prevent the conversion of highly specialized words, which are rare in general, when inputting documents in unrelated fields, and reduce the number of words to be analyzed for conversion, which shortens the response time and improves the operation. The property is also improved.
【0012】[0012]
【実施例】以下、図面を参照して本発明の実施例を詳細
に説明する。Embodiments of the present invention will now be described in detail with reference to the drawings.
【0013】図1は本発明の文字処理装置の全体構成の
一例を示すブロック図である。図示の構成において、C
PUは、マイクロプロセッサであり、文字処理のための
演算、論理判断等を行ない、アドレスバスAB、コント
ロールバスCB、データバスDBを介して、それらのバ
スに接続された各構成要素を制御する。アドレスバスA
BはマイクロプロセッサCPUの制御の対象とする構成
要素を指示するアドレス信号を転送する。コントロール
バスCBはマイクロプロセッサCPUの制御の対象とす
る各構成要素のコントロール信号を転送して印加する。
データバスDBは各構成機器相互間のデータの転送を行
なう。FIG. 1 is a block diagram showing an example of the overall configuration of the character processing apparatus of the present invention. In the configuration shown, C
The PU is a microprocessor, performs arithmetic operations for character processing, logical judgments, etc., and controls each component connected to these buses via an address bus AB, a control bus CB, and a data bus DB. Address bus A
B transfers an address signal indicating a component to be controlled by the microprocessor CPU. The control bus CB transfers and applies a control signal of each constituent element to be controlled by the microprocessor CPU.
The data bus DB transfers data between the constituent devices.
【0014】次にROMは、読出し専用の固定メモリ
(読出し専用メモリ)である。PAは、図7〜図12に
つき後述するマイクロプロセッサCPUによる制御手順
等を記憶させたプログラムエリアである。The ROM is a read-only fixed memory (read-only memory). PA is a program area in which control procedures by the microprocessor CPU, which will be described later with reference to FIGS. 7 to 12, are stored.
【0015】また、RAMは、1ワード16ビットの構
成の書込み可能のランダムアクセスメモリであって、各
構成要素からの各種データの一時記憶に用いる。DIC
はカナ漢字変換を行なうための単語辞書である。TBU
Fは文書バッファであり、キーボードKBから入力され
た文書情報を蓄えるためのメモリである。YBUFはキ
ーボードKBから入力された読みを格納する入力読みバ
ッファ・メモリである。WBUFは単語辞書DICの検
索結果を一時的に格納する検索結果格納バッファ・メモ
リである。DBPOOLはカナ漢字変換の候補を蓄える
同音語プールである。The RAM is a writable random access memory having a structure of 1 word 16 bits, and is used for temporary storage of various data from each constituent element. DIC
Is a word dictionary for performing Kana-Kanji conversion. TBU
F is a document buffer, which is a memory for storing the document information input from the keyboard KB. YBUF is an input reading buffer memory for storing readings input from the keyboard KB. WBUF is a search result storage buffer memory that temporarily stores the search results of the word dictionary DIC. DBPOOL is a homophone pool that stores candidates for kana-kanji conversion.
【0016】BFLGは単語辞書DICに変換されてい
る単語のうち、専門語情報の付与されている単語の変換
を指定する指定専門語辞書フラグである。BTBLは優
先変換する分野と分野に対応した専門語辞書との対応を
とって格納した分野対応テーブルであり、専門語辞書の
切換え判定に用いる閾値と、分野の優先状態を積算して
いくカウンタ・メモリをも対応付けて格納する。BFLG is a designated technical word dictionary flag for designating conversion of a word to which technical word information is added among words converted to the word dictionary DIC. The BTBL is a field correspondence table stored by associating a field to be preferentially converted with a technical word dictionary corresponding to the field, and a counter that accumulates a threshold value used for switching the technical word dictionary and the priority state of the field. The memory is also associated and stored.
【0017】KBはキーボードであって、アルファベッ
トキー、ひらがなキー、カタカナキー等の文字記号入力
キー、及び、変換を指示する変換キーなどの各種のファ
ンクッションキーを備えている。図1において、YOM
Iは読みを入力するためのキー、CONは入力した読み
を変換するための変換指示キー(以下、変換キーと称す
る)、NXTは変換候補を変更して次候補に変換するた
めの次候補変換指示キー(以下、次候補変換キーと称す
る)、SELは現在の同音語表示候補に確定し同時にそ
の候補表記を学習することを指示するための選択キーで
ある。また、MDCは、単語辞書DICに格納されてい
る医学分野専門語の変換を指定するための医学辞書指定
キーである。The KB is a keyboard, which is provided with various character input keys such as alphabet keys, hiragana keys, katakana keys, and various fan cushion keys such as conversion keys for instructing conversion. In FIG. 1, YOM
I is a key for inputting a reading, CON is a conversion instruction key for converting the input reading (hereinafter referred to as a conversion key), and NXT is a next candidate conversion for changing a conversion candidate and converting it to a next candidate. An instruction key (hereinafter referred to as a next candidate conversion key) and SEL are selection keys for instructing to fix the current homophone display candidate and learn the candidate notation at the same time. Further, MDC is a medical dictionary designation key for designating conversion of a medical field technical term stored in the word dictionary DIC.
【0018】DISKは定型文書を記憶するための外部
メモリで、作成された文書の保管を行ない、保管された
文書はキーボードKBの指示により、必要な時呼び出さ
れる。DISK is an external memory for storing a fixed form document. The created document is stored, and the stored document is called when necessary by an instruction of the keyboard KB.
【0019】CRはカーソルレジスタである。マイクロ
プロセッサCPUにより、カーソルレジスタCRの内容
を読み書きできる。後述するCRTコントローラCRT
Cは、このカーソルレジスタCRに蓄えられたアドレス
に対する表示装置CRT上の位置にカーソルを表示す
る。DBUFは表示用バッファメモリで、文書バッファ
TBUFに蓄えられた文書情報等のパターンを蓄える。
CRTコントローラCRTCはカーソルレジスタCR及
びバッファDBUFに蓄えられた内容を表示器CRTに
表示する役割を担う。また、CRTは陰極線管等を用い
た表示装置であり、その表示装置CRTにおけるドット
構成のパターンおよびカーソルの表示をCRTコントロ
ーラCRTCで制御する。CR is a cursor register. The microprocessor CPU can read and write the contents of the cursor register CR. CRT controller CRT described later
C displays the cursor at the position on the display device CRT with respect to the address stored in the cursor register CR. DBUF is a display buffer memory that stores patterns such as document information stored in the document buffer TBUF.
The CRT controller CRTC plays a role of displaying the contents stored in the cursor register CR and the buffer DBUF on the display CRT. The CRT is a display device using a cathode ray tube or the like, and the display of the dot configuration pattern and the cursor on the display device CRT is controlled by the CRT controller CRTC.
【0020】さらに、CGはキャラクタジェネレータで
あって、表示装置CRTに表示する文字,記号のパター
ンを記憶するものである。Further, CG is a character generator, which stores a pattern of characters and symbols to be displayed on the display device CRT.
【0021】かかる各構成要素からなる本発明の一実施
例の文字処理装置においては、キーボードKBからの各
種の入力に応じて作動するものであって、キーボードK
Bからの入力が供給されると、まず、インタラプト信号
がマイクロプロセッサCPUに送られ、そのマイクロプ
ロセッサCPUがメモリROM内に記憶してある各種の
制御信号を読出し、それらの制御信号に従って、各種の
制御が行なわれる。In the character processing device of one embodiment of the present invention comprising the above-described components, the character processing device operates in response to various inputs from the keyboard KB, and the keyboard K
When the input from B is supplied, first, an interrupt signal is sent to the microprocessor CPU, the microprocessor CPU reads out various control signals stored in the memory ROM, and according to the control signals, various types of control signals are read out. Control is performed.
【0022】上記の構成からなる本実施例装置における
漢字変換が実行される一例を従来例と対比させて、図2
および図3を参照して以下に説明する。FIG. 2 shows an example in which Kanji conversion is executed in the apparatus of the present embodiment having the above-mentioned configuration, in comparison with the conventional example.
And with reference to FIG. 3, it demonstrates below.
【0023】図2の(a)は途中まで文章の入力をした
ときの表示装置CRTの表示状態である。この図中にお
いて(j)がカーソルを示す。FIG. 2 (a) shows the display state of the display device CRT when a sentence is input halfway. In the figure, (j) indicates a cursor.
【0024】この状態で「け」,「ん」,「き」,
「ゅ」,「う」,「で」,「は」という文字が入力され
ると、表示装置CRTの表示状態は(b)のようにな
る。この図中において(k)の示すアンダーラインはか
な漢字変換結果が決定されていない状態を示す。In this state, "ke", "n", "ki",
When the characters "yu", "u", "de", and "ha" are input, the display state of the display device CRT becomes as shown in (b). In this figure, the underline indicated by (k) indicates a state in which the kana-kanji conversion result has not been determined.
【0025】図2の(b)の表示状態から、変換キーC
ONが入力されると、入力文字列に対してかな漢字変換
が実行される。従来の分野語優先変換では、入力文書の
状態から入力分野が『医学』分野であると判定された場
合、無条件に『医学』分野の単語が優先変換されるた
め、図2の(c)のように「瞼球」という極めて専門的
な医学用語が一般的な「研究」よりも優先されて変換さ
れる。From the display state of FIG. 2B, the conversion key C
When ON is input, kana-kanji conversion is executed on the input character string. In the conventional field word priority conversion, when it is determined from the state of the input document that the input field is the "medicine" field, the words in the "medical" field are unconditionally prioritized, so that FIG. As described above, the highly specialized medical term "eyelid bulb" is converted with priority over general "research".
【0026】これに対して、本発明によれば入力分野が
『医学』分野であると判定されていても、操作者が指定
した専門分野のみが、分野語優先変換の対象となるた
め、図2の(d)のように「研究」と変換できる。On the other hand, according to the present invention, even if the input field is determined to be the "medical" field, only the specialized field designated by the operator is subject to the field word priority conversion. It can be converted to "research" as in (d) of 2.
【0027】さらに、図3の(e)において、医学辞書
指定キーMDCを入力することにより、分野語優先変換
の対象を『医学』分野の専門語にも適用する指示が行え
る。図3の(f)の図における(1)は、現在『医学』
分野専門語辞書が変換可能になっていることを示すモー
ド表示である。『医学』分野専門語辞書が変換可能な状
態で、図2の(b)と同様の文書を入力し、同じように
「けんきゅうでは」と変換すると、図3の(i)に示す
ように今度は医学分野の専門語である「瞼球」が分野優
先語変換の結果、「研究」に優先されて出力される。Further, in FIG. 3 (e), by inputting the medical dictionary designation key MDC, it is possible to give an instruction to apply the target of the field word priority conversion to the technical words in the field of "medical". (1) in the figure of (f) of FIG. 3 is currently "medicine"
It is a mode display showing that the field technical term dictionary can be converted. When a document similar to that shown in FIG. 2 (b) is input while the “medical” field technical dictionary is convertible, and similarly converted to “Kenkyu de”, as shown in FIG. 3 (i). This time, as a result of the field priority word conversion, the term "eyelid ball", which is a technical term in the medical field, is output with priority over "research".
【0028】図4は、本発明の一実施例の文字処理装置
における単語辞書DICの一例である。図4において、
YMは単語の読みを、HKは単語の表記を、GIは品詞
をFQは頻度数値を、SPは一般単語であるか、あるい
は専門語であるかの情報を、CTは単語が良く使われる
分野を、CFはその分野における使われ易さの度合い
(確信度ともいう)を、それぞれ固定長のレコード形式
で格納している。本図において、例えば「瞼球」は頻度
2の各詞で医学専門語であり、医学分野に確信度5で登
録されている。FIG. 4 shows an example of the word dictionary DIC in the character processing apparatus according to the embodiment of the present invention. In FIG.
YM is the reading of words, HK is the notation of words, GI is the part of speech, FQ is the frequency value, SP is information about whether it is a general word or a technical word, and CT is a field where words are often used. The CF stores the degree of ease of use (also referred to as the certainty factor) in the field in a fixed-length record format. In this figure, for example, “eyelid ball” is a medical term with a frequency of 2 and is registered in the medical field with a certainty factor of 5.
【0029】図5は、本発明の一実施例の文字処理装置
における、指定専門語辞書フラグBFLGの一例であ
る。このフラグBFLGは1専門語辞書を1ビットで、
変換するか、しないかをセットする。本図の図示の状態
においては、ビットの値が1になっている『医学』専門
語のみが専門語辞書では変換される。FIG. 5 shows an example of the designated technical term dictionary flag BFLG in the character processing apparatus according to the embodiment of the present invention. This flag BFLG is 1 bit for 1 technical term dictionary,
Set whether to convert or not. In the illustrated state of the figure, only the "medical" technical word having a bit value of 1 is converted in the technical word dictionary.
【0030】図6は、本発明の一実施例の文字処理装置
における、分野対応テーブルBTBLの一例を示す。図
6において、CATは優先変換処理分野を格納する。S
GMはその優先変換処理分野の状態を示す積算指標値で
あり、その分野に相当する単語が選択されるごとに、単
語辞書DICにおけるCF(その分野での使われ易さ)
の値に応じて、積算され、また、その分野以外の分野に
属する単語が選択されると、減算されていく。SHLは
その分野に対応する専門語辞書を使用可能にするか否か
を判定するための閾値で、この閾値から上記SGMの値
(積算指標値)が大きければ、対応する専門語辞書の使
用を可能となるように動作する。SPD1,SPD2,
SPD3は、その分野に対応する専門語辞書種別で、3
種まで格納可能となっている。図6の図示においては、
医療・健康・医学分野の積算値SGMが閾値SHLを越
えれば、医学専門語および生物学専門語を使用可能とす
るように動作する。FIG. 6 shows an example of the field correspondence table BTBL in the character processing apparatus of one embodiment of the present invention. In FIG. 6, CAT stores the priority conversion processing field. S
GM is an integrated index value indicating the state of the priority conversion processing field, and every time a word corresponding to the field is selected, CF in the word dictionary DIC (ease of use in the field)
Is added up according to the value of, and when a word belonging to a field other than the field is selected, the word is subtracted. SHL is a threshold value for determining whether or not the technical term dictionary corresponding to the field can be used. If the value of the SGM (integrated index value) is large from this threshold value, the corresponding technical term dictionary is used. Operate to be possible. SPD1, SPD2
SPD3 is a technical term dictionary type corresponding to the field and is 3
It is possible to store even seeds. In the illustration of FIG.
If the integrated value SGM in the medical / health / medical fields exceeds the threshold value SHL, the medical term and the biological term operate so as to be usable.
【0031】以下、上述の実施例の作動を図7〜図12
のフローチャートに従って説明する。The operation of the above embodiment will be described below with reference to FIGS.
It will be described in accordance with the flowchart of.
【0032】図7は本発明の一実施例の文字処理装置の
全体の動作を示すフローチャートである。まず、S7−
1においてキーボードKBからキーが押下され、割り込
みが発生するのを待つ。キーが入力されるとS7−2に
おいてキー判別をし、キーの種類に応じてS7−3,S
7−4,S7−5,S7−6,S7−7,S7−8のい
ずれかのステップに分岐する。FIG. 7 is a flow chart showing the overall operation of the character processing device of one embodiment of the present invention. First, S7-
At 1, a key is pressed from the keyboard KB and an interrupt occurs. When a key is input, the key is discriminated in S7-2, and depending on the type of key, S7-3, S
7-4, S7-5, S7-6, S7-7, S7-8.
【0033】S7−3は読み入力キーYOMIが押下さ
れたときの処理であり、押下された読みのコードを入力
読みバッファ・メモリYBUFに蓄える。S7-3 is a process when the reading input key YOMI is pressed, and the code of the pressed reading is stored in the input reading buffer memory YBUF.
【0034】S7−4は変換キーCONが押下されたと
きの処理であり、S7−3で入力されて入力読みバッフ
ァ・メモリYBUFに蓄えられている、カナ漢字変換の
対象となる文字列を漢字に変換し、出力バッファに出力
する。S7-4 is a process when the conversion key CON is pressed, and the character string which is input in S7-3 and stored in the input reading buffer memory YBUF and which is the target of kana-kanji conversion is kanji. And output to the output buffer.
【0035】S7−5は次候補変換キーNXTが押下さ
れたときの処理であり、S7−4によって出力された出
力バッファ中の同音語の別の候補を表示する。Step S7-5 is the processing when the next candidate conversion key NXT is pressed, and another candidate of the same word in the output buffer output in step S7-4 is displayed.
【0036】S7−6は選択キーSELが押下されたと
きの処理であり、表示装置CRTの画面に表示されてい
る出力バッファ中の同音語を確定し、確定された文字列
を文書(TBUF)中に出力する。さらに、選択された
単語の分野の情報から入力文書の分野を判定し、対応す
る専門語辞書の使用可否の判定を行なう。Step S7-6 is a process when the selection key SEL is pressed, and the homophone in the output buffer displayed on the screen of the display device CRT is fixed, and the fixed character string is documented (TBUF). Output inside. Further, the field of the input document is determined from the information of the field of the selected word, and the availability of the corresponding technical term dictionary is determined.
【0037】S7−7は医学辞書指定キー(医学専門語
辞書指定キーとも称する)MDCが押下されたときの処
理であり、指定した専門語辞書に対応する指定専門語辞
書フラグ(専門語辞書変換指定フラグとも称する)BF
LGのビットの値を1にする。Step S7-7 is a process when the medical dictionary designation key (also referred to as a medical technical term dictionary designation key) MDC is pressed, and the designated technical term dictionary flag (special term dictionary conversion) corresponding to the designated technical term dictionary. Also called designated flag) BF
Set the bit value of LG to 1.
【0038】S7−8は、YOMI,CON,NXT,
SEL,MDC以外のキー(例えば、カーソル移動キー
などの文書編集で用いるキーなど)が押下された場合の
処理であり、同種の文字処理装置において一般に行なわ
れている処理であり、公知であるので特にその詳細は記
述しない。S7-8 is YOMI, CON, NXT,
This is a process when a key other than SEL and MDC (for example, a key used for document editing such as a cursor movement key) is pressed, and is a process generally performed in a character processing device of the same type, and is known. The details will not be described.
【0039】S7−9は上記の処理の結果、変更された
部分を表示する表示処理である。文書(TBUF)中の
データ1文字を読んではパターンに展開し、表示用バッ
ファ・メモリDBUFに出力するという通常広く行なわ
れている処理である。S7-9 is a display process for displaying the changed part as a result of the above process. This is a widely-used process of reading one character of data in a document (TBUF), developing it into a pattern, and outputting it to the display buffer memory DBUF.
【0040】図8は、図7のS7−4の変換処理を詳細
に示すフローチャートである。まず、S8−1では、文
節単位に分ち書きされて入力されたカナ漢字変換の対象
となる文字列に対し、単語辞書DICを検索し、検索結
果格納バッファ・メモリWBUFに格納する。続いてS
8−2では単語辞書検索結果(WBUF)から文節とし
て認定される候補のみをカナ漢字変換の出力の候補とし
て、同音語プールDBPOOLに出力する。この処理は
同種の文字処理装置において一般に行なわれている処理
であり、周知であるので特に詳述しない。FIG. 8 is a flow chart showing the conversion process of S7-4 of FIG. 7 in detail. First, in step S8-1, the word dictionary DIC is searched for a character string to be subjected to Kana-Kanji conversion that has been segmented and input in phrase units, and stored in the search result storage buffer memory WBUF. Then S
In 8-2, only candidates that are recognized as phrases from the word dictionary search result (WBUF) are output to the homophone pool DBPOOL as candidates for output of Kana-Kanji conversion. This process is a process generally performed in a character processing device of the same type and is well known, so a detailed description thereof will be omitted.
【0041】次、S8−3ではS8−2において同音語
プールDBPOOLに出力された解析結果に対して、入
力文書の分野と一致する単語や、単語学習されている候
補の中から、カナ漢字変換の第1候補を決定する。Next, in step S8-3, for the analysis result output to the homophone pool DBPOOL in step S8-2, kana-kanji conversion is performed from words that match the field of the input document or candidates for which words have been learned. Determines the first candidate of.
【0042】続いて、S8−4では、出力バッファに格
納されたカナ漢字変換の出力を表示する。この処理は同
種の文字処理装置において一般に行なわれている処理で
あり、周知であるので特に詳述しない。Subsequently, in S8-4, the output of the Kana-Kanji conversion stored in the output buffer is displayed. This process is a process generally performed in a character processing device of the same type and is well known, so a detailed description thereof will be omitted.
【0043】図9は、図8のS8−1の辞書検索処理を
詳細に示すフローチャートである。まず、S9−1では
分かち書き入力されてバッファ・メモリYBUFに格納
された単語の読み文字で単語辞書DICを検索する。次
のS9−2で読み文字に対応する単語が検索されたかど
うかを判定し、これ以上見つからなかった場合は、即座
に終了する。見つかった場合は、S9−3へ進み、単語
辞書DICのデータ項目SPを参照し、一般語であった
(すなわち専門語ではない)ならば、S9−5で単語検
索結果格納バッファ・メモリWBUFに検索結果を蓄え
る。一般語ではなかった(すなわち、いずれかの専門語
であった)ならば、S9−4で使用可能専門語かどうか
の判定を行なう。FIG. 9 is a flow chart showing in detail the dictionary search process of S8-1 of FIG. First, in step S9-1, the word dictionary DIC is searched for with the reading characters of the words input in a divided manner and stored in the buffer memory YBUF. In the next step S9-2, it is determined whether or not a word corresponding to the reading character has been searched. If no more words are found, the process is immediately terminated. If found, the process proceeds to S9-3, refers to the data item SP of the word dictionary DIC, and if it is a general word (that is, not a technical word), it is stored in the word search result storage buffer memory WBUF in S9-5. Store search results. If it is not a general word (that is, it is one of the technical words), it is determined in S9-4 whether it is a usable technical word.
【0044】S9−4は図4の単語辞書DICのデータ
項目のSPの示す、いずれの専門語であるかの専門語種
別が、また指定専門語辞書フラグこBFLGにおいて、
対応するビット情報が、セットされているかどうかを判
定する。指定専門語辞書フラグBFLGにおいて、検索
された専門語が使用可能でなかったならば、検索結果バ
ッファ・メモリWBUFに蓄えられることなく、S9−
6で次の単語の検索を行なう。指定専門語辞書フラグB
FLGにおいて、検索された専門語が使用可能であった
ならば、S9−5で検索結果バッファ・メモリWBUF
に検索結果を蓄えた後、S9−6で次の単語の検索を行
なう。入力バッファYBUFに対応するすべての単語を
検索し終えると、S9−2でこれ以上見つからないと判
定され、本処理を終了する。In S9-4, the technical word type indicating which technical word is indicated by the SP of the data item of the word dictionary DIC in FIG. 4 is the designated technical word dictionary flag BFLG.
It is determined whether the corresponding bit information is set. If the searched technical word is not usable in the designated technical word dictionary flag BFLG, it is not stored in the search result buffer memory WBUF and S9-
At 6, the next word is searched. Specified technical language dictionary flag B
If the searched technical term is available in the FLG, the search result buffer memory WBUF is determined in S9-5.
After storing the search result in, the next word is searched in S9-6. When all the words corresponding to the input buffer YBUF have been searched, it is determined in S9-2 that no more words are found, and this processing ends.
【0045】図10は、図8のS8−3の第1候補決定
処理を詳細に示すフローチャートである。まず、S10
−1で、同音語プールDBPOOLに格納されたかな漢
字変換候補単語のすべてについて、入力分野と一致して
いるかどうかをチェックし、全てをチェック済ならば分
野との一致による単語決定はできなかったものとして、
S10−4で、学習されている単語がないかどうかをチ
ェックし、学習されている単語があればその単語に決定
して処理を終了する。FIG. 10 is a flow chart showing in detail the first candidate determination processing of S8-3 of FIG. First, S10
In -1, all Kana-Kanji conversion candidate words stored in the homophone pool DBPOOL are checked to see if they match the input field. If all are checked, the word cannot be determined by matching the field. As
In S10-4, it is checked whether or not there is a learned word, and if there is a learned word, the word is decided and the process is terminated.
【0046】S10−1で全てをチェック済みでなけれ
ば、S10−2で入力分野と一致する分野情報を持って
いる単語であるかどうかを判定し、もし分野が一致すれ
ばその分野による決定可能として、その単語を第1候補
として決定し終了する。もしそうでなければS10−3
へと進み、同音語プールDBPOOL内の次の候補単語
のチェックを行う。If all the fields have not been checked in S10-1, it is determined in S10-2 whether or not the word has field information that matches the input field. If the fields match, the field can be determined. Then, the word is determined as the first candidate, and the process ends. If not, S10-3
Go to and check the next candidate word in the homophone pool DBPOOL.
【0047】上記の入力分野と一致するかどうかの判定
は、以下のように行なう。同音語プールDBPOOLに
蓄えられた単語の情報のうち、図4の単語辞書DIC中
のデータ項目である分野CTと確信度CFを参照する。
図6の分野対応テーブルBTBLの分野積算指標値SG
Mが0でない分野CATとCTが一致するもののうち、
そのSGMの値とCFの値の積が最大になる同音語プー
ルDBPOOL内の候補単語に決定する。The determination as to whether or not it matches the input field is performed as follows. Of the word information stored in the homophone pool DBPOOL, the field CT and the certainty factor CF, which are the data items in the word dictionary DIC of FIG. 4, are referred to.
Field integration index value SG of the field correspondence table BTBL in FIG.
Among fields where CAT and CT match where M is not 0,
The candidate word in the homonym pool DBPOOL that maximizes the product of the SGM value and the CF value is determined.
【0048】図11は図7のS7−6の選択処理を詳細
に示すフローチャートである。まず、S11−1では選
択された単語の分野情報から、入力文書の分野を判定す
る。分野の判定は、以下のように行なう。同音語プール
DBPOOLに蓄えられた候補単語のうち、選択された
単語の分野情報CTに対応する分野対応テーブルBTB
Lの積算指標値SGMに上記の確信度CFの値を加え、
対応しない分野の積算指標値SGMから一定値(本実施
例では2とする)を減じる。分野判定処理後、分野別専
門語辞書設定処理を実行する。FIG. 11 is a flow chart showing in detail the selection processing of S7-6 of FIG. First, in S11-1, the field of the input document is determined from the field information of the selected word. The field determination is performed as follows. Of the candidate words stored in the homophone pool DBPOOL, the field correspondence table BTB corresponding to the field information CT of the selected word
The value of the certainty factor CF is added to the integrated index value SGM of L,
A constant value (2 in this embodiment) is subtracted from the integrated index value SGM of the unsupported field. After the field determination processing, field-specific technical term dictionary setting processing is executed.
【0049】次のS11−2の分野別専門語辞書設定処
理では、一定水準以上の分野積算指標値に達した分野に
対応する使用可能な専門語辞書を使用可能な状態に設定
を行なう。In the next field-specific technical word dictionary setting process in S11-2, the available technical word dictionary corresponding to the field that has reached the field integration index value of a certain level or higher is set to a usable state.
【0050】続いてS11−3の学習処理において、選
択された単語を学習し、これ以後のその単語の変換時の
優先度を上げる。この処理は同種の文字処理装置におい
て従来より行なわれてきた周知の処理である。この学習
処理終了後、S11−4で同音語を確定する確定処理を
行う。Subsequently, in the learning process of S11-3, the selected word is learned, and the priority of the subsequent conversion of the word is increased. This process is a well-known process that has been conventionally performed in a character processing device of the same type. After this learning process is completed, a confirmation process for confirming a homonym is performed in S11-4.
【0051】上記学習処理は辞書に存在する単語、ある
いは登録された単語に対応した学習データを更新するも
のであり、同種の文字処理装置において一般に行われて
いる処理であり、周知であるので特に詳述しない。The learning process is to update the learning data corresponding to the word existing in the dictionary or the registered word, and is a process generally performed in the character processing device of the same kind, and is well known, and therefore, in particular, Not detailed.
【0052】図12は図11のS11−2の入力分野判
定処理を詳細に示すフローチャートである。まず、S1
2−1で、すべての専門語辞書を使用不可の状態にすべ
く、専門語辞書指定フラグBFLGの全ビット情報を0
にセットする。次のS12−2で分野対応テーブルBT
BLに格納されている全分野を処理したかどうかを判定
し、すべて終了した場合は本処理を終了する。FIG. 12 is a flow chart showing in detail the input field determination processing of S11-2 of FIG. First, S1
In step 2-1, all the bit information of the technical word dictionary designation flag BFLG is set to 0 in order to disable all the technical word dictionaries.
Set to. Field correspondence table BT in the next S12-2
It is determined whether or not all fields stored in the BL have been processed, and if all fields have been processed, this process ends.
【0053】全分野を処理していない場合は、S12−
3で図6の分野対応テーブルBTBLの入力分野積算指
標値SGMの値から専門語使用閾値SHLの値を減じた
結果が負であれば、すなわちこの分野積算指標値SGM
は、専門語使用可能に閾値に達していないということて
であり、この場合はS12−5で次の分野の処理を行な
う。If all fields are not processed, S12-
If the result of subtracting the value of the technical term use threshold value SHL from the value of the input field integration index value SGM of the field correspondence table BTBL in 3 is negative, that is, this field integration index value SGM
Means that the threshold value for the use of technical terms has not reached the threshold. In this case, the processing of the next field is performed in S12-5.
【0054】上記の減算結果が非負(負でない)であれ
ば、この分野積算指標値は、専門語使用可能な閾値に達
していると判断し、次のS12−4でこの分野に対応す
る専門語辞書を分野対応テーブルBTBLのSPD1,
SPD2,SPD3から取得し、それぞれの専門語辞書
を指定専門語辞書フラグBFLGの対応ビット情報を1
にセットして、使用可能な状態にする。その後、次の分
野の処理をS12−5で行った後、S12−2に戻る。If the above subtraction result is non-negative (not negative), it is judged that this field integration index value has reached the threshold value at which a technical term can be used, and in the next step S12-4, the technical field corresponding to this field is specialized. The word dictionary is SPD1, which is the field correspondence table BTBL.
It is acquired from SPD2 and SPD3, and each technical term dictionary is designated. The corresponding bit information of the technical term dictionary flag BFLG is set to 1
And set it to the usable state. After that, the process of the next field is performed in S12-5, and then the process returns to S12-2.
【0055】(他の実施例)以上の説明において、一般
語と専門語は同一の固定長の辞書内に混在させ、識別情
報で区別するようにしたが、一般単語辞書と、専門語辞
書とに辞書そのものを分けることにより、辞書検索処理
における応答性能をより向上させることができる。(Other Embodiments) In the above description, the general word and the technical word are mixed in the same fixed length dictionary so as to be distinguished by the identification information. However, the general word dictionary and the technical word dictionary are different from each other. By dividing the dictionary itself into, it is possible to further improve the response performance in the dictionary search processing.
【0056】また、以上の説明において、専門語辞書を
使用するかどうかの判定にあたって、分野ごとに専門語
使用可否判定用の閾値を定数として設け、この閾値を超
えたかどうかで判定するようにしたが、各分野の中で突
出している分野を求め、突出している分野に対応する専
門語を指定するようにしてもよい。その突出した分野と
は、作成中の文書の内容による分野の偏向の度合いが高
いもので、例えば、以下のように、求めることができ
る。図10におけるS10−3で、全分野の積算指標値
SGMの総和と平均を求め、各分野ごとの平均との差
(すなわち、偏差)を算出する。各偏差の平方和の平均
の平方根(すなわち、作文文書の分野の標準偏差)をσ
とし、+Nσ(Nは正の定数)の分野積算指標値をもつ
分野であるかどうかで、専門語辞書の使用判定を行なう
ことができる。Further, in the above description, in determining whether to use the technical term dictionary, a threshold value for determining whether to use the technical term is set as a constant for each field, and it is determined whether or not the threshold value is exceeded. However, a prominent field may be sought in each field and a technical term corresponding to the prominent field may be designated. The prominent field has a high degree of field bias depending on the content of the document being created, and can be obtained as follows, for example. In S10-3 in FIG. 10, the sum and average of the integrated index values SGM of all fields are obtained, and the difference (that is, deviation) from the average for each field is calculated. Σ is the square root of the mean of the sum of squares of each deviation (ie, the standard deviation of the writing document field)
Then, it is possible to determine whether to use the technical term dictionary by checking whether or not the field has a field integration index value of + Nσ (N is a positive constant).
【0057】[0057]
【発明の効果】上述したように、本発明によれば、操作
者が自ら専門語を変換指定することなく、入力する文書
分野に適した、専門語を使用することができるので、変
換効率が高まり、操作性を向上させることができる。As described above, according to the present invention, since the operator can use the jargon suitable for the field of the input document without designating the jargon by himself or herself, the conversion efficiency is improved. Therefore, the operability can be improved.
【0058】また、本発明によれば、操作者が自ら専門
語辞書の使用可否の指定をすることなく、入力する文書
分野に適した、専門語を使用することができ、関係のな
い内容の文書入力の際には、専門語の使用を抑制するこ
とができる。そのため、専門性が高く一般には稀な単語
が、関係のない分野の文書入力時に、変換されることを
防ぎ、なおかつ、変換解析対象単語数が抑制されること
により、応答時間を縮められ、操作性も向上する。Further, according to the present invention, the operator can use a technical word suitable for the input document field without designating whether to use the technical word dictionary by himself or herself. It is possible to suppress the use of technical terms when inputting a document. Therefore, it is possible to prevent the conversion of highly specialized words, which are rare in general, when inputting documents in unrelated fields, and reduce the number of words to be analyzed for conversion, which shortens the response time and improves the operation. The property is also improved.
【0059】更に、本発明によれば、操作者の指定した
専門語の範囲で分野優先変換されるため、専門性が高く
一般には稀な単語が、その変換を所望しない操作者に第
1優先で変換されることがなく、入力分野に適合し、な
おかつ操作者の単語の使用レベルに応じたかな漢字変換
装置を築くことが可能である。Further, according to the present invention, since the field priority conversion is performed within the range of the technical words designated by the operator, words having high specialization and which are rare in general are given first priority to the operator who does not desire the conversion. It is possible to build a kana-kanji conversion device that is not converted by the method, is suitable for the input field, and is suitable for the operator's word usage level.
【図1】本発明の一実施例の文字処理装置の全体構成を
示すブロック図である。FIG. 1 is a block diagram showing an overall configuration of a character processing device according to an embodiment of the present invention.
【図2】従来のかな漢字変換例と本発明のかな漢字変換
の実行例を対比して示す図である。FIG. 2 is a diagram showing a comparison between a conventional kana-kanji conversion example and an execution example of kana-kanji conversion of the present invention.
【図3】本発明のかな漢字変換の実行例の続きを示す図
である。FIG. 3 is a diagram showing a continuation of an execution example of kana-kanji conversion according to the present invention.
【図4】本発明の一実施例の文字処理装置における単語
辞書DICの構成の一例を示す図である。FIG. 4 is a diagram showing an example of a configuration of a word dictionary DIC in the character processing device of the exemplary embodiment of the present invention.
【図5】本発明の一実施例の文字処理装置における専門
語変換指定フラグBFLGの構成の一例を示す図であ
る。FIG. 5 is a diagram showing an example of a structure of a technical term conversion designation flag BFLG in the character processing device of one embodiment of the present invention.
【図6】本発明の一実施例の文字処理装置における分野
対応テーブルBTBLの構成の一例を示す図である。FIG. 6 is a diagram showing an example of a configuration of a field correspondence table BTBL in the character processing device according to the embodiment of the present invention.
【図7】本発明の一実施例の動作全体の処理手順の一例
を示すフローチャートである。FIG. 7 is a flowchart showing an example of the processing procedure of the entire operation of one embodiment of the present invention.
【図8】本発明の一実施例のかな漢字変換全体の処理手
順の一例を示すフローチャートである。FIG. 8 is a flowchart showing an example of a processing procedure of the entire kana-kanji conversion according to the embodiment of the present invention.
【図9】本発明の一実施例のかな漢字変換処理における
辞書検索手順の一例を示すフローチャートである。FIG. 9 is a flowchart showing an example of a dictionary search procedure in the Kana-Kanji conversion processing according to the embodiment of the present invention.
【図10】本発明の一実施例のかな漢字変換処理におけ
る第1候補決定手順の一例を示すフローチャートであ
る。FIG. 10 is a flowchart showing an example of a first candidate determination procedure in the kana-kanji conversion processing according to the embodiment of the present invention.
【図11】本発明の一実施例の選択処理の処理手順の一
例を示すフローチャートである。FIG. 11 is a flowchart showing an example of a processing procedure of selection processing according to an embodiment of the present invention.
【図12】本発明の一実施例の選択処理における分野別
専門語辞書設定処理手順の一例を示すフローチャートで
ある。FIG. 12 is a flowchart showing an example of a field-specific technical term dictionary setting process procedure in the selection process according to the embodiment of the present invention.
CPU マイクロプロセッサ ROM 読出し専用の固定メモリ(読出し専用メモリ) RAM ランダムアクセスメモリ DIC 単語辞書 TBUF 文書バッファ YBUF 入力読みバッファ・メモリ WBUF 検索結果格納バッファ・メモリ DBPOOL 同音語プール BFLG 指定専門語辞書フラグ BTBL 分野対応テーブル KB キーボード YOMI 読み入力キー CON 変換指定キー NXT 次候補変換指定キー SEL 選択キー MDC 医学辞書指定キー DISK 外部メモリ CR カーソルレジスタ CRT 表示装置 CRTC CRTコントローラ DBUF 表示用バッファメモリ CG キャラクタジェネレータ CPU Microprocessor ROM Read-only fixed memory (read-only memory) RAM Random access memory DIC Word dictionary TBUF Document buffer YBUF Input reading buffer / memory WBUF Search result storage buffer / memory DBPOOL Homophone pool BFLG designated specialized word dictionary flag BTBL Field compatible Table KB Keyboard YOMI Reading input key CON Conversion designation key NXT Next candidate conversion designation key SEL selection key MDC Medical dictionary designation key DISK External memory CR cursor register CRT display device CRTC CRT controller DBUF Display buffer memory CG Character generator
フロントページの続き (72)発明者 鈴木 秀恭 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 森澤 秀一 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 鈴木 大記 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 緩利 仁志 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 小楠 千佳 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 森田 麻友美 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 榊原 厚志 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内 (72)発明者 秋葉 麻里子 東京都大田区下丸子3丁目30番2号 キヤ ノン株式会社内(72) Inventor Hideyasu Suzuki 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Shuichi Morisawa 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Daiki Suzuki 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Hitoshi Haruri 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) ) Inventor Chika Kogusu 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Mayumi Morita 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Sakakibara Atsushi 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc. (72) Inventor Mariko Akiba 3-30-2 Shimomaruko, Ota-ku, Tokyo Canon Inc.
Claims (3)
定分野でのみ使用される専門語とを区別しつつ、単語の
読みに対して、表記文字列を含む当該単語の情報を格納
した単語辞書と、 該単語辞書に格納されている専門語への変換を行うか否
かを指定する専門語辞書変換指定手段と、 単語の読みを入力する入力手段と、 該入力手段によって入力された文章の属する文書分野を
判定する分野判定手段と、 前記入力手段によって入力された単語の読みを、前記専
門語辞書変換指定手段によって指定されている専門語お
よび一般語のみを検索するとともに、前記分野判定手段
によって判定された分野に属する単語に優先的に変換す
る分野優先変換手段とを有し、 前記分野判定手段は、前記専門語辞書変換指定手段を介
して、入力された文章の属する文書分野に対応した専門
語を指定することを特徴とする文字処理装置。1. A word for reading a word, which includes a written character string, is stored while distinguishing a general word having no specific usage area from a technical word used only in a specific field. A word dictionary, a technical word dictionary conversion designating means for designating whether or not to convert into a technical word stored in the word dictionary, an input means for inputting a reading of a word, and an input by the input means. A field determining unit that determines a document field to which a sentence belongs, and a reading of a word input by the input unit, searching only a technical word and a general word specified by the technical word dictionary conversion specifying unit, and the field And a field priority conversion means for preferentially converting words belonging to the field judged by the judgment means, wherein the field judgment means belongs to the input sentence through the technical word dictionary conversion designation means. Character processing apparatus according to claim that you specify a technical term that corresponds to the document field.
換指定手段を介して、入力された文章の属する文書分野
に対応しないすべての専門語辞書の使用を抑制すること
を特徴とする請求項1に記載の文字処理装置。2. The field determining means suppresses the use of all the technical word dictionaries that do not correspond to the document field to which the input sentence belongs via the technical word dictionary conversion designating means. The character processing device according to 1.
手段によって判定された分野に属している単語であって
も、前記専門語辞書変換指定手段によって指定されてい
ない専門語であった場合には、分野による優先変換を行
わないことを特徴とする請求項1に記載の文字処理装
置。3. The field priority conversion means, when a word belonging to a field determined by the field determination means, is a technical word which is not specified by the technical word dictionary conversion specifying means. The character processing device according to claim 1, wherein the priority conversion according to the field is not performed.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5350237A JPH07200568A (en) | 1993-12-29 | 1993-12-29 | Character processor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP5350237A JPH07200568A (en) | 1993-12-29 | 1993-12-29 | Character processor |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPH07200568A true JPH07200568A (en) | 1995-08-04 |
Family
ID=18409156
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP5350237A Pending JPH07200568A (en) | 1993-12-29 | 1993-12-29 | Character processor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPH07200568A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017037513A (en) * | 2015-08-11 | 2017-02-16 | 富士通株式会社 | Language processing device, language processing program, and language processing method |
-
1993
- 1993-12-29 JP JP5350237A patent/JPH07200568A/en active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017037513A (en) * | 2015-08-11 | 2017-02-16 | 富士通株式会社 | Language processing device, language processing program, and language processing method |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7110939B2 (en) | Process of automatically generating translation-example dictionary, program product, computer-readable recording medium and apparatus for performing thereof | |
| US4777600A (en) | Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms | |
| JPH07200568A (en) | Character processor | |
| JP2951956B2 (en) | Character processing apparatus and method | |
| JPH0567079A (en) | Character processor | |
| JPS59100941A (en) | Kana (japanese syllabary)-kanji (chinese character) converter | |
| JP3304999B2 (en) | Dictionary management method and device | |
| JP2542384B2 (en) | Character processor | |
| JP3847812B2 (en) | Character processing method and apparatus | |
| JPH096771A (en) | Data processing device | |
| JP3809238B2 (en) | Document processing method and apparatus | |
| JPH05233604A (en) | Word registration method | |
| JPH0981555A (en) | Document processing apparatus and method | |
| JPS60181835A (en) | Information processor | |
| JPH0567078A (en) | Character processor | |
| JPH08202701A (en) | Character processing device and its kana-kanji conversion method | |
| JPH0442350A (en) | character processing device | |
| JP2003122745A (en) | Character processing apparatus and method | |
| JP3873299B2 (en) | Kana-kanji conversion device and kana-kanji conversion method | |
| JPH05135011A (en) | Character processing method and device therefor | |
| JPH0528143A (en) | Document processor | |
| JP2003173332A (en) | Kana-Kanji conversion system and character processor | |
| JPH05135017A (en) | Character processing method and device | |
| JPH04332073A (en) | Method and device for processing character | |
| JPH11195020A (en) | Document processing method and apparatus |