JPH05120331A - Homonym recognizing device - Google Patents

Homonym recognizing device

Info

Publication number
JPH05120331A
JPH05120331A JP3089507A JP8950791A JPH05120331A JP H05120331 A JPH05120331 A JP H05120331A JP 3089507 A JP3089507 A JP 3089507A JP 8950791 A JP8950791 A JP 8950791A JP H05120331 A JPH05120331 A JP H05120331A
Authority
JP
Japan
Prior art keywords
predicate
character string
kanji
hit rate
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3089507A
Other languages
Japanese (ja)
Other versions
JP2793992B2 (en
Inventor
Hisao Nakamura
久夫 中村
Tsutomu Takahashi
力 高橋
Motohiko Hasegawa
元彦 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
M C WAADE CENTER KK
Original Assignee
M C WAADE CENTER KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by M C WAADE CENTER KK filed Critical M C WAADE CENTER KK
Priority to JP3089507A priority Critical patent/JP2793992B2/en
Publication of JPH05120331A publication Critical patent/JPH05120331A/en
Application granted granted Critical
Publication of JP2793992B2 publication Critical patent/JP2793992B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

PURPOSE:To improve the efficiency of recognition by providing a learning function to calculate a hit rate based on the original hit rate concerning the plural candidates of a homonym, to display those candidates in order of a large hit rate value and to transform them. CONSTITUTION:As a control means, a CPU 4 is equipped with a discriminating means, retrieving means and hit rate recalculating means. The discriminating means discriminates whether a predicate exists in a character string inputted from a keyboard 1 and containing a character string to be transformed into the string of Chinese characters (KANJI) or not. When the existence of the predicate is discriminated, in the dictionary of a fixed disk 3, a retrieving object is retrieved while being limited to a case frame concerning the KANJI string to be transformed in each character string according to the case frame decided by the predicate. Next, the hit rate is calculated again concerning the combination with the meaning element of meaning to be obtained by the retrieved predicate. Then, the KANJI strings are displayed at a CRT display device 5 successively from the KANJI string having the combination of the predicate and the meaning element with the higher hit rate.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、日本語ワードプロセッ
サ、日本語ワードプロセッサを内蔵するコンピュータ装
置、印刷装置、日本語の音声認識装置、日本語を他言語
に翻訳する自動翻訳装置、その他日本語を認識する装置
に利用する。本発明は、日本語の同音異義語をその文中
の前後関係にしたがって認識する装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a Japanese word processor, a computer device incorporating the Japanese word processor, a printing device, a Japanese voice recognition device, an automatic translation device for translating Japanese into another language, and other Japanese It is used as a recognition device. The present invention relates to an apparatus for recognizing Japanese homophones according to the context in the sentence.

【0002】[0002]

【従来の技術】出願人は、かな漢字変換装置において同
音異義語の漢字列の絞り込みについて入力された漢字に
変換すべき文字列を含む文字に述語が含まれるときに、
格フレームの概念により変換対象となる同音異義語を絞
り込むことにより、同音異義語選択能率を高めた技術を
特願平1−313045として出願した。
2. Description of the Related Art The applicant has found that when a kana-kanji conversion device includes a predicate in a character containing a character string to be converted into a kanji input for narrowing down a kanji string of a homonym,
Japanese Patent Application No. 1-313045 was filed for a technique that improves the homonym selection efficiency by narrowing down the homonyms to be converted according to the case frame concept.

【0003】この発明は、かな漢字変換辞書に「格フレ
ーム」あるいは「拡大格フレーム」の概念を導入し、格
フレームを記述した述語辞書および意味素性を記述した
項辞書を備え、入力文字列中から述語を取り出し、文中
の名詞句が述語の格フレームのどの格の位置に入るかの
マッチングをすることにより、同音異義語を絞り込んで
いくものである。
This invention introduces the concept of "case frame" or "enlarged case frame" into a kana-kanji conversion dictionary, and is equipped with a predicate dictionary describing case frames and a term dictionary describing semantic features. By extracting predicates and matching which case position in the case frame of the noun phrase in the sentence, the homonyms are narrowed down.

【0004】[0004]

【発明が解決しようとする課題】しかし、この先願の発
明でも、同音異義語解析用辞書に登録されていない未知
語については、その同音異義語の認識率が低下してお
り、また拡大格フレームのルールによっても同音異義語
の認識ができない場合があった。
However, even in the invention of this earlier application, the recognition rate of the homonyms is reduced for unknown words not registered in the homonym analysis dictionary, and the expanded case frame is also used. There were cases where homonyms could not be recognized even according to the rules.

【0005】本発明は、上述の問題を解決するもので、
頻度計算により学習機能を解析用辞書にもたせて、同音
異義語の認識率を向上させた同音異義語認識装置を提供
することを目的とする。
The present invention solves the above-mentioned problems.
An object of the present invention is to provide a homonym synonym recognition device in which the learning function is provided in the analysis dictionary by frequency calculation and the homonym synonym recognition rate is improved.

【0006】[0006]

【課題を解決するための手段】本発明は、文字列を入力
する入力手段と、文字列に対応する一文字または複数文
字からなり特定の意味をもち日本語で常用されるきわめ
て多数の漢字列(一字以上の漢字の列、かな文字列、英
文字列、その組み合わせを含み、一字であってもよい。
以下同じ。)を辞書として記憶する記憶手段と、前記入
力手段から入力され漢字列に変換すべき文字列に対応す
る漢字列をこの辞書から検索し読み出す制御手段とを備
え、前記辞書は、格フレームに基づいて設計され、前記
入力手段から入力され漢字列に変換すべき文字列を含む
文字列に述語が存在するか否かを判別する判別手段と、
この判別手段により述語が存在することが判別されたと
きに、その述語により定まる格フレームにしたがって各
文字列の変換すべき漢字列について前記辞書の中で検索
対象を当該格フレームに限定して検索する検索手段とを
備えた同音異義語認識装置において、上記検索手段で検
索された述語の取りうる意味の意味素との組み合わせに
ついて、そのヒット率の再計算を行い、ヒット率の高い
述語と意味素との組み合わせの漢字列から順に表示する
手段を備えたことを特徴とする。
According to the present invention, an input means for inputting a character string and an extremely large number of kanji strings (a single character or a plurality of characters corresponding to the character string) having a specific meaning and commonly used in Japanese ( A single character may be included including a string of one or more kanji, a kana character string, an English character string, or a combination thereof.
same as below. ) As a dictionary, and a control means for retrieving and reading from this dictionary a kanji string corresponding to a character string input from the input means and to be converted into a kanji string. The dictionary is based on case frames. Discriminating means designed to discriminate whether or not a predicate exists in a character string including a character string to be converted into a kanji character string input from the input means,
When it is determined by this determining means that a predicate is present, a search target is limited to the case frame in the dictionary for the kanji string to be converted of each character string according to the case frame determined by the predicate. In the homophone synonym recognition device having a search means, for a combination with a semantic meaning of a possible predicate searched by the search means, the hit rate is recalculated, and the predicate and the meaning with a high hit rate It is characterized in that it is provided with a means for displaying in sequence from a kanji string in combination with a prime.

【0007】[0007]

【作用】本発明では、文字列から述語を取り出して、こ
の述語の格フレームに対応する意味素の項を選択して同
音異義語の複数候補を出力表示するときに、ヒット率を
計算し、そのヒット率の数値が大きい順に複数候補を出
力する。ヒット率をその都度再計算し、その数値が大き
い順に表示することにより、同音異義語認識率をさらに
向上することができる。
In the present invention, when the predicate is extracted from the character string, the term of the semantic element corresponding to the case frame of the predicate is selected, and a plurality of candidates for the homonyms are output and displayed, the hit ratio is calculated, Multiple candidates are output in descending order of the hit rate. By recalculating the hit rate each time and displaying the numerical values in descending order, the homonym recognition rate can be further improved.

【0008】[0008]

【実施例】本発明の実施例を図面を参照して説明する。Embodiments of the present invention will be described with reference to the drawings.

【0009】図1は、本発明一実施例の同音異義語認識
装置のブロック構成図を示す。本図において、この装置
は、文字列を入力する入力手段であるキーボード1と、
日本工業規格C6226に規定された第1水準および第2水
準の漢字集合を記憶する読み出し専用メモリ2と、この
読み出し専用メモリ2を参照して入力された文字列に対
応する一文字または複数文字からなり特定の意味をもち
日本語で常用されるきわめて多数の漢字列を辞書として
記憶している固定ディスク3を含む固定ディスク制御部
3Aと、キーボード1から入力され漢字列に変換すべき
文字列に対応する漢字列をこの辞書から検索し読み出す
制御手段4とを備える。
FIG. 1 is a block diagram of a homonym recognition device according to an embodiment of the present invention. In the figure, this device includes a keyboard 1 which is an input means for inputting a character string,
It consists of a read-only memory 2 for storing the first-level and second-level kanji sets defined in Japanese Industrial Standard C6226, and one or more characters corresponding to the character string input by referring to this read-only memory 2. Corresponds to a fixed disk control unit 3A that includes a fixed disk 3 that stores a very large number of Kanji strings that have a specific meaning and are commonly used in Japanese as a dictionary, and a character string that is input from the keyboard 1 and should be converted into a Kanji string. And a control means 4 for retrieving and reading the Kanji string to be read from this dictionary.

【0010】また、キーボード1より入力された文字列
と制御手段4により読み出された漢字列とを順次光学的
に表示するCRT表示装置5は、表示文字データメモリ
5A、ドット画像表示データメモリ5B、表示制御デー
タメモリ5CおよびCRT方式による表示部5Dとから
構成される。変換結果を記憶するフロッピーディスク7
を含むフロッピーディスク制御部7Aと、印字出力する
プリンタ8とを備えている。また符号9は増設可能な書
き込み読み出しメモリで、通常前記固定ディスク3によ
り代行される。また符号10は、RS-232C規格に準拠し
た回線インタフェースである。
A CRT display device 5 for optically optically displaying a character string input from the keyboard 1 and a Chinese character string read by the control means 4 is a display character data memory 5A and a dot image display data memory 5B. , A display control data memory 5C and a display section 5D of the CRT system. Floppy disk 7 for storing conversion results
And a printer 8 for printing out. Reference numeral 9 is a write / read memory that can be expanded, and is usually replaced by the fixed disk 3. Reference numeral 10 is a line interface compliant with the RS-232C standard.

【0011】ここで、固定ディスク3に記憶されている
辞書には、格フレームを付与された辞書項目(述語とい
う)および意味素性を付与された辞書項目(項という)
などからなり、意味素性は、名詞など項のおおよその意
味を表示する標識で、述語の属性である格フレームのな
かの意味素性と対応するものであり、さらに、キーボー
ド1から入力され漢字列に変換すべき文字列を含む文字
列に述語が存在するか否かを判別する第一の判別手段
と、この第一の判別手段により述語が存在することが判
別されたときに、固定ディスク3に記憶されたこの文字
列に対応する漢字列に同音異義語が存在するか否かを判
別する第二の判別手段と、この第二の判別手段により同
音異義語が存在することが判別されたときに、その述語
により定まる格フレームにしたがって同音異義語が存在
する各文字列の変換すべき漢字列をこの格フレームに対
応する意味組成が付与された項を登録した辞書の中で検
索対象として検索する検索手段とを備えた制御手段4に
おいて、この制御手段4はヒット率の再計算手段を備
え、上記第一判別手段および第二判別手段において、同
音異義語が存在することが判別され、この判別結果に基
づき検索された複数の同音異義語について、述語の格フ
レームとこれに対応する項とのヒット率の再計算を行
い、この再計算結果に基づきヒット率の大きい順に複数
の同音異義語の候補を表示し、かな漢字変換効率を向上
させ、同音異義認識率を高めるところに特徴がある。
Here, in the dictionary stored in the fixed disk 3, dictionary items to which case frames are added (called predicates) and dictionary items to which semantic features are added (terms).
The semantic feature is a marker that displays the approximate meaning of a term such as a noun, and corresponds to the semantic feature in the case frame that is the attribute of the predicate. First discriminating means for discriminating whether or not a predicate is present in a character string including a character string to be converted, and when it is discriminated by the first discriminating means that the predicate is present, the fixed disk 3 is stored. A second discriminating means for discriminating whether or not a homonym is present in the stored kanji string corresponding to this character string, and when it is discriminated by the second discriminating means that a homonym is present. In addition, according to the case frame determined by the predicate, a kanji string to be converted of each character string in which homonyms exist is searched as a search target in the dictionary in which the term with the semantic composition corresponding to this case frame is registered. You In the control means 4 including the search means, the control means 4 includes the recalculation means for the hit rate, and it is determined in the first determination means and the second determination means that there is a homonym, and this determination is made. For multiple homonyms searched based on the result, the hit ratio between the case frame of the predicate and the corresponding term is recalculated, and based on this recalculation result, a plurality of homonyms are ordered in descending order of hit ratio. It is characterized by displaying candidates, improving kana-kanji conversion efficiency, and increasing homonym recognition rate.

【0012】ここで、意味素性について説明する。意味
素性とは、辞書上で名詞など「項」に付与されている意
味標識で述語の属性である格フレームの中の意味素性に
対応するものであり、HUMN(人間) 、ANIM(動物)、PL
AC(場所)、ACTN(動作)、CONC(具象物)、ABST(抽
象物)、CHAR(文字情報)、INST(道具手段)、PLNT
(植物)、TIME(時間)、PHEN(現象、無意志動作)、
MENT(思考)、DIRC(方向性)、DEGR(数値表現、程
度)、VEHC(乗り物)、ROLE(役割)、ATRB(属性)、
DIVR(現れ得る項の種類に何らの制限も設けないもの)
などを含み、述語の属性である格フレームの中の意味素
性と対応するものであり、述語とは辞書で格フレームを
付与された語である。
Here, the semantic features will be described. The semantic feature corresponds to the semantic feature in the case frame that is the attribute of the predicate by the meaning indicator attached to the “term” such as a noun in the dictionary. HUMN (human), ANIM (animal), PL
AC (location), ACTN (motion), CONC (concrete), ABST (abstract), CHAR (character information), INST (tool means), PLNT
(Plant), TIME (time), PHEN (phenomenon, involuntary movement),
MENT (thinking), DIRC (direction), DEGR (numerical expression, degree), VEHC (vehicle), ROLE (role), ATRB (attribute),
DIVR (no restrictions on the types of terms that can appear)
And the like, and corresponds to the semantic feature in the case frame that is the attribute of the predicate, and the predicate is the word to which the case frame is added in the dictionary.

【0013】以下、本実施例におけるヒット率の再計算
処理を例を挙げて説明する。
Hereinafter, the recalculation processing of the hit rate in this embodiment will be described by way of example.

【0014】図2は、本実施例の同音異義語認識装置に
おける制御流れ図を示す。本実施例では、変換結果確認
処理において、図3の(A)に示すように、候補より選
択指示し、確定した後、意味素のヒット率の再計算処理
を行い、複数候補が選択されこれを表示する場合に、こ
の再計算したヒット率の数値が大きい順に表示するとこ
ろに特徴がある。このヒット率の再計算処理によって同
音異義語の複数候補の出現頻度に基づいて学習し、認識
率を向上させる。
FIG. 2 shows a control flow chart in the homonym recognition device of this embodiment. In the present embodiment, in the conversion result confirmation process, as shown in FIG. 3A, after a selection instruction is given from the candidates and confirmed, a recalculation process of the hit ratio of the semantics is performed, and a plurality of candidates are selected. When displaying, the feature is that the numerical values of the recalculated hit rate are displayed in descending order. By this recalculation processing of the hit rate, learning is performed based on the appearance frequency of a plurality of candidates for homonyms and the recognition rate is improved.

【0015】図4は図3(A)に示す意味素の再計算処
理を説明する流れ図であり、この再計算処理は、述語の
意味素性と項の意味素性とのヒット率の再計算に分けら
れる。なお図面中ではヒット率をHRで表す。
FIG. 4 is a flow chart for explaining the recalculation processing of the semantic elements shown in FIG. 3A. This recalculation processing is divided into recalculation of the hit ratio of the semantic characteristic of the predicate and the semantic characteristic of the term. Be done. The hit rate is represented by HR in the drawing.

【0016】述語の意味素性のヒット率の再計算は、確
定した述語と項の間で、述語は自分と同じ意味素を持つ
項のヒット率を自分のヒット率に加える。また、項の意
味素性のヒット率の再計算は、確定した述語と項の間
で、項は述語のすべての意味素性とそのヒット率を受け
取り再計算する。
The recalculation of the hit rate of the semantic feature of the predicate adds the hit rate of the term having the same meaning as the self to the hit rate of itself between the determined predicate and the term. Further, the recalculation of the hit rate of the semantic features of the term receives and recalculates all the semantic features of the predicate and the hit rate between the determined predicate and the term.

【0017】次に、述語の意味素性のヒット率の再計算
についてその計算式を挙げて説明する。
Next, the recalculation of the hit rate of the semantic features of the predicate will be described with reference to its calculation formula.

【0018】述語の意味素性のヒット率の再計算は、確
定した述語の意味素性の数をn個 それぞれ元のヒット率をvj1,vj2,…vjn ヒット率の和vj1+vj2+…+vjn=Svj それらに対応する項の意味素のヒット率をvk1,vk2,…vk
n (対応する意味素がない場合の値は0とする) 項のヒット率の和をvk1+vk2+…+vkn=Svk 求める述語の意味素性の新しいヒット率をj1,j2,…jnと
すると、 j1={(vj1/Svj)+vk1 }/ (1+Svk)*Svj j2={(vj2/Svj)+vk2 }/ (1+Svk)*Svj … jn={(vjn/Svj)+vkn }/ (1+Svk)*Svj となる。
The recalculation of the hit rate of the semantic features of the predicate is performed by calculating the number of the determined semantic features of the predicate by n, and the original hit rates are vj1, vj2, ... Vjn The sum of the hit rates vj1 + vj2 + ... The hit rates of the semantics of the terms corresponding to them are vk1, vk2, ... vk
n (when there is no corresponding semantic element, the value is 0) The sum of the hit ratios of terms is vk1 + vk2 + ... + vkn = Svk If the new hit ratio of the semantic features of the predicate to be obtained is j1, j2, ... jn, j1 = {(vj1 / Svj) + vk1} / (1 + Svk) * Svj j2 = {(vj2 / Svj) + vk2} / (1 + Svk) * Svj ... jn = {(vjn / Svj) + vkn} / (1 + Svk) * Svj.

【0019】未知語の項の場合、vk1,vk2,…vkn 、およ
びヒット率の和Svk は「0」なので、 jn={(vjn/Svj)+0 }/ (1+0)*Svj =(Vjn/Svj)Svj =vjn となり、述語のヒット率は変わらない。また、述語の要
素が一つしかない場合、Svj =vj1,Svk =vk1 なので、 j1={(vj1/vj1)+vk1 }/ (1+vk1)*vj1 =vj1 となり、述語のヒット率は項のヒット率に関係なく変わ
らない。
In the case of the term of unknown word, the sum Svk of vk1, vk2, ... Vkn and the hit rate is “0”, so jn = {(vjn / Svj) +0} / (1 + 0) * Svj = (Vjn / Svj) Svj = vjn, and the hit rate of the predicate does not change. If there is only one predicate element, then Svj = vj1, Svk = vk1, so j1 = {(vj1 / vj1) + vk1} / (1 + vk1) * vj1 = vj1 and the predicate hit rate is the term It doesn't change regardless of the hit rate.

【0020】項の意味素性のヒット率の再計算は、確定
した述語の意味素性の数をm個 それぞれ元のヒット率をak1,ak2,…akm (持っていなか
った意味素のヒット率の値は0) ヒット率の和ak1 +ak2 +…+akm =Sak それらに対応する項の意味素性のヒット率をaj1,aj2,…
ajm (対応する意味素性がない場合の値は0とする) 述語のヒット率の和をaj1 +aj2 +…+ajm =Saj 求める項の新しい意味素のヒット率をk1,k2,…kmとする
と、 k1={(ak1+aj1/Saj)/(Sak+Saj/Saj) =(ak1+aj1/Saj)/(Sak+1) k2={(ak2+aj2/Saj)/(Sak+Saj/Saj) =(ak2+aj2/Saj)/(Sak+1) … km={(akm+ajm/Saj)/(Sak+Saj/Saj) =(akm+ajm/Saj)/(Sak+1) となる。
The recalculation of the hit rate of the semantic features of the term is performed by calculating the number of the semantic features of the determined predicate as m, the original hit rates of ak1, ak2, ... Is 0) Sum of hit rates ak1 + ak2 +… + akm = Sak Semantic hit rates of terms corresponding to them are aj1, aj2,…
ajm (If there is no corresponding semantic feature, the value is 0.) The sum of the hit ratios of predicates is aj1 + aj2 + ... + ajm = Saj. = {(Ak1 + aj1 / Saj) / (Sak + Saj / Saj) = (ak1 + aj1 / Saj) / (Sak + 1) k2 = {(ak2 + aj2 / Saj) / (Sak + Saj / Saj) = (ak2 + aj2 / Saj) / (Sak + 1)… km = {(akm + ajm / Saj) / (Sak + Saj / Saj) = (akm + ajm / Saj) / (Sak + 1).

【0021】未知語の項の場合、ak1,ak2,…akm,および
Sak は「0」なので、 k1=aj1/Saj k2=aj2/Saj … km=ajm/Saj
In the case of an unknown word, ak1, ak2, ... akm, and
Since Sak is “0”, k1 = aj1 / Saj k2 = aj2 / Saj… km = ajm / Saj

【0022】既知語の項の場合、ヒット率の和Sak は通
常「1」なので、 k1=(ak1+aj1/Saj)/2 k2=(ak2+aj2/Saj)2 … km=(akm+ajm/Saj)/2 となる。
In the case of the term of the known word, the sum Sak of hit rates is usually "1", so k1 = (ak1 + aj1 / Saj) / 2 k2 = (ak2 + aj2 / Saj) 2 ... km = (akm + ajm / Saj) / 2.

【0023】次に具体的に文字列入力があった場合のヒ
ット率の再計算処理の例を挙げて説明する。
Next, a concrete example of the recalculation processing of the hit rate when a character string is input will be described.

【0024】辞書に次の述語「生える」と「植える」に
ついてその取りうる意味素性、表層格、ヒット率の数値
が与えられた辞書があり、また、項については、「ポイ
ンセチア」、「歯」、「葉」についてそれぞれ辞書があ
り、「生える」と「植える」の意味素性、表層格、ヒッ
ト率は以下の通りであるとする。
There are dictionaries in the dictionary which are given numerical values of the possible semantic features, surface layer, and hit rate for the following predicates "grow" and "plant", and for terms, "Poinsettia" and "teeth". , "Leaves" have dictionaries, and the semantic features of "growing" and "planting", surface layer, and hit rate are as follows.

【0025】 [0025]

【0026】 [0026]

【0027】なお、述語のヒット率の初期値は1深層格
当たり1.0 、項のヒット率は1項あたり常に1.0 とす
る。
The initial value of the hit rate of the predicate is 1.0 per deep case, and the hit rate of terms is always 1.0 per term.

【0028】ここで、確定した述語と項の間で、述語は
自分と同じ意味素を持つ項のヒット率を自分のヒット率
に加え、項は述語のすべての意味素性とそのヒット率を
受け取り、ヒット率を再計算する。述語の候補群のヒッ
ト率の合計は計算前と後で変わらない。さて、入力文字
列として「ポインセチアが生える」の場合のヒット率を
再計算すると 「生える」 A1 +SEGM が {(1.0/2+0)/1 }*2=1 B1 +PLAT が {(0.5/2+0)/1 }*2=0.5 +PART が {(0.5/2+0)/1 }*2=0.5 「ボインセチア」 SEGM (0+1.0/2)/1 =0.5 PLAT (0+0.5/2)/1 =0.25 PART (0+0.5/2)/1 =0.25 となる。また入力文字列として「ポインセチアを植え
る」の場合のヒット率を再計算する。このときの「植え
る」について上述のjn={(vjn/Svj)+vkn }/(1+Svk)*S
vjの式でそのヒット率を計算すると、 「植える」 A2 +PLAT を (1/2+0.25)/1.25*2 =1.2 B2 +IDEA を (1/2+0)/1.25*2=0.8 また、「ポインセチア」についても、上述のkm=(akm+a
jm/Saj)/2 の式で計算すると、 を得る。
Here, between the determined predicate and the term, the predicate adds the hit rate of the term having the same semantics as its own to its own hit rate, and the term receives all the semantic features of the predicate and its hit rate. , Recalculate the hit rate. The total hit rate of the predicate candidate group does not change before and after the calculation. By recalculating the hit rate when "Poinsettia grows" as the input string, "Growth" A1 + SEGM is {(1.0 / 2 + 0) / 1} * 2 = 1 B1 + PLAT is {(0.5 / 2 + 0) / 1} * 2 = 0.5 + PART is {(0.5 / 2 + 0) / 1} * 2 = 0.5 "Boinsettia" SEGM (0 + 1.0 / 2) / 1 = 0.5 PLAT (0 + 0.5 / 2) / 1 = 0.25 PART (0 + 0.5 / 2) / 1 = 0.25. In addition, the hit rate in the case of "plant poinsettia" as the input character string is recalculated. Regarding "planting" at this time, jn = {(vjn / Svj) + vkn} / (1 + Svk) * S described above
If you calculate the hit rate with the formula of vj, "plant" A2 + PLAT is (1/2 + 0.25) /1.25*2 = 1.2 B2 + IDEA is (1/2 + 0) /1.25*2=0.8 As for "Poinsettia", the above km = (akm + a
jm / Saj) / 2, To get

【0029】次に「歯が生える」については、「生え
る」がj1=vj1の式で計算すると、 「生える」 A1 +SEGM が 1.0 「歯」がkm=(akm+aim/Saj)/2 の式より 「歯」 SEGM (1.0+1.0/1)/2=1.0
Next, regarding "tooth growth", if "growth" is calculated by the formula of j1 = vj1, "growth" A1 + SEGM is 1.0 "teeth" is km = (akm + aim / Saj) / 2 From the formula, "teeth" SEGM (1.0 + 1.0 / 1) /2=1.0

【0030】次に「葉が生える」については、jn={(v
jn/Svj)+vkn }/ (1+Svk)*Svjより 「生える」 B1 +PLAT が (0.5/1+0)/2*1 =0.125 1 +PART が (0.5/1+1.0)/2*1 =0.625 を得る。
Next, regarding “leaves grow”, jn = {(v
jn / Svj) + vkn} / (1 + Svk) * Svj "grown up" B1 + PLAT is (0.5 / 1 + 0) / 2 * 1 = 0.125 1 + PART is (0.5 / 1 + 1.0) / 2 * 1 = 0.625 To get

【0031】次に「ポインセチアを植える」について
は、jn={(vjn/Svj)+vkn }/ (1+Svk)*Svj、jn=vjn
より また、「ポインセチア」についても、上述のkm=ajm/Sa
j 式で計算すると、 となる。「花を植える」については、jn={(vjn/Svj)+
vkn }/ (1+Svk)*Svjから 「植える」 A2 +PLATA を {(1/2)+0.5 }/1.5*2=1.333 B2 +IDEA を {(1/2)+0.0 }/1.5*2=0.667 変換の順番を変えると、 「花を植える」は jn ={(vjn/Svj)+vkn }/ (1+Svk)*Svj jn =vjn より 「植える」 A2 +PLATA を {(1/2)+0.5 }/1.5*2=1.333 B2 +IDEA を {(1/2)+0.0 }/1.5*2=0.667 となり、変換順序で結果が変わり、直前の情報に重みが
おかれている。
Next, regarding "planting Poinsettia", jn = {(vjn / Svj) + vkn} / (1 + Svk) * Svj, jn = vjn
Than Also for "Poinsettia", km = ajm / Sa mentioned above.
When calculated by j formula, Becomes For "planting flowers", jn = {(vjn / Svj) +
"Planting" from vkn} / (1 + Svk) * Svj A2 + PLATA {(1/2) +0.5} /1.5*2=1.333 B2 + IDEA {(1/2) +0.0} /1.5*2=0.667 If you change the order of conversion, "planting flowers" is jn = {(vjn / Svj) + vkn} / (1 + Svk) * Svj jn = vjn, and "planting" A2 + PLATA is {(1/2) +0.5} /1.5*2=1.333 B2 + IDEA = {(1/2) +0.0} /1.5*2=0.667 The result changes depending on the conversion order, and the previous information is weighted.

【0032】[0032]

【発明の効果】このように同音異義語の複数候補につい
てそのヒット率を元のヒット率に基づいて再計算してそ
のヒット率の値が大きい順に表示して変換する学習機能
を設けることによりその認識効率を向上させることがで
きる。
As described above, by providing a learning function for recalculating the hit rate of a plurality of homonymous synonyms based on the original hit rate and displaying the values in descending order of the hit rate, conversion is performed. The recognition efficiency can be improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明一実施例同音異義語認識装置のブロッ
ク図。
FIG. 1 is a block diagram of a homonym recognition device according to an embodiment of the present invention.

【図2】 (A)および(B)は同実施例の制御流れ
図。
2A and 2B are control flow charts of the embodiment.

【図3】 (A)、(B)、(C)は同じく制御流れ
図。
3 (A), (B), and (C) are the same control flow charts.

【図4】 図3(A)のヒット率再計算処理の制御流れ
図。
FIG. 4 is a control flow chart of the hit rate recalculation process of FIG.

【図符号の説明】 1 キーボード 1A、8A インタフェース 2 読み出し専用メモリ 3 固定ディスク 3A 固定ディスク制御部 4 制御手段 5 CRT表示装置 5A 表示部5Dに表示されるテキスト用文字情報を記
憶する表示文字データメモリ 5B ドット単位の画像データを記憶するドット画像表
示データメモリ 5C テキスト用文字情報と画像データとの混合制御デ
ータを記憶する表示制御データメモリ 5D CRT方式による表示部 6 書き込み読み出しメモリ(容量640Kバイト) 7 フロッピーディスク(容量1Mバイトおよび640Kバ
イト) 7A フロッピーディスク制御部 8 プリンタ 9 増設可能な書き込み読み出しメモリ 10 回線インタフェース
[Explanation of reference symbols] 1 keyboard 1A, 8A interface 2 read-only memory 3 fixed disk 3A fixed disk control unit 4 control means 5 CRT display device 5A display character data memory for storing text character information displayed on display unit 5D 5B Dot image display data memory that stores image data in dot units 5C Display control data memory that stores mixed control data of text character information and image data 5D Display section by CRT system 6 Write / read memory (640K bytes capacity) 7 Floppy disk (capacity 1M bytes and 640K bytes) 7A Floppy disk control unit 8 Printer 9 Expandable write / read memory 10 Line interface

─────────────────────────────────────────────────────
─────────────────────────────────────────────────── ───

【手続補正書】[Procedure amendment]

【提出日】平成4年10月7日[Submission date] October 7, 1992

【手続補正1】[Procedure Amendment 1]

【補正対象書類名】明細書[Document name to be amended] Statement

【補正対象項目名】図面の簡単な説明[Name of item to be corrected] Brief description of the drawing

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明一実施例同音異義語認識装置のブロック
図。
FIG. 1 is a block diagram of a homonym recognition device according to an embodiment of the present invention.

【図2】本発明実施例の制御流れ図。FIG. 2 is a control flow chart of the embodiment of the present invention.

【図3】本発明実施例の制御流れ図。FIG. 3 is a control flow chart of the embodiment of the present invention.

【図4】本発明実施例の制御流れ図。FIG. 4 is a control flow chart of the embodiment of the present invention.

【図5】本発明実施例の制御流れ図。FIG. 5 is a control flow chart of the embodiment of the present invention.

【図6】本発明実施例の制御流れ図。FIG. 6 is a control flow chart of the embodiment of the present invention.

【図7】図4のヒット率再計算処理の制御流れ図。7 is a control flow chart of the hit rate recalculation process of FIG. 4;

【手続補正2】[Procedure Amendment 2]

【補正対象書類名】図面[Document name to be corrected] Drawing

【補正対象項目名】全図[Correction target item name] All drawings

【補正方法】変更[Correction method] Change

【補正内容】[Correction content]

【図1】 [Figure 1]

【図2】 [Fig. 2]

【図3】 [Figure 3]

【図4】 [Figure 4]

【図5】 [Figure 5]

【図7】 [Figure 7]

【図6】 [Figure 6]

Claims (1)

【特許請求の範囲】[Claims] 【請求項1】 文字列を入力する入力手段と、文字列に
対応する一文字または複数文字からなり特定の意味をも
ち日本語で常用されるきわめて多数の漢字列(一字以上
の漢字の列、かな文字列、英文字列、その組み合わせを
含み、一字であってもよい。以下同じ。)を辞書として
記憶する記憶手段と、前記入力手段から入力され漢字列
に変換すべき文字列に対応する漢字列をこの辞書から検
索し読み出す制御手段とを備え、 前記辞書は、格フレームに基づいて設計され、 前記入力手段から入力され漢字列に変換すべき文字列を
含む文字列に述語が存在するか否かを判別する判別手段
と、 この判別手段により述語が存在することが判別されたと
きに、その述語により定まる格フレームにしたがって各
文字列の変換すべき漢字列について前記辞書の中で検索
対象を当該格フレームに限定して検索する検索手段とを
備えた同音異義語認識装置において、 上記検索手段で検索された述語の取りうる意味の意味素
との組み合わせについて、そのヒット率の再計算を行
い、ヒット率の高い述語と意味素との組み合わせの漢字
列から順に表示する手段を備えたことを特徴とする同音
異義語認識装置。
1. An extremely large number of kanji strings (one or more kanji strings, which consist of one or more characters corresponding to the character string and have a specific meaning and which are commonly used in Japanese, A kana character string, an English character string, and a combination thereof, and may be a single character. The same applies hereinafter), and a storage means for storing as a dictionary, and a character string input from the input means and to be converted into a kanji character string. The dictionary is designed based on the case frame, and the predicate exists in the character string including the character string to be converted into the Kanji string input from the input unit. Determining means for determining whether or not to perform, and when the determining means determines that a predicate exists, the dictionary for the kanji character string to be converted of each character string according to the case frame determined by the predicate In the homonym recognition device provided with a search means for limiting the search target to the case frame in the above, in the combination with the semantics of the possible meaning of the predicate searched by the search means, hit A homonym synonym recognition device comprising means for recalculating the rate and displaying in order from a kanji string of combinations of predicates and semantics with a high hit rate.
JP3089507A 1991-03-27 1991-03-27 Homonym recognition device Expired - Fee Related JP2793992B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3089507A JP2793992B2 (en) 1991-03-27 1991-03-27 Homonym recognition device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3089507A JP2793992B2 (en) 1991-03-27 1991-03-27 Homonym recognition device

Publications (2)

Publication Number Publication Date
JPH05120331A true JPH05120331A (en) 1993-05-18
JP2793992B2 JP2793992B2 (en) 1998-09-03

Family

ID=13972699

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3089507A Expired - Fee Related JP2793992B2 (en) 1991-03-27 1991-03-27 Homonym recognition device

Country Status (1)

Country Link
JP (1) JP2793992B2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006350663A (en) * 2005-06-15 2006-12-28 Fuji Xerox Co Ltd Document reading system
KR20210068790A (en) * 2019-12-02 2021-06-10 (주)이투엘네트웍 Sign language interpretation system

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5882368A (en) * 1981-11-11 1983-05-17 Ricoh Co Ltd Kana-kanji conversion processing method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5882368A (en) * 1981-11-11 1983-05-17 Ricoh Co Ltd Kana-kanji conversion processing method

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006350663A (en) * 2005-06-15 2006-12-28 Fuji Xerox Co Ltd Document reading system
KR20210068790A (en) * 2019-12-02 2021-06-10 (주)이투엘네트웍 Sign language interpretation system

Also Published As

Publication number Publication date
JP2793992B2 (en) 1998-09-03

Similar Documents

Publication Publication Date Title
US7680646B2 (en) Retrieval method for translation memories containing highly structured documents
US6393389B1 (en) Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions
US5495413A (en) Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes
US5257186A (en) Digital computing apparatus for preparing document text
US4903206A (en) Spelling error correcting system
EP0562818A2 (en) System for pattern based text translation
JPH03172966A (en) Similar document retrieving device
JPH11110416A (en) Method and device for retrieving document from data base
JP2000200281A (en) Information retrieval apparatus, information retrieval method, and recording medium recording information retrieval program
WO2000026839A9 (en) Advanced model for automatic extraction of skill and knowledge information from an electronic document
JPH06325073A (en) Special cooccurrence processing and device using it
JP2793992B2 (en) Homonym recognition device
JPH11238051A (en) Chinese input conversion processing device, Chinese input conversion processing method, recording medium recording Chinese input conversion processing program
JP3249743B2 (en) Document search system
JPH08339376A (en) Foreign language search device and information search system
JPS60254367A (en) Sentence analyzer
JPH0412866B2 (en)
JP3847801B2 (en) Character processing apparatus and processing method thereof
JP3548372B2 (en) Character recognition device
JP2958044B2 (en) Kana-Kanji conversion method and device
JP3363552B2 (en) Document processing method and apparatus
JP4054353B2 (en) Machine translation apparatus and machine translation program
JPH07334526A (en) Dictionary retrieval and display device
JP2001051992A (en) Japanese statistical data creation apparatus and method, and dictation system
JPH0567137A (en) Document quantity expression converter

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees