JPH05120331A - 同音異義語認識装置 - Google Patents
同音異義語認識装置Info
- Publication number
- JPH05120331A JPH05120331A JP3089507A JP8950791A JPH05120331A JP H05120331 A JPH05120331 A JP H05120331A JP 3089507 A JP3089507 A JP 3089507A JP 8950791 A JP8950791 A JP 8950791A JP H05120331 A JPH05120331 A JP H05120331A
- Authority
- JP
- Japan
- Prior art keywords
- predicate
- character string
- kanji
- hit rate
- string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
Abstract
(57)【要約】
【目的】 格フレームに基づいて設計された辞書を備
え、述語の格フレームに対応する意味素性の項との組み
合わせにより同音異義語を検索し入力文字列の同音異義
語を認識する装置での同音異義語の認識率を向上させ
る。 【構成】 述語の格フレームに対応する意味素性の項
(名詞)の組み合わせから候補を絞り込んで優先的に表
示して同音異義語を認識する場合において、この複数の
候補についてそのヒット率を再計算しておき、ヒット率
の高いものから順に表示して候補を絞り込んでいく。
え、述語の格フレームに対応する意味素性の項との組み
合わせにより同音異義語を検索し入力文字列の同音異義
語を認識する装置での同音異義語の認識率を向上させ
る。 【構成】 述語の格フレームに対応する意味素性の項
(名詞)の組み合わせから候補を絞り込んで優先的に表
示して同音異義語を認識する場合において、この複数の
候補についてそのヒット率を再計算しておき、ヒット率
の高いものから順に表示して候補を絞り込んでいく。
Description
【0001】
【産業上の利用分野】本発明は、日本語ワードプロセッ
サ、日本語ワードプロセッサを内蔵するコンピュータ装
置、印刷装置、日本語の音声認識装置、日本語を他言語
に翻訳する自動翻訳装置、その他日本語を認識する装置
に利用する。本発明は、日本語の同音異義語をその文中
の前後関係にしたがって認識する装置に関する。
サ、日本語ワードプロセッサを内蔵するコンピュータ装
置、印刷装置、日本語の音声認識装置、日本語を他言語
に翻訳する自動翻訳装置、その他日本語を認識する装置
に利用する。本発明は、日本語の同音異義語をその文中
の前後関係にしたがって認識する装置に関する。
【0002】
【従来の技術】出願人は、かな漢字変換装置において同
音異義語の漢字列の絞り込みについて入力された漢字に
変換すべき文字列を含む文字に述語が含まれるときに、
格フレームの概念により変換対象となる同音異義語を絞
り込むことにより、同音異義語選択能率を高めた技術を
特願平1−313045として出願した。
音異義語の漢字列の絞り込みについて入力された漢字に
変換すべき文字列を含む文字に述語が含まれるときに、
格フレームの概念により変換対象となる同音異義語を絞
り込むことにより、同音異義語選択能率を高めた技術を
特願平1−313045として出願した。
【0003】この発明は、かな漢字変換辞書に「格フレ
ーム」あるいは「拡大格フレーム」の概念を導入し、格
フレームを記述した述語辞書および意味素性を記述した
項辞書を備え、入力文字列中から述語を取り出し、文中
の名詞句が述語の格フレームのどの格の位置に入るかの
マッチングをすることにより、同音異義語を絞り込んで
いくものである。
ーム」あるいは「拡大格フレーム」の概念を導入し、格
フレームを記述した述語辞書および意味素性を記述した
項辞書を備え、入力文字列中から述語を取り出し、文中
の名詞句が述語の格フレームのどの格の位置に入るかの
マッチングをすることにより、同音異義語を絞り込んで
いくものである。
【0004】
【発明が解決しようとする課題】しかし、この先願の発
明でも、同音異義語解析用辞書に登録されていない未知
語については、その同音異義語の認識率が低下してお
り、また拡大格フレームのルールによっても同音異義語
の認識ができない場合があった。
明でも、同音異義語解析用辞書に登録されていない未知
語については、その同音異義語の認識率が低下してお
り、また拡大格フレームのルールによっても同音異義語
の認識ができない場合があった。
【0005】本発明は、上述の問題を解決するもので、
頻度計算により学習機能を解析用辞書にもたせて、同音
異義語の認識率を向上させた同音異義語認識装置を提供
することを目的とする。
頻度計算により学習機能を解析用辞書にもたせて、同音
異義語の認識率を向上させた同音異義語認識装置を提供
することを目的とする。
【0006】
【課題を解決するための手段】本発明は、文字列を入力
する入力手段と、文字列に対応する一文字または複数文
字からなり特定の意味をもち日本語で常用されるきわめ
て多数の漢字列(一字以上の漢字の列、かな文字列、英
文字列、その組み合わせを含み、一字であってもよい。
以下同じ。)を辞書として記憶する記憶手段と、前記入
力手段から入力され漢字列に変換すべき文字列に対応す
る漢字列をこの辞書から検索し読み出す制御手段とを備
え、前記辞書は、格フレームに基づいて設計され、前記
入力手段から入力され漢字列に変換すべき文字列を含む
文字列に述語が存在するか否かを判別する判別手段と、
この判別手段により述語が存在することが判別されたと
きに、その述語により定まる格フレームにしたがって各
文字列の変換すべき漢字列について前記辞書の中で検索
対象を当該格フレームに限定して検索する検索手段とを
備えた同音異義語認識装置において、上記検索手段で検
索された述語の取りうる意味の意味素との組み合わせに
ついて、そのヒット率の再計算を行い、ヒット率の高い
述語と意味素との組み合わせの漢字列から順に表示する
手段を備えたことを特徴とする。
する入力手段と、文字列に対応する一文字または複数文
字からなり特定の意味をもち日本語で常用されるきわめ
て多数の漢字列(一字以上の漢字の列、かな文字列、英
文字列、その組み合わせを含み、一字であってもよい。
以下同じ。)を辞書として記憶する記憶手段と、前記入
力手段から入力され漢字列に変換すべき文字列に対応す
る漢字列をこの辞書から検索し読み出す制御手段とを備
え、前記辞書は、格フレームに基づいて設計され、前記
入力手段から入力され漢字列に変換すべき文字列を含む
文字列に述語が存在するか否かを判別する判別手段と、
この判別手段により述語が存在することが判別されたと
きに、その述語により定まる格フレームにしたがって各
文字列の変換すべき漢字列について前記辞書の中で検索
対象を当該格フレームに限定して検索する検索手段とを
備えた同音異義語認識装置において、上記検索手段で検
索された述語の取りうる意味の意味素との組み合わせに
ついて、そのヒット率の再計算を行い、ヒット率の高い
述語と意味素との組み合わせの漢字列から順に表示する
手段を備えたことを特徴とする。
【0007】
【作用】本発明では、文字列から述語を取り出して、こ
の述語の格フレームに対応する意味素の項を選択して同
音異義語の複数候補を出力表示するときに、ヒット率を
計算し、そのヒット率の数値が大きい順に複数候補を出
力する。ヒット率をその都度再計算し、その数値が大き
い順に表示することにより、同音異義語認識率をさらに
向上することができる。
の述語の格フレームに対応する意味素の項を選択して同
音異義語の複数候補を出力表示するときに、ヒット率を
計算し、そのヒット率の数値が大きい順に複数候補を出
力する。ヒット率をその都度再計算し、その数値が大き
い順に表示することにより、同音異義語認識率をさらに
向上することができる。
【0008】
【実施例】本発明の実施例を図面を参照して説明する。
【0009】図1は、本発明一実施例の同音異義語認識
装置のブロック構成図を示す。本図において、この装置
は、文字列を入力する入力手段であるキーボード1と、
日本工業規格C6226に規定された第1水準および第2水
準の漢字集合を記憶する読み出し専用メモリ2と、この
読み出し専用メモリ2を参照して入力された文字列に対
応する一文字または複数文字からなり特定の意味をもち
日本語で常用されるきわめて多数の漢字列を辞書として
記憶している固定ディスク3を含む固定ディスク制御部
3Aと、キーボード1から入力され漢字列に変換すべき
文字列に対応する漢字列をこの辞書から検索し読み出す
制御手段4とを備える。
装置のブロック構成図を示す。本図において、この装置
は、文字列を入力する入力手段であるキーボード1と、
日本工業規格C6226に規定された第1水準および第2水
準の漢字集合を記憶する読み出し専用メモリ2と、この
読み出し専用メモリ2を参照して入力された文字列に対
応する一文字または複数文字からなり特定の意味をもち
日本語で常用されるきわめて多数の漢字列を辞書として
記憶している固定ディスク3を含む固定ディスク制御部
3Aと、キーボード1から入力され漢字列に変換すべき
文字列に対応する漢字列をこの辞書から検索し読み出す
制御手段4とを備える。
【0010】また、キーボード1より入力された文字列
と制御手段4により読み出された漢字列とを順次光学的
に表示するCRT表示装置5は、表示文字データメモリ
5A、ドット画像表示データメモリ5B、表示制御デー
タメモリ5CおよびCRT方式による表示部5Dとから
構成される。変換結果を記憶するフロッピーディスク7
を含むフロッピーディスク制御部7Aと、印字出力する
プリンタ8とを備えている。また符号9は増設可能な書
き込み読み出しメモリで、通常前記固定ディスク3によ
り代行される。また符号10は、RS-232C規格に準拠し
た回線インタフェースである。
と制御手段4により読み出された漢字列とを順次光学的
に表示するCRT表示装置5は、表示文字データメモリ
5A、ドット画像表示データメモリ5B、表示制御デー
タメモリ5CおよびCRT方式による表示部5Dとから
構成される。変換結果を記憶するフロッピーディスク7
を含むフロッピーディスク制御部7Aと、印字出力する
プリンタ8とを備えている。また符号9は増設可能な書
き込み読み出しメモリで、通常前記固定ディスク3によ
り代行される。また符号10は、RS-232C規格に準拠し
た回線インタフェースである。
【0011】ここで、固定ディスク3に記憶されている
辞書には、格フレームを付与された辞書項目(述語とい
う)および意味素性を付与された辞書項目(項という)
などからなり、意味素性は、名詞など項のおおよその意
味を表示する標識で、述語の属性である格フレームのな
かの意味素性と対応するものであり、さらに、キーボー
ド1から入力され漢字列に変換すべき文字列を含む文字
列に述語が存在するか否かを判別する第一の判別手段
と、この第一の判別手段により述語が存在することが判
別されたときに、固定ディスク3に記憶されたこの文字
列に対応する漢字列に同音異義語が存在するか否かを判
別する第二の判別手段と、この第二の判別手段により同
音異義語が存在することが判別されたときに、その述語
により定まる格フレームにしたがって同音異義語が存在
する各文字列の変換すべき漢字列をこの格フレームに対
応する意味組成が付与された項を登録した辞書の中で検
索対象として検索する検索手段とを備えた制御手段4に
おいて、この制御手段4はヒット率の再計算手段を備
え、上記第一判別手段および第二判別手段において、同
音異義語が存在することが判別され、この判別結果に基
づき検索された複数の同音異義語について、述語の格フ
レームとこれに対応する項とのヒット率の再計算を行
い、この再計算結果に基づきヒット率の大きい順に複数
の同音異義語の候補を表示し、かな漢字変換効率を向上
させ、同音異義認識率を高めるところに特徴がある。
辞書には、格フレームを付与された辞書項目(述語とい
う)および意味素性を付与された辞書項目(項という)
などからなり、意味素性は、名詞など項のおおよその意
味を表示する標識で、述語の属性である格フレームのな
かの意味素性と対応するものであり、さらに、キーボー
ド1から入力され漢字列に変換すべき文字列を含む文字
列に述語が存在するか否かを判別する第一の判別手段
と、この第一の判別手段により述語が存在することが判
別されたときに、固定ディスク3に記憶されたこの文字
列に対応する漢字列に同音異義語が存在するか否かを判
別する第二の判別手段と、この第二の判別手段により同
音異義語が存在することが判別されたときに、その述語
により定まる格フレームにしたがって同音異義語が存在
する各文字列の変換すべき漢字列をこの格フレームに対
応する意味組成が付与された項を登録した辞書の中で検
索対象として検索する検索手段とを備えた制御手段4に
おいて、この制御手段4はヒット率の再計算手段を備
え、上記第一判別手段および第二判別手段において、同
音異義語が存在することが判別され、この判別結果に基
づき検索された複数の同音異義語について、述語の格フ
レームとこれに対応する項とのヒット率の再計算を行
い、この再計算結果に基づきヒット率の大きい順に複数
の同音異義語の候補を表示し、かな漢字変換効率を向上
させ、同音異義認識率を高めるところに特徴がある。
【0012】ここで、意味素性について説明する。意味
素性とは、辞書上で名詞など「項」に付与されている意
味標識で述語の属性である格フレームの中の意味素性に
対応するものであり、HUMN(人間) 、ANIM(動物)、PL
AC(場所)、ACTN(動作)、CONC(具象物)、ABST(抽
象物)、CHAR(文字情報)、INST(道具手段)、PLNT
(植物)、TIME(時間)、PHEN(現象、無意志動作)、
MENT(思考)、DIRC(方向性)、DEGR(数値表現、程
度)、VEHC(乗り物)、ROLE(役割)、ATRB(属性)、
DIVR(現れ得る項の種類に何らの制限も設けないもの)
などを含み、述語の属性である格フレームの中の意味素
性と対応するものであり、述語とは辞書で格フレームを
付与された語である。
素性とは、辞書上で名詞など「項」に付与されている意
味標識で述語の属性である格フレームの中の意味素性に
対応するものであり、HUMN(人間) 、ANIM(動物)、PL
AC(場所)、ACTN(動作)、CONC(具象物)、ABST(抽
象物)、CHAR(文字情報)、INST(道具手段)、PLNT
(植物)、TIME(時間)、PHEN(現象、無意志動作)、
MENT(思考)、DIRC(方向性)、DEGR(数値表現、程
度)、VEHC(乗り物)、ROLE(役割)、ATRB(属性)、
DIVR(現れ得る項の種類に何らの制限も設けないもの)
などを含み、述語の属性である格フレームの中の意味素
性と対応するものであり、述語とは辞書で格フレームを
付与された語である。
【0013】以下、本実施例におけるヒット率の再計算
処理を例を挙げて説明する。
処理を例を挙げて説明する。
【0014】図2は、本実施例の同音異義語認識装置に
おける制御流れ図を示す。本実施例では、変換結果確認
処理において、図3の(A)に示すように、候補より選
択指示し、確定した後、意味素のヒット率の再計算処理
を行い、複数候補が選択されこれを表示する場合に、こ
の再計算したヒット率の数値が大きい順に表示するとこ
ろに特徴がある。このヒット率の再計算処理によって同
音異義語の複数候補の出現頻度に基づいて学習し、認識
率を向上させる。
おける制御流れ図を示す。本実施例では、変換結果確認
処理において、図3の(A)に示すように、候補より選
択指示し、確定した後、意味素のヒット率の再計算処理
を行い、複数候補が選択されこれを表示する場合に、こ
の再計算したヒット率の数値が大きい順に表示するとこ
ろに特徴がある。このヒット率の再計算処理によって同
音異義語の複数候補の出現頻度に基づいて学習し、認識
率を向上させる。
【0015】図4は図3(A)に示す意味素の再計算処
理を説明する流れ図であり、この再計算処理は、述語の
意味素性と項の意味素性とのヒット率の再計算に分けら
れる。なお図面中ではヒット率をHRで表す。
理を説明する流れ図であり、この再計算処理は、述語の
意味素性と項の意味素性とのヒット率の再計算に分けら
れる。なお図面中ではヒット率をHRで表す。
【0016】述語の意味素性のヒット率の再計算は、確
定した述語と項の間で、述語は自分と同じ意味素を持つ
項のヒット率を自分のヒット率に加える。また、項の意
味素性のヒット率の再計算は、確定した述語と項の間
で、項は述語のすべての意味素性とそのヒット率を受け
取り再計算する。
定した述語と項の間で、述語は自分と同じ意味素を持つ
項のヒット率を自分のヒット率に加える。また、項の意
味素性のヒット率の再計算は、確定した述語と項の間
で、項は述語のすべての意味素性とそのヒット率を受け
取り再計算する。
【0017】次に、述語の意味素性のヒット率の再計算
についてその計算式を挙げて説明する。
についてその計算式を挙げて説明する。
【0018】述語の意味素性のヒット率の再計算は、確
定した述語の意味素性の数をn個 それぞれ元のヒット率をvj1,vj2,…vjn ヒット率の和vj1+vj2+…+vjn=Svj それらに対応する項の意味素のヒット率をvk1,vk2,…vk
n (対応する意味素がない場合の値は0とする) 項のヒット率の和をvk1+vk2+…+vkn=Svk 求める述語の意味素性の新しいヒット率をj1,j2,…jnと
すると、 j1={(vj1/Svj)+vk1 }/ (1+Svk)*Svj j2={(vj2/Svj)+vk2 }/ (1+Svk)*Svj … jn={(vjn/Svj)+vkn }/ (1+Svk)*Svj となる。
定した述語の意味素性の数をn個 それぞれ元のヒット率をvj1,vj2,…vjn ヒット率の和vj1+vj2+…+vjn=Svj それらに対応する項の意味素のヒット率をvk1,vk2,…vk
n (対応する意味素がない場合の値は0とする) 項のヒット率の和をvk1+vk2+…+vkn=Svk 求める述語の意味素性の新しいヒット率をj1,j2,…jnと
すると、 j1={(vj1/Svj)+vk1 }/ (1+Svk)*Svj j2={(vj2/Svj)+vk2 }/ (1+Svk)*Svj … jn={(vjn/Svj)+vkn }/ (1+Svk)*Svj となる。
【0019】未知語の項の場合、vk1,vk2,…vkn 、およ
びヒット率の和Svk は「0」なので、 jn={(vjn/Svj)+0 }/ (1+0)*Svj =(Vjn/Svj)Svj =vjn となり、述語のヒット率は変わらない。また、述語の要
素が一つしかない場合、Svj =vj1,Svk =vk1 なので、 j1={(vj1/vj1)+vk1 }/ (1+vk1)*vj1 =vj1 となり、述語のヒット率は項のヒット率に関係なく変わ
らない。
びヒット率の和Svk は「0」なので、 jn={(vjn/Svj)+0 }/ (1+0)*Svj =(Vjn/Svj)Svj =vjn となり、述語のヒット率は変わらない。また、述語の要
素が一つしかない場合、Svj =vj1,Svk =vk1 なので、 j1={(vj1/vj1)+vk1 }/ (1+vk1)*vj1 =vj1 となり、述語のヒット率は項のヒット率に関係なく変わ
らない。
【0020】項の意味素性のヒット率の再計算は、確定
した述語の意味素性の数をm個 それぞれ元のヒット率をak1,ak2,…akm (持っていなか
った意味素のヒット率の値は0) ヒット率の和ak1 +ak2 +…+akm =Sak それらに対応する項の意味素性のヒット率をaj1,aj2,…
ajm (対応する意味素性がない場合の値は0とする) 述語のヒット率の和をaj1 +aj2 +…+ajm =Saj 求める項の新しい意味素のヒット率をk1,k2,…kmとする
と、 k1={(ak1+aj1/Saj)/(Sak+Saj/Saj) =(ak1+aj1/Saj)/(Sak+1) k2={(ak2+aj2/Saj)/(Sak+Saj/Saj) =(ak2+aj2/Saj)/(Sak+1) … km={(akm+ajm/Saj)/(Sak+Saj/Saj) =(akm+ajm/Saj)/(Sak+1) となる。
した述語の意味素性の数をm個 それぞれ元のヒット率をak1,ak2,…akm (持っていなか
った意味素のヒット率の値は0) ヒット率の和ak1 +ak2 +…+akm =Sak それらに対応する項の意味素性のヒット率をaj1,aj2,…
ajm (対応する意味素性がない場合の値は0とする) 述語のヒット率の和をaj1 +aj2 +…+ajm =Saj 求める項の新しい意味素のヒット率をk1,k2,…kmとする
と、 k1={(ak1+aj1/Saj)/(Sak+Saj/Saj) =(ak1+aj1/Saj)/(Sak+1) k2={(ak2+aj2/Saj)/(Sak+Saj/Saj) =(ak2+aj2/Saj)/(Sak+1) … km={(akm+ajm/Saj)/(Sak+Saj/Saj) =(akm+ajm/Saj)/(Sak+1) となる。
【0021】未知語の項の場合、ak1,ak2,…akm,および
Sak は「0」なので、 k1=aj1/Saj k2=aj2/Saj … km=ajm/Saj
Sak は「0」なので、 k1=aj1/Saj k2=aj2/Saj … km=ajm/Saj
【0022】既知語の項の場合、ヒット率の和Sak は通
常「1」なので、 k1=(ak1+aj1/Saj)/2 k2=(ak2+aj2/Saj)2 … km=(akm+ajm/Saj)/2 となる。
常「1」なので、 k1=(ak1+aj1/Saj)/2 k2=(ak2+aj2/Saj)2 … km=(akm+ajm/Saj)/2 となる。
【0023】次に具体的に文字列入力があった場合のヒ
ット率の再計算処理の例を挙げて説明する。
ット率の再計算処理の例を挙げて説明する。
【0024】辞書に次の述語「生える」と「植える」に
ついてその取りうる意味素性、表層格、ヒット率の数値
が与えられた辞書があり、また、項については、「ポイ
ンセチア」、「歯」、「葉」についてそれぞれ辞書があ
り、「生える」と「植える」の意味素性、表層格、ヒッ
ト率は以下の通りであるとする。
ついてその取りうる意味素性、表層格、ヒット率の数値
が与えられた辞書があり、また、項については、「ポイ
ンセチア」、「歯」、「葉」についてそれぞれ辞書があ
り、「生える」と「植える」の意味素性、表層格、ヒッ
ト率は以下の通りであるとする。
【0025】
【0026】
【0027】なお、述語のヒット率の初期値は1深層格
当たり1.0 、項のヒット率は1項あたり常に1.0 とす
る。
当たり1.0 、項のヒット率は1項あたり常に1.0 とす
る。
【0028】ここで、確定した述語と項の間で、述語は
自分と同じ意味素を持つ項のヒット率を自分のヒット率
に加え、項は述語のすべての意味素性とそのヒット率を
受け取り、ヒット率を再計算する。述語の候補群のヒッ
ト率の合計は計算前と後で変わらない。さて、入力文字
列として「ポインセチアが生える」の場合のヒット率を
再計算すると 「生える」 A1 +SEGM が {(1.0/2+0)/1 }*2=1 B1 +PLAT が {(0.5/2+0)/1 }*2=0.5 +PART が {(0.5/2+0)/1 }*2=0.5 「ボインセチア」 SEGM (0+1.0/2)/1 =0.5 PLAT (0+0.5/2)/1 =0.25 PART (0+0.5/2)/1 =0.25 となる。また入力文字列として「ポインセチアを植え
る」の場合のヒット率を再計算する。このときの「植え
る」について上述のjn={(vjn/Svj)+vkn }/(1+Svk)*S
vjの式でそのヒット率を計算すると、 「植える」 A2 +PLAT を (1/2+0.25)/1.25*2 =1.2 B2 +IDEA を (1/2+0)/1.25*2=0.8 また、「ポインセチア」についても、上述のkm=(akm+a
jm/Saj)/2 の式で計算すると、 を得る。
自分と同じ意味素を持つ項のヒット率を自分のヒット率
に加え、項は述語のすべての意味素性とそのヒット率を
受け取り、ヒット率を再計算する。述語の候補群のヒッ
ト率の合計は計算前と後で変わらない。さて、入力文字
列として「ポインセチアが生える」の場合のヒット率を
再計算すると 「生える」 A1 +SEGM が {(1.0/2+0)/1 }*2=1 B1 +PLAT が {(0.5/2+0)/1 }*2=0.5 +PART が {(0.5/2+0)/1 }*2=0.5 「ボインセチア」 SEGM (0+1.0/2)/1 =0.5 PLAT (0+0.5/2)/1 =0.25 PART (0+0.5/2)/1 =0.25 となる。また入力文字列として「ポインセチアを植え
る」の場合のヒット率を再計算する。このときの「植え
る」について上述のjn={(vjn/Svj)+vkn }/(1+Svk)*S
vjの式でそのヒット率を計算すると、 「植える」 A2 +PLAT を (1/2+0.25)/1.25*2 =1.2 B2 +IDEA を (1/2+0)/1.25*2=0.8 また、「ポインセチア」についても、上述のkm=(akm+a
jm/Saj)/2 の式で計算すると、 を得る。
【0029】次に「歯が生える」については、「生え
る」がj1=vj1の式で計算すると、 「生える」 A1 +SEGM が 1.0 「歯」がkm=(akm+aim/Saj)/2 の式より 「歯」 SEGM (1.0+1.0/1)/2=1.0
る」がj1=vj1の式で計算すると、 「生える」 A1 +SEGM が 1.0 「歯」がkm=(akm+aim/Saj)/2 の式より 「歯」 SEGM (1.0+1.0/1)/2=1.0
【0030】次に「葉が生える」については、jn={(v
jn/Svj)+vkn }/ (1+Svk)*Svjより 「生える」 B1 +PLAT が (0.5/1+0)/2*1 =0.125 1 +PART が (0.5/1+1.0)/2*1 =0.625 を得る。
jn/Svj)+vkn }/ (1+Svk)*Svjより 「生える」 B1 +PLAT が (0.5/1+0)/2*1 =0.125 1 +PART が (0.5/1+1.0)/2*1 =0.625 を得る。
【0031】次に「ポインセチアを植える」について
は、jn={(vjn/Svj)+vkn }/ (1+Svk)*Svj、jn=vjn
より また、「ポインセチア」についても、上述のkm=ajm/Sa
j 式で計算すると、 となる。「花を植える」については、jn={(vjn/Svj)+
vkn }/ (1+Svk)*Svjから 「植える」 A2 +PLATA を {(1/2)+0.5 }/1.5*2=1.333 B2 +IDEA を {(1/2)+0.0 }/1.5*2=0.667 変換の順番を変えると、 「花を植える」は jn ={(vjn/Svj)+vkn }/ (1+Svk)*Svj jn =vjn より 「植える」 A2 +PLATA を {(1/2)+0.5 }/1.5*2=1.333 B2 +IDEA を {(1/2)+0.0 }/1.5*2=0.667 となり、変換順序で結果が変わり、直前の情報に重みが
おかれている。
は、jn={(vjn/Svj)+vkn }/ (1+Svk)*Svj、jn=vjn
より また、「ポインセチア」についても、上述のkm=ajm/Sa
j 式で計算すると、 となる。「花を植える」については、jn={(vjn/Svj)+
vkn }/ (1+Svk)*Svjから 「植える」 A2 +PLATA を {(1/2)+0.5 }/1.5*2=1.333 B2 +IDEA を {(1/2)+0.0 }/1.5*2=0.667 変換の順番を変えると、 「花を植える」は jn ={(vjn/Svj)+vkn }/ (1+Svk)*Svj jn =vjn より 「植える」 A2 +PLATA を {(1/2)+0.5 }/1.5*2=1.333 B2 +IDEA を {(1/2)+0.0 }/1.5*2=0.667 となり、変換順序で結果が変わり、直前の情報に重みが
おかれている。
【0032】
【発明の効果】このように同音異義語の複数候補につい
てそのヒット率を元のヒット率に基づいて再計算してそ
のヒット率の値が大きい順に表示して変換する学習機能
を設けることによりその認識効率を向上させることがで
きる。
てそのヒット率を元のヒット率に基づいて再計算してそ
のヒット率の値が大きい順に表示して変換する学習機能
を設けることによりその認識効率を向上させることがで
きる。
【図1】 本発明一実施例同音異義語認識装置のブロッ
ク図。
ク図。
【図2】 (A)および(B)は同実施例の制御流れ
図。
図。
【図3】 (A)、(B)、(C)は同じく制御流れ
図。
図。
【図4】 図3(A)のヒット率再計算処理の制御流れ
図。
図。
【図符号の説明】 1 キーボード 1A、8A インタフェース 2 読み出し専用メモリ 3 固定ディスク 3A 固定ディスク制御部 4 制御手段 5 CRT表示装置 5A 表示部5Dに表示されるテキスト用文字情報を記
憶する表示文字データメモリ 5B ドット単位の画像データを記憶するドット画像表
示データメモリ 5C テキスト用文字情報と画像データとの混合制御デ
ータを記憶する表示制御データメモリ 5D CRT方式による表示部 6 書き込み読み出しメモリ(容量640Kバイト) 7 フロッピーディスク(容量1Mバイトおよび640Kバ
イト) 7A フロッピーディスク制御部 8 プリンタ 9 増設可能な書き込み読み出しメモリ 10 回線インタフェース
憶する表示文字データメモリ 5B ドット単位の画像データを記憶するドット画像表
示データメモリ 5C テキスト用文字情報と画像データとの混合制御デ
ータを記憶する表示制御データメモリ 5D CRT方式による表示部 6 書き込み読み出しメモリ(容量640Kバイト) 7 フロッピーディスク(容量1Mバイトおよび640Kバ
イト) 7A フロッピーディスク制御部 8 プリンタ 9 増設可能な書き込み読み出しメモリ 10 回線インタフェース
─────────────────────────────────────────────────────
【手続補正書】
【提出日】平成4年10月7日
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】図面の簡単な説明
【補正方法】変更
【補正内容】
【図面の簡単な説明】
【図1】本発明一実施例同音異義語認識装置のブロック
図。
図。
【図2】本発明実施例の制御流れ図。
【図3】本発明実施例の制御流れ図。
【図4】本発明実施例の制御流れ図。
【図5】本発明実施例の制御流れ図。
【図6】本発明実施例の制御流れ図。
【図7】図4のヒット率再計算処理の制御流れ図。
【手続補正2】
【補正対象書類名】図面
【補正対象項目名】全図
【補正方法】変更
【補正内容】
【図1】
【図2】
【図3】
【図4】
【図5】
【図7】
【図6】
Claims (1)
- 【請求項1】 文字列を入力する入力手段と、文字列に
対応する一文字または複数文字からなり特定の意味をも
ち日本語で常用されるきわめて多数の漢字列(一字以上
の漢字の列、かな文字列、英文字列、その組み合わせを
含み、一字であってもよい。以下同じ。)を辞書として
記憶する記憶手段と、前記入力手段から入力され漢字列
に変換すべき文字列に対応する漢字列をこの辞書から検
索し読み出す制御手段とを備え、 前記辞書は、格フレームに基づいて設計され、 前記入力手段から入力され漢字列に変換すべき文字列を
含む文字列に述語が存在するか否かを判別する判別手段
と、 この判別手段により述語が存在することが判別されたと
きに、その述語により定まる格フレームにしたがって各
文字列の変換すべき漢字列について前記辞書の中で検索
対象を当該格フレームに限定して検索する検索手段とを
備えた同音異義語認識装置において、 上記検索手段で検索された述語の取りうる意味の意味素
との組み合わせについて、そのヒット率の再計算を行
い、ヒット率の高い述語と意味素との組み合わせの漢字
列から順に表示する手段を備えたことを特徴とする同音
異義語認識装置。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3089507A JP2793992B2 (ja) | 1991-03-27 | 1991-03-27 | 同音異義語認識装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP3089507A JP2793992B2 (ja) | 1991-03-27 | 1991-03-27 | 同音異義語認識装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPH05120331A true JPH05120331A (ja) | 1993-05-18 |
| JP2793992B2 JP2793992B2 (ja) | 1998-09-03 |
Family
ID=13972699
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP3089507A Expired - Fee Related JP2793992B2 (ja) | 1991-03-27 | 1991-03-27 | 同音異義語認識装置 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2793992B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006350663A (ja) * | 2005-06-15 | 2006-12-28 | Fuji Xerox Co Ltd | 文書読取システム |
| KR20210068790A (ko) * | 2019-12-02 | 2021-06-10 | (주)이투엘네트웍 | 수화통역 시스템 |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5882368A (ja) * | 1981-11-11 | 1983-05-17 | Ricoh Co Ltd | カナ漢字変換処理方式 |
-
1991
- 1991-03-27 JP JP3089507A patent/JP2793992B2/ja not_active Expired - Fee Related
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5882368A (ja) * | 1981-11-11 | 1983-05-17 | Ricoh Co Ltd | カナ漢字変換処理方式 |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2006350663A (ja) * | 2005-06-15 | 2006-12-28 | Fuji Xerox Co Ltd | 文書読取システム |
| KR20210068790A (ko) * | 2019-12-02 | 2021-06-10 | (주)이투엘네트웍 | 수화통역 시스템 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2793992B2 (ja) | 1998-09-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7680646B2 (en) | Retrieval method for translation memories containing highly structured documents | |
| US6393389B1 (en) | Using ranked translation choices to obtain sequences indicating meaning of multi-token expressions | |
| US5495413A (en) | Translation machine having a function of deriving two or more syntaxes from one original sentence and giving precedence to a selected one of the syntaxes | |
| US5257186A (en) | Digital computing apparatus for preparing document text | |
| US4903206A (en) | Spelling error correcting system | |
| EP0562818A2 (en) | System for pattern based text translation | |
| JPH03172966A (ja) | 類似文書検索装置 | |
| JPH11110416A (ja) | データベースからドキュメントを検索するための方法および装置 | |
| JP2000200281A (ja) | 情報検索装置および情報検索方法ならびに情報検索プログラムを記録した記録媒体 | |
| WO2000026839A9 (en) | Advanced model for automatic extraction of skill and knowledge information from an electronic document | |
| JPH06325073A (ja) | 特殊共起処理方法およびその特殊共起処理方法を用いた装置 | |
| JP2793992B2 (ja) | 同音異義語認識装置 | |
| JPH11238051A (ja) | 中国語入力変換処理装置、中国語入力変換処理方法、中国語入力変換処理プログラムを記録した記録媒体 | |
| JP3249743B2 (ja) | 文書検索システム | |
| JPH08339376A (ja) | 外国語検索装置及び情報検索システム | |
| JPS60254367A (ja) | 文章分析装置 | |
| JPH0412866B2 (ja) | ||
| JP3847801B2 (ja) | 文字処理装置及びその処理方法 | |
| JP3548372B2 (ja) | 文字認識装置 | |
| JP2958044B2 (ja) | かな漢字変換方法及び装置 | |
| JP3363552B2 (ja) | 文書処理方法とその装置 | |
| JP4054353B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
| JPH07334526A (ja) | 辞書検索表示装置 | |
| JP2001051992A (ja) | 日本語統計データ作成装置および方法、並びにディクテーションシステム | |
| JPH0567137A (ja) | 文書内数量表現変換装置 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| LAPS | Cancellation because of no payment of annual fees |