JPH06290168A - 仮名漢字変換装置 - Google Patents

仮名漢字変換装置

Info

Publication number
JPH06290168A
JPH06290168A JP5100339A JP10033993A JPH06290168A JP H06290168 A JPH06290168 A JP H06290168A JP 5100339 A JP5100339 A JP 5100339A JP 10033993 A JP10033993 A JP 10033993A JP H06290168 A JPH06290168 A JP H06290168A
Authority
JP
Japan
Prior art keywords
conversion
kana
noun
dictionary
particle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5100339A
Other languages
English (en)
Inventor
Takeshi Hirose
岳史 広瀬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP5100339A priority Critical patent/JPH06290168A/ja
Publication of JPH06290168A publication Critical patent/JPH06290168A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 用例辞書に助詞変換情報を付加し、体言と用
言の共起判定において、助詞変換ルールを用いて用例判
定処理を行う。 【構成】 入力部1によりかな文字列などの入力を行
い、CRT(Cathode RayTube)やLCD(Liquid Crys
tal Display)などから成る出力部21により仮名漢字
変換結果などの出力を行う。単語辞書3には単語の読み
や表記などを格納してあり、用例辞書4には、共起関係
にある単語ペアを格納してあり、体言と用言の単語ペア
については助詞変換情報を備えている。変換ルールテー
ブル5には助詞の変換ルールが格納されている。変換処
理部6により仮名漢字変換処理を行う。判定処理部7は
用例辞書に記載されている変換情報と変換ルールテーブ
ル5を参照して助詞変換の判定を行う。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、仮名漢字変換装置に関
し、より詳細には、日本語ワードプロセッサや電子手帳
などの仮名漢字変換処理機能を有する装置に関するもの
である。
【0002】
【従来の技術】仮名漢字変換の同音語選択処理などにお
いて、共起関係にある単語と単語ペアをあらかじめ記述
した、いわゆる用例辞書を参照して変換精度を向上させ
る手法が用いられている。そして、この用例辞書による
仮名漢字変換の精度を更に向上させるために、体言と用
言の単語ペアからなる用例情報、たとえば「漢字」と
「書く」などについては、それらの単語の間に入りうる
助詞に関する情報も与えるといった方法が、例えば、特
開平1−229367号公報に「文字処理装置」が開示
されている。すなわち、助詞(主に格助詞)に関する情
報が無ければ「かんじをかく」「かんじでかく」「かん
じがかく」などの入力に対して、すべて「漢字」と「書
く」を用いて変換されることになり、「漢字が書く」と
いった日本語として不自然な変換を引き起こしてしま
う。
【0003】
【発明が解決しようとする課題】前述のように、従来の
文字処理装置において、前記助詞は用いられる動詞の態
によって変化する場合がある。特に用言に使役や受け身
を表す助動詞が接続したような場合には、「火事(を)
発見する」「火事(が)発見される」といった助詞の違
いが生じる。あるいは、体言と用言などからなる節構造
が後続する体言を連体修飾する、いわゆる関係節構造を
含む文などでも同様に助詞の変化が起りうる。例えば、
「角がある」という文では、体言「角」と用言「ある」
の間には助詞「が」を用いるが、この文が節となって更
に体言を修飾するような「角がある動物」といった場合
では、助詞として「の」を用いた「角のある動物」とい
う言い方も可能となる。このような用言の変化に対応す
る方法として、変化パターンごとに用例情報を用意して
おくことが考えられるが、メモリ容量や検索速度などの
点から現実的でない。
【0004】したがって、変化パターンの違いは無視し
て用言部分が共通な用例情報をひとまとめにし、一つの
単語ペアに複数の助詞情報を与えることで前記問題点の
解決が図れる。すなわち、「火事」と「発生する」の間
には、助詞「が」「を」が入りうるといった用例辞書を
用意する。しかしながら、このような用例辞書を用いた
場合にも以下のような問題点が生じる。例えば、「景観
を破壊する」「景観が破壊される」という例をもとに
「景観(が、を)破壊する」(ただし、()内は使用可
能な助詞)といった用例情報や、「真価を問う」「真価
が問われる」という例をもとに「真価(が、を)問う」
という用例情報が用意されていた場合、「けいかんがは
かいする」(警官が破壊する)や「しんかがとう」(臣
下が問う)といった入力に対して「景観が破壊する」、
「真価が問う」といった、やはり、不自然な変換が生じ
てしまう可能性がある。
【0005】本発明は、このような情実に鑑みてなされ
たもので、用例辞書に助詞変換情報を付加し、体言と用
言の共起判定において、助詞変換ルールを用いて用例判
定処理を行うようにした仮名漢字変換装置を提供するこ
とを目的としている。
【0006】
【課題を解決するための手段】本発明は、上記目的を達
成するために、(1)入力文字列を入力するための入力
手段と、仮名漢字変換結果などを表示する出力手段と、
単語の読みや表記などからなる単語辞書と、用言の変化
による接続可能助詞の変換ルールを格納した変換ルール
テーブルと、共起関係にある単語のペアを格納してお
り、体言と用言の共起関係ペアについては前記変換ルー
ルテーブルを参照するための変換情報を格納した用例辞
書とを備え、前記入力手段によって入力された文字列を
前記単語辞書や用例辞書を参照して仮名漢字変換処理を
行い、前記出力手段に結果を表示する仮名漢字変換装置
であって、変換処理の際に前記用例辞書に格納されてい
る変換情報と前記変換ルールテーブルを用いて判定処理
を行う判定手段を備えていること、更には、(2)用言
部分の態の変化に関しての、接続可能助詞変換ルールテ
ーブルと、用例辞書に記述される体言と用言の共起関係
ペアに対する変換情報とを備えていること、更には、
(3)体言および用言などからなる節構造部分が用言に
後続する体言を連体修飾する場合に関しての、接続可能
助詞変換ルールテーブルと、用例辞書に記述される前記
節構造の体言と用言の共起関係ペアに対する変換情報と
を備えていることを特徴としたものである。
【0007】
【作用】入力手段によって入力された文字列を単語辞書
や用例辞書を参照して仮名漢字変換処理を行い、出力手
段に結果を表示する仮名漢字変換装置であって、変換処
理の際に前記用例辞書に格納されている変換情報と前記
変換ルールテーブルを用いて判定処理を行う。これによ
り、用例情報の誤った適用による誤変換の抑制や用例辞
書メモリ容量の増加の抑制、更に、既存の用例辞書をベ
ースにして再構築が可能であることから、容易に仮名漢
変換精度の向上が図れる。
【0008】
【実施例】実施例について、図面を参照して以下に説明
する。図1は、本発明による仮名漢字変換装置の一実施
例を説明するための構成図で、図中、1は入力部、2は
出力部、3は単語辞書、4は用例辞書、5は変換ルール
テーブル、6は変換処理部、7は判定処理部(変換用例
処理部)である。キーボードやペン入力タブレットなど
から成る入力部1によりかな文字列などの入力を行い、
CRT(Cathode Ray Tube)やLCD(Liquid Crystal
Display)などから成る出力部2により仮名漢字変換結
果などの出力を行う。単語辞書3には単語の読みや表記
などを格納してあり、用例辞書4には、共起関係にある
単語ペアを格納してあり、体言と用言の単語ペアについ
ては助詞変換情報を備えている。変換ルールテーブル5
には助詞の変換ルールが格納されている。変換処理部6
により仮名漢字変換処理を行う。判定処理部7は用例辞
書に記載されている変換情報と変換ルールテーブル5を
参照して助詞変換の判定を行う。
【0009】図2は、本発明による仮名漢字変換装置の
より具体的な構成図で、図中、8は入出力制御部、9は
候補バッファで、その他、図1と同じ作用をする部分は
同一の符号を付してある。入出力制御部8は入力部1及
び出力部2と接続されており、入出力の制御を行う。候
補バッファ9は、用例辞書4による判定の対象となる変
換候補を格納している。
【0010】図3は、仮名漢字変換処理のフローチャー
トである。以下、各ステップに従って順に説明する。装
置は入力されたかな文字列を読み込み(S1)、辞書引
きを行うなどして変換候補を生成する(S2)。このと
き、文節(あるいは単語)の切り分け方に曖昧性が存在
したり、同音異義語が存在することから、多くの場合、
ある入力に対しての複数の変換候補が生成される。すな
わち、入力部1から入力されたかな文字列をもとに、変
換処理部6は単語辞書3を検索するなどして、変換候補
を生成して候補バッファ9に格納する。次に、これらの
候補の中から尤もらしい候補を決定するための評価処理
(S3)を行う。共起関係にある単語ペアの表記などの
あらかじめ格納した、いわゆる用例辞書も同音異義語の
選択などを行うための評価処理の中で用いられることが
多い。装置は、用例処理などからなる評価処理の結果、
変換候補を決定して変換結果を出力する(S4)。すな
わち、変換結果を出力部2へ出力し、1つの変換処理単
位を終える。
【0011】図4は、図3における評価処理の1つであ
る用例処理のフローチャートである。以下、各ステップ
に従って順に説明する。評価処理において用例処理が起
動されると、まず装置は、候補バッファ9から用例処理
の対象となる先に生成された候補ペアを取り出し、用例
辞書4を検索する(S01)。そして、これらの候補ペ
アが用例として登録されているか否かを判定し(S0
2)、登録されていれば、その用例が適用可能であるか
を判定する通常用例処理を行い、登録されていない場合
は、候補ペアに対する用例処理を終える。ここで言う通
常用例処理(S03)とは、用例関係にある単語と単語
の間に入りうる助詞の判定などの行うものであるが、本
発明における変換ルールによる変換後の助詞判定とは異
なり、変換情報以外の部分の用例辞書情報を用いて行え
る判定処理単位をさす。したがって、表記の比較のみで
判定するような場合(例えば、名詞と名詞による複合語
の判定など)については特に何も行なわない。
【0012】通常用例処理の結果、用例が適用可能であ
るか否かを判定し(S04)、適用可能であれば、用例
として登録されていたことを示す情報(例えば得点付け
を行うなどの方法がある)を格納し、変換結果として優
先処理(S08)を行い用例処理を終える。S04で適
用不可と判定された場合は、更に、候補の単語ペアが
「体言+用言」の組み合わせであるか否かを調べる(S
05)。単語ペアが「体言+用言」でない場合は用例処
理を終え、そうでなければ、変換用処理(S06)を行
う。変換用例処理は、変換用例処理部7によって変換ル
ールテーブル5および用例辞書4に記述されている変換
パターン情報を用いて行われる。
【0013】図5は、変換ルールテーブルの構成を表す
模式図である。図5中のビットパターン部分は、各変換
ルール毎に一意に与えられている。また、変換条件の部
分は対象となる候補単語ペアが満たすべき文法的条件な
どが記述されており、変換ルール部分は助詞(主に格助
詞)の変換ルールが記述されている。図6は、用例辞書
の構成を示す模式図である。用例辞書4には、共起関係
にある単語ペア(例では単語の表記を記述しているが、
単語毎に一意を与えられた番号などを用いてもよい)、
その間に入りうる助詞情報や助詞の変換パターンを示す
ビット情報が記述される。
【0014】図5及び図6を用いて変換用処理の具体例
を説明する。例えば「けいかんがはかいされる」という
入力がなされると、「景観(が)」「破壊(+れる)」
といった候補が生成されるが、図6に示すような用例辞
書には、「景観」と「破壊する」は間に助詞を「を」介
するという用例情報しか登録されていない。このため通
常用例処理(S03)では、助詞の判定において失敗す
ることになる。従って、この場合には、更に変換ルール
を用いて判定を行う変換用例処理(S06)を起動す
る。用例辞書に格納されている「景観」と「破壊する」
の変換情報部分のビットパターンは 0010 であるので、
変換ルールテーブルを検索し、変換条件および変換ルー
ルを得る。例では、用言部分に助動詞「れる/られる」
が接続している場合には、助詞「を」を「が」に変換す
るというものであるので、変換候補はこの条件に適合す
ることから、用例が適用可能であると判定される。ま
た、入力が「けいかんがはかいした」であるような場合
には、用言部分「用言+た(助動詞・過去)」であるこ
とから変換条件に適合せず、助詞の変換を認めない。こ
のため「景観」と「破壊する」というペアの用例による
「景観が破壊する」という不自然な変換結果の生成が抑
制される。
【0015】変換ルールのパターンとしては、先のもの
に加えて「用言+れる/られる」という場合でも用いる
助詞は変化しない(図5のビットパターン 0100 )とい
うもの、例えば、「ナイフで切る」と「ナイフで切られ
る」といった場合や、用言が連体修飾として用いられる
場合には助詞「が」を「の」に変換できる(図5中のビ
ットパータン 1000 )といったもの、例えば、「プロペ
ラが回転する。」と「プロペラの回転する模型。」とい
った場合などが考えられる。これらのルールは随時テー
ブルに追加していくことで、用例辞書の容量増加を最小
限にとどめつつ、変換処理の精度向上が図れる。実施例
では、変換ルールの識別や検索にビットパターン情報を
用いているが、用例辞書への登録方法およびルールの識
別方法はこの限りではない。変換用例処理の結果をもと
に、用例が適用可能であるか否かを判定し(S07)、
使用可能であれば前記優先処理(S08)を行った後、
用例処理を終了する。また、適用不能であれば、用例処
理を終了する。
【0016】
【発明の効果】以上の説明から明らかなように、本発明
によると、以下のような効果がある。すなわち、既存の
用例情報に新たに助詞変換ルール情報を付加し、更に、
変換処理に際して用言の変化に関する情報(接続してい
る助動詞の有無など)をもとに、用例辞書に付加された
助詞変換ルールを用いて判定処理を行う判定手段を設け
て仮名漢字変換処理を行う。これにより、用例情報の誤
った適用による誤変換の抑制や用例辞書メモリ容量の増
加の抑制、更に、既存の用例辞書をベースにして再構築
が可能であることから、容易に仮名変換装置の変換精度
の向上が図れるといった効果が期待される。
【図面の簡単な説明】
【図1】本発明による仮名漢字装置の一実施例を説明す
るための構成図である。
【図2】本発明による仮名漢字装置のより具体的な構成
図である。
【図3】本発明による仮名漢字装置を説明するための変
換処理のフローチャートである。
【図4】図3における評価処理の1つである用例処理の
フローチャートである。
【図5】本発明の変換ルールテーブルの構成を表す模式
図である。
【図6】本発明の用例辞書の構成を表す模式図である。
【符号の説明】
1…入力部、2…出力部、3…単語辞書、4…用例辞
書、5…変換ルールテーブル、6…変換処理部、7…判
定処理部(変換用例処理部)。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 入力文字列を入力するための入力手段
    と、仮名漢字変換結果などを表示する出力手段と、単語
    の読みや表記などからなる単語辞書と、用言の変化によ
    る接続可能助詞の変換ルールを格納した変換ルールテー
    ブルと、共起関係にある単語のペアを格納しており、体
    言と用言の共起関係ペアについては前記変換ルールテー
    ブルを参照するための変換情報を格納した用例辞書とを
    備え、前記入力手段によって入力された文字列を前記単
    語辞書や用例辞書を参照して仮名漢字変換処理を行い、
    前記出力手段に結果を表示する仮名漢字変換装置であっ
    て、変換処理の際に前記用例辞書に格納されている変換
    情報と前記変換ルールテーブルを用いて判定処理を行う
    判定手段を備えていることを特徴とする仮名漢字変換装
    置。
  2. 【請求項2】 用言部分の態の変化に関しての、接続可
    能助詞変換ルールテーブルと、用例辞書に記述される体
    言と用言の共起関係ペアに対する変換情報とを備えてい
    ることを特徴とする請求項1記載の仮名漢字変換装置。
  3. 【請求項3】 体言および用言などからなる節構造部分
    が用言に後続する体言を連体修飾する場合に関しての、
    接続可能助詞変換ルールテーブルと、用例辞書に記述さ
    れる前記節構造の体言と用言の共起関係ペアに対する変
    換情報とを備えていることを特徴とする請求項1記載の
    仮名漢字変換装置。
JP5100339A 1993-04-02 1993-04-02 仮名漢字変換装置 Pending JPH06290168A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5100339A JPH06290168A (ja) 1993-04-02 1993-04-02 仮名漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5100339A JPH06290168A (ja) 1993-04-02 1993-04-02 仮名漢字変換装置

Publications (1)

Publication Number Publication Date
JPH06290168A true JPH06290168A (ja) 1994-10-18

Family

ID=14271375

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5100339A Pending JPH06290168A (ja) 1993-04-02 1993-04-02 仮名漢字変換装置

Country Status (1)

Country Link
JP (1) JPH06290168A (ja)

Similar Documents

Publication Publication Date Title
US5612872A (en) Machine translation system
JP3161942B2 (ja) 訳振り機械翻訳装置
US5832478A (en) Method of searching an on-line dictionary using syllables and syllable count
US4860206A (en) Translation system allowing user designation of postpositional words
JP2007157123A (ja) 改善された中国語−英語翻訳ツール
JPH06290168A (ja) 仮名漢字変換装置
JPS60254367A (ja) 文章分析装置
JP2621999B2 (ja) 文書処理装置
JPH0130173B2 (ja)
JPH0785040A (ja) 表記不統一検出方法およびかな漢字変換方法
JP3847801B2 (ja) 文字処理装置及びその処理方法
JPS6277669A (ja) 入力文章の自動校正方式
JPH0410052A (ja) 外国語電子辞書検索方法及び装置
JP3386520B2 (ja) 仮名漢字変換装置および方法
JP3300492B2 (ja) 辞書検査装置
JPH0154742B2 (ja)
JP2002351868A (ja) 電子辞書
JPH0221623B2 (ja)
JP2958811B2 (ja) 日本語文章処理装置
JPH07121542A (ja) 機械翻訳装置
JPH035875A (ja) 正表記・異表記対応電子化辞書
JPH11306181A (ja) 文章校正支援システムおよびそのシステムでの処理をコンピュータに行わせるためのプログラムを格納した記録媒体
JPH0589094A (ja) かな漢字変換装置
JPS63195765A (ja) 片仮名つづり検査機能を有するワ−ドプロセサ
JPS60112174A (ja) 仮名漢字変換装置における略称語変換方式