JPH0498449A - 単漢字変換装置 - Google Patents

単漢字変換装置

Info

Publication number
JPH0498449A
JPH0498449A JP2213304A JP21330490A JPH0498449A JP H0498449 A JPH0498449 A JP H0498449A JP 2213304 A JP2213304 A JP 2213304A JP 21330490 A JP21330490 A JP 21330490A JP H0498449 A JPH0498449 A JP H0498449A
Authority
JP
Japan
Prior art keywords
kanji
character string
dictionary
input
kana
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2213304A
Other languages
English (en)
Other versions
JPH0748212B2 (ja
Inventor
Tsuneaki Kato
加藤 恒昭
Yoshiji Oyama
芳史 大山
Muneyuki Horii
統之 堀井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2213304A priority Critical patent/JPH0748212B2/ja
Publication of JPH0498449A publication Critical patent/JPH0498449A/ja
Publication of JPH0748212B2 publication Critical patent/JPH0748212B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野J この発明は、入力装置から入力される平仮名(ローマ字
)文字列を、カナ漢字変換して出力する文書作成装置!
!(ワードプロセッサ等)や、上記入力された平板名文
字列をカナ漢字変換して処理装置に送る日本語フロント
エンド等に用いられ、入力文字列を単漢字に変換する単
漢字変換装置に関する。
「従来の技術」 カナ漢字変換装置において、姓名・地名等の固有名詞を
入力する場合、単語辞書にその固を名詞が登録されてい
ないことが多く、この場合、利用者は漢字を一文字ずつ
カナ漢字変換して入力することが必要となる0例えば、
r恒昭(つねあき)コと入力したい場合、「つねあきJ
をカナ漢字変換しても所望の変換結果は得られないこと
が多く、「恒J、「昭」を一文字ずつ変換する必要があ
る。
固有名詞の数は膨大で、その全てを辞書に登録しておく
ことは不可能であるため、このような単漢字の変換は必
ず生じる事態である。従来のカナ漢字変換装置において
は、この様な単漢字入力の手段として以下のものが主に
提供されている。
コード入カニ入力したい漢字のコード(JISコードや
句点コード)を入力して変換する2ストローク法:漠字
毎に特殊なコードを決め、それを入力する 読み人カニ入力したい漢字の音読み(F昭」であれば、
「しよう」)を入力して変換する「発明が解決しようと
する課題」 上記コード入力は、入力したい漢字のコードをコードブ
ック等で調べる必要があり、手間のかかる手法である。
上記2ストローク法は、特殊なコードを暗記する必要が
あり、軌線を要する手法である。上記読み入力は、−4
には同音異語(「シょう」については、章、冨、小、竿
、等)が多く、所望の漢字を得るまでに、多数回、次候
補キイを押下するなどの操作が必要であり、使い勝手の
良いものではなかった。つまり、単漢字を変換するため
の簡便な手段が、従来、提供されていなかった。
「課題を解決するための手段J この発明によれば、漢字の形状を記述した形状辞書と、
部首の読み方を記述した部首辞書と、漢字の読み方と形
状を記述した漢字辞書と、与えられた文字列を文節とみ
なして仮名漢字変換を行う仮名漢字変換部と、その仮名
漢字変化部が利用する仮名漢字変換辞書とを備え、 入力文字例解析部で、入力された文字列について、以下
の1〜4のどの指定形式であるかを判定し、その結果に
応して、形状指定処理、熟語指定処理、単語指定処理の
いずれかを呼び出し、入力文字列を渡す。
1 当該漢字を構成する漢字もしくは部首名とそれらの
位置関係による指定 2 当該漢字が含まれている熟語の読みと、その熟語に
おける当該漢字の読みによる指定3 当該漢字の訓読を
含む用言終止形による指定 4 当該漢字が一文字で単語となる場合にその単語の読
みによる指定 形状指定処理部は指定の形式が1の時に呼び出され、与
えられた文字列から部分となる漢字もしくは部首名を表
現している文字列である部分文字列と、下、右などの位
置関係の情報を抽出する。
これらの部分文字列が部首名であるかを部首辞書によっ
て確認する0部首名でない文字列については、それをこ
の単漢字変換装置の入力として処理し、漢字候補の集合
を得る。これらによって得られた部首名もしくは漢字候
補と先の関係情報を用いて上記形状辞書と上記漢字情報
辞書を検索し、入力文字列の漢字候補を得て、出力とす
る。
熟語指定処理部は指定の形式が2の時に呼び出され、与
えられた文字列から、熟語の読みである文字列と、当該
漢字の読みがその熟語の読みのどの部分に相当するかと
いう位置情報を抽出する。
次に、仮名漢字変換部を利用して、熟語の読みを仮名漢
字変換し、漢字熟語文字列を得る。これと先の位置情報
とから、入力文字列の漢字候補を得て、それら漢字候補
のうち、当該漢字の読みとして指定された文字列を読み
として持つものを漢字情報辞書を検索して選び出し、入
力文字列の漢字候補とする。
単語指定処理部は指定の形式が3.4の時に呼び出され
、仮名漢字変換部を利用して与えられた文字列を仮名漢
字変換し、単語を表現する漢字一文字もしくは漢字一文
字を含む用言文節を得る。
それらから、そこに含まれる一文字の漢字のうち、入力
文字列を読みとして持つものを漢字情報辞書を検索して
選び出し、入力7字列の漢字候補として、出力する。
このように構成されているから入力したい単漢字を次の
4種類の何れかで指定できる。
1 形状による指定 変換したい漢字を、当該漢字を構成する漢字もしくは部
首名とそれらの位置関係によって指定する 例 くさかんむりにほうこうのほう→芳ちからのみぎに
くち     →加 2 熟語による指定 変換したい漢字を、当該漢字が含まれている熟語の読み
と、その熟語における当該漢字の読みによって指定する 例 れきしのし   →史 しょうわのしょう→昭 3 訓読による指定 変換したい漢字を、当該漢字の訓読を含む用言終止形に
よって指定する。
例 おおきい →大 くわえる →加 4 単語による指定 当該漢字が一文字で単語となる場合には、変換したい漢
字を、その単語の読みによって指定する例 やま →山 単漢字指定のこれらの方式は、従来の方式に比べて熟練
を必要としない上、コードブック等も不要である。また
、これらの形式で指定された場合、候補となる漢字の数
は単なる読みで指定された場合に比べて極めて少ないた
め、次候補キイ押下等の候補選択の手間も削減すること
ができる。特にこれらの形式は人間が言葉を用いて漢字
を説明するときに用いる説明に類似しており、ユーザは
普段用いている説明と同しような入力をするだけで必要
な漢字を入力することができるため、その知的負荷を軽
減することにつながる。
「実施例」 第1図は、この発明の実施例の構成を示す、この装置は
入力文字列解析部1、形状指定処理部2、熟語指定処理
部3、単語指定処理部4、仮名漢字変換部5、部首辞書
6、形状辞書7、漢字情報辞書8、仮名漢字変換辞書9
よりなる。仮名漢字変換部5と仮名漢字変換辞書9はワ
ープロ等に利用されている一般の仮名漢字変換装置で、
与えられた文字列を文節と見做して仮名漢字変換を行な
い、変換結果を返すという機能を持つものである。この
発明においではこの仮名漢字変換部5と仮名漢字変換辞
書9の内部構成は規定しない。
入力される文字列は以下のいずれかの形式を持っている
形式1 文字列1+((の1区切り記号)+(下1右1
中1間))+(に1区切り 記号)十文字列2 0は省略可能、())は選択を示す。
ここで、文字列1、文字列2は部首名もしくは以下に示
すこの単漢字変換の入力であり、この入力は、文字列1
、文字列2で、部首名もしくは漢字を指定し、それらの
部分が下、右等の位置関係で組み合わされて構成される
漢字を指定している。
形式2 文字列1+(の1区切り記号)十文字列lの部
分 ここで、文字列1は熟語の読みであり、この入力は、文
字列−1で指定された熟語を構成する漢字の内、文字列
1の部分の読みを持つ漢字を指定している。
形式3 上記1,2以外の文字列 文字列は、用言終止形−文節、もしくは、漢字一文字か
らなる単語の読みであり、この入力は、そこに現われる
漢字を指定している。
入力された文字列は、入力文字列解析部1によって解析
される。入力文字列解析部1の処理の流れは第2図に示
す通りで、入力文字列が上に示したどの形式であるかを
判定し、必要な処理を呼び出す、入力文字列の形式決定
は、形式1の場合、入力文字列が((の1区切り記号)
+(下I在中1間))+(に1区切り記号)と言う文字
列を含むかによって、形式2の場合、入力文字列が(の
1区切り記号)を含み、かつ、その後の文字が前の文字
列の部分となっているかによって行なわれる。形式1.
2に合わない文字列は形式3であると判定される。
入力文字列が形式1であると判定されると、形状指定処
理部2が呼び出される。形状指定処理部2の処理の流れ
を第3図に示す、ここでは、まず、入力文字列から文字
列((の1区切り記号)+(下1右1中1間))+1に
1区切り記号)の前後の文字列を取りだし、文字列l、
文字列2とする。また、関係情報として、下、右、中、
間、任意のいずれかを抽出する8文字列1.2が、部首
辞書6に含まれているかを検索することによって、それ
ぞれの文字列が部首名であるかが判定される。
ここで、部首辞書6は第4図に示すように部首の名称を
列挙したものである0部首名でない文字列については、
これを再びこの単漢字変換装置の入力として再帰的な処
理が行なわれる。これらの処理によって得られた部首、
もしくは、漢字をキイとして、形状辞書7を検索する。
形状辞書7は第5図に示すような構成となっており、部
首名もしくは漢字がキイとなっており、その内容として
、そのキイを部分として含む漢字が記述されている。
この形状辞書7を検索し、検索結果に共通した文字をと
ることによって、文字列1が表現する漢字もしくは部首
名と、文字列2が表現する漢字もしくは部首名との両方
を含む漢字が得られる。これらの漢字をキイに漢字情報
辞書8を検索する。漢字情報辞書8は、各漢字について
、その音読み、訓読み、単紐読み、形状が、音項目、訓
項目、単項目、形項目に整理されて記述されている第6
図に示すような辞書である。得られた漢字候補について
、この漢字情報辞書8を検索し、その形項目を得て、関
係情報が指定されたものと一致するかを!!認し、一致
するものを候補として出力する。
入力文字列が形式2であると判定されると、熟語指定処
理部3が呼び出される。ここでは、(の区切り記号)の
前後の文字列をそれぞれ文字列l、及び文字列10部分
として取りだす、後者の文字列1の部分が前者の文字列
1の先頭部分と一致する部分文字列であるとき、位置情
報を「左」、末尾部分と一致する部分文字列であるとき
、位置情報を「右」、それ以外の部分文字列であるとき
位置情報を「中」とする、この後、文字例1を仮名漢字
変換部5を利用して仮名漢字変換し、文字列1を読みと
する熟語の漢字表記を得る。この熟語がn文字の漢字か
らなる熟語であるとする0位置情報が「左」の時、この
熟語の第一文字目を漢字候補とする0位置情報が「右j
の時、この熟語の第n文字目を漢字候補とする0位置情
報が「中」の時、この熟語の第2文字目からn−1文字
目までを漢字候補とする。これらの漢字候補のうち、文
字列1の部分で示された読みを持つものを、漢字情報辞
書8の音項目、訓項目を用いて選択し、これを漢字候補
として出力する。
入力文字列が形式3であると判定されると、単結指定処
理部4が呼び出される。ここでは、入力文字列を仮名漢
字変換部5を用いて仮名漢字変換し、得られた結果に含
まれる漢字を漢字候補とする。これらの漢字候補のうち
、入力文字列で示された読みを持つものを、漢字情報辞
書8の訓項目、単項目を用いて選択し、これを漢字候補
として出力する。
次にr<、さかんむりのしたにほうこうのほう」という
文字列が入力された場合を例に装置の動作を具体的に岐
明する。この文字列が形式1を満たすことが入力文字列
解析部1によって判定され、形状指定処理部2が呼び出
される。形状指定処理部2は、この入力を解析し、文字
列1=「くさかんむり」、文字例2=「はうこうのほう
」、関係情報=「下Jを得る0部首辞書6を検索するこ
とで、文字列1は部首名であることがわかる0文字列2
は部首辞書6の中に存在しないので、これを新たに入力
としてこの単漢字変換が再帰的に呼び出される。
従ってこの単漢字変換装置に「はうこうのほう」という
文字列が入力され、この文字列が形式1であるかが調べ
られるが、この文字列は形式1でないことがわかり、次
に形式2であるかが調べられる。この文字列は形式2で
あると判定され、熟語指定処理部3が呼び出される。熟
語指定処理部3は文字列を解析し、文字列1=1はうこ
う」、位置情報=「左」を得る。その文字列Iを仮名漢
字変換することにより、その結果として、r方向J「奉
公」 「彷徨」 「放校」等が得られる。これと位置情
報=「左」から漢字候補として、「方」「奉」 「彷」
 「放」が得られる。これらの漢字について漢字情報辞
書8を検索−し、それぞれの漢字の読みとして「はう」
が存在することを確認し、これを出力する。
文字列2の漢字変換結果として、「方J 「奉」「彷」
 「放」を受は取った形状指定処理部2は、まず、「く
さかんむり」をキイとして、形状辞書7を検索し、文字
列「・・・草・・・芳・・・」を得る0次に、「方」を
キイとして形状辞書7を検索し、文字列「・・・芳・・
・旗・・・jを得る6次に、この2つの文字列に共通す
る文字を抽出することで、漢字候補「芳」を得る。この
操作を「奉」 「彷」 「放」についても行ない、全て
の漢字候補を得る。この例では、漢字候補として「芳」
だけが得られたものとする。
最後に、この得られた候補「芳」について、漢字情報辞
書8を検索し、その形項目「草冠−下一方」から、関係
情報が「下」であることを確認し、漢字候補として出力
する。
これにより、形状指定処理部2の出力として、漢字候補
[芳づが得られ、単漢字変換の処理が終了する0以上の
処理により、文字列「くさかんむりのしたにほうこうの
ほう)の単漢字変換結果として、「芳」が得られる。
もう一つの例として、「たいようのよう」という文字列
が入力された場合の装置の動作を説明する。「たいよう
のよう」という文字列が入力されると、まず、この文字
列が形式lであるかが調べられるが、この文字列は形式
1でないことがわかり、次に形式2であるかが調べられ
る。この文字列は形式2であると判定され、熟語指定処
理部3が呼び出される。熟語指定処理部3は文字列を解
析し、文字列1=rたいようJ、位置情報−「右」を得
る0文字列1を仮名漢字変換することにより、その結果
として、「太陽J 「大洋J 「大要Jが得られる。こ
れと位置情報=「右」から、漢字候補として、「陽」 
「洋」 「要」が得られる。これらの漢字について漢字
情報辞書8を検索し、それぞれの漢字の読みとして「よ
う」が存在することを確認し、これら「陽J 「洋J 
「要」を出力とする。
なお、ここに示した例では、形状辞書7の構成を部首名
もしくは漢字一文字をキイとし、これを含む漢字からな
る文字列を内容とするものとしたが、形状辞書7の構成
として、部首名もしくは漢字と、位置情報の全てをキイ
として、それらによって構成される漢字を内容とするこ
とも可能である。
F発明の効果」 以上で説明したように、この発明によれば、従来に較べ
て、簡便で使い勝手の良い単漢字変換機能が実現できる
。つまり、単漢字指定が、従来の方式に比べて熟練を必
要としない上、コードブック等も不要である。また、こ
れらの形式で指定された場合、候補となる漢字の数は単
なる読みで指定された場合りこ比べて極めて少ないため
、次候補キイ押下等の候補選択の手間も削減することが
できる。特にこれらの形式は人間が言葉を用いて漢字を
説明するときに用いる説明に類似しており、ユーザは普
段用いている説明と同じような入力をするだけで必要な
漢字を入力することができるため、その知的負荷を軽減
することにつながる。
【図面の簡単な説明】
第1図は、この発明の実施例の構成を示すブロック図、
第2図は、第1図中の入力文字列解析部1の処理の流れ
を示す図、第3図は第1図中の形状指定処理部2の処理
の流れを示す図、第4図は部首辞書6の内容の例を示す
図、第5図は形状辞書7の内容の例を示す図、第6図は
漢字情報辞書Bの内容の例を示す図である。 特許出願人  日本電信電話株式会社

Claims (1)

    【特許請求の範囲】
  1. (1)漢字の形状を記述した形状辞書と、 部首の読み方を記述した部首辞書と、 漢字の読み方と形状を記述した漢字情報辞書と、与えら
    れた文字列を文節とみなして仮名漢字変換を行う仮名漢
    字変換部と、 上記仮名漢字変換部が利用する仮名漢字変換辞書と、 漢字一文字を指定して入力された文字列が、1、当該漢
    字を構成する漢字もしくは部首名とそれらの位置関係に
    よる指定、2、当該漢字が含まれている熟語の読みと、
    その熟語における当該漢字の読みによる指定、3、当該
    漢字の訓読を含む用言終止形による指定、4、当該漢字
    が一文字で単語となる場合にその単語の読みによる指定
    、の何れであるかを判定し、その判定結果に応じて形状
    指定処理部、熟語指定処理部、単語指定処理部の何れか
    の処理を呼び出す入力文字列解析部と、 入力された文字列が上記1による指定である時に呼び出
    され、与えられた文字列から部分となる漢字もしくは部
    首名を表現している文字列である部分文字列と、下、右
    などの位置関係の情報を抽出し、これら部分文字列が部
    首名であるかを上記部首辞書によって確認し、そうでな
    ければ、それら部分文字列をこの単漢字変換装置の入力
    として漢字候補の集合を得て、これらによって得られた
    部首名もしくは漢字候補と先の関係情報を用いて上記形
    状辞書と上記漢字情報辞書とを検索し、入力文字列の漢
    字候補を得る上記形状指定処理部と、入力された文字列
    が上記2による指定である時に呼び出され、与えられた
    文字列から、熟語の読みである文字列と、当該漢字の読
    みがその熟語の読みのどの部分に相当するかという位置
    情報を抽出し、上記仮名漢字変換部を利用して得られる
    熟語の読みの仮名漢字変換結果である漢字熟語文字列と
    上記の位置情報とから、入力文字列の漢字候補を得て、
    それら漢字候補のうち、当該漢字の読みとして指定され
    た文字列を読みとして持つものを上記漢字情報辞書を検
    索して選び出し、入力文字列の漢字候補とする上記熟語
    指定処理部と、入力された文字列が上記3、4による指
    定である時に呼び出され、与えられた文字列を上記仮名
    漢字変換部を利用して変換し、そこに含まれる一文字の
    漢字を漢字候補とし、それら漢字候補のうち、入力文字
    列を読みとして持つものを上記漢字情報辞書を検索して
    選び出し、入力文字列の漢字候補とする上記単語指定処
    理部と、 を有することを特徴とする単漢字変換装置。
JP2213304A 1990-08-10 1990-08-10 単漢字変換装置 Expired - Lifetime JPH0748212B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2213304A JPH0748212B2 (ja) 1990-08-10 1990-08-10 単漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2213304A JPH0748212B2 (ja) 1990-08-10 1990-08-10 単漢字変換装置

Publications (2)

Publication Number Publication Date
JPH0498449A true JPH0498449A (ja) 1992-03-31
JPH0748212B2 JPH0748212B2 (ja) 1995-05-24

Family

ID=16636914

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2213304A Expired - Lifetime JPH0748212B2 (ja) 1990-08-10 1990-08-10 単漢字変換装置

Country Status (1)

Country Link
JP (1) JPH0748212B2 (ja)

Also Published As

Publication number Publication date
JPH0748212B2 (ja) 1995-05-24

Similar Documents

Publication Publication Date Title
US4777600A (en) Phonetic data-to-kanji character converter with a syntax analyzer to alter priority order of displayed kanji homonyms
JPS6211932A (ja) 情報検索方法
JP3230606B2 (ja) 固有名詞特定方法
JP2828692B2 (ja) 情報検索装置
JPH05233600A (ja) ワードプロセッサ
JPH0498449A (ja) 単漢字変換装置
JPS61248160A (ja) 文書情報登録方式
JPH1011431A (ja) 漢字検索装置および方法
JPH01259448A (ja) 漢字入力方式
JP2570784B2 (ja) 文書リーダ後処理装置
JP2759123B2 (ja) かな漢字変換装置
JPH03278176A (ja) 日本文固有用語抽出処理装置
JP4262529B2 (ja) 全文検索装置、方法、プログラム及び記録媒体
JPS6389976A (ja) 言語解析装置
JPH04330565A (ja) 自然言語処理システム
JPH0475162A (ja) 仮名漢字変換装置
JPH0612453A (ja) 未知語抽出登録装置
JP3233283B2 (ja) 日本文文章解析装置
JPS6174060A (ja) 外来語簡易入力方式
JPH04270450A (ja) 文書作成装置
JPH03225462A (ja) ローマ字漢字変換装置
JPS6349929A (ja) キ−ワ−ド抽出装置
JPH035877A (ja) データ操作方式
JPH0468466A (ja) かな漢字変換装置
JPS61128364A (ja) 辞書検索装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090524

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090524

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100524

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100524

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110524

Year of fee payment: 16

EXPY Cancellation because of completion of term
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110524

Year of fee payment: 16