JPH09185613A - 仮名漢字変換装置および仮名漢字変換方法 - Google Patents

仮名漢字変換装置および仮名漢字変換方法

Info

Publication number
JPH09185613A
JPH09185613A JP7354236A JP35423695A JPH09185613A JP H09185613 A JPH09185613 A JP H09185613A JP 7354236 A JP7354236 A JP 7354236A JP 35423695 A JP35423695 A JP 35423695A JP H09185613 A JPH09185613 A JP H09185613A
Authority
JP
Japan
Prior art keywords
word
conversion
kana
character string
speech information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7354236A
Other languages
English (en)
Inventor
Yasuo Koyama
泰男 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
EE I SOFT KK
Original Assignee
EE I SOFT KK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by EE I SOFT KK filed Critical EE I SOFT KK
Priority to JP7354236A priority Critical patent/JPH09185613A/ja
Publication of JPH09185613A publication Critical patent/JPH09185613A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 単語毎に入力して変換したり、入力した仮名
文字列に対して任意の位置に区切りを指定して変換して
も、所望の変換を得る。 【解決手段】 直前に確定した変換候補の最後尾の単語
(確定単語)の品詞データを格納しておき、この確定単
語をダミー単語(ダミー自立語又はダミー付属語)とし
て設定する(S305,S315)。そして、ダミー単
語と、変換対象の仮名文字列の先頭文字を検索位置とし
て検索された自立語又は付属語との接続の適否を判定し
(S355)、接続が適合するときにはダミー単語に接
続する語からなる文節を作成して変換候補とする(S3
75)。この結果、例えば、活用する語の語幹のみを入
力し変換し確定した後に活用語尾を入力し変換しても、
確定された語の活用語尾として認識され変換される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、仮名漢字変換装置
および仮名漢字変換方法に関し、詳しくは、入力された
仮名文字列に対して辞書を参照して漢字混じり文字列に
変換する仮名漢字変換装置および仮名漢字変換方法に関
する。
【0002】
【従来の技術】従来、この種の仮名漢字変換装置または
仮名漢字変換方法としては、入力された仮名文字列に対
して検索された自立語と付属語の接続の適否を判定する
ものが提案されている。この装置または方法では、ま
ず、入力された仮名文字列の先頭文字から切り出し可能
な文字列からなる自立語を検索し、この検索された自立
語に連続する文字を先頭文字として切り出し可能な文字
列からなる付属語を検索する。そして、検索された自立
語と付属語との接続の適否をそれぞれの語の品詞情報に
基づいて判定し、適合する場合に変換候補として表示す
る。この装置または方法が、まず入力された仮名文字列
の先頭文字から始まる自立語を検索するのは、日本語で
は文の先頭文字から始まる最初の単語は、接頭語を伴う
場合も含めて自立語だからである。
【0003】
【発明が解決しようとする課題】しかしながら、こうし
た装置や方法では、単語毎に入力し、仮名漢字変換する
場合には、所望の変換にならない場合を生じるという問
題があった。例えば、漢字混じり文字列として「秀麗な
装い」を得たい場合に、「しゅうれい」「な」「よそお
い」と3回に分けて入力する場合や、「しゅうれいなよ
そおい」と入力するものの「しゅうれい」に対する所望
の変換候補を得るために「しゅうれい」と「なよそお
い」とに区切って変換する場合には、「な」が形容動詞
である「秀麗な」の活用語尾として表示されず、自立語
の「名」等が検索されて変換候補として表示されてしま
う。こうした問題は、活用語尾を伴う自立語に関する場
合に限られず、活用しない自立語と付属語からなる文節
に対して、自立語部分と付属語部分とを個々に入力して
変換したり、自立語部分と付属語部分とを区切って変換
する場合にも生じる。
【0004】こうした問題に対して、活用語尾や付属語
を含めてそれらすべてを自立語として辞書に登録するこ
とも考えられるが、辞書に登録する語彙が膨大な量とな
ってしまうと共に、検索に長時間を要してしまう。ま
た、活用語尾や付属語を自立語として登録しておくこと
も考えられるが、これでは、付属語を自立語と区別する
意味を失ってしまう。
【0005】本発明の仮名漢字変換装置および仮名漢字
変換方法は、こうした問題を解決し、単語毎に入力して
変換したり、入力した仮名文字列に対して任意の位置に
区切りを指定して変換しても、所望の変換が得られるこ
とを目的とする。
【0006】
【課題を解決するための手段およびその作用・効果】本
発明の第1の仮名漢字変換装置は、入力された仮名文字
列の先頭文字から始まる単語および該単語に連続する文
字から始まる単語を辞書を参照して検索する単語検索手
段と、該連続して検索された単語の接続の適否を判定
し、単語の接続が適合する漢字混じり文字列を変換候補
として作成する変換候補作成手段と、該作成された変換
候補を表示する表示手段と、前記表示手段により表示さ
れた変換候補について確定の指示がなされたとき、該変
換候補を前記入力された仮名文字列に対応する漢字混じ
り文字列として確定する確定手段とを備える仮名漢字変
換装置において、前記確定手段による変換候補の確定が
されたとき、該確定された変換候補に含まれる単語のう
ち少なくとも最後尾の単語の品詞情報を記憶する品詞情
報記憶手段を備え、前記変換候補作成手段は、前記品詞
情報記憶手段により記憶された品詞情報に基づいて、前
記確定された変換候補の最後尾の単語と前記単語検索手
段により前記入力された仮名文字列の先頭文字から始ま
る単語との接続の適否を判定する手段であることを特徴
とする。
【0007】この第1の仮名漢字変換装置は、確定の指
示に基づく確定手段による変換候補の入力された仮名文
字列に対応する漢字混じり文字列への確定がされたと
き、品詞情報記憶手段が、この確定された変換候補に含
まれる単語のうち少なくとも最後尾の単語の品詞情報を
記憶する。単語検索手段は、入力された仮名文字列の先
頭文字から始まる単語およびこの単語に連続する文字か
ら始まる単語を辞書を参照して検索する。変換候補作成
手段は、品詞情報記憶手段により記憶された品詞情報に
基づいて、確定された変換候補の最後尾の単語と単語検
索手段により入力された仮名文字列の先頭文字から始ま
る単語との接続の適否や、連続して検索された単語の接
続の適否を判定し、単語の接続が適合する漢字混じり文
字列を変換候補として作成する。そして、表示手段は、
作成された変換候補を表示する。
【0008】なお、ここで、単語とは、自立語や付属語
を含むのは言うまでもなく、活用する自立語の場合には
語幹や活用語尾も含まれ、自立語が接頭語や接尾語を伴
う場合には接頭語や接尾語も含まれ、さらに形式名詞や
補助用言など自立語が転じて補助的に用いられる準自立
語も含まれる。
【0009】この第1の仮名漢字変換装置によれば、確
定された変換候補の最後尾の単語と入力された仮名文字
列の先頭文字から始まる単語との接続の適否を判定する
から、単語毎に入力を行なっても確定された変換候補の
最後尾の単語との接続が適合する単語を変換候補として
表示することができる。この結果、より確からしい変換
候補を表示することができる。
【0010】この本発明の第1の仮名漢字変換装置にお
いて、前記品詞情報記憶手段は、前記確定された変換候
補の最後尾の単語が付属語を接続可能な単語のとき、該
最後尾の単語の品詞情報を記憶する手段であり、前記変
換候補作成手段は、前記品詞情報記憶手段により前記確
定された変換候補の最後尾の単語の品詞情報が記憶され
たとき、該最後尾の単語と前記単語検索手段により前記
入力された仮名文字列の先頭文字から始まる単語との接
続の適否を判定する手段であるものとすることもでき
る。
【0011】こうすれば、確定された変換候補の最後尾
の単語が付属語を接続可能な単語のときにのみ、変換候
補作成手段がこの最後尾の単語と入力された仮名文字列
の先頭文字から始まる単語との接続の適否を判定するか
ら、常に判定する場合に比して迅速に処理することがで
きる。
【0012】また、本発明の第1の仮名漢字変換装置に
おいて、前記変換候補作成手段により前記確定された変
換候補の最後尾の単語と前記単語検索手段により前記入
力された仮名文字列の先頭文字から始まる単語との接続
が適合すると判定されて作成された変換候補が複数ある
とき、前記品詞情報記憶手段により記憶された該最後尾
の単語の品詞情報と、該最後尾の単語に接続する単語の
品詞情報とに基づいて前記複数の変換候補の優先順位を
設定する優先順位設定手段を備え、前記表示手段は、前
記優先順位設定手段により設定された優先順位の順に前
記作成された変換候補を表示する手段であるものとする
こともできる。
【0013】こうすれば、変換候補の優先順位を確定さ
れた変換候補の最後尾の単語とこれに接続する単語の品
詞情報に基づいて設定することができ、より確からしい
変換候補の優先順位を高くすることができる。
【0014】本発明の第2の仮名漢字変換装置は、入力
された仮名文字列の先頭文字から切り出し可能な文字列
に対して自立語辞書を参照して自立語を検索する自立語
検索手段と、該検索された自立語に連続する文字から切
り出し可能な文字列または該自立語に連続するとして検
索された付属語に連続する文字から切り出し可能な文字
列に対して付属語辞書を参照して付属語を検索する付属
語検索手段と、前記自立語検索手段により検索された自
立語と前記付属語検索手段により検索された付属語との
接続の適否,前記自立語検索手段により検索された自立
語間の接続の適否および前記付属語検索手段により検索
された連続する付属語間の接続の適否を判定し、接続の
適合する漢字混じり文字列を変換候補として作成する変
換候補作成手段と、該作成された変換候補を表示する表
示手段と、前記表示手段により表示された変換候補につ
いて確定の指示がなされたとき、該変換候補を前記入力
された仮名文字列に対応する漢字混じり文字列として確
定する確定手段とを備える仮名漢字変換装置において、
前記確定手段による変換候補の確定がされたとき、該確
定された変換候補に含まれる単語のうち少なくとも最後
尾の単語の品詞情報を記憶する品詞情報記憶手段を備
え、前記付属語検索手段は、前記品詞情報記憶手段によ
り記憶された品詞情報が付属語の接続可能な単語に関す
る情報のとき、前記入力された仮名文字列の先頭文字か
ら切り出し可能な文字列に対して前記付属語辞書を参照
して付属語を検索する手段であり、前記変換候補作成手
段は、前記品詞情報記憶手段により記憶された品詞情報
に基づいて前記確定された変換候補の最後尾の単語と前
記自立語検索手段により検索された自立語との接続の適
否を判定すると共に、前記品詞情報記憶手段により記憶
された品詞情報に基づいて前記付属語検索手段が前記入
力された仮名文字列の先頭文字から切り出される付属語
を検索したときには、該品詞情報に基づいて前記確定さ
れた変換候補の最後尾の単語と該付属語検索手段により
検索された付属語との接続の適否を判定する手段である
ことを特徴とする。
【0015】この第2の仮名漢字変換装置は、確定の指
示に基づく確定手段による変換候補の入力された仮名文
字列に対応する漢字混じり文字列への確定がされたと
き、品詞情報記憶手段が、この確定された変換候補に含
まれる単語のうち少なくとも最後尾の単語の品詞情報を
記憶する。自立語検索手段は、入力された仮名文字列の
先頭文字から切り出し可能な文字列に対して自立語辞書
を参照して自立語を検索し、付属語検索手段は、品詞情
報記憶手段により記憶された品詞情報が付属語の接続可
能な単語に関する情報のとき、入力された仮名文字列の
先頭文字から切り出し可能な文字列に対して付属語辞書
を参照して付属語を検索すると共に、自立語検索手段に
より検索された自立語に連続する文字から切り出し可能
な文字列またはこの自立語に連続するとして検索された
付属語に連続する文字から切り出し可能な文字列に対し
て付属語辞書を参照して付属語を検索する。
【0016】変換候補作成手段は、品詞情報記憶手段に
より記憶された品詞情報に基づいて確定された変換候補
の最後尾の単語と自立語検索手段により検索された自立
語との接続の適否を判定すると共に、品詞情報記憶手段
により記憶された品詞情報に基づいて付属語検索手段が
入力された仮名文字列の先頭文字から切り出される付属
語を検索したときには、品詞情報に基づいて確定された
変換候補の最後尾の単語と付属語検索手段により検索さ
れた付属語との接続の適否を判定し、更に、自立語検索
手段により検索された自立語と付属語検索手段により検
索された付属語との接続の適否,自立語検索手段により
検索された自立語間の接続の適否および付属語検索手段
により検索された連続する付属語間の接続の適否を判定
し、接続の適合する漢字混じり文字列を変換候補として
作成する。表示手段は、こうして作成された変換候補を
表示する。
【0017】なお、自立語には、語幹と活用語尾とから
なる語の場合には語幹のみが含まれ、活用語尾は含まれ
ない。また、付属語には、活用語尾,接頭語,接尾語,
形式名詞,補助用言など自立語に含まれないすべての語
が含まれる。そして、単語とは、自立語と付属語との総
称をいう。
【0018】この本発明の第2の仮名漢字変換装置によ
れば、確定された変換候補の最後尾の単語と入力された
仮名文字列の先頭文字から切り出される自立語および付
属語との接続の適否を判定するから、単語毎に入力を行
なって変換しても確定された変換候補の最後尾の単語と
の接続が適合する自立語または付属語を変換候補として
表示することができる。この結果、より確からしい変換
候補を表示することができる。
【0019】こうした本発明の第2の仮名漢字変換装置
において、前記自立語検索手段は、前記品詞情報記憶手
段により記憶された品詞情報が自立語の情報のとき、前
記入力された仮名文字列の先頭文字から切り出し可能な
文字列に対して前記自立語辞書を参照する検索を行なわ
ない手段であり、前記付属語検索手段は、前記品詞情報
記憶手段により記憶された品詞情報が自立語の情報のと
き、前記入力された仮名文字列の先頭文字から切り出し
可能な文字列に対して前記付属語辞書を参照して付属語
を検索する手段であるものとすることもできる。
【0020】こうすれば、品詞情報記憶手段により記憶
された品詞情報が自立語の情報のときには、入力された
仮名文字列の先頭文字からの自立語の検索は行なわず付
属語の検索を行なうのみとなるから、確定された変換候
補の最後尾の単語に接続するより確からしい変換候補を
迅速に検索し表示することができる。
【0021】また、本発明の第2の仮名漢字変換装置に
おいて、前記品詞情報記憶手段は、前記確定された変換
候補の最後尾の単語が付属語を接続可能な単語のとき、
該最後尾の単語の品詞情報を記憶する手段であり、前記
付属語検索手段は、前記品詞情報記憶手段により前記確
定された変換候補の最後尾の単語の品詞情報が記憶され
たとき、前記入力された仮名文字列の先頭文字から切り
出し可能な文字列に対して前記付属語辞書を参照して付
属語を検索する手段であるものとすることもできる。
【0022】こうすれば、確定された変換候補の最後尾
の単語が付属語を接続可能な単語のときにのみ品詞情報
が記憶され、この品詞情報に基づいて入力された仮名文
字列の先頭文字から切り出し可能な付属語が検索される
から、常に入力された仮名文字列の先頭文字から切り出
し可能な付属語を検索するものに比して、確定された変
換候補の最後尾の単語に接続するより確からしい変換候
補を迅速に検索し表示することができる。
【0023】本発明の第2の仮名漢字変換装置におい
て、前記変換候補作成手段により、前記確定された変換
候補の最後尾の単語と、前記自立語検索手段により検索
された自立語または前記付属語検索手段により検索され
た付属語との接続が適合すると判定されて作成された変
換候補が複数あるとき、前記品詞情報記憶手段により記
憶された該最後尾の単語の品詞情報と、該最後の単語に
接続する自立語または付属語の品詞情報とに基づいて、
前記複数の変換候補の優先順位を設定する優先順位設定
手段を備え、前記表示手段は、前記優先順位設定手段に
より設定された優先順位の順に前記作成された変換候補
を表示する手段であるものとすることもできる。
【0024】こうすれば、変換候補の優先順位を確定さ
れた変換候補の最後尾の単語とこれに接続する自立語ま
たは付属語の品詞情報に基づいて設定することができ、
より確からしい変換候補の優先順位を高くすることがで
きる。
【0025】こうした優先順位設定手段を備える第2の
仮名漢字変換装置において、前記優先順位設定手段は、
前記品詞情報記憶手段により記憶された前記確定された
変換候補の最後尾の単語の品詞情報が自立語のとき、該
最後尾の単語に付属語が接続する変換候補を該最後尾の
単語に自立語が接続する変換候補より優先順位を高く設
定する手段であるものとしたり、あるいは、前記優先順
位設定手段は、前記品詞情報記憶手段により記憶された
前記確定された変換候補の最後尾の単語の品詞情報が活
用する自立語のとき、該最後尾の単語に付属語が接続す
る変換候補を該最後尾の単語に自立語が接続する変換候
補より優先順位を高く設定する手段であるものとするこ
ともできる。こうすれば、より確からしい変換候補の優
先順位を高くして、より確からしい変換候補を表示する
ことができる。
【0026】本発明の仮名漢字変換方法は、入力された
仮名文字列を、辞書を参照して漢字混じり文字列に変換
する仮名漢字変換方法であって、入力された仮名文字列
の先頭文字から切り出し可能な文字列からなる語を見出
しとする単語を前記辞書を参照して検索し、該検索され
た単語が前記入力された仮名文字列が入力される直前に
確定された変換候補の最後尾の単語に接続するか否か
を、該検索された単語の品詞情報と該最後尾の単語の品
詞情報とに基づいて判定し、接続が適合するとの判定が
なされた単語を優先順位の高い変換候補として表示する
ことを要旨とする。
【0027】この仮名漢字変換方法によれば、確定され
た変換候補の最後尾の単語と入力された仮名文字列の先
頭文字から切り出し可能な文字列を見出しとする単語と
の接続の適否を判定するから、単語毎に入力を行なって
も確定された変換候補の最後尾の単語との接続が適合す
る単語を変換候補として表示することができる。この結
果、より確からしい変換候補を表示することができる。
【0028】
【発明の他の態様】本発明の他の態様としては、仮名文
字列を入力可能なコンピュータのメモリにロードされた
とき、該コンピュータを前記第1または第2の仮名漢字
変換装置として機能させるプログラムを記憶する記憶媒
体を考えることができる。この記憶媒体は、コンピュー
タのフレキシブルディスク装置や光磁気ディスク装置な
どに装着され、磁気的な手段や光学的な手段により記録
したプログラムをコンピュータのメモリに転送すること
により、コンピュータにおいて仮名漢字変換機能を実現
するものである。
【0029】
【発明の実施の形態】以上説明した本発明の構成・作用
を一層明らかにするために、以下本発明の実施の形態を
実施例に基づき説明する。図1は本発明の好適な一実施
例である仮名漢字変換装置において、仮名漢字変換制御
ロジックが実際に動作するハードウェアの構成を示すブ
ロック図である。図1に示すように、この装置は、予め
設定されたプログラムに従って仮名漢字変換に関わる動
作を制御するための各種演算処理を実行するCPU21
を中心に、CPU21で各種演算処理を実行するのに必
要な仮名漢字変換に関わるプログラムやデータなどを予
め格納するROM22、同じくCPU21で各種演算処
理を実行するのに必要な仮名漢字変換に関わる各種デー
タが一時的に読み書きされるRAM23、キーボード2
4からのキー入力を司るキーボードインターフェース2
5、カラーで表示可能なCRT26への信号出力を制御
するCRTC27、プリンタ28へのデータの出力を制
御するプリンタインターフェース29、RAM23にロ
ードされて実行される各種プログラムやデバイスドライ
バの形式で提供される仮名漢字変換処理プログラムある
いは各種変換辞書などが記憶されるハードディスク32
を制御するハードディスクコントローラ(HDC)30
等の各部を備える。こうした各部は、バス31により相
互に接続されている。
【0030】このように構成されたハードウェアによ
り、文字列の入力、仮名漢字変換、編集、表示、印刷な
どがなされる。すなわち、キーボード24から入力され
た文字列は、ハードディスク32に記憶した各種データ
を参照しながらCPU21により所定の処理がなされ、
RAM23の所定領域に格納され、CRTC27を介し
てCRT26の画面上に表示される。
【0031】次に、こうして構成されたハードウェアに
より実行される仮名漢字変換処理の詳細について説明す
る。まず、図2を用いて仮名漢字変換処理に関わる各部
の構成と働きについて概説するが、ここで行なわれる処
理は、キーボード24より入力されたデータに基づき、
中央処理装置(CPU21)が実行するものである。こ
のCPU21により、すべての処理が行なわれる。仮名
漢字変換については、キーボード24が操作されたと
き、所定の割り込み処理が起動し、入力したキーイメー
ジを対応する仮名文字列に変換し、更にこれを仮名漢字
混じり文字列に変換するデバイスドライバが起動する。
もとより、並行処理可能なコンピュータであれば、仮名
漢字変換を一つのアプリケーション(インプットメソッ
ド)が行なうものとし、変換結果を、必要とするアプリ
ケーションに引き渡す構成としても差し支えない。この
場合には、キーボード24からの入力をインプットメソ
ッドが一括して引き受けることになる。
【0032】キーボード24からのキーイメージは、文
字入力部40により受け付けられ、ここで、対応する文
字列に変換される。ローマ字入力の場合には所定の変換
テーブルを参照して、仮名文字列に変換する。一つの仮
名文字が得られる度に文字入力部40は、その仮名文字
を変換制御部42に送出する。この変換制御部42は、
仮名漢字変換の中心的な役割を果たすところであり、後
述する種々の仮名漢字変換を制御して、結果を変換後文
字列出力部44や品詞データ格納部112,自立語学習
部72,補助語学習部74,接辞学習部76,文字変換
学習部78に送出する。変換後文字列出力部44は、現
実には、CRTC27に信号を送り、CRT26に変換
後文字列を表示する。品詞データ格納部112は、後述
する確定処理部110における確定処理により変換候補
が確定されたときに、変換制御部44から送出される確
定された変換候補に含まれる最後尾の単語の品詞データ
を格納する。自立語学習部72、補助語学習部74、接
辞学習部76、文字変換学習部78については後述す
る。
【0033】変換制御部42は、受け取った仮名文字を
文字列入力部50に引き渡し、文字列入力部50は、受
け取った仮名文字列を変換対象文字列として文字格納部
52に格納する。自立語候補作成部54と付属語候補作
成部64とは、文字格納部52に格納された変換対象文
字列と品詞データ格納部112に格納された品詞データ
に基づいて、単語データの候補を作成する。自立語候補
作成部54は、ハードディスク32に予め記憶された自
立語辞書58を用い、自立語検索位置管理部56の管理
の下で、得られた変換対象文字列から自立語候補を抽出
する処理を行なう。一方、付属語候補作成部64は、同
じく付属語辞書68を用い、付属語検索位置管理部66
の管理の下で、得られた変換対象文字列から付属語候補
を抽出する処理を行なう。
【0034】自立語辞書58および付属語辞書68は、
B−Tree構造を有し、数万の語について、読みと、
表記と、品詞と、意味用例(係り受け情報)と、その他
のデータとを記憶している。以下、自立語辞書58の構
成について説明する。単語辞書58は、図3に示すよう
に、ヘッダとインデックスと辞書本体とからなる。ヘッ
ダは、辞書自体を管理するための情報である。インデッ
クスおよび辞書本体は、代表表記と派生表記と意味用例
とに分けて管理されている。代表表記とは、一つの単語
が複数の表記を許容されている場合、例えば「取り扱
い」に対して「取扱い」や「取扱」などが表記として許
されている場合、「取り扱い」をこれらの表記を代表す
るものとする、というように予め定めた単語表記であ
る。派生表記とは、「取扱い」「取扱」の様に、一つの
単語に対して許容されたその他の表記のことである。文
節分かち書き処理を行なう際には、このように派生表記
を有する語については、派生表記を代表する代表表記を
用いて文節分かち書き処理が行なわれる。意味用例につ
いての領域は、ある語と他の語との間に生じる特定の関
係、例えば「暑い夏」における「暑い」と「夏」、「熱
いお茶」における「熱い」と「お茶」など、ある語が他
の特定の語と共に用いられやすい関係(以下、この関係
を「係り受け」と呼ぶ)に関する情報が管理されている
領域である。
【0035】これらの代表表記、派生表記、意味用例
は、辞書本体においては、BーTree構造により管理
されている。B−Tree構造は、多数のデータを外部
記憶に置く場合に採用される周知の管理構造であり、本
実施例のB−Tree構造では、分木の節にはデータを
置かず、データはすべて分木の終端に置く構造を取って
いる。多分木の構造を取っているので、2分木と比べて
木構造の深さが浅くなり、外部記憶を用いる場合には、
アクセス時間を短いという特徴を有するものとして知ら
れている(B+Treeと呼ぶこともある)。辞書本体
におけるB−Tree構造の一例を図4に示した。単語
の読み(仮名文字列)に基づいてB−Tree制御ブロ
ックを辿って単語ブロックに至ると、ここに実際の単語
データがおかれている。なお、このタイプのB−Tre
e構造では、当初、キーは、その節に置くことができる
キーの最大数より少ない数だけ置かれ、データの追加な
どに柔軟に対応できるものとしている。
【0036】以下に、単語の読みに基づいてB−Tre
e制御ブロックを辿る様子を図4に即して説明する。例
えば、「かわき」という仮名文字列が入力され、自立語
辞書58における代表表記領域で検索が開始されるとき
を示す。B−Treeの根元にあたる1段目には、それ
ぞれ1つの文字を持つキーが50音順に並んでいる。
「かわき」から次段のどの分木に検索を進めるかは、
「かわき」を、1段目の節S1の各キーと比較すること
により知ることができる。この例では、「かわき」が少
なくともキー「か」とキー「さ」との間に存在するか
ら、2段目の節S2が探索の対象となる。次にこの節S
2において、同様の判断を行ない、「かわき」という読
みは50音順でキー「かる」より後、キー「くり」より
前であると判断し、キー「かる」以降でキー「くり」間
での範囲に対応する3段目の節S3が探索される。この
3段目の4個のキーの中で「かわき」を検索すると、5
0音順でキー「かわ」より後、キー「きじ」より前であ
るので、この範囲に対応する単語ブロックが探索され
る。この範囲に対応する単語ブロックの中に「かわき」
という読みを持つ語に関する実際の単語データが格納さ
れているのである。
【0037】代表表記領域などの単語データは、大まか
には、図5に示すデータ構造を有している。即ち、先頭
に単語データのレコード長Xを示すデータが存在し、そ
の後、Xバイトの実データが続いている。実データの先
頭には、見出し語の長さYが記録されており、続いてY
バイトの見出し語が記録されている。実際の単語データ
は、その後に続いている。単語データは、その先頭に単
語長Wが記録されており、その直後に漢字データの有無
などを示す1バイトのフラグが記録されている。フラグ
の後には、漢字データが記録されているが、この漢字デ
ータは、漢字データ長と実際の漢字文字列を示す漢字コ
ードから構成されている。その後、単語情報および品詞
データ(場合によっては複数の品詞データ)が記録され
ている。単語情報は、単語情報の長さを示すデータと、
実際の単語情報とからなる。また、品詞データは、品詞
データの長さを示す品詞データ長とその後の主たる品詞
および品詞に関する品詞情報からなる。品詞情報は、通
常複数あり、その後の意味上の役割(人名、役職、住
所、動物・・・・等)を示す情報や、活用形、活用語尾
長、連語品詞、短文品詞、特殊品詞、接続可能な直前お
よび直後の単語の品詞など様々な情報が記憶されてい
る。このほか、その語が、接頭語を取りうるか否か、接
尾語を取りうるか否か、連用名詞化するか否か、自動詞
か他動詞か、意志動詞か無意志動詞かなどの情報も記憶
されている。
【0038】自立語辞書58,付属語辞書68では、B
−Tree構造を用いて、単語の見出し文字列に基づい
て、所望の単語に関する情報を取り出すことができる。
これらの単語情報は、更に図6に示すように、セパレー
タとこれに続くデータとから構成されている。セパレー
タとしては、それ以後に続くデータが表示される漢字の
データであることを示す表示漢字セパレータや、データ
が読み情報であることを示す読み情報セパレータ、派生
表記であることを示す派生表記セパレータなどがある。
表示漢字とは、一つの単語に代表表記と派生表記とがあ
る場合に、デフォルトで漢字を表示するために、代表表
記に対応する漢字での表記を記録しているものである。
派生表記には種々の形態が存在するが、各単語について
はそれぞれ許容された表記が派生表記情報として記憶さ
れている。
【0039】派生表記セパレータは、派生表記領域にの
み存在する情報であり、その下位3ビットは、各派生表
記セパレータの後に情報が記憶されている派生表記が、
派生表記の形態の何種類分に対応するのかを示してい
る。 一例として、「売り上げ」という単語を挙げる
と、「売り上げ」という表記は、派生表記の「本則」と
「送る」の両者に該当するため、その派生表記セパレー
タの下位3ビットには、派生表記形態の2種類に対応す
るとして、値2が設定されている。また、読み情報は、
単語の読みを与えるものであり、見出し語が漢字である
場合などにその読みを与えるものである。この情報は、
漢字からその読みを得て、読みを同じくする単語を検索
する場合などに用いられる。例えば、文字の入力をキー
ボードからの他に手書き入力などで行なって、仮名と共
に漢字を含む文字列が入力されたとき、これを正しく変
換する際に用いられる(例「ひ行き」→「飛行機」)。
なお、一つの代表表記とこの代表表記に対応する派生表
記とは、別々の領域で管理されているが、単語の読み
(見出し)と単語の品詞情報とが一致するものについ
て、対応関係があるとみなしている。
【0040】同音異義語や接辞の表記について、仮名漢
字変換においていずれかの語や表記が選択されると、こ
れを自立語辞書58内に記録し、次回以降の変換では、
その語が第一候補になりやすくする学習処理がなされて
いる。この学習処理を行なうのが、図2に示した自立語
学習部72、補助語学習部74、接辞学習部76、文字
変換学習部78である。自立語学習部72は、同音異義
語の存在する自立語群において、最後に選択された単語
を次回以降の変換において最優先の候補とするよう学習
するものである。補助語学習部74は、例えば「くださ
い」などの補助語を「ください」「下さい」など、いず
れの語形で変換するかを学習するものである。更に、接
辞学習部76は、接頭語、接尾語などの変換形式(例え
ば、「御」「ご」など)を学習するものである。文字変
換学習部78は、入力した文字列をそのままひらがなや
カタカナとして確定させた場合に、その文字列を学習
し、次回以降の変換処理では確定させたひらがなまたは
カタカナを候補として出力するものである。
【0041】付属語辞書68も、基本的には自立語辞書
と同一の構造を備える。両辞書に登録されている語の種
別を以下に示す。
【0042】 品詞番号 品詞 登録辞書 表示上の取扱い (1) 1〜79 自立語 自立語辞書 自立語 (2) 80〜119 活用語尾 付属語辞書 活用語尾 (3) 120〜199 補助用言 付属語辞書 見掛け自立語 (4) 200〜205 形式名詞 付属語辞書 見掛け自立語 (5) 206〜248 接辞 付属語辞書 見掛け自立語 (6) 249 基数 付属語辞書 付属語 (7) 250〜299 助動詞 付属語辞書 付属語 (8) 300〜439 助詞 付属語辞書 付属語 (9) 440〜459 助動詞的表現 付属語辞書 付属語 (10)460〜499 助詞的表現 付属語辞書 付属語 。
【0043】ここで、「表示上の取扱い」とは、文節分
かち書きなどの処理で用いられる文法情報とは別に、文
節分かち書きされた文字列をCRT26に表示する際の
取扱いに関する情報である。補助用言や形式名詞、接辞
については、自立語ではないが、表示においては見掛け
上、自立語として扱うので、「見掛け自立語」として取
り扱っている。
【0044】自立語候補作成部54および付属語候補作
成部64により作成された語候補は、文節データ作成部
80に出力される。文節データ作成部80は、品詞デー
タ格納部112からのデータと自立語候補作成部54お
よび付属語候補作成部64により作成された語候補から
文節データを作成し、文節データ格納部100に作成し
た文節データを送出する。文節データ作成部80では、
接続検定部82により、品詞データ格納部112からの
データに基づく単語(前回確定処理がなされた際の変換
候補の最後尾の単語)と得られた付属語、得られた自立
語と付属語、得られた付属語と付属語との接続の適否
を、それぞれの単語の品詞情報に基づいて接続検定テー
ブル84を参照して検定する。
【0045】文節は、図7に示す構造のように、通常、
それ自体で意味をなす自立部と自立部に付随する付属部
とから構成される。自立部は、名詞や動詞等のように意
味をなす自立語から構成され、ときにはこれを修飾する
接尾語や接尾語を伴うこともある。自立語は、動詞や形
容動詞のように活用する語では、更に活用によっては変
化しない語幹と活用によって変化する活用語尾とに分け
られる。付属部は、1または2以上の付属語から構成さ
れている。なお、文節には、こうした自立部と付属部と
からなるものの他、自立部と付属部に、更に、形式名詞
や補助用言などの自立語が転じて補助的に用いられる語
(準自立語)と、この準自立語に付随する1または2以
上の付属語とが付加されたものとして構成されるものも
ある。本実施例では、前述したように、活用しない自立
語と活用する自立語の語幹を自立語辞書58の見出しと
して登録し、それ以外を付属語辞書68の見出しとして
登録した。
【0046】文節分かち書き部102は、文節データ格
納部100に格納された文節データから判断して、文字
格納部52に格納された変換対象文字列に対応する変換
候補が2以上の文節による組み合わせが複数有り得ると
きに、いずれの組み合わせが最も確からしいかを最小コ
スト法によって求め、その求めた組み合わせを変換候補
の第1候補とする。
【0047】文節データ格納部100に格納された文節
データは、変換文字列出力部108により変換制御部4
2に出力される。変換制御部42は、この文字列を変換
候補として表示すると共に、非所望の文字列が候補とな
る場合もありえるから、使用者による指示を受けて、次
候補の表示や選択などの処理を行なう。
【0048】こうして所望の変換候補を選択すると、確
定処理部110は、選択された変換候補を変換対象文字
列に対応する漢字混じり文字列として確定すると共に確
定時の各処理の信号を変換制御部42に出力する。この
信号を受け取った変換制御部42は、確定された変換候
補の最後尾の単語の品詞データを品詞データ格納部11
2に格納すると共に自立語学習部72,補助語学習部7
4,接辞学習部76,文字変換学習部78に学習の指示
を出し、更に文字格納部52および文節データ格納部1
00に格納されている格データをすべて消去して次の変
換に備える。学習の指示を受けた各学習部72〜78
は、変換候補の確定による優先順位の書き換えを行な
う。
【0049】以上、仮名文字列の入力から変換候補の確
定までを概説したが、次に各処理の詳細について説明す
る。まず始めに仮名漢字変換処理について大まかに説明
し、次に各処理の詳細について説明する。図8は、本実
施例における仮名漢字変換処理ルーチンの概略を示すフ
ローチャートである。この処理ルーチンは、キーボード
24から一ないし複数の仮名文字が入力された後、変換
キー(例えば「スペースキー」)が押されたとき、開始
される処理である。なお、変換キーが操作されなくて
も、所定数の仮名文字が入力されたとき、あるい
は「。」や「、」「.」などの区切り記号が入力された
ときに、図8の仮名漢字変換処理が開始されるものとし
ても差し支えない。
【0050】仮名漢字変換処理ルーチンでは、まず、品
詞データ格納部112にデータ(確定品詞データ)が格
納されているか否かを調べ(ステップS100)、確定
品詞データが格納されていないときには、文字格納部5
2に格納された変換対象文字列について通常に文節を作
成する通常文節作成処理を実行し(ステップS10
5)、確定品詞データが格納されているときには、前回
確定された変換候補の最後尾の単語(確定単語)との接
続を検定しながら変換対象文字列について文節を作成す
る確定単語接続文節作成処理を実行する(ステップS1
10)。次に作成された文節により変換対象文字列に対
応する文節の組み合わせが複数存在するか否かを判断し
(ステップS120)、複数の組み合わせがあるときに
は、いずれの組み合わせが最も確からしいかを判定し、
最も確からしい組み合わせを変換候補の第1候補とする
分かち書き処理を行なう(ステップS130)。変換対
象文字列に対応する文節の組み合わせが複数ないとき、
あるいは分かち書き処理により最も確からしい組み合わ
せについて第1候補が判定されたときには、作成された
文節の第1候補および確からしい文節の組み合わせの第
1候補をCRT26に表示する表示処理を行なう(ステ
ップS140)。そして、次候補の要求があるときには
次候補を表示する次候補処理を行ない(ステップS15
0,S160)、変換候補の確定処理を行なって(ステ
ップS170)、本ルーチン(仮名漢字変換)を終了す
る。以下、ステップS100の単語検索処理、ステップ
S110の接続検定処理およびステップS170の確定
処理を中心に各処理の詳細について説明する。
【0051】通常文節作成処理(ステップS105)
は、具体的には、自立語候補作成部54,付属語検索位
置管理部66および文節データ作成部80として機能す
るCPU21が図9に例示する通常文節作成処理ルーチ
ンを実行することにより行なう。通常文節作成処理処理
ルーチンが実行されると、CPU21は、まず自立語検
索位置管理部56により管理される自立語検索位置を変
換対象文字列の先頭文字にセットする(ステップS20
0)、そして、この自立語検索位置の文字を先頭文字と
して変換対象文字列から切り出し可能な自立語を自立語
辞書58から検索すると共に(ステップS205)、変
換対象文字列のうち検索された自立語の次の文字を付属
語検索位置にセットして(ステップS210)、セット
された文字を先頭文字として切り出し可能な付属語を付
属語辞書68から検索する(ステップS215)。
【0052】次に、検索された自立語のうち優先順位の
最優位の自立語を取り出すと共に(ステップS22
0)、この自立語に連続する単語として検索された自立
語または付属語のうち優先順位の最優位の自立語または
付属語を取り出し(ステップS225)、取り出した自
立語およびこれに連続する単語の品詞情報に基づいてそ
の接続の適否を判定する(ステップS230)。接続が
適合すると判定されたときには、接続が適合する単語に
更に連続する単語が検索されているか否かを調べ(ステ
ップS235)、更に連続する単語が検索されていると
きには、その単語を取り出して(ステップS240)、
更に接続するか否かをそれぞれの品詞情報に基づいて判
定する(ステップS245)。接続すると判定されたと
きには、ステップS235に戻ってステップS235な
いしS245の処理を繰り返す。ステップS235で、
更に接続する単語が検索されていないとき、または、ス
テップS245で接続しないと判定されたときには、接
続すると判定された単語までの各単語を連接して文節を
作成する(ステップS250)。ここで、文節は、図7
を用いて説明したように、1つの自立語からなるもので
あるが、2以上の自立語が連接する場合もあり、この場
合、2以上の連接する自立語が1つの自立語として働
く。
【0053】ステップS250で文節を作成した後、ま
たはステップS230で接続が適合しないと判定された
ときには、他に検索された自立語がないかを調べ(ステ
ップS255)、検索された自立語があるときには優先
順位の順に自立語を取り出してステップS225なしい
S255の処理を繰り返す。なお、他の自立語により文
節が作成されたときには、2以上の変換候補が作成され
ることになるが、図8の仮名漢字変換処理ルーチンのス
テップS140の表示処理で表示される優先順位は、自
立語の優先順となる。
【0054】確定単語接続文節処理ルーチン(ステップ
S110)は、具体的には、自立語候補作成部54,付
属語検索位置管理部66および文節データ作成部80と
して機能するCPU21が図10に例示する確定単語接
続文節作成処理ルーチンを実行することにより行なう。
確定単語接続文節作成処理処理ルーチンが実行される
と、CPU21は、まず品詞データ格納部112に格納
された確定品詞データから前回確定された変換候補の最
後尾の単語(確定単語)が自立語か否かを調べ(ステッ
プS300)、確定単語が自立語のときには確定品詞デ
ータから仮の自立語(ダミー自立語)を設定する(ステ
ップS305)。ここで、ダミー自立語は、文字はない
が品詞および品詞データを有する単語として設定される
ものである。
【0055】次に、設定されたダミー自立語が活用する
か否かを調べ(ステップS310)、ダミー自立語が活
用しないときには、自立語検索位置管理部56により管
理される自立語検索位置を変換対象文字列の先頭文字に
セットして(ステップS320)、この自立語検索位置
の文字を先頭文字として変換対象文字列から切り出し可
能な自立語を自立語辞書58から検索する(ステップS
325)。そして、変換対象文字列の先頭文字および変
換対象文字列のうち検索された自立語の次の文字を付属
語検索位置にセットし(ステップS330)、セットさ
れた文字を先頭文字として切り出し可能な付属語を付属
語辞書68から検索する(ステップS340)。ステッ
プS310でダミー自立語が活用すると判定されたとき
には、確定単語には活用語尾が接続すると判断して、付
属語検索位置管理部66により管理される付属語検索位
置を変換対象文字列の先頭文字にセットし(ステップS
335)、この付属語検索位置の文字を先頭文字として
変換対象文字列から切り出し可能な付属語を付属語辞書
68から検索する(ステップS340)。
【0056】ステップS300で確定単語は自立語でな
いと判定されたときには、確定品詞データから仮の付属
語(ダミー付属語)を設定する(ステップS315)。
ここで、ダミー付属語は、前述のダミー自立語と同様に
文字はないが品詞および品詞データを有する単語として
設定されるものである。ダミー付属語が設定された後
は、前述したステップS320ないしS340の処理を
行なう。
【0057】こうして、自立語および付属語を検索する
と、ダミー単語(ダミー自立語またはダミー付属語)に
連続する単語として検索された自立語または付属語のう
ち優先順位の最優位の自立語または付属語を取り出し
(ステップS350)、ダミー自立語と取り出した単語
の品詞情報に基づいてその接続の適否を判定する(ステ
ップS355)。ダミー単語との接続が適合すると判定
されたときには、この単語に更に連続する単語が検索さ
れているか否かを調べ(ステップS360)、更に連続
する単語が検索されているときには、その単語を取り出
して(ステップS365)、更に接続するか否かをそれ
ぞれの品詞情報に基づいて判定する(ステップS37
0)。接続すると判定されたときには、ステップS36
0に戻ってステップS360ないしS370の処理を繰
り返す。ステップS360で、更に接続する単語が検索
されていないとき、または、ステップS370で接続し
ないと判定されたときには、接続が適合すると判定され
た単語までの各単語をダミー単語に連接させて文節を作
成する(ステップS375)。ここで、作成される文節
は、ダミー単語が実体(文字)のないものであるから、
接続が適合すると判定された単語のみを連接させたもの
となる。
【0058】ステップS375で文節を作成した後、ま
たはステップS355で接続が適合しないと判定された
ときには、他にダミー単語に連続する単語が検索されて
いないかを調べ(ステップS255)、検索された単語
があるときには優先順位の順に単語を取り出してステッ
プS355なしいS380の処理を繰り返す。
【0059】図8の仮名漢字変換処理ルーチンのステッ
プS130の分かち書き処理は、変換対象文字列に対応
する変換候補が接続検定処理(ステップS110)で作
成された2以上の文節の組み合わせからなり、かつ、そ
の組み合わせが複数あり得るときに文節分かち書き部1
02として機能するCPU21により行なわれる処理
で、自立語=2、付属語=0のコストを持つものとして
変換対象文字列に対応する各変換候補(文節の組み合わ
せ)のコスト計算を行ない、そのコストが最小の変換候
補を第1候補とする処理である。
【0060】ステップS140の表示処理は、変換制御
部42および文字列出力部44として機能するCPU2
1およびCRTC27が、分かち書き処理(ステップS
130)が実行されたときには、コストが最小の第1候
補の変換候補をCRT26に表示し、分かち書き処理が
実行されなかったときには、接続検定処理(ステップS
110)により接続が適合すると判定され作成された文
節のうち優先順位の最優位のものを第1候補としてCR
T26に表示する処理である。
【0061】ステップS160の次候補処理は、変換制
御部42および文字列出力部44として機能するCPU
21およびCRTC27が、分かち書き処理(ステップ
S130)が実行されたときには、コスト計算が次に小
さい変換候補をCRT26に表示し、分かち書き処理が
実行されなかったときには、接続検定処理(ステップS
110)により接続が適合すると判定され作成された文
節のうち次の優先順位のものをCRT26に表示する処
理である。
【0062】ステップS170の確定処理は、操作者に
より明示の確定操作、例えば、キーボード24に確定処
理を実行する機能キーとして割り当てられたキーが操作
されたときに行なわれる処理であり、変換制御部42お
よび確定処理部110として機能するCPU21が図1
1に例示する確定処理ルーチンを実行することにより行
なう。このルーチンが実行されると、CPU21は、ま
ず、確定した変換候補の最後尾の単語が、句読点か、独
立後か、あるいは感動詞であるかを調べ(ステップS4
00)、これら以外のものであれば、この最後尾の単語
の品詞データを確定品詞データとして品詞データ格納部
112に格納し(ステップS410)、最後尾の単語が
句読点等に該当するときには、品詞データ格納部112
に格納されている確定品詞データを消去する(ステップ
S420)。
【0063】そして、確定した変換候補を出力し(ステ
ップS430)、品詞データ格納部112以外の各部に
仮名漢字変換に伴って一時的に格納したデータを消去し
て(ステップS440)、本ルーチンを終了する。な
お、仮名漢字変換を一つのアプリケーション(インプッ
トメソッド)が行なうものとした場合には、ステップS
430の確定した変換候補の出力は、変換候補のアプリ
ケーションへの引き渡しとなる。また、品詞データ格納
部112以外の各部のデータを消去するのは、次の仮名
漢字変換処理に備えるためである。
【0064】次に、こうした仮名漢字変換の処理を具体
例を用いて説明する。いま、「協会から」という変換を
得たいときに、「きょうかい」と入力して一旦変換し、
表示された変換候補から「協会」を選択して確定した後
に、「から」を入力して変換する場合を考える。
【0065】変換対象文字列として「から」が入力され
変換の指示がなされたときには、品詞データ格納部11
2には確定品詞データとして「協会」の品詞データ、す
なわち単語の品詞としての「名詞」や接続可能な直後の
単語の品詞としての「格助詞」などのデータが格納され
ているから、文節作成処理としては、図10の確定単語
連続文節作成処理ルーチンが実行され、確定単語は自立
語であると判断されてダミー自立語が設定され(ステッ
プS300,S310)、自立語検索位置が変換対象文
字列の先頭文字に設定されて自立語の検索が行なわれる
(ステップS320,S325)。ここで、検索される
自立語としては、名詞の「殻」や「空」,「唐」等であ
る。次に、付属語検索位置が変換対象文字列の先頭文字
に設定されて付属語の検索が行なわれる(ステップS3
30,S340)。検索される付属語としては、例え
ば、終助詞の「か」や副詞の「か」,格助詞の「か
ら」,接続助詞の「から」等である。
【0066】そして、ダミー単語(ダミー自立語)に連
続する単語のうち優先順位の最優位の単語が取り出され
てダミー単語との接続が検定される。ここでは、ダミー
単語が接続可能な直後の単語の品詞が「格助詞」であ
り、検索された自立語との接続も品詞情報からあり得な
いから、格助詞の「から」のみが接続が適合するとして
この付属語の「から」のみからなる文節を作成する(ス
テップS375)。この結果、図8の仮名漢字変換処理
ルーチンのステップS140の表示処理では、格助詞の
「から」が変換候補として表示され、自立語の「殻」や
「空」,「唐」等や他の付属語の終助詞の「か」や副詞
の「か」,接続助詞の「から」等は表示されない。
【0067】次に確定された変換候補の最後尾の単語が
付属語の場合、例えば、「協会からは」と変換したいと
きに、「協会から」まで変換し確定した後に「は」を入
力して変換する場合を考える。この場合、図10の確定
単語接続文節処理ルーチンでは、ステップS300で確
定単語が付属語と判定されてダミー付属語が設定され
(ステップS315)、自立語検索位置を変換対象文字
列の先頭文字に設定して自立語が検索されると共に(ス
テップS320,S325)、付属語検索位置を変換対
象文字列の先頭文字および検索された自立語の次の文字
に設定して付属語が検索される(ステップS330,S
340)。そして、設定されたダミー付属語とこれに連
続する単語として検索された自立語または付属語との接
続の適否が判定される(ステップS355)。したがっ
て、仮名文字列「は」の入力に対して、自立語の「葉」
や「歯」「刃」等が検索されると共に付属語の系助詞の
「は」も検索され、ダミー付属語が格助詞(「から」の
品詞)であることから、その接続が適合する単語として
係助詞の「は」が判定され文節が作成される(ステップ
S375)。
【0068】以上説明した実施例の仮名漢字変換装置に
よれば、確定された変換候補の最後尾の単語の品詞情報
を品詞データ格納部112に格納し、変換対象として入
力された仮名文字列との接続の適否を判定するから、確
定された変換候補の最後尾の単語に接続可能な変換候補
を表示することができる。したがって、自立語と付属語
とからなる文節のうち自立語部分の仮名文字列を変換対
象文字列として入力し変換して確定した後に付属語部分
の仮名文字列を変換対象文字列を入力して変換しても、
付属語部分の変換対象文字列に対して自立語の変換候補
が表示されることなく、正しく付属語の変換候補を表示
することができる。
【0069】なお、実施例の仮名漢字変換装置では、ダ
ミー単語は、文字はないが品詞データを有するものとし
て設定したが、前回確定した変換候補の最後尾の単語の
文字をも格納し、文字を有するものとして設定するもの
としてもよい。この場合、ステップS140の表示処理
やステップS170の確定処理では、作成された文節か
らダミー単語を削除して付属語のみにする処理を行なう
必要がある。
【0070】実施例の仮名漢字変換装置では、入力され
た仮名文字列に対応する変換候補が確定されたときに確
定された変換候補の最後尾の単語の品詞データを品詞デ
ータ格納部112に格納するものとしたが、見出しの文
字列に対して関連付けられた単語をその品詞データと共
に記憶する連想変換辞書を備え、入力された文字列に対
してこの連想変換辞書を参照して変換され確定された変
換候補の最後尾の単語の品詞データを品詞データ格納部
112に格納するものとしてもよい。なお、こうした連
想変換は、図8のステップS160の次候補処理に代え
て行なうものとすればよい。以下にこの場合の処理につ
いて具体例を挙げて説明する。
【0071】いま、「うつくしい」という仮名文字列を
入力して変換し第1候補として「美しい」が表示された
ときに、この連想変換を行なって「秀麗」を選択し確定
した場合を考える。この場合、品詞データ格納部112
には、「秀麗」の品詞データ、すなわち品詞として「形
容動詞」を含むデータが格納されるから、この直後に
「なよそおい」を変換対象文字列として入力して変換す
れば、図10の確定単語連続文節作成処理ルーチンで
は、確定単語が自立語であるからダミー自立語がセット
され(ステップS300,S305)、さらにダミー自
立語が形容動詞であるから活用すると判断される(ステ
ップS310)。したがって、付属語検索位置が変換対
象文字列の先頭文字にセットされて付属語が検索され
(ステップS335,S330)、「秀麗」の品詞デー
タを有するダミー自立語と、検索される付属語の活用語
尾「な」との接続の適否が判定されることになり、「な
装い」と正しく変換される。なお、この場合、連想変換
される前の「美しい」は形容詞であるがこの品詞データ
が品詞データ格納部112に格納されず、連想変換され
た「秀麗」の品詞データが格納されるから、実際の仮名
文字入力の「うつくしい」「なよそおい」に対して、前
述したように「秀麗」「な装い」に変換される。
【0072】実施例の仮名漢字変換装置では、変換候補
を確定した後に、変換対象文字列を入力し変換する際
に、品詞データ格納部112に格納された確定品詞デー
タ(確定した変換候補の最後尾の単語の品詞データ)に
基づいて変換対象文字列から自立語および付属語を検索
する際の検索位置を設定し、確定品詞データから設定さ
れるダミー単語(ダミー自立語またはダミー付属語)と
検索された自立語または付属語との接続の適否を判定し
たが、入力された変換対象文字列の先頭文字から一部の
変換候補について確定したときに、確定された一部の変
換候補の最後尾の単語の品詞データを確定品詞データと
して品詞データ格納部112に格納すると共に、変換対
象文字列の確定されていない変換候補に対応する文字列
に対して、格納された確定品詞データに基づいて自立語
または付属語の検索位置を設定し、確定された一部の変
換候補の最後尾の単語の品詞データから設定されるダミ
ー単語と検索された自立語または付属語との接続の適否
を判定するものとしてもよい。すなわち、変換対象文字
列の先頭文字から一部の変換候補について確定したとき
に、確定された一部の変換候補の最後尾の単語の品詞デ
ータを確定品詞データとして品詞データ格納部112に
格納すると共に、変換対象文字列の確定されていない変
換候補に対応する文字列を新たに入力された変換対象文
字列とみなして図10の確定単語接続文節作成処理ルー
チンを動作させるのである。
【0073】例えば、変換対象文字列として「しゅうれ
いなよそおい」を入力し仮名漢字変換する際に、変換操
作の途中で文節を「しゅうれい」「なよそおい」に区切
り、文節「しゅうれい」に対応する変換候補として「秀
麗」を選択して確定したときに、確定された「秀麗」の
品詞データを確定品詞データとして品詞データ格納部1
12に格納すると共に、変換対象文字列のうち確定され
ていない「なよそおい」が新たに入力された変換対象文
字列とみなし、図10の確定単語接続文節作成処理ルー
チンを実行するのである。
【0074】実施例の仮名漢字変換装置では、ダミー単
語に自立語が接続する文節と、ダミー単語に付属語が接
続する文節とが作成されたときに、いずれを優先して表
示するかについて設定しないものとしたが、ダミー単語
の品詞情報に基づいていずれを優先して表示するかの設
定を行なうものとしてもよい。例えば、ダミー単語の品
詞が自立語(ダミー自立語)のときには、ダミー単語に
付属語が接続する文節をダミー単語に自立語が接続する
文節より優先して取り扱うものとし、ダミー単語の品詞
が付属語(ダミー付属語)のときには、その逆に、ダミ
ー単語に自立語が接続する文節をダミー単語に付属語が
接続する文節より優先して取り扱うものとする場合など
である。具体的には、図10の確定単語接続文節作成処
理ルーチンのステップS340の付属語を検索した後
に、ダミー単語の品詞情報に基づいて自立語と付属語と
の間の優先順位の設定を行ない、設定した順にステップ
S350のダミー単語に連続する単語の取り出し、更
に、ステップS375で文節の作成された順を文節の優
先順位とすればよい。こうすれば、ダミー単語の品詞に
応じて作成される文節の優先順位が定められるから、よ
り確からしい変換候補を第1候補としてCRT26に表
示することができる。
【0075】実施例の仮名漢字変換装置では、ダミー自
立語が活用する語のときには、変換対象文字列の先頭文
字からの付属語の検索を行なうのみで、自立語の検索は
行なわないものとしたが、変換対象文字列の先頭文字か
らの付属語の検索に加えて自立語の検索をも行なうもの
としてもよい。この場合、ダミー自立語に付属語が接続
する文節をダミー自立語に自立語が接続する文節より優
先して取り扱うものとすれば、ダミー自立語に付属語が
接続する文節を第1候補として表示することができ、ダ
ミー自立語に自立語が接続する場合をも考慮することが
できる。
【0076】実施例の仮名漢字変換装置では、前述した
ように、ハードウェアにより実現されている部分とソフ
トウェアにより実現されている部分とを含み、そのソフ
トウェアのうちハードウェアに依存しない部分について
はアプリケーションソフトとしてハードディスク32に
記憶しており、必要に応じて読み込まれるが、記憶する
媒体は、ハードディスク32に限られず、フレキシブル
ディスクや光磁気ディスク,CDROM等、コンピュー
タに接続可能な入出力機器に使用可能な記憶媒体であれ
ばいかなる記憶媒体であってもかまわない。この場合、
記憶媒体に記憶されるアプリケーションソフトを、コン
ピュータが直接記憶媒体(CDROMやフレキシブルデ
ィスク等)から読み込むことができず、所定の方法によ
りハードディスク32にインストールした後にのみ読み
込むことができるものとしてもよい。
【0077】以上、本発明の実施の形態について説明し
たが、本発明はこうした実施の形態に何等限定されるも
のではなく、本発明の要旨を逸脱しない範囲内におい
て、種々なる形態で実施し得ることは勿論である。
【図面の簡単な説明】
【図1】本発明の一実施例である仮名漢字変換装置が実
現されるハードウェアを示すブロック図である。
【図2】実施例としての仮名漢字変換装置における仮名
漢字変換機能の実現形態を示す機能ブロック図である。
【図3】自立語辞書58の内部構成を示す説明図であ
る。
【図4】代表表記領域の管理の様子を示す説明図であ
る。
【図5】単語データの構成を示す説明図である。
【図6】単語情報の詳細を各セパレータとともに示す説
明図である。
【図7】文節の構造を示す構造図である。
【図8】本発明の実施例で実行される仮名漢字変換処理
ルーチンを説明するフローチャートである。
【図9】自立語候補作成部54,付属語候補作成部64
および文節データ作成部80において実行される通常文
節作成処理ルーチンを例示するフローチャートである。
【図10】自立語候補作成部54,付属語候補作成部6
4および文節データ作成部80において実行される確定
単語接続文節作成処理ルーチンを例示するフローチャー
トである。
【図11】変換制御部42および確定処理部110にお
いて実行される確定処理ルーチンを例示するフローチャ
ートである。
【符号の説明】
21…CPU 22…ROM 23…RAM 24…キーボード 25…キーボードインターフェース 26…CRT 27…CRTC 28…プリンタ 29…プリンタインターフェース 31…バス 32…ハードディスク 40…文字入力部 42…変換制御部 44…文字列出力部 44…変換後文字列出力部 44…変換制御部 50…文字列入力部 52…文字格納部 54…自立語候補作成部 56…自立語検索位置管理部 58…自立語辞書 58…単語辞書 64…付属語候補作成部 66…付属語検索位置管理部 68…付属語辞書 72…自立語学習部 74…補助語学習部 76…接辞学習部 78…文字変換学習部 80…文節データ作成部 82…接続検定部 84…接続検定テーブル 100…文節データ格納部 102…文節分かち書き部 108…変換文字列出力部 110…確定処理部 112…品詞データ格納部

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 入力された仮名文字列の先頭文字から始
    まる単語および該単語に連続する文字から始まる単語を
    辞書を参照して検索する単語検索手段と、 該連続して検索された単語の接続の適否を判定し、単語
    の接続が適合する漢字混じり文字列を変換候補として作
    成する変換候補作成手段と、 該作成された変換候補を表示する表示手段と、 前記表示手段により表示された変換候補について確定の
    指示がなされたとき、該変換候補を前記入力された仮名
    文字列に対応する漢字混じり文字列として確定する確定
    手段とを備える仮名漢字変換装置において、 前記確定手段による変換候補の確定がされたとき、該確
    定された変換候補に含まれる単語のうち少なくとも最後
    尾の単語の品詞情報を記憶する品詞情報記憶手段を備
    え、 前記変換候補作成手段は、前記品詞情報記憶手段により
    記憶された品詞情報に基づいて、前記確定された変換候
    補の最後尾の単語と前記単語検索手段により前記入力さ
    れた仮名文字列の先頭文字から始まる単語との接続の適
    否を判定する手段であることを特徴とする仮名漢字変換
    装置。
  2. 【請求項2】 請求項1記載の仮名漢字変換装置であっ
    て、 前記品詞情報記憶手段は、前記確定された変換候補の最
    後尾の単語が付属語を接続可能な単語のとき、該最後尾
    の単語の品詞情報を記憶する手段であり、 前記変換候補作成手段は、前記品詞情報記憶手段により
    前記確定された変換候補の最後尾の単語の品詞情報が記
    憶されたとき、該最後尾の単語と前記単語検索手段によ
    り前記入力された仮名文字列の先頭文字から始まる単語
    との接続の適否を判定する手段である仮名漢字変換装
    置。
  3. 【請求項3】 請求項1記載の仮名漢字変換装置であっ
    て、 前記変換候補作成手段により前記確定された変換候補の
    最後尾の単語と前記単語検索手段により前記入力された
    仮名文字列の先頭文字から始まる単語との接続が適合す
    ると判定されて作成された変換候補が複数あるとき、前
    記品詞情報記憶手段により記憶された該最後尾の単語の
    品詞情報と、該最後尾の単語に接続する単語の品詞情報
    とに基づいて前記複数の変換候補の優先順位を設定する
    優先順位設定手段を備え、 前記表示手段は、前記優先順位設定手段により設定され
    た優先順位の順に前記作成された変換候補を表示する手
    段である仮名漢字変換装置。
  4. 【請求項4】 入力された仮名文字列の先頭文字から切
    り出し可能な文字列に対して自立語辞書を参照して自立
    語を検索する自立語検索手段と、 該検索された自立語に連続する文字から切り出し可能な
    文字列または該自立語に連続するとして検索された付属
    語に連続する文字から切り出し可能な文字列に対して付
    属語辞書を参照して付属語を検索する付属語検索手段
    と、 前記自立語検索手段により検索された自立語と前記付属
    語検索手段により検索された付属語との接続の適否,前
    記自立語検索手段により検索された自立語間の接続の適
    否および前記付属語検索手段により検索された連続する
    付属語間の接続の適否を判定し、接続の適合する漢字混
    じり文字列を変換候補として作成する変換候補作成手段
    と、 該作成された変換候補を表示する表示手段と、 前記表示手段により表示された変換候補について確定の
    指示がなされたとき、該変換候補を前記入力された仮名
    文字列に対応する漢字混じり文字列として確定する確定
    手段とを備える仮名漢字変換装置において、 前記確定手段による変換候補の確定がされたとき、該確
    定された変換候補に含まれる単語のうち少なくとも最後
    尾の単語の品詞情報を記憶する品詞情報記憶手段を備
    え、 前記付属語検索手段は、前記品詞情報記憶手段により記
    憶された品詞情報が付属語の接続可能な単語に関する情
    報のとき、前記入力された仮名文字列の先頭文字から切
    り出し可能な文字列に対して前記付属語辞書を参照して
    付属語を検索する手段であり、 前記変換候補作成手段は、前記品詞情報記憶手段により
    記憶された品詞情報に基づいて前記確定された変換候補
    の最後尾の単語と前記自立語検索手段により検索された
    自立語との接続の適否を判定すると共に、前記品詞情報
    記憶手段により記憶された品詞情報に基づいて前記付属
    語検索手段が前記入力された仮名文字列の先頭文字から
    切り出される付属語を検索したときには、該品詞情報に
    基づいて前記確定された変換候補の最後尾の単語と該付
    属語検索手段により検索された付属語との接続の適否を
    判定する手段であることを特徴とする仮名漢字変換装
    置。
  5. 【請求項5】 請求項4記載の仮名漢字変換装置であっ
    て、 前記自立語検索手段は、前記品詞情報記憶手段により記
    憶された品詞情報が自立語の情報のとき、前記入力され
    た仮名文字列の先頭文字から切り出し可能な文字列に対
    して前記自立語辞書を参照する検索を行なわない手段で
    あり、 前記付属語検索手段は、前記品詞情報記憶手段により記
    憶された品詞情報が自立語の情報のとき、前記入力され
    た仮名文字列の先頭文字から切り出し可能な文字列に対
    して前記付属語辞書を参照して付属語を検索する手段で
    ある仮名漢字変換装置。
  6. 【請求項6】 請求項4記載の仮名漢字変換装置であっ
    て、 前記品詞情報記憶手段は、前記確定された変換候補の最
    後尾の単語が付属語を接続可能な単語のとき、該最後尾
    の単語の品詞情報を記憶する手段であり、 前記付属語検索手段は、前記品詞情報記憶手段により前
    記確定された変換候補の最後尾の単語の品詞情報が記憶
    されたとき、前記入力された仮名文字列の先頭文字から
    切り出し可能な文字列に対して前記付属語辞書を参照し
    て付属語を検索する手段である仮名漢字変換装置。
  7. 【請求項7】 請求項4記載の仮名漢字変換装置であっ
    て、 前記変換候補作成手段により、前記確定された変換候補
    の最後尾の単語と、前記自立語検索手段により検索され
    た自立語または前記付属語検索手段により検索された付
    属語との接続が適合すると判定されて作成された変換候
    補が複数あるとき、前記品詞情報記憶手段により記憶さ
    れた該最後尾の単語の品詞情報と、該最後の単語に接続
    する自立語または付属語の品詞情報とに基づいて、前記
    複数の変換候補の優先順位を設定する優先順位設定手段
    を備え、 前記表示手段は、前記優先順位設定手段により設定され
    た優先順位の順に前記作成された変換候補を表示する手
    段である仮名漢字変換装置。
  8. 【請求項8】 前記優先順位設定手段は、前記品詞情報
    記憶手段により記憶された前記確定された変換候補の最
    後尾の単語の品詞情報が自立語のとき、該最後尾の単語
    に付属語が接続する変換候補を該最後尾の単語に自立語
    が接続する変換候補より優先順位を高く設定する手段で
    ある請求項7記載の仮名漢字変換装置。
  9. 【請求項9】 前記優先順位設定手段は、前記品詞情報
    記憶手段により記憶された前記確定された変換候補の最
    後尾の単語の品詞情報が活用する自立語のとき、該最後
    尾の単語に付属語が接続する変換候補を該最後尾の単語
    に自立語が接続する変換候補より優先順位を高く設定す
    る手段である請求項7記載の仮名漢字変換装置。
  10. 【請求項10】 入力された仮名文字列を、辞書を参照
    して漢字混じり文字列に変換する仮名漢字変換方法であ
    って、 入力された仮名文字列の先頭文字から切り出し可能な文
    字列からなる語を見出しとする単語を前記辞書を参照し
    て検索し、 該検索された単語が前記入力された仮名文字列が入力さ
    れる直前に確定された変換候補の最後尾の単語に接続す
    るか否かを、該検索された単語の品詞情報と該最後尾の
    単語の品詞情報とに基づいて判定し、 接続が適合するとの判定がなされた単語を優先順位の高
    い変換候補として表示する仮名漢字変換方法。
JP7354236A 1995-12-28 1995-12-28 仮名漢字変換装置および仮名漢字変換方法 Pending JPH09185613A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7354236A JPH09185613A (ja) 1995-12-28 1995-12-28 仮名漢字変換装置および仮名漢字変換方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7354236A JPH09185613A (ja) 1995-12-28 1995-12-28 仮名漢字変換装置および仮名漢字変換方法

Publications (1)

Publication Number Publication Date
JPH09185613A true JPH09185613A (ja) 1997-07-15

Family

ID=18436201

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7354236A Pending JPH09185613A (ja) 1995-12-28 1995-12-28 仮名漢字変換装置および仮名漢字変換方法

Country Status (1)

Country Link
JP (1) JPH09185613A (ja)

Similar Documents

Publication Publication Date Title
JP3189186B2 (ja) パターンに基づく翻訳装置
EP0971294A2 (en) Method and apparatus for automated search and retrieval processing
JP2002215617A (ja) 品詞タグ付けをする方法
JP2013117978A (ja) タイピング効率向上のためのタイピング候補の生成方法
JPH0724055B2 (ja) 単語分割処理方法
JPS63231674A (ja) コンピュータによる形態論的テキスト解析方法
JP2002117027A (ja) 感情情報抽出方法および感情情報抽出プログラムの記録媒体
JPH09185613A (ja) 仮名漢字変換装置および仮名漢字変換方法
JP3873305B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JPS6210763A (ja) 仮名漢字変換処理装置
JP2004265440A (ja) 未知語登録装置および方法並びに記録媒体
JP3581237B2 (ja) 未知語登録装置および方法並びに記録媒体
JPS59100941A (ja) 仮名漢字変換装置
JPS5998236A (ja) 日本文入力装置
JP2862236B2 (ja) 文字処理装置
JPS60207948A (ja) カナ漢字変換処理装置
JP3873299B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JPH02136959A (ja) 日本文訂正候補抽出装置
JPH0816910B2 (ja) 言語解析装置
JPH08241315A (ja) 文書処理装置の単語登録機構
JPS6210762A (ja) 仮名漢字変換方式
JPH04365166A (ja) 文章検査装置
JPS60112175A (ja) 仮名漢字変換装置における略称語変換方式
JPH0131230B2 (ja)
JPH0345423B2 (ja)

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20041015

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060221