JPS61282964A

JPS61282964A - 仮名漢字変換方式

Info

Publication number: JPS61282964A
Application number: JP60124683A
Authority: JP
Inventors: Shunichi Fukushima; 俊一福島
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 1985-06-07
Filing date: 1985-06-07
Publication date: 1986-12-13

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、ワードプロセッサ等における入力した仮名文
字列を漢字仮名混じり表記に変換して出力する仮名漢字
変換方式に関する。

（従来技術とその問題点）従来のワードプロセッサ等における仮名漢字変換方式は
、入力した仮名文字列の先頭から後方へ順次、単語辞書
を検索しながら単語、文節等を抽出してゆくものである
。単語辞書の見出しも読み仮名の並びそのままになって
いる。また、読み仮名を逆順に並べたものを見出しとす
る単語辞書を用いた方式が、提案されている。［例えば
、［仮名漢字変換のための文法解析」（大河内、藤崎、
諸橋、情報処理学会計算言語学研究会２５Ａ、　１９８
１）］これは予め文節の単位で与えられた仮名文字列の
末尾から付属語を、先頭から自立語を各々検索するもの
であり、複数文節にまたがった入力仮名文字列の場合、
文節の先頭位置あるいは末尾位置が定められないため、
適用ができない。

日本語文の場合、文末決定性という性質があり、一般に
、文の意味・構造の中心となる述語が文の末尾に置かれ
る。そこで、入力した仮名文字列の先頭から後方へ順次
文節を抽出してゆく場合、解析の途中では、係り受は関
係が曖昧なまま、多くの文節候補を可能性として残して
おかねばならないという欠点を有する。例えば、次のよ
うな仮名文字列が入力されたとする。

キネンノコウカヲミチデヒロッタ仮名文字列の先頭から文節候補を抽出してゆくと、「・
・・ミチデ」の位置までで、次のような文節候最後の「
ヒロック」を解析し、「拾った」が得られた時点で、「
拾った」との係り受は関係から、「硬貨を」（［拾った
］対象物として）と「道で」（「拾った」場所として）
が文節候補の中から絞られ、さらに、「硬貨」に対する
係り受は関係から、「記念のＪ（ｒ硬貨」の属性として
）が文節候補の中から絞られる。そして、最終的な変換
結果は次のようになる。

記念の硬貨を道で拾った最終的に得られる結果は正しくとも、途中の段階におい
て多数の文節候補を残しておくために、処理速度やメモ
リ等について非常に効率が悪くなる。

（発明の目的）本発明の目的は、従来の欠点を除去し、日本語文の特性
を生かした効率よい仮名漢字変換を可能とする方式を提
供することである。

（発明の構成）本発明は、入力した仮名文字列を漢字仮名混じり表記に
変換して出力する仮名漢字変換方式において、入力仮名
文字列を記憶する仮名文字列記憶手段、単語の読み仮名
を逆順に並べた見出しと漢字仮名混じり表記及び品詞を
収納した単語辞書、前記入力仮名文字列において文節の
末尾になる可能性のある文字位置の値を記憶する文節末
尾可能位置記憶手段、前記文節末尾可能位置記憶手段に
記憶された前記文節の末尾になる可能性のある文字位置
を末尾とする文節を前記単語辞書を検索することにより
抽出し、抽出された文節の先頭文字位置の直前の文字位
置の値を前記文節末尾可能位置記憶手段へ書き込む文節
抽出手段、前記抽出された文節を記憶する文節記憶手段
、前記文節記憶手段に記憶された前記抽出された文節を
もとに漢字仮名混じり表記を出力する表記出力手段とを
備え、前記入力仮名文字列の末尾から前方へ文節を抽出
することを特徴とした仮名漢字変換方式である。

（実施例）図面を用いて、本発明の構成を詳細に説明する。第１図
は、本発明の仮名漢字変換方式の一実施例である。第１
図において、１は仮名人力手段であり、入力した仮名文
字を仮名文字列記憶手段２に書き込む。キーボード等を
用いて実現される。

２は仮名文字列記憶手段であり、入力された仮名文字列
を記憶する。ＩＣメモリ、磁気ディスク装置、磁気テー
プ装置等を用いて実現される。

３は単語辞書であり、単語の読み仮名を逆順に並べたも
のを見出しとして漢字仮名混じり表記及び品詞を収納し
たものである。第２図は単語辞書３の記憶例を示す概念
図である。第２図において、３０は見出しであり、単語
の読み仮名を逆順に並べたものである。３１は単語の漢
字仮名混じり表記、３２は単語の品詞情報である。

第１図において、４は文節末尾可能位置記憶手段であり
、仮名文字列記憶手段２に記憶された入力仮名文字列に
おいて文節の末尾になる可能性のある文字位置の値を記
憶する。ＩＣメモリ、磁気ディスク装置、磁気テープ装
置等を用いて実現される。文節末尾可能位置記憶手段４
の内容は、初期値は入力仮名文字列の末尾位置であるが
、文節抽出手段５が動作すると、文節抽出手段５が抽出
した文節の先頭文字位置の直前の文字位置が新たに文節
末尾可能位置記憶手段４に書き込まれる。

５°は文節抽出手段であり、文節末尾可能位置記憶手段
４に記憶された文節の末尾になる可能性のある文字位置
を末尾とする文節を抽出し、抽出された文節の先頭文字
位置の直前の文字位置を文節末尾可能位置記憶手段４へ
書き込み、抽出された文節を文節記憶手段６へ書き込む
。文節の抽出は、文節の末尾になる可能性のある文字位
置から逆向きに単語辞書３を検索し、検索された単語の
直前の文字位置からさらに単語辞書３を検索することを
繰り返す。そして、検索された単語について品詞間の接
続可否を調べ、接続可能な単語をつないでゆき、自立語
あるいは接頭語を先頭とする単語列を文節として抽出す
る。

６は文節記憶手段であり、文節抽出手段５によって抽出
された文節に関する情報（文節を構成する単語の系列、
及び各単語の表記９品詞等）を記憶する。

ＩＣメモリ、磁気ディスク装置、磁気テープ装置等を用
いて実現される。

７は表記出力手段であり、文節記憶手段６に記憶された
文節をもとに漢字仮名混じり表記を出力する。漢字仮名
混じり表記に複数の可能性がある場合には、複数の可能
性について評価を行い最も確からしいものを出力する必
要があるが、この評価方法は文節数最小法、最長一致法
、あるいは係り受は関係を考慮する方法等、様々な方法
が知られている。本発明ではこの評価方法については限
定しない。

８は表示手段であり、表記出力手段７の出力である漢字
仮名混じり表記を表示する。ＣＲＴディスプレイ、漢字
プリンタ等を用いて実現される。

９は制御方法であり、１〜９の各手段の動作を第３図の
ように制御する。次に、第３図に従って、この実施例の
動作を例を用いて説明する。

［５ＴＥＰ１］仮名人力手段１により仮名文字列が入力される。

ここでは次のような仮名文字列が入力され、仮名文字列
記憶手段２に記憶されたものとする。

キョウハコクデンデキタこのとき、文節末尾可能位置記憶手段４には、文字位置
の値″１１”のみが記憶されている（文字位置の値は入
力された仮名文字列の先頭から数えた文字数で示す）。

［５ＴＥＰ２］文節抽出手段５は、文節末尾可能位置記憶手段４から前
屈文字位置の値９１１１！１を読み込み、この文字位置
を末尾とする文節を抽出する。文字位置の値”１１”で
示される位置から逆向きに単語辞書３を検索し、検索さ
れた単語間の接続検定を行うことにより、次のような自
立語までの単語系列が得られる。これらが文字位置の値
ｔｌｌｌｔ？で示される位置を末尾とする文節として抽
出されたことになる。

夕（完了の助動詞の［た」の終止形［たＪ）−−デキ（
動詞「出来る」の連用形「出来」）−出来た　′ り（完了の助動詞の「た」の終止形「た」）−−キ（動
詞「来る」の連用形「来Ｊ）−来たこれらは文節記憶手
段６へ書き込まれ、これらの文節の先頭位置の直前の文
字位置の値、すなわち、「出来た」に対する文字位置の
値″′８”、「来た」に対する文字位置の値″９”が、
文節末尾可能位置記憶手段４へ書き込まれる。

［５ＴＥＰ３］文節末尾可能位置記憶手段４には、まだ５ＴＥＰ２の処
理の対象となっていない文字位置として、文字位置の値
″９９′、ｔｔ８ｔ”が、残っているので、再び５ＴＥ
Ｐ２を行う。

［５ＴＥＰ２］文字位置の値ｎ９ｎで示される位置を末尾とする文節を
抽出し、次の文節を得る。

デ（格助詞「で」）−一一コクデン（名詞「国電」）−
国電で文節末尾可能位置記憶手段４へ、文字位置の値６４″が
書き込まれる。

［５ＴＥＰ３］文節末尾可能位置記憶手段４には、まだ５ＴＥＰ２の処
理の対象となっていない文字位置として、文字位置の値
“８′”、４′′が残っているので、再び５ＴＥＰ２を
行う。

［５ＴＥＰ２］文字位置の値″′８”で示される位置を末尾とする文節
を抽出し、次の文節を得る。

、コクデン（名詞「国電」）−国電文字位置の値″′４”は既に文節末尾可能位置記憶手段
４へ書き込まれている。

［５ＴＥＰ３］文節末尾可能位置記憶手段４には、まだ５ＴＥＰ２の処
理の対象となっていない文字位置として、文字位置の値
″４”が残っているので、再び５ＴＥＰ２を行う。

［５ＴＥＰ２］文字位置の値″″４″で示される位置を末尾とする文節
を抽出し、次の文節を得る。

ハ（係助詞「は」）−−キョウ（名詞「今日」）ハ（係
助詞「は」）−−キョウ（名詞「京」）これらの文節の
直前の文字位置は入力された仮名文字列の先頭を超える
ので、文節末尾可能位置記憶手段４への書き込みは行わ
ない。

［５ＴＥＰ３］文節末尾可能位置記憶手段４には、５ＴＥＰ２の処理の
対象となっていない文字位置の情報は残っていないので
、５ＴＥＰ４へ移る。このとき、文節記憶手段６には次
のような文節が記憶されていることになる。

今日は（名詞＋係助詞）京は　（名詞＋係助詞）国電で（名詞＋格助詞）国電　（名詞）出来た（動詞連用形＋助動詞終止形）来た（動詞連用形＋助動詞終止形）［５ＴＥＰ４］表記出力手段７により、文節記憶手段６に記憶された文
節が評価され、漢字仮名混じり表記が表示手段８へ出力
される。先頭から表記の長いものを優先する評価を行う
ならば、次のような表記が得られることになる。

今日は国電で来た（発明の効果２以上説明したように、本発明の仮名漢字変換方式では、
入力された仮名文字列の末尾から順次前方へ文節が抽出
されてゆくため、解析の途中で係り受は関係により文節
候補の絞り込みを行った場合、従来技術の説明で用いた
例で比べると、「拾った」が最初に抽出されるために、
その直前のｒ道で」と「未知で」は［拾った」との係り
受は関係により速やかに［道で」が選ばれ、それ以後も
曖昧なまま複数の文節候補を持つことなく「硬貨を」、
「記念の」が選ばれることになる。したがって、文末決
定性を持つ日本語文を効率良く解析することができる。

【図面の簡単な説明】

第１図は本発明の仮名漢字変換方式の一実施例の構成を
示すブロック図、第２図は単語辞書の例を示す図、第３
図は実施例の動作を示すフローチャートである。図にお
いて、１・・・仮名人力手段２・・・仮名文字列記憶手段３・・・単語辞書４・・・文節末尾可能位置記憶手段５・・・文節抽出手段６・・・文節記憶手段７・・・表記出力手段８・・・表示手段３０・・・単語辞書の見出し３１・・・単語の漢子仮名混じり表記３２・・・単語の品詞情報

Claims

【特許請求の範囲】

入力した仮名文字列を漢字仮名混じり表記に変換して出
力する仮名漢字変換方式において、入力仮名文字列を記
憶する仮名文字列記憶手段、単語の読み仮名を逆順に並
べた見出しと漢字仮名混じり表記及び品詞を収納した単
語辞書、前記入力仮名文字列において文節の末尾になる
可能性のある文字位置の値を記憶する文節末尾可能位置
記憶手段、前記文節末尾可能位置記憶手段に記憶された
前記文節の末尾になる可能性のある文字位置を末尾とす
る文節を前記単語辞書を検索することにより抽出し、抽
出された文節の先頭文字位置の直前の文字位置の値を前
記文節末尾可能位置記憶手段へ書き込む文節抽出手段、
前記抽出された文節を記憶する文節記憶手段、前記文節
記憶手段に記憶された前記抽出された文節をもとに漢字
仮名混じり表記を出力する表記出力手段とを備え、前記
入力仮名文字列の末尾から前方へ文節を抽出することを
特徴とした仮名漢字変換方式。