JPS61282964A - 仮名漢字変換方式 - Google Patents

仮名漢字変換方式

Info

Publication number
JPS61282964A
JPS61282964A JP60124683A JP12468385A JPS61282964A JP S61282964 A JPS61282964 A JP S61282964A JP 60124683 A JP60124683 A JP 60124683A JP 12468385 A JP12468385 A JP 12468385A JP S61282964 A JPS61282964 A JP S61282964A
Authority
JP
Japan
Prior art keywords
kana
clause
storage means
paragraph
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60124683A
Other languages
English (en)
Inventor
Shunichi Fukushima
俊一 福島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP60124683A priority Critical patent/JPS61282964A/ja
Publication of JPS61282964A publication Critical patent/JPS61282964A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、ワードプロセッサ等における入力した仮名文
字列を漢字仮名混じり表記に変換して出力する仮名漢字
変換方式に関する。
(従来技術とその問題点) 従来のワードプロセッサ等における仮名漢字変換方式は
、入力した仮名文字列の先頭から後方へ順次、単語辞書
を検索しながら単語、文節等を抽出してゆくものである
。単語辞書の見出しも読み仮名の並びそのままになって
いる。また、読み仮名を逆順に並べたものを見出しとす
る単語辞書を用いた方式が、提案されている。[例えば
、[仮名漢字変換のための文法解析」(大河内、藤崎、
諸橋、情報処理学会計算言語学研究会25A、 198
1)]これは予め文節の単位で与えられた仮名文字列の
末尾から付属語を、先頭から自立語を各々検索するもの
であり、複数文節にまたがった入力仮名文字列の場合、
文節の先頭位置あるいは末尾位置が定められないため、
適用ができない。
日本語文の場合、文末決定性という性質があり、一般に
、文の意味・構造の中心となる述語が文の末尾に置かれ
る。そこで、入力した仮名文字列の先頭から後方へ順次
文節を抽出してゆく場合、解析の途中では、係り受は関
係が曖昧なまま、多くの文節候補を可能性として残して
おかねばならないという欠点を有する。例えば、次のよ
うな仮名文字列が入力されたとする。
キネンノコウカヲミチデヒロッタ 仮名文字列の先頭から文節候補を抽出してゆくと、「・
・・ミチデ」の位置までで、次のような文節候最後の「
ヒロック」を解析し、「拾った」が得られた時点で、「
拾った」との係り受は関係から、「硬貨を」([拾った
]対象物として)と「道で」(「拾った」場所として)
が文節候補の中から絞られ、さらに、「硬貨」に対する
係り受は関係から、「記念のJ(r硬貨」の属性として
)が文節候補の中から絞られる。そして、最終的な変換
結果は次のようになる。
記念の硬貨を道で拾った 最終的に得られる結果は正しくとも、途中の段階におい
て多数の文節候補を残しておくために、処理速度やメモ
リ等について非常に効率が悪くなる。
(発明の目的) 本発明の目的は、従来の欠点を除去し、日本語文の特性
を生かした効率よい仮名漢字変換を可能とする方式を提
供することである。
(発明の構成) 本発明は、入力した仮名文字列を漢字仮名混じり表記に
変換して出力する仮名漢字変換方式において、入力仮名
文字列を記憶する仮名文字列記憶手段、単語の読み仮名
を逆順に並べた見出しと漢字仮名混じり表記及び品詞を
収納した単語辞書、前記入力仮名文字列において文節の
末尾になる可能性のある文字位置の値を記憶する文節末
尾可能位置記憶手段、前記文節末尾可能位置記憶手段に
記憶された前記文節の末尾になる可能性のある文字位置
を末尾とする文節を前記単語辞書を検索することにより
抽出し、抽出された文節の先頭文字位置の直前の文字位
置の値を前記文節末尾可能位置記憶手段へ書き込む文節
抽出手段、前記抽出された文節を記憶する文節記憶手段
、前記文節記憶手段に記憶された前記抽出された文節を
もとに漢字仮名混じり表記を出力する表記出力手段とを
備え、前記入力仮名文字列の末尾から前方へ文節を抽出
することを特徴とした仮名漢字変換方式である。
(実施例) 図面を用いて、本発明の構成を詳細に説明する。第1図
は、本発明の仮名漢字変換方式の一実施例である。第1
図において、1は仮名人力手段であり、入力した仮名文
字を仮名文字列記憶手段2に書き込む。キーボード等を
用いて実現される。
2は仮名文字列記憶手段であり、入力された仮名文字列
を記憶する。ICメモリ、磁気ディスク装置、磁気テー
プ装置等を用いて実現される。
3は単語辞書であり、単語の読み仮名を逆順に並べたも
のを見出しとして漢字仮名混じり表記及び品詞を収納し
たものである。第2図は単語辞書3の記憶例を示す概念
図である。第2図において、30は見出しであり、単語
の読み仮名を逆順に並べたものである。31は単語の漢
字仮名混じり表記、32は単語の品詞情報である。
第1図において、4は文節末尾可能位置記憶手段であり
、仮名文字列記憶手段2に記憶された入力仮名文字列に
おいて文節の末尾になる可能性のある文字位置の値を記
憶する。ICメモリ、磁気ディスク装置、磁気テープ装
置等を用いて実現される。文節末尾可能位置記憶手段4
の内容は、初期値は入力仮名文字列の末尾位置であるが
、文節抽出手段5が動作すると、文節抽出手段5が抽出
した文節の先頭文字位置の直前の文字位置が新たに文節
末尾可能位置記憶手段4に書き込まれる。
5°は文節抽出手段であり、文節末尾可能位置記憶手段
4に記憶された文節の末尾になる可能性のある文字位置
を末尾とする文節を抽出し、抽出された文節の先頭文字
位置の直前の文字位置を文節末尾可能位置記憶手段4へ
書き込み、抽出された文節を文節記憶手段6へ書き込む
。文節の抽出は、文節の末尾になる可能性のある文字位
置から逆向きに単語辞書3を検索し、検索された単語の
直前の文字位置からさらに単語辞書3を検索することを
繰り返す。そして、検索された単語について品詞間の接
続可否を調べ、接続可能な単語をつないでゆき、自立語
あるいは接頭語を先頭とする単語列を文節として抽出す
る。
6は文節記憶手段であり、文節抽出手段5によって抽出
された文節に関する情報(文節を構成する単語の系列、
及び各単語の表記9品詞等)を記憶する。
ICメモリ、磁気ディスク装置、磁気テープ装置等を用
いて実現される。
7は表記出力手段であり、文節記憶手段6に記憶された
文節をもとに漢字仮名混じり表記を出力する。漢字仮名
混じり表記に複数の可能性がある場合には、複数の可能
性について評価を行い最も確からしいものを出力する必
要があるが、この評価方法は文節数最小法、最長一致法
、あるいは係り受は関係を考慮する方法等、様々な方法
が知られている。本発明ではこの評価方法については限
定しない。
8は表示手段であり、表記出力手段7の出力である漢字
仮名混じり表記を表示する。CRTディスプレイ、漢字
プリンタ等を用いて実現される。
9は制御方法であり、1〜9の各手段の動作を第3図の
ように制御する。次に、第3図に従って、この実施例の
動作を例を用いて説明する。
[5TEP1] 仮名人力手段1により仮名文字列が入力される。
ここでは次のような仮名文字列が入力され、仮名文字列
記憶手段2に記憶されたものとする。
キョウハコクデンデキタ このとき、文節末尾可能位置記憶手段4には、文字位置
の値″11”のみが記憶されている(文字位置の値は入
力された仮名文字列の先頭から数えた文字数で示す)。
[5TEP2] 文節抽出手段5は、文節末尾可能位置記憶手段4から前
屈文字位置の値9111!1を読み込み、この文字位置
を末尾とする文節を抽出する。文字位置の値”11”で
示される位置から逆向きに単語辞書3を検索し、検索さ
れた単語間の接続検定を行うことにより、次のような自
立語までの単語系列が得られる。これらが文字位置の値
tlllt?で示される位置を末尾とする文節として抽
出されたことになる。
夕(完了の助動詞の[た」の終止形[たJ)−−デキ(
動詞「出来る」の連用形「出来」)−出来た ′ り(完了の助動詞の「た」の終止形「た」)−−キ(動
詞「来る」の連用形「来J)−来たこれらは文節記憶手
段6へ書き込まれ、これらの文節の先頭位置の直前の文
字位置の値、すなわち、「出来た」に対する文字位置の
値″′8”、「来た」に対する文字位置の値″9”が、
文節末尾可能位置記憶手段4へ書き込まれる。
[5TEP3] 文節末尾可能位置記憶手段4には、まだ5TEP2の処
理の対象となっていない文字位置として、文字位置の値
″99′、tt8t”が、残っているので、再び5TE
P2を行う。
[5TEP2] 文字位置の値n9nで示される位置を末尾とする文節を
抽出し、次の文節を得る。
デ(格助詞「で」)−一一コクデン(名詞「国電」)−
国電で 文節末尾可能位置記憶手段4へ、文字位置の値64″が
書き込まれる。
[5TEP3] 文節末尾可能位置記憶手段4には、まだ5TEP2の処
理の対象となっていない文字位置として、文字位置の値
“8′”、4′′が残っているので、再び5TEP2を
行う。
[5TEP2] 文字位置の値″′8”で示される位置を末尾とする文節
を抽出し、次の文節を得る。
、コクデン(名詞「国電」)−国電 文字位置の値″′4”は既に文節末尾可能位置記憶手段
4へ書き込まれている。
[5TEP3] 文節末尾可能位置記憶手段4には、まだ5TEP2の処
理の対象となっていない文字位置として、文字位置の値
″4”が残っているので、再び5TEP2を行う。
[5TEP2] 文字位置の値″″4″で示される位置を末尾とする文節
を抽出し、次の文節を得る。
ハ(係助詞「は」)−−キョウ(名詞「今日」)ハ(係
助詞「は」)−−キョウ(名詞「京」)これらの文節の
直前の文字位置は入力された仮名文字列の先頭を超える
ので、文節末尾可能位置記憶手段4への書き込みは行わ
ない。
[5TEP3] 文節末尾可能位置記憶手段4には、5TEP2の処理の
対象となっていない文字位置の情報は残っていないので
、5TEP4へ移る。このとき、文節記憶手段6には次
のような文節が記憶されていることになる。
今日は(名詞+係助詞) 京は (名詞+係助詞) 国電で(名詞+格助詞) 国電 (名詞) 出来た(動詞連用形+助動詞終止形) 来た(動詞連用形+助動詞終止形) [5TEP4] 表記出力手段7により、文節記憶手段6に記憶された文
節が評価され、漢字仮名混じり表記が表示手段8へ出力
される。先頭から表記の長いものを優先する評価を行う
ならば、次のような表記が得られることになる。
今日は国電で来た (発明の効果2 以上説明したように、本発明の仮名漢字変換方式では、
入力された仮名文字列の末尾から順次前方へ文節が抽出
されてゆくため、解析の途中で係り受は関係により文節
候補の絞り込みを行った場合、従来技術の説明で用いた
例で比べると、「拾った」が最初に抽出されるために、
その直前のr道で」と「未知で」は[拾った」との係り
受は関係により速やかに[道で」が選ばれ、それ以後も
曖昧なまま複数の文節候補を持つことなく「硬貨を」、
「記念の」が選ばれることになる。したがって、文末決
定性を持つ日本語文を効率良く解析することができる。
【図面の簡単な説明】
第1図は本発明の仮名漢字変換方式の一実施例の構成を
示すブロック図、第2図は単語辞書の例を示す図、第3
図は実施例の動作を示すフローチャートである。図にお
いて、 1・・・仮名人力手段 2・・・仮名文字列記憶手段 3・・・単語辞書 4・・・文節末尾可能位置記憶手段 5・・・文節抽出手段 6・・・文節記憶手段 7・・・表記出力手段 8・・・表示手段 30・・・単語辞書の見出し 31・・・単語の漢子仮名混じり表記 32・・・単語の品詞情報

Claims (1)

    【特許請求の範囲】
  1. 入力した仮名文字列を漢字仮名混じり表記に変換して出
    力する仮名漢字変換方式において、入力仮名文字列を記
    憶する仮名文字列記憶手段、単語の読み仮名を逆順に並
    べた見出しと漢字仮名混じり表記及び品詞を収納した単
    語辞書、前記入力仮名文字列において文節の末尾になる
    可能性のある文字位置の値を記憶する文節末尾可能位置
    記憶手段、前記文節末尾可能位置記憶手段に記憶された
    前記文節の末尾になる可能性のある文字位置を末尾とす
    る文節を前記単語辞書を検索することにより抽出し、抽
    出された文節の先頭文字位置の直前の文字位置の値を前
    記文節末尾可能位置記憶手段へ書き込む文節抽出手段、
    前記抽出された文節を記憶する文節記憶手段、前記文節
    記憶手段に記憶された前記抽出された文節をもとに漢字
    仮名混じり表記を出力する表記出力手段とを備え、前記
    入力仮名文字列の末尾から前方へ文節を抽出することを
    特徴とした仮名漢字変換方式。
JP60124683A 1985-06-07 1985-06-07 仮名漢字変換方式 Pending JPS61282964A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60124683A JPS61282964A (ja) 1985-06-07 1985-06-07 仮名漢字変換方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60124683A JPS61282964A (ja) 1985-06-07 1985-06-07 仮名漢字変換方式

Publications (1)

Publication Number Publication Date
JPS61282964A true JPS61282964A (ja) 1986-12-13

Family

ID=14891487

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60124683A Pending JPS61282964A (ja) 1985-06-07 1985-06-07 仮名漢字変換方式

Country Status (1)

Country Link
JP (1) JPS61282964A (ja)

Similar Documents

Publication Publication Date Title
KR100282610B1 (ko) 부분 문자열별 기분석에 기반한 한국어 형태소 분석장치 및 그방법
JPS61282964A (ja) 仮名漢字変換方式
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
JPS58123129A (ja) 仮名漢字変換装置
JPS61282966A (ja) 仮名漢字変換方式
JPS63221475A (ja) 構文解析方法
JPS58123126A (ja) 辞書検索装置
JPS6172361A (ja) かな漢字変換装置
JP2628775B2 (ja) 辞書作成装置
JPS62144269A (ja) 情報検索装置
JP2001051992A (ja) 日本語統計データ作成装置および方法、並びにディクテーションシステム
JPS62214468A (ja) かな漢字変換装置
JPH01114976A (ja) 文書処理装置の辞書構造
JPH0916575A (ja) 発音辞書装置
JPH01185766A (ja) かな漢字変換装置
JP2526657B2 (ja) 形態素解析装置
JPS62282364A (ja) 文字列検索方式
JPS6118065A (ja) カナ漢字変換処理装置
JPS62180472A (ja) 語調の不統一箇所検出方式
JPH0350669A (ja) 情報処理装置
JPS62150462A (ja) 文章誤り自動修正方式
JPS62271172A (ja) 仮名漢字変換処理方式
JPS59103132A (ja) 日本語入力装置
JPS62298869A (ja) 文尾変換方式
JPS63118975A (ja) かな漢字変換装置