JPH0675943A - かな漢字変換装置 - Google Patents

かな漢字変換装置

Info

Publication number
JPH0675943A
JPH0675943A JP4226581A JP22658192A JPH0675943A JP H0675943 A JPH0675943 A JP H0675943A JP 4226581 A JP4226581 A JP 4226581A JP 22658192 A JP22658192 A JP 22658192A JP H0675943 A JPH0675943 A JP H0675943A
Authority
JP
Japan
Prior art keywords
conversion
kana
kanji
candidate
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4226581A
Other languages
English (en)
Inventor
Hiroyasu Nogami
宏康 野上
Kazuhiro Kimura
和広 木村
Setsu Suzuoka
節 鈴岡
Tatsuya Uehara
龍也 上原
Masaie Amano
真家 天野
Tatsuya Dewa
達也 出羽
Yoshimi Saito
佳美 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP4226581A priority Critical patent/JPH0675943A/ja
Publication of JPH0675943A publication Critical patent/JPH0675943A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 本発明は、利用者が選択操作を行わない場合
でも、装置が適切にネットワークを刺激することによ
り、話題の把握の精度を向上させ、変換精度の高いかな
漢字変換装置を提供することを目的とする。 【構成】 入力部から入力された読み情報を漢字かな混
じり文に変換するかな漢字変換装置において、利用者の
指示若しくは選択されたものとみなしてニューラルネッ
トワークに入力を与えるネットワーク制御部を設ける。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、かな表現の入力日本
語文を漢字かな混じり文に変換するかな漢字変換装置に
関するものである。
【0002】
【従来の技術】日本語文章の読み情報を入力してかな漢
字混じり文に変換するための入力手段として、日本語ワ
ードプロセッサが広く普及している。
【0003】このような日本語ワードプロセッサにおい
ては、キーボードより読み情報が入力されると、文節及
び文の切れ目等を指示する特定キーの操作タイミング、
或いは、かな入力中に句読点が入力されたり、入力され
た文字数が予め定められた文字数を越えた場合等のタイ
ミングで、入力されたかな入力に対応する漢字かな混じ
り文表記の変換処理が行われ、その変換処理結果がCR
T等のディスプレイに表示され利用者の所望とする漢字
かな混じり表記を得ることができる。
【0004】ところで、日本語には、読みが同じであり
ながら表記の異なる語(漢字)、いわゆる同音異義語が
多数存在する。このため、かな漢字変換装置の開発にお
いては、ある読み情報漢字に変換するに際して、その読
みに対応する同音異義語の中で利用者が入力したいと考
えている語を、いかに第1候補として提示するかという
観点から技術開発が行われている。
【0005】従来の試みとして、同音異義語の中で直前
に選択された語(句)を最優先の変換候補として処理す
る技術がある。しかしながら、この場合は、同一文章中
に複数の同音異義語が存在する場合や、その語が初出現
の場合には、正しく機能しないという問題があった。例
えば、「この計算機の使用は難しい。」という文章を入
力した後、「それは、仕様が悪いからだ。」という文章
を入力した場合、直前に「使用」という語が用いられて
いるため「使用」に変換されてしまい、所望としている
「仕様」には、変換されない。
【0006】そこで、語と語との共起関係に着目し、こ
れを利用して変換を行う方法が提案されている。例え
ば、「なく」という読み情報には、「泣く」、「鳴く」
等という表記があり、主語となる語に応じて「人が泣
く」又は「犬が鳴く」というように使い分ける必要があ
るが、共起関係に着目する方法では、これらの関係を予
め、「人」−「泣く」、「犬」−「鳴く」という形で共
起情報として記憶しておき、変換の際に、この共起情報
を参照することにより、同音異義語の中の最も適切なも
のを候補として提示できるようにしている。しかしなが
ら、上記従来の共起関係を用いた変換方法においては、
それに用いられる共起関係が極めて多種多様で、その数
は極めて多いという問題があった。例えば、単語辞書に
登録されている語数を10万語とすると、2語の組合わ
せは、単純計算で10万語×10万語=100億語とな
る。これらの中で、共起関係にあるものについてはかな
り数が絞られるが、それでも数百万から数千の組合わせ
が存在すると考えられている。従って、このような多数
の組合わせの可能性を調べ、なおかつ、多数の組合わせ
を予め共起情報として格納しておくことは、実際問題と
して不可能である。また、この方法は、共起情報の中に
該当する語の組合わせがない場合は、効果が得られない
ことは明かである。例えば、「日本人がなく」や「秋田
犬がなく」等の入力に対して共起関係を見いだすことが
できない場合には、通常の変換方法に頼り誤変換をして
しまうことがある。また、共起情報の中に該当する語の
組合わせがある場合でも、他の候補の組合わせが存在す
る場合は、正しい候補に決定できないという問題があ
る。例えば、「あついてっぱん」という読み情報に対し
ては、「厚い」−「鉄板」と「熱い」−「鉄板」という
組合わせが共起情報として存在する可能性がある。この
ような問題を解決するためには、入力文章の文脈を把握
する必要がある。例えば、「…鉄板を高温の炉の中に入
れて熱し、しばらくしてから取り出します。このあつい
てっぱんは、…」という文章が入力されている場合に
は、この文脈を把握することにより、「あついてっぱ
ん」は「厚い鉄板」ではなく「熱い鉄板」に正しく変換
することができる。
【0007】従って、変換を行う際に、入力中の文章の
話題を把握して、その情報を用いて変換する技術が「神
経回路網の連想機能を用いたかな漢字変換方式:第40
回情報処理学会全国大会(1990)」で提案されてい
る。即ち、予め与えられた漢字かな混じり文章(学習デ
ータ)及び語の結びつきの強さをネットワーク形式で形
成する。ネットワーク中の各ノードは、かな漢字変換辞
書の各単語項目に一意に対応し、それぞれ荷重値を持
つ。また、ノード間のリンクは、重みを持つ双方向性の
リンクであり、単語間の結びつきの強さを示す。
【0008】今、同音異義語選択時にある単語が確定さ
れると、その確定情報は、その単語に対応するノードに
対する入力となるので、そのノードの荷重値が上昇す
る。この荷重値の上昇がリンクを伝搬することにより、
そのノードに接続されているノード(連想語)の荷重値
が上昇する。かな漢字変換における同音異義語の出力順
位は、このノードの荷重値の大小を比較して決定する。
【0009】この方式のネットワークの具体例を図8に
示す。今、例えば、図8に示すようなネットワークが形
成されているとする。ここで、図中の例文のような「鉄
を熱すること」に関する文章が入力中であるとすると、
先行文脈に出現した「高温」や「炉」等の荷重値が上昇
しているため、連想語である「熱い」の荷重値も高くな
っている。これによって、「あつい」という読み情報が
この文章において初めて入力されたとしても、「熱い」
と正しく変換することができる。
【0010】従って、文脈に適した候補を優先出力する
ことができ、文脈が推移してもそれに追随することがで
きる。また、利用者の語彙使用傾向を反映した語を選択
できるので、コストの高い意味解析処理等の手間をかけ
ずに変換精度が向上するようになる。
【0011】このように単語連想機能によれば、変換精
度の向上に有益な効果をもたらすものであるが、例え
ば、利用者が「高温」や「炉」に対して選択を行った場
合にのみ、そのノードに対して入力を行っていた。即
ち、利用者が「高温」や「炉」に対して選択操作を行う
必要があるにもかかわらず、一般に利用者は、所望の変
換候補が最初に表示された場合には、その語に対する選
択操作は行わず、次のかな入力操作を優先して行ってい
た。従って、文脈上活性値が上昇すべきノードに対し入
力が行われない場合が多く、このため、文脈の把握に支
障をきたし、変換精度が低下してしまうという欠点があ
った。
【0012】一方、一般のかな漢字変換処理において、
所望とする変換結果を第1候補として表示を行うように
するために、文法規則が適用され、文法的に適確な変換
結果を第1候補として表示する方式が用いられている。
【0013】このような文法規則を適用する際、参照す
る各単語の文法情報が、従来の品詞分類だけでは、正確
な変換を行なうことができない。そこで、文法規則に応
じて単語毎に品詞分類以外の属性をも付与する方法が考
えられている。
【0014】しかし、莫大な数の単語に属性を付与する
という作業は、人間の判断で行なわれるため、誤った属
性を付与してしまう可能性があると共に、非常に大変な
労力を必要とする。また、より文法的に正しい変換を行
おうとして文法的制約を強くすると、口語文等の特殊な
文章を入力しようとした場合に、所望とする変換結果が
文法的に不的確であると判定されたり、逆に、このよう
な口語文等も広く許容することとして文法属性を付与す
ると、文法的制約が弱くなり過ぎてしまうなど、属性の
付与には判断上の困難を伴うことが多かった。
【0015】
【発明が解決しようとする課題】上述したように、従来
のニューラルネットを用いた変換方法においては、利用
者が選択操作を行った単語に対してのみノードへの活性
化を行うので、ネットワークによる入力文章の話題の把
握に支障をきたし、変換精度が低下してしまうという欠
点があった。
【0016】また、従来のかな漢字変換装置において、
かな漢字変換結果に文法規則を適用するのに必要な文法
属性を各単語に付与しようとした場合、属性を付与する
上で、文法属性の誤りや判断の難しさを伴うと共に、そ
の労力は耐え難いものがあった。 そこで、第1の発明
においては、利用者が選択操作を行わない場合において
も適切にノードへの活性化を行い、話題の把握の精度を
向上させ、変換精度の高いかな漢字変換装置を提供する
ものである。
【0017】また、第2の発明においては、固定的な属
性を付与することに問題のある単語に対して属性が付与
されている場合や、文法属性が誤って付与された場合に
おいても、利用者の入力に応じて適切に文法規則を適用
し、所望のかな漢字変換を行なうことを可能とするかな
漢字変換装置を提供することにある。
【0018】
【課題を解決するための手段】本発明は上記従来の課題
を解決するために、変換対象として入力される読み情報
を、ニューラルネットワーク内の各ノードに保持された
荷重値に基づいて、漢字かな混じり文に変換するかな漢
字変換装置において、前記かな漢字変換された変換候補
について、所望の変換候補を選択し変換結果として確定
する変換候補選択手段と、前記かな漢字変換された変換
候補について、前記選択手段による選択がない場合に、
該変換候補を変換結果としてみなして確定する選択判定
手段と、前記変換候補選択手段或いは選択判定手段によ
って確定された変換結果の語に対応する前記荷重値を変
更すると共に、前記ニューラルネットワークの状態を制
御するネットワーク制御手段とからかな漢字変換装置を
構成する。
【0019】また、前記ネットワーク制御手段は、前記
変換候補選択手段で選択された語か前記選択判定手段で
選択されたと判定された語かの情報によって、前記ノー
ドに対して異なった荷重値を入力する。
【0020】さらに、変換対象として入力される読み情
報を、漢字かな混じり文に変換するかな漢字変換装置に
おいて、前記かな漢字変換された変換候補の中から所望
の変換候補を選択し変換結果として確定する変換候補選
択手段と、所定の文法規則情報を記憶した文法規則情報
記憶手段と、この文法規則情報記憶手段に記憶された所
定の文法規則情報に基づいて、前記変換候補選択手段に
よって変換された変換結果が文法規則に則っているか否
かを判断する文法規則判断手段と、この文法規則判断手
段によって得られた結果が文法規則に則っていない場合
は、該文法規則に則っていない変換結果に対する文法情
報について該文法規則を文法規則情報として変更を行う
文法情報管理手段とからなるかな漢字変換装置を構成す
る。
【0021】
【作用】第1の発明によれば、表示手段により表示され
た変換候補に対し、利用者が該変換候補に対する修正操
作を行わなかった場合には、選択判定手段により、該変
換候補は選択されたと判定する。入力手段によって、そ
の候補に対応するネットワーク上のノードに荷重値を与
え、その入力に基づいて各ノードの荷重値を計算し、そ
の値に基づいて変換候補の優先順位を決定しつつ、かな
漢字変換を行う。
【0022】これにより、例えば、図8の例文の「てっ
ぱんをこうおんの…」という入力の変換結果が、最初に
「鉄板を高温の」と表示され、利用者が選択操作を行わ
ず、次の「ろのなかにいれ…」と入力操作を行った場合
でも、ネットワーク上の「鉄板」、「高温」に対して荷
重値が与えられることにより、「あつい」の変換候補と
して、「鉄板」、「高温」と大きな重みでリンク付けさ
れている「熱い」を優先することができる。
【0023】また、第2の発明によれば、単語辞書中に
各単語の文法属性を固定的に記憶する場合、属性を付与
する作業において、文法的制約を厳しくしておけばよい
ので判断の基準が明確になり、その判断が容易になる。
さらに、所望の変換結果が、文法的に不的確であると判
定されても次候補手段によって利用者が該変換結果を選
択することにより、文法情報が更新され、以降の同様な
入力に対して文法的に的確であると判定され、利用者の
多様な入力に対しても柔軟に対応し、利用者の望む変換
結果を出力することができるようになる。
【0024】
【実施例】以下、図面を参照しながら本発明の一実施例
について説明する。
【0025】図1は、第1の発明に係るかな漢字変換装
置の構成を示すものである。入力部1は、かな漢字変換
の対象となるかな文字列を入力したり、校正、追加やカ
ーソルキー等各種編集のためのコマンドを入力するため
のキーボード等からなる。そして、この入力部1から入
力された読み情報は、順次、編集制御部2に送られる。
この編集制御部2は、変換結果メモリ5の内容を参照し
て利用者に提示する情報を決定し、表示部3に送る。ま
た、カーソルの移動、文字列の削除、文節の切り直し、
同音異義語の選択などの各種の編集コマンドを入力部1
から受けとり、それぞれのコマンドに従って予め決めら
れた動作を行なうと共に、かな漢字変換装置全体の処理
を制御する。表示部3は、入力部1から与えられた文字
列や、編集制御部2の制御下でかな漢字変換された変換
結果、或いはかな漢字変換処理に用いられる同音異義語
リスト、その他の各種ガイドメッセージ等の表示を行う
ためのものであり、CRTディスプレイ等からなる。か
な漢字変換部4は、入力部1から編集制御部2を介して
送られた変換結果メモリ5に保持されているかな文字列
を漢字かな混じり列に変換する。この際、単語文法記憶
部6及びネットワーク参照部7からの情報を参照する。
単語文法記憶部6は、単語の読み、漢字表記、品詞等の
文法属性等、文節として可能な構造を規定する文節内文
法、文節間の可能な接続を規定する文節間文法等が記憶
されている。同音異義語選択部8は、表示部3に表示し
た変換候補のうち、他に同音異義語のある語に対して、
利用者の要求により同音異義語の選択を可能にするもの
である。なお、最初に表示された同音異義語に対して
も、選択を行うことは可能である。選択判定部9は、表
示部3に表示された変換結果に対して、利用者が修正を
行わない場合に、その変換候補は選択されたと判定し、
ネットワーク制御部10へこの語の情報を送る。ネット
ワーク制御部10は、同音異義語選択部8又は選択判定
部9から送られてきた単語に対応する荷重値をネットワ
ーク11上のノードに付与し、ネットワーク11の状態
を変化させる。ネットワーク参照部7は、かな漢字変換
部4から送られてくる変換候補に対応するネットワーク
11上のノードの荷重値を参照し、かな漢字変換部4へ
その荷重値を送る。
【0026】図2は、第1の発明に係るかな漢字変換装
置における処理の流れを示す図であり、図3は、表示部
3上に表示される内容を示したものである。以下、図
2、図3に従って説明する。図3(a)は、利用者が、
既に、「鉄板を」という文字列を入力済みの状態を表し
ている。この後、S1 において、利用者が、変換対象の
読み情報として「こうおんの」を入力し、変換指示を行
った場合(S2 )の画面が図3(b)である。この入力
に対し変換を行い、変換結果を表示する(S3 ,S4
図3(c))。図3(c)の「高温」の上線は、この他
に同音異義語候補「高音」、「厚恩」等が存在している
ことを利用者に提示している。この時点における変換結
果メモリ5に保持されている「高温」に対する同音異義
語情報の構造を図4(a)に示す。同音異義語情報は、
読み41、漢字表記42、辞書ID43、被選択情報の
項目である確定44、選択判定45から構成されてい
る。被選択情報とは、その語が選択されたかどうかを表
す情報であり、同音異義語選択部8によって利用者が選
択した場合は、確定44の項目が「1」に、選択判定部
9によって選択されたと判定された場合は、選択判定4
5の項目が「1」になる。上記の各々の場合を「高温」
を例にして示したものが、図4(b)及び図4(c)で
ある。
【0027】表示部3が図3(c)の状態で、利用者が
次のかな文字列「ろの」を入力し始め(S5 )、図3
(d)の状態になったとする。この入力に対しては、通
常の処理を行う(S8 )と共に、選択判定部9におい
て、該変換候補に対する選択判定処理を行う(S6 )。
【0028】図5は、該変換候補に対する選択判定処理
(S6 )における処理の流れを示す図である。利用者の
入力部1からの入力に対して、それが該変換候補に対す
る確定指示かどうかを調べ(S61)、さらに該変換候補
に対する次候補指示であるかどうかを調べる(S62)。
次候補の指示の場合は、次候補を提示した後、S61へ戻
る。次候補指示でない場合は、S63へ進み、次に続くか
な文字の入力の場合は、該候補は選択されたと判定する
(S64)。そして、該変換候補に対する単語情報をネッ
トワーク制御部10へ送る(S65)。この時点における
同音異義語情報は、図4(c)に示すようになってい
る。
【0029】以上で該変換候補に対する選択判定処理
(S6 )の処理を終了し、ネットワーク制御部10にお
ける処理に移る(S7 )。図6は、ネットワーク制御部
10における処理の流れを示す図である。ネットワーク
制御部10は、送られてきた単語情報が同音異議語選択
部8又は選択判定部9のどちらからの入力であるかを判
定する(S71,S73)。同音異義語選択部8からの入力
の場合は、Ij =I0 とする(S72)。選択判定部9か
らの入力の場合は、Ij =I1 (ただし、I0 >I1
とする(S74)。S75において、ネットワーク11上の
該単語情報に対応するノードに対し、荷重値Ij を与え
る。この荷重値Ij をネットワーク上の関連ある他のノ
ードに伝搬させて、ネットワーク11の状態を変化させ
る。
【0030】ネットワーク11は、無階層、双方向、自
己ループ無しのホップフィールドネットワークであり、
各語をノードとし、それらが重み付きのリンクで結ばれ
ている。本発明に係るかな漢字変換装置においては、例
えば、先述した図8に示すようなネットワークを用いる
ことができる。次に、図6におけるS76の処理について
説明する。ここでは、以下に示す式に従ってS75で与え
られた荷重値Ij をネットワーク11上に伝搬させる。
【0031】
【数1】
【0032】ここで、荷重値Ij は、S75において同音
異義語選択部8からの単語に対する場合の方が、選択判
定部9からの単語に対する場合よりも大きくなるよう
に、即ち、I0 >I1 となるように設定されている。こ
れは、選択判定部9が判定した場合の確度の方が、実際
に利用者が指示選択した場合の確度よりも低いという前
提に基づくものである。しかしながら、必ずしもこの条
件である必要はなく、数式2に示すように、I0 =I1
としても構わない。また、同音異義語候補の数に依存し
てI1 を決定することも可能である。
【0033】
【数2】
【0034】今回の例文の場合では、図4(c)の状態
がネットワーク制御部10へ送られる。そして、S73
74へ進み、S76において、数式3に従って、ネットワ
ーク11の状態が変化する。そして、ノード「高温」と
その回りのノードの活性値が高い状態となる。
【0035】
【数3】
【0036】その後、図8に示す例文をさらに入力して
いくと、今までの説明と同様にしてノード「炉」の回り
の単語の活性値も高い状態となる。つまり、利用者が、
変換結果である「高温」、「炉」という単語に対し選択
操作を行わない場合でも、ネットワーク11上のそれら
の単語に対応するノードの回りは、活性値の高い状態に
することができる。
【0037】次に、「あつい」が入力された場合を説明
する。この「あつい」に対しては、かな漢字変換部4に
おいて同音異義語候補「暑い」、「熱い」、「厚い」が
生成される。この時点における「あつい」に対する同音
異義語情報を図7に示す。かな漢字変換部4は、これら
の候補のうちどれを優先するかの情報の1つとして、ネ
ットワーク参照部7へ、これらの単語に対応するネット
ワーク11上のノードの荷重値を問い合わせる。問い合
わせを受けたネットワーク参照部7は、ネットワーク1
1の該ノードを検索し、その活性値をかな漢字変換部4
へ返す。
【0038】なお、今回の一例においては、ネットワー
ク上で「高温」「炉」に大きな重みでリンクされている
「熱い」が他の2候補よりも高い活性値になっている。
かな漢字変換部4は、この情報を参考にして「熱い」を
優先して変換することができる。
【0039】以上のように、第1の発明においては、利
用者が選択操作を行わない場合でも、以降の変換におい
て文脈に関係の深い同音異義語候補を優先して処理でき
ることになる。
【0040】図9は、第2の発明に係るかな漢字変換装
置の構成を示す図である。図9において、入力部1は、
かな漢字変換処理の対象となるかな文字列の入力若しく
は同音異義語選択等の編集のためのコマンドの入力を行
なうためのキーボード等からなっている。編集制御部2
は、変換結果メモリ5の内容を参照して利用者に提示す
る情報を決定し、表示部3に送る。また、カーソルの移
動、文字列の削除、文節の切り直し、同音異義語の選択
などの編集コマンドを受けとり、それぞれのコマンドに
従って予め決められた動作を行なう。表示部3は、かな
漢字変換処理された変換結果、或いは変換結果の修正に
用いられる同音異義語リスト等を表示する。かな漢字変
換部4は、入力部1から編集制御部2を介して送られた
変換結果メモリ5に保持されているかな文字列を、単語
文法記憶部6、文法規則表12及び単語文法記憶部6の
文法情報の変更内容を記憶した文法情報変更表13に基
づいて、漢字かな混じり文に変換し、各候補の順序付け
を行ない、その結果を変換結果メモリ5に書き込むもの
である。
【0041】文法情報制御部14は、最終的に確定した
変換結果が、文法規則表12と単語文法記憶部6の文法
情報に参照して文法的に不的確であると判定された場
合、対応する単語を編集制御部2から受けとり、その単
語の文法情報変更の内容を文法情報変更表13に書き込
むものである。
【0042】図10は、単語文法記憶部6に記憶される
単語辞書のフォーマットの一例を示す図である。また、
図11は、そのフォーマットに従って表現された辞書内
容の一例を示す図である。単語文法記憶部6は、見出し
番号101、読み102、見出し103及び文法情報1
04の各項目から構成されている。見出し番号101の
部分には各見出し毎に付けられた認識番号(例えば、
「2」)が記憶されており、読み102の部分には単語
の読み(例えば、「たんまつ」)が記憶され、見出し1
03の部分には、読み112の部分の読みを持つ単語の
漢字かな混じり表記(例えば、「端末」)が記憶されて
いる。文法情報104は、品詞105(例えば、「名
詞」)と文法属性リスト106とから成り、文法属性リ
スト106は、N個の「文法属性」1061 〜106N
(この例では、「0」と「1」の2値)の項目から成っ
ている。文法属性1061 〜106N は、文法規則表1
1の中の文法規則が適用される際の属性である。
【0043】図12及び図13は、かな漢字変換部4に
よって変換された結果を格納する変換結果メモリ5に記
憶された変換結果の格納フォーマットである。また、図
14及び図15は、図16に示すような入力に対し、そ
れぞれ図12及び図13のフォーマットに従って記憶さ
れたかな漢字変換結果の一例である。変換結果は文節毎
に区切られているが、これらの文節を、文節番号12
1、文節の始点122、文節の終点123、全候補数1
24、同音語データ125の項目で表現している。文節
番号121は、べた書き入力に対するかな漢字変換の結
果生じた文節の候補毎に付けられた認識番号である。文
節の始点122及び文節の終点123は、文節がべた書
き入力の先頭より何文字目から始まり、何文字目で終わ
るかを格納している。全候補数124は、同音異義語デ
ータ125の候補の数を保持するものである。同音語デ
ータ125は、N個の文節候補データ1251 〜125
N によって構成されている。このときの1〜Nを「文節
候補番号」と呼ぶ。文節候補データ1251 〜125N
は、かな文字列に対するかな漢字変換結果126とその
変換結果に含まれる単語の見出し番号127から成って
いる。
【0044】べた書き入力のかな漢字変換では、文節切
りの組合せが複数生じるが、その組合せが、選択系列番
号131と系列候補データ132の項目で表現されてい
る。系列候補データ132は、N個の系列候補データ1
321 〜132N によって構成されている。このときの
1〜Nを「系列候補番号」と呼ぶ。各系列候補データ
は、第1文節データ1331 から第M文節データ133
M までのM個の文節データの並びで表現されている。更
に、各文節データは、文節番号134、選択候補番号1
35、文法規則番号136から構成される。選択系列番
号131は、N個の系列候補データ1321 〜132N
のうち、選択されている系列候補の番号を記憶してい
る。文節番号134は文節番号131に対応し、選択候
補番号135は、N個の同音異義語データ1351 〜1
35N のうち、選択されている文節候補の番号を記憶し
ている。文法規則番号136は、最終的に確定したかな
漢字変換結果に対して文法規則が適用されて、文法的に
正しくないと判定された場合に、適用された文法規則の
番号が記憶される。
【0045】図17は、利用者の選択に応じて、文法情
報制御部14の制御により、単語の文法属性1061
106N の変更の情報を格納する文法情報変更表13の
格納フォーマットの一例である。このフォーマットにお
ける1セットは、文法規則番号171と属性変更単語リ
スト173からなる。文法規則番号171は、適用され
る文法規則の番号を表し、1つの文法規則に対して、文
法情報変更表が1セット対応している。属性変更単語リ
スト173は、N個の見出し番号1731 〜173N
ら成り、各セットに対応した文法規則を適用する際、単
語文法記憶部6に記憶されている文法属性を変更する単
語の見出し語が記憶されている。
【0046】図18は、このフォーマットで格納されて
いる文法情報変更表の一例である。この例は、番号1の
文法規則が適用される際に参照されるセットで、属性変
更単語リストには、見出し番号3の単語「接続」が記載
されている。
【0047】番号1の文法規則は、サ変名詞の1番目の
文法属性をチェックする。かな漢字変換辞書9に記憶さ
れている見出し番号3の単語「接続」の1番目の文法属
性は、図11によると「0」であるが、文法情報変更表
に記載された後は、かな漢字変換の際には属性1として
扱われる。次に、文法規則の一例を以下に示す。 (1) [数字]と[サ変名詞/属性名詞1:0]の隣接 → 不可 [数字]と[サ変名詞/属性名詞1:1]の隣接 → 可
【0048】上記の例は、文法規則番号は1番で、文法
規則の内容は、「数字とサ変名詞で属性番号1が0のも
のは隣接不可」「数字とサ変名詞で属性番号1が1のも
のは隣接可」というものである。
【0049】図11において、サ変名詞「接続」(見出
し番号3)の1番目の属性は「0」であるので、単語文
法記憶部6に記憶された文法情報では、「接続」という
サ変名詞は数字に隣接しないことになっている。一方、
サ変名詞「増加」(見出し番号4)の1番目の属性は
「1」であるので、「増加」というサ変名詞は数字に隣
接し得る。例えば、「物価指数が5増加した」等という
表現はよく使われる。「接続」も、「ネットワークに端
末を500接続し、」等のように数字に後接することも
あるが、「増加」「減少」などに比べると頻度は低い。
図19は、本発明に係るかな漢字変換装置の全体の流れ
を示す図である。
【0050】ステップA1 で、入力部1が変換すべきか
な文字列を受けとる。そして、ステップA2 で、受けと
ったかな列に対して、かな漢字変換部4が、単語文法記
憶部6、文法規則表12及び文法情報変更表13を参照
して、かな漢字混じり文の変換候補を作成する。次に、
ステップA3 において変換候補を図12及び図13のフ
ォーマットに従って変換結果メモリ5に書き込む。ステ
ップA4 では、編集制御部2によって、図20のような
手段を用いて利用者に文節の切り直しや同音異義語の選
択を行なわせる。同音異義語の選択は、図20(a)の
ように文節毎に同音異義語の一覧を表示し、その中から
選択することによって行なう。文節の切り直しは、図2
0(b),(c)のように、文節の始点を固定して、終
点を動かすことによって行なう。指定された文節より前
の文節切りは共通で、指定された文節の終点が、「長
く」「短く」の指示に対応した系列を探す。
【0051】ステップA5 では、最終的に確定した変換
結果、即ち、選択系列番号131及び選択系列番号13
5で指定された変換結果に対して再び文法規則を適用す
る。変換結果が文法上正しくないと判定された場合、該
当する文節の文法規則番号136の欄が記入される。ス
テップA6 では、最終的に確定した変換結果が、ステッ
プA5 で文法上不的確であると判定されたかどうかを調
べる。選択系列番号で指定された系列候補の各文節の文
法規則番号136の欄をチェックし、記入されている欄
があれば、ステップA7 において文法情報変更表13の
書換えを行なう。文法上的確か否かの判断は、単語文法
記憶部6に記憶されている情報のみを参照して行なわれ
る。文法情報変更表に文法属性の変更が既に記載されて
いれば、第1候補を決定する際の扱いは文法上正しいと
判断されたものと同じである。
【0052】次に、ステップA4 について、図21に従
って詳細に説明する。まず、第1候補を表示し(ステッ
プB1 )、文節番号を表す変数BNに1を代入する(ス
テップB2 )。ステップB3 において、図20(b),
(c)のような手段を用いて、利用者によって文節の切
り直しが行なわれると、図12の文節の始点122、文
節の終点123を参照して、(BN−1)番目の文節切
りが同じで、BN番目の文節切りが利用者の指示に一致
する系列の系列候補番号を選択系列番号131に書き込
む。
【0053】次にステップB5 で、図20(a)のよう
な手段を用いて、利用者に同音異義語の選択を行なわ
せ、選択された候補の文節候補番号を選択候補番号13
5に書き込む。ステップB7 で、もし、処理されていな
い文節がもうなければ、終了する。まだ、処理されてい
ない文節があれば、変数BNを1増やして(ステップB
8 )、ステップB3 以降の処理を行なう。
【0054】次に、ステップA7 の動作を図22に従っ
て説明する。まず、文法規則番号136が記入されてい
る文節の、文節番号134と選択候補番号135で指示
される文節候補の見出し語番号127が、文法規則番号
136に対応する文法規則番号171を持つ文法情報変
更表の属性変更単語リスト172の中に記載されている
かどうかを判断する(ステップC1 )。該見出し語番号
がリスト中に記載されていた場合、該見出し語番号がリ
ストの最後尾で、他の見出し語の順序はそのままになる
よう見出し語をソートする(ステップC2 )。リストに
ない場合、リストが一杯でなければ(リストに記載され
ている見出し語の数<N)、リストの最後尾に該見出し
語を加える(ステップC5 )。リストが一杯であった場
合、リストの先頭に入っている見出し語を削除し、他の
見出し語の順序を1つずつ繰り上げてから(ステップC
4 )、リストの最後尾に該見出し語を加える(ステップ
5 )。次に、本発明に係るかな漢字変換装置における
処理の一例を示す。
【0055】例えば、図16のようなかな入力があった
とする。このとき、かな漢字変換部4によって、変換結
果メモリ5の内容は、図14及び図15(a)のように
なっている。まず、図17の番号1の文法規則、図11
より「接続」というサ変名詞は文法属性1が「0」なの
で、数字に後接しない。従って、「ネットワークに/端
末を/500/接続し」という変換は非優先となり、
「ネットワークに/端末を/500/節/属し」という
変換が第1候補になる。なお、「/」は文節の切れ目を
示す。
【0056】ここで、利用者が図22(b),(c)の
ように文節の切り直しを行なって、変換結果を、「ネッ
トワークに/端末を/500/接続し」と修正すると、
選択系列番号71は図15(a)の「2」から、図15
(b)のように「1」へと書換わる。これを確定する
と、文法規則が適用され、番号1の文法規則により、数
字「500」と、サ変名詞「接続」(文法属性1が
「0」)の隣接は文法的に不適格であると判定され、第
4文節の文法規則番号76に「1」が記入される。
【0057】以後、見出し語3のサ変名詞「接続」は、
属性番号1が「1」として扱われるので、同様なかな入
力があったとき、「500接続する」というような変換
が非優先とされることはない。なお、第2の発明は、上
記実施例に限定されず、以下(a)から(e)に示すよ
うに、適宜変形して実施することが可能である。 (a)本実施例では、文法属性は「1」又は「0」の2
値であったが、3つ以上の値をとるようにしても良い。
【0058】(b)本実施例では、文節候補に対する文
法的な判定は1つの文法規則によって、1つしか行なえ
ないが、複数の文法規則によって、それぞれの文法規則
に対応した複数の判定を行なうことも可能である。
【0059】(c)本実施例では、1つの文法規則は、
1つの単語の1つの属性しか参照していないが、1つの
文法規則が、複数の単語の複数の属性を参照することも
可能である。
【0060】(d)本実施例では、文法上不的確である
と1度判定されただけで、単語の文法属性を変更した
が、N回判定されれば、変更するとしても良い。Nは2
以上の整数で、その値は文法規則毎に任意に設定可能で
ある。
【0061】(e)本実施例では、文法情報変更表が一
杯になったら、履歴の古い単語から順に削除していった
が、それと同時に、記載された時点を記憶しておいて記
載からの経過時間、或いは、かな入力量を基準に、削除
することも可能である。また、かな漢字変換プログラム
を立ち上げるたびに文法情報変更表をすべてクリアして
もよいし、利用者の指示によってクリアするようにして
もよい。。
【0062】
【発明の効果】以上のように第1の発明によれば、変換
結果に対する利用者の選択操作がなくても、選択された
と判定できるものについては、ネットワーク上の対応す
るノードを刺激することにより、以降の処理で、その語
と連想関係の強い語を優先して処理することができる。
これにより、変換結果を利用者の意図を反映したものに
することができ、かな漢字変換の信頼性を高めることが
できる。
【0063】例えば、利用者が「高温」「炉」という語
に対し、選択操作を行わない場合でも、「あつい」に対
しては「暑い」「熱い」「厚い」の中から「熱い」を優
先して処理することができる。
【0064】また、第2の発明によれば、所望のかな漢
字変換結果が、単語毎に付与された文法属性を参照する
と文法上不的確であると判定されて非優先になり、第1
候補として表示されていなくても、次候補手段によって
選択するようにすることにより、対応する単語の文法属
性が更新される、以後、同様の入力に対しては、文法上
的確であると判定され、所望のかな漢字変換結果を得る
ことができるようになる。従って、辞書に記憶する各単
語の文法情報を決定する際、文法的な制約を厳しくして
おけば良いので、判断が容易になり、属性を付与する作
業が簡単になる。
【図面の簡単な説明】
【図1】 第1の発明に係るかな漢字変換装置の構成を
示す図。
【図2】 第1の発明に係るかな漢字変換装置における
処理の流れを示す図。
【図3】 表示部に表示された内容を示す図。
【図4】 変換結果メモリ内の同音異義語情報の構造の
一例を示す図。
【図5】 該変換候補に対する選択判定処理における処
理の流れを示す図。
【図6】 ネットワーク制御部における処理の流れを示
す図。
【図7】 「あつい」に対する同音異義語情報を示す
図。
【図8】 ネットワークの一例を示す図。
【図9】 第2の発明に係るかな漢字変換装置の構成を
示す図。
【図10】 単語文法記憶部に記憶される単語情報のフ
ォーマットを示す図。
【図11】 図11に示す単語文法記憶部される単語情
報の一例を示す図。
【図12】 変換結果メモリに記憶される文節候補のフ
ォーマットを示す図。
【図13】 入力部から入力されるかな文字列の一例を
示す図。
【図14】 図12に示す変換結果メモリに記憶される
文節候補の一例を示す図。
【図15】 変換結果メモリに記憶される系列候補のフ
ォーマットを示す図。
【図16】 図15に示す変換結果メモリに記憶される
系列候補の一例を示す図。
【図17】 文法情報変更表のフォーマットを示す図。
【図18】 図17に示す文法情報変更表の一例を示す
図。
【図19】 変換処理の全体の流れを示す図。
【図20】 同音異義語選択及び文節切り直しのインタ
ーフェースの一例を示す図。
【図21】 変換候補の選択の処理を示す図。
【図22】 文法情報変更表の書き換えの処理の流れを
示す図。
【符号の説明】
1 入力部 2 編集制御部 3 表示部 4 かな漢字変換部 5 変換結果メモリ 6 単語文法記憶部 7 ネットワーク参照部 8 同音異義語選択部 9 選択判定部 10 ネットワーク制御部 11 ネットワーク 12 文法規則表 13 文法情報変更表 14 文法情報制御部
───────────────────────────────────────────────────── フロントページの続き (72)発明者 上原 龍也 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝総合研究所内 (72)発明者 天野 真家 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝総合研究所内 (72)発明者 出羽 達也 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝総合研究所内 (72)発明者 齋藤 佳美 神奈川県川崎市幸区小向東芝町1番地 株 式会社東芝総合研究所内

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 変換対象として入力される読み情報を、
    ニューラルネットワーク内の各ノードに保持された荷重
    値に基づいて、漢字かな混じり文に変換するかな漢字変
    換装置において、 前記かな漢字変換された変換候補について、所望の変換
    候補を選択し変換結果として確定する変換候補選択手段
    と、 前記かな漢字変換された変換候補について、前記選択手
    段による選択がない場合に、該変換候補を変換結果とし
    てみなして確定する選択判定手段と、 前記変換候補選択手段或いは選択判定手段によって確定
    された変換結果の語に対応する前記荷重値を変更すると
    共に、前記ニューラルネットワークの状態を制御するネ
    ットワーク制御手段とからなることを特徴とするかな漢
    字変換装置。
  2. 【請求項2】 前記ネットワーク制御手段は、前記変換
    候補選択手段で確定された語か前記選択判定手段で選択
    されたと判定された語かの情報によって、前記ノードに
    対して異なった荷重値を入力することを特徴とする請求
    項1記載のかな漢字変換装置。
  3. 【請求項3】 変換対象として入力される読み情報を、
    漢字かな混じり文に変換するかな漢字変換装置におい
    て、 前記かな漢字変換された変換候補の中から所望の変換候
    補を選択し変換結果として確定する変換候補選択手段
    と、 所定の文法規則情報を記憶した文法規則情報記憶手段
    と、 この文法規則情報記憶手段に記憶された所定の文法規則
    情報に基づいて、前記変換候補選択手段によって変換さ
    れた変換結果が文法規則に則っているか否かを判断する
    文法規則判断手段と、 この文法規則判断手段によって得られた結果が文法規則
    に則っていない場合は、該文法規則に則っていない変換
    結果に対する文法情報について該文法規則を文法規則情
    報として変更を行う文法情報管理手段とからなることを
    特徴とするかな漢字変換装置。
JP4226581A 1992-08-26 1992-08-26 かな漢字変換装置 Pending JPH0675943A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4226581A JPH0675943A (ja) 1992-08-26 1992-08-26 かな漢字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4226581A JPH0675943A (ja) 1992-08-26 1992-08-26 かな漢字変換装置

Publications (1)

Publication Number Publication Date
JPH0675943A true JPH0675943A (ja) 1994-03-18

Family

ID=16847419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4226581A Pending JPH0675943A (ja) 1992-08-26 1992-08-26 かな漢字変換装置

Country Status (1)

Country Link
JP (1) JPH0675943A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013020410A (ja) * 2011-07-11 2013-01-31 Mukogawa Gakuin 数式出力コンピュータ、数式出力方法、数式出力プログラム、および数式出力プログラムを記録したコンピュータ読取可能な記録媒体
JP2021189429A (ja) * 2020-05-28 2021-12-13 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 音声認識方法及び装置、電子機器並びに記憶媒体

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013020410A (ja) * 2011-07-11 2013-01-31 Mukogawa Gakuin 数式出力コンピュータ、数式出力方法、数式出力プログラム、および数式出力プログラムを記録したコンピュータ読取可能な記録媒体
JP2021189429A (ja) * 2020-05-28 2021-12-13 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド 音声認識方法及び装置、電子機器並びに記憶媒体
US11756529B2 (en) 2020-05-28 2023-09-12 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and apparatus for speech recognition, and storage medium

Similar Documents

Publication Publication Date Title
US5257186A (en) Digital computing apparatus for preparing document text
KR100650427B1 (ko) 자연어 인식 애플리케이션 구축을 위한 통합 개발 툴
US5623406A (en) Method and system for entering text in computer equipment
US4876665A (en) Document processing system deciding apparatus provided with selection functions
CN112257442A (zh) 一种基于扩充语料库神经网络的政策文件信息提取方法
EP0118187B1 (en) Menu-based natural language understanding system
JP2003131776A (ja) 情報処理装置、文字列入力装置、および確定履歴制御方法
JPH08314980A (ja) ドキュメントデータベースの構築方法、表示方法、及び表示装置
JPH0576067B2 (ja)
JPH0675943A (ja) かな漢字変換装置
JPH07271774A (ja) 文章入力装置
JPH0652151A (ja) 共起学習装置及びこれを用いたかな漢字変換装置
JP2994681B2 (ja) 仮名漢字変換装置
JP3873299B2 (ja) 仮名漢字変換装置および仮名漢字変換方法
JP3192415B2 (ja) 文生成方式
JPH0561902A (ja) 機械翻訳システム
JP3041002B2 (ja) 仮名漢字変換方法及び仮名漢字変換装置
JP3061855B2 (ja) かな漢字変換装置及びかな漢字変換方法
JPH1011444A (ja) 機械翻訳システム
JP2856775B2 (ja) 文書作成装置
JPH07200602A (ja) 機械翻訳装置
JPH04290158A (ja) 文書作成装置
JPH06266701A (ja) かな漢字変換装置
JP2899087B2 (ja) 文字処理装置
JPH05189413A (ja) かな漢字変換装置